Vol.72:生物医学研究で慎重に使うべき統計用語5選
生物医学研究では、データの誤った解釈を避けるために、統計用語を慎重に使うことが重要です。この記事では、読者が研究結果を正確に理解できるように、研究者として注意深く扱うべき5つの統計用語について説明します。
1. Normal(正規)
統計で「normal」と言えば、正規分布(またはガウス分布)を指します。正規分布は、連続型確率変数の確率分布を表す釣鐘型の曲線です。ただ、「normal」という語は一般的に「typical(典型的な)」または「usual(通常の)」という意味でよく使われます。論文ではこの意味でnormal を使うとデータの誤解につながる可能性があるので避けるようにしましょう。たとえば、患者の血圧がnormal であると言うと、血圧が患者の年齢と性別の典型的な値の範囲内にある、もしくは値が正規分布に従っているといういずれの意味にもなり得ます。この2つはまったく異なる解釈になるので、どちらの意味なのかを明確にすることが大切です。
2. Random(無作為)
「random」という語は偶然または恣意的という意味でよく使われますが、統計では特定の意味を持ちます。random sample(無作為標本)は、母集団のすべてのメンバーが等しく選択される可能性のある方法で選択されたサンプル(標本)です。たとえば、臨床試験のために患者を無作為に(randomly)選択したと言うと、無作為抽出法 (コンピューターで生成された乱数を使うことも多い) を用いたことが示唆されます。また、患者を治療群に無作為に(randomly)割り当てたと言うと、コンピュータ化された無作為化手順を使ったという意味になります。
3. Average(平均)
「average」という語は、一連の値の合計を値の数で割った算術平均を表すときによく使われます。ただ、「平凡な」という意味で使われることもあります。したがって、「The biomarker had average sensitivity.」のような言い方は意味が曖昧になるので避け、「The mean sensitivity was XYZ.(平均感度はXYZだった。)」または「The biomarker had low sensitivity.(バイオマーカーの感度は低かった。)」のように言うようにしましょう。
4. Significant(有意)
「significant」は重要または有意義であるという意味でよく使われますが、統計では統計的に有意(つまり、有意水準α を下回るp 値)という特定の意味を持ちます。混乱を招かないよう、「significant」を使う際は注意しましょう。具体的には「a treatment had a statistically significant effect on clinical outcomes(臨床転帰に統計的に有意な効果があった)」、または「this effect was clinically meaningful(この効果は臨床的に意味のあるものだった)」のように使います。
5. Correlation(相関)
統計における「相関」は2つの変数の間の関係を指します。ただし、相関関係は因果関係を意味するものではありません。相関分析から導き出される推論について明確に述べることが重要です。たとえば、アルコール摂取量と喘息の重症度との間にpositive correlation(正の相関関係)があると言うと、「アルコール摂取量が多い参加者ほど喘息の重症度が高いことが分かった」と言う意味になります。相関係数のみに基づいて、「喘息管理プログラムにはアルコール摂取に対処する要素を含める必要がある」と主張することはできますが、「喘息を予防するためにアルコール消費を制限する必要がある」という声明を出すことはできません。そのように言うと、アルコールが喘息を引き起こす原因であるという意味になってしまうからです。
生物医学研究では、統計用語を注意深く使用することが重要です。慎重かつ正確に使用することで、データを正確に解釈し、研究結果に信頼性を与えることができます。