リード
「妊娠中にこれを食べると赤ちゃんのリスクが2倍」「この添加物で発達障害が1.5倍」——育児にまつわる情報の中には、数字を使って親の不安を煽る記事が絶えない。
その数字は嘘ではないかもしれない。しかし、文脈のない数字は誤解を生む。「2倍」という見出しの背後に、元のリスクが0.1%だった場合、「2倍」になっても0.2%だ。千人に1人の話が、読者には「自分の子が危ない」と伝わる。
統計リテラシーとは、数字を疑う能力ではなく、数字を正しく読む能力だ。いくつかの概念を知っておくだけで、育児情報の受け取り方は大きく変わる。
前提:数字が正確でも誤解が生まれる理由
研究者が論文に書く統計と、メディアが見出しに書く言葉の間には、翻訳の歪みがある。「有意差あり」は「効果がある」の意味ではないし、「リスクが上昇」は「危険」の意味ではない。
この歪みを生む主な原因は2つある。ひとつは「相対リスクで語る習慣」であり、もうひとつは「研究デザインを省略する習慣」だ。どちらも、受け手が少しの知識を持つことで補正できる [1]。
本論
相対リスクと絶対リスク——数字が2種類あることを知る
医学研究では、ある曝露や介入の効果を表す方法が主に2つある。
相対リスク: 曝露なし群に対する曝露あり群の発症率の比。元のリスクが小さい場合、大きな倍率でも実際の差は僅かなことがある(RR: Relative Risk) は、「曝露なし」を基準にした比率だ。「曝露あり群の発症率 ÷ 曝露なし群の発症率」で計算される。元のリスクが1%で、曝露後が2%なら、相対リスクは2.0——「2倍」と言える。
絶対リスク差: 曝露あり群と曝露なし群の発症率の実際の差。相対リスクと違い、元のリスクの大きさが反映される(ARD: Absolute Risk Difference) は、発症率の実際の差だ。上の例では 2% − 1% = 1%。1000人中10人が曝露なし群で発症し、曝露あり群では20人が発症する——という話になる。
問題は、相対リスクは見出しになりやすく、絶対リスクは地味だという点だ。「2倍」と「1%の差」はどちらも正確だが、印象は全く違う。
ニュース記事を読んだとき、「元のリスクは何%か」「絶対リスクはどれくらいか」を確認する習慣を持つと、情報の重みを正しく評価できる [2]。
NNT——何人に介入すれば1人が助かるか
NNT: 1人に臨床的恩恵をもたらすために治療が必要な患者数。絶対リスク差の逆数で計算され、治療効果の臨床的意義を示す(Number Needed to Treat) は「1人を救うために、何人に治療を施す必要があるか」を示す数字で、絶対リスク差の逆数(1 ÷ ARD)として計算される。
ARDが1%であれば、NNT = 100。つまり、100人に介入して初めて1人が恩恵を受ける。ARDが0.1%ならNNT = 1000だ [2]。
逆の概念が NNH(Number Needed to Harm) で、「1人に害が起きるまでに何人に曝露が必要か」を示す。NNTとNNHを比較することで、「この介入は恩恵と害のどちらが大きいか」を判断する材料になる。
育児情報でこの発想を使うと、「○○が2倍のリスク」と報じられた食品や習慣について、「元のリスクが0.05%なら、NNHは2000。自分の子に当てはまる話か」と問い返せる。
p値——「有意差あり」は「効果あり」ではない
p値: 帰無仮説が正しいとした場合に、今回と同じかそれ以上の差が偶然生じる確率。0.05未満が統計的有意の目安とされるが「効果あり」の証明ではない は「帰無仮説(効果がないという前提)のもとで、今回と同じかそれ以上の結果が偶然起きる確率」だ。p < 0.05 は、その確率が5%未満であることを意味する。
ここで多くの誤解が生まれる。p < 0.05 は「効果がある」の証明ではなく「偶然では説明しにくい差がある」という意味に過ぎない [3]。さらに、標本サイズが大きければ、臨床的にほとんど意味のない微小な差でも統計的有意差が出てしまう。
重要なのは p 値より 効果量(Cohen's d や odds ratio) と 信頼区間 の幅だ。効果量が小さく、信頼区間が広い結果は、統計的に有意でも実際には意味が薄い可能性がある [4]。
「統計的有意差あり」≠「臨床的に意味のある差あり」 という原則は、Altman & Bland (1995) が指摘した「不存在の証拠は欠如の証拠ではない(absence of evidence is not evidence of absence)」という論点と対をなす [3]。
エビデンスのピラミッド——研究の種類で信頼度は変わる
すべての研究が同等のエビデンスを生むわけではない。Sackett らが体系化したエビデンスの階層では、信頼度が高い順に以下のように整理される [5]。
- システマティックレビュー・メタ分析
- 無作為化比較試験(RCT)
- コホート研究・症例対照研究
- 症例報告・専門家意見
育児メディアが引用する「研究」の多くは観察研究(コホート研究)だ。観察研究では、「○○が△△に関連する」という結論は出せるが、「○○が△△を引き起こす」という因果関係は直接示せない。交絡因子——つまり、観察された関連を説明する第三の要因——の可能性が常に残るからだ。
「保育園に通う子は〜が多い」という観察は、保育園自体の効果ではなく、保育園に通わせる家庭の特性を反映しているかもしれない。研究の種類を確認する習慣が、こうした混同を防ぐ。
出版バイアスとメタ分析の限界
出版バイアス: 統計的有意な「効果あり」の研究が掲載されやすく、「効果なし」の研究が発表されにくい偏り。メタアナリシスの精度を低下させる は、「効果あり」の研究は論文誌に掲載されやすく、「効果なし」の研究は引き出しに眠る傾向を指す(Rosenthal はこれを "file drawer problem" と呼んだ [6])。
この偏りを可視化する手法が ファンネルプロット だ。標本サイズ(精度)と効果量を散布図に描いたとき、左右対称にならない(小規模研究が片側に偏る)場合、出版バイアスの疑いがある [7]。
メタ分析はこのバイアスの影響を受けやすい。さらに、「異質性(I²)」が高い——すなわち、組み合わせた研究間で結果にバラつきがある——場合、統合した推定値の信頼度は下がる [8]。
Ioannidis は 2005 年に、発表された研究知見の過半数は後に再現されないと推定し、小規模研究・多仮説検定・利益相反の文脈で生まれた研究は特に注意が必要だと論じた [9]。「複数の高品質なRCTを統合したメタ分析」と「数本の小規模観察研究のメタ分析」では、意味が大きく異なる。
行動レベルへの落とし込み
統計リテラシーを身につけるためにできることは3つある。
1. ニュース記事で「元のリスクは何%か」「絶対リスク差はいくらか」を探す。 記事に書いていない場合、元の論文のアブストラクトだけでも確認する価値がある。
2. 「この結果はRCTか、観察研究か」を一度問い返す。 「関連する」と「引き起こす」は異なる。観察研究の結論を因果関係として読み替えない。
3. かかりつけ医に「NNTはどのくらいですか」と聞いてみる。 ワクチンや薬の効果について、数字の意味を医師と共有する習慣が、より具体的な対話を生む。
育児記録として子の症状・受診・処置のログを蓄積しておくと、「うちの子の場合」というデータを持った状態でかかりつけ医に相談でき、抽象的な「平均」の話に翻弄されにくくなる。
まとめ
「○倍のリスク」という見出しは、数字として正確でも、文脈なしには意味をなさない。相対リスクか絶対リスクか、RCTか観察研究か、p値の意味は何か——この問いを持つだけで、情報の質を見極める力は上がる。
完全な専門家になる必要はない。「何%の人が、何と比べて、どんな研究で」という3つの問いを習慣にするだけで、育児情報に振り回されず、自分の子に合った判断ができるようになる。数字は、文脈とともに使われてはじめて意味を持つ。
References
- Greenhalgh T. How to read a paper: statistics for the non-statistician. I: different types of data need different statistical tests. BMJ. 1997;315(7104):364–366. doi:10.1136/bmj.315.7104.364. PMID: 9270463.
- Cook RJ, Sackett DL. The number needed to treat: a clinically useful measure of treatment effect. BMJ. 1995;310(6977):452–454. doi:10.1136/bmj.310.6977.452. PMID: 7873954.
- Altman DG, Bland JM. Statistics notes: absence of evidence is not evidence of absence. BMJ. 1995;311(7003):485. doi:10.1136/bmj.311.7003.485. PMID: 7647644.
- Cohen J. Statistical Power Analysis for the Behavioral Sciences. 2nd ed. Hillsdale: Lawrence Erlbaum Associates; 1988.
- Sackett DL, Rosenberg WMC, Gray JAM, Haynes RB, Richardson WS. Evidence based medicine: what it is and what it isn't. BMJ. 1996;312(7023):71–72. doi:10.1136/bmj.312.7023.71. PMID: 8555924.
- Rosenthal R. The file drawer problem and tolerance for null results. Psychol Bull. 1979;86(3):638–641. doi:10.1037/0033-2909.86.3.638.
- Egger M, Davey Smith G, Schneider M, Minder C. Bias in meta-analysis detected by a simple, graphical test. BMJ. 1997;315(7109):629–634. doi:10.1136/bmj.315.7109.629. PMID: 9310563.
- Higgins JPT, Thomas J, Chandler J, et al., eds. Cochrane Handbook for Systematic Reviews of Interventions. Version 6.4. Cochrane; 2023. Available from: https://training.cochrane.org/handbook.
- Ioannidis JPA. Why most published research findings are false. PLoS Med. 2005;2(8):e124. doi:10.1371/journal.pmed.0020124. PMID: 16060722.
- Schulz KF, Altman DG, Moher D; CONSORT Group. CONSORT 2010 statement: updated guidelines for reporting parallel group randomised trials. BMJ. 2010;340:c332. doi:10.1136/bmj.c332. PMID: 20332509.
- Moher D, Liberati A, Tetzlaff J, Altman DG; PRISMA Group. Preferred reporting items for systematic reviews and meta-analyses: the PRISMA statement. PLoS Med. 2009;6(7):e1000097. doi:10.1371/journal.pmed.1000097. PMID: 19621072.