DAGとは?統計・疫学研究の勉強

DAG: 非巡回有向グラフ (Directed Acyclic Graph)の勉強をしてみた

こんにちは!

今回は、因果推論や変数間の関係性を視覚的に示すのに便利な”DAG”、つまり非巡回有向グラフについて勉強してみたので、自分のメモを基に簡単な解説を記事にしてみました。

DAGは少し専門的な話題に思えるかもしれませんが、一度その使い方や効果を理解すると、臨床疫学やデータ解析の強力なツールになるんです。


1. DAGの定義をざっくり解説

DAGには2つの重要な特徴があります。

有向性 (Directed)

ノード(点)間を結ぶ矢印が、原因と結果の関係を示します。たとえば、AからBに矢印が伸びている場合、「AがBに影響を与える」という因果関係を表しています。この矢印の方向性が、因果の流れを示す鍵となります。

例として、喫煙 (A) が肺癌 (B) に影響を与える場合を考えましょう。この場合、DAGには以下のような矢印が描かれます:

喫煙 → 肺癌

この矢印によって、因果関係が視覚的にわかりやすく示されます。

非巡回性 (Acyclic)

DAGでは、矢印がループ(循環)を作らないようになっています。たとえば、A → B → C → A のように、元のノードに戻る矢印がある場合、それは非巡回ではなくなります。

もう少し噛み砕いて言うと、DAGの「非巡回性」は「タイムマシンを使わない」ルールのようなものです。過去に戻って同じ出来事を繰り返すことはできない、という考え方に基づいており、このルールによって因果関係の流れが一方向に保たれるのです。

この2つの特徴、有向性と非巡回性が組み合わさることで、

DAGは「因果関係を視覚的に整理する地図」のような役割を果たします。

反実仮想 (Counterfactual)との関係

DAGは、反実仮想の考え方とも深く関連しています。反実仮想とは、現実には起きていない仮の状況を想定して「もし〜していたら、結果はどうなっていただろうか?」と考えるアプローチです。これにより、介入の効果やリスクをより明確に検討できます。

例えば、ある治療法が患者の回復に与える影響を評価する場合を考えましょう。治療を受けた患者と受けなかった患者の回復率を比較するだけでは、背景要因の違いが影響する可能性があります。そこで、DAGを活用して交絡因子を調整し、治療を受けなかった場合の仮想的な回復率を推定することで、治療の純粋な効果を明らかにできます。

このように、反実仮想を基にしたDAGは、因果推論を行う上で不可欠なツールとなります。

2. DAGが役立つ場面

DAGが活躍するのは、以下のようなシーンです。

因果推論

治療の効果やリスク要因を調べるとき、DAGを使うことで因果関係を視覚的に整理しやすくなります。例えば、どの要因が真の原因であり、どの要因が結果を引き起こしているのかを明確にできます。

交絡因子の整理

交絡因子とは、原因と結果の間に入り込んで影響を与える変数のことです。DAGを使うことで、これらの交絡因子を特定し、適切に調整するための道筋が明らかになります。

バイアスの特定

DAGは、選択バイアスや情報バイアスのように研究結果に影響を与える要因を見つけるのにも役立ちます。

例えば、「喫煙が肺癌に与える影響」を調べる場合を考えてみましょう。このとき、社会経済的地位(SES)が喫煙に影響を与え、さらに肺癌にも影響を与える可能性があります。このような交絡因子をDAGで図示すると、どの部分を調整すべきかが視覚的にわかりやすくなります。

DAGを使うと、交絡因子や中間因子を特定し、それらを調整するための明確な基準を持つことができます。このプロセスにより、より正確で信頼性の高い結果を得ることが可能になります。

DAGを用いた変数調整の基準として、以下の方法がよく用いられます:

  • Pretreatment Criterion: 曝露が起こる前に測定された変数のみを調整します。これにより、曝露後の変数が因果推論に影響を与えるリスクを回避できます。
  • Common Cause Criterion: 曝露とアウトカムの両方に影響を与える共通の原因(交絡因子)のみを調整します。これにより、交絡の影響を排除できます。
  • Modified Disjunctive Criterion: 曝露またはアウトカムに影響を与える変数を選択しますが、操作変数(特定のバイアスを増幅する可能性のある要素)は除外します。これにより、適切な調整が可能になります。

これらの基準を適切に適用することで、因果関係の理解が深まり、研究の信頼性が向上します。


3. どんな時にDAGを使うべき?

DAGが特に効果を発揮するのは次のような場合です。

  1. 複雑な因果関係が絡むとき:
    • 多くの変数が関わる問題を整理するときに便利。
  2. 交絡因子を調整したいとき:
    • 観察研究や後ろ向きコホート研究で、交絡因子の影響を排除するために使えます。
  3. 仮説を立てたり検証したりするとき:
    • 因果構造を基に仮説を構築し、統計モデルで確認するプロセスをサポートします。
  4. バイアスのリスクを減らしたい場合:
    • 調整すべきでない変数(例: 操作変数)を誤って含めてしまうと新たなバイアスを生む可能性があり、DAGを使うことでそのリスクを最小化できます。

4. 実際にDAGを描いてみよう!

ステップ1: 主要な変数をリストアップ

まずは研究で重要な原因や結果の変数を書き出します。

ステップ2: 因果関係を矢印で結ぶ

「AがBに影響を与える」という因果関係を矢印で示します。

ステップ3: 交絡因子や中間因子を追加

交絡因子や中間因子(媒介変数)を考え、それらも矢印でつなぎます。

ステップ4: DAGツールを使う

手書きでも描けますが、DAGittyなどのオンラインツールを使うと見た目も整ったグラフが作れます。

簡単な例

  • テーマ: 喫煙が肺癌に与える影響
喫煙 → 肺癌
喫煙 → COPD → 肺癌
SES (社会経済的地位) → 喫煙

この例では、SESが交絡因子、COPDが中間因子として作用していることが示されています。

さらに、どの経路を閉じるべきかをDAGを用いて検討することで、バイアスのリスクを軽減できます。


5. まとめ

DAGは、因果関係を整理し、研究の質を高めるための強力なツールです。特に交絡因子の調整やバイアスの特定に役立ちます。

初めて使うときは少しハードルが高いと感じるかもしれませんが、一度慣れると手放せなくなります。DAGを使って、ぜひより正確で信頼性の高い研究を目指してください!

参考資料

  • Judea Pearl, The Book of Why
  • Greenland et al., Causal Diagrams for Epidemiologic Research (Epidemiology, 1999)
  • VanderWeele, Principles of Confounder Selection (European Journal of Epidemiology, 2019)

コメント

タイトルとURLをコピーしました