SlideShare una empresa de Scribd logo
1 de 40
Descargar para leer sin conexión
遺伝疫学研究デザイン

  東京大学 医学系研究科
    M1 倉橋一成



                1
遺伝研究
   2003年にヒトゲノム計画が完了
   ヒトゲノム:約30億塩基対,約22,000遺伝子
   これら遺伝子の形質を知りたい
    (ポストゲノム計画)
     Knowledge-based approach
    →実験的手法
     Statistics-based approach

    →統計的手法
                                  2
遺伝統計学の倫理的問題
   三省庁(文部科学省,厚生労働省,経済産業
    省)による倫理指針
   「ヒトゲノム,遺伝子解析のための倫理指針」
       倫理審査委員会による審査
       インフォームドコンセントの徹底
       個人情報の保護
       情報の開示
       遺伝カウンセリング
               http://www.mhlw.go.jp/houdou/0103/h0329-3.html

                                                          3
遺伝カウンセリング
   情報開示に伴う個人の心理的障害に対処
   遺伝子は…
     生涯変化しない
     個人だけでなく血縁者にも関係する

    →特に生殖細胞遺伝子の取り扱いに注意




                         4
遺伝統計学
   DNAアレイ,SNPアレイなどの発現解析
   遺伝疫学
       薬物の感受性
       有害事象の頻度
       遺伝子と環境との交互作用




                           5
遺伝子と環境の交互作用
 遺伝子や環境単独ではリスク無し
 遺伝子と環境の交互作用リスクは有り

例)妊娠期の喫煙,TGFα多型と口蓋リスクとの関係
        喫煙,TGFα多型のみではリスク無し
        喫煙とTGFα多型の交互作用リスクは有り
    喫煙    遺伝子型   ケース   コントロール オッズ比   95%信頼区間
     +      +     13      11   5.5     2.1-14.6
     +      -     13      69   0.9     0.4-1.8
     -      +      7      34   1.0     0.3-2.4
     -      -     36     167   1.0

                                             6
遺伝疫学の特徴
   疾患感受性遺伝子
       ケースコントロール研究
       マーカーによって疾患と相関のある遺伝子を同定
   遺伝子と環境との疾患に対する交互作用
   遺伝子診断はしばしば高価
   妥当なコントロールが不明
       ケースオンリー研究
       ケースの親族をコントロールとした研究
                                 7
今回紹介する研究デザイン
   Case-control study
   Case-only study
   Case-parental control study
       伝達不平衡テスト(TDT)
       家族内相関解析(AFBAC)
   Affected relative-pair study
       罹患同胞対解析

                                   8
遺伝に関する基礎知識
   DNA
       染色体
       遺伝子多型
       アレル
       座位(遺伝子座)
       塩基
   遺伝
       メンデルの法則
       表現型と形質
       連鎖         9
細胞
   生物の最小単位
   ヒトでは
       約数10兆個
        (体重1kgにつき1兆個)
       約220種




                        10
染色体
   DNAの集合体
   ほとんどが核の中に存在
   通常の細胞:23対(46本)
   全DNAを1ゲノムと表現
   約22,000の遺伝子
   遺伝子はゲノムの約数%

               染色体

                     染色分体   11
遺伝子
   染色体の一部
   遺伝子座(locus):遺伝子が存在する場所
   形質(trait):ある遺伝子座の役割
       疾患,薬剤感受性
   表現型(phenotype):形質を細かく表現
       疾患の有無,薬剤感受性の強弱
    形質

    染色体
                         ポストゲノム時代の遺伝統計学 12
遺伝子(つづき)
   アレル(allele):同遺伝子座に存在する対立遺伝子
   遺伝子型:2つのアレルで表現される
   多型(polymorphism):遺伝子やその産物の違い
   マーカー遺伝子:測定が容易な遺伝子
    遺伝子座
                 アレル   遺伝子型が決定
                       表現型が決定




           染色体                     13
ハプロタイプ(haplotype)
   2つの遺伝子座でのアレルの組み合わせ
   ディプロタイプ形:2つのハプロタイプの組み合わせ
            1    2       1       2




                     1       2
      ある遺伝子座のアレル




        ハプロタイプ                   ディプロタイプ形

                             ポストゲノム時代の遺伝統計学 14
Case-control study
   前提:適切なコントロールの選出
   曝露(環境)と遺伝子型はそれぞれ2分類
       遺伝子型:1つまたはいくつかの遺伝子座
        に存在するアレルによって決定
   曝露,遺伝子型,発病の2×4表を作成
    曝露      遺伝子型   ケース   コントロール
              +     a       b
        +
              -     c       d
              +     e       f
        -
              -     g       h     15
オッズ比
    曝露          遺伝子型        ケース   コントロール
                  +          a       b
        +
                  -          c       d
                  +          e       f
        -
                  -          g       h
ORe = ch dg , ORg = eh fg , OReg = ah bg
   交互作用の指標(synergy index)
                  ORge
        SIM =
                ORg × ORe
       1でなければ乗法モデルで交互作用有り                 16
遺伝子と疾患との関連
   交絡変数を調整したオッズ比
   まれな疾患の場合はリスク比に近似
   疾患と関連のあるアレルが疾患の原因とは
    限らない
       本当の疾患遺伝子と連鎖不平衡であるため検出
        された可能性
       集団の特徴によって変わる


                           17
連鎖(linkage)
   連鎖:アレル同士の子への分配が非独立
       遺伝子座Aとマーカー:連鎖不平衡
       遺伝子座Bとマーカー:連鎖平衡

    Pr :あるアレルが子供へ継承される確率
    m1 , m2 :マーカー1,2
        Pr ( A1m1 ) ≠ Pr ( A1 ) × Pr ( m1 )
        Pr (= Pr ( B1 ) × Pr ( m1 )
            B1m1 )
                                              18
妊娠期の喫煙,TGFα多型と
     口蓋リスクとの関係                             Hwang et al. 1995


        喫煙,遺伝子型のみではリスクなし
        同時リスクは約5.5倍(2.1-14.6倍)
            交互作用有り
喫煙       遺伝子型      ケース    コントロール    オッズ比    95%信頼区間
           +        13       11      5.5      2.1-14.6
+
           -        13       69      0.9      0.4-1.8
           +         7       34       1       0.3-2.4
-
           -        36      167       1

                       13 ×167 11× 36
SIM           = 6.57
             ( 7 ×167 34 × 36 ) × (13 ×167 69 × 36 )
                                                          19
Case-only study
   曝露(環境)と遺伝子型の交互作用に興味
   ケースのみを用いた2×2表
曝露       遺伝子型   ケース           遺伝子型
           +     a     曝露
+                            +    -
           -     c
           +     e
                        +    a    c
-                       -    e    g
           -     g
                    adfg bh
       COR SIM × Z
           =      =     × = ag ce
                    bceh df
    Z = 1 であればSIMとCORは一致する
        Z:コントロール群での曝露と遺伝子型とのオッズ比
                                      20
CORの解釈
   コントロール群で曝露と遺伝子型が独立
= 1, COR SIM
 Z =
       交互作用として解釈できる
   曝露や遺伝子型の単独の効果はわからない
   ロジスティックモデルにより共変量を考慮
                              Piegorsh et.al. 1944
       精密な推定値
   SIMは疾患に潜む病因の異質性を表現
                    Begg and Zhang 1994
   交絡要因を調整する事も可能
                                               21
妊娠期の喫煙,TGFα多型と
     口蓋リスクとの関係                     Hwang et al. 1995


喫煙    遺伝子型   ケース   コントロール   オッズ比    95%信頼区間
        +     13      11     5.5      2.1-14.6
+
        -     13      69     0.9      0.4-1.8
        +      7      34      1       0.3-2.4
-
        -     36     167      1

                 13 × 36
             = = 5.14
             COR
                 13 × 7
       11×167     5.14
    = = 0.78, SIM = 6.59
     Z         =
       69 × 34    0.78
   独立の仮定は満たされているであろう                             22
Case-only studyの注意点1
   ケースの選出法
       発症ケースが最も良い
   コントロール群での仮定
       通常の状況に比べて満たされる場合が多い
           栄養状態,喫煙,職業曝露,飲酒
       満たされない場合
           アルコール代謝酵素によるアルコール依存症や肝硬変
            などへのリスク
   曝露や遺伝子型単独の効果はわからない
                                   23
Case-only studyの注意点2
   検出されたアレルや遺伝子型と疾患との関係
       真の疾患感受性遺伝子との連鎖不平衡
   CORは乗法モデルでの交互作用と解釈
       疫学における正しい交互作用とは?
       SIMも加法モデルでの交互作用とは解釈できない
       多くの環境-遺伝交互作用は乗法モデルで記述



                             24
Parental control study
   コントロールの定義が不明確
   ケースの親類がコントロールとして理想的かも
       先祖が同じである
       親や兄弟をコントロールとする
   親をコントロールとする
       伝達不平衡テスト(TDT)
       ハプロタイプ相対リスク(HHRR)
       家族内相関解析(AFBAC)
                                 25
TDT
    (transmission disequilibrium test)

                                           non-transmitted allele
                      transmitted allele
    M/M         M/m                            M          m
                              M                a          b         a+b
                              m                c          d         c+d
                                              a+c        b+d         2n
          M/m
   マーカー座位MにアレルMとm
   両親を分割表に分類する
     父親:a,母親:c

    McNemar検定: 2 ( b − c )
                           2

                      χ td =                 ~ χ12
                                  b+c                                26
HHRR
    (Haplotype-based haplotype relative risk)

                                                allele
    M/M         M/m                           M         m
                            transmitted      a+b      c+d     2n
                          nontransmitted    a+c        b+d    2n
                                           2a+b+c    b+c+2d   4n
          M/m
   興味あるアレルの頻度を知りたい
     伝達された,又はされてないアレル中の頻度

    Pearsonの χ 検定を行う
                      2




                                                              27
AFBAC
       (affected family based control study)
   HRR(haplotype relative risk)に基づく
   両親の遺伝子型を基に仮想コントロールを設定
                              仮想コントロール
         M/M         M/m   M/M


               M/m

   Case-parental control studyも仮想コントロール
    を設定
                                          28
TDT,HHRR,AFBAC
   TDT
       アレルと疾患(遺伝子)との連鎖を検定
       少なくとも相関はあることが前提
           相関が無いと連鎖していても検出できない
   HHRR,AFBAC
       アレルと疾患(遺伝子)との相関を検定
       相関しているからといって連鎖しているとは限らない
       この方法を連鎖の検定に用いるとαエラーは大
                                  29
AFBAC
        (Case-parental control study)
   ケースとコントロールを分割表に分類
           genotype in   genotype in case
             control       +          -
               +           a          b
               -           c          d
       あるアレルや遺伝子型を持っているor持っていない
   マッチング表の解析
       全セルの合計はn(ペア)
   オッズ比: c b
                                            30
環境との交互作用
   曝露で層別
                   genotype in   genotype in case
        exposure
                     control       +          -
                       +           a          b
           +
                       -           c          d
                       +           e          f
           -
                       -           g          h

       曝露有り群のオッズ比:c b
       曝露無し群のオッズ比:g f
              cb
       これらの比    によって交互作用を確認
                       g f                          31
Flanders and Khouryの方法




                         32
Case-parental control study
        の特徴1
   コントロールが妥当であるか
       仮想コントロールの遺伝子型が生殖機能に関わっ
        ている場合
   生存や生殖に影響を及ぼさない遺伝子型
       大人になって発病するような疾患に有用
   親の遺伝子型が必要
       周産期に関わる疾患(先天異常など)に有用


                                      33
Case-parental control study
         の特徴2
   環境単独の効果はわからない
       曝露の有り無しで遺伝子型の効果が異なるかどうか
       環境と遺伝子型の交互作用はわかる
   遺伝子型単独の効果がわかる
       Case-only studyではわからなかった
   検出されたアレルや遺伝子型と疾患との関係
       真の疾患感受性遺伝子との連鎖不平衡

                                       34
Sib control study
   ケースの親族がコントロールとして適切
   発症年齢が高い疾患
       親の遺伝子型を調べることは困難
       罹患していない兄弟をコントロールとする
   同胞伝達不平衡テスト(S-TDT)
   罹患同胞対解析(affected sib-pair analysis)


                                     35
S-TDT
   家族毎(i)に分割表を考える
                                            genotype
                disease                  +                   -                total
                    +                    r+ i                r− i                 r⋅i
                    -                n+ i − r+ i         n− i − r− i          n⋅i − r⋅i
                  total                 n+ i                 n− i                 n⋅i
    ある遺伝子型の期待値からのずれをMantel-
     Haenszel testによって検定                                                                           
                                                                                                      2

                                                                                 ∑ ( r+ i − e+ i ) 
                                        n+ i n− i r⋅i ( n⋅i − r⋅i )
e+ i = r⋅i n+ i n⋅i , V [ r+ i − e+ i ] = 2                         , χ S −TDT =  i
                                                                        2                           
                                             n⋅i ( n⋅i − 1)                       ∑V [ r+i − e+i ]
                                                                                   i

                                                                                                          36
Affected sib-pair analysis
   兄弟間のIBD(identity by descent)を考える
       IBD:アレルが同祖である状態
       兄弟のIBDは期待的に・・・
           IBD=0:25%
           IBD=1:50%
           IBD=2:25%
   期待値からの乖離:連鎖の存在を示唆
   環境で層別することで交互作用を確認
       兄弟間で曝露が異なっていたら複雑になる
                                   37
環境との交互作用
                                            odds ratio
                 exposed
     IBD                       expected      exposed
             +             -                +        -
         0   a             d     0.25       1        1
         1   b             e      0.5     b/2a     e/2d
         2   c             f     0.25      c/a      f/d


    ここの比で交互作用を調べる

   IBDの分布の偏りは尤度比で検定する
        尤度比の対数:LOD値

                                                          38
Affected sib-pair analysisの特徴
   疾患感受性を増加させる遺伝子座を調査
       家族に2人以上の患者が必要
       サンプルサイズの減少
   ケース同士のIBD
       親や親戚の情報が必要
   特定のアレルの疾病への影響はわからない
   環境単独の効果はわからない
   メンデルの法則が崩れると妥当ではない
                                        39
まとめ
   遺伝子と環境の交互作用を確かめる様々な方法
   外的なコントロールは利用しない
   疾病の機序が複雑な場合
       特定の交互作用を検出することは難しい
   ケースコントロール研究に勝ることは無い
   交互作用を調べるためには充分に有用である


                             40

Más contenido relacionado

La actualidad más candente

深層生成モデルによるメディア生成
深層生成モデルによるメディア生成深層生成モデルによるメディア生成
深層生成モデルによるメディア生成kame_hirokazu
 
ΠΛΗ20 ΚΑΡΤΑ ΜΑΘΗΜΑ 1.4
ΠΛΗ20 ΚΑΡΤΑ ΜΑΘΗΜΑ 1.4 ΠΛΗ20 ΚΑΡΤΑ ΜΑΘΗΜΑ 1.4
ΠΛΗ20 ΚΑΡΤΑ ΜΑΘΗΜΑ 1.4 Dimitris Psounis
 
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則koba cky
 
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定Katsuya Ito
 
[DL輪読会]Opening the Black Box of Deep Neural Networks via Information
[DL輪読会]Opening the Black Box of Deep Neural Networks via Information[DL輪読会]Opening the Black Box of Deep Neural Networks via Information
[DL輪読会]Opening the Black Box of Deep Neural Networks via InformationDeep Learning JP
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)Haruka Ozaki
 
査読コメントに回答する時の、3つの黄金律
査読コメントに回答する時の、3つの黄金律査読コメントに回答する時の、3つの黄金律
査読コメントに回答する時の、3つの黄金律英文校正エディテージ
 
自由エネルギー原理から エナクティヴィズムへ
自由エネルギー原理から エナクティヴィズムへ自由エネルギー原理から エナクティヴィズムへ
自由エネルギー原理から エナクティヴィズムへMasatoshi Yoshida
 
DNAマイクロアレイの解析と多重検定補正
DNAマイクロアレイの解析と多重検定補正DNAマイクロアレイの解析と多重検定補正
DNAマイクロアレイの解析と多重検定補正弘毅 露崎
 
バイオインフォ講義3
バイオインフォ講義3バイオインフォ講義3
バイオインフォ講義3Mas Kot
 
20191006 bayesian dl_1_pub
20191006 bayesian dl_1_pub20191006 bayesian dl_1_pub
20191006 bayesian dl_1_pubYoichi Tokita
 
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章Takahiro Kubo
 
BERTに関して
BERTに関してBERTに関して
BERTに関してSaitama Uni
 
機械学習を用いたfNIRSの解析手法の提案
機械学習を用いたfNIRSの解析手法の提案機械学習を用いたfNIRSの解析手法の提案
機械学習を用いたfNIRSの解析手法の提案Reiji Ohkuma
 
オントロジー工学に基づくセマンティック技術(1)オントロジー工学入門
オントロジー工学に基づくセマンティック技術(1)オントロジー工学入門オントロジー工学に基づくセマンティック技術(1)オントロジー工学入門
オントロジー工学に基づくセマンティック技術(1)オントロジー工学入門Kouji Kozaki
 
EEG analysis (nonlinear)
EEG analysis (nonlinear)EEG analysis (nonlinear)
EEG analysis (nonlinear)Kenyu Uehara
 
距離と分類の話
距離と分類の話距離と分類の話
距離と分類の話考司 小杉
 
[DL輪読会]An Iterative Framework for Self-supervised Deep Speaker Representatio...
[DL輪読会]An Iterative Framework for Self-supervised Deep  Speaker Representatio...[DL輪読会]An Iterative Framework for Self-supervised Deep  Speaker Representatio...
[DL輪読会]An Iterative Framework for Self-supervised Deep Speaker Representatio...Deep Learning JP
 
特徴パターンを用いた機械学習の説明手法 (JSAI2019)
特徴パターンを用いた機械学習の説明手法 (JSAI2019)特徴パターンを用いた機械学習の説明手法 (JSAI2019)
特徴パターンを用いた機械学習の説明手法 (JSAI2019)Kohei Asano
 
機会学習ハッカソン:ランダムフォレスト
機会学習ハッカソン:ランダムフォレスト機会学習ハッカソン:ランダムフォレスト
機会学習ハッカソン:ランダムフォレストTeppei Baba
 

La actualidad más candente (20)

深層生成モデルによるメディア生成
深層生成モデルによるメディア生成深層生成モデルによるメディア生成
深層生成モデルによるメディア生成
 
ΠΛΗ20 ΚΑΡΤΑ ΜΑΘΗΜΑ 1.4
ΠΛΗ20 ΚΑΡΤΑ ΜΑΘΗΜΑ 1.4 ΠΛΗ20 ΚΑΡΤΑ ΜΑΘΗΜΑ 1.4
ΠΛΗ20 ΚΑΡΤΑ ΜΑΘΗΜΑ 1.4
 
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則
 
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
 
[DL輪読会]Opening the Black Box of Deep Neural Networks via Information
[DL輪読会]Opening the Black Box of Deep Neural Networks via Information[DL輪読会]Opening the Black Box of Deep Neural Networks via Information
[DL輪読会]Opening the Black Box of Deep Neural Networks via Information
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
 
査読コメントに回答する時の、3つの黄金律
査読コメントに回答する時の、3つの黄金律査読コメントに回答する時の、3つの黄金律
査読コメントに回答する時の、3つの黄金律
 
自由エネルギー原理から エナクティヴィズムへ
自由エネルギー原理から エナクティヴィズムへ自由エネルギー原理から エナクティヴィズムへ
自由エネルギー原理から エナクティヴィズムへ
 
DNAマイクロアレイの解析と多重検定補正
DNAマイクロアレイの解析と多重検定補正DNAマイクロアレイの解析と多重検定補正
DNAマイクロアレイの解析と多重検定補正
 
バイオインフォ講義3
バイオインフォ講義3バイオインフォ講義3
バイオインフォ講義3
 
20191006 bayesian dl_1_pub
20191006 bayesian dl_1_pub20191006 bayesian dl_1_pub
20191006 bayesian dl_1_pub
 
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
 
BERTに関して
BERTに関してBERTに関して
BERTに関して
 
機械学習を用いたfNIRSの解析手法の提案
機械学習を用いたfNIRSの解析手法の提案機械学習を用いたfNIRSの解析手法の提案
機械学習を用いたfNIRSの解析手法の提案
 
オントロジー工学に基づくセマンティック技術(1)オントロジー工学入門
オントロジー工学に基づくセマンティック技術(1)オントロジー工学入門オントロジー工学に基づくセマンティック技術(1)オントロジー工学入門
オントロジー工学に基づくセマンティック技術(1)オントロジー工学入門
 
EEG analysis (nonlinear)
EEG analysis (nonlinear)EEG analysis (nonlinear)
EEG analysis (nonlinear)
 
距離と分類の話
距離と分類の話距離と分類の話
距離と分類の話
 
[DL輪読会]An Iterative Framework for Self-supervised Deep Speaker Representatio...
[DL輪読会]An Iterative Framework for Self-supervised Deep  Speaker Representatio...[DL輪読会]An Iterative Framework for Self-supervised Deep  Speaker Representatio...
[DL輪読会]An Iterative Framework for Self-supervised Deep Speaker Representatio...
 
特徴パターンを用いた機械学習の説明手法 (JSAI2019)
特徴パターンを用いた機械学習の説明手法 (JSAI2019)特徴パターンを用いた機械学習の説明手法 (JSAI2019)
特徴パターンを用いた機械学習の説明手法 (JSAI2019)
 
機会学習ハッカソン:ランダムフォレスト
機会学習ハッカソン:ランダムフォレスト機会学習ハッカソン:ランダムフォレスト
機会学習ハッカソン:ランダムフォレスト
 

Más de Issei Kurahashi

おしゃスタ@リクルート
おしゃスタ@リクルートおしゃスタ@リクルート
おしゃスタ@リクルートIssei Kurahashi
 
【スクー】業務改善のためのデータサイエンス
【スクー】業務改善のためのデータサイエンス【スクー】業務改善のためのデータサイエンス
【スクー】業務改善のためのデータサイエンスIssei Kurahashi
 
データサイエンティストになるために
データサイエンティストになるためにデータサイエンティストになるために
データサイエンティストになるためにIssei Kurahashi
 
Tokyo webmining統計学部 第2回
Tokyo webmining統計学部 第2回Tokyo webmining統計学部 第2回
Tokyo webmining統計学部 第2回Issei Kurahashi
 
おしゃスタVI 倉橋
おしゃスタVI 倉橋おしゃスタVI 倉橋
おしゃスタVI 倉橋Issei Kurahashi
 
TokyoWebmining統計学部 第1回
TokyoWebmining統計学部 第1回TokyoWebmining統計学部 第1回
TokyoWebmining統計学部 第1回Issei Kurahashi
 
コホート研究 isseing333
コホート研究 isseing333コホート研究 isseing333
コホート研究 isseing333Issei Kurahashi
 
一般化線形混合モデル isseing333
一般化線形混合モデル isseing333一般化線形混合モデル isseing333
一般化線形混合モデル isseing333Issei Kurahashi
 
生物統計特論6資料 2006 abc法(bootstrap) isseing333
生物統計特論6資料 2006 abc法(bootstrap) isseing333生物統計特論6資料 2006 abc法(bootstrap) isseing333
生物統計特論6資料 2006 abc法(bootstrap) isseing333Issei Kurahashi
 
生物統計特論3資料 2006 ギブス MCMC isseing333
生物統計特論3資料 2006 ギブス MCMC isseing333生物統計特論3資料 2006 ギブス MCMC isseing333
生物統計特論3資料 2006 ギブス MCMC isseing333Issei Kurahashi
 
Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Issei Kurahashi
 
統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333Issei Kurahashi
 

Más de Issei Kurahashi (19)

おしゃスタ@リクルート
おしゃスタ@リクルートおしゃスタ@リクルート
おしゃスタ@リクルート
 
【スクー】業務改善のためのデータサイエンス
【スクー】業務改善のためのデータサイエンス【スクー】業務改善のためのデータサイエンス
【スクー】業務改善のためのデータサイエンス
 
データサイエンティストになるために
データサイエンティストになるためにデータサイエンティストになるために
データサイエンティストになるために
 
Tokyo webmining統計学部 第2回
Tokyo webmining統計学部 第2回Tokyo webmining統計学部 第2回
Tokyo webmining統計学部 第2回
 
おしゃスタVI 倉橋
おしゃスタVI 倉橋おしゃスタVI 倉橋
おしゃスタVI 倉橋
 
おしゃスタat銀座
おしゃスタat銀座おしゃスタat銀座
おしゃスタat銀座
 
TokyoWebmining統計学部 第1回
TokyoWebmining統計学部 第1回TokyoWebmining統計学部 第1回
TokyoWebmining統計学部 第1回
 
iAnalysis NY視察
iAnalysis NY視察 iAnalysis NY視察
iAnalysis NY視察
 
おしゃスタV
おしゃスタVおしゃスタV
おしゃスタV
 
平方和の分解
平方和の分解平方和の分解
平方和の分解
 
コホート研究 isseing333
コホート研究 isseing333コホート研究 isseing333
コホート研究 isseing333
 
一般化線形混合モデル isseing333
一般化線形混合モデル isseing333一般化線形混合モデル isseing333
一般化線形混合モデル isseing333
 
生物統計特論6資料 2006 abc法(bootstrap) isseing333
生物統計特論6資料 2006 abc法(bootstrap) isseing333生物統計特論6資料 2006 abc法(bootstrap) isseing333
生物統計特論6資料 2006 abc法(bootstrap) isseing333
 
生物統計特論3資料 2006 ギブス MCMC isseing333
生物統計特論3資料 2006 ギブス MCMC isseing333生物統計特論3資料 2006 ギブス MCMC isseing333
生物統計特論3資料 2006 ギブス MCMC isseing333
 
Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333
 
統計概論 isseing333
統計概論 isseing333統計概論 isseing333
統計概論 isseing333
 
統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333
 
分布 isseing333
分布 isseing333分布 isseing333
分布 isseing333
 
データ解析
データ解析データ解析
データ解析
 

遺伝疫学研究デザイン isseing333

  • 1. 遺伝疫学研究デザイン 東京大学 医学系研究科 M1 倉橋一成 1
  • 2. 遺伝研究  2003年にヒトゲノム計画が完了  ヒトゲノム:約30億塩基対,約22,000遺伝子  これら遺伝子の形質を知りたい (ポストゲノム計画)  Knowledge-based approach →実験的手法  Statistics-based approach →統計的手法 2
  • 3. 遺伝統計学の倫理的問題  三省庁(文部科学省,厚生労働省,経済産業 省)による倫理指針  「ヒトゲノム,遺伝子解析のための倫理指針」  倫理審査委員会による審査  インフォームドコンセントの徹底  個人情報の保護  情報の開示  遺伝カウンセリング http://www.mhlw.go.jp/houdou/0103/h0329-3.html 3
  • 4. 遺伝カウンセリング  情報開示に伴う個人の心理的障害に対処  遺伝子は…  生涯変化しない  個人だけでなく血縁者にも関係する →特に生殖細胞遺伝子の取り扱いに注意 4
  • 5. 遺伝統計学  DNAアレイ,SNPアレイなどの発現解析  遺伝疫学  薬物の感受性  有害事象の頻度  遺伝子と環境との交互作用 5
  • 6. 遺伝子と環境の交互作用  遺伝子や環境単独ではリスク無し  遺伝子と環境の交互作用リスクは有り 例)妊娠期の喫煙,TGFα多型と口蓋リスクとの関係  喫煙,TGFα多型のみではリスク無し  喫煙とTGFα多型の交互作用リスクは有り 喫煙 遺伝子型 ケース コントロール オッズ比 95%信頼区間 + + 13 11 5.5 2.1-14.6 + - 13 69 0.9 0.4-1.8 - + 7 34 1.0 0.3-2.4 - - 36 167 1.0 6
  • 7. 遺伝疫学の特徴  疾患感受性遺伝子  ケースコントロール研究  マーカーによって疾患と相関のある遺伝子を同定  遺伝子と環境との疾患に対する交互作用  遺伝子診断はしばしば高価  妥当なコントロールが不明  ケースオンリー研究  ケースの親族をコントロールとした研究 7
  • 8. 今回紹介する研究デザイン  Case-control study  Case-only study  Case-parental control study  伝達不平衡テスト(TDT)  家族内相関解析(AFBAC)  Affected relative-pair study  罹患同胞対解析 8
  • 9. 遺伝に関する基礎知識  DNA  染色体  遺伝子多型  アレル  座位(遺伝子座)  塩基  遺伝  メンデルの法則  表現型と形質  連鎖 9
  • 10. 細胞  生物の最小単位  ヒトでは  約数10兆個 (体重1kgにつき1兆個)  約220種 10
  • 11. 染色体  DNAの集合体  ほとんどが核の中に存在  通常の細胞:23対(46本)  全DNAを1ゲノムと表現  約22,000の遺伝子  遺伝子はゲノムの約数% 染色体 染色分体 11
  • 12. 遺伝子  染色体の一部  遺伝子座(locus):遺伝子が存在する場所  形質(trait):ある遺伝子座の役割  疾患,薬剤感受性  表現型(phenotype):形質を細かく表現  疾患の有無,薬剤感受性の強弱 形質 染色体 ポストゲノム時代の遺伝統計学 12
  • 13. 遺伝子(つづき)  アレル(allele):同遺伝子座に存在する対立遺伝子  遺伝子型:2つのアレルで表現される  多型(polymorphism):遺伝子やその産物の違い  マーカー遺伝子:測定が容易な遺伝子 遺伝子座 アレル 遺伝子型が決定 表現型が決定 染色体 13
  • 14. ハプロタイプ(haplotype)  2つの遺伝子座でのアレルの組み合わせ  ディプロタイプ形:2つのハプロタイプの組み合わせ 1 2 1 2 1 2 ある遺伝子座のアレル ハプロタイプ ディプロタイプ形 ポストゲノム時代の遺伝統計学 14
  • 15. Case-control study  前提:適切なコントロールの選出  曝露(環境)と遺伝子型はそれぞれ2分類  遺伝子型:1つまたはいくつかの遺伝子座 に存在するアレルによって決定  曝露,遺伝子型,発病の2×4表を作成 曝露 遺伝子型 ケース コントロール + a b + - c d + e f - - g h 15
  • 16. オッズ比 曝露 遺伝子型 ケース コントロール + a b + - c d + e f - - g h ORe = ch dg , ORg = eh fg , OReg = ah bg  交互作用の指標(synergy index) ORge SIM = ORg × ORe  1でなければ乗法モデルで交互作用有り 16
  • 17. 遺伝子と疾患との関連  交絡変数を調整したオッズ比  まれな疾患の場合はリスク比に近似  疾患と関連のあるアレルが疾患の原因とは 限らない  本当の疾患遺伝子と連鎖不平衡であるため検出 された可能性  集団の特徴によって変わる 17
  • 18. 連鎖(linkage)  連鎖:アレル同士の子への分配が非独立  遺伝子座Aとマーカー:連鎖不平衡  遺伝子座Bとマーカー:連鎖平衡 Pr :あるアレルが子供へ継承される確率 m1 , m2 :マーカー1,2 Pr ( A1m1 ) ≠ Pr ( A1 ) × Pr ( m1 ) Pr (= Pr ( B1 ) × Pr ( m1 ) B1m1 ) 18
  • 19. 妊娠期の喫煙,TGFα多型と 口蓋リスクとの関係 Hwang et al. 1995  喫煙,遺伝子型のみではリスクなし  同時リスクは約5.5倍(2.1-14.6倍)  交互作用有り 喫煙 遺伝子型 ケース コントロール オッズ比 95%信頼区間 + 13 11 5.5 2.1-14.6 + - 13 69 0.9 0.4-1.8 + 7 34 1 0.3-2.4 - - 36 167 1 13 ×167 11× 36 SIM = 6.57 ( 7 ×167 34 × 36 ) × (13 ×167 69 × 36 ) 19
  • 20. Case-only study  曝露(環境)と遺伝子型の交互作用に興味  ケースのみを用いた2×2表 曝露 遺伝子型 ケース 遺伝子型 + a 曝露 + + - - c + e + a c - - e g - g adfg bh COR SIM × Z = = × = ag ce bceh df  Z = 1 であればSIMとCORは一致する  Z:コントロール群での曝露と遺伝子型とのオッズ比 20
  • 21. CORの解釈  コントロール群で曝露と遺伝子型が独立 = 1, COR SIM  Z =  交互作用として解釈できる  曝露や遺伝子型の単独の効果はわからない  ロジスティックモデルにより共変量を考慮 Piegorsh et.al. 1944  精密な推定値  SIMは疾患に潜む病因の異質性を表現 Begg and Zhang 1994  交絡要因を調整する事も可能 21
  • 22. 妊娠期の喫煙,TGFα多型と 口蓋リスクとの関係 Hwang et al. 1995 喫煙 遺伝子型 ケース コントロール オッズ比 95%信頼区間 + 13 11 5.5 2.1-14.6 + - 13 69 0.9 0.4-1.8 + 7 34 1 0.3-2.4 - - 36 167 1 13 × 36 = = 5.14 COR 13 × 7 11×167 5.14 = = 0.78, SIM = 6.59 Z = 69 × 34 0.78  独立の仮定は満たされているであろう 22
  • 23. Case-only studyの注意点1  ケースの選出法  発症ケースが最も良い  コントロール群での仮定  通常の状況に比べて満たされる場合が多い  栄養状態,喫煙,職業曝露,飲酒  満たされない場合  アルコール代謝酵素によるアルコール依存症や肝硬変 などへのリスク  曝露や遺伝子型単独の効果はわからない 23
  • 24. Case-only studyの注意点2  検出されたアレルや遺伝子型と疾患との関係  真の疾患感受性遺伝子との連鎖不平衡  CORは乗法モデルでの交互作用と解釈  疫学における正しい交互作用とは?  SIMも加法モデルでの交互作用とは解釈できない  多くの環境-遺伝交互作用は乗法モデルで記述 24
  • 25. Parental control study  コントロールの定義が不明確  ケースの親類がコントロールとして理想的かも  先祖が同じである  親や兄弟をコントロールとする  親をコントロールとする  伝達不平衡テスト(TDT)  ハプロタイプ相対リスク(HHRR)  家族内相関解析(AFBAC) 25
  • 26. TDT (transmission disequilibrium test) non-transmitted allele transmitted allele M/M M/m M m M a b a+b m c d c+d a+c b+d 2n M/m  マーカー座位MにアレルMとm  両親を分割表に分類する  父親:a,母親:c McNemar検定: 2 ( b − c ) 2  χ td = ~ χ12 b+c 26
  • 27. HHRR (Haplotype-based haplotype relative risk) allele M/M M/m M m transmitted a+b c+d 2n nontransmitted a+c b+d 2n 2a+b+c b+c+2d 4n M/m  興味あるアレルの頻度を知りたい  伝達された,又はされてないアレル中の頻度 Pearsonの χ 検定を行う 2  27
  • 28. AFBAC (affected family based control study)  HRR(haplotype relative risk)に基づく  両親の遺伝子型を基に仮想コントロールを設定 仮想コントロール M/M M/m M/M M/m  Case-parental control studyも仮想コントロール を設定 28
  • 29. TDT,HHRR,AFBAC  TDT  アレルと疾患(遺伝子)との連鎖を検定  少なくとも相関はあることが前提  相関が無いと連鎖していても検出できない  HHRR,AFBAC  アレルと疾患(遺伝子)との相関を検定  相関しているからといって連鎖しているとは限らない  この方法を連鎖の検定に用いるとαエラーは大 29
  • 30. AFBAC (Case-parental control study)  ケースとコントロールを分割表に分類 genotype in genotype in case control + - + a b - c d  あるアレルや遺伝子型を持っているor持っていない  マッチング表の解析  全セルの合計はn(ペア)  オッズ比: c b 30
  • 31. 環境との交互作用  曝露で層別 genotype in genotype in case exposure control + - + a b + - c d + e f - - g h  曝露有り群のオッズ比:c b  曝露無し群のオッズ比:g f cb  これらの比 によって交互作用を確認 g f 31
  • 33. Case-parental control study の特徴1  コントロールが妥当であるか  仮想コントロールの遺伝子型が生殖機能に関わっ ている場合  生存や生殖に影響を及ぼさない遺伝子型  大人になって発病するような疾患に有用  親の遺伝子型が必要  周産期に関わる疾患(先天異常など)に有用 33
  • 34. Case-parental control study の特徴2  環境単独の効果はわからない  曝露の有り無しで遺伝子型の効果が異なるかどうか  環境と遺伝子型の交互作用はわかる  遺伝子型単独の効果がわかる  Case-only studyではわからなかった  検出されたアレルや遺伝子型と疾患との関係  真の疾患感受性遺伝子との連鎖不平衡 34
  • 35. Sib control study  ケースの親族がコントロールとして適切  発症年齢が高い疾患  親の遺伝子型を調べることは困難  罹患していない兄弟をコントロールとする  同胞伝達不平衡テスト(S-TDT)  罹患同胞対解析(affected sib-pair analysis) 35
  • 36. S-TDT  家族毎(i)に分割表を考える genotype disease + - total + r+ i r− i r⋅i - n+ i − r+ i n− i − r− i n⋅i − r⋅i total n+ i n− i n⋅i  ある遺伝子型の期待値からのずれをMantel- Haenszel testによって検定   2 ∑ ( r+ i − e+ i )  n+ i n− i r⋅i ( n⋅i − r⋅i ) e+ i = r⋅i n+ i n⋅i , V [ r+ i − e+ i ] = 2 , χ S −TDT =  i 2  n⋅i ( n⋅i − 1) ∑V [ r+i − e+i ] i 36
  • 37. Affected sib-pair analysis  兄弟間のIBD(identity by descent)を考える  IBD:アレルが同祖である状態  兄弟のIBDは期待的に・・・  IBD=0:25%  IBD=1:50%  IBD=2:25%  期待値からの乖離:連鎖の存在を示唆  環境で層別することで交互作用を確認  兄弟間で曝露が異なっていたら複雑になる 37
  • 38. 環境との交互作用 odds ratio exposed IBD expected exposed + - + - 0 a d 0.25 1 1 1 b e 0.5 b/2a e/2d 2 c f 0.25 c/a f/d ここの比で交互作用を調べる  IBDの分布の偏りは尤度比で検定する  尤度比の対数:LOD値 38
  • 39. Affected sib-pair analysisの特徴  疾患感受性を増加させる遺伝子座を調査  家族に2人以上の患者が必要  サンプルサイズの減少  ケース同士のIBD  親や親戚の情報が必要  特定のアレルの疾病への影響はわからない  環境単独の効果はわからない  メンデルの法則が崩れると妥当ではない 39
  • 40. まとめ  遺伝子と環境の交互作用を確かめる様々な方法  外的なコントロールは利用しない  疾病の機序が複雑な場合  特定の交互作用を検出することは難しい  ケースコントロール研究に勝ることは無い  交互作用を調べるためには充分に有用である 40