SlideShare una empresa de Scribd logo
1 de 20
Descargar para leer sin conexión
荒川和晴



Progress Seminar 09.10.09

          Chaos Game Representationによる
                  ゲノムのフラクタル解析
荒川和晴


Progress Seminar 09.10.09

          Chaos Game Representationによる
                  ゲノムのフラクタル解析
accesses




ranking
600



           450
accesses




           300



           150



             0
                 10   9   8   7    6   5    4   3   2   1

                                  ranking
フラクタル

• 図形の「部分」と「全体」が自己相似系になっているもの


• シェルピンスキーのギャスケット、コッホ曲線


• 海岸線、樹木の枝葉、血管や腸、巻貝など自然界にも数多に存在


• 厳密な定義:位相次元とハウスドルフ次元が一致しない図形
ハウスドルフ次元

• 正方形の一辺を2倍にすると、面積が2乗になる(元の正方形が4つできる)
                       N次元における図形P倍の相似形の個数Qは


                             よって、次元とは




• フラクタル図形の場合は
      コッホ曲線では、図形Aの長さを3倍にすると、図形ABCD、つまり相似形4個になる。

                          このハウスドルフ次元を求めると




                             位相次元2と異なる。

フラクタル図形は有限の面積内に無限の長さを持つ。
逆に、シェルピンスキーのギャスケットなどは面積を持たない。
ハウスドルフ次元

• 正方形の一辺を2倍にすると、面積が2乗になる(元の正方形が4つできる)
                       N次元における図形P倍の相似形の個数Qは


                             よって、次元とは




• フラクタル図形の場合は
      コッホ曲線では、図形Aの長さを3倍にすると、図形ABCD、つまり相似形4個になる。

                          このハウスドルフ次元を求めると




                             位相次元2と異なる。

フラクタル図形は有限の面積内に無限の長さを持つ。
逆に、シェルピンスキーのギャスケットなどは面積を持たない。
フラクタルとカオスゲーム

• カオス:複雑系における、解が予測できない複雑な現象。ただし、ある決定
論的法則に従うため、ランダムではない。


• 一見不規則だが背後に規則性を持つカオスを、反復関数系を用いてグラフに
プロットすると、フラクタルな性質を持つカオスアトラクターを描くことが
できる。(ランダムではないため、何かしらのアトラクターを持つ)これ
を、カオスゲームと呼ぶ。


• シェルピンスキーのギャスケットやコッホ曲線も反復関数系を用いて描いてい
る。


• カオスゲームは、ランダムかカオスかを判定するための可視化手法。
Joel H. Jeffrey (1990) NAR

• Chaos game representation of gene structure




 ゲノムはカオスであることを示した(ランダムではない)
配列の長さに依存しない、配列の特徴(genomic signature)の比較が可能。
Nick Goldman (1993) NAR

• CGRは、2塩基及び3塩基のマルコフ性で説明できる。

              CG塩基が存在しない、という
              ルールの反復関数系でJoeffreyの
              CGRをシミュレーションで再現。
Jonas S. Almeida (2001) Bioinformatics
• CGRは一般化マルコフ遷移確率表である。(箱の区切り方で配列の長さ、非
 正数を含めたマルコフオーダーに対応できる)
CGR利用上の問題点

• マルコフ性が逆である。


• 一般化マルコフ遷移確率表と言って
 も、どの座標がどの塩基に対応する
 かがわからない。


• EMBOSSやAlmeidaのソフトウェア
 では、画像がビットマップであり、
 せっかくのフラクタルなのに拡大し         Almeida et al. 2001
 てもピクセルが見えるだけ。
Arakawa et al. (2009) Source Code Biol. Med.

• 配列の逆順CGRを描くことによって、オリゴ配列表と座標系を対応づける。
 正しい(一般的に使う)マルコフ性を表現。
k-mer table and CGR
32px
                                             Creating a Font for effective
                                                     visualization
                               32px
                                                                     0   1   2   3   4
                                        Ben Fry Font


                                                                     5   6   7   8   9




                                      gaou pixel Font




                                      gaou pixel Font
Cartography of chromosome 21
         by Ben Fry
• マルコフ性が逆である。
         配列の逆読みでN+iの座標に対応。
• 一般化マルコフ遷移確率表と言っても、どの座標がどの塩基に対応するかが
わからない。
       オリゴ配列表と対応する一般座標系に。
• EMBOSSやAlmeidaのソフトウェアでは、画像がビットマップであり、せっか
くのフラクタルなのに拡大してもピクセルが見えるだけ。

   文字を記録しながら最小限のビットマップに。
• マルコフ性が逆である。
          配列の逆読みでN+iの座標に対応。
• 一般化マルコフ遷移確率表と言っても、どの座標がどの塩基に対応するかが
 わからない。
       オリゴ配列表と対応する一般座標系に。
• EMBOSSやAlmeidaのソフトウェアでは、画像がビットマップであり、せっか
 くのフラクタルなのに拡大してもピクセルが見えるだけ。

   文字を記録しながら最小限のビットマップに。
Google Maps APIを用いたZoomableなマップを構築。
    G-language RESTサービスをベースに。

Más contenido relacionado

Destacado

Granger因果による 時系列データの因果推定(因果フェス2015)
Granger因果による時系列データの因果推定(因果フェス2015)Granger因果による時系列データの因果推定(因果フェス2015)
Granger因果による 時系列データの因果推定(因果フェス2015)Takashi J OZAKI
 
Rによるデータサイエンス:12章「時系列」
Rによるデータサイエンス:12章「時系列」Rによるデータサイエンス:12章「時系列」
Rによるデータサイエンス:12章「時系列」Nagi Teramo
 
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測するTakashi J OZAKI
 
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」Takashi J OZAKI
 
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫るTakashi J OZAKI
 
ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
 ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイドEtsuji Nakai
 
Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~ Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~ Takashi J OZAKI
 
ビジネスの現場のデータ分析における理想と現実
ビジネスの現場のデータ分析における理想と現実ビジネスの現場のデータ分析における理想と現実
ビジネスの現場のデータ分析における理想と現実Takashi J OZAKI
 
Simple perceptron by TJO
Simple perceptron by TJOSimple perceptron by TJO
Simple perceptron by TJOTakashi J OZAKI
 

Destacado (9)

Granger因果による 時系列データの因果推定(因果フェス2015)
Granger因果による時系列データの因果推定(因果フェス2015)Granger因果による時系列データの因果推定(因果フェス2015)
Granger因果による 時系列データの因果推定(因果フェス2015)
 
Rによるデータサイエンス:12章「時系列」
Rによるデータサイエンス:12章「時系列」Rによるデータサイエンス:12章「時系列」
Rによるデータサイエンス:12章「時系列」
 
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
 
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
 
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
21世紀で最もセクシーな職業!?「データサイエンティスト」の実像に迫る
 
ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
 ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
 
Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~ Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~
 
ビジネスの現場のデータ分析における理想と現実
ビジネスの現場のデータ分析における理想と現実ビジネスの現場のデータ分析における理想と現実
ビジネスの現場のデータ分析における理想と現実
 
Simple perceptron by TJO
Simple perceptron by TJOSimple perceptron by TJO
Simple perceptron by TJO
 

Chaos Game Representation Web Service