Enviar búsqueda
Cargar
遺伝研 Rina Aizawa ユーザミーティング
•
1 recomendación
•
937 vistas
Tazro Ohta
Seguir
遺伝研DDBJスパコンユーザ会
Leer menos
Leer más
Ciencias
Denunciar
Compartir
Denunciar
Compartir
1 de 12
Descargar ahora
Descargar para leer sin conexión
Recomendados
Quincy: Fair Scheduling for Distributed Computing Clusters (SOSP’09) を読む
Quincy: Fair Scheduling for Distributed Computing Clusters (SOSP’09) を読む
peryaudo
Grunt.jsを使った Expressの開発環境構築
Grunt.jsを使った Expressの開発環境構築
kamiyam .
Ceilometer苦労話
Ceilometer苦労話
Daisuke Matsui
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
Kuninobu SaSaki
Parse触ってみた
Parse触ってみた
Naoya Harasawa
Red Hat Data Grid 8.1 新機能
Red Hat Data Grid 8.1 新機能
Chihiro Ito
20180423 OpenStackユーザー会 SDS
20180423 OpenStackユーザー会 SDS
Takuya Utsunomiya
Red Hat ストレージ製品
Red Hat ストレージ製品
Takuya Utsunomiya
Recomendados
Quincy: Fair Scheduling for Distributed Computing Clusters (SOSP’09) を読む
Quincy: Fair Scheduling for Distributed Computing Clusters (SOSP’09) を読む
peryaudo
Grunt.jsを使った Expressの開発環境構築
Grunt.jsを使った Expressの開発環境構築
kamiyam .
Ceilometer苦労話
Ceilometer苦労話
Daisuke Matsui
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
Kuninobu SaSaki
Parse触ってみた
Parse触ってみた
Naoya Harasawa
Red Hat Data Grid 8.1 新機能
Red Hat Data Grid 8.1 新機能
Chihiro Ito
20180423 OpenStackユーザー会 SDS
20180423 OpenStackユーザー会 SDS
Takuya Utsunomiya
Red Hat ストレージ製品
Red Hat ストレージ製品
Takuya Utsunomiya
Red Hat Data Grid 8.2 新機能
Red Hat Data Grid 8.2 新機能
Chihiro Ito
昨今のストレージ選定のポイントとCephStorageの特徴
昨今のストレージ選定のポイントとCephStorageの特徴
Takuya Utsunomiya
これからはNo sqlの時代って本当ですか
これからはNo sqlの時代って本当ですか
yumi_chappy
全文検索とUNKテーブル
全文検索とUNKテーブル
Haruyuki Nakano
あたらしい伺かを動かしてみたはなし
あたらしい伺かを動かしてみたはなし
kiki utagawa
NoSQLとビッグデータ入門編
NoSQLとビッグデータ入門編
Koichiro Nishijima
NASクラウドの連携3.pdf
NASクラウドの連携3.pdf
ssuser3440151
YCSB JSONB 対応版 を作ってMongoDB と 比較してみた
YCSB JSONB 対応版 を作ってMongoDB と 比較してみた
Toshi Harada
オープンデータ基盤としてのWindows Azure
オープンデータ基盤としてのWindows Azure
Masaki Takeda
Open data とは in open data day
Open data とは in open data day
ko ty
Dvx update 20180605
Dvx update 20180605
正明 羽鳥
Renesas Night 11
Renesas Night 11
Hirofumi Inomata
git移行の3つの山
git移行の3つの山
Katsuya Ohnishi
PostgreSQL のイケてるテクニック7選
PostgreSQL のイケてるテクニック7選
Tomoya Kawanishi
今から始めるDocument db
今から始めるDocument db
Kazunori Hamamoto
Database on Kubernetes - HA,Replication and more -
Database on Kubernetes - HA,Replication and more -
t8kobayashi
Aws x MLB ~after cast~
Aws x MLB ~after cast~
Yuta Matsumura
Introducing PostgreSQL on Kubernetes
Introducing PostgreSQL on Kubernetes
t8kobayashi
Postgresql on kubernetesへの道
Postgresql on kubernetesへの道
t8kobayashi
Google bigquery導入記
Google bigquery導入記
Yugo Shimizu
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...
Eli Kaminuma
遺伝研スパコンの『ここが困った!』事例集と今後への提言
遺伝研スパコンの『ここが困った!』事例集と今後への提言
Masahiro Kasahara
Más contenido relacionado
La actualidad más candente
Red Hat Data Grid 8.2 新機能
Red Hat Data Grid 8.2 新機能
Chihiro Ito
昨今のストレージ選定のポイントとCephStorageの特徴
昨今のストレージ選定のポイントとCephStorageの特徴
Takuya Utsunomiya
これからはNo sqlの時代って本当ですか
これからはNo sqlの時代って本当ですか
yumi_chappy
全文検索とUNKテーブル
全文検索とUNKテーブル
Haruyuki Nakano
あたらしい伺かを動かしてみたはなし
あたらしい伺かを動かしてみたはなし
kiki utagawa
NoSQLとビッグデータ入門編
NoSQLとビッグデータ入門編
Koichiro Nishijima
NASクラウドの連携3.pdf
NASクラウドの連携3.pdf
ssuser3440151
YCSB JSONB 対応版 を作ってMongoDB と 比較してみた
YCSB JSONB 対応版 を作ってMongoDB と 比較してみた
Toshi Harada
オープンデータ基盤としてのWindows Azure
オープンデータ基盤としてのWindows Azure
Masaki Takeda
Open data とは in open data day
Open data とは in open data day
ko ty
Dvx update 20180605
Dvx update 20180605
正明 羽鳥
Renesas Night 11
Renesas Night 11
Hirofumi Inomata
git移行の3つの山
git移行の3つの山
Katsuya Ohnishi
PostgreSQL のイケてるテクニック7選
PostgreSQL のイケてるテクニック7選
Tomoya Kawanishi
今から始めるDocument db
今から始めるDocument db
Kazunori Hamamoto
Database on Kubernetes - HA,Replication and more -
Database on Kubernetes - HA,Replication and more -
t8kobayashi
Aws x MLB ~after cast~
Aws x MLB ~after cast~
Yuta Matsumura
Introducing PostgreSQL on Kubernetes
Introducing PostgreSQL on Kubernetes
t8kobayashi
Postgresql on kubernetesへの道
Postgresql on kubernetesへの道
t8kobayashi
Google bigquery導入記
Google bigquery導入記
Yugo Shimizu
La actualidad más candente
(20)
Red Hat Data Grid 8.2 新機能
Red Hat Data Grid 8.2 新機能
昨今のストレージ選定のポイントとCephStorageの特徴
昨今のストレージ選定のポイントとCephStorageの特徴
これからはNo sqlの時代って本当ですか
これからはNo sqlの時代って本当ですか
全文検索とUNKテーブル
全文検索とUNKテーブル
あたらしい伺かを動かしてみたはなし
あたらしい伺かを動かしてみたはなし
NoSQLとビッグデータ入門編
NoSQLとビッグデータ入門編
NASクラウドの連携3.pdf
NASクラウドの連携3.pdf
YCSB JSONB 対応版 を作ってMongoDB と 比較してみた
YCSB JSONB 対応版 を作ってMongoDB と 比較してみた
オープンデータ基盤としてのWindows Azure
オープンデータ基盤としてのWindows Azure
Open data とは in open data day
Open data とは in open data day
Dvx update 20180605
Dvx update 20180605
Renesas Night 11
Renesas Night 11
git移行の3つの山
git移行の3つの山
PostgreSQL のイケてるテクニック7選
PostgreSQL のイケてるテクニック7選
今から始めるDocument db
今から始めるDocument db
Database on Kubernetes - HA,Replication and more -
Database on Kubernetes - HA,Replication and more -
Aws x MLB ~after cast~
Aws x MLB ~after cast~
Introducing PostgreSQL on Kubernetes
Introducing PostgreSQL on Kubernetes
Postgresql on kubernetesへの道
Postgresql on kubernetesへの道
Google bigquery導入記
Google bigquery導入記
Destacado
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...
Eli Kaminuma
遺伝研スパコンの『ここが困った!』事例集と今後への提言
遺伝研スパコンの『ここが困った!』事例集と今後への提言
Masahiro Kasahara
Ddbj all ver3
Ddbj all ver3
Yoshihiro_Handa
知っておくべきCephのIOアクセラレーション技術とその活用方法 - OpenStack最新情報セミナー 2015年9月
知っておくべきCephのIOアクセラレーション技術とその活用方法 - OpenStack最新情報セミナー 2015年9月
VirtualTech Japan Inc.
Ceph アーキテクチャ概説
Ceph アーキテクチャ概説
Emma Haruka Iwao
[DDBJing31] DDBJ と NIG SuperComputer の使い方
[DDBJing31] DDBJ と NIG SuperComputer の使い方
DNA Data Bank of Japan center
「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)
DNA Data Bank of Japan center
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
DNA Data Bank of Japan center
DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開
DNA Data Bank of Japan center
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
DNA Data Bank of Japan center
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
DNA Data Bank of Japan center
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
DNA Data Bank of Japan center
Destacado
(12)
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...
遺伝研スパコンの『ここが困った!』事例集と今後への提言
遺伝研スパコンの『ここが困った!』事例集と今後への提言
Ddbj all ver3
Ddbj all ver3
知っておくべきCephのIOアクセラレーション技術とその活用方法 - OpenStack最新情報セミナー 2015年9月
知っておくべきCephのIOアクセラレーション技術とその活用方法 - OpenStack最新情報セミナー 2015年9月
Ceph アーキテクチャ概説
Ceph アーキテクチャ概説
[DDBJing31] DDBJ と NIG SuperComputer の使い方
[DDBJing31] DDBJ と NIG SuperComputer の使い方
「次世代シークエンスデータの登録」(理研横浜)
「次世代シークエンスデータの登録」(理研横浜)
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
DDBJ センターにおける一次データベースの展開
DDBJ センターにおける一次データベースの展開
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
[DDBJ Challenge 2016] 機械学習コンペティションにおける予測モデリング手法の傾向
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
[DDBJ Challenge 2016] DDBJデータ解析事例「ChIP-Atlasデータベース」の紹介
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
[DDBJ Challenge 2016] 機械学習と予測モデルコンペティション
Similar a 遺伝研 Rina Aizawa ユーザミーティング
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
NTT DATA Technology & Innovation
OpenStack Object Storage; Usage
OpenStack Object Storage; Usage
irix_jp
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
Insight Technology, Inc.
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
Insight Technology, Inc.
"Global Distcloud File System" ~インタークラウド広域分散ファイルシステム 大陸間横断ライブマイグレーションを実現する技術
"Global Distcloud File System" ~インタークラウド広域分散ファイルシステム 大陸間横断ライブマイグレーションを実現する技術
Tech Circle
経済学のための実践的データ分析 4.SQL ことはじめ
経済学のための実践的データ分析 4.SQL ことはじめ
Yasushi Hara
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
Insight Technology, Inc.
Microsoft Build 2021 前夜祭 LT#4
Microsoft Build 2021 前夜祭 LT#4
Microsoft
20120913 nosql@hikarie(okuyama fuse)
20120913 nosql@hikarie(okuyama fuse)
Takahiro Iwase
ほんとに使える?Big Data SQL検証結果から見る、その有益性(性能編)
ほんとに使える?Big Data SQL検証結果から見る、その有益性(性能編)
オラクルエンジニア通信
Couchbase meetup21040925 sfa demo
Couchbase meetup21040925 sfa demo
ktoda
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
Genaris Omics, Inc.
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
Developers Summit
Panel Discussion@WebDB forum 2014
Panel Discussion@WebDB forum 2014
Makoto Yui
PostgreSQL開発コミュニティに参加しよう!(PostgreSQL Conference Japan 2021 発表資料)
PostgreSQL開発コミュニティに参加しよう!(PostgreSQL Conference Japan 2021 発表資料)
NTT DATA Technology & Innovation
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
日本マイクロソフト株式会社
マイニング探検会#10
マイニング探検会#10
Yoji Kiyota
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
DNA Data Bank of Japan center
20121013_GIS学会FOSS4G分科会
20121013_GIS学会FOSS4G分科会
Toshikazu Seto
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
Koichiro Sasaki
Similar a 遺伝研 Rina Aizawa ユーザミーティング
(20)
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
OpenStack Object Storage; Usage
OpenStack Object Storage; Usage
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
"Global Distcloud File System" ~インタークラウド広域分散ファイルシステム 大陸間横断ライブマイグレーションを実現する技術
"Global Distcloud File System" ~インタークラウド広域分散ファイルシステム 大陸間横断ライブマイグレーションを実現する技術
経済学のための実践的データ分析 4.SQL ことはじめ
経済学のための実践的データ分析 4.SQL ことはじめ
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
Microsoft Build 2021 前夜祭 LT#4
Microsoft Build 2021 前夜祭 LT#4
20120913 nosql@hikarie(okuyama fuse)
20120913 nosql@hikarie(okuyama fuse)
ほんとに使える?Big Data SQL検証結果から見る、その有益性(性能編)
ほんとに使える?Big Data SQL検証結果から見る、その有益性(性能編)
Couchbase meetup21040925 sfa demo
Couchbase meetup21040925 sfa demo
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
Panel Discussion@WebDB forum 2014
Panel Discussion@WebDB forum 2014
PostgreSQL開発コミュニティに参加しよう!(PostgreSQL Conference Japan 2021 発表資料)
PostgreSQL開発コミュニティに参加しよう!(PostgreSQL Conference Japan 2021 発表資料)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
マイニング探検会#10
マイニング探検会#10
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
20121013_GIS学会FOSS4G分科会
20121013_GIS学会FOSS4G分科会
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
Más de Tazro Ohta
Database Integration to Improve Accessibility to High-Throughput Sequence Data
Database Integration to Improve Accessibility to High-Throughput Sequence Data
Tazro Ohta
Now and then: next-generation sequencing database to encourage the big data s...
Now and then: next-generation sequencing database to encourage the big data s...
Tazro Ohta
次世代おもろい話
次世代おもろい話
Tazro Ohta
第三回統合牧場収穫祭イントロダクション
第三回統合牧場収穫祭イントロダクション
Tazro Ohta
Kusarinoko: developing the public next generation sequencing data search inte...
Kusarinoko: developing the public next generation sequencing data search inte...
Tazro Ohta
生存戦略、しましょうか。 或いは、もっともスマートな研究職の探し方
生存戦略、しましょうか。 或いは、もっともスマートな研究職の探し方
Tazro Ohta
Large-scale data in life science
Large-scale data in life science
Tazro Ohta
JPMA forum 2 at DBCLS 3. June 2011
JPMA forum 2 at DBCLS 3. June 2011
Tazro Ohta
"次世代シーケンサのデータ解析 戦略立案編"
"次世代シーケンサのデータ解析 戦略立案編"
Tazro Ohta
Transcriptome Sequenceによる遺伝子発現解析の実際
Transcriptome Sequenceによる遺伝子発現解析の実際
Tazro Ohta
Jaspug 2010
Jaspug 2010
Tazro Ohta
Más de Tazro Ohta
(11)
Database Integration to Improve Accessibility to High-Throughput Sequence Data
Database Integration to Improve Accessibility to High-Throughput Sequence Data
Now and then: next-generation sequencing database to encourage the big data s...
Now and then: next-generation sequencing database to encourage the big data s...
次世代おもろい話
次世代おもろい話
第三回統合牧場収穫祭イントロダクション
第三回統合牧場収穫祭イントロダクション
Kusarinoko: developing the public next generation sequencing data search inte...
Kusarinoko: developing the public next generation sequencing data search inte...
生存戦略、しましょうか。 或いは、もっともスマートな研究職の探し方
生存戦略、しましょうか。 或いは、もっともスマートな研究職の探し方
Large-scale data in life science
Large-scale data in life science
JPMA forum 2 at DBCLS 3. June 2011
JPMA forum 2 at DBCLS 3. June 2011
"次世代シーケンサのデータ解析 戦略立案編"
"次世代シーケンサのデータ解析 戦略立案編"
Transcriptome Sequenceによる遺伝子発現解析の実際
Transcriptome Sequenceによる遺伝子発現解析の実際
Jaspug 2010
Jaspug 2010
遺伝研 Rina Aizawa ユーザミーティング
1.
大量NGSデータの並列処理と共用スパコンにおける環境構築の今後について 情報・システム研究機構 ライフサイエンス統合データベースセンター 大田 達郎 <t.ohta@dbcls.rois.ac.jp> ! prepared
for 遺伝研DDBJスパコンユーザ会 July 22, 2014
2.
Summary ‣ 遺伝研スパコンを利用し公開NGSデータ全てに対して バッチ処理を行い,DBの構築を行っています ! ‣ データ解析パイプラインの共有・再実行を行うための VM/コンテナを利用した環境構築の調査・開発を行っています
3.
sra.dbcls.jp
4.
‣ 公開NGSデータに対してFastQCを実行し結果を回収・集計 ‣ DL可能なデータ全てが対象 ‣
∼2013年登録分まで完了 ‣ 総データ数 ‣ 452,144 Sequence Run (single or paired) ‣ 総データサイズ ‣ 745,802,769,612,172 (745T) 塩基対 公開NGSデータのリードクオリティDB
5.
‣ データ転送速度 ‣ lftp
mgetによる16GBのデータ転送 13:00.20 => 1:35.58 (x8.16) ‣ 同時並列実行数 ‣ 64CPU => 3184CPU (x49.75) 既存計算機環境との差
6.
‣ ソフトウェアのバージョン管理の問題 ‣ 共用環境ではインストールが難しい場合もある ‣
現状は東大笠原さんのLPMを使わせて頂くなどで回避 ‣ http://www.kasahara.ws/lpm/ ‣ 大量のデータに対してひとつひとつ手作業? 課題: 論文に書かれたパイプラインを再現することが困難
7.
‣ VirtualMachine(VM)やコンテナで環境ごと解析パイプラインを共有 ‣ イメージを展開してすぐに解析を始めることができる ‣
環境構築とイメージ共有の技術調査/開発を行っています ‣ Amazon Web ServiceにおけるAMIの共有 ‣ Docker Hubにおけるコンテナイメージの共有 ‣ 遺伝研スパコンでもこれらと互換性を持たせたい データ解析の再現性を担保するための解決策
8.
コードやソフトウェアと同じように解析環境を公開/共有
9.
コードやソフトウェアと同じように解析環境を公開/共有 $ docker run
-d -p 8080:80 -t inutano/galaxy
10.
‣ イメージ共有で環境への依存がなくなると選択肢が増える ‣ 自分で購入した計算機 ‣
遺伝研スパコンなどの共用計算機リソース ‣ Amazon Web Service(AWS)などのInfrastructure as a Service(IaaS) ‣ 決め手は導入のコストとマシン構成,コスト ‣ AWSのコストがかなり下がったため選択肢として現実的に ‣ ルーチンな計算は遺伝研スパコンで(ただなので) 計算機プラットフォームの選択
11.
初期導入コスト 維持コスト 構成の柔軟性
信頼性/永続性 秘匿性 特徴 個別導入 ✕ ✕ ⃝ △ ⃝ 資金あれば制約なし 共用計算機資源 (NIGスパコン) ⃝ ⃝ △ △ ✕ DDBJのDBと直結 IaaS (クラウド) ⃝ △ ⃝ △ △ 必要な時に必要なだけ コストも年々下がる ユーザ視点での各計算機環境のメリット比較
12.
Summary ‣ 遺伝研スパコンを利用し公開NGSデータ全てに対して バッチ処理を行うことでDBの構築を行っています ! ‣ データ処理/解析パイプラインの保存/永続化/再実行を行うための VM/コンテナを利用した環境構築と公開DBの調査・開発を行っています
Descargar ahora