BH14.14/Docker
提供:TogoWiki
Docker for BioDevOps, またの名を「チームなんでもコンテナ隊」
目次 |
Motivation
This is why we do this.
Members
- 池田
- 大石
- 坊農
- 仲里
- 内藤
- 小野
- 大田
Manifesto
1日1コンテナ
バイオハッカソンでやりまぁす
- 創薬系キュレーション支援ツールの環境配布 (池田)
- ゲノム解析ワークフローのパッケージング・レシピ化
- ゲノムアセンブラなど
- Pitagora-Galaxy
- FANTOM5データ解析ワークフローのパッケージング
- ワイワイメタデータ
- 複数ソースのメタデータの管理を一括化
- SRA
- BioSample
- BioProject
- Proteome
- 複数ソースのメタデータの管理を一括化
- DBCLS SRA
- UI改修
Day 1
Docker講習会をしました。環境は Docker on CoreOS launched via vagrant/virtualbox on MacOS です。
本日のDockerfile
- https://registry.hub.docker.com/u/inutano/cmatrix
- スクリーンセーバー。dockerのお試しに最適です
- https://registry.hub.docker.com/u/bonohu/hmmemit
- HMMERパッケージのプログラムhmmemit。profileHMMのみで実行できるのでテストに最適です
- https://registry.hub.docker.com/u/dogrunjp/docker-bottle/
Day 2
Docker講習会をしながらDockerfileをがりがり作っています。
本日のDockerfile
- https://registry.hub.docker.com/u/bonohu/debian-hmmsearch/
- みんなおなじみHMMERのhmmsearchプログラム。profile HMMならびにDBが決め打ちですが
- https://registry.hub.docker.com/u/kazikedahixton/inchi-iupac-docker/
- IUPACが提供する公式InChI Generator。化合物構造をSDFから(ChEMBLなどとマッチング可能な)InChI-Keyに変換できます。
- https://registry.hub.docker.com/u/chalkless/constngs/
- FastQC, Bowtie2, samtoolsをインストールする
- https://registry.hub.docker.com/u/inutano/delve
- FANTOM5で使われたshort read aligner
- https://registry.hub.docker.com/u/dogrunjp/docker-meteor/
Day 3
Dockerthonをしてます。
本日のDockerfile
- https://registry.hub.docker.com/u/bonohu/debian-hmmsearch2/
- 昨日作成したhmmsearchのDockerfileでprofile HMMとDBを指定して実行できるように
- https://registry.hub.docker.com/u/chalkless/test-instbioperl/
- BioPerlをインストールした環境を提供(キリッ
- https://registry.hub.docker.com/u/inutano/blast-docker/
- blast突っ込んだコンテナ
- https://registry.hub.docker.com/u/inutano/sra-toolkit/
- sraフォーマットで圧縮されたファイルを展開するのに必要なtoolkitが丁寧にインストールされた逸品
検討事項
- データ永続化
- コンテナビルド中に作ったデータはコンテナを潰すと残らない
- 例えばビルドの途中でmakeblastdbしてファイルを拵えてもそれはコンテナが落ちるとなくなる
- コンテナのshを起動してインタラクティブに使ったり標準出力で出す分には問題ない
- 解決策
- 全部S3に突っ込む
- 富豪的解決策
- データファイルを受け取ってホストに突っ込むサーバ的な別コンテナを建ててそっちに投げる
- MySQLなどのDBMSを使うwebappはこのパターンを採用している
- コンテナ間でのフラットファイルのやりとりはどうなんだ?
- 全部S3に突っ込む
- コンテナビルド中に作ったデータはコンテナを潰すと残らない
- コンテナ間連携
- ワークフロー的にコンテナ間でデータのやりとりをする必要性
- Illumina BaseSpaceのようにディレクトリをマウントして全てそこにやりたいがillumina basespaceのコンテナはDockerfileが公開されてない?
- プロダクションでの運用
- 死活管理やリソース管理、ネットワークセキュリティなどなど課題は盛りだくさん
Day 4
Dockerthonをしてます。
本日のDockerfile
- https://registry.hub.docker.com/u/chalkless/test-fetchsra/
- SRAの某かのIDを指定すると、関連する.sraファイルへのリンクを(とりあえず)表示する(とりあえずな)
- https://registry.hub.docker.com/u/hiromasaono/tblastx_pig2human/
- ncbi-blast+をインストール → human cDNA (GRCh38)取得 → togowsでpig PPARG(723266032.fasta)取得 → makeblastdb → tblastx 実行 の流れ
- https://registry.hub.docker.com/u/dogrunjp/docker-it-phangomjs/
- https://registry.hub.docker.com/u/bonohu/ubuntu-tophat/
- run tophat (A spliced read mapper for RNA-Seq)
Day 5
Dockerthonをしてます。
- GitHubとDocker初心者のためのDockerコンテナ作りまとめ https://gist.github.com/hiromasaono/1187dd6a34ca221baada
- BioDockerthon the last day - bonohu.jp
- d3MeteorS2P