Portableportal
提供:TogoWiki
目次 |
Interested
青木さん、山田さん、新町さん、おおた
Motivation
- 作っているデータを他のデータと合わせたときにちゃんとクエリが書けるのか?をテストするのがだるい
- 任意のデータセットがロードされた SPARQL Endpoint を (ローカル|クラウド) にお手軽に作りたい
Solution
- https://github.com/aokinobu/docker-taxonomy.git
- 直接登録されたタクソノミー用リポジトリー
- docker-compose pull; docker-compose up
- http://localhost:8890
Manual Creation
- virtuoso の rdfloader scriptを初期からロードされているイメージ。
- rdfloaderのfunctionを使ってデータをロード
- docker commitを使ってロードされた状態のコンテナーを新イメージ化
- docker pushで新イメージのバージョンをプッシュ
Automation
- ユーザは混ぜたいデータを引数に docker コマンドを打つ
- $ docker run -it -v /my/local/tax:/dir/in/container dude/portablePortal:latest load "glytoucan" "taxonomy:1.0"
- Virtuosoか何かTriplestoreがpackageされたコンテナがpullされてくる (初回時のみ)
- コンテナが立ち上がる
- NBDCのFTPサイトからバージョンを指定してttlをfetchする
- triplestoreにロードする
- (゚д゚)ウマー
ToDo
- GlyTouCan で使っているコンテナは現状ではappとdataがバンドルされているのでそれを分離する
- リモートにある複数のttlをfetchしてロードするスクリプトをつくる
- NBDCないしDBCLSで色々のデータを管理する体制を整える
- full のデータだけでなくサブセットやテスト用の小さいデータも揃っているとハッピー
- tutorial用の小さいセットとか、微生物だけ/真核だけ/植物だけのRefSeqとかなんかそういうの
- full のデータだけでなくサブセットやテスト用の小さいデータも揃っているとハッピー