Portableportal

提供:TogoWiki

移動: 案内, 検索

目次

Interested

青木さん、山田さん、新町さん、おおた

Motivation

  • 作っているデータを他のデータと合わせたときにちゃんとクエリが書けるのか?をテストするのがだるい
    • 任意のデータセットがロードされた SPARQL Endpoint を (ローカル|クラウド) にお手軽に作りたい

Prototype

Manual Creation

  • virtuoso の rdfloader scriptを初期からロードされているイメージ。
  • rdfloaderのfunctionを使ってデータをロード
  • docker commitを使ってロードされた状態のコンテナーを新イメージ化
  • docker pushで新イメージのバージョンをプッシュ

Automation

  • ユーザは混ぜたいデータを引数に docker コマンドを打つ
    • $ docker run -it -v /my/local/tax:/dir/in/container dude/portablePortal:latest load "glytoucan" "taxonomy:1.0"
  • Virtuosoか何かTriplestoreがpackageされたコンテナがpullされてくる (初回時のみ)
  • コンテナが立ち上がる
  • NBDCのFTPサイトからバージョンを指定してttlをfetchする
  • triplestoreにロードする
  • (゚д゚)ウマー

ToDo

  • GlyTouCan で使っているコンテナは現状ではappとdataがバンドルされているのでそれを分離する
  • リモートにある複数のttlをfetchしてロードするスクリプトをつくる
  • NBDCないしDBCLSで色々のデータを管理する体制を整える
    • full のデータだけでなくサブセットやテスト用の小さいデータも揃っているとハッピー
      • tutorial用の小さいセットとか、微生物だけ/真核だけ/植物だけのRefSeqとかなんかそういうの
個人用ツール