Portableportal

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(How)
(Solution)
 
8行: 8行:
** 任意のデータセットがロードされた SPARQL Endpoint を (ローカル|クラウド) にお手軽に作りたい
** 任意のデータセットがロードされた SPARQL Endpoint を (ローカル|クラウド) にお手軽に作りたい
-
== Solution ==
+
== Prototype ==
* https://github.com/aokinobu/docker-taxonomy.git
* https://github.com/aokinobu/docker-taxonomy.git

2017年4月13日 (木) 08:06時点における最新版

目次

Interested

青木さん、山田さん、新町さん、おおた

Motivation

  • 作っているデータを他のデータと合わせたときにちゃんとクエリが書けるのか?をテストするのがだるい
    • 任意のデータセットがロードされた SPARQL Endpoint を (ローカル|クラウド) にお手軽に作りたい

Prototype

Manual Creation

  • virtuoso の rdfloader scriptを初期からロードされているイメージ。
  • rdfloaderのfunctionを使ってデータをロード
  • docker commitを使ってロードされた状態のコンテナーを新イメージ化
  • docker pushで新イメージのバージョンをプッシュ

Automation

  • ユーザは混ぜたいデータを引数に docker コマンドを打つ
    • $ docker run -it -v /my/local/tax:/dir/in/container dude/portablePortal:latest load "glytoucan" "taxonomy:1.0"
  • Virtuosoか何かTriplestoreがpackageされたコンテナがpullされてくる (初回時のみ)
  • コンテナが立ち上がる
  • NBDCのFTPサイトからバージョンを指定してttlをfetchする
  • triplestoreにロードする
  • (゚д゚)ウマー

ToDo

  • GlyTouCan で使っているコンテナは現状ではappとdataがバンドルされているのでそれを分離する
  • リモートにある複数のttlをfetchしてロードするスクリプトをつくる
  • NBDCないしDBCLSで色々のデータを管理する体制を整える
    • full のデータだけでなくサブセットやテスト用の小さいデータも揃っているとハッピー
      • tutorial用の小さいセットとか、微生物だけ/真核だけ/植物だけのRefSeqとかなんかそういうの
/mw/Portableportal」より作成