BH16.12/FederatedSearch
提供:TogoWiki
目次 |
目標
- DynaJoinを使える形に
メンバー
金,山口
現状
- http://fsearch.dbcls.jp/bio2RDF/ でbio2rdf対象のものがサービス中
- Bio2RDF のみが対象,かつ古いエンドポイントを指しているので事実上動かない
- https://github.com/rainy5/DynaJoin にてソース公開されているがこちらも Bio2RDF に特化されている(ハードコーディングされてる)上,そのままでは動かない(ライブラリが足りない)
やったこと
- https://github.com/acopom/DynaJoin にフォーク
- 必要なライブラリを追加
- 任意のエンドポイントのリストのファイルを引数で選べるようにサーブレットを改変
- index.htmlを改変
- ローカルに1エンドポイントで一通り動くことを確認
- 細かいbug fix (count数の取得方法がVirtuoso依存だったのを標準的な方法に変更,など)
- http://fsearch.dbcls.jp/dynajoin/ にデプロイ
Virtuoso問題
- DynaJoinからクエリを投げると406 errorを返してくるエンドポイントがあることが判明
- FedX(DynaJoinの元になったfederated search system)でも同じエンドポイントからは406 error が返ってくる
- 406 が返るエンドポイントはVirtuoso7(いろんなバージョン,含む最新版)であることが判明
- FedX側のsesameは Accept: application/sparql-results+xml で request を出しているが , ASK文でうまく受け渡しできてない模様
- とりあえずDydra(問題なくクエリを投げられる)に必要なデータを入れて実験することに
実験
データセット
- Sider
- DrugBank
クエリ
FedX と DynaJoin の比較
- Query 1 (簡単) FedX: 一瞬で正解,DynaJoin: 一瞬で正解
- Query 2 (ちょっと難しい) FedX: 数秒で不正解,DynaJoin: 数秒で正解
- Query 3 (かなり難しい) FedX: 10分以上戻ってこない,DynaJoin: 数十秒で正解