SPARQL Builderの開発計画
提供:TogoWiki
SPARQL Builder の開発 (3ヵ年計画)
目的:
単数あるいは複数のSPARQL Endpointを対象に、RDFやSPARQLの知識を必要としないGUIをユーザに提供し、ユーザが欲しいデータ種(クラス)と興味の対象(クラス)を指定するとそれらを繋ぐRDFデータ群を取得、ダウンロード可能とするようツール SPARQL Builderの開発研究を行う。
開発グループは3つ
- 1. メタデータグループ (山本、小林)
- 2. 連合検索開発グループ (山口、小林)
- 3. システム開発研究 (桝屋、古崎、山口、山本、小林)
各グループは独立して研究開発を行うように編成されているが、必要に応じてグループの枠組みを越えて相互協力し、目標達成に挑む。
当面はSPARQLthonにて、ユーザに提供すべきGUIの仕様を検討し、各グループ個別の課題推進は進捗共有程度に留める。
国際会議等にマイルストンをおいて研究をすすめる。
- ISWC
- JIST
- SWAT4LS
- NAR Web Server Issue
課題1.SPARQL BuilderのGUIの仕様を決める
- 入力は? (現在 クラス2つ および パス1本)
- 対象クエリは? (現在 クラス間パス)
- 出力の見せ方は? (現在 SPARQLの結果そのまま)
課題2. 連合検索の実例収集と評価
- 今年度は http://srvgal78.deri.ie/BioFed/queries.html を利用予定
- 顕微鏡画像<->モデル生物 のユースケースを詰める
1.メタデータグループ
生命科学系RDFデータを提供するSPARQL Endpointをクロールして、データスキーマ(これをメタデータと呼ぶ)を抽出してメタデータ化する 連合検索を高効率に行うために必要なメタデータの仕様を検討する。そのクローラを開発して実行して、主要なSPARQL endpointのメタデータを収集する。
さらに、VoID、HCLS Community Profile、IntegBio等のデータベースカタログ情報提供を提供するSPARQL Endpointについてはそれらも収集し、 上記メタデータと合わせてカタログ化し、データベース化して公開する。
2.連合検索開発グループ
データ統合を、SPARQL endpointのデータを集約して統合するのではなく、統合に必要なデータサブセットのみを分散環境からSPARQLの連合検索の仕組を活用して実現させる。 現在のSPARQL連合検索の仕様では探索空間の広さ、探索効率の点で実用に問題があり、上記メタデータを活用した実用的な連合検索機能を実現させる。
3.システム開発研究
生命科学研究で必要なツールとしてのSPARQL Builderの完成を図る。
これまで開発してきたSPARQL Builder は、トリプルがシーケンシャルにつながっている(パス)構造を重視してGUIの開発が行われてきたが、これを見直して研究のニーズに適したGUIに作り変える。