SPARQL Builderの開発計画

提供:TogoWiki

移動: 案内, 検索

SPARQL Builder の開発 (3ヵ年計画)


目的: 単数あるいは複数のSPARQL Endpointを対象に、RDFやSPARQLの知識を必要としないGUIをユーザに提供し、ユーザが欲しいデータ種(クラス)と興味の対象(クラス)を指定するとそれらを繋ぐRDFデータ群を取得、ダウンロード可能とするようツール SPARQL Builderの開発研究を行う。


開発グループは3つ

1. メタデータグループ (山本、小林)

2. 連合検索開発グループ (山口、小林)

3. システム開発研究 (桝屋、古崎、山口、山本、小林)


各グループは独立して研究開発を行うように編成されているが、必要に応じてグループの枠組みを越えて相互協力し、目標達成に挑む。

当面はSPARQLthonにて、ユーザに提供すべきGUIの仕様を検討し、各グループ個別の課題推進は進捗共有程度に留める。

国際会議等にマイルストンをおいて研究をすすめる。

  • ISWC
  • JIST
  • SWAT4LS
  • NAR Web Server Issue



課題1.SPARQL BuilderのGUIの仕様を決める

  •  入力は? (現在 クラス2つ および パス1本)
  • 対象クエリは? (現在 クラス間パス)
  • 出力の見せ方は? (現在 SPARQLの結果そのまま)

課題2. 連合検索の実例収集と評価


1.メタデータグループ

生命科学系RDFデータを提供するSPARQL Endpointをクロールして、データスキーマ(これをメタデータと呼ぶ)を抽出してメタデータ化する 連合検索を高効率に行うために必要なメタデータの仕様を検討する。そのクローラを開発して実行して、主要なSPARQL endpointのメタデータを収集する。

さらに、VoID、HCLS Community Profile、IntegBio等のデータベースカタログ情報提供を提供するSPARQL Endpointについてはそれらも収集し、 上記メタデータと合わせてカタログ化し、データベース化して公開する。


2.連合検索開発グループ

データ統合を、SPARQL endpointのデータを集約して統合するのではなく、統合に必要なデータサブセットのみを分散環境からSPARQLの連合検索の仕組を活用して実現させる。 現在のSPARQL連合検索の仕様では探索空間の広さ、探索効率の点で実用に問題があり、上記メタデータを活用した実用的な連合検索機能を実現させる。


3.システム開発研究

生命科学研究で必要なツールとしてのSPARQL Builderの完成を図る。

これまで開発してきたSPARQL Builder は、トリプルがシーケンシャルにつながっている(パス)構造を重視してGUIの開発が行われてきたが、これを見直して研究のニーズに適したGUIに作り変える。