TPP-DB

提供:TogoWiki

2014年9月25日 (木) 06:28時点におけるMasuya (トーク | 投稿記録)による版
移動: 案内, 検索

統合化推進プログラム (TPP) の各グループが持つデータベースを俯瞰し、RDF による統合データベース化にあたって共通化できる部分を検討する。

目次

各 TPP DB の共通 RDF モデル/オントロジー

TPP 各グループのデータ分野とRDF化対象の表

7ページ目の図を参考程度に

各プロジェクトのスキーマに関しては、下記にそれぞれ図をアップする。

TODO

  • 各分野ごとに共通に使用する RDF モデルとオントロジーを整理する
  • 分野間をまたぐ property (predicate) も揃えたい
  • できるだけ各分野間で(rdfs:seeAlso などで)リンクしあいましょう (URI はできれば Identifiers.org のもので)リンクトデータの原則
  • 具体的なプロジェクト間連携の例・・・

Biological entity

生物サンプルをtaxionomy ontologyとリンクさせて記述する

化合物

文献

数値/定量値

単位付き数値。15g、10cm等の記述方法

ゲノム関連

ゲノム、ゲノムの中の位置情報、オルソログ、遺伝子・遺伝マーカー・QTL、アレル,バリアント、SNP、Genotype等

SPARQLthon 24 (2014/9/25)

  • Biological entityについて、前回の合意(議論?)に沿ってまとめた。SPARQLthon24#biological entity taxonプロパティは共通化できるかも。
  • 数値/定量値について、桝屋Gも黒川Gと同様の記述とする

SPARQLthon 23 (2014/8/18)

  • RDF化対象の表のうち、"実験結果、データ" に分類されている項目については、スキーマ作成を先行させるのではなく、TPPグループ関係者で、まずRDFデータを作った後に、お互いにレビューすることで進めていく。
  • 現状、気をつけたいことは、主要な語彙(RDF, RDFS, OWL, SKOS, DC, DCterm, FOAF等)にある語彙が利用できる場合は利用すること。
    • データのIDを記述する場合は、dc:identifiers を利用する。
    • 各プロジェクトで使うオントロジーは、RDF化対象の表を参照。
    • 前回おおまかに合意している、 biological entity, 化合物、ゲノムに関しては、生物種/分野横断的に使えるので、共通して使っていく。
  • "統合化"について、見せる成果としては、具体的にデータ連携するプロジェクト間を繋ぐスタンザを作成する、をとりあえずの目標とする。
  • 各プロジェクトが各分野で世界とつながることが重要。TPP内統合が小さくまとまらないように。
  • SPARQLthon23#文献 櫛田さんより、個々の文献の識別にどのIDが使えそうか検討の報告

SPARQLthon 22 (2014/7/15)

SPARQLthon 22 (2014/6/18)

個人用ツール