TPP-masuya

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(TPP_Masuya RDFスキーマのツクリカタ説明(テスト作成))
(TPP_Masuya RDFスキーマのツクリカタ説明(テスト作成))
28行: 28行:
== TPP_Masuya RDFスキーマのツクリカタ説明(テスト作成) ==
== TPP_Masuya RDFスキーマのツクリカタ説明(テスト作成) ==
* 表現型データ
* 表現型データ
-
 計測データオブジェクト毎にインスタンスを作成する。各データは何かのクラスに属するようにする(例:BRCマウスクリニックデータ、等)。計測対象が同じでも、値の形式が異なる場合(定量値と定性値等)は、別のインスタンスを作成する(<=要検討)。本「データ」は、表現型そのものではなく、[表現型をEAVモデル http://en.wikipedia.org/wiki/Entity–attribute–value_model] の形式で記述した「informational entity」である。
+
 計測データオブジェクト毎にインスタンスを作成する。各データは何かのクラスに属するようにする(例:BRCマウスクリニックデータ、等)。計測対象が同じでも、値の形式が異なる場合(定量値と定性値等)は、別のインスタンスを作成する(<=要検討)。本「データ」は、表現型そのものではなく、表現型を[[EAVモデル http://en.wikipedia.org/wiki/Entity–attribute–value_model]] の形式で記述した「informational entity」である。
**indicates_entity_whole プロパティ:測定対象の個体/コホートのインスタンスを述語とする。indicates_entityの解剖学概念やプロセスのインスタンスを作らないようにする意図でこのプロパティを使う。
**indicates_entity_whole プロパティ:測定対象の個体/コホートのインスタンスを述語とする。indicates_entityの解剖学概念やプロセスのインスタンスを作らないようにする意図でこのプロパティを使う。

2014年10月27日 (月) 05:37時点における版

研究開発課題名 生命と環境のフェノーム統合データベース
研究代表者 桝屋 啓志
所属・役職 理化学研究所 バイオリソースセンター ユニットリーダー
概   要 遺伝子の多様性の結果として現れる生命の表現型(フェノタイプ)の情報を、モデル動物(マウス、ラット、ゼブラフィッシュ、メダカ)、ゲノム編集研究など、幅広い研究コミュニティから収集し、研究分野の垣根を超えて標準化・統合化・体系化してオープンに公開する。集約されたフェノタイプ情報は、ゲノム情報や分子情報とともに横断的に利活用することで、新たな生命科学イノベーションの原動力となると期待される。

目次

参加メンバー

  • 桝屋 啓志 (理研)
  • 高月 照江(理研)
  • 熊谷 禎洋(日立ソリューション)

検討課題

フェノームのRDFスキーマの設計、および相互運用性の確立

  • 数値のRDF記述についての検討
  • 生物種、系統のRDF(with 植物グループ)

SPARQLthon21#Taxonomy Ontology について

  • その他植物グループとのスキーマ検討
  • 複数生物のフェノームを繋ぐデータ
  • データ項目のリスト
  • 外部RDFを利用するデータリスト

TPP_Masuya RDFスキーマのツクリカタ説明(テスト作成)

  • 表現型データ

 計測データオブジェクト毎にインスタンスを作成する。各データは何かのクラスに属するようにする(例:BRCマウスクリニックデータ、等)。計測対象が同じでも、値の形式が異なる場合(定量値と定性値等)は、別のインスタンスを作成する(<=要検討)。本「データ」は、表現型そのものではなく、表現型をEAVモデル http://en.wikipedia.org/wiki/Entity–attribute–value_model の形式で記述した「informational entity」である。

    • indicates_entity_whole プロパティ:測定対象の個体/コホートのインスタンスを述語とする。indicates_entityの解剖学概念やプロセスのインスタンスを作らないようにする意図でこのプロパティを使う。
    • indicates_entity プロパティ:測定対象Entity(クラス)への述語。物である解剖学的概念や、プロセスである
    • indicates_trait プロパティ
    • indicates_value プロパティ
    • indicates_stage プロパティ
  • バイオリソース関連
  • 文献へのリンク
  • 種間表現型のリンク

これまでの成果

  • フェノームのRDFスキーマの設計:全体概要像(2014.6.19更新)

3.jpg

  • フェノームのRDFスキーマの設計:基礎部分: EAVモデル(2014.6.19更新)

1.jpg

  •  数値のRDF記述についての検討(2014.8.18更新)
    • 方法1:ブランクノードを使った記述

2.jpg

[
a:濃度量; 
:value “100”^^xsd:demical; 
:unit <mg/ml>
]  
こんな感じ?
    • 方法2:^^を使ってリテラルに属性を書く
:has_quantity “100”^^xsd:demical; ^^mg/ml;

(has_quantityはリテラルプロパティ) こうすることで、リテラルでありながら、mg/mlである、という意味をもつことができる。

      • 利点:プロパティが少なくて済む

疑問点:xsd:demicalはリテラルの下位概念で良いと思うが、mg/mlはリテラルとは全く違う概念定義されるはずなので、それは良いのかどうか



  • 生物種、系統の記述についての検討(with 植物グループ)(2014.8.18更新)


  • データ項目のリスト

植物グループに習って作成する。


●登録を予定している項目のリスト(2014.7.16更新:高月)   https://docs.google.com/spreadsheets/d/161D5D1Vp00QJs9AaaHXJULAiqapL3xkibKmltmroObQ/edit#gid=sharing


  • 外部RDFを利用するデータリスト(2014.7.16更新:高月)

 外部からのRDFを利用する場合、直接のリンクは、動作に不具合が生じることがあるとの事。  Bioportalでは、エンドポイントを持っているが、基本的にはデモ用のメンテナンスとの事で、  大量のバッチを投げたりすることは推奨しておらず。  また、Bio2RDFのサイトでは、エンドポイントも設置してあるが、保持しているデータが古く  更新されていない。

●現在までの調査結果(2014.7.16更新:高月)   https://docs.google.com/spreadsheets/d/1pl6szC4lK9qJzXxMbFwg1DrvPPRJ85NoygzcOyudmwo/edit?usp=sharing

SPARQLthon

Mediawiki ヘルプへのリンク

フォーマット リンク

個人用ツール