TPP-masuya

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(TPP_Masuya RDFスキーマのツクリカタ説明(テスト作成))
(TPP_Masuya RDFスキーマのツクリカタ説明(テスト作成))
46行: 46行:
***'''BRC_IDプロパティ等(バイオリソース特有:'''述語はリテラル。他の括りのIDも同様にリテラルプロパティで作る。
***'''BRC_IDプロパティ等(バイオリソース特有:'''述語はリテラル。他の括りのIDも同様にリテラルプロパティで作る。
**'''コホート:'''コホートを定義し、インスタンスを作成する。系統や性別などコホートの定義に関わるプロパティをつける。
**'''コホート:'''コホートを定義し、インスタンスを作成する。系統や性別などコホートの定義に関わるプロパティをつける。
-
***'''memberプロパティ:'''系統を述語とする。コホートのメンバーのクラス制約が、系統くらす、という意味。(OWLのプロパティにした方が良い?)
+
***'''memberプロパティ:'''系統を述語とする。コホートのメンバーのクラス制約が、系統クラスである、という意味。(OWLのプロパティにした方が良い?)
***'''grouping_genderプロパティ:'''基本的に、PATO:0001894(phenotypic sex)の下位概念を述語とする。
***'''grouping_genderプロパティ:'''基本的に、PATO:0001894(phenotypic sex)の下位概念を述語とする。
 +
***'''has_genotypeプロパティ:'''述語がgenotype。グルーピングの基準にgenotypeがある場合。
**'''個体:'''ブランクノードとする。「ディッシュの中の細胞」とかも、コホート様のものを定義するのもどうかと思われ、ブランクノードで良いのではないか・・・
**'''個体:'''ブランクノードとする。「ディッシュの中の細胞」とかも、コホート様のものを定義するのもどうかと思われ、ブランクノードで良いのではないか・・・

2014年10月27日 (月) 06:37時点における版

研究開発課題名 生命と環境のフェノーム統合データベース
研究代表者 桝屋 啓志
所属・役職 理化学研究所 バイオリソースセンター ユニットリーダー
概   要 遺伝子の多様性の結果として現れる生命の表現型(フェノタイプ)の情報を、モデル動物(マウス、ラット、ゼブラフィッシュ、メダカ)、ゲノム編集研究など、幅広い研究コミュニティから収集し、研究分野の垣根を超えて標準化・統合化・体系化してオープンに公開する。集約されたフェノタイプ情報は、ゲノム情報や分子情報とともに横断的に利活用することで、新たな生命科学イノベーションの原動力となると期待される。

目次

参加メンバー

  • 桝屋 啓志 (理研)
  • 高月 照江(理研)
  • 熊谷 禎洋(日立ソリューション)

検討課題

フェノームのRDFスキーマの設計、および相互運用性の確立

  • 数値のRDF記述についての検討
  • 生物種、系統のRDF(with 植物グループ)

SPARQLthon21#Taxonomy Ontology について

  • その他植物グループとのスキーマ検討
  • 複数生物のフェノームを繋ぐデータ
  • データ項目のリスト
  • 外部RDFを利用するデータリスト

TPP_Masuya RDFスキーマのツクリカタ説明(テスト作成)

(プロパティは、全てを列挙できている訳ではないので注意)

  • 表現型データ

 計測データオブジェクト毎にインスタンスを作成する。各データは何かのクラスに属するようにする(例:BRCマウスクリニックデータ、等)。計測対象が同じでも、値の形式が異なる場合(定量値と定性値等)は、別のインスタンスを作成する(<=要検討)。本「データ」は、表現型そのものではなく、表現型を[EAVモデル] の形式で記述した「informational entity」である。下記のプロパティを持つ。各プロパティは、なるべくインスタンス生成なしに、クラスで記述できる事を意図してデザインしている。(必要な場合には、プログラム的に生成可能なはず・・)

    • indicates_entity_whole プロパティ:測定対象の個体/コホートのインスタンスを述語とする。indicates_entityの解剖学概念やプロセス、indicates_traitのPATOのインスタンスを作らないようにする意図でこのプロパティを使う。Strainそのものを述語にしてはダメ。
    • indicates_entity プロパティ:測定対象Entityを述語とする。述語はクラスで良い。例えば、"物"であるMA, FMA概念や、プロセスであるGOの概念。
    • indicates_trait プロパティ:測定対象のQuality Typeを述語とする。述語はクラスで良い。具体的には、PATOの中間概念(attribute slim)。indicates_entityが"物"の場合は、PATO:0001241(physical object quality)、プロセスの場合は、PATO:0001236(process quality)の下位概念とすること。
    • indicates_value プロパティ:測定結果であるQuality Valueを述語とする。述語はクラスで良い。定性値の場合には、PATOの最下位の概念(value silm)または、MPやMPOの最下位の概念。定量値の場合には、TPP-DB#数値/定量値の通りに書く。
    • indicates_stage プロパティ:測定された発生ステージを述語とする。述語はクラスで良い。
    • その他skosの著者や測定日等を示すプロパティを用いても良い。
  • バイオリソース/サンプル関連
    • Biological Strain:TPP-DB#biological entityの通りに書く。寄託者など、バイオリソース特有のプロパティもつける。
      • taxonプロパティ:TPP-DB#biological entityの通り。
      • has_alleleプロパティ:述語がアレル、変異遺伝子。
      • depositorプロパティ(バイオリソース特有):述語は、寄託者あるいは寄託施設のインスタンス。
      • BRC_IDプロパティ等(バイオリソース特有:述語はリテラル。他の括りのIDも同様にリテラルプロパティで作る。
    • コホート:コホートを定義し、インスタンスを作成する。系統や性別などコホートの定義に関わるプロパティをつける。
      • memberプロパティ:系統を述語とする。コホートのメンバーのクラス制約が、系統クラスである、という意味。(OWLのプロパティにした方が良い?)
      • grouping_genderプロパティ:基本的に、PATO:0001894(phenotypic sex)の下位概念を述語とする。
      • has_genotypeプロパティ:述語がgenotype。グルーピングの基準にgenotypeがある場合。
    • 個体:ブランクノードとする。「ディッシュの中の細胞」とかも、コホート様のものを定義するのもどうかと思われ、ブランクノードで良いのではないか・・・


  • 文献へのリンク
  • 種間表現型のリンク

これまでの成果

  • フェノームのRDFスキーマの設計:全体概要像(2014.6.19更新)

3.jpg

  • フェノームのRDFスキーマの設計:基礎部分: EAVモデル(2014.6.19更新)

1.jpg

  •  数値のRDF記述についての検討(2014.8.18更新)
    • 方法1:ブランクノードを使った記述

2.jpg

[
a:濃度量; 
:value “100”^^xsd:demical; 
:unit <mg/ml>
]  
こんな感じ?
    • 方法2:^^を使ってリテラルに属性を書く
:has_quantity “100”^^xsd:demical; ^^mg/ml;

(has_quantityはリテラルプロパティ) こうすることで、リテラルでありながら、mg/mlである、という意味をもつことができる。

      • 利点:プロパティが少なくて済む

疑問点:xsd:demicalはリテラルの下位概念で良いと思うが、mg/mlはリテラルとは全く違う概念定義されるはずなので、それは良いのかどうか



  • 生物種、系統の記述についての検討(with 植物グループ)(2014.8.18更新)


  • データ項目のリスト

植物グループに習って作成する。


●登録を予定している項目のリスト(2014.7.16更新:高月)   https://docs.google.com/spreadsheets/d/161D5D1Vp00QJs9AaaHXJULAiqapL3xkibKmltmroObQ/edit#gid=sharing


  • 外部RDFを利用するデータリスト(2014.7.16更新:高月)

 外部からのRDFを利用する場合、直接のリンクは、動作に不具合が生じることがあるとの事。  Bioportalでは、エンドポイントを持っているが、基本的にはデモ用のメンテナンスとの事で、  大量のバッチを投げたりすることは推奨しておらず。  また、Bio2RDFのサイトでは、エンドポイントも設置してあるが、保持しているデータが古く  更新されていない。

●現在までの調査結果(2014.7.16更新:高月)   https://docs.google.com/spreadsheets/d/1pl6szC4lK9qJzXxMbFwg1DrvPPRJ85NoygzcOyudmwo/edit?usp=sharing

SPARQLthon

Mediawiki ヘルプへのリンク

フォーマット リンク

個人用ツール