SPARQLthon/RefExRDF2019

提供:TogoWiki

移動: 案内, 検索

RefEx に新たに GTEx, FANTOM5 phase 1-2 のデータを RDF として収載する。
それに伴って、従来の RefEx RDF で採用されていたスキーマの更新も行う。

目次

概要

スキーマ図

Media:RefExRDF_schema_v0.4_ikeda.png

主な変更点

  • サンプルの age, sex など、BioSample RDF で記述されているデータは RefEx 側には記述する必要がなくなったので記述しない。
  • サンプルのアノテーションで、従来独自のプロパティ(refexo:RefExOriginalDescription など)を定義して記述していた事項について、BioSample RDF での記述法を採用した。
refexs:RSE00001514
    schema:additionalProperty [
        a schema:PropertyValue ;
        schema:name "originalDescription" ;
        schema:value "TPM (tags per million) of 293SLAM rinderpest infection, 00hr, biol_rep1.CNhs14406.13541-145H4"
    ]
refexs:RSE00001514
    refexo:sampleReference [
        schema:additionalProperty [
            a schema:PropertyValue ;
            schema:name "belongsToDisease" ;
            schema:value
                obo:DOID_0050117 ,
                obo:DOID_4
        ]
    ]
  • 発現量の TPM 値に 1 を足して log2 変換したものついて、サンプル群内での統計値(最大・最小値、各四分位数、平均値、標準偏差)を算出。これらの統計値を表すためのクラスとして refexo:logTPMMin などを定義し、sio:SIO_000216 (has measurement value) と sio:SIO_000300 (has value) を用いて以下のように記述する。
refex:RFX0019827610
    sio:SIO_000216
        [ a refexo:logTPMMin ;
          sio:SIO_000300 0.031762 ]
  • サンプルのクラスとして、refexo:RefExSample に加えて sio:SIO_001050 (sample) を使用する。
  • RefExEntry の指す遺伝子について、プロパティとして従来 rdfs:seeAlso を使っていたが、refexo:isMeasurementOf を作りこれを使う。
    RefExEntry はサンプルに比べて数が膨大なので、これを主語とするトリプル数をなるべく抑えたい。additionalProperty を用いる方法はトリプル数が大きく増えてしまうため却下。

Examples

https://gist.github.com/sh-ikeda/a09d2bfc2a57967fce1524e612a1d824

個人用ツール