BH14.14/genomeRDF/toxico
提供:TogoWiki
目次 |
背景
- Open TG-GATEsのRDFは以前から作成されていたものの,汎用的な利用が出来る設計ではなかったため,修正を試みることに。
- 修正の際には,Gene Expression AtlasのSchemaを参照した。
メンバー
- 伊藤
- 川島
Schema
困ったこと・相談したこと
- 血液検査・生化学的データは各個体由来だが,遺伝子発現のデータは,各個体の臓器由来。
- 個体はIndividualで示し,そこに血液検査・生化学的データを紐付け,遺伝子はExperiment -> Chip -> Probe
- 遺伝子発現のデータは,p-valueやlog2foldの値を出す必要があるが,3個体(Control) vs 3個体(Target)で値を出したい。
- Analysisクラスを作って,そこにTestProfileGroup vs ControlProfileGroup とし,その時のProfileに値を紐付けて解決。
- nibioのドメイン使えない問題。
- 櫛田さん,川島さんにご協力いただき,http://purl.jp/bio/101/ を頂けることに。
- 臓器は何のオントロジーで表現すべきか?
- 高月さんにUberonのオントロジーを教えて頂く。
- 病理所見のRDF化はどうするべきか。
- もともとToxico Genomics Project で使用されていた,病理所見用語集を使用して,作成することに。
参照・使用したオントロジー
以下のサイトから検索して見つけられるものが多数あった。
RDF化例
- 以下,血液学的・生化学的検査値のデータは除く。
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix tgo: <http://purl.jp/bio/101/opentggates/ontology/> .
@prefix tga: <http://purl.jp/bio/101/opentggates/analysis/> .
@prefix tgprobe: <http://purl.jp/bio/101/opentggates/probe/> .
@prefix tgs: <http://purl.jp/bio/101/opentggates/sample/> .
@prefix tgi: <http://purl.jp/bio/101/opentggates/individual/> .
@prefix tgc: <http://purl.jp/bio/101/opentggates/chemicalcompound/> .
@prefix tgchip: <http://purl.jp/bio/101/opentggates/chip/> .
@prefix tgexp: <http://purl.jp/bio/101/opentggates/experiment/> .
@prefix tgexs: <http://purl.jp/bio/101/opentggates/experimentalset/> .
@prefix tgexc: <http://purl.jp/bio/101/opentggates/experimentalcondition/> .
@prefix tgprofile: <http://purl.jp/bio/101/opentggates/profile/> .
@prefix tgpathology: <http://purl.jp/bio/101/opentggates/pathology/> .
@prefix tgpathotopography: <http://purl.jp/bio/101/opentggates/pathologicaltopography/> .
@prefix tgpathofinding: <http://purl.jp/bio/101/opentggates/pathologicalfindings/> .
@prefix tgpathograde: <http://purl.jp/bio/101/opentggates/pathologicalfindings/> .
@prefix tgcg: <http://purl.jp/bio/101/opentggates/controlprofilegroup/> .
@prefix tgtg: <http://purl.jp/bio/101/opentggates/testprofilegroup/> .
@prefix tge: <http://purl.jp/bio/101/opentggates/expressionprofile/> .
@prefix sio: <http://semanticscience.org/resource/> .
@prefix biodb: <http://schema.org/BiologicalDatabaseEntry/> .
@prefix snomedct: <http://purl.bioontology.org/ontology/SNOMEDCT/> .
@prefix mesh: <http://purl.bioontology.org/ontology/MESH/> .
@prefix obo: <http://purl.obolibrary.org/obo/> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix drugbank: <http://bio2rdf.org/drugbank:> .
@prefix pubchem: <http://bio2rdf.org/pubchem.compound:> .
@prefix kegg: <http://bio2rdf.org/kegg:> .
@prefix cas: <http://bio2rdf.org/cas:> .
@prefix go: <http://bio2rdf.org/go:> .
tgs:0450104LR a tgo:Sample;
dcterms:isPartOf tgi:0450104;
## sampleにもともと使用していたIDを使用
tgo:appliedOrgan obo:UBERON_0002113.
##ユペロンのオントロジーを参照しよう。->UBERON_0002113 -> kidney. -> UBERON_0002107 -> liver
##実験条件。IDの付け方を相談。
tgexpc:0450_1 a tgo:ExperimentalCondition;
tgo:exposedCompound tgc:00086;
tgo:hasExperimentalFactor [
a snomedct:260911001;
#snomedct:260911001 indicates Dosage
skos:prefLabel "Dosage";
sio:SIO_000300 300 ;
sio:SIO_000221 snomedct:396163008 ;
#snomedct:396163008 means mg/kg
tgo:dose_level "Middle".
];
tgo:hasExperimentalFactor [
a obo:XCO_0000152;
## http://purl.obolibrary.org/obo/XCO_0000152 drug dose time series これでいいのか相談。
##実験の意味を五十嵐さんに確認。
skos:prefLabel "drug dose time series";
sio:SIO_000300 6 ;
sio:SIO_000221 snomedct:258702006 .
##snomedct:258702006はhrの意味
];
sio:SIO_000900 "Single".
##SIO_000900は頻度。この書き方についても相談。
##実験条件
tgc:00086 a tgo:Compound;
skos:prefLabel "ranitidine";
snomedct:398223008 "RAN";
#snomedct:398223008 indicates abbreviation.
##略語。これも相談しましょうか。
tgo:x-kegg kegg:C11227,D00422;
tgo:x-drugbank drugbank:DB00863;
tgo:x-cas cas:66357-35-5;
tgo:x-pubchem pubchem:3001055 .
#ExperimentalSet
tgexs:0450104LR tgo:belongs_to tgo:ExperimentalSet.
##Experiment
tge:0450104LE a tgo:Experiment;
tgo:belongsTo tgexs:0450;
tgo:hasSample tgs:0450104LR;
tgo:hasChip tgchip:003017405020 .
tgchip:003017405020 a tgo:chip;
tgo:hasProbe tgprobe:1367452_at;
tgo:hasProbe tgprobe:1367453_at.
tgprobe:1367452_at a tgo:Probe ;
tgo:geneSymbol "Cdc37";
tgo:x-go go:0051726;
tgo:x-entrez "114562";
tgo:x-swissprot "Q63692".
##entrez, swissprotはどうすべきか相談。
#解析系の結果
tga:000001 a tgo:Analysis;
tgo:hasProfile tgprof:00001;
tgo:hasCrontolGroup tgcg:0001;
tgo:hasTestGroup tgtg:0001.
#Control Group
#ここで3個体 VS 3個体を示している。
tgtg:0001 tgo:hasExperiment tge:0450104LE,tge:0450105LE,tge:0450106LE.
tgcg:0001 tgo:hasExperiment tge:0450101LE,tge:0450102LE,tge:0450103LE.
#Profileで実際に使用する発現量の値を示している。"UP"や"DOWN"は事前に閾値を決めて,付与するものである。
tgprof:00001 a tgo:Profile;
sio:has-value [
tgo:hasProbe tgprobe:1367452_at;
tgo:log2FoldChange -0.5951643469173868;
tgo:pValue 6.8711052155039E-7;
tgo:hasValue "DOWN".
];
sio:has-value [
tgo:hasProbe tgprobe:1367453_at;
tgo:log2FoldChange -0.9951643469173868;
tgo:pValue 2.8711052155039E-5;
tgo:hasValue "DOWN".
].
##以下病理所見
tgpathology:22890 a tgo:Pathology;
tgpathology:topography tgpathotopography:TO-K0570;
tgpathology:findings tgpathofinding:FI-K1200;
tgpathology:grade tgpathograde:GRAD0080;
biodb:image <http://virtualslide.nibio.go.jp/Authenticate3.php?image_id=23181> ;
tgo:hasSample tgs:0450104LR.
#Grade
tgpahograde:GRAD0080 a tgo:PathologicalGrade;
tgpathology:gradelabel snomedct:6736007;
skos:prefLabel "Moderate (++)"@en;
skos:prefLabel "中等度"@ja;
biodb:dateCreated "2007-02-28".
#Topography
tgpathotopography:TO-K0570 a tgo:Topography;
tgo:label obo:UBERON_0009773;
#上記obo:UBERON_0009773は尿細管の意味
skos:prefLabel "Renal tubule"@en;
skos:prefLabel "尿細管"@en;
dcterms:isPartOf obo:UBERON_0002113;
biodb:dateCreated "2007-02-28".
#Findings
tgpathofinding:FI-K1200 a tgo:PathologicalFindings;
skos:prefLabel "Regeneration"@en;
skos:prefLabel "再生"@ja;
tgpathology:lesion "Non-neoplastic lesions"@en;
tgpathology:lesion "非腫瘍性病変"@ja.
tgpathology:organ obo:UBERON_0002113;
biodb:dateCreated "2007-02-28".
obo:UBERON_0002113 skos:prefLabel "腎臓"@ja;
skos:prefLabel "Kidney"@ja.
今後の予定
- 細かい実験条件等をNIBIOにて確認,修正。
- 全てのRDFを作成したRDF Schemaをもとに修正しまくる。
- RDF化ガイドラインに準拠する。
- オントロジーファイルの作成
- アプリケーションに反映,RDFのダウンロード機能の提供