BH14.14/genomeRDF/toxico
提供:TogoWiki
目次 |
背景
- Open TG-GATEsのRDFは以前から作成されていたものの,汎用的な利用が出来る設計ではなかったため,修正を試みることに。
- 修正の際には,Gene Expression AtlasのSchemaを参照した。
メンバー
- 伊藤
- 川島
Schema
困ったこと・相談したこと
- 血液検査・生化学的データは各個体由来だが,遺伝子発現のデータは,各個体の臓器由来。
- 個体はIndividualで示し,そこに血液検査・生化学的データを紐付け,遺伝子はExperiment -> Chip -> Probe
- 遺伝子発現のデータは,p-valueやlog2foldの値を出す必要があるが,3個体(Control) vs 3個体(Target)で値を出したい。
- Analysisクラスを作って,そこにTestProfileGroup vs ControlProfileGroup とし,その時のProfileに値を紐付けて解決。
- nibioのドメイン使えない問題。
- 櫛田さん,川島さんにご協力いただき,http://purl.jp/bio/101/ を頂けることに。
- 臓器は何のオントロジーで表現すべきか?
- 高月さんにUberonのオントロジーを教えて頂く。
- 病理所見のRDF化はどうするべきか。
- もともとToxico Genomics Project で使用されていた,病理所見用語集を使用して,作成することに。
参照・使用したオントロジー
以下のサイトから検索して見つけられるものが多数あった。
RDF化例
- 以下,血液学的・生化学的検査値のデータは除く。
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix tgo: <http://purl.jp/bio/101/opentggates/ontology/> .
@prefix tgaffy: <http://purl.jp/bio/101/opentggates/affymetrix/> .
@prefix tganalysis: <http://purl.jp/bio/101/opentggates/analysis/> .
@prefix tgarray: <http://purl.jp/bio/101/opentggates/array/> .
@prefix tgprobe: <http://purl.jp/bio/101/opentggates/probe/> .
@prefix tgsample: <http://purl.jp/bio/101/opentggates/sample/> .
@prefix tgi: <http://purl.jp/bio/101/opentggates/individual/> .
@prefix tgc: <http://purl.jp/bio/101/opentggates/chemicalcompound/> .
@prefix tgchip: <http://purl.jp/bio/101/opentggates/chip/> .
@prefix tgexp: <http://purl.jp/bio/101/opentggates/experiment/> .
@prefix tgexps: <http://purl.jp/bio/101/opentggates/experimentalset/> .
@prefix tgexpc: <http://purl.jp/bio/101/opentggates/experimentalcondition/> .
@prefix tgprofile: <http://purl.jp/bio/101/opentggates/profile/> .
@prefix tgpathology: <http://purl.jp/bio/101/opentggates/pathology/> .
@prefix tgpathotopography: <http://purl.jp/bio/101/opentggates/pathologicaltopography/> .
@prefix tgpathofinding: <http://purl.jp/bio/101/opentggates/pathologicalfindings/> .
@prefix tgpathograde: <http://purl.jp/bio/101/opentggates/pathologicalfindings/> .
@prefix dcterms: <http://purl.org/dc/terms/> .
@prefix sio: <http://semanticscience.org/resource/> .
@prefix biodb: <http://schema.org/BiologicalDatabaseEntry/> .
@prefix snomedct: <http://purl.bioontology.org/ontology/SNOMEDCT/> .
@prefix mesh: <http://purl.bioontology.org/ontology/MESH/> .
@prefix obo: <http://purl.obolibrary.org/obo/> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix drugbank: <http://bio2rdf.org/drugbank:> .
@prefix pubchem: <http://bio2rdf.org/pubchem.compound:> .
@prefix kegg: <http://bio2rdf.org/kegg:> .
@prefix cas: <http://bio2rdf.org/cas:> .
@prefix go: <http://bio2rdf.org/go:> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix uniprot: <http://purl.uniprot.org/uniprot/> .
@prefix affymetrix: <http://bio2rdf.org/affymetrix:> .
@prefix unigene: <http://bio2rdf.org/unigene:> .
@prefix ncbigene: <http://bio2rdf.org/ncbigene:> .
@prefix taxon: <http://identifiers.org/taxonomy/> .
#Sample
tgs:0450104LR a tgo:Sample;
dcterms:isPartOf tgi:0450104;
## sampleにもともと使用していたIDを使用
tgo:appliedOrgan obo:UBERON_0002113.
##ユペロンのオントロジーを参照しよう。->UBERON_0002113 -> kidney. -> UBERON_0002107 -> liver
#Individual
tgi:0126112 a tgo:Individual;
tgo:taxon taxon:10116;
tgo:condition tgexpc:012611;
tgo:hasSample tgsample:0126112hR;
sio:SIO_000216 [
a snomedct:687005;
skos:prefLabel "Albumin/Globulin ratio" ;
rdfs:label "Albumin/Globulin ratio" ;
tgo:abbr "AGratio";
sio:SIO_000300 1.9;
sio:SIO_000221 obo:UO_0000190
];
sio:SIO_000216 [
a obo:CMO_0000045 ;
sio:SIO_000300 949.0 ;
skos:prefLabel "plasma alkaline phosphatase activity level" ;
rdfs:label "plasma alkaline phosphatase activity level" ;
tgo:abbr "ALP";
sio:SIO_000221 snomedct:259001000 ;
].
##実験条件。IDの付け方を相談。
tgexpc:045010 a tgo:ExperimentalCondition;
tgo:exposedCompound tgc:00086;
tgo:hasExperimentalFactor [
## hasValue こうして良いのかなぁ…
a snomedct:260911001;
#snomedct:260911001 indicates Dosage
rdfs:label "Dosage";
sio:SIO_000300 300 ;
sio:SIO_000221 snomedct:396163008 ;
#snomedct:396163008 means mg/kg
tgo:doseLevel "Middle".
];
tgo:hasExperimentalFactor [
a obo:XCO_0000152;
## http://purl.obolibrary.org/obo/XCO_0000152 drug dose time series これでいいのか相談。
##実験の意味を五十嵐さんに確認。
rdfs:label "drug dose time series";
sio:SIO_000300 6 ;
sio:SIO_000221 snomedct:258702006 .
##snomedct:258702006はhrの意味
];
sio:SIO_000900 "Single".
##SIO_000900は頻度。この書き方についても相談。
##化合物
tgc:00086 a tgo:Compound;
rdfs:label "ranitidine";
snomedct:398223008 "RAN";
#snomedct:398223008 indicates abbreviation.
tgo:x-kegg kegg:C11227,D00422;
tgo:x-drugbank drugbank:DB00863;
tgo:x-cas cas:66357-35-5;
tgo:x-pubchem pubchem:3001055 .
#ExperimentalSet
tgexs:0450104LR tgo:belongs_to tgo:ExperimentalSet.
##Experiment
tgexp:0450104LE a tgo:Experiment;
tgo:belongsTo tgexps:0450;
tgo:hasSample tgsample:0450104LR;
tgo:hasChip tgchip:003017405020 .
#Chip
tgchip:003017405020 a tgo:Chip;
tgo:hasArray tgarray:Rat230_2.
#Array
tgarray:Rat230_2 a tgo:Array;
tgo:hasProbe tgprobe:1367452_at;
tgo:hasProbe tgprobe:1367453_at.
#Probeの書き方は相談が必要。
tgprobe:1367452_at a tgo:Probe ;
rdfs:seeAlso affymetrix:1367452_at;
rdfs:label "SMT3 suppressor of mif two 3 homolog 2 (S. cerevisiae)";
tgo:geneSymbol ”Sumo2";
tgaffy:biologicalProcess go:0051726;
tgaffy:cellularComponent go:0005634;
tgaffy:molecularFunction go:0031625;
tgo:x-unigene unigene:Rn.1546549;
tgo:x-ncbigene ncbigene:690244;
tgo:x-uniprot uniprot:Q63692.
#解析系の結果
tganalysis:00001l3cl a tgo:Analysis;
#l3clはliver 3h control vs low の意味
tgo:hasProfile tgprofile:00001L15chp ;
tgo:hasControlGroup tgexp:0040011LE;
tgo:hasControlGroup tgexp:0040012LE;
tgo:hasControlGroup tgexp:0040013LE;
tgo:hasTestGroup tgexp:0040111LE;
tgo:hasTestGroup tgexp:0040112LE;
tgo:hasTestGroup tgexp:0040113LE.
#Profile
tgprofile:00001L15chp a tgo:Profile;
sio:has-value [
tgo:hasProbe tgprobe:1367452_at;
tgo:log2FoldChange -0.5951643469173868;
tgo:pValue 6.8711052155039E-7;
tgo:geneExpressionLevel "DOWN".
];
sio:has-value [
tgo:hasProbe tgprobe:1367453_at;
tgo:log2FoldChange -0.9951643469173868;
tgo:pValue 2.8711052155039E-5;
tgo:geneExpressionLevel "DOWN".
].
##以下病理所見
tgpathology:22890 a tgo:Pathology;
tgpathology:topography tgpathotopography:TO-K0570;
tgpathology:findings tgpathofinding:FI-K1200;
tgpathology:grade tgpathograde:GRAD0080;
foaf:depiction <http://virtualslide.nibio.go.jp/Authenticate3.php?image_id=23181> ;
tgo:hasSample tgs:0450104LR.
#Grade
tgpahograde:GRAD0080 a tgo:PathologicalGrade;
tgpathology:gradelabel snomedct:6736007;
rdfs:label "Moderate (++)"@en;
rdfs:label "中等度"@ja;
biodb:dateCreated "2007-02-28".
#present -> snomedct:52101004
#minimal -> snomedct:255605001
#slight -> snomedct:255510006
#moderate -> snomedct:6736007
#severe -> snomedct:24484000
#Topography
tgpathotopography:TO-K0570 a tgo:Topography;
#tgo:label obo:UBERON_0009773;
#上記obo:UBERON_0009773は尿細管の意味
rdfs:label "Renal tubule"@en;
rdfs:label "尿細管"@ja;
dcterms:isPartOf obo:UBERON_0002113;
biodb:dateCreated "2007-02-28".
#Findings
tgpathofinding:FI-K1200 a tgo:PathologicalFindings;
rdfs:label "Regeneration"@en;
rdfs:label "再生"@ja;
tgpathology:lesion "Non-neoplastic lesions"@en;
tgpathology:lesion "非腫瘍性病変"@ja.
tgpathology:organ obo:UBERON_0002113;
biodb:dateCreated "2007-02-28".
obo:UBERON_0002113 rdfs:label "腎臓"@ja;
rdfs:label "Kidney"@en.
今後の予定
- 細かい実験条件等をNIBIOにて確認,修正。
- 全てのRDFを作成したRDF Schemaをもとに修正しまくる。
- RDF化ガイドラインに準拠する。
- オントロジーファイルの作成
- アプリケーションに反映,RDFのダウンロード機能の提供