BH14.14/genomeRDF/toxico
提供:TogoWiki
目次 |
背景
- Open TG-GATEsのRDFは以前から作成されていたものの,汎用的な利用が出来る設計ではなかったため,修正を試みることに。
- 修正の際には,Gene Expression AtlasのSchemaを参照した。
メンバー
- 伊藤
- 川島
Schema
困ったこと・相談したこと
- 血液検査・生化学的データは各個体由来だが,遺伝子発現のデータは,各個体の臓器由来。
- 個体はIndividualで示し,そこに血液検査・生化学的データを紐付け,遺伝子はExperiment -> Chip -> Probe
- 遺伝子発現のデータは,p-valueやlog2foldの値を出す必要があるが,3個体(Control) vs 3個体(Target)で値を出したい。
- Analysisクラスを作って,そこにTestProfileGroup vs ControlProfileGroup とし,その時のProfileに値を紐付けて解決。
- nibioのドメイン使えない問題。
- 櫛田さん,川島さんにご協力いただき,http://purl.jp/bio/101/ を頂けることに。
- 臓器は何のオントロジーで表現すべきか?
- 高月さんにUberonのオントロジーを教えて頂く。
- 病理所見のRDF化はどうするべきか。
- もともとToxico Genomics Project で使用されていた,病理所見用語集を使用して,作成することに。
参照・使用したオントロジー
以下のサイトから検索して見つけられるものが多数あった。
RDF化例
- 以下,血液学的・生化学的検査値のデータは除く。
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix tgo: <http://purl.jp/bio/101/opentggates/ontology/> . @prefix tgaffy: <http://purl.jp/bio/101/opentggates/affymetrix/> . @prefix tganalysis: <http://purl.jp/bio/101/opentggates/analysis/> . @prefix tgarray: <http://purl.jp/bio/101/opentggates/array/> . @prefix tgprobe: <http://purl.jp/bio/101/opentggates/probe/> . @prefix tgsample: <http://purl.jp/bio/101/opentggates/sample/> . @prefix tgi: <http://purl.jp/bio/101/opentggates/individual/> . @prefix tgc: <http://purl.jp/bio/101/opentggates/chemicalcompound/> . @prefix tgchip: <http://purl.jp/bio/101/opentggates/chip/> . @prefix tgexp: <http://purl.jp/bio/101/opentggates/experiment/> . @prefix tgexps: <http://purl.jp/bio/101/opentggates/experimentalset/> . @prefix tgexpc: <http://purl.jp/bio/101/opentggates/experimentalcondition/> . @prefix tgprofile: <http://purl.jp/bio/101/opentggates/profile/> . @prefix tgpathology: <http://purl.jp/bio/101/opentggates/pathology/> . @prefix tgpathotopography: <http://purl.jp/bio/101/opentggates/pathologicaltopography/> . @prefix tgpathofinding: <http://purl.jp/bio/101/opentggates/pathologicalfindings/> . @prefix tgpathograde: <http://purl.jp/bio/101/opentggates/pathologicalfindings/> . @prefix dcterms: <http://purl.org/dc/terms/> . @prefix sio: <http://semanticscience.org/resource/> . @prefix biodb: <http://schema.org/BiologicalDatabaseEntry/> . @prefix snomedct: <http://purl.bioontology.org/ontology/SNOMEDCT/> . @prefix mesh: <http://purl.bioontology.org/ontology/MESH/> . @prefix obo: <http://purl.obolibrary.org/obo/> . @prefix skos: <http://www.w3.org/2004/02/skos/core#> . @prefix drugbank: <http://bio2rdf.org/drugbank:> . @prefix pubchem: <http://bio2rdf.org/pubchem.compound:> . @prefix kegg: <http://bio2rdf.org/kegg:> . @prefix cas: <http://bio2rdf.org/cas:> . @prefix go: <http://bio2rdf.org/go:> . @prefix foaf: <http://xmlns.com/foaf/0.1/> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix uniprot: <http://purl.uniprot.org/uniprot/> . @prefix affymetrix: <http://bio2rdf.org/affymetrix:> . @prefix unigene: <http://bio2rdf.org/unigene:> . @prefix ncbigene: <http://bio2rdf.org/ncbigene:> . @prefix taxon: <http://identifiers.org/taxonomy/> . #Sample tgs:0450104LR a tgo:Sample; dcterms:isPartOf tgi:0450104; ## sampleにもともと使用していたIDを使用 tgo:appliedOrgan obo:UBERON_0002113. ##ユペロンのオントロジーを参照しよう。->UBERON_0002113 -> kidney. -> UBERON_0002107 -> liver #Individual tgi:0126112 a tgo:Individual; tgo:taxon taxon:10116; tgo:condition tgexpc:012611; tgo:hasSample tgsample:0126112hR; sio:SIO_000216 [ a snomedct:687005; skos:prefLabel "Albumin/Globulin ratio" ; rdfs:label "Albumin/Globulin ratio" ; tgo:abbr "AGratio"; sio:SIO_000300 1.9; sio:SIO_000221 obo:UO_0000190 ]; sio:SIO_000216 [ a obo:CMO_0000045 ; sio:SIO_000300 949.0 ; skos:prefLabel "plasma alkaline phosphatase activity level" ; rdfs:label "plasma alkaline phosphatase activity level" ; tgo:abbr "ALP"; sio:SIO_000221 snomedct:259001000 ; ]. ##実験条件。IDの付け方を相談。 tgexpc:045010 a tgo:ExperimentalCondition; tgo:exposedCompound tgc:00086; tgo:hasExperimentalFactor [ ## hasValue こうして良いのかなぁ… a snomedct:260911001; #snomedct:260911001 indicates Dosage rdfs:label "Dosage"; sio:SIO_000300 300 ; sio:SIO_000221 snomedct:396163008 ; #snomedct:396163008 means mg/kg tgo:doseLevel "Middle". ]; tgo:hasExperimentalFactor [ a obo:XCO_0000152; ## http://purl.obolibrary.org/obo/XCO_0000152 drug dose time series これでいいのか相談。 ##実験の意味を五十嵐さんに確認。 rdfs:label "drug dose time series"; sio:SIO_000300 6 ; sio:SIO_000221 snomedct:258702006 . ##snomedct:258702006はhrの意味 ]; sio:SIO_000900 "Single". ##SIO_000900は頻度。この書き方についても相談。 ##化合物 tgc:00086 a tgo:Compound; rdfs:label "ranitidine"; snomedct:398223008 "RAN"; #snomedct:398223008 indicates abbreviation. tgo:x-kegg kegg:C11227,D00422; tgo:x-drugbank drugbank:DB00863; tgo:x-cas cas:66357-35-5; tgo:x-pubchem pubchem:3001055 . #ExperimentalSet tgexs:0450104LR tgo:belongs_to tgo:ExperimentalSet. ##Experiment tgexp:0450104LE a tgo:Experiment; tgo:belongsTo tgexps:0450; tgo:hasSample tgsample:0450104LR; tgo:hasChip tgchip:003017405020 . #Chip tgchip:003017405020 a tgo:Chip; tgo:hasArray tgarray:Rat230_2. #Array tgarray:Rat230_2 a tgo:Array; tgo:hasProbe tgprobe:1367452_at; tgo:hasProbe tgprobe:1367453_at. #Probeの書き方は相談が必要。 tgprobe:1367452_at a tgo:Probe ; rdfs:seeAlso affymetrix:1367452_at; rdfs:label "SMT3 suppressor of mif two 3 homolog 2 (S. cerevisiae)"; tgo:geneSymbol ”Sumo2"; tgaffy:biologicalProcess go:0051726; tgaffy:cellularComponent go:0005634; tgaffy:molecularFunction go:0031625; tgo:x-unigene unigene:Rn.1546549; tgo:x-ncbigene ncbigene:690244; tgo:x-uniprot uniprot:Q63692. #解析系の結果 tganalysis:00001l3cl a tgo:Analysis; #l3clはliver 3h control vs low の意味 tgo:hasProfile tgprofile:00001L15chp ; tgo:hasControlGroup tgexp:0040011LE; tgo:hasControlGroup tgexp:0040012LE; tgo:hasControlGroup tgexp:0040013LE; tgo:hasTestGroup tgexp:0040111LE; tgo:hasTestGroup tgexp:0040112LE; tgo:hasTestGroup tgexp:0040113LE. #Profile tgprofile:00001L15chp a tgo:Profile; sio:has-value [ tgo:hasProbe tgprobe:1367452_at; tgo:log2FoldChange -0.5951643469173868; tgo:pValue 6.8711052155039E-7; tgo:geneExpressionLevel "DOWN". ]; sio:has-value [ tgo:hasProbe tgprobe:1367453_at; tgo:log2FoldChange -0.9951643469173868; tgo:pValue 2.8711052155039E-5; tgo:geneExpressionLevel "DOWN". ]. ##以下病理所見 tgpathology:22890 a tgo:Pathology; tgpathology:topography tgpathotopography:TO-K0570; tgpathology:findings tgpathofinding:FI-K1200; tgpathology:grade tgpathograde:GRAD0080; foaf:depiction <http://virtualslide.nibio.go.jp/Authenticate3.php?image_id=23181> ; tgo:hasSample tgs:0450104LR. #Grade tgpahograde:GRAD0080 a tgo:PathologicalGrade; tgpathology:gradelabel snomedct:6736007; rdfs:label "Moderate (++)"@en; rdfs:label "中等度"@ja; biodb:dateCreated "2007-02-28". #present -> snomedct:52101004 #minimal -> snomedct:255605001 #slight -> snomedct:255510006 #moderate -> snomedct:6736007 #severe -> snomedct:24484000 #Topography tgpathotopography:TO-K0570 a tgo:Topography; #tgo:label obo:UBERON_0009773; #上記obo:UBERON_0009773は尿細管の意味 rdfs:label "Renal tubule"@en; rdfs:label "尿細管"@ja; dcterms:isPartOf obo:UBERON_0002113; biodb:dateCreated "2007-02-28". #Findings tgpathofinding:FI-K1200 a tgo:PathologicalFindings; rdfs:label "Regeneration"@en; rdfs:label "再生"@ja; tgpathology:lesion "Non-neoplastic lesions"@en; tgpathology:lesion "非腫瘍性病変"@ja. tgpathology:organ obo:UBERON_0002113; biodb:dateCreated "2007-02-28". obo:UBERON_0002113 rdfs:label "腎臓"@ja; rdfs:label "Kidney"@en.
今後の予定
- 細かい実験条件等をNIBIOにて確認,修正。
- 全てのRDFを作成したRDF Schemaをもとに修正しまくる。
- RDF化ガイドラインに準拠する。
- オントロジーファイルの作成
- アプリケーションに反映,RDFのダウンロード機能の提供