BH14.14/genomeRDF/toxico
提供:TogoWiki
目次 |
背景
- Open TG-GATEsのRDFは以前から作成されていたものの,汎用的な利用が出来る設計ではなかったため,修正を試みることに。
- 修正の際には,Gene Expression AtlasのSchemaを参照した。
メンバー
- 伊藤
- 川島
Schema
困ったこと・相談したこと
- 血液検査・生化学的データは各個体由来だが,遺伝子発現のデータは,各個体の臓器由来。
- 個体はIndividualで示し,そこに血液検査・生化学的データを紐付け,遺伝子はExperiment -> Chip -> Probe
- 遺伝子発現のデータは,p-valueやlog2foldの値を出す必要があるが,3個体(Control) vs 3個体(Target)で値を出したい。
- Analysisクラスを作って,そこにTestProfileGroup vs ControlProfileGroup とし,その時のProfileに値を紐付けて解決。
- nibioのドメイン使えない問題。
- 櫛田さん,川島さんにご協力いただき,http://purl.jp/bio/101/ を頂けることに。
- 臓器は何のオントロジーで表現すべきか?
- 高月さんにUberonのオントロジーを教えて頂く。
- 病理所見のRDF化はどうするべきか。
- もともとToxico Genomics Project で使用されていた,病理所見用語集を使用して,作成することに。
参照・使用したオントロジー
以下のサイトから検索して見つけられるものが多数あった。
RDF化例
- 以下,血液学的・生化学的検査値のデータは除く。
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix tgo: <http://purl.jp/bio/101/opentggates/ontology/> . @prefix tga: <http://purl.jp/bio/101/opentggates/analysis/> . @prefix tgprobe: <http://purl.jp/bio/101/opentggates/probe/> . @prefix tgs: <http://purl.jp/bio/101/opentggates/sample/> . @prefix tgi: <http://purl.jp/bio/101/opentggates/individual/> . @prefix tgc: <http://purl.jp/bio/101/opentggates/chemicalcompound/> . @prefix tgchip: <http://purl.jp/bio/101/opentggates/chip/> . @prefix tgexp: <http://purl.jp/bio/101/opentggates/experiment/> . @prefix tgexs: <http://purl.jp/bio/101/opentggates/experimentalset/> . @prefix tgexc: <http://purl.jp/bio/101/opentggates/experimentalcondition/> . @prefix tgprofile: <http://purl.jp/bio/101/opentggates/profile/> . @prefix tgpathology: <http://purl.jp/bio/101/opentggates/pathology/> . @prefix tgpathotopography: <http://purl.jp/bio/101/opentggates/pathologicaltopography/> . @prefix tgpathofinding: <http://purl.jp/bio/101/opentggates/pathologicalfindings/> . @prefix tgpathograde: <http://purl.jp/bio/101/opentggates/pathologicalfindings/> . @prefix tgcg: <http://purl.jp/bio/101/opentggates/controlprofilegroup/> . @prefix tgtg: <http://purl.jp/bio/101/opentggates/testprofilegroup/> . @prefix tge: <http://purl.jp/bio/101/opentggates/expressionprofile/> . @prefix sio: <http://semanticscience.org/resource/> . @prefix biodb: <http://schema.org/BiologicalDatabaseEntry/> . @prefix snomedct: <http://purl.bioontology.org/ontology/SNOMEDCT/> . @prefix mesh: <http://purl.bioontology.org/ontology/MESH/> . @prefix obo: <http://purl.obolibrary.org/obo/> . @prefix skos: <http://www.w3.org/2004/02/skos/core#> . @prefix drugbank: <http://bio2rdf.org/drugbank:> . @prefix pubchem: <http://bio2rdf.org/pubchem.compound:> . @prefix kegg: <http://bio2rdf.org/kegg:> . @prefix cas: <http://bio2rdf.org/cas:> . @prefix go: <http://bio2rdf.org/go:> . tgs:0450104LR a tgo:Sample; dcterms:isPartOf tgi:0450104; ## sampleにもともと使用していたIDを使用 tgo:appliedOrgan obo:UBERON_0002113. ##ユペロンのオントロジーを参照しよう。->UBERON_0002113 -> kidney. -> UBERON_0002107 -> liver ##実験条件。IDの付け方を相談。 tgexpc:0450_1 a tgo:ExperimentalCondition; tgo:exposedCompound tgc:00086; tgo:hasExperimentalFactor [ a snomedct:260911001; #snomedct:260911001 indicates Dosage skos:prefLabel "Dosage"; sio:SIO_000300 300 ; sio:SIO_000221 snomedct:396163008 ; #snomedct:396163008 means mg/kg tgo:dose_level "Middle". ]; tgo:hasExperimentalFactor [ a obo:XCO_0000152; ## http://purl.obolibrary.org/obo/XCO_0000152 drug dose time series これでいいのか相談。 ##実験の意味を五十嵐さんに確認。 skos:prefLabel "drug dose time series"; sio:SIO_000300 6 ; sio:SIO_000221 snomedct:258702006 . ##snomedct:258702006はhrの意味 ]; sio:SIO_000900 "Single". ##SIO_000900は頻度。この書き方についても相談。 ##実験条件 tgc:00086 a tgo:Compound; skos:prefLabel "ranitidine"; snomedct:398223008 "RAN"; #snomedct:398223008 indicates abbreviation. ##略語。これも相談しましょうか。 tgo:x-kegg kegg:C11227,D00422; tgo:x-drugbank drugbank:DB00863; tgo:x-cas cas:66357-35-5; tgo:x-pubchem pubchem:3001055 . #ExperimentalSet tgexs:0450104LR tgo:belongs_to tgo:ExperimentalSet. ##Experiment tge:0450104LE a tgo:Experiment; tgo:belongsTo tgexs:0450; tgo:hasSample tgs:0450104LR; tgo:hasChip tgchip:003017405020 . tgchip:003017405020 a tgo:chip; tgo:hasProbe tgprobe:1367452_at; tgo:hasProbe tgprobe:1367453_at. tgprobe:1367452_at a tgo:Probe ; tgo:geneSymbol "Cdc37"; tgo:x-go go:0051726; tgo:x-entrez "114562"; tgo:x-swissprot "Q63692". ##entrez, swissprotはどうすべきか相談。 #解析系の結果 tga:000001 a tgo:Analysis; tgo:hasProfile tgprof:00001; tgo:hasCrontolGroup tgcg:0001; tgo:hasTestGroup tgtg:0001. #Control Group #ここで3個体 VS 3個体を示している。 tgtg:0001 tgo:hasExperiment tge:0450104LE,tge:0450105LE,tge:0450106LE. tgcg:0001 tgo:hasExperiment tge:0450101LE,tge:0450102LE,tge:0450103LE. #Profileで実際に使用する発現量の値を示している。"UP"や"DOWN"は事前に閾値を決めて,付与するものである。 tgprof:00001 a tgo:Profile; sio:has-value [ tgo:hasProbe tgprobe:1367452_at; tgo:log2FoldChange -0.5951643469173868; tgo:pValue 6.8711052155039E-7; tgo:hasValue "DOWN". ]; sio:has-value [ tgo:hasProbe tgprobe:1367453_at; tgo:log2FoldChange -0.9951643469173868; tgo:pValue 2.8711052155039E-5; tgo:hasValue "DOWN". ]. ##以下病理所見 tgpathology:22890 a tgo:Pathology; tgpathology:topography tgpathotopography:TO-K0570; tgpathology:findings tgpathofinding:FI-K1200; tgpathology:grade tgpathograde:GRAD0080; biodb:image <http://virtualslide.nibio.go.jp/Authenticate3.php?image_id=23181> ; tgo:hasSample tgs:0450104LR. #Grade tgpahograde:GRAD0080 a tgo:PathologicalGrade; tgpathology:gradelabel snomedct:6736007; skos:prefLabel "Moderate (++)"@en; skos:prefLabel "中等度"@ja; biodb:dateCreated "2007-02-28". #Topography tgpathotopography:TO-K0570 a tgo:Topography; tgo:label obo:UBERON_0009773; #上記obo:UBERON_0009773は尿細管の意味 skos:prefLabel "Renal tubule"@en; skos:prefLabel "尿細管"@en; dcterms:isPartOf obo:UBERON_0002113; biodb:dateCreated "2007-02-28". #Findings tgpathofinding:FI-K1200 a tgo:PathologicalFindings; skos:prefLabel "Regeneration"@en; skos:prefLabel "再生"@ja; tgpathology:lesion "Non-neoplastic lesions"@en; tgpathology:lesion "非腫瘍性病変"@ja. tgpathology:organ obo:UBERON_0002113; biodb:dateCreated "2007-02-28". obo:UBERON_0002113 skos:prefLabel "腎臓"@ja; skos:prefLabel "Kidney"@ja.
今後の予定
- 細かい実験条件等をNIBIOにて確認,修正。
- 全てのRDFを作成したRDF Schemaをもとに修正しまくる。
- RDF化ガイドラインに準拠する。
- オントロジーファイルの作成
- アプリケーションに反映,RDFのダウンロード機能の提供