BH14.14/genomeRDF/toxico

提供:TogoWiki

移動: 案内, 検索

目次

背景

  • Open TG-GATEsのRDFは以前から作成されていたものの,汎用的な利用が出来る設計ではなかったため,修正を試みることに。
  • 修正の際には,Gene Expression AtlasのSchemaを参照した。

メンバー

  • 伊藤
  • 川島

Schema

Core Toxico RDF Schema

困ったこと・相談したこと

  • 血液検査・生化学的データは各個体由来だが,遺伝子発現のデータは,各個体の臓器由来。
    • 個体はIndividualで示し,そこに血液検査・生化学的データを紐付け,遺伝子はExperiment -> Chip -> Probe
  • 遺伝子発現のデータは,p-valueやlog2foldの値を出す必要があるが,3個体(Control) vs 3個体(Target)で値を出したい。
    • Analysisクラスを作って,そこにTestProfileGroup vs ControlProfileGroup とし,その時のProfileに値を紐付けて解決。
  • nibioのドメイン使えない問題。
  • 臓器は何のオントロジーで表現すべきか?
    • 高月さんにUberonのオントロジーを教えて頂く。
  • 病理所見のRDF化はどうするべきか。
    • もともとToxico Genomics Project で使用されていた,病理所見用語集を使用して,作成することに。

参照・使用したオントロジー

以下のサイトから検索して見つけられるものが多数あった。

RDF化例

@prefix rdf:   <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix tgo: <http://purl.jp/bio/101/opentggates/ontology/> .
@prefix tgaffy: <http://purl.jp/bio/101/opentggates/affymetrix/> .
@prefix tganalysis: <http://purl.jp/bio/101/opentggates/analysis/> .
@prefix tgarray: <http://purl.jp/bio/101/opentggates/array/> .
@prefix tgprobe: <http://purl.jp/bio/101/opentggates/probe/> .
@prefix tgsample: <http://purl.jp/bio/101/opentggates/sample/> .
@prefix tgi: <http://purl.jp/bio/101/opentggates/individual/> .
@prefix tgc: <http://purl.jp/bio/101/opentggates/chemicalcompound/> .
@prefix tgchip: <http://purl.jp/bio/101/opentggates/chip/> .
@prefix tgexp: <http://purl.jp/bio/101/opentggates/experiment/> .
@prefix tgexps: <http://purl.jp/bio/101/opentggates/experimentalset/> .
@prefix tgexpc: <http://purl.jp/bio/101/opentggates/experimentalcondition/> .
@prefix tgprofile: <http://purl.jp/bio/101/opentggates/profile/> .
@prefix tgpathology: <http://purl.jp/bio/101/opentggates/pathology/> .
@prefix tgpathotopography: <http://purl.jp/bio/101/opentggates/pathologicaltopography/> .
@prefix tgpathofinding: <http://purl.jp/bio/101/opentggates/pathologicalfindings/> .
@prefix tgpathograde: <http://purl.jp/bio/101/opentggates/pathologicalfindings/> .
@prefix dcterms: <http://purl.org/dc/terms/> .
@prefix sio: <http://semanticscience.org/resource/> .
@prefix biodb: <http://schema.org/BiologicalDatabaseEntry/> .
@prefix snomedct: <http://purl.bioontology.org/ontology/SNOMEDCT/> .
@prefix mesh: <http://purl.bioontology.org/ontology/MESH/> .
@prefix obo: <http://purl.obolibrary.org/obo/> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix drugbank: <http://bio2rdf.org/drugbank:> .
@prefix pubchem: <http://bio2rdf.org/pubchem.compound:> .
@prefix kegg:  <http://bio2rdf.org/kegg:> .
@prefix cas:  <http://bio2rdf.org/cas:> .
@prefix go:  <http://bio2rdf.org/go:> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix rdfs:  <http://www.w3.org/2000/01/rdf-schema#> . 
@prefix uniprot: <http://purl.uniprot.org/uniprot/> .
@prefix affymetrix: <http://bio2rdf.org/affymetrix:> .
@prefix unigene: <http://bio2rdf.org/unigene:> .
@prefix ncbigene: <http://bio2rdf.org/ncbigene:> .
@prefix taxon: <http://identifiers.org/taxonomy/> .

#Sample
tgs:0450104LR a tgo:Sample;
dcterms:isPartOf tgi:0450104;
## sampleにもともと使用していたIDを使用
tgo:appliedOrgan obo:UBERON_0002113.
##ユペロンのオントロジーを参照しよう。->UBERON_0002113 -> kidney. -> UBERON_0002107 -> liver 

#Individual
tgi:0126112  a  tgo:Individual;
 tgo:taxon taxon:10116;
 tgo:condition tgexpc:012611; 
 tgo:hasSample tgsample:0126112hR;
  sio:SIO_000216 [
  a snomedct:687005;
  skos:prefLabel "Albumin/Globulin ratio" ;
  rdfs:label "Albumin/Globulin ratio" ;
  tgo:abbr "AGratio";
  sio:SIO_000300  1.9;
  sio:SIO_000221 obo:UO_0000190 
];
 sio:SIO_000216 [
  a obo:CMO_0000045 ;
  sio:SIO_000300  949.0 ;
  skos:prefLabel "plasma alkaline phosphatase activity level" ;
  rdfs:label "plasma alkaline phosphatase activity level" ;
  tgo:abbr "ALP";
  sio:SIO_000221 snomedct:259001000 ;
].

##実験条件。IDの付け方を相談。
tgexpc:045010 a tgo:ExperimentalCondition;
tgo:exposedCompound tgc:00086;
tgo:hasExperimentalFactor [ 
## hasValue こうして良いのかなぁ…
    a snomedct:260911001; 
#snomedct:260911001 indicates Dosage
    rdfs:label "Dosage";
    sio:SIO_000300  300 ;
    sio:SIO_000221 snomedct:396163008 ;
#snomedct:396163008 means mg/kg
    tgo:doseLevel  "Middle".
    ];
tgo:hasExperimentalFactor [ 
    a obo:XCO_0000152;
## http://purl.obolibrary.org/obo/XCO_0000152 drug dose time series これでいいのか相談。 
##実験の意味を五十嵐さんに確認。
    rdfs:label "drug dose time series";
    sio:SIO_000300  6 ;  
    sio:SIO_000221  snomedct:258702006 .
##snomedct:258702006はhrの意味
    ]; 
sio:SIO_000900 "Single".
##SIO_000900は頻度。この書き方についても相談。

##化合物
tgc:00086 a tgo:Compound;
rdfs:label "ranitidine";
snomedct:398223008 "RAN";
#snomedct:398223008 indicates abbreviation.
tgo:x-kegg kegg:C11227,D00422;
tgo:x-drugbank drugbank:DB00863;
tgo:x-cas cas:66357-35-5;
tgo:x-pubchem pubchem:3001055 .

#ExperimentalSet
tgexs:0450104LR tgo:belongs_to tgo:ExperimentalSet.

##Experiment
tgexp:0450104LE a tgo:Experiment; 
tgo:belongsTo tgexps:0450;
tgo:hasSample tgsample:0450104LR;
tgo:hasChip tgchip:003017405020 . 

#Chip
tgchip:003017405020 a tgo:Chip;
tgo:hasArray tgarray:Rat230_2.

#Array
tgarray:Rat230_2 a tgo:Array;
tgo:hasProbe tgprobe:1367452_at;
tgo:hasProbe tgprobe:1367453_at.


#Probeの書き方は相談が必要。
tgprobe:1367452_at a  tgo:Probe ;
   rdfs:seeAlso affymetrix:1367452_at;
   rdfs:label "SMT3 suppressor of mif two 3 homolog 2 (S. cerevisiae)";
   tgo:geneSymbol ”Sumo2";
   tgaffy:biologicalProcess go:0051726;
   tgaffy:cellularComponent go:0005634;
   tgaffy:molecularFunction go:0031625;
   tgo:x-unigene unigene:Rn.1546549;
   tgo:x-ncbigene ncbigene:690244;
   tgo:x-uniprot uniprot:Q63692.


#解析系の結果
tganalysis:00001l3cl a tgo:Analysis;
#l3clはliver 3h control vs low の意味
    tgo:hasProfile tgprofile:00001L15chp ;
    tgo:hasControlGroup tgexp:0040011LE;
    tgo:hasControlGroup tgexp:0040012LE;
    tgo:hasControlGroup tgexp:0040013LE;
    tgo:hasTestGroup tgexp:0040111LE;
    tgo:hasTestGroup tgexp:0040112LE;
    tgo:hasTestGroup tgexp:0040113LE.

#Profile
tgprofile:00001L15chp a tgo:Profile;
sio:has-value [
tgo:hasProbe tgprobe:1367452_at;
tgo:log2FoldChange -0.5951643469173868;
tgo:pValue  6.8711052155039E-7;
tgo:geneExpressionLevel "DOWN".
];
sio:has-value [
tgo:hasProbe tgprobe:1367453_at;
tgo:log2FoldChange -0.9951643469173868;
tgo:pValue  2.8711052155039E-5;
tgo:geneExpressionLevel "DOWN".
].

##以下病理所見
tgpathology:22890 a tgo:Pathology;
tgpathology:topography tgpathotopography:TO-K0570;
tgpathology:findings tgpathofinding:FI-K1200;
tgpathology:grade tgpathograde:GRAD0080;
foaf:depiction  <http://virtualslide.nibio.go.jp/Authenticate3.php?image_id=23181> ;
tgo:hasSample tgs:0450104LR.

#Grade
tgpahograde:GRAD0080 a tgo:PathologicalGrade;
tgpathology:gradelabel snomedct:6736007;
rdfs:label "Moderate (++)"@en;
rdfs:label "中等度"@ja;
biodb:dateCreated "2007-02-28".
#present -> snomedct:52101004 
#minimal -> snomedct:255605001
#slight -> snomedct:255510006
#moderate -> snomedct:6736007 
#severe -> snomedct:24484000 

#Topography
tgpathotopography:TO-K0570 a tgo:Topography;
#tgo:label obo:UBERON_0009773;
#上記obo:UBERON_0009773は尿細管の意味
rdfs:label "Renal tubule"@en;
rdfs:label "尿細管"@ja;
dcterms:isPartOf obo:UBERON_0002113;
biodb:dateCreated "2007-02-28".

#Findings
tgpathofinding:FI-K1200 a tgo:PathologicalFindings;
rdfs:label "Regeneration"@en;
rdfs:label "再生"@ja;
tgpathology:lesion "Non-neoplastic lesions"@en;
tgpathology:lesion  "非腫瘍性病変"@ja.
tgpathology:organ obo:UBERON_0002113;
biodb:dateCreated "2007-02-28".

obo:UBERON_0002113 rdfs:label "腎臓"@ja;
rdfs:label "Kidney"@en. 


今後の予定

  • 細かい実験条件等をNIBIOにて確認,修正。
  • 全てのRDFを作成したRDF Schemaをもとに修正しまくる。
    • RDF化ガイドラインに準拠する。
  • オントロジーファイルの作成
  • アプリケーションに反映,RDFのダウンロード機能の提供
/mw/BH14.14/genomeRDF/toxico」より作成