BH12.12/SPARQLthon15/GlycoProtDB
提供:TogoWiki
目次 |
GlycoProtDB
GlycoProtDBのRDF仕様サンプル書いてみました。 jcggdb.jp以下のURIはほとんどダミーです。
描画したグラフのURL(20131217 11:00まで有効)
http://www.w3.org/RDF/Validator/ARPServlet.tmp/servlet_273035522317489651.svg
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix dc: <http://purl.org/dc/terms/> . @prefix owl: <http://www.w3.org/2002/07/owl#> . @prefix foaf: <http://xmlns.com/foaf/0.1/> . @prefix bto: <http://purl.obolibrary.org/obo/> . @prefix uniprot: <http://purl.uniprot.org/core/> . @prefix skos: <http://www.w3.org/2004/02/skos/core#> . @prefix faldo: <http://biohackathon.org/resource/faldo#> . @prefix psimod: <http://purl.obolibrary.org/obo/mod.owl#> . @prefix bt: <http://purl.org/biotop/biotop.owl#> . @prefix glyco: <http://purl.jp/bio/12/glyco/glycan/> . <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330#uuid41790loc> faldo:position "263" ; faldo:reference <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330> ; a faldo:ExactPosition . <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330#uuid48790loc> faldo:position "263" ; faldo:reference <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330> ; a faldo:ExactPosition . <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330> glyco:has_glycosylated_AA <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330#uuid41790>, <http://jcggdb.jp/rcmg/gpdb/GiDetail? gproId=GPMMU00000330#uuid48790> ; glyco:has_sequence """ MAPQRRGPPRIPEGSSAAERRRATSTKKDRLPREAQRTWLRIVAFGVGLALVTCLLWSSVGIDDDVAEVV ARRGEVLEGRFIEVPCSEDYDGHRRFEGCTPRKCGRGVTDIVITREEAEQIRRIAEKGLSLGGSDGGASI LDLHSGALSVGKHFVNLYRYFGDKIQNIFSEEDFQLYRDIRQKVQLTIAEAFGISASLLYLTKPTFFSRI NSTEARTAHDEYWHAHVDKVTYGSFDYTSLLYLSDYLEDFGGGRFVFMEEGSNKTVEPRAGRVSFFTSGS ENLHRVEKVLWGTRYAITIAFTCNPDHGIEDPVLT """^^glyco:sequence ; uniprot:created "2011-08-14"^^<http://www.w3.org/2001/XMLSchema#date> ; uniprot:length "315" ; uniprot:modified "2011-09-15"^^<http://www.w3.org/2001/XMLSchema#date> ; uniprot:organism <http://purl.uniprot.org/taxonomy/10090> ; a glyco:glycoprotein ; rdfs:seeAlso <http://www.uniprot.org/uniprot/OGFD3_MOUSE> ; owl:seeAlso <http://www.ncbi.nlm.nih.gov/protein/13384786> ; skos:closedMatch <http://www.ncbi.nlm.nih.gov/protein/NP_079678> . <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GP_MMU_00000330#uuid41790> faldo:location <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330#uuid41790loc> ; glyco:has_reference <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3693#uuidGAAR1> ; a psimod:modified_L-asparagine_residue ; skos:closedMatch uniprot:Glycosylation_Annotation . <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330#uuid48790> faldo:location <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330#uuid48790loc> ; glyco:has_reference <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1> ; a psimod:modified_L-asparagine_residue ; skos:closedMatch uniprot:Glycosylation_Annotation . <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645> glyco:captured_by <http://purl.jp/bio/12/glyco/glycan#ConA> ; glyco:is_from_source <http://purl.jp/bio/12/glyco/glycan#Heart> ; a <http://purl.jp/bio/12/glyco/glycan#glycopeptide>, <http://purl.jp/bio/12/glyco/glycan#referenced_compound> . <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1> dc:isPartOf <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645> ; a <http://purl.jp/bio/12/glyco/glycan#referenced_compound>, psimod:modified_L-asparagine_residue . <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3693> glyco:captured_by <http://purl.jp/bio/12/glyco/glycan#ConA> ; glyco:has_source <http://purl.jp/bio/12/glyco/glycan#Lung> ; a <http://purl.jp/bio/12/glyco/glycan#glycopeptide>, <http://purl.jp/bio/12/glyco/glycan#referenced_compound> . <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3693#uuidGAAR1> dc:isPartOf <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3693> ; a <http://purl.jp/bio/12/glyco/glycan#referenced_compound>, psimod:modified_L-asparagine_residue .
- 真ん中辺りにある「owl:seeAlso」は「rdfs:seeAlso」の間違い?
IGOT peptide dataset
質量分析計が吐き出すトリプシン消化した短いペプチド断片の配列のエントリーRDF化してみました。
turtle
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix dc: <http://purl.org/dc/terms/> . @prefix owl: <http://www.w3.org/2002/07/owl#> . @prefix foaf: <http://xmlns.com/foaf/0.1/> . @prefix bto: <http://purl.obolibrary.org/obo/bto#> . @prefix uniprot: <http://purl.uniprot.org/core/> . @prefix skos: <http://www.w3.org/2004/02/skos/core#> . @prefix faldo: <http://biohackathon.org/resource/faldo#> . @prefix psimod: <http://purl.obolibrary.org/obo/mod.owl#> . @prefix bt: <http://purl.org/biotop/biotop.owl#> . @prefix so: <http://purl.obolibrary.org/obo/so.owl#> . @prefix glyco: <http://purl.jp/bio/12/glyco/glycan/> . <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645> faldo:location <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeploc> ; glyco:has_evidence <http://purl.jp/bio/12/glyco/glycan#evidence_IGOT> ; glyco:has_glycosylated_AA <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1> ; glyco:has_sequence """ >IGOTPEPID0000588-3453|modificationDigit|000002200400000000000000000 DIYTMMGQNVTLECFALGNPVPDIR """^^<http://edamontology.org/data_1954>, """ DIYTMMGQNVTLECFALGNPVPDIR """^^<http://edamontology.org/data_2974> ; glyco:is_from_source <http://jcggdb.jp/rcmg/gpdb/IGS=IGS3645> ; uniprot:created "2013-08-11"^^<http://www.w3.org/2001/XMLSchema#date> ; uniprot:length "25" ; uniprot:organism <http://purl.uniprot.org/taxonomy/10090> ; a <http://purl.jp/bio/12/glyco/glycan#glycopeptide>, <http://purl.jp/bio/12/glyco/glycan#referenced_compound> ; rdfs:isPartOf <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330> . <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1> faldo:location <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1loc> ; a psimod:modified_L-asparagine_residue ; skos:closeMatch uniprot:Glycosylation_Annotation . <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1loc> faldo:position "9" ; faldo:reference <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645> ; a faldo:ExactPosition . <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeploc> faldo:begin <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeplocB> ; faldo:end <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeplocE> ; a faldo:Region . <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeplocB> faldo:position "256" ; faldo:reference <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330> ; a faldo:ExactPosition . <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeplocE> faldo:position "281" ; faldo:reference <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330> ; a faldo:ExactPosition .
RDF/XML
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:dc="http://purl.org/dc/terms/" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:bto="http://purl.obolibrary.org/obo/bto#" xmlns:uniprot="http://purl.uniprot.org/core/" xmlns:skos="http://www.w3.org/2004/02/skos/core#" xmlns:faldo="http://biohackathon.org/resource/faldo#" xmlns:psimod="http://purl.obolibrary.org/obo/mod.owl#" xmlns:bt="http://purl.org/biotop/biotop.owl#" xmlns:so="http://purl.obolibrary.org/obo/so.owl#" xmlns:glyco="http://purl.jp/bio/12/glyco/glycan/"> <rdf:Description rdf:about="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645"> <rdf:type rdf:resource="http://purl.jp/bio/12/glyco/glycan#glycopeptide" /> <uniprot:organism rdf:resource="http://purl.uniprot.org/taxonomy/10090" /> <rdf:type rdf:resource="http://purl.jp/bio/12/glyco/glycan#referenced_compound" /> <glyco:has_evidence rdf:resource="http://purl.jp/bio/12/glyco/glycan#evidence_IGOT" /> <uniprot:created rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2013-08-11</uniprot:created> <glyco:has_sequence rdf:datatype="http://edamontology.org/data_2974"> DIYTMMGQNVTLECFALGNPVPDIR </glyco:has_sequence> <glyco:has_sequence rdf:datatype="http://edamontology.org/data_1954"> >IGOTPEPID0000588-3453|modificationDigit|000002200400000000000000000 DIYTMMGQNVTLECFALGNPVPDIR </glyco:has_sequence> <uniprot:length>25</uniprot:length> <glyco:has_glycosylated_AA> <rdf:Description rdf:about="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1"> <rdf:type rdf:resource="http://purl.obolibrary.org/obo/mod.owl#modified_L-asparagine_residue" /> <skos:closeMatch rdf:resource="http://purl.uniprot.org/core/Glycosylation_Annotation" /> <faldo:location> <rdf:Description rdf:about="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1loc"> <rdf:type rdf:resource="http://biohackathon.org/resource/faldo#ExactPosition" /> <faldo:position>9</faldo:position> <faldo:reference rdf:resource="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645"/> </rdf:Description> </faldo:location> </rdf:Description> </glyco:has_glycosylated_AA> <glyco:is_from_source rdf:resource="http://jcggdb.jp/rcmg/gpdb/IGS=IGS3645" /> <rdfs:isPartOf rdf:resource="http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330"/> <faldo:location> <rdf:Description rdf:about="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeploc"> <rdf:type rdf:resource="http://biohackathon.org/resource/faldo#Region" /> <faldo:begin> <rdf:Description rdf:about="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeplocB" > <rdf:type rdf:resource="http://biohackathon.org/resource/faldo#ExactPosition" /> <faldo:position>256</faldo:position> <faldo:reference rdf:resource="http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330"/> </rdf:Description> </faldo:begin> <faldo:end> <rdf:Description rdf:about="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeplocE" > <rdf:type rdf:resource="http://biohackathon.org/resource/faldo#ExactPosition" /> <faldo:position>281</faldo:position> <faldo:reference rdf:resource="http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330"/> </rdf:Description> </faldo:end> </rdf:Description> </faldo:location> </rdf:Description> </rdf:RDF>
- Sequence Ontologyのprotein_matchっていうのがある。(藤沢さん)
実験条件メタデータのRDF化
Data Model
記述例が欲しい。
- MIAPE?
記述しておきたい内容
- 生物材料
- Taxonomy
- Tissue
- Organ
- Cell-Type
- Cell-Line
- Medium
- 試料調製
- ワークフロー(?)
- プロテアーゼ
- グリコシダーゼ
- レクチン
- 分析条件
back to BH12.12/SPARQLthon15 page