BH12.12/SPARQLthon15/GlycoProtDB

提供:TogoWiki

2013年12月17日 (火) 07:46時点におけるHsaw (トーク | 投稿記録)による版
移動: 案内, 検索

目次

GlycoProtDB

GlycoProtDBのRDF仕様サンプル書いてみました。コメントいただけるとすごく嬉しいです。 jcggdb.jp以下のURIはほとんどダミーです。

描画したグラフのURL(20131217 11:00まで有効)
http://www.w3.org/RDF/Validator/ARPServlet.tmp/servlet_273035522317489651.svg


@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix dc: <http://purl.org/dc/terms/> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix bto: <http://purl.obolibrary.org/obo/> .
@prefix uniprot: <http://purl.uniprot.org/core/> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix faldo: <http://biohackathon.org/resource/faldo#> .
@prefix psimod: <http://purl.obolibrary.org/obo/mod.owl#> .
@prefix bt: <http://purl.org/biotop/biotop.owl#> .
@prefix glyco: <http://purl.jp/bio/12/glyco/glycan/> .

<http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330#uuid41790loc>
   faldo:position "263" ;
   faldo:reference <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330> ;
   a faldo:ExactPosition .

<http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330#uuid48790loc>
   faldo:position "263" ;
   faldo:reference <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330> ;
   a faldo:ExactPosition .

<http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330>
   glyco:has_glycosylated_AA <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330#uuid41790>, <http://jcggdb.jp/rcmg/gpdb/GiDetail? gproId=GPMMU00000330#uuid48790> ;
   glyco:has_sequence """
MAPQRRGPPRIPEGSSAAERRRATSTKKDRLPREAQRTWLRIVAFGVGLALVTCLLWSSVGIDDDVAEVV
ARRGEVLEGRFIEVPCSEDYDGHRRFEGCTPRKCGRGVTDIVITREEAEQIRRIAEKGLSLGGSDGGASI
LDLHSGALSVGKHFVNLYRYFGDKIQNIFSEEDFQLYRDIRQKVQLTIAEAFGISASLLYLTKPTFFSRI
NSTEARTAHDEYWHAHVDKVTYGSFDYTSLLYLSDYLEDFGGGRFVFMEEGSNKTVEPRAGRVSFFTSGS
ENLHRVEKVLWGTRYAITIAFTCNPDHGIEDPVLT
	"""^^glyco:sequence ;
   uniprot:created "2011-08-14"^^<http://www.w3.org/2001/XMLSchema#date> ;
   uniprot:length "315" ;
   uniprot:modified "2011-09-15"^^<http://www.w3.org/2001/XMLSchema#date> ;
   uniprot:organism <http://purl.uniprot.org/taxonomy/10090> ;
   a glyco:glycoprotein ;
   rdfs:seeAlso <http://www.uniprot.org/uniprot/OGFD3_MOUSE> ;
   owl:seeAlso <http://www.ncbi.nlm.nih.gov/protein/13384786> ;
   skos:closedMatch <http://www.ncbi.nlm.nih.gov/protein/NP_079678> .

<http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GP_MMU_00000330#uuid41790>
   faldo:location <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330#uuid41790loc> ;
   glyco:has_reference <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3693#uuidGAAR1> ;
   a psimod:modified_L-asparagine_residue ;
   skos:closedMatch uniprot:Glycosylation_Annotation .

<http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330#uuid48790>
   faldo:location <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330#uuid48790loc> ;
   glyco:has_reference <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1> ;
   a psimod:modified_L-asparagine_residue ;
   skos:closedMatch uniprot:Glycosylation_Annotation .

<http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645>
   glyco:captured_by <http://purl.jp/bio/12/glyco/glycan#ConA> ;
   glyco:is_from_source <http://purl.jp/bio/12/glyco/glycan#Heart> ;
   a <http://purl.jp/bio/12/glyco/glycan#glycopeptide>, <http://purl.jp/bio/12/glyco/glycan#referenced_compound> .

<http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1>
   dc:isPartOf <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645> ;
   a <http://purl.jp/bio/12/glyco/glycan#referenced_compound>, psimod:modified_L-asparagine_residue .

<http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3693>
   glyco:captured_by <http://purl.jp/bio/12/glyco/glycan#ConA> ;
   glyco:has_source <http://purl.jp/bio/12/glyco/glycan#Lung> ;
   a <http://purl.jp/bio/12/glyco/glycan#glycopeptide>, <http://purl.jp/bio/12/glyco/glycan#referenced_compound> .

<http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3693#uuidGAAR1>
   dc:isPartOf <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3693> ;
   a <http://purl.jp/bio/12/glyco/glycan#referenced_compound>, psimod:modified_L-asparagine_residue .
  • 真ん中辺りにある「owl:seeAlso」は「rdfs:seeAlso」の間違い?

IGOT peptide dataset

質量分析計が吐き出すトリプシン消化した短いペプチド断片の配列のエントリーRDF化してみました。
turtle

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix dc: <http://purl.org/dc/terms/> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix bto: <http://purl.obolibrary.org/obo/bto#> .
@prefix uniprot: <http://purl.uniprot.org/core/> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix faldo: <http://biohackathon.org/resource/faldo#> .
@prefix psimod: <http://purl.obolibrary.org/obo/mod.owl#> .
@prefix bt: <http://purl.org/biotop/biotop.owl#> .
@prefix so: <http://purl.obolibrary.org/obo/so.owl#> .
@prefix glyco: <http://purl.jp/bio/12/glyco/glycan/> .

<http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645>
    faldo:location <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeploc> ;
    glyco:has_evidence <http://purl.jp/bio/12/glyco/glycan#evidence_IGOT> ;
    glyco:has_glycosylated_AA <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1> ;
    glyco:has_sequence """
>IGOTPEPID0000588-3453|modificationDigit|000002200400000000000000000
DIYTMMGQNVTLECFALGNPVPDIR
	"""^^<http://edamontology.org/data_1954>, """
DIYTMMGQNVTLECFALGNPVPDIR
	"""^^<http://edamontology.org/data_2974> ;
    glyco:is_from_source <http://jcggdb.jp/rcmg/gpdb/IGS=IGS3645> ;
    uniprot:created "2013-08-11"^^<http://www.w3.org/2001/XMLSchema#date> ;
    uniprot:length "25" ;
    uniprot:organism <http://purl.uniprot.org/taxonomy/10090> ;
    a <http://purl.jp/bio/12/glyco/glycan#glycopeptide>, <http://purl.jp/bio/12/glyco/glycan#referenced_compound> ;
    rdfs:isPartOf <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330> .


<http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1>
    faldo:location <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1loc> ;
    a psimod:modified_L-asparagine_residue ;
    skos:closeMatch uniprot:Glycosylation_Annotation .

<http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1loc>
    faldo:position "9" ;
    faldo:reference <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645> ;
    a faldo:ExactPosition .

<http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeploc>
    faldo:begin <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeplocB> ;
    faldo:end <http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeplocE> ;
    a faldo:Region .

<http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeplocB>
    faldo:position "256" ;
    faldo:reference <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330> ;
    a faldo:ExactPosition .

<http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeplocE>
    faldo:position "281" ;
    faldo:reference <http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330> ;
    a faldo:ExactPosition .


RDF/XML

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" 
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" 
xmlns:dc="http://purl.org/dc/terms/" 
xmlns:owl="http://www.w3.org/2002/07/owl#" 
xmlns:foaf="http://xmlns.com/foaf/0.1/" 
xmlns:bto="http://purl.obolibrary.org/obo/bto#" 
xmlns:uniprot="http://purl.uniprot.org/core/" 
xmlns:skos="http://www.w3.org/2004/02/skos/core#" 
xmlns:faldo="http://biohackathon.org/resource/faldo#" 
xmlns:psimod="http://purl.obolibrary.org/obo/mod.owl#" 
xmlns:bt="http://purl.org/biotop/biotop.owl#" 
xmlns:so="http://purl.obolibrary.org/obo/so.owl#"  
xmlns:glyco="http://purl.jp/bio/12/glyco/glycan/">
<rdf:Description rdf:about="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645">
	<rdf:type rdf:resource="http://purl.jp/bio/12/glyco/glycan#glycopeptide" />
	<uniprot:organism rdf:resource="http://purl.uniprot.org/taxonomy/10090" /> 
	<rdf:type rdf:resource="http://purl.jp/bio/12/glyco/glycan#referenced_compound" />
	<glyco:has_evidence rdf:resource="http://purl.jp/bio/12/glyco/glycan#evidence_IGOT" />
	<uniprot:created rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2013-08-11</uniprot:created>
	<glyco:has_sequence rdf:datatype="http://edamontology.org/data_2974">
DIYTMMGQNVTLECFALGNPVPDIR
	</glyco:has_sequence>
	<glyco:has_sequence rdf:datatype="http://edamontology.org/data_1954">
>IGOTPEPID0000588-3453|modificationDigit|000002200400000000000000000
DIYTMMGQNVTLECFALGNPVPDIR 
	</glyco:has_sequence>
	<uniprot:length>25</uniprot:length>

	<glyco:has_glycosylated_AA>
		<rdf:Description rdf:about="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1">
			<rdf:type rdf:resource="http://purl.obolibrary.org/obo/mod.owl#modified_L-asparagine_residue" />
			<skos:closeMatch rdf:resource="http://purl.uniprot.org/core/Glycosylation_Annotation" />
			<faldo:location>
				<rdf:Description rdf:about="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGAAR1loc">
					<rdf:type rdf:resource="http://biohackathon.org/resource/faldo#ExactPosition" />
					<faldo:position>9</faldo:position>
					<faldo:reference rdf:resource="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645"/>
				</rdf:Description>
			</faldo:location>
			</rdf:Description>
	</glyco:has_glycosylated_AA>

	<glyco:is_from_source rdf:resource="http://jcggdb.jp/rcmg/gpdb/IGS=IGS3645" />
	<rdfs:isPartOf rdf:resource="http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330"/>

	<faldo:location>
		<rdf:Description rdf:about="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeploc">
			<rdf:type rdf:resource="http://biohackathon.org/resource/faldo#Region" />
			<faldo:begin>
				<rdf:Description rdf:about="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeplocB" >
					<rdf:type rdf:resource="http://biohackathon.org/resource/faldo#ExactPosition" />
					<faldo:position>256</faldo:position>						
					<faldo:reference rdf:resource="http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330"/>
				</rdf:Description>
			</faldo:begin>
			<faldo:end>
				<rdf:Description rdf:about="http://jcggdb.jp/rcmg/gpdb/IGPF=IGP0002000619_3645#uuidGpeplocE" >
					<rdf:type rdf:resource="http://biohackathon.org/resource/faldo#ExactPosition" />
					<faldo:position>281</faldo:position>						
					<faldo:reference rdf:resource="http://jcggdb.jp/rcmg/gpdb/GiDetail?gproId=GPMMU00000330"/>
				</rdf:Description>
			</faldo:end>
		</rdf:Description>
	</faldo:location>

	</rdf:Description>
</rdf:RDF>


  • Sequence Ontologyのprotein_matchっていうのがある。(藤沢さん)

実験条件メタデータのRDF化

Data Model

記述例が欲しい。

  • MIAPE?

記述しておきたい内容

  • 生物材料
    • Taxonomy
    • Tissue
    • Organ
    • Cell-Type
    • Cell-Line
    • Medium
  • 試料調製
    • ワークフロー(?)
    • プロテアーゼ
    • グリコシダーゼ
    • レクチン
  • 分析条件

back to BH12.12/SPARQLthon15 page