糖鎖情報のRDF連携について

提供:TogoWiki

2017年5月15日 (月) 04:16時点におけるTk-tk (トーク | 投稿記録)による版
移動: 案内, 検索

目次

糖鎖関連遺伝子のデータベース


UniProtとの連携を探る

例として、ST3GAL1を例として UniProt のRDFを見てみる。


Gene symbol を UniProt Accession にコンバートしてみる

  • IDをコンバートできるサイト
    • http://biodb.jp/
    • ID Converterで、HUGO gene symbol —> UniProt Accession ができる
  • GGDB の HUGO gene symbol から UniProt Accession へ変換してみる
    • ST3GAL1
      • --> Q11201 (homo sapiense)
  • 他の gene symbolからでも、変換してみる
    • FUT9
      • --> B4DEW1 (homo sapiense)
      • --> Q5Q0U2 (homo sapiense)
      • --> Q9BUV6 (homo sapiense)
      • --> Q9Y231 (homo sapiense)
  • gene symbolで、対応を取るだけなら、コンバーター使わなくても、SPARQLの文字列マッチでできるはず。


SPARQL クエリ

対応を取るための、sparql クエリをつくる。

PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> 
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> 
PREFIX up: <http://purl.uniprot.org/core/> 
PREFIX ggdb:  <http://purl.jp/bio/12/ggdb/2015/6/owl#> 
PREFIX edam:  <http://edamontology.org/> 
PREFIX skos:  <http://www.w3.org/2004/02/skos/core#> 

CONSTRUCT{
	?glycogene a ggdb:Glycogene.
	?glycogene ggdb:has_gene ?up_gene.	
	?up_gene a up:Gene.
}
WHERE{
	?glycogene a ggdb:Glycogene;
		ggdb:has_gene ?gene.

	?gene a edam:data2299;
		rdfs:label ?gene_name.

	SERVICE SILENT <http://sparql.uniprot.org> {
		?up_gene a up:Gene; 
			skos:prefLabel ?gene_name.
	}
}

クエリが正しいかどうか、未確認。。。

  • スクリーニングには、いいかもしれない
  • キュレーションとしての使用はできない

Federated query

SPARQLthon56にて ローカルで、Virtuosoを起動し、federated queryを行ったことがなかったので、やってみた。

個人用ツール