SPARQLthon21/Organism

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
1行: 1行:
 +
= 生物種情報の記述 =
== ゲノムRDF ==
== ゲノムRDF ==
* [https://github.com/dbcls/rdfsummit/tree/master/insdc2ttl insds2ttl] (RDF summit後の更新バージョン) を用いて[ftp://ftp.ncbi.nlm.nih.gov/refseq/release/plant/ RefSeq/plant (release65)]からRDF試作
* [https://github.com/dbcls/rdfsummit/tree/master/insdc2ttl insds2ttl] (RDF summit後の更新バージョン) を用いて[ftp://ftp.ncbi.nlm.nih.gov/refseq/release/plant/ RefSeq/plant (release65)]からRDF試作

2014年6月18日 (水) 05:59時点における版

目次

生物種情報の記述

ゲノムRDF

  • RDF/turtle、配列エントリーのメタデータおよびSource Feature部分のみ
<http://identifiers.org/refseq/NW_005178015.1>  rdf:type        obo:SO_0000340 .  # SO:chromosome
<http://identifiers.org/refseq/NW_005178015.1>  rdfs:label      "Coccomyxa subellipsoidea C-169, whole genome shotgun sequence." .
<http://identifiers.org/refseq/NW_005178015.1>  insdc:sequence_version  "NW_005178015.1" .
<http://identifiers.org/refseq/NW_005178015.1>  insdc:sequence_length   206615 .
<http://identifiers.org/refseq/NW_005178015.1>  insdc:sequence_fasta    <http://www.ncbi.nlm.nih.gov/nuccore/NW_005178015.1?report=fasta> .
<http://identifiers.org/refseq/NW_005178015.1>  rdf:type        obo:SO_0000987 .  # SO:linear
<http://identifiers.org/refseq/NW_005178015.1>  insdc:sequence_date     "2013-09-24"^^xsd:date .
<http://identifiers.org/refseq/NW_005178015.1>  rdfs:seeAlso    <http://identifiers.org/ncbigi/GI:545353528> .
<http://identifiers.org/ncbigi/GI:545353528>    rdfs:label      "GI:545353528" .
<http://identifiers.org/ncbigi/GI:545353528>    sio:SIO_000068  <http://identifiers.org/ncbigi> .  # sio:is-part-of
<http://identifiers.org/refseq/NW_005178015.1>  rdfs:seeAlso    <http://identifiers.org/refseq/NW_005178015.1> .
<http://identifiers.org/refseq/NW_005178015.1>  rdfs:label      "NW_005178015.1" .
<http://identifiers.org/refseq/NW_005178015.1>  sio:SIO_000068  <http://identifiers.org/refseq> .  # sio:is-part-of
<http://identifiers.org/refseq/NW_005178015.1>  insdc:dblink    <http://identifiers.org/bioproject/PRJNA221161> .
<http://identifiers.org/bioproject/PRJNA221161> rdfs:label      "PRJNA221161" .
<http://identifiers.org/bioproject/PRJNA221161> rdf:type        <http://identifiers.org/bioproject#Entry> .
<http://identifiers.org/refseq/NW_005178015.1>  rdfs:seeAlso    <http://identifiers.org/pubmed/22630137> .
<http://identifiers.org/pubmed/22630137>        rdfs:label      "22630137" .
<http://identifiers.org/pubmed/22630137>        sio:SIO_000068  <http://identifiers.org/pubmed> .  # sio:is-part-of
<http://identifiers.org/refseq/NW_005178015.1>  insdc:location  "1..206615" .
<http://identifiers.org/refseq/NW_005178015.1>  faldo:location  <http://identifiers.org/refseq/NW_005178015.1#region:1-206615:1> .
<http://identifiers.org/refseq/NW_005178015.1#region:1-206615:1>        rdf:type        faldo:Region .
<http://identifiers.org/refseq/NW_005178015.1#region:1-206615:1>        faldo:begin     <http://identifiers.org/refseq/NW_005178015.1#position:1:1> .
<http://identifiers.org/refseq/NW_005178015.1#region:1-206615:1>        faldo:end       <http://identifiers.org/refseq/NW_005178015.1#position:206615:1> .
<http://identifiers.org/refseq/NW_005178015.1#position:1:1>     faldo:position  1 .
<http://identifiers.org/refseq/NW_005178015.1#position:1:1>     faldo:reference <http://identifiers.org/refseq/NW_005178015.1> .
<http://identifiers.org/refseq/NW_005178015.1#position:1:1>     rdf:type        faldo:ForwardStrandPosition .
<http://identifiers.org/refseq/NW_005178015.1#position:1:1>     rdf:type        faldo:ExactPosition .
<http://identifiers.org/refseq/NW_005178015.1#position:206615:1>        faldo:position  206615 .
<http://identifiers.org/refseq/NW_005178015.1#position:206615:1>        faldo:reference <http://identifiers.org/refseq/NW_005178015.1> .
<http://identifiers.org/refseq/NW_005178015.1#position:206615:1>        rdf:type        faldo:ForwardStrandPosition .
<http://identifiers.org/refseq/NW_005178015.1#position:206615:1>        rdf:type        faldo:ExactPosition .
<http://identifiers.org/refseq/NW_005178015.1>  rdfs:seeAlso    <http://identifiers.org/taxonomy/574566> .
<http://identifiers.org/taxonomy/574566>        rdfs:label      "574566" .
<http://identifiers.org/taxonomy/574566>        sio:SIO_000068  <http://identifiers.org/taxonomy> .  # sio:is-part-of
<http://identifiers.org/refseq/NW_005178015.1>  insdc:organism  "Coccomyxa subellipsoidea C-169" .
<http://identifiers.org/refseq/NW_005178015.1>  insdc:mol_type  "genomic DNA" .
<http://identifiers.org/refseq/NW_005178015.1>  insdc:strain    "C-169"

データベースカタログ

  • DCAT を用いたRDFデータモデル図、生物種情報の記述部分を赤で示した

Dbcatalog-rdf-organism.png

  • 利用例)taxonomy.owlとdbcatalog-RDFを用いて緑藻(taxid:3041)データベースのSPARQLによる問い合せ

NCBI/Genome_Reports

  • 菌類、緑藻などRefSeqのゲノムサブセットを取得するために作ったドラフトバージョン

  • 原核生物
[
       :organismname   "Synechocystis sp. PCC 6803" ;
       :taxid  <http://identifiers.org/taxonomy/1148> ;
       :bioproject_accession   <http://identifiers.org/bioproject/PRJNA60> ;
       :bioproject_id  "60" ;
       :group  "Cyanobacteria" ;
       :subgroup       "Oscillatoriophycideae" ;
       :size_mb        "3.94702" ;
       :gc     "47.3493" ;
       :chromosomesrefseq      "NC_000911.1" ;
       :chromosomesinsdc       "BA000022.2" ;
       :plasmidsrefseq "NC_005229.1,NC_005231.1,NC_005230.1,NC_005232.1" ;
       :plasmidsinsdc  "AP004310.1,AP004312.1,AP004311.1,AP006585.1" ;
       :wgs    "-" ;
       :scaffolds      "5" ;
       :genes  "3625" ;
       :proteins       "3575" ;
       :release_date   "2001-07-27"^^xsd:date ;
       :modify_date    "2014-05-15"^^xsd:date ;
       :status "Gapless Chromosome" ;
       :center "Kazusa" ;
       :biosample_accession    "-" ;
       :assembly_accession     "GCA_000009725.1" ;
       :reference      "REPR" ;
       :ftp_path       "Synechocystis_sp._PCC_6803/GCF_000009725" ;
       :pubmed_id      "8590279,8905231,9724772" ;
] .
  • 真確生物
[
       :organismname   "Chlamydomonas reinhardtii" ;
       :taxid  <http://identifiers.org/taxonomy/3055> ;
       :bioproject_accession   <http://identifiers.org/bioproject/PRJNA12260> ;
       :bioproject_id  "12260" ;
       :group  "Plants" ;
       :subgroup       "Green Algae" ;
       :size_mb        "120.405" ;
       :gc     "63.8478" ;
       :assembly_accession     "GCA_000002595.2" ;
       :organelles     "2" ;
       :wgs    "ABCN01" ;
       :scaffolds      "1558" ;
       :genes  "14488" ;
       :proteins       "14489" ;
       :release_date   "2007-08-03"^^xsd:date ;
       :modify_date    "2009-08-26"^^xsd:date ;
       :status "Scaffold" ;
       :center "DOE Joint Genome Institute" ;
] .
個人用ツール