TogoStanzaQuery/v201412

提供:TogoWiki

移動: 案内, 検索

目次

グラフ構成

グラフ一覧

元データ グラフ名 トリプル数
./togogenome/refseq/current/refseq.ttl/**/*.ttl http://togogenome.org/graph/refseq 1,099,975,325
./uniprot/current/uniprot_unzip/*.owl http://togogenome.org/graph/uniprot 2,206,879,140
./uniprot/current/uniprot_unzip/*.rdf
./togogenome/uniprot/current/refseq/**/*.ttl
./togogenome/genomes/current/ASSEMBLY_REPORTS/assembly_reports.ttl http://togogenome.org/graph/assembly_report 141,409,228
./togogenome/ontology/go/current/go.owl http://togogenome.org/graph/go 1,328,568
./togogenome/ontology/so/current/so.owl http://togogenome.org/graph/so 43,060
./togogenome/ontology/taxonomy/current/taxonomy.ttl http://togogenome.org/graph/taxonomy 16,865,077
./togogenome/ontology/MCCV/current/mccv.ttl http://togogenome.org/graph/mccv 675
./togogenome/ontology/MEO/current/meo.owl http://togogenome.org/graph/meo 4,468
./togogenome/ontology/MPO/current/mpo.ttl http://togogenome.org/graph/mpo 1,618
./togogenome/ontology/GMO/current/gmo.ttl http://togogenome.org/graph/gmo 6,956
./togogenome/ontology/GOLD/current/gold2meo.ttl http://togogenome.org/graph/gold 239,615
./togogenome/ontology/GOLD/current/gold2taxon.ttl
./togogenome/ontology/GOLD/current/gold2mpo.ttl
./togogenome/ontology/GOLD/current/additional/*.ttl
./togogenome/ontology/BRC/current/*/*.ttl http://togogenome.org/graph/brc 914,050
./togogenome/ontology/GAZETTEER/current/gazetteer.owl http://togogenome.org/graph/gazetteer 7,062,536
./togogenome/ontology/GAZETTEER/current/gazetteer_lonlat.ttl
./togogenome/ontology/PDO/current/pdo.owl http://togogenome.org/graph/pdo 2,881
./togogenome/ontology/PDO/current/csso.owl http://togogenome.org/graph/csso 2,537
./togogenome/ontology/PDO/current/mapping.ttl http://togogenome.org/graph/pdo_mapping 3,306
./togogenome/ontology/faldo/current/faldo.ttl http://togogenome.org/graph/faldo 217
./togogenome/ontology/insdc/current/nucleotide.ttl http://togogenome.org/graph/insdc 14,238
./edgestore/current/*.ttl http://togogenome.org/graph/edgestore 1,028,278,267
./togogenome/refseq/current/refseq.stats.ttl http://togogenome.org/graph/stats 137,249
./togogenome/refseq/current/refseq.up.ttl http://togogenome.org/graph/tgup 140,612,211
./togogenome/refseq/current/refseq.tgtax.ttl http://togogenome.org/graph/tgtax 35,250
./togogenome/ontology/go/current/goup/*.ttl http://togogenome.org/graph/goup 97,385,550
./togogenome/ontology/MEO/current/meo_descendants.ttl http://togogenome.org/graph/meo_descendants 4,247
./togogenome/ontology/MPO/current/mpo_descendants.ttl http://togogenome.org/graph/mpo_descendants 1,471
(自動生成) http://togogenome.org/graph/


v201310版からのRDF変更点

graph名の末尾のスラッシュ削除

旧: <http://togogenome.org/graph/mpo/>
新: <http://togogenome.org/graph/mpo>

refseqデータの改変

真核データの追加

UUIDを不使用

これまで主語にUUIDを使用していたが、普通のURIを使用するように変更。regionのポジション情報もURIに含んでいるため、データ更新時に位置情報が変わるケースもあるためURIに永続性はない。

Strandが逆向きの場合のpositionの記述

これまではgene等のstrandが逆向きであった場合にも必ずbegin < end でポジションを記述していたが、逆向きの場合にはbegin > endでポジションを記述するように変更。faldoのpositionを使用しているクエリについては見直しが必要な場合がある。

データスキーマ大幅変更(未調査)


SequenceのTaxonomyの取得

RefseqグラフでSequenceのTaxonomy情報をsourceエントリ経由で取得できなくはないが(20150118版はデータが欠けてて取得できない)、一つのSequenceにphase等の理由で複数のsource(tax?)が紐づく場合がある。結果例
Sequenceの代表のTaxを取得するためにstatsグラフを使用する。statsグラフではrdfs:seeAlsoでtaxonomyまで辿ることができる。

<http://identifiers.org/bioproject/PRJNA89373>  rdfs:seeAlso    <http://identifiers.org/refseq/NC_016937.1> .
<http://identifiers.org/taxonomy/1001534>       rdfs:seeAlso    <http://identifiers.org/bioproject/PRJNA89373> .

statsグラフの変更

stats:sequence_lengthやstats:pseudogeneを追加。

<http://identifiers.org/refseq/NC_016937.1>     stats:sequence_length   1892744 .
<http://identifiers.org/refseq/NC_016937.1>     stats:gene      1764 .
<http://identifiers.org/refseq/NC_016937.1>     stats:pseudogene        172 .
<http://identifiers.org/refseq/NC_016937.1>     stats:trna      38 .
<http://identifiers.org/refseq/NC_016937.1>     stats:rrna      10 .
<http://identifiers.org/refseq/NC_016937.1>     stats:mrna      0 .
<http://identifiers.org/refseq/NC_016937.1>     stats:cds       1544 .
<http://identifiers.org/refseq/NC_016937.1>     stats:exon      0 .
<http://identifiers.org/refseq/NC_016937.1>     stats:ncrna     0 .
<http://identifiers.org/refseq/NC_016937.1>     stats:other     296 .
<http://identifiers.org/bioproject/PRJNA89373>  rdfs:seeAlso    <http://identifiers.org/refseq/NC_016937.1> .
<http://identifiers.org/bioproject/PRJNA89373>  stats:sequence_length   1892744 .
<http://identifiers.org/bioproject/PRJNA89373>  stats:gene      1764 .
<http://identifiers.org/bioproject/PRJNA89373>  stats:pseudogene        172 .
<http://identifiers.org/bioproject/PRJNA89373>  stats:trna      38 .
<http://identifiers.org/bioproject/PRJNA89373>  stats:rrna      10 .
<http://identifiers.org/bioproject/PRJNA89373>  stats:mrna      0 .
<http://identifiers.org/bioproject/PRJNA89373>  stats:cds       1544 .
<http://identifiers.org/bioproject/PRJNA89373>  stats:exon      0 .
<http://identifiers.org/bioproject/PRJNA89373>  stats:ncrna     0 .
<http://identifiers.org/bioproject/PRJNA89373>  stats:other     296 .
<http://identifiers.org/taxonomy/1001534>       rdfs:seeAlso    <http://identifiers.org/bioproject/PRJNA89373> .
<http://identifiers.org/taxonomy/1001534>       stats:sequence_length   1892744 .
<http://identifiers.org/taxonomy/1001534>       stats:gene      1764 .
<http://identifiers.org/taxonomy/1001534>       stats:pseudogene        172 .
<http://identifiers.org/taxonomy/1001534>       stats:trna      38 .
<http://identifiers.org/taxonomy/1001534>       stats:rrna      10 .
<http://identifiers.org/taxonomy/1001534>       stats:mrna      0 .
<http://identifiers.org/taxonomy/1001534>       stats:cds       1544 .
<http://identifiers.org/taxonomy/1001534>       stats:exon      0 .
<http://identifiers.org/taxonomy/1001534>       stats:ncrna     0 .
<http://identifiers.org/taxonomy/1001534>       stats:other     296 .
<http://identifiers.org/refseq/NC_016933.1>     stats:sequence_length 
  • tax:1148のように複数のBioProjectを持つ場合は、tax単位ではどれか一つの値を採用する
<http://identifiers.org/bioproject/PRJNA159873> stats:sequence_length   3571103 .
<http://identifiers.org/bioproject/PRJNA159873> stats:gene      3219 .
(中略)
<http://identifiers.org/bioproject/PRJNA189748> stats:sequence_length   3949306 .
<http://identifiers.org/bioproject/PRJNA189748> stats:gene      3610 .
(中略)
<http://identifiers.org/bioproject/PRJNA57659>  stats:sequence_length   3947019 .
<http://identifiers.org/bioproject/PRJNA57659>  stats:gene      3625 .
(中略)
#tax単位のgene数は全BioProjectの合算にはせず、どれか一つだけ選択したBioProjectの数値にした。
<http://identifiers.org/taxonomy/1148>  stats:sequence_length   3571103 .
<http://identifiers.org/taxonomy/1148>  stats:gene      3219 .

tgupグラフのURI変更

refseqエントリとuniprotエントリを直接繋げるためのtgupグラフのURIを大幅に変更。
原核生物だけの場合にはrefseqエントリをtaxid+locus_tagで一意に識別していたが、真核データの場合にはlocus_tagの登録は任意でありgeneやCDSを一意識別するIDはない。
そのため、refseqグラフのURIの一部をIDとして流用するように変更した。
geneエントリについてはrdfs:label(insdc:locus_tagがなければinsdc:gene)がRefSeqID(NC_000001.11等)の中では一意になるため、RefSeqID(バージョンなし) + geneのrdfs:labelの組み合わせをtgupのgeneURIとした。詳細
また、これまではrefseqのCDSエントリとuniprotのエントリを繋げていたが、真核の場合geneとCDSの個数の差が大きかったので、gene - uniprot, CDS - uniprotの両方を繋げるようにした。
その後UniprotIDがIsoformのものが含まれていたため、それらはisoform番号を除き("P00457-1" => "P00457")、gene - uniprotで繋げるようにした(CDSは繋げず)。
refseqのgeneエントリへはskos:exactMatchで繋げている

  • 旧データのトリプル例
<http://togogenome.org/gene/103690:all1455>     rdfs:seeAlso    upid:P00457 .
upid:P00457     rdf:type        <http://identifiers.org/uniprot/> .
upid:P00457     rdfs:seeAlso    up:P00457 .
up:P00457       dct:publisher   mir:MIR:00100134 .
<http://togogenome.org/gene/103690:all1455>     rdfs:seeAlso    tax:103690 .
  • 新データのトリプル例
<http://togogenome.org/gene/NC_003272:all1455>  rdfs:seeAlso    tax:103690 .
<http://togogenome.org/gene/NC_003272:all1455>  skos:exactMatch <http://identifiers.org/refseq/NC_003272.1#feature:1713396-1714283:-1:gene.1466> .
<http://togogenome.org/gene/NC_003272:all1455>  rdfs:seeAlso    upid:P00457 .
upid:P00457     rdf:type        <http://identifiers.org/uniprot> .
upid:P00457     rdfs:seeAlso    up:P00457 .
up:P00457       dct:publisher   mir:MIR:00100134 .
upid:P00457     rdfs:seeAlso    tax:103690 .
  • 新データのトリプル例(没:geneのURLが長く、永続性がないため)
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:gene.1466>    rdfs:seeAlso    tax:103690 .
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:gene.1466>    rdf:type        insdc:Gene .
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:gene.1466>    rdfs:label      "all1455" .
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:gene.1466>    owl:sameAs      <http://identifiers.org/refseq/NC_003272.1#feature:1713396-1714283:-1:gene.1466> .
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:gene.1466>    rdfs:seeAlso    upid:P00457 .
upid:P00457     rdf:type        <http://identifiers.org/uniprot> .
upid:P00457     rdfs:seeAlso    up:P00457 .
up:P00457       dct:publisher   mir:MIR:00100134 .
upid:P00457     rdfs:seeAlso    tax:103690 .
  • 新データのトリプル例(没:Isoformが混じっていたため)
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:CDS.1452>     rdfs:seeAlso    tax:103690 .
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:CDS.1452>     rdf:type        insdc:Coding_Sequence .
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:CDS.1452>     rdfs:label      "all1455" .
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:CDS.1452>     rdfs:seeAlso    upid:P00457 .
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:gene.1466>    rdfs:seeAlso    tax:103690 .
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:gene.1466>    rdf:type        insdc:Gene .
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:gene.1466>    rdfs:label      "all1455" .
<http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:gene.1466>    rdfs:seeAlso    upid:P00457 .
upid:P00457     rdf:type        <http://identifiers.org/uniprot> .
upid:P00457     rdfs:seeAlso    up:P00457 .
up:P00457       dct:publisher   mir:MIR:00100134 .
upid:P00457     rdfs:seeAlso    tax:103690 .


課題

  • RefSeqID + geneラベルではgeneを一意に特定できないケースがある

tgupグラフにおいてgeneIDを"RefSeqID + geneのラベル"とした場合、対応するRefSeqデータのgeneが複数(locationだけ異なる)になる場合がある。
スタンザの引数で渡されるgeneIDが一意の値であることを前提として記述されたスタンザで不具合を引き起こす可能性が出てくる。



このようなgeneIDを指定した場合、ロケーションの違いにより

  • 一つのGeneに複数のUniprotIDが紐づくケースがある

この場合、TogoGenomeのレポートページでgeneが選択されると複数のProtein情報が出て来る事になる。
複数のUniprotIDを持つGeneリスト (以下は一部抜粋)

http://togogenome.org/gene/7227:NC_004354.4#feature:16455027-16533096:-1:gene.1920                                                                                  55
http://togogenome.org/gene/7227:NT_033778.4#feature:7317924-7381899:-1:gene.296                                                                                  53
http://togogenome.org/gene/46245:NC_009005.2#feature:5678520-5703408:-1:gene.775                                                                                  26
http://togogenome.org/gene/9606:NC_000024.10#feature:13248379-13480670:-1:gene.189                                                                                  22
http://togogenome.org/gene/180454:NT_078266.2#feature:37723747-37763186:-1:gene.2499                                                                                  20
http://togogenome.org/gene/10090:NC_000085.6#feature:22040865-22989897:1:gene.602                                                                                  20
http://togogenome.org/gene/46245:NC_009006.2#feature:16177937-16238434:1:gene.2414                                                                                  19
http://togogenome.org/gene/7227:NT_037436.4#feature:2377655-2499226:1:gene.366                                                                                  19

新規追加グラフ

・INSDCオントロジー
<http://togogenome.org/graph/insdc>

・AssemblyReportsデータ(インポートデータ選定用。Stanzaでは使用しない)
<http://togogenome.org/graph/assembly_report>

Gene Report

Protein names

スタンザファイル名:protein_names

PREFIX up: <http://purl.uniprot.org/core/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX taxonomy: <http://purl.uniprot.org/taxonomy/>

SELECT DISTINCT ?gene_name ?synonyms_name ?locus_name ?orf_name
FROM <http://togogenome.org/graph/uniprot>
FROM <http://togogenome.org/graph/tgup>
WHERE {
  <http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:gene.1466> ?p ?id_upid .
   ?id_upid rdfs:seeAlso ?protein .
   ?protein a <http://purl.uniprot.org/core/Protein> .

  # Gene names
  ?protein up:encodedBy ?gene .

  ## Name:
  OPTIONAL { ?gene skos:prefLabel ?gene_name . }

  ## Synonyms:
  OPTIONAL { ?gene skos:altLabel ?synonyms_name . }

  ## Ordered Locus Names:
  OPTIONAL { ?gene up:locusName ?locus_name . }

  ## ORF Names:
  OPTIONAL { ?gene up:orfName ?orf_name . }
}
PREFIX up: <http://purl.uniprot.org/core/>
PREFIX taxonomy: <http://purl.uniprot.org/taxonomy/>

SELECT DISTINCT ?recommended_name ?ec_name ?alternative_names ?organism_name ?parent_taxonomy_names
FROM <http://togogenome.org/graph/uniprot>
FROM <http://togogenome.org/graph/tgup>
WHERE {
  <http://togogenome.org/gene/103690:NC_003272.1#feature:1713396-1714283:-1:gene.1466> ?p ?id_upid .
   ?id_upid rdfs:seeAlso ?protein .
   ?protein a <http://purl.uniprot.org/core/Protein> ;
     up:organism ?tax_id .

  # Protein names
  ## Recommended name:
  OPTIONAL {
    ?protein up:recommendedName ?recommended_name_node .
    ?recommended_name_node up:fullName ?recommended_name .
  }

  ### EC=
  OPTIONAL { ?recommended_name_node up:ecName ?ec_name . }

  OPTIONAL {
    ?protein up:alternativeName ?alternative_names_node .
    ?alternative_names_node up:fullName ?alternative_names .
  }

  # Organism
  OPTIONAL { ?tax_id up:scientificName ?organism_name . }

  # Taxonomic identifier

  # Taxonomic lineage
  OPTIONAL {
    ?tax_id rdfs:subClassOf* ?parent_taxonomy .
    ?parent_taxonomy up:scientificName ?parent_taxonomy_names .
  }
}

JBrowse

Gene単位

locus tagからTaxonomyIDを取得するクエリ。引数gene_id:"slr0473"


表示範囲を取得するクエリ。引数gene_id:"slr0473"


JBrowseで発行するクエリはOrganismと同一

Organism単位

表示範囲の取得
最もlengthの長いsequenceを選択する


CDS
引数例:ref="NC_000911.1", start = 2784787, end = 2816352


tRNA,rRNA 252,253を入れ替える
引数例:ref="NC_000911.1", start = 1, end = 10000000


Genomic context

スタンザファイル名:genome_genomic_contex


Gene attributes

スタンザファイル名:gene_attributes


Nucleotide sequence

スタンザファイル名:nucleotide_sequences


Protein attributes

スタンザファイル名:protein_attributes


Protein sequence

スタンザファイル名:protein_sequences


Protein general annotation

スタンザファイル名:protein_general_annotation

PREFIX up: <http://purl.uniprot.org/core/>
PREFIX taxonomy: <http://purl.uniprot.org/taxonomy/>

SELECT DISTINCT ?name ?message
FROM <http://togogenome.org/graph/uniprot>
FROM <http://togogenome.org/graph/tgup>
WHERE {
    <http://togogenome.org/gene/1148:NC_000911.1#feature:7229-8311:1:gene.8> ?p ?id_upid .
    ?id_upid rdfs:seeAlso ?protein .
             ?protein a <http://purl.uniprot.org/core/Protein> ;
             up:annotation ?annotation .

    {

        # type がup:Annotation のアノテーション
        ?annotation rdf:type up:Annotation .

        # name, message の取得
        BIND(STR('Miscellaneous') AS ?name) .
        ?annotation rdfs:comment ?message .

    }UNION{

        # subClassOf Annotation で type が up:Subcellular_Location_Annotation のアノテーション
        ?type rdfs:subClassOf up:Annotation .
        ?annotation rdf:type up:Subcellular_Location_Annotation .

        # name, message の取得
        up:Subcellular_Location_Annotation rdfs:label ?name .
        ?annotation up:locatedIn ?located_in .
        ?located_in ?p ?location .
        ?location up:alias ?message .

    }UNION{

        # type が up:Subcellular_Location_Annotation 以外の subClassOf Annotation のアノテーション
        ?annotation rdf:type ?type .
        ?type rdfs:subClassOf up:Annotation .
        FILTER (?type != up:Subcellular_Location_Annotation)

        # name, message の取得
        ?type rdfs:label ?name .
        ?annotation rdfs:comment ?message .

    }
}


Protein ontologies

スタンザファイル名:protein_ontologies




Protein sequence annotation

スタンザファイル名:protein_sequence_annotation


Pfam plot

スタンザファイル名:protein_pfam_plot 旧スタンザファイル名:pfam_plot

  • Genomeの情報を取得

Genomeの情報はGenome plotの3クエリをそのまま使用する クエリ

  • 指定されたProteinに含まれるPfam名一覧を取得

  • 生物種毎に指定したPfamIDの数と種類数を取得

Orthologs

スタンザファイル名:protein_orthologs

  • UniProtIDを取得


  • Proteinのオーソログリストを取得

※このクエリはmbgdのエンドポイントへ投げる


Protein references

スタンザファイル名:protein_references


Protein cross references

スタンザファイル名:protein_cross_references

PREFIX up: <http://purl.uniprot.org/core/>
PREFIX taxonomy: <http://purl.uniprot.org/taxonomy/>

SELECT DISTINCT ?protein ?category ?abbr ?ref ?url_template
FROM <http://togogenome.org/graph/uniprot>
FROM <http://togogenome.org/graph/tgup>
WHERE {
    <http://togogenome.org/gene/1148:NC_000911.1#feature:7229-8311:1:gene.8> ?p ?id_upid .
    ?id_upid rdfs:seeAlso ?protein .
    ?protein a <http://purl.uniprot.org/core/Protein> ;
             rdfs:seeAlso    ?ref .
    ?ref      up:database     ?database .
    ?database up:category     ?category ;
              up:abbreviation ?abbr ;
              up:urlTemplate  ?url_template .
}

Protein reaction fgc list

スタンザファイル名:protein_reaction_fgc_list

  • locus_tagからuniprotIDを取得

共通クエリ

  • uniprotIDからEC_numberを取得

  • EC_numberからReactionを取得

※このクエリはreactionontologyのエンドポイントへ投げる ※reactionのデータは整備中


Organism Report

Organism names

スタンザファイル名:organism_names


Genome information

スタンザファイル名:genome_information
※RefSeqのlabelがNucleotideIDのラベル表現とdescriptionが混在していて、分けて欲しい

DEFINE sql:select-option "order"
PREFIX obo: <http://purl.obolibrary.org/obo/>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX insdc: <http://ddbj.nig.ac.jp/ontologies/nucleotide/>
PREFIX idtax: <http://identifiers.org/taxonomy/>
PREFIX togo: <http://togogenome.org/stats/>

SELECT  ?bioproject  ?bioproject_id ?refseq_version ?refseq_link  ?desc ?replicon_type ?sequence_length  #?p ?bioproject ?sequence_length 
 ?gene_cnt ?rrna_cnt ?trna_cnt ?other_cnt 
FROM <http://togogenome.org/graph/refseq>
FROM <http://togogenome.org/graph/so>
FROM <http://togogenome.org/graph/stats>
WHERE
{
  idtax:1148 rdfs:seeAlso ?bioproject .
  ?bioproject a insdc:BioProject ;
    rdfs:label ?bioproject_id .
  ?refseq_link insdc:dblink ?bioproject ;
    a insdc:Entry ;
    rdfs:label ?refseq_version ;
    rdfs:label ?desc ;
    insdc:sequence ?seq.
  ?seq rdfs:subClassOf/rdfs:label ?replicon_type ;
    insdc:sequence_length ?sequence_length .
  ?refseq_link  togo:gene ?gene_cnt ;
    togo:rrna ?rrna_cnt ;
    togo:trna ?trna_cnt ;
    togo:other ?other_cnt .
  FILTER regex(?refseq_version, "^((AC|AP|NC|NG|NM|NP|NR|NT|NW|XM|XP|XR|YP|ZP)_\\d+|(NZ\\_[A-Z]{2,4}\\d+))(\\.\\d+)?$") # due to multi data of refseq_link label
  FILTER (!regex(?desc, "^((AC|AP|NC|NG|NM|NP|NR|NT|NW|XM|XP|XR|YP|ZP)_\\d+|(NZ\\_[A-Z]{2,4}\\d+))(\\.\\d+)?$")) # due to multi data of refseq_link label
} ORDER BY ?bioproject_id ?refseq_version

Ortholog profile

スタンザファイル名:taxonomy_ortholog_profile
※このクエリはmbgdのエンドポイントへ投げる


Taxonomic information

スタンザファイル名:lineage_information

上位層


下位層


Culture collections

スタンザファイル名:organism_culture_collections


Medium

スタンザファイル名:organism_medium_information taxid「1351」のMedium情報
培地の基本情報を取得


medium classification


Phenotype information

スタンザファイル名:organism_phyenotype 旧スタンザファイル名:phenotype_information


Organism habitat

スタンザファイル名:organism_habitat


Genomic plot

スタンザファイル名:genome_plot 旧スタンザファイル名:taxonomy_plot

genomeサイズ + Organism Name + Phenotype


環境名(第一階層のみを取得)


Gene,rRNA,tRNA数の取得


Pathogen information

スタンザファイル名:organism_pathogen_information


Organism cross references

スタンザファイル名:organism_cross_references


Genome cross references

スタンザファイル名:genome_cross_references


Environment Report

Environment attributes

スタンザファイル名:environment_attributes


Inhabitants statistics

スタンザファイル名:environment_inhabitants_statistics


Inhabitants

スタンザファイル名:environment_inhabitants GOLD samples


Culture collections


Sampling places

スタンザファイル名:environment_geographical_map


Taxonomic composition

スタンザファイル名:environment_taxonomic_composition


Environment ontology

スタンザファイル名:environment_environmental_ontology


Nano stanza

共通クエリ

uniprot_id_from_togogenome(gene_id)

RefSeqのTaxonomy+LocusTagからUniProtIDを返すクエリ。


Nanoスタンザクエリ

その他

GGGenome用クエリ







				
				
個人用ツール