PIERO

提供:TogoWiki

移動: 案内, 検索

目次

PIERO情報

ウェブページと論文

データ

PIEROとKCF-Sとの関係(SPARQLthon30

現状

  • 現在KCF-Sと呼んでいるもの
    • C1a-C1b-N1aとかのラベル = piero:kcfs
    • S00000123T とかのIDを与えた
  • 現在substructureと呼んでいるもの = piero:substructure
    • たとえば C00002 の 20-22-22 とかいう原子の並び
  • 現在KCFSDと呼んでいるもの
    • たとえば C00002 に S00000123T が 3個 とかを表したベクトル

理想

  • 個々の分子がMolfileとして持つ情報
    • 分子(kegg:compound) C00002 という分子
    • 分子中の原子(kegg:cpdatm) C00002:20 C00002:21 などの原子
    • 部分構造(kegg:kcfsatom) C00002:20-21 などの部分構造(原子情報付き)
    • 原子ラベル 分子中のどの原子が Carbon = C, Nitrogen = N なのか。
  • 個々の分子がKCFまたはKCF-Sとして持つ情報
    • 分子中のどの原子(kegg:cpdatom)がどのKEGGatomラベル(kegg:atom)を持つか
    • 分子中のどの部分構造(kegg:kcfsatom)がどのKCF-S(kcfs:id)を持つか
    • どの原子がどのKEGGatomラベルを持つか kcfs:cpdatmとkcfs:idの関係
    • どの部分構造がどのKCF-Sを持つか kcfs:subsatmとkcfs:idの関係
  • 一般的な定義(分子)
    • KEGGatom (kegg:atom) C1a, N1a など
    • KCFSlabel (kcfs:label) P1b-O1c など
    • KCFSid (kcfs:id) KEGGatomまたはKCFSlabelに与えられたID S00123Bなど
    • P1b は P1b-O1c に含まれる、などの包含関係 kcfs:idとkcfs:idの関係
    • KCFSatom (kcfs:kcfsatom)一般化したKCFS中でどの原子か指定するためのID たとえば S000123B:1 とか
  • 一般的な反応
    • C1a は C1b に変換される、などのアラインメント情報 kcfs:idとkcfs:idの関係
    • 一般化されたアラインメント(kcfs:idとkcfs:idの関係)の中でどの原子がどの原子になるか kcfs:kcfsatomとkcfs:kcfsatomの関係
    • C1a-C1b 結合が切断される、などの反応情報 kcfs:idとkcfs:idの関係
  • 具体的な反応
    • RP0000x において C0000x:12が C0000y:13になる kcfs:cpdatmとkcfs:cpdatmとの関係
    • RP0000x において C0000x:20-21 が C0000y:21-22になる kcfs:subsatom と kcfs:subsatom の関係(要らない可能性)

SPARQLthon30進捗

  • KCF-S部分構造間の階層関係
    @prefix piero:                   <http://reactionontology.org/piero/> .
    @prefix kegg:                    <http://www.kegg.jp/entry/> .
    @prefix rdfs:                    <http://www.w3.org/2000/01/rdf-schema#> .
    @prefix kcfs:                    <http://reactionontology.org/piero/kcfs#> .
    
    # 原子環境の階層関係
    kcfs:S00000002A rdfs:label "C" .
    kcfs:S00000002A rdfs:subClassOf kcfs:ATOM .
    
    kcfs:S00000011A rdfs:label "C8" .
    kcfs:S00000011A rdfs:subClassOf kcfs:S00000002A .
    
    kcfs:S00000015A rdfs:label "C8y" .
    kcfs:S00000015A rdfs:subClassOf kcfs:S00000011A .
    
    kcfs:S00000019A rdfs:label "C8x" .
    kcfs:S00000019A rdfs:subClassOf kcfs:S00000011A .
    
    #部分構造の階層関係
    kcfs:S00000039R rdfs:label               "C-C-C-C-C-C" .
    kcfs:S00000039R rdfs:subClassOf     kcfs:RING .
    kcfs:S00000151S rdfs:label               "C-C-C-C-C-C" .
    kcfs:S00000151S rdfs:subClassOf     kcfs:SKELETON .
    
    kcfs:S00000058R rdfs:label              "C8-C8-C8-C8-C8-C8" .
    kcfs:S00000058R rdfs:subClassOf    kcfs:S00000039R .
    
    kcfs:S00000740S rdfs:label              "C8-C8-C8-C8-C8-C8" .
    kcfs:S00000740S rdfs:subClassOf     kcfs:S00000151S .
    
    kcfs:S00000225R rdfs:label              "C8x-C8x-C8y-C8x-C8y-C8y" .
    kcfs:S00000225R rdfs:subClassOf    kcfs:S00000058R .
    
    kcfs:S00002241S rdfs:label              "C8x-C8x-C8y-C8x-C8y-C8y" .
    kcfs:S00002241S rdfs:subClassOf    kcfs:S00000740S .
    
    #部分構造の含有関係
    kcfs:S00000225R piero:hasPart kcfs:S00000019A .
    kcfs:S00000225R piero:hasPart kcfs:S00000015A .
    kcfs:S00000225R piero:hasPart kcfs:S00000017B .
    kcfs:S00000225R piero:hasPart kcfs:S00000048B .
    kcfs:S00000225R piero:hasPart kcfs:S00000028B .
    kcfs:S00000225R piero:hasPart kcfs:S00000043T .
    kcfs:S00000225R piero:hasPart kcfs:S00000032T .
    kcfs:S00000225R piero:hasPart kcfs:S00000077T .
    kcfs:S00000225R piero:hasPart kcfs:S00000072T .
  • 具体的な化合物中のKCF-S部分構造 [[1]]
    @prefix piero:                   <http://reactionontology.org/piero/> .
    @prefix kegg:                    <http://www.kegg.jp/entry/> .
    @prefix rdfs:                    <http://www.w3.org/2000/01/rdf-schema#> .
    @prefix kcfs:                    <http://reactionontology.org/piero/kcfs#> .
    
    # 化合物ID
    kegg:C00220 rdfs:label "C00220" .
    kegg:C00220 rdfs:subClassOf kegg:compound .
    
    # 化合物が持つ原子の記述
    kegg:C00220 piero:hasCpdAtom kegg:C00220_A4 .
    kegg:C00220_A4 rdf:type kcfs:S00000019A .
    kegg:C00220 piero:hasCpdAtom kegg:C00220_A6 .
    kegg:C00220_A6 rdf:type kcfs:S00000019A .
    kegg:C00220 piero:hasCpdAtom kegg:C00220_A10 .
    .....
    kegg:C00220 piero:hasCpdAtom kegg:C00220_A2 .
    kegg:C00220_A2 rdf:type kcfs:S00000015A .
    kegg:C00220 piero:hasCpdAtom kegg:C00220_A7 .
    kegg:C00220_A7 rdf:type kcfs:S00000015A .
    
    # 化合物が持つ部分構造の記述
    kegg:C00220 piero:hasCpdRing kegg:C00220_R1 .
    kegg:C00220_R1 piero:hasCpdAtom kegg:C00220_A6 .
    kegg:C00220_R1 piero:hasCpdAtom kegg:C00220_A10 .
    kegg:C00220_R1 piero:hasCpdAtom kegg:C00220_A8 .
    kegg:C00220_R1 piero:hasCpdAtom kegg:C00220_A4 .
    kegg:C00220_R1 piero:hasCpdAtom kegg:C00220_A1 .
    kegg:C00220_R1 piero:hasCpdAtom kegg:C00220_A2 .
    kegg:C00220_R1 rdf:type kcfs:S00000225R .
    .....
    kegg:C00220 piero:hasCpdRing kegg:C00220_R2 .
    kegg:C00220_R2 piero:hasCpdAtom kegg:C00220_A13 .
    kegg:C00220_R2 piero:hasCpdAtom kegg:C00220_A17 .
    kegg:C00220_R2 piero:hasCpdAtom kegg:C00220_A14 .
    kegg:C00220_R2 piero:hasCpdAtom kegg:C00220_A11 .
    kegg:C00220_R2 piero:hasCpdAtom kegg:C00220_A7 .
    kegg:C00220_R2 piero:hasCpdAtom kegg:C00220_A9 .
    kegg:C00220_R2 rdf:type kcfs:S00000225R .
    .....
    kegg:C00220 piero:hasCpdRing kegg:C00220_R3 .
    kegg:C00220_R3 piero:hasCpdAtom kegg:C00220_A13 .
    kegg:C00220_R3 piero:hasCpdAtom kegg:C00220_A17 .
    kegg:C00220_R3 piero:hasCpdAtom kegg:C00220_A14 .
    kegg:C00220_R3 piero:hasCpdAtom kegg:C00220_A11 .
    kegg:C00220_R3 piero:hasCpdAtom kegg:C00220_A7 .
    kegg:C00220_R3 piero:hasCpdAtom kegg:C00220_A3 .
    kegg:C00220_R3 piero:hasCpdAtom kegg:C00220_A1 .
    kegg:C00220_R3 piero:hasCpdAtom kegg:C00220_A2 .
    kegg:C00220_R3 piero:hasCpdAtom kegg:C00220_A5 .
    kegg:C00220_R3 piero:hasCpdAtom kegg:C00220_A9 .
    kegg:C00220_R3 rdf:type kcfs:S00033119R .
  • 酵素反応中の基質・生成物ペア (RPAIR; ReactantPair) における化合物アラインメント
    @prefix piero:                   <http://reactionontology.org/piero/> .
    @prefix kegg:                    <http://www.kegg.jp/entry/> .
    @prefix rdfs:                    <http://www.w3.org/2000/01/rdf-schema#> .
    @prefix kcfs:                    <http://reactionontology.org/piero/kcfs#> .
    
    # 水素化・脱水素化反応の例
    kegg:RP00001 a piero:ReactantPair ; 
    kegg:RP00001 piero:hasAlignment piero:RP00001_A1 .
    kegg:RP00001 piero:hasSubstrate kegg:C00005 .
    kegg:RP00001 piero:hasProduct   kegg:C00006 .
    piero:RP00001_A1 a piero:Alignment .
    piero:RP00001_A1 piero:hasAlignedAtomPair [
      piero:hasAlignedAtomInSubstrate kegg:C00005_A1 ;
      piero:hasAlignedAtomInProduct   kegg:C00006_A1 
      ], [
      piero:hasAlignedAtomInSubstrate kegg:C00005_A2 ;
      piero:hasAlignedAtomInProduct   kegg:C00006_A2 
      ], [
    .....
      ], [
      piero:changingAtomLabelInSubstrate kegg:C00005_A41 ;
      piero:changingAtomLabelInProduct   kegg:C00006_A41 ;
      piero:hasAlignedAtomInSubstrate kegg:C00005_A41 ;
      piero:hasAlignedAtomInProduct   kegg:C00006_A41 
      ], [
      piero:changingAtomLabelInSubstrate kegg:C00005_A42 ;
      piero:changingAtomLabelInProduct   kegg:C00006_A42 ;
      piero:hasAlignedAtomInSubstrate kegg:C00005_A42 ;
      piero:hasAlignedAtomInProduct   kegg:C00006_A42 
      ], [
      ] .
    
    # それ以外の反応の例
    kegg:RP00003 a piero:ReactantPair ; 
    kegg:RP00003 piero:hasAlignment piero:RP00003_A1 .
    kegg:RP00003 piero:hasSubstrate kegg:C00002 .
    kegg:RP00003 piero:hasProduct   kegg:C00008 .
    piero:RP00003_A1 a piero:Alignment .
    piero:RP00003_A1 piero:hasAlignedAtomPair [
      piero:hasReactionCenterInSubstrate kegg:C00002_A25 ;
      piero:hasReactionCenterInProduct   kegg:C00008_A26 ;
      piero:hasEliminatingBondInSubstrate kegg:C00002_B11 
      ], [
      piero:hasAlignedAtomInSubstrate kegg:C00002_A1 ;
      piero:hasAlignedAtomInProduct   kegg:C00008_A1 
      ], [
      piero:hasAlignedAtomInSubstrate kegg:C00002_A2 ;
      piero:hasAlignedAtomInProduct   kegg:C00008_A2 
      ], [
      .....
      ].
    
    kegg:RP00007 a piero:ReactantPair ; 
    kegg:RP00007 piero:hasAlignment piero:RP00007_A1 .
    kegg:RP00007 piero:hasSubstrate kegg:C00010 .
    kegg:RP00007 piero:hasProduct   kegg:C00024 .
    piero:RP00007_A1 a piero:Alignment .
    piero:RP00007_A1 piero:hasAlignedAtomPair [
      piero:hasReactionCenterInSubstrate kegg:C00024_A48 ;
      piero:hasReactionCenterInProduct   kegg:C00010_A48 ;
      piero:hasGeneratingBondInProduct kegg:C00024_B6 
      ], [
      piero:hasAlignedAtomInSubstrate kegg:C00010_A1 ;
      piero:hasAlignedAtomInProduct   kegg:C00024_A1 
      ], [
      piero:hasAlignedAtomInSubstrate kegg:C00010_A2 ;
      piero:hasAlignedAtomInProduct   kegg:C00024_A2 
      ], [
    .....
    ] .
    
    kegg:RP00221 a piero:ReactantPair ; 
    kegg:RP00221 piero:hasAlignment piero:RP00221_A1 .
    kegg:RP00221 piero:hasSubstrate kegg:C00143 .
    kegg:RP00221 piero:hasProduct   kegg:C00440 .
    piero:RP00221_A1 a piero:Alignment .
    piero:RP00221_A1 piero:hasAlignedAtomPair [
      piero:hasReactionCenterInSubstrate kegg:C00143_A4 ;
      piero:hasReactionCenterInProduct   kegg:C00440_A10 ;
      piero:hasOpeningBondInSubstrate kegg:C00143_B10 
      ], [
      piero:hasAlignedAtomInSubstrate kegg:C00143_A1 ;
      piero:hasAlignedAtomInProduct   kegg:C00440_A5 
      ], [
      .....
      ] .
    
    kegg:RP00249 a piero:ReactantPair ; 
    kegg:RP00249 piero:hasAlignment piero:RP00249_A1 .
    kegg:RP00249 piero:hasSubstrate kegg:C00265 .
    kegg:RP00249 piero:hasProduct   kegg:C01119 .
    piero:RP00249_A1 a piero:Alignment .
    piero:RP00249_A1 piero:hasAlignedAtomPair [
      piero:hasReactionCenterInSubstrate kegg:C01119_A1 ;
      piero:hasReactionCenterInProduct   kegg:C00265_A8 ;
      piero:hasClosingBondInProduct kegg:C01119_B8 
      ], [
      piero:changingAtomLabelInSubstrate kegg:C00265_A1 ;
      piero:changingAtomLabelInProduct   kegg:C01119_A4 ;
      piero:hasAlignedAtomInSubstrate kegg:C00265_A1 ;
      piero:hasAlignedAtomInProduct   kegg:C01119_A4 
      ], [
      .....
      ] .

懸案

PIEROの構成の見直し(SPARQLthon33)

RDF化ガイドラインに沿う形に

PIEROオントロジー

  • 3つのsub-ontologiesに分ける

PIERO Reaction ontology

  • Reaction = 反応式全体
  • 概念に対する名前と、個別の反応に対する名前の区別
    • 「加水分解」(概念)>「アミド結合の加水分解」(概念)>「ほにゃららアミド分子中のアミド結合の加水分解」(個別の反応)
  • 「個別の反応」= instance ? (違うと思うけど)
  • piero:RN00001

PIERO Transformation ontology

  • Transformation = 基質・生成物の対応関係
  • 概念に対する名前と、個別のtransformationに対する名前の区別
    • 「C-N結合をC-O結合に変換するtransformation」(概念)>「アミド結合をカルボン酸に変換するtransformation」(概念)>「ほにゃららアミド分子をほにゃらら酸分子に変換するtransformation」(個別のtransformation)
  • 「個別のtransformation」= instance ? (違うと思うけど)
  • piero:TR00001
    • 現行の transformation.ttl と substructure_conversion.ttl はほとんど同じ内容を扱っていて、substructure_conversion.ttl は古いので廃棄していいかも。

PIERO Substructure ontology

  • Substructure = 化学部分構造
  • 概念に対する名前と、個別のsubstructureに対する名前の区別
    • 「芳香環」(概念)>「炭素原子(と水素原子)のみから成る芳香環」(概念)>「5つのC8xと1つのC8yから成る芳香環」(個別のsubstructure)
  • piero:S00001A
  • kcfsの構造は別のオントロジーにするか、substructureに含めるか?
    • 現行の substructure.ttl と kcfs.ttl はほとんど同じ内容を扱っているが、両者とも廃棄。kgcpd_kcfs.ttl kgdrg_kcfs.ttl knapsack_kcfs.ttl から新規に作るのが一番いい。

データベース

  • オントロジーとデータをしっかり区別する。
  • 「piero:」を使う時は、オントロジーをさす。「piero:hasReaction」とかは、データ間の関係を表すので別prefixを考える
    • 「pink:」(piero-link)とか?
  • データベースをどのようにスタンザ等で見れたら嬉しいのか?
    • EC番号(または遺伝子)を入力すると、EC番号だけでは共通点を見いだせないが反応パターン(RPまたはRCまたはRDM)を共有する他のEC番号(または遺伝子)をリストアップする、とか。

現行データに何が書かれているか整理(turtle files v0.4)

概念とその分類 (piero:)

  • PIERO transformation ontology
    • transformation語彙とその分類 http://reactionontology.org/ttl/transformation.ttl
      • 予定:piero:hasParent > rdfs:subClassOf。piero:hasChild の削除
    • 部分構造変換RDM とその分類 http://reactionontology.org/ttl/rdm.ttl
      • 予定:他と揃えるために ID を付ける
      • RDMとCONVとFROMの定義とtype分けは?
    • RPAIR内の原子対応関係 http://reactionontology.org/ttl/rpair_alignment.ttl
      • 予定:kegg:C00005_A1 などの rdf:type
      • これは DB では? piero:hasAlignment とかは piero: でも pink: でも無く KEGG データベースを記述するオントロジーになるのかも
      • piero: とそれ以外、という風に分けるなら、pink: という名前は変だけど
  • PIERO substructure ontology
    • 部分構造の階層分類 http://reactionontology.org/ttl/kcfs.ttl
      • データが古くてIDが付いておらず、新規ttlと整合性がない
      • 予定:現在 kgcpd_kcfs.ttl, kgdrg_kcfs.ttl に重複して記述されている "KCF-S部分構造間の階層関係" の部分をIDごと、この kcfs.ttl にもってくる
    • 部分構造間の包含関係 http://reactionontology.org/ttl/kcfs-substructure.ttl
      • 予定:substructure.ttl がディスコンなんで、これもディスコンですか? > 小寺さん


PIERO で用いる ID 間の link (pink:)

  • 予定:piero: から pink: になる部分を piero.ttl から抜き出して pink.ttl を作成
  • 内部データ間の関係

KEGG (kegg:)

廃棄予定

不明

PIERO概略と語彙の整理(SPARQLthon39)

PIERO基本方針

  • PIEROの反応名は系統名(Systematic Name)を利用する。慣用名(Trivial Name)の多くは意味に曖昧さを含む。
    • 例:phosphorylation (慣用名)のほとんどは phospho-de-hydro-substitution (系統名)だが、phospho,hydro-addition (系統名)の場合もある。
  • 遺伝子オントロジーによる遺伝子の分類に3つのカテゴリー(biological process(生物学的プロセス)、cellular component(細胞の構成要素)、molecular function(分子機能))があるように、PIEROによる酵素反応分類には下記のカテゴリーを考える。
    • 生成・切断する結合の種類による分類
      • 置換反応(Substitution)
        • 例:Chloro-de-hydro-substitution etc.
      • 付加反応(Addition)※二重結合に何かが結合して単結合を生成する反応
        • 例:Chloro,hydro-addition etc.
      • 脱離反応(Elimination)※付加反応の逆反応
        • 例:Chloro,hydro-elimination etc.
      • 挿入反応(Insertion)
        • 例:Oxygen-insertion etc.
    • 転移される基に基づいた分類
      • 転移される基の種類に基づいた分類(glycosyl-transfer, acyl-transferなど)
      • 転移される基から見て何の置換が起こったかという分類(acyl-exchangeなど)
    • 生成される基・生成物に基づいた分類
      • 例:Esterification (ester formation), amidation, hydroxylation, O-acylation, etc.
    • 開環反応か閉環反応か、そのいずれでもないか。
      • 一分子開環・閉環反応
      • 多分子開環・閉環反応
      • そのいずれでもない反応
    • 分子内転移反応か、そうではないか。
      • 分子内転移反応(rearrangement)
        • 例:Phospho-rearrangement, methyl-rearrangement, etc.
      • 環拡張反応、環縮小反応
        • たとえば糖の6員環が5員環になる反応
        • 例:Ring contraction, ring expansion, etc
      • そのいずれでもない反応
    • 結果的に組成式が変化するか否か
      • 組成式の変化しない反応(異性化反応)
      • 組成式の変化する反応
    • 多段階反応か否か
      • 多段階反応には multi-step のフラグを付ける。
/mw/PIERO」より作成