SPARQLthon28
提供:TogoWiki
2015年1月18日 (日) 10:56時点におけるRyotayamanaka (トーク | 投稿記録)による版
第28回 SPARQLthon を下記日程で開催したいと思います。
目次 |
開催概要
- 開催期間:2015年 1月15日(木) 10:00 〜 16日(金) 18:00
- 開催場所:ライフサイエンス統合データベースセンター (DBCLS) @ 東京大学 柏の葉キャンパス駅前 サテライト 6階
- アクセス:http://dbcls.rois.ac.jp/access
- 開催連絡:http://groups.google.com/group/biohackathon-jp メーリングリストにて
プロジェクト
TPP グループ全体
- ゲノム・メタゲノム情報統合による微生物DBの超高度化推進 (黒川)
- 昨日解析の終わった RNA-Seq の結果をどう RDF 化するか(オペロン etc.)→ アノテーションのエビデンスコード用の property (森)
- TopHat に食わせる GTF をゲノム RDF から生成, ゲノム RDF 用 FASTA のヘッダ行は前回合意 (藤沢)
- Cufflinks の GTF (FPKMの値など) の RDF 化に BH12 の gem が使えないか調査 (森・藤沢)
- MeGAP の解析結果を MicrobeDB.jp に流すデータフローでファイル形式と identifier を決める
- MicrobeDB.jp のキーワード検索に加え、欲しいデータにたどり着くための質問応答システムを設計 (森)
- 遺伝子、生物種、環境、表現系のレポートをたゆたうユーザーインターフェイスを作る
- 疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オミクスデータの統合 (菅野)
- EBI の variation RDF を参考に菅野研のデータを RDF 化する (河野)
- 植物ゲノム情報活用のための統合研究基盤の構築 (田畑)
- 生命と環境のフェノーム統合データベース (桝屋)
- 疾患:難病情報センターの難病データ、平成27年1月1日施行の難病法の指定難病一覧を LSD, Orphanet と英名で対応させる (矢田)
- ゼブラフィッシュ:ゲノムDB ZFIN と gene trap (トラップベクターが挿入された系統)の insertion site の配列情報から trans gene の情報を RDF で結合 (矢田)
- データ作成:コンソミックマウス系統と理研BRCのマウスの基本情報(系統名や遺伝子名や寄託者など)・属性情報(表現型など)を RDF 化 (高月)
- 生物種メタボロームモデル・データベースの構築 (有田)
- メタデータのデータベースMetabolonoteのUIの検討(櫻井・永野さん)
- 分子内チャージを持った化合物の抽出(櫻井)
- 山田さん時松さんにmolファイルのくわしい仕様を教えてもらった。O原子に+1価のチャージがあるものをCDKで抽出。KNApSAcKに512件、KEGGに98件、KEGGのは全部KNApSAcKにあった。今後チャージした分子として質量値から検索できるようにする。
- ゲノムとフェノタイプ・疾患・医薬品の統合データベース (金久)
- 個別化医療に向けたヒトゲノムバリエーションデータベース (徳永)
- 蛋白質構造データバンクの高度化と統合的運用 (中村)
- 糖鎖統合データベースおよび国際糖鎖構造リポジトリの開発 (成松)
- 糖鎖レポジトリの RDF 化がほぼ完了(木下・新町)
- 各糖鎖の構造を RDF のグラフで表現 (WURCS) → 部分構造検索を SPARQL で行うように
- WURCS RDF (木下、新町、青木、松原、山田)
- RDB である JCGGDB (Japan) の RDF 化したものを ACGGDB (Asia) として提供(産総研)
- GlycoProtDB の RDF 化は8割くらい完了(鈴木)
- GlycoFormDB の RDF 化はオントロジー作成中(鹿内)
- LfDB レクチンフロンティアDBの RDF 化はほぼ完了、更新システムを作成中(鈴木)
- 糖鎖データのエンドポイント http://glycoinfo.org/
化合物
- 天然物化合物 (時松、山田)
- 天然物の基本骨格(Skeleton)のデータベース化
- 当面、アルカロイドをターゲットに
- pseudoalkaloids の一部について、生合成経路・生合成単位の情報を含む骨格データを用意したので、それをもとに今後の方針を議論
- 個々の骨格の生合成単位の情報を機械可読にする方法の検討(山田)
- ChemBioDrawのCDXML形式データのフォーマットから、原子のXY座標、色、文字などを抽出したい。
- 生合成経路・生合成単位の情報を含むアルカロイド骨格情報の収集(時松)
- 個々の骨格の生合成単位の情報を機械可読にする方法の検討(山田)
- 天然物の基本骨格(Skeleton)のデータベース化
- 日化辞(櫛田)
各データベースの該当分野とモデル図
SPARQLthon グループ
- TogoGenome
- TogoGenome 真核版対応 (岡別府)
- データ更新中
- Gene を一意に決めるための URI をどうするか
- http://togogenome.org/gene/<refseq_id>:<gene_id> (gene_id は /locus_tag か /gene) とする
- locus_tag または gene が複数回出現している場合をチェックするデバッグコードを追加 (片山)
- 真核データ・グラフ対応でスタンザを更新する
- 守屋さん、永和さん部分はほぼ完了、上記 URI 変更に伴って再確認が必要
- RDF で taxonomy <-> sequence URI のリンクが抜けていたので obo:so_part_of を追加 (岡別府・藤沢・片山)
- GOLD Phenotype の RDF のデータ修正
- スクリプトのバグを修正した結果、対応がとれるものが増えた (川島)
- Phenotype レポートのスタンザを修正し取り込む
- 継続中
- 生物種リスト、遺伝子リストのスタンザを取り込む
- 生物種リストは、TogoGenome トップページが Gene/Organism ... などタブ化したので代用可能
- 遺伝子リストを生物種レポートページに埋め込むスタンザとしたい
- SPARQLthon27/StanzaMetadata (スタンザの JSON によるメタデータ記述) のための Stanza オントロジー を作成 (片山)
- これを用いて、スタンザメタデータを記述する JSON を JSON-LD/Turtle にしたい (片山)
- MicrobeDB.jp/CyanoBase で開発されているスタンザのカテゴリもオントロジーでカバーする (藤沢・森)
- TogoGenome 真核版対応 (岡別府)
- SparqlBuilder
- HCLS community プロファイル とメタデータ表現の調整
- HCLS のメタデータが最近更新されたこと、そのための SPARQL にバグがあるなど検証中 (山口)
- HCLS community プロファイル とメタデータ表現の調整
- SideEffect to Gene
- SideEffect to Gene (伊藤)
- TogoStanza(永野)
参考リンク
- これまでの SPARQLthon
参加者
- 片山俊明 (DBCLS)
- 川島秀一 (DBCLS)
- 小澤健太郎 (SGI) 15日のみ
- 岡別府陽子(MSS)
- 守屋勇樹(DBCLS)
- 永野朗夫(PENQE)
- 森宙史(東工大)15日のみ
- 伊藤真和吏 (NIBIO) 16日のみ
- 戀津魁(理研)
- 山口敦子 (DBCLS)
- 小林紀郎 (理研)
- 櫻井望(かずさDNA研)15日のみ
- 桝屋啓志(理研BRC)15日のみ
- 矢田有加里(理研BRC)15日のみ
- 高月照江(理研BRC)
- 藤澤貴智(遺伝研)
- 山本希(東工大)15日のみ
- 山田一作(野口研)15日AM&16日
- 大田達郎(DBCLS)
- 山本泰智(DBCLS)
- 木下聖子(創価大)15日AM
- 新町大輔(創価大)15日AM
- 青木信行(創価大)15日AM
- 山中遼太(先端研)
- 櫛田達矢(NBDC)15日のみ
- 時松敏明(DBCLS)15日のみ