MicrobeDB.jpポータル開発
提供:TogoWiki
(版間での差分)
(→MEOIDアサインのポータルサイト組込みの仕様案) |
|||
167行: | 167行: | ||
* ミヤコグサGenBank→RDF開発(w/PGDBj)(平川さん) | * ミヤコグサGenBank→RDF開発(w/PGDBj)(平川さん) | ||
* 根粒菌データベースRhizoBase/JBrowse作成中(藤澤) | * 根粒菌データベースRhizoBase/JBrowse作成中(藤澤) | ||
+ | |||
+ | == SPARQLthon65 == | ||
+ | * MeGAP解析アップロード→ファセット検索→ 比較解析スタンザ(藤澤、岡別府、渡辺) | ||
+ | * RDF→Elasticsearch検索インデックスデータ生成(藤澤) |
2018年2月15日 (木) 01:26時点における版
目次 |
H29年度マイルストーン
- MicrobeDB.jp top page差し替え
- 期限: MicrobeDB.jp論文submitまで
- 期限(日付): 2018年1月上旬?
- 理由: 論文の図で差し替え予定のtop pageの画像を使っている
- MicrobeDB.jp HTTPS→HTTPリダイレクト設定
- 期限: MicrobeDB.jp論文submitまで
- 期限(日付): 2018年1月上旬?
- 理由: https://microbedb.jp URLの論文記載目的
- MicrobeDB.jpヘルプページの稼働
- 期限: MicrobeDB.jp論文submitしてから査読に回るまで?
- 期限(日付): 2018年1月中旬?
- 理由: Helpページがないとそれだけでrejectになる
- MicrobeDB.jp ポータルサイトのプレリリース
- 期限: 日本ゲノム微生物学会まで
- 期限: 2018年3月7日
- 理由: ゲノ微(3/7)でMicrobeDB.jpの講習会をする
- MicrobeDB.jp ポータルサイトHTTPS化
- 期限: 日本ゲノム微生物学会まで
- 期限: 2018年3月7日
- 理由: ゲノ微(3/7)でMicrobeDB.jpの講習会をする
- ポータルサイトへ移行
- 期限: 論文アクセプト後
- 期限: 2018年4月中をめどに
- 理由: ポータル公開を予告しているため
SPARQLthon59
DFAST - MBGD - MDBフローについて
- MBGDでCluster IDをアサインするAPIサーバを立てて、ポータル側はクライアントとしてCDS fastaをPOSTして、結果を受け取る方針
DFAST生成GenBank2RDF
- 非公開データのゲノムRDF変換について、MDBでの対応検討
INSDC | MDB | ||
---|---|---|---|
insdc:Entry | http://identifiers.org/insdc/AE006470.1 | mdb:Entry | |
insdc:Taxonomy | http://identifiers.org/taxonomy/194439 | insdc:Taxonomy | http://identifiers.org/taxonomy/194439 |
insdc:BioProject | http://identifiers.org/bioproject/PRJNA302 | mdb:BioProject | |
insdc:BioSample | http://identifiers.org/biosample/SAMN02604006 | mdb:BioSample | |
insdc:Gene | http://identifiers.org/insdc/AE006470.1#feature:2-1126:-1:gene.1 | ||
insdc:locus_tag | "CT0001" |
- taxonomy関連情報の取得のためSPARQListを利用してAPI試作【~SPARQLthon59】
- ValidなGenBankファイルの情報を取得するためのtaxonomy.ttl更新および修正 【~SPARQLthon60】
- Division、GenBank hidden flagのトリプルを追加のためのコンバーター拡張 https://github.com/ddbj/rdfsummit/commit/5723ff76da744521d5f1a26d9967a544af8f3187
- 残作業
- exact match複数件ヒットの対応
- divsionのセマンティクス問題 Homo sapiens { DDBJ => 'HUM', NCBI => 'PRI' }
SPARQLthon60
比較解析スタンザナビゲーションの高度化
- 検索性の向上、インターフェースの改良→BioSample RDF/メタゲノムサブセットの取得方法について
- 情報共有していただいたDBCLS punk API について利用の検討【Todo】
- プライベートデータに対してのMEO、MDBVアノテーション(オントロジーマッピング)およびRDF変換の自動化の必要性
SPARQLthon61
ホロゲノム解析支援ツール開発
- 開発方針としては、MDB比較解析スタンザ+ホロゲノム解析のための拡張
- メタゲノム解析データを検索しやすくするためのファセットナビゲーションも合わせて開発 ←比較解析スタンザナビゲーションの高度化
ホロゲノム関連RDF
- Host, Symbiont, Holobiontのゲノム関係情報の記述はMDBVで →管理、拡張のためレポジトリを移動する【Todo】
- Holobiontの定義されているオントロジーなし
差分更新系の調査
- 各グラフ単位のRDFデータセット生成フローの確認
- Stats情報の自動取得およびMicrobeDB.jpが利用しているRDFの依存関係調査を目的としてSPARQLbuilder/metadata生成→umakaviewerを試用 → SPARQLthon61/MicrobeDB.jp-Umakaviewer
- INSDC/BioProjectはDBCLS punk APIが生成するRDFバルクに置き換える方向で
認証サーバtauth
- OpenID connectインターフェースのクライアント実装(Ruby, Perl) 【Todo】
- 認証サーバ用に、無料で使えるSSL証明を取得する https://letsencrypt.org 【Todo】
→ Global Sign Open Source Projectも無料で利用できる
菌類RNA-Seq RDF
- RNA-Seq RDF関連情報 http://wiki.lifesciencedb.jp/mw/SPARQLthon28/Cufflinks2RDF
- 解析に利用されている遺伝子IDはRefSeq/NCBI GeneID
- NCBI GeneIDはゲノムRDFと接続のためにidentifiers.orgで記述する
→ データモデルができたら川島さん査定をお願いする、ExpressionAtlas, IHEC に既存モデルがあるかも。
SPARQLthon62
認証サーバTAuth
- OpenID connectインターフェースのSinatraクライアントで接続テスト(藤澤)
- google OpenID Connect認証動作確認→ tauthエンドポイント差し替え+パラメーター微調整
- 有効期限切れ*.annotation.jp SSL証明をletsencrypt取得 ← いまここ
BH17.11
- 論文投稿+講習会+ポータルサイト公開に向けたマイルストーンとユースケースのシナリオ作成
- スタンザヘルプ+ドキュメント書き
- ポータルサイト開発
- ユーザ・グループ認証サーバセットアップ
- メタゲノム解析データ可視化ツールLEAのAPI実行テスト
- プライベートゲノム・メタゲノム解析データのRDF変換系組込み
- DFAST生成GenBank2RDF、MBGDバージョン等のID体系の確認
- DDBJ Pipeline生成MeGAP2RDF
- BioSampleからMEO自動アノテーション準備
- スタンザのhttps化
- MBGD高精度解析サービス(開発予定)へのユーザ認証・データ連携の準備
SPARQLthon63
- MEOID自動アサインとポータルサイト組込み方法の検討
- 鈴木さん作のツールの動作確認(森)
- DDBJ BioSample Package - MEO IDマッピング(森)
MEOIDアサインのポータルサイト組込みの仕様案
- APIでTSVファイルPOST、レスポンス Sample_ID, MEO_id, MEO_label取得なJSON
- MEOアサイン
- DDBJ biosample package→ MEO(AutoAnnotation)
- env_* attribute → EnvO → MEO(AutoAnnotation)
- 鈴木さんツール→ MEO(AutoAnnotation)
- 自動アサインMEO → ユーザが選別したMEO (CuratedAnnotation)
- EBI BioSample RDFに習ったデータモデル(案)
- 来年度公開データも同じ仕様でアサイン予定
<uuid> rdf:type, mdbv:MEOAnnotation, owl:NamedIndividual ; mdbv:score "100.0"^^xsd:double ; dc:creator "MDB API"^^xsd:string ; oac:hasBody <http://purl.jp/bio/11/meo/MEO_0000422> ; oac:hasTarget <http://microbedb.jp/resource/MDB00001#Sample> . <uuid> rdf:type, mdbv:MEOManualAnnotation, owl:NamedIndividual ; mdbv:score "100.0"^^xsd:double ; dc:creator "submitter"^^xsd:string ; oac:hasBody <http://purl.jp/bio/11/meo/MEO_0000422> ; oac:hasTarget <http://microbedb.jp/resource/MDB00001#Sample> .
ドキュメント管理
- MicrobeDB.jpドキュメント管理のためにGitHub pages利用提案
- (参考)CyanoBaseの例 https://cyanobase.github.io/document/#about-cyanobase
ホロゲノム解析支援ツール
- ミヤコグサGenBank→RDF開発(w/PGDBj)(平川さん)
- 根粒菌データベースRhizoBase/JBrowse作成中(藤澤)
SPARQLthon65
- MeGAP解析アップロード→ファセット検索→ 比較解析スタンザ(藤澤、岡別府、渡辺)
- RDF→Elasticsearch検索インデックスデータ生成(藤澤)