SPARQLthon40
提供:TogoWiki
(版間での差分)
(→SPARQLthon グループ) |
(→SPARQLthon グループ) |
||
107行: | 107行: | ||
* JSTシソーラス高度化(改訂)に向けた「法造」の機能拡張(古崎・櫛田) | * JSTシソーラス高度化(改訂)に向けた「法造」の機能拡張(古崎・櫛田) | ||
* 日化辞とKNApSAcKのID対応の立体異性問題について調査(時松) | * 日化辞とKNApSAcKのID対応の立体異性問題について調査(時松) | ||
- | * | + | * 化合物の分子構造のInChIからトリプルを生成するスクリプトの修正とSPARQLによるデータ取得(山田) |
+ | ** 修正したスクリプトでつくったRDFをVirtuosoに入れ、必要な情報をSPARQLクエリで取得できることを確認した。KNApSAcKデータには同位体を含む分子がない(たぶん)ためIsotopic_*のデータは0件でした。 | ||
+ | <pre> | ||
+ | prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> | ||
+ | prefix dcterms: <http://purl.org/dc/terms/> | ||
+ | prefix sio: <http://semanticscience.org/resource/> | ||
+ | prefix inchi: <http://glyconavi.org/inchi/> | ||
+ | |||
+ | SELECT DISTINCT ?id ?Version ?inchi ?inchikey ?value ?key_value | ||
+ | FROM <http://www.glyconavi.org/SPARQLthon40/iupac-inchi/KNApSAcK> | ||
+ | WHERE { | ||
+ | ?s dcterms:identifier ?id . | ||
+ | ?s sio:CHEMINF_000200 [ sio:SIO_000300 ?inchi ; rdf:type sio:CHEMINF_000396 ] . | ||
+ | ?s sio:CHEMINF_000200 [ sio:SIO_000300 ?inchikey ; rdf:type sio:CHEMINF_000399 ] . | ||
+ | ?s sio:CHEMINF_000200 / inchi:Version ?Version . | ||
+ | |||
+ | # inchi:Connections | ||
+ | # inchi:H_atoms | ||
+ | # inchi:Main_layer | ||
+ | # inchi:Charge | ||
+ | # inchi:Protons | ||
+ | # inchi:Charge_layer | ||
+ | # inchi:Stereo_dbond | ||
+ | # inchi:Stereo_sp3 | ||
+ | # inchi:Stereo_sp3_inverted | ||
+ | # inchi:Stereo_type | ||
+ | # inchi:Stereo_layer | ||
+ | #0 inchi:Isotopic_atoms | ||
+ | #0 inchi:Isotopic_exchangeable_H | ||
+ | #0 inchi:Isotopic_stereo_dbond | ||
+ | #0 inchi:Isotopic_stereo_sp3 | ||
+ | #0 inchi:Isotopic_stereo_sp3_inverted | ||
+ | #0 inchi:Isotopic_stereo_type | ||
+ | # inchi:Isotopic_layer | ||
+ | |||
+ | ?s sio:CHEMINF_000200 / sio:SIO_000028 / sio:SIO_000028 [ rdf:type inchi:Connections ; sio:SIO_000300 ?value ] . | ||
+ | |||
+ | #0 inchi:Skeleton | ||
+ | #0 inchi:Stereo_isotopic_substitution_information | ||
+ | #0 inchi:Kind_of_InChIKey | ||
+ | #0 inchi:InChI_version | ||
+ | #0 inchi:Number_of_protons | ||
+ | ?s sio:CHEMINF_000200 / sio:SIO_000028 [ rdf:type inchi:Number_of_protons ; sio:SIO_000300 ?key_value ] . | ||
+ | |||
+ | } | ||
+ | LIMIT 1 | ||
+ | </pre> | ||
* 転写因子ネットワーク推定ツールをDockerにラップしてwebappにしました -> アウトプットはd3jsでヒートマップ描画などする予定ですが、その間の計算結果をJSON-LDでexportしたい (おおた) | * 転写因子ネットワーク推定ツールをDockerにラップしてwebappにしました -> アウトプットはd3jsでヒートマップ描画などする予定ですが、その間の計算結果をJSON-LDでexportしたい (おおた) | ||
* SPARQL Builder(山口,戀津,古崎,山本) | * SPARQL Builder(山口,戀津,古崎,山本) |
2016年1月15日 (金) 03:06時点における版
第40回 SPARQLthon を下記日程で開催したいと思います。SPARQLthon初の、関西での開催です。奮ってご参加ください。
目次 |
開催概要
日時と会場
- 開催期間:2016年 1月14日(木) 10:00 ~ 15日(金) 18:00
- 開催場所:京都大学化学研究所バイオインフォマティクスセンター @ 京都大学宇治キャンパス 総合研究実験棟 2階 CB207
- キャンパスへのアクセス:jpg簡略版 pdf詳細版 宇治キャンパスへのアクセス
- 最寄り駅はJR奈良線・黄檗(おうばく)駅です。京阪電車宇治線・黄檗駅はもう少し距離があります(共に徒歩圏内です)。
SPARQL講習会
SPARQLthon 初の関西での開催になることもあり、SPARQLの入門的な講習会を行います。
- 開催日時:2016年 1月14日(木)15:00〜16:00
- 講師:片山俊明、川島秀一
- タイトル:SPARQL入門
- 内容:SPARQLの入門的な解説。SPARQLを学習するのに必要な、最小限のRDFやオントロジーについての解説も含みます。実際のエンドポイントを利用したハンズオンセミナーも行いますのでその部分に参加する場合は、ご自分のPCを持参して下さい(SPARQLthon 参加者を想定しているので、PC持参は前提になります)。参加者のレベルに応じて、適宜、質疑応答中心の内容に変わるかもしれません。
- 参考図書:オープンデータ時代の標準Web API SPARQL インプレス刊
- SPARQLthon40HandsOnSeminar
昼食など
- 吉田キャンパス(メインキャンパス)と違って、宇治キャンパス周辺の飲食店は多くありません。但し、構内にはレストランとセブン・イレブン、及び生協の売店・食堂があります。
- レストラン(「きはだ」)は、本館3階につながっているウッドデッキ(正門左手、Google Sreet View)から入場できる「ハイブリッドスペース」に隣接しています。ハイブリッドスペースは「おうばくプラザ」(2015年10月のJSBi(IIBMP)会場)に隣接しています(見取り図参照)。
- セブン・イレブンは、ハイブリッドスペースの真下1階にあります。
- 参考:pdf版・宇治キャンパス周辺マップ
- 化学研究所アクセス関係ページ
- 生協食堂&売店は、このpdf版マップの緑色マル6で、会場(緑色マル4)からは近い位置にあります。
- なお、2015年初夏にキャンパス(おうばくプラザ)の真向かいに移転してきたパン屋(「たま木亭」)は人気店です(ランキング)。
- 2015年12月中旬時点で、Google Mapには旧店舗と新店舗の両方が記載され、Street Viewも新店舗完成前の工事中の画像が使用されています。
ホテルと交通手段について(参考情報)
- 黄檗にはホテルはありません。また、宇治市内のホテルも非常に少数です。従って、京都市内に宿泊し、黄檗まで毎日移動するのが無難です。
- 京都市内からの公共交通としては、JR奈良線と京阪電車宇治線(中書島駅で京阪本線から乗り換え)が利用できます。以下のようなコースが一般的でしょう:
- JRの場合:京都駅 → (奈良線各駅停車) → 黄檗駅 (快速は止まりません)
- 京阪の場合:ホテルに最寄りの駅 → (京阪本線特急) → 中書島駅(乗り換え。通常、降りた目の前のホーム) → (宇治線、各駅停車しかありません) → 黄檗駅
- 乗車駅として通常は、出町柳(でまちやなぎ)or神宮丸太町(じんぐうまるたまち)or三条or祇園四条or清水五条or七条駅が考えられます。但し神宮丸太町と清水五条には特急は止まりません。
- これ以外にも、市営地下鉄東西線・東行きで六地蔵駅まで出て、そこでJRに乗り換える手があります(地下鉄とJRの駅は隣接していますが、京阪の駅は若干離れています)。
- なお、京都駅(近鉄京都駅、八条口側の西の方)で近鉄に乗ると、丹波橋駅で京阪に乗り換えできます。また市営地下鉄烏丸線は竹田駅経由で近鉄に乗り入れています(近鉄京都駅発の列車と、地下鉄国際会館駅発の列車がある)。
- 駅自体は、JR黄檗駅のほうがキャンパスに近いですが、JRが単線のため、複線の京阪のほうが一般的にはアクセスが良いです。
- JR奈良線・黄檗駅と京阪電車宇治線・黄檗駅は隣接していますが、連絡通路などはなく、両者間の連絡は一般道を大回りする必要があります。
- JR黄檗駅から宇治キャンパス内総合研究実験棟までは徒歩10分程度、京阪黄檗駅からは15分程度を見込んでください。
- JR奈良線は、京都駅から稲荷駅に向かう間は猛烈に混みます(ラッシュアワーの山手線よりは少しマシです)が、稲荷駅で殆どの乗客が下車してガラ空きになります(つまり、大半は伏見稲荷大社への観光客です)。
- JRを利用する場合、ホテルは京都駅周辺で、京阪を利用する場合、三条駅または祇園四条駅(共に京阪本線)周辺で確保するのが無難です。
- JR奈良線 時刻表1 時刻表2
- 京阪宇治線 時刻表(京阪電車公式) 路線図(京阪電車公式)
- 京都市は観光地なのでホテルは多数あり、また今回の開催予定日は、一般的には「多少余裕がある」時期です。しかし週末は混む傾向がありますので、早めの予約をお勧めします。
- なお、翌日の16日(土)・17日(日)にはセンター試験が行われます。センター試験では、受験生は概ね地元で受験するため、二次試験ほどの混雑は予想されませんが、宿泊の予約は早めにされておくことを強くお勧めします。
キャンパス入り口から会場までの進み方
- ウッドデッキ(正門左手、Google Sreet View)から進入してください。
- 左手にある「おうばくプラザ」の建物(レストランきはだ・ハイブリッドスペース)には構内図が掲示されています。(なお、この「おうばくプラザ」の建物は、構内図では「26」と表示され、その番号はハイブリッドスペースの入り口横にも掲げられています。)
- 総合研究実験棟は「29」ですが、この棟は本館「27」と渡り廊下で接続しています。
- そのままウッドデッキを進んで、本館に入ってください。入り口には「27」と表示されています。
- この入り口は、このPDF版キャンパス図にも写真入りで表示されています。
- 入り口左手には、「防災研究所」と「農学研究科」という大きな看板が出ていますが、右手には「化学研究所」などのネームプレートも設置されています。
- そのまままっすぐ、(遙か彼方の)廊下の突き当たりまで進んでください。
- 本館の東端から入って、西端まで歩くことになりますので、距離はかなりあります。
- 突き当たりに来たら、そこで左に曲がります。目の前に全面金属の扉があります(非常口の扉のように見えますが、非常口の掲示はありません。非常口ではないので)。この扉を開けると、総合研究実験棟(「29」。このキャンパス図でいうと緑マル4)につながる渡り廊下があります。
- 空中を渡る吊り橋のような(…というと大袈裟)渡り廊下です。
- (これで、南を向いていることになります。)
- 渡り廊下を渡り、更に扉を開けて総合研究実験棟に入ります。
- ここは3階です。入ってすぐ右手に手洗い場と休憩スペースがあり、左手の扉には「緒方研究室」と表示されています。
- そのまま(すぐに)突き当たり、ここで再度左に曲がります。
- 突き当たりで左に曲がらず、逆に右を向くと階段がありますが、道順の説明の都合上、ここではこの階段は使いません。
- (左に曲がった結果、東を向いていることになります。)
- そのまま再度、廊下の突き当たりまで進みます。左手に見える部屋が「図書室」「統合データベース室」「阿久津研究室」となると、廊下が突き当たりになる筈です。
- 会場(CB207)は、この「統合データベース室」「阿久津研究室」の真下です。
- 突き当たりの階段で一つ下の階(2階)に降ります。
- 階段から出て、「CB207/208/209」のいずれか、開いている扉から入室してください(各扉ごとに番号が付いていますが、実態は1つの大部屋です)。
- 開催連絡:http://groups.google.com/group/biohackathon-jp メーリングリストにて
プロジェクト
TPP グループ全体
統合化推進プログラム (TPP) の RDF 化支援
- 糖鎖統合データベースおよび国際糖鎖構造リポジトリの開発 (成松)
- NBDC RDFポータルのデータについて、糖鎖Gのデータ(GlyTouCan, glycoEpitope,WURCS)がリンクされてなかったため、トリプルを追加することに(奥田、山田)
- * データベースRDF化ガイドライン (ドラフト) の”他のデータベースへのクロスリファレンスはpolite URLとidentifiers.orgのURIを利用する”のところの、identifiers.orgとrdfs:seeAlsoでつなげるトリプルを利用している(川島さん より)
- NBDC RDFポータルのデータについて、糖鎖Gのデータ(GlyTouCan, glycoEpitope,WURCS)がリンクされてなかったため、トリプルを追加することに(奥田、山田)
- 疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オミクスデータの統合 (菅野)
- TSSデータのRDF化
SPARQLthon グループ
- TogoWS の NCBI/DDBJ の Turtle 化スクリプト isndc2ttl.rb を最新版に更新 → 主語が UUID から Id.org の URI に (片山・西澤)
- BioQueries 調査(千葉)
- KEGG OC RDF を使った stanza (守屋)
- JSTシソーラス高度化(改訂)に向けた「法造」の機能拡張(古崎・櫛田)
- 日化辞とKNApSAcKのID対応の立体異性問題について調査(時松)
- 化合物の分子構造のInChIからトリプルを生成するスクリプトの修正とSPARQLによるデータ取得(山田)
- 修正したスクリプトでつくったRDFをVirtuosoに入れ、必要な情報をSPARQLクエリで取得できることを確認した。KNApSAcKデータには同位体を含む分子がない(たぶん)ためIsotopic_*のデータは0件でした。
prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> prefix dcterms: <http://purl.org/dc/terms/> prefix sio: <http://semanticscience.org/resource/> prefix inchi: <http://glyconavi.org/inchi/> SELECT DISTINCT ?id ?Version ?inchi ?inchikey ?value ?key_value FROM <http://www.glyconavi.org/SPARQLthon40/iupac-inchi/KNApSAcK> WHERE { ?s dcterms:identifier ?id . ?s sio:CHEMINF_000200 [ sio:SIO_000300 ?inchi ; rdf:type sio:CHEMINF_000396 ] . ?s sio:CHEMINF_000200 [ sio:SIO_000300 ?inchikey ; rdf:type sio:CHEMINF_000399 ] . ?s sio:CHEMINF_000200 / inchi:Version ?Version . # inchi:Connections # inchi:H_atoms # inchi:Main_layer # inchi:Charge # inchi:Protons # inchi:Charge_layer # inchi:Stereo_dbond # inchi:Stereo_sp3 # inchi:Stereo_sp3_inverted # inchi:Stereo_type # inchi:Stereo_layer #0 inchi:Isotopic_atoms #0 inchi:Isotopic_exchangeable_H #0 inchi:Isotopic_stereo_dbond #0 inchi:Isotopic_stereo_sp3 #0 inchi:Isotopic_stereo_sp3_inverted #0 inchi:Isotopic_stereo_type # inchi:Isotopic_layer ?s sio:CHEMINF_000200 / sio:SIO_000028 / sio:SIO_000028 [ rdf:type inchi:Connections ; sio:SIO_000300 ?value ] . #0 inchi:Skeleton #0 inchi:Stereo_isotopic_substitution_information #0 inchi:Kind_of_InChIKey #0 inchi:InChI_version #0 inchi:Number_of_protons ?s sio:CHEMINF_000200 / sio:SIO_000028 [ rdf:type inchi:Number_of_protons ; sio:SIO_000300 ?key_value ] . } LIMIT 1
- 転写因子ネットワーク推定ツールをDockerにラップしてwebappにしました -> アウトプットはd3jsでヒートマップ描画などする予定ですが、その間の計算結果をJSON-LDでexportしたい (おおた)
- SPARQL Builder(山口,戀津,古崎,山本)
- Assembly RecordのDDBJ対応に関連してAssembly Reprots RDF更新(藤澤)
- prefix asm: <http://ddbj.nig.ac.jp/ontologies/assembly/> でOWL開発中 Class: 1 Property: 49
- Category theory 調査
- Linked ICGC Data Portal を NDBC RDF Portal のエンドポイント上で動作するように変更作業中(山中)
- NDBC RDF Portal から Bio2RDF への連携クエリが返ってこない問題(川島さんに相談)
- 負荷が大きい集計系クエリのチューニングが可能かどうか検討(岡別府さんに相談)
今後の予定
- RDF化ガイドライン最新版 → RDFizingDatabaseGuideline
参考リンク
- これまでの SPARQLthon
参加者
- 片山俊明 (DBCLS)
- 川島秀一 (DBCLS)
- 守屋勇樹 (DBCLS)
- 吉沢明康(京都大学)
- 山本泰智 (DBCLS)
- 岡別府陽子(MSS)
- 古崎晃司(大阪大学)
- 山口敦子 (DBCLS)
- 大田達郎 (DBCLS)
- 米納朋子(京都大学)14日のみ
- 山田一作(野口研究所)
- 時松敏明 (DBCLS)
- 戀津魁 (理研)
- 内藤雄樹 (DBCLS)
- 千葉啓和(基生研)14日のみ
- 桝屋啓志 (RIKEN BRC)14日は取り消し 15日は?
- 高月照江 (RIKEN BRC)14日は午後から
- 永野朗夫(PENQE)
- 田中聡 (Trans-IT)
- 藤澤貴智(遺伝研)
- 櫛田達矢(NBDC)14日のみ
- 田畑剛(京都大学)15日のみ
- 小澤健太郎 (SGI)
- 奥田修二郎(新潟大)