SPARQLthon53/AssemblyReports
提供:TogoWiki
(版間での差分)
(→RDF更新系を整備) |
(→作業) |
||
19行: | 19行: | ||
* RDFについては同じ階層で1ファイルではなくgenome assembly毎にRDF作成するように変更 | * RDFについては同じ階層で1ファイルではなくgenome assembly毎にRDF作成するように変更 | ||
=== 作業 === | === 作業 === | ||
- | * ./cron/ | + | * ./cron/assembyの配下のコードを修正し、rsync中 2/16 |
2017年2月16日 (木) 08:25時点における最新版
目次 |
AssemblyReports
最新情報を確認
NCBI Genomes-announce メーリングリストの「2 done for reorganization of genomes/all & genomes/ASSEMBLY_REPORTS/All, Tue Jan 24 16:55:57 EST 2017」の情報をフォローした
- ftp://ftp.ncbi.nlm.nih.gov/genomes/ASSEMBLY_REPORTS/All ディレクトリが消失
- ftp://ftp.ncbi.nlm.nih.gov/genomes/all の直下にGenBank, RefSeq の各genome assemblyディレクトリが以下のような構成で再配置
- genomes/all/GCA_000001405.23_GRCh38.p8 → genomes/all/GCA/000/001/405/GCA_000001405.23_GRCh38.p8
- genomes/all/GCF_001696305.1_UCN72.1 → genomes/all/GCF/001/696/305/GCF_001696305.1_UCN72.1
FTPサイト
RDF変換系において、影響の上記の変更をftpサイトで確認した。
- assembly_summaryファイルは、ASSEMBLY_REPORTS内のまま
RDF更新系を整備
作業方針
- データ取得&変換&cron実行できるlinksetsコードを配置・修正し、DDBJスパコン上でRDF更新系を整備
- RDFについては同じ階層で1ファイルではなくgenome assembly毎にRDF作成するように変更
作業
- ./cron/assembyの配下のコードを修正し、rsync中 2/16