Finding promoters containing TAF1 binding sites identified from a CHiP-seq experiment

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(データタイプを interval に変更)
(データセット6から確認)
 
(間の8版分が非表示)
30行: 30行:
===  遺伝子アノテーションをUCSC Table Browser から取得 ===
===  遺伝子アノテーションをUCSC Table Browser から取得 ===
-
# Get Data/UCSC main ツール
+
# ツール:Get Data/UCSC main
# UCSC table browserでの操作
# UCSC table browserでの操作
## Human Mar 2006 (hg18のこと)
## Human Mar 2006 (hg18のこと)
52行: 52行:
=== プロモーター領域は遺伝子の1000塩基上流部分とする、それを取り出す ===
=== プロモーター領域は遺伝子の1000塩基上流部分とする、それを取り出す ===
-
# Operate on Genomic Intervals/Get flanks ツール
+
# ツール:Operate on Genomic Intervals/Get flanks
# '''Select data:''' ''2: RefSeq''
# '''Select data:''' ''2: RefSeq''
# '''Location of the flanking region/s:''' ''Upstream''
# '''Location of the flanking region/s:''' ''Upstream''
64行: 64行:
# 保存
# 保存
=== データセット3(Promoters)のカラムを減らしたい。 ===
=== データセット3(Promoters)のカラムを減らしたい。 ===
-
# Text Manipulation/Cut ツール
+
# ツール:Text Manipulation/Cut
# ''c1,c2,c3,c4,c6''
# ''c1,c2,c3,c4,c6''
# chrom, start, end, name, strand に対応
# chrom, start, end, name, strand に対応
80行: 80行:
# 保存
# 保存
=== データセット4(Clean Prom)とデータセット1(TAF1結合サイト)をjoinする ===
=== データセット4(Clean Prom)とデータセット1(TAF1結合サイト)をjoinする ===
-
# Operate on Genomic Intervals/Join ツール
+
# ツール:Operate on Genomic Intervals/Join
# '''Join:''' ''4. Clean Prom''
# '''Join:''' ''4. Clean Prom''
# '''with:''' ''1. TAF1_binding_site''
# '''with:''' ''1. TAF1_binding_site''
# Execute
# Execute
-
=== UCSC genome browser で可視化します。 ===
+
=== UCSC genome browser で可視化 ===
-
# Graph/Display Data/Build custom track for UCSC genome browserツール
+
# ツール:Graph/Display Data/Build custom track for UCSC genome browser
-
# '''Add new Track''' をクリック
+
# これから三つのカスタムトラックを作成する(TAF結合サイト、全プロモーター、オーバーラップ)
# これから三つのカスタムトラックを作成する(TAF結合サイト、全プロモーター、オーバーラップ)
 +
# '''Add new Track''' をクリック
# Track 1
# Track 1
## ''1: TAF1_CHiP.txt''
## ''1: TAF1_CHiP.txt''
105行: 105行:
## '''description:''' ''Overlap''
## '''description:''' ''Overlap''
## '''color:''' ''Blue''
## '''color:''' ''Blue''
-
# Executeをクリック
+
# Execute
# データセット6が作られる。
# データセット6が作られる。
 +
=== データセット6から確認 ===
=== データセット6から確認 ===
-
# display at UCSC mainリンクで別タブにUCSC genome browserが開く
+
# データセット6の '''display at UCSC main''' リンクから別タブにUCSC genome browserが開く
-
# レッドが結合領域
+
# カスタムトラックのレッドがTAF1
-
# グリーンがプロモーター領域
+
# カスタムトラックのグリーンがプロモーター領域
-
# グリーンがオーバーラップ
+
# カスタムトラックのブルーがオーバーラップ(こんかい解析した結果)
 +
 
== FAQ ==
== FAQ ==
=== オーバーラップというより、重なりのあるプロモーター領域になっている? ===
=== オーバーラップというより、重なりのあるプロモーター領域になっている? ===
118行: 120行:
# 重なりのあったあたらしい領域ではなくて、二つのセットのなかから領域が選ばれている。
# 重なりのあったあたらしい領域ではなくて、二つのセットのなかから領域が選ばれている。
=== ChiP-seq とは? ===
=== ChiP-seq とは? ===
-
=== TAF1 とは? ===
+
ChiP-seq法とは、クロマチン免疫沈降法とシーケンシン グ法を組み合わせて、転写調整因子のゲノム上の結合部位 を網羅的に同定する方法。
-
== 補遺:オーバーラップのあったプロモーターの配列について近縁種の領域と比較する ===
+
=== TAF1結合サイトとは? ===
 +
TAF1結合サイトとは、DNA結合タンパク質かつ転写制御 因子、TAF1タンパク質(基本転写因子TFIIDサブユニット 1)が結合するゲノム領域
 +
 
 +
== 補遺 ==
=== オーバーラップの塩基配列(FASTAフォーマット)の取得 ===
=== オーバーラップの塩基配列(FASTAフォーマット)の取得 ===
-
# Fetch Sequences / Extract Genomic DNA ツール
+
# ツール:Fetch Sequences / Extract Genomic DNA
# '''Query: 5:''' ''join data 1 and 4'' を選択
# '''Query: 5:''' ''join data 1 and 4'' を選択
# Execute
# Execute
# データセット6ができる。
# データセット6ができる。
 +
=== オーバーラップのあるプロモーター領域の近縁種との多重配列整列をみる ===
=== オーバーラップのあるプロモーター領域の近縁種との多重配列整列をみる ===
-
# Fetch Alignments / Extract Pairwise MAF blocks ツール
+
# ツール:Fetch Alignments / Extract Pairwise MAF blocks
# '''Choose intervals:''' ''5: join data 1 and 4'' を選択
# '''Choose intervals:''' ''5: join data 1 and 4'' を選択
# '''Choose alignments:''' ''17-way multiZ (hg18)'' を選択
# '''Choose alignments:''' ''17-way multiZ (hg18)'' を選択

2010年8月10日 (火) 07:34時点における最新版

  • タイトル:Finding promoters containing TAF1 binding sites identified from a CHiP-seq experiment.
  • ノート:Suppose you performed a CHiP-seq experiment and identified a series of genomic regions that bind TAF1-protein. You now need to identify a list of genes that contain such sites. This can be easily done with Galaxy in just a few steps. To run this example yourself you will need a file containing genomic coordinates for TAF1- binding sites from the CHiP-seq experiment (an example file can be downloaded from here).
  • 作者:Galaxy team
  • オリジナル:http://main.g2.bx.psu.edu/screencast

目次

シナリオ:ChiP-seqで解析して得られたTAF1結合サイトをプロモーターに持っている遺伝子を知りたい

TAF1ファイルアップロード

  1. ツール:Get Data/Upload File
  2. URL/Texthttp://galaxy.psu.edu/CPMB/TAF1_CHiP.txt をURL/Text を入力
  3. Execute
  4. ヒストリーにデータセット1ができる。

databaseを human hg18 に設定

  1. ヒストリーのデータセット1の database: ? の ?をクリック
  2. Database/Build: セレクトメニューでHuman Mar. 2006 (NCBI36/hg18) (hg18) を選択
  3. 保存

データタイプを interval に変更

  1. データセット1のペンシルツールをクリック
  2. データタイプの変更:New Typesセレクトメニューintervalを選択
  3. 保存
  4. (つぎの画面に遷移:自動推定の場合は省略される)
  5. 2 col を chrom に、col 3, 4をスタート、エンドに変更
  6. Nameカラムをcal 5でチャックボックスをチェック
  7. 保存

データセット1をリネーム

  1. データセット1のペンシルツールをクリック
  2. Name:TAF1_CHiP.txt に変更
  3. 保存

遺伝子アノテーションをUCSC Table Browser から取得

  1. ツール:Get Data/UCSC main
  2. UCSC table browserでの操作
    1. Human Mar 2006 (hg18のこと)
    2. group: Genes and Gene Prediction Tracks
    3. track: RefSeq Genes
    4. region: genome
    5. output format: BED
    6. Send output to Galaxy チェックボックス
    7. get outout をクリック
    8. (つぎの画面に遷移)
    9. Whole genesであることを確認
    10. Send query to Galaxy をクリック
  3. データセット2ができる。
  4. (ヒストリがイエローの時は処理待ち)
  5. (処理が終わると、グリーン)

データセット2のリネーム

  1. データセット2のペンシルツールをクリック
  2. 名前が長過ぎるので Name: RefSeq に変更
  3. 保存

プロモーター領域は遺伝子の1000塩基上流部分とする、それを取り出す

  1. ツール:Operate on Genomic Intervals/Get flanks
  2. Select data: 2: RefSeq
  3. Location of the flanking region/s: Upstream
  4. length of the flanking region(s): 1000
  5. Execute
  6. データセット3ができる。

データセット3のリネーム

  1. ペンシルツール
  2. Name: Promoters
  3. 保存

データセット3(Promoters)のカラムを減らしたい。

  1. ツール:Text Manipulation/Cut
  2. c1,c2,c3,c4,c6
  3. chrom, start, end, name, strand に対応
  4. 保存

データセット4のリネーム

  1. ペンシルツール
  2. Name: Clean Prom
  3. 保存

データセット4のデータタイプをintervalに変更

  1. Cutをするとデータ型情報が落ちるので再度型をつける。
  2. データセット4のペンシルツールをクリック
  3. タイプintervalに変更
  4. Namecol 4 としてチェック
  5. Strandcol 5 としてチェック
  6. 保存

データセット4(Clean Prom)とデータセット1(TAF1結合サイト)をjoinする

  1. ツール:Operate on Genomic Intervals/Join
  2. Join: 4. Clean Prom
  3. with: 1. TAF1_binding_site
  4. Execute

UCSC genome browser で可視化

  1. ツール:Graph/Display Data/Build custom track for UCSC genome browser
  2. これから三つのカスタムトラックを作成する(TAF結合サイト、全プロモーター、オーバーラップ)
  3. Add new Track をクリック
  4. Track 1
    1. 1: TAF1_CHiP.txt
    2. name: TAF1
    3. description: "TAF1"
    4. color: Red
  5. Add new Trackをクリック
  6. Track 2
    1. 4: Clean Prom
    2. name: Prom
    3. description: Prom
    4. color: Green
  7. Add new Trackをクリック
  8. track 3
    1. 5: Join on data 1
    2. name: Overlap
    3. description: Overlap
    4. color: Blue
  9. Execute
  10. データセット6が作られる。

データセット6から確認

  1. データセット6の display at UCSC main リンクから別タブにUCSC genome browserが開く
  2. カスタムトラックのレッドがTAF1
  3. カスタムトラックのグリーンがプロモーター領域
  4. カスタムトラックのブルーがオーバーラップ(こんかい解析した結果)

FAQ

オーバーラップというより、重なりのあるプロモーター領域になっている?

  1. Joinツールは、二つのセットの重なりのあった領域(インターバル)を調べている。
  2. 領域(インターバル)は始点と終点でユニークになっている。
  3. 重なりのあったあたらしい領域ではなくて、二つのセットのなかから領域が選ばれている。

ChiP-seq とは?

ChiP-seq法とは、クロマチン免疫沈降法とシーケンシン グ法を組み合わせて、転写調整因子のゲノム上の結合部位 を網羅的に同定する方法。

TAF1結合サイトとは?

TAF1結合サイトとは、DNA結合タンパク質かつ転写制御 因子、TAF1タンパク質(基本転写因子TFIIDサブユニット 1)が結合するゲノム領域

補遺

オーバーラップの塩基配列(FASTAフォーマット)の取得

  1. ツール:Fetch Sequences / Extract Genomic DNA
  2. Query: 5: join data 1 and 4 を選択
  3. Execute
  4. データセット6ができる。

オーバーラップのあるプロモーター領域の近縁種との多重配列整列をみる

  1. ツール:Fetch Alignments / Extract Pairwise MAF blocks
  2. Choose intervals: 5: join data 1 and 4 を選択
  3. Choose alignments: 17-way multiZ (hg18) を選択
  4. ビルドと生物種名は http://genomewiki.ucsc.edu/index.php/Mm9_multiple_alignment を参照
  5. Choose spacies:Select Allをクリック
  6. Execute
  7. (しばしまつ)
  8. データセット7が作られる。
個人用ツール