GeneSpring GXによるデータ解析
注意事項
学生実習用のライセンスなので6/30までしか使えません。
最初にソフトを起動した端末でしか使えません。
→ 別の端末で使う場合はSurrenderという操作が必要。方法は下記参照。
Failed to start the Pathway … という警告が出て起動しない場合
→ マシン再起動でOK
-
警告が出て先に進めない場合、ソフト再起動、それでもだめならマシンを再起動。
グラフが何十枚もたまってくると動作が重くなるので、適宜閉じること。
GeneSpringを別の端末で利用する方法(Surrender):
GeneSpringが起動している状態でHelpメニュー → License Manager
12桁のOrder IDを控える。
Surrenderボタンを押す。Yesを選択。
GeneSpringが勝手に閉じる。
別のマシンでGeneSpringを起動して12桁のOrder IDを入力すると使えるようになる。
GeneSpring GXのインストール方法
注意:インストールするには1.5GB程度のスペースが必要です。最初にディスク使用量の確認を参照して空きスペースを確保してください。
メニューバーの移動メニューからフォルダへ移動 →「~sirna/Microarray/」
genespringGX_mac.appをダブルクリックして開き、プログラムの指示に従いインストールする。
デスクトップにできたGeneSpringGXのアイコンを開く。
ライセンスを入れる画面では、講師が配布する12桁のコードを入力。
ここで、かなり時間がかかる。2回目以降に起動するときは時間はかからない。
Annotations Managerの画面が出てきたら、UpdateせずにCloseする。
Automatic Software Updateの画面もCancel(時間がかかるので)。
データの読み込み
GeneSpring GXを起動
Project → New Project → 適当な名前をつける
Create new experiment
Experiment name → 適当な名前をつける
Analysis type → Expression
Experiment type → Agilent Expression Single Color
Workflow type → Data Import Wizard
Experiment notes → メモ。空欄でも可
Load Data → Choose Filesから数値データ(TXT)を全部選択
Use spot information in data files to flag the dataのみにチェック。以下推奨設定。
Feature is not positive and significant → Not Detected
Feature is not Uniform → Compromised
Feature is not above background → Not Detected
Feature is Saturated → Compromised
Feature is population outlier → Compromised
Normailzation algorithm → Quantile
Baseline Options → Do not perform baseline transformation
初回のみTechnology Agilent何とか was not found.というエラーがでるが、Yesと答えてダウンロードする。
サンプル名の入力・replicateの指定
画面右側のExperiment Groupingタブ → Add Parameter
Parameter nameには何を入れてもよい(例:sample nameとか)
Parameter Valuesにmock、Wild typeなどといった名前をつける。
画面右側のExperiment Groupingタブ → Create Interpretation
先ほど入力したパラメータをチェックしてNext
Average over replicates in conditionsがチェックされているか確認。
他は変更せずに終了。
以上の操作で2サンプル間の平均の値が算出される。
バックに近い値や、異常な値を除去
画面右側のQuality Controlタブ → Filter Probesets by Flags → Next
at least [8] out of 8 samples have acceptable values(全4サンプルの場合は4)
→ 1サンプルでもAbsentと判定された値があるものは除外。
XYプロット、MAプロット
GeneSpring GXにおけるMAプロットでは、たとえばX-AxisにWild type、Y-Axisにmockを選択すると、Wild typeのサンプルで増加している遺伝子が上方(> 0)に、減少している遺伝子が下方(< 0)にプロットされる。
プロットの保存(画像ファイル書き出し)
グラフ上で右クリック
Export as → Image
Fileのところの…をクリック
ファイル名入力し、保存をクリック
注目している遺伝子の抽出
遺伝子(アクセッション番号)リストを読み込み、その遺伝子に色をつける。
遺伝子リストの例:
Accession
NM_003380
NM_014616
NM_000368
NM_177402
………
Choose file → 遺伝子リストのテキストファイルを選択
Choose file column to match → 読み込ませた遺伝子リストの1行目
Choose technology column to match → GenBank Accession
(アレイのプローブIDや遺伝子名など、他の項目のリストを読むことも可能)
画面左側の Analysis フォルダ内に Imported Lists フォルダができ、その中に読み込んだリストが保存されている。それを選択すると、リスト内の遺伝子のみがプロットされる。この状態で、「3. バックに近い値や、異常な値を除去」と同じ操作をおこなう。
すべての点を選択した状態で、 All Entities 内の Filtered on Flags Present or Marginal を選択すると、全体のなかでリスト内の遺伝子がどこにプロットされているかわかる。
siRNAとseedマッチする配列を3'UTRにもつ遺伝子の抽出
seed → siRNAの5'末端から2〜8の7塩基(今回は 5′-UGAACUC-3′ および 5′-CAUCAAC-3′)
mRNA側の配列は、5′-GAGUUCA-3′ および 5′-GUUGAUG-3′
-
1〜7や、3〜9、1〜9、11〜17等で同じ解析をおこなった場合はどうなるか。
解析例(過去の学生実習より)
過去のマイクロアレイ実習の結果。
miR-373とseed(2〜8)マッチする配列を3'UTRにもつ遺伝子を緑で表示している。
同様の解析を、mock対RNA、mock対2OMe、mock対LNAの各サンプルに関しておこなってください。
累積度数曲線
seedマッチによる抑制を定量的に調べるため累積度数曲線をプロットする。
全遺伝子の累積度数曲線
Filterd on Flagsした後に残った点全体を選択し、Spread Sheetボタンを押す。
Excelの表のような画面が表示されるので、表の上で右クリック → Export As Text
Excelで開き、新しい列に[RNA] - [mock]の値を算出。
[RNA] - [mock]の値を昇順ソート。→ 列α
その右側の列に、0〜100までの値を均等に振る。→ 列β
列αと列βを選択してグラフを作成。
RNAとseedマッチする遺伝子の累積度数曲線
RNA seedを持つ遺伝子の点を選択。
Filter Probeset by Flagsを同じ条件で実行。
以下、同様にSpread Sheetボタンを押してデータをExcelに移してグラフ作成。
グラフを選択してコピー、全遺伝子の累積度数曲線のうえにペースト。
過去のマイクロアレイ実習の結果↓