12
Most read
13
Most read
14
Most read
metaSeq: RNA-seqデータにおける
メタアナリシス解析パッケージ
antiplastics@Kashiwa.R#9
自己紹介
名前: 露崎弘毅 (つゆざき こうき)
所属: 東京理科大学大学院 薬学研究科 D2
専門: バイオインフォマティクス、システムバイオロジー
抗生物質

緑膿菌

バイオフィルム形成

?
薬物耐性
BioCHackathon
Bioconductorのパッケージを開発するハッカソン
Itoshi
Nikaido

Gota
Morota

RIKEN

UW-medison

@dritoshi

@chikudaisei
Koki
Tsuyuzaki
TUS

@antiplastics

Takeru
Nakazato
DBCLS
@chalkless
遺伝子アノテーション
アノテーション = 注釈をつける
こいつらは一体何者?

RNA-seq
ChIP-seq
DNA Microarray
SNP array
CAGE
SAGE

HNRNPR
ZNF436
TFEA3
ASAP3
E2F2
ID3
GALE
HMGCL
FUCA1
CNR2
...

ゲノムワイドな実験

のリスト

サイトを有するか

どこのパスウェイか

自分が興味ある遺伝子

(オミックス)

どんな転写因子結合

どんな機能に関わっ
ているか
MeSH
Medical Subject Headings
PubMedの注釈情報
MeSHによる遺伝子アノテーション
GeneとMeSHを対応づける

HNRNPR
ZNF436
TFEA3
ASAP3
E2F2
...

Gene

gendoo
gene2pubmed

23445621
23521515
53515315
51231357
61646667
...

PubMed

Licensed
PubMed

Cancer
Stem Cell
Internet
Soft ware
USA
...

MeSH
これまで開発に携わったパッケージ

MeSH.db: MeSHデータ全般
org.MeSH.XXX.db:
119生物種のGeneID-MeSHIDの対応関係
meshr: MeSHエンリッチメント解析
metaSeq: RNA-seqメタアナリシス

MeSH関連
今後の予定
metaSeqはBioconductor2.13 (2013/10/15)に公開
MeSH関連はBioconductor 2.14 (2014/4/XX) にて公開予定
JSBi2013 (2013/10/29-31)でmetaSeqはポスター発表で、
MeSHR関連については、BioHackコンペディション
https:/
/github.com/dbcls/jsbi2013/wiki/BioHack
にて話す予定
RNA-seq (1/2)
Gene XのmRNA
AAAAAAAAAA

PCR増幅
断片化

次世代シーケンサー
(NGS)
ショートリード

シーケンシング

GCTGTACAC
GCTACGAA
GTCAAACTC
CAGCTGCAC ACACTGCAC
TGCATGCTA
CCCACACTT
CTCAGAAC

マッピング
TGCATGCTA
GCTACGAA
... ATGCATGCTACGAAGCT ...

Gene Xには2つのリード
定量化

がマップされた!

参照ゲノム
e.g., hg19 (UCSC), GRCh37 (Ensembl)

© 2011 DBCLS Licensed under CC 表示 2.1 日本
RNA-seq (2/2)
対象群 (無処置)

処置群 (薬物投与)

C_1

C_2

C_3

T_1

T_2

1/2-BSRNA4

2

1

2

1

3

4

A1BG

0

2

1

0

0

1

A1BG-AS1

23

12

42

1

2

p-value

T_3

4

DESeq
edgeR
cuffdiff ...

0.67
0.35

q-value

BH
Q-value
LFDR

0.04

統計解析

0.53
0.32
0.020

FDR制御

ZZZ3

12

12

32

124

104

96

0.02

0.012

tAKR

21

32

41

10

12

58

0.11

0.25

e.g., 30000行 (遺伝子数) × 6列 (サンプル数)

発現変動遺伝子 (DEGs)
(q < 0.1)
© 2011 DBCLS Licensed under CC 表示 2.1 日本
“meta”-analysisとは?
meta-analysis = analysis of analysis
出所が異なる(e.g., 異なる機関)から出たRNA-seqデータを統合して解析する
StudyA

StudyB

StudyC

C_1

C_2

C_3

T_1

T_2

T_3

3

2

1

2

2

4

1

1/2BSRNA4
A1BG

0

5

4

1

1

2

4

A1BG-AS1

19

10

31

3

124

104

96

ZZZ3

32

21

31

10

12

58

tAKR

21

46

24

C_1

C_2

C_3

T_1

T_2

T_3

1/2BSRNA4
A1BG

2

1

2

1

3

4

0

2

1

0

0

A1BG-AS1

23

12

42

1

ZZZ3

12

12

32

tAKR

21

32

41

+

C_1

C_2

C_3

T_1

T_2

T_3

3

4

6

2

5

3

2

1/2BSRNA4
A1BG

4

2

2

3

2

2

4

4

A1BG-AS1

21

21

36

5

5

4

86

35

64

ZZZ3

21

21

25

152

135

112

14

56

21

tAKR

20

30

41

21

21

53

+

DEGs
どのデータからも検出される再現性が高いDEGsを取得する事ができる
p値の統合
Fisher’s method

p1
p2
p3
p4

meta-p
統合

Χ^2検定
p値の統合
Stouffer’s method(重み付け有り)

p2
p3

Z1
Z2
Z3

w1 × Z1
w2 × Z2
w3 × Z3

p4

Z4

w4 × Z4

p1

変換

meta-p

Z
統合

Z検定

重み付け

サンプルサイズ
による重み付け
乳癌データにおける
エンリッチメント解析の結果
4つの乳癌研究のメタアナリシス

データによっては有意に

統合によりどのデータでも

ならないものもある

安定して有意にできている
パッケージ化
NOISeq

metaSeq
まとめ
メタアナリシスとは複数の研究データの統合解析
metaSeqでRNA-seqのメタアナリシスができる
Bioconductor page : http:/
/www.bioconductor.org/packages/
devel/bioc/html/metaSeq.html
GitHup page : https:/
/github.com/kokitsuyuzaki/metaSeq

More Related Content

PPTX
リアルタイムPoint cloudデータのビジュアライゼーションについて
PDF
潜在クラス分析
PPTX
分割時系列解析(ITS)の入門
PPTX
社会心理学者のための時系列分析入門_小森
PDF
遺伝子のアノテーション付加
PPTX
Single-cell pseudo-temporal ordering 近年の技術動向
PDF
傾向スコア:その概念とRによる実装
PDF
ノンパラベイズ入門の入門
リアルタイムPoint cloudデータのビジュアライゼーションについて
潜在クラス分析
分割時系列解析(ITS)の入門
社会心理学者のための時系列分析入門_小森
遺伝子のアノテーション付加
Single-cell pseudo-temporal ordering 近年の技術動向
傾向スコア:その概念とRによる実装
ノンパラベイズ入門の入門

What's hot (20)

PDF
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
PDF
『バックドア基準の入門』@統数研研究集会
PDF
相関と因果について考える:統計的因果推論、その(不)可能性の中心
PPTX
重回帰分析で交互作用効果
PPTX
Imputation of Missing Values using Random Forest
PPTX
WBICによる混合正規分布の分離と抽出
PPTX
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
PDF
Rで計量時系列分析~CRANパッケージ総ざらい~
PPTX
GEE(一般化推定方程式)の理論
PDF
実践で学ぶネットワーク分析
PDF
“機械学習の説明”の信頼性
PDF
Rでisomap(多様体学習のはなし)
PDF
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】
PDF
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
PDF
対人コミュニケーション研究における周波数解析
PDF
CVPR 2019 速報
PDF
第4回DARM勉強会 (構造方程式モデリング)
PDF
検定力分析とベイズファクターデザイン分析によるサンプルサイズ設計【※Docswellにも同じものを上げています】
PPTX
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
PDF
統計的因果推論への招待 -因果構造探索を中心に-
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
『バックドア基準の入門』@統数研研究集会
相関と因果について考える:統計的因果推論、その(不)可能性の中心
重回帰分析で交互作用効果
Imputation of Missing Values using Random Forest
WBICによる混合正規分布の分離と抽出
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
Rで計量時系列分析~CRANパッケージ総ざらい~
GEE(一般化推定方程式)の理論
実践で学ぶネットワーク分析
“機械学習の説明”の信頼性
Rでisomap(多様体学習のはなし)
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
対人コミュニケーション研究における周波数解析
CVPR 2019 速報
第4回DARM勉強会 (構造方程式モデリング)
検定力分析とベイズファクターデザイン分析によるサンプルサイズ設計【※Docswellにも同じものを上げています】
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
統計的因果推論への招待 -因果構造探索を中心に-
Ad

More from 弘毅 露崎 (20)

PDF
大規模テンソルデータに適用可能なeinsumの開発
PDF
バイオインフォ分野におけるtidyなデータ解析の最新動向
PDF
Benchmarking principal component analysis for large-scale single-cell RNA-seq...
PDF
R-4.0の解説
PDF
scTGIFの鬼QC機能の追加
PDF
20191204 mbsj2019
PDF
1細胞オミックスのための新GSEA手法
PDF
Predicting drug-induced transcriptome responses of a wide range of human cell...
PDF
LRBase × scTensorで細胞間コミュニケーションの検出
PDF
非負値テンソル分解を用いた細胞間コミュニケーション検出
PDF
Exploring the phenotypic consequences of tissue specific gene expression vari...
PDF
データベースとデータ解析の融合
PDF
ビール砲の放ち方
PDF
Identification of associations between genotypes and longitudinal phenotypes ...
PDF
A novel method for discovering local spatial clusters of genomic regions with...
PDF
Rによる統計解析と可視化
PDF
文献注釈情報MeSHを利用した網羅的な遺伝子の機能アノテーションパッケージ
PDF
PCAの最終形態GPLVMの解説
PDF
カーネル法を利用した異常波形検知
PDF
ISMB読み会 2nd graph kernel
大規模テンソルデータに適用可能なeinsumの開発
バイオインフォ分野におけるtidyなデータ解析の最新動向
Benchmarking principal component analysis for large-scale single-cell RNA-seq...
R-4.0の解説
scTGIFの鬼QC機能の追加
20191204 mbsj2019
1細胞オミックスのための新GSEA手法
Predicting drug-induced transcriptome responses of a wide range of human cell...
LRBase × scTensorで細胞間コミュニケーションの検出
非負値テンソル分解を用いた細胞間コミュニケーション検出
Exploring the phenotypic consequences of tissue specific gene expression vari...
データベースとデータ解析の融合
ビール砲の放ち方
Identification of associations between genotypes and longitudinal phenotypes ...
A novel method for discovering local spatial clusters of genomic regions with...
Rによる統計解析と可視化
文献注釈情報MeSHを利用した網羅的な遺伝子の機能アノテーションパッケージ
PCAの最終形態GPLVMの解説
カーネル法を利用した異常波形検知
ISMB読み会 2nd graph kernel
Ad

metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ