頑健なデータ駆動形エピゲノム解析を実現する情報解析システムの構築

概要

AMED-PRIME「早期ライフステージ」において、多細胞種・多サンプルを同時入力可能なエピゲノム比較解析システムを開発しています(図1)。本プロジェクトでは、ChIP-seq, RNA-seq, Hi-CなどさまざまなNGSアッセイを複数の細胞種(または細胞状態)から取得した大規模データを横断的に解析し、半教師あり学習を用いてクロマチン状態を詳細に注釈づけ(アノテーション)する手法を開発します。また、機械学習によるデータ補完技術を用いたエピゲノムデータの再構築手法を実現し、低品質・欠損データを含む大規模データから信頼性高く情報を抽出するための仕組みを構築します。 本システムが完成すれば、大規模解析のためのデータ生成コスト、解析コスト両面を大きく低減することが可能となり、生命系・医療系研究の飛躍的な推進が期待できます。ひいては、エピゲノム解析そのものの価値を飛躍的に高めることになります。

開発するシステムを用いてAMED内共同研究を積極的に推進し、早期ライフステージに関する知見獲得に貢献します。また、本プロジェクトの一貫として国際ヒトエピゲノムコンソーシアム (IHEC) にも参加しており、世界各国の情報解析の専門家と交流・議論しながら、大規模データ統合解析のためのアプローチを模索していきます。

参考:

Recent Posts

2022/03/24
第13回:マルチNGSオミクス解析研究会
2022/02/18
第12回:マルチNGSオミクス解析研究会
2022/01/18
第11回:マルチNGSオミクス解析研究会
2021/12/14
第10回:マルチNGSオミクス解析研究会
2021/11/19
第9回:マルチNGSオミクス解析研究会