RNA Analysis
RNA解析 − 生命科学を次のステージへ
ヒトゲノムのほとんどの領域は,発生段階のどこかで RNA へ転写されます. このうち、タンパク質をコードしている領域は 2 %しかありません. 残りの 98 %の領域には,タンパク質への翻訳を経ずに RNA として細胞機能を担う遺伝子が多数存在しています.
榊原研究室は RNA の未知の機能を解明し,新しい生命科学の基礎を築くことを目指しています. 生物実験と情報技術の両方を駆使して,細胞内に存在する全ての RNA 分子を対象とした網羅的な解析を行っています.
実験できる人も歓迎! |
情報できる人も歓迎! |
機械学習による網羅的な機能解析
転写されているゲノム領域を同定した後は,それぞれの RNA について詳細な機能解析を行います.
RACE や in situ ハイブリダイゼーションといった生物実験は,長い時間とコストを必要とするため少数の RNA しか扱えません.
そこで榊原研究室の得意とする情報技術を駆使した,計算機による網羅的な解析が非常に重要となります.
バイオインフォマティクスを活用することにより,機能未知の RNA に関する解析を高速に実行することが可能になります.
例えば,生体内で形成される RNA の 2 次構造を配列データから予測して,修飾部位やモチーフの位置を同定することができます.
また,RNA 配列間の類似度を正確に評価して,解析対象の RNA と既知の機能性 RNA との関連を調べたり,
新しい機能性 RNA のファミリーを発見することができます.
2 次構造予測とモチーフ同定
新規ファミリ発見
榊原研究室は RNA の機能解析に不可欠な情報技術の開発を 10 年以上に渡って続けており, この分野に関して日本を代表する研究グループの 1 つです. 機械学習,特に確率文法やカーネル法を基礎理論として,膨大な配列データに隠された機能性 RNA の特徴を解明し, 高精度な計算機予測を実現してきました. これらの研究成果はソフトウェアや Web サーバとして積極的に公開しています. 他人が作ったツールをただ使うのではなく,自らの手で新しい手法を提案することが重要だと考えています.
開発ソフトウェア
PHMMTS
RNA 配列のアラインメントと 2 次構造を計算するプログラムです. 2 次構造未知の入力配列を 2 次構造既知の参照配列に対してアラインメントします.
PSTAG
RNA 配列のアラインメントと 2 次構造を計算するプログラムです. PHMMTS の拡張版であり,シュードノットと呼ばれる特殊な 2 次構造を扱うことができます.
BPLA kernel
RNA 配列間の類似度を極めて正確に計算するプログラムです.これまでに機能性 RNA のファミリ予測,クラスタリング,プロファイル探索, 相同性検索など様々な解析に応用され,いずれも世界最高の精度を達成しています (2010年11月現在).