独立行政法人 産業技術総合研究所【理事長 吉川 弘之】(以下「産総研」という)生命情報工学研究センター RNA情報工学チーム 光山 統泰 研究チーム長、木立 尚孝 産総研特別研究員、みずほ情報総研 株式会社【代表取締役社長 小原之夫】(以下「みずほ情報総研」という)浜田 道昭、社団法人 バイオ産業情報化コンソーシアム【会長 秋草 直之】(以下「JBIC」という)佐藤 健吾 研究員、国立大学法人 東京大学【総長 小宮山 宏】(以下「東大」という)浅井 潔 教授らによる共同研究チームは、遺伝子の発現制御で重要な役割をしているRNAの二次構造を予測するソフトウェア「CentroidFold」を開発した。
RNAは遺伝子DNAからタンパク質が合成される際の中継ぎとしての役割が古くから知られているが、近年そのような役割をしないRNAが遺伝子の発現制御や細胞のガン化などで重要な役割を果たしていることが分かってきた。このようなRNAを機能性RNAというが、機能を発現するには長い1本鎖であるRNA分子が部分的に2本鎖を形成して二次構造と呼ばれる特異的な構造をつくる。
今回、開発したRNA二次構造予測手法は予測精度の期待値が最大になることを理論的に証明し、ベンチマークテストでも世界最高の精度で二次構造を予測できることを実証した。今後、機能性RNAの発見や、機能解明に貢献することが期待される。「CentroidFold」はフリーソフトウェアとして無償で提供される。
なお、本研究は、近くイギリスの論文誌Bioinformatics誌に掲載される予定。
従来RNAはDNA配列を元にタンパク質を合成するための中間物質と考えられていたが、近年RNAが生体内で様々な機能を担っていることが明らかになり、生命の機能を解明するための重要な物質として位置づけられてきた。このようなRNAを機能性RNAというが、機能性RNAを利用した医薬品の開発も進んでいる。
RNAが機能を発現するのは1本鎖の長い分子であるRNA分子が、部分的に2本鎖を形成して特異的な構造を形成することに由来する。2本鎖を形成するのは、RNAを構成する4種の塩基(A、G、C、U)のうち、AとU、GとCがお互いに引き合うためである。1本鎖RNAにおける塩基対形成の様子を二次構造とよぶ。(立体構造は三次構造ともよぶ)。
RNAの二次構造を解明することはRNAの機能解明の重要な手がかりとなる。しかし、二次構造の実験における観測は手間とコストの面で現実的ではなく、計算機による二次構造予測がRNA研究における重要な手段となっている。
二次構造予測の技術は、生物学実験では欠かせないDNA増幅(PCR)に用いるプライマーの設計や、近年医薬品としての用途を開拓しつつあるRNA干渉に用いるsiRNAの設計、さらにはマイクロアレイに用いるプローブの設計など、バイオテクノロジー産業に広く影響を与える基盤技術である。
二次構造予測がより正確になることによって、より高い精度のsiRNA設計が可能になったり、生体内におけるRNA分子の機能解明をより正確に推定したりすることが可能になるなど、RNA医薬品開発のための技術水準を一段高めることになる。
産総研では将来のゲノム創薬支援技術を目指した基盤技術構築の一環として、機能性RNAの網羅的予測の研究に取り組んでいる。そのために、みずほ情報総研、JBIC、東大と共同でRNAの機能を解明するのに不可欠な二次構造を計算機上で効率よく扱うための基盤技術の開発に取り組んできた。今回、RNA二次構造予測に関する新理論に基づく、世界最高の予測精度を有するソフトウェア「CentroidFold」を開発した。
本研究は、独立行政法人 新エネルギー技術総合開発機構(NEDO)の「機能性RNAプロジェクト」によって行われた。
1本の長いRNA鎖がとる塩基対(AとU、GとC)の組み合わせは膨大な数になるが、RNAを安定な状態にする塩基対の組み合わせは限られており、その数は1つではない。従来の予測では最も安定な二次構造を正しい二次構造として求める方法がとられてきたが、最も安定な二次構造が必ずしも正しい二次構造であるとは限らない場合が多々あることが経験的にわかってきた。
細胞内の物質は1つの構造に固定されているのではなく、熱のエネルギーによって常に形を変化させながらゆらいでおり、RNAもまたゆらいでいると考えられる。従来の二次構造予測では、理論上最も安定な二次構造だとしても、ゆらぎの影響を受けやすいものが含まれている。このことが、従来の予測方法で正しい二次構造を予測できない原因ではないかということが、最近の研究からわかってきた。
共同研究チームでは、上記の知見に触発され、予測精度の期待値を最大化する独自手法を用い、ゆらぎの影響を受けにくい二次構造予測技術の開発に成功し、RNA二次構造予測を行うソフトウェア「CentroidFold」として実装した。
「CentroidFold」は、RNAの二次構造予測の精度を評価するために広く用いられているベンチマークデータセット(構造がわかっているRNA)を用いた計算機予測実験によって、従来のRNA二次構造予測手法より高精度であることが実証された。
「CentroidFold」はフリーソフトウェアとして無償で提供されるほか、インターネットを通じて、二次構造予測サービスが12月18日より公開される。(http://www.ncrna.org)
「CentroidFold」は、二次構造予測の標準的なソフトウェアのひとつとして、生物学におけるRNAの機能解明や、新しい機能性RNA発見のための一助となる一方、バイオテクノロジー産業において、より品質の高いPCRプライマーやsiRNA、マイクロアレイプローブの設計のための一助となることが期待される。