|
|
バイオインフォマティクスとは何か?
1. はじめに
バイオインフォマティクス(Bioinformatics, 生命情報科学)は、コンピュータ上での情報解析を通じて、生物のゲノム構造、遺伝子発現制御機構、タンパク質の立体構造と機能、代謝経路、シグナル伝達経路などの様々な研究を支援し、あるいはこれらの生命現象に関する新たな仮説を実験研究者に提示すること等を目的とした学問領域である。当初はバイオインフォマティクスといえば、遺伝子配列やアミノ酸配列のデータベースに対する配列相同性検索(sequence homology search)や、タンパク質の二次構造予測(secondary structure prediction)などの比較的簡単な情報処理を意味し、まさに実験研究者への技術支援だけを行う存在であった。やがてゲノム・トランスクリプトーム・プロテオーム・メタボロームなどの俯瞰的情報が得られる時代になると、計算機による網羅的な情報解析でなければ見えてこない現象なども明らかになり、バイオインフォマティクスは単なる支援サービスを超えて、生物学研究の一つの強力な一派としても期待されつつある。
ただし下記にも述べるように、これまでのバイオインフォマティクスも様々な背景を持つ研究者の流入によって成り立ってきたが、今後とも新しい背景をもった新しい人材が流入してこの分野を作っていく必要がある。もしバイオインフォマティクスが、やがて計算生物学(in silico biology)と呼ばれる日が来るのであるなら、そこに携わる研究者は単に計算のプロであるだけではなく、生物学・生化学を真に志す者でなければならないはずである。
2. バイオインフォマティクスの概観
バイオインフォマティクスでは、分子生物学、分子遺伝学、細胞生物学などに関わる多くの問題が扱われている。図は、筆者が1999年に書いた解説記事1) での分類案であるが、各分野での技術進展はめまぐるしいものの、分野の概観は当時からさほど大きな変化はない。(創薬支援に関わる研究はバイオインフォマティクスが社会と関わるための「出口」として特に重要と筆者は考えているため、高分子構造の研究とは別項目として加えていた。)
バイオインフォマティクス研究は1970年前後から始まっている。これまでの発展段階をもしも大くくりに時間的経緯から整理すると、少なくとも3つの異なる技術の流れがあるのではないかと筆者は考えている。第一世代は、配列間の相同性解析や進化系統樹の作成など、配列や構造データ間の「比較」をするための技術であった。確率統計や最適化の理論が活用された。いったんデータ間の距離などを数学的に定義できてしまえば、求められる処理は明確であるので、理論的にはもっとも深く発展した分野といって良いだろう。
つづいて現れた第二世代は、ゲノム配列からの遺伝子領域の発見や、アミノ酸配列からのタンパク質立体構造や機能の類推など、「推定」をするための技術であった。これは入力したデータとは質の違う情報を計算機に出力させ、実験前に予想しようというものである。ニューラルネットワーク、サポートベクターマシン、その他の数理統計的な予測手法が広く試みられた。第一世代とは必要とされる人材も少し異なり、いわゆる人工知能や学習理論などの専門家が流入した。ゲノム配列をはじめとするデータの洪水に対処するためには、最も必要な技術の一つと言えるのだが、計算機で予測をしなくても安価に計測できる技術が登場してしまえばそこで使命は終わりである点が、「比較」の永続的な役割とは異なっている。その一方で、そうして大量に得られた実験データをフルに活用して、より精度が高く、高速な推定アルゴリズムが現れるという繰り返しで発展してきた分野である。
第三の流れは、複雑なシステムの「シミュレーション」であろう。代謝パスウェイや遺伝子制御ネットワークについても量的なシミュレーションが試みられ始めている。これを行うにはシステム工学や、非線形理論の専門家などの人材の流入も求められている。世代という言葉を使ったが、前の世代の技術が不要になることはなく、第一世代の「比較」は複数の全ゲノム間の比較など、量的にも質的にも益々発展しているところである。最新の情報科学の理論を用いなければ、優れたバイオインフォマティクスのツールは作成できないが、それをどう使うかは生物学者・生化学者の(従来は?)領分である。この両者の微妙な関係とマナーについては、講演の中でできるだけわかりやすく説明したい。
- 秋山 泰: バイオインフォマティクス~情報システムとしての生命現象の理解へ~, 情報処理, 40(11), 1136-1138, (1999)
- 秋山 泰: バイオインフォマティクスが必要とする計算機環境, 蛋核酵, 48(9), 1306-1312, (2003)
- 秋山 泰: バイオインフォマティクス研究者スキル, 情報処理, 46(3), 239-245, (2005)
- 阿久津,秋山: バイオインフォマティクスと人工知能の相互作用, 人工知能学会誌, 22(1), 42-48,(2007)
|
|