【坊農秀雅先生先生】 講師要旨
講演タイトル:
実践系バイオインフォマティクス(マイクロアレイデータ解析編)
入門編 (マイクロアレイデータ解析関連ウェブツールの紹介、使い方)
第二部 実戦編 (マイクロアレイデータを使った実戦的な解析現場の紹介)
ヒトゲノムプロジェクトを始めとするさまざまな生物種でのゲノム配列決定に伴って大量のDNA塩基配列データが集積する一方、マイクロアレイ技術による大量の遺伝子発現データが比較的簡単に得られるようになってきていて、それらの大量の情報を処理して生物学的に有意な結論を引きだすバイオインフォマティクスの重要性が認知されてきている。
遺伝子発現情報は、個体のどの細胞をとっても同じであるゲノム配列情報に比べると、時間的にも(発生段階、細胞周期など)空間的にも(細胞の組織や細胞内局在など)可変な情報で、再現性という観点からも振れが大きく「堅い」情報ではない。すなわち、遺伝子配列情報は基本的には塩基配列なら4種類、アミノ酸配列なら20種類しかない一方、遺伝子発現情報はEST(Expressed Sequence Tag)やSAGE(Serial Analysis of Gene Expression)タグなどのカウント数や蛍光強度、2つの状態の発現比として数値データとして得られる。したがって遺伝子発現情報は配列データベースのように画一的な遺伝子配列(もちろん、SNPなどの多型情報も含まれるわけであるが)として表現することは難しい。それでもNCBIではGEO(Gene Expression Omnibus)、EBIではArrayExpress、DDBJではCIBEXという名前で個々のデータを寄せ集めて、塩基配列データベース(DDBJ/EMBL/GenBank)のような公共データベース化を進めている。これまで、多くの遺伝子発現データ、とくにマイクロアレイによる遺伝子発現データを産生してきた研究室がそのデータベース化の重要性と有用性に気づき、それぞれ独自にデータベース化を行ってきた。その結果、現時点ではそれらをうまく使うことで必要な遺伝子の発現情報を多くの場合得ることができる。そして、調べた遺伝子に関する発現データはGene Ontology(GO)などの遺伝子機能アノテーションや、その遺伝子がマッピングされるゲノム上の位置の情報と合わせて、生物学的に解釈していく必要がある。
本講演では、第一部(入門編)と第二部(実戦編)にわけて、目的を分けてお話する。
第一部では上記の流れに沿って、ウェブインターフェースで利用可能な公開されているマイクロアレイやSAGEなどの遺伝子発現データベースと、移行しつつある遺伝子発現情報の公共データベースの利用方法の紹介を中心にお話する予定である。より具体的には、「バイオデータベースとウェブツールの手とり足とり活用法」(中村保一 他編、羊土社)にあるようなスタイルのバイオデータベースとウェブツールの使いこなしを、今夏刊行予定の「ゲノム比較解析の初歩と医学研究への応用(仮題)」(羊土社刊)の「2章2-1遺伝子の発現情報をデータベースから調べる」に則してお話しする予定である。さらにゲノムアノテーションと合わせて、得たデータを生物学的に解釈する一連の流れを掴んでもらうことを最終目的とする。この入門編で必要とされるコンピューターリテラシーはウェブブラウザーが使えるレベルを想定している。
第二部では、実戦的なデータ解析現場の例として、時計遺伝子で有名な bHLH 型転写因子の結合配列を上流にもつ遺伝子群とそのマイクロアレイによる遺伝子発現情報の対比を実際に解析することを試み、ゲノムワイドな解析の実際に触れてもらう。こちらでは、拙著「初心者でもわかるバイオインフォマティクス入門」(羊土社)や「バイオ研究が10倍はかどるMacOSX活用マニュアル」(中村保一他著、羊土社)の第3章にあるようなUNIXコマンドやちょっとしたPerlやRubyプログラミングを利用する。そのため、この実戦編のより深い理解にはこれらの知識をある程度持っていることが望ましい。
なお、本講演で用いたスライドなどは、以下のウェブページから公開して講演後の復習等に役立ててもらうものとする。
http://bonohu.jp/docs/seikawakate05/
http://bonohu.jp/