ダウンロード数: 175

このアイテムのファイル:
ファイル 記述 サイズフォーマット 
KJ00004705536.pdf820.18 kBAdobe PDF見る/開く
タイトル: An introduction to DNA microarrays and some mathematical challenges behind them
その他のタイトル: DNAマイクロアレイ技術および関連する数学的課題(数学者のための分子生物学入門,研究会報告)
著者: Vert, Jean-Philippe
阿久津, 達也  KAKEN_name
発行日: 20-Oct-2003
出版者: 物性研究刊行会
誌名: 物性研究
巻: 81
号: 1
開始ページ: 130
終了ページ: 141
抄録: DNAには多くの遺伝子が含まれているが、各遺伝子にはタンパク質に関する情報が記述され、必要に応じて遺伝子からタンパク質が合成される。生物の理解のためには、遺伝子がどのように制御されるか(すなわち、各タンパク質が、いつ、なぜ、どのように合成されるか)、各タンパク質はどのような機能を持つか、タンパク質どうし、もしくは、タンパク質が周囲の物質や刺激とどう相互作用するか、を明らかにすることが必要である。近年、開発されたDNAマイクロアレイやDNAチップといった技術を用いることにより、様々な条件下において、各生物のほぼすべての遺伝子の発現(タンパク質の生成)量を間接的に同時に観測することができるようになりつつあるため、その情報解析手法の開発も重要な課題となっている。1. DNAマイクロアレイ技術 DNAマイクロアレイは、あらかじめ各遺伝子配列より作成した一本鎖のプローブDNAをガラス基板などの上に配置したものである。一方、細胞よりメッセンジャーRNAを通じて抽出した一本鎖の相補DNA(cDNA)を蛍光物質などでラベルしておき、これらのcDNAとマイクロアレイ上のプローブDNAをハイブリダイゼーションと呼ばれる技術を用いて結合させることにより、メッセンジャーRNAの量を間接的に測定する。2.データの正規化 DNAマイクロアレイによる実験データは、画像データとして得られるため、まず、画像処理を行い各遺伝子に対応する領域の強度を求める。しかしながら、遺伝子により強度やその分布に大きな違いがあるため、データの正規化が必要となる。そのために、リファレンスとなる状態のデータと観測したデータを比較し、さらに統計解析などを行うことにより正規化するという手法が広く利用されている。3.教師なし学習 通常、数十から数百程度の異なる環境下で数千から数万個の遺伝子の発現量を観測する。これらの発現データの解析法としてクラスタリングと呼ばれる教師なし学習法(分類法)が広く利用されているが、その利用法は大きく二種類に分けられる。一つは遺伝子発現量の違いによる細胞の分類であり、もう一つは遺伝子発現量の変化の比較による遺伝子の分類である。前者は数万次元空間における数百点の分類に相当し、後者は数百次元空間における数万点の分類に相当する。クラスタリング手法は、階層的クラスタリング法と分割に基づくクラスタリング法に大きく分類されるが、どのようなクラスタリングを用いれば良いかはよくわかっていない。4.教師あり学習 遺伝子発現データは、がん細胞の分類にも利用できるが、その際には学習データの一部としてあらかじめ分類結果が与えられることが多い。このような場合の学習は教師あり学習と呼ばれる。教師あり学習の場合には、学習データに対するエラーが最小となる仮説を計算するといった戦略がよく用いられるが、発現データの場合には、数千から数万次元のデータを扱うため、過学習を起こし易い。高次元における学習は重要な数学的研究課題である。5.システム生物学 遺伝子やタンパク質などの制御関係やパラメータを明らかにし、生物の数理モデルを作成し、より正確なシミュレーションを行うことは今後の重要な研究課題であり、システム生物学の名のもとに研究が進展しつつある。制御関係やパラメータの推定のためにベイジアンネットワークなどの確率モデルや微分方程式に基づく方法が研究されている。しかしながら、より多様なデータに対する数理モデルや推定方式など、研究すべき課題は多い。
記述: この論文は国立情報学研究所の電子図書館事業により電子化されました。
URI: http://hdl.handle.net/2433/97609
出現コレクション:Vol.81 No.1

アイテムの詳細レコードを表示する

Export to RefWorks


出力フォーマット 


このリポジトリに保管されているアイテムはすべて著作権により保護されています。