ダウンロード数: 895
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
KJ00004705537.pdf | 820.74 kB | Adobe PDF | 見る/開く |
完全メタデータレコード
DCフィールド | 値 | 言語 |
---|---|---|
dc.contributor.author | Vert, Jean-Philippe | en |
dc.contributor.author | 阿久津, 達也 | ja |
dc.date.accessioned | 2010-02-10T06:48:40Z | - |
dc.date.available | 2010-02-10T06:48:40Z | - |
dc.date.issued | 2003-10-20 | - |
dc.identifier.issn | 0525-2997 | - |
dc.identifier.uri | http://hdl.handle.net/2433/97608 | - |
dc.description | この論文は国立情報学研究所の電子図書館事業により電子化されました。 | ja |
dc.description.abstract | 1.緒言 計算生物学の研究目的の一つは、実験的研究により生成される大量のデータを解析し、生物学的に有用な仮説を自動的に導くための計算手法を開発することである。また、生物学においては多種多様なデータが生成されるため、それらを統合して扱うことのできる数学的枠組みを見出すことは重要な課題の一つである。計算生物学において対象となるデータには、遺伝子配列データ、化学構造データ、遺伝子発現データなどがあるが、ここでは、これらを統一的に扱うことを可能とするカーネル法について説明する。カーネル法はここ十年間に機械学習分野において発展してきた手法であり、生物学を含む数多くの問題に応用されている。2. Mercerカーネル 集合Xの直積から実数へ関数K(x,y)が、対称性(K(x,y)=K(y,x))を満たし、さらに、正定値性を満たす場合に、関数K(.,.)はMercerカーネルと呼ばれる。K(.,.)がMercerカーネルである場合、あるヒルベルト空間Φ、および、XからΦへの関数φ(x)が存在し、K(x,y)はφ(x)とφ(y)の内積となる。より、厳密にはRKHS (reproducing kernel Hilbert space)と呼ばれるヒルベルト空間を用いることにより、MercerカーネルとRKHSを対応づけすることができる。また、RKHSの重要な性質として、RKHSが無限次元空間であっても、ある条件下で正則化された関数の最小化が有限個の点のみを考慮することで行えるということがあげられる。3.カーネル法 カーネル法の大きな利点の一つとして、ヒルベルト空間へ写像すること無しに種々の計算が行えることがあげられ、このことはカーネルトリックと呼ばれる。簡単な例としてはヒルベルト空間における2点間の距離がカーネル関数の簡単な組み合わせで求めることができる。より有用な例として、統計解析の主要手法の一つである主成分分析(PCA)が、カーネルを用いた場合にも、ヒルベルト空間における計算なしに行える。カーネルを用いた正準相関分析(CCA)は固有値計算問題に帰着することができ、二種類のデータを統合した解析を行うのに有用である。サポートベクターマシン(SVM)はカーネル法に基づく(教師あり)機械学習のための手法で、正負の例が与えられた時、正負の例を分離し、かつ、最近点までの距離(マージン)が最大となる超平面を計算する。実際には、正負の例を完全に分離することが不可能である場合が多いので、分類誤差と距離をトレードオフしたものを最適化する。SVMでは、カーネルトリックにより、最適な分離超平面が(多くの場合には少ないサイズの)正負の例の部分集合に対するカーネルの組み合わせにより表現される。4.タンパク質データに対するカーネル法 カーネル法を生物学データに適用するため、タンパク質や関連するデータに対するカーネル関数が提案されている。特に、配列(文字列)に対するカーネル関数はよく研究されている。長さkの部分文字列の出現頻度のベクトルを用いることにより、文字列からユークリッド空間へのカーネル関数を定義できるが、この手法はspectrumカーネルと呼ばれている。また、配列解析に広く利用されている確率モデルである隠れマルコフモデル(HMM)などから情報を抽出することによりカーネル関数を定義する、Fisherカーネルも提案されている。配列データ以外には、遺伝子発現データ、Phylogenetic Profileなどを扱うためのカーネルや、グラフ構造に関するdiffusionカーネルとカーネルCCAを組み合わせ代謝パスウェイと発現データの相関を抽出する研究などが行われている。カーネルの組み合わせに関する研究も行われており、半正定値計画法による、カーネルの線形結合の最適化などが研究されている。 | ja |
dc.format.mimetype | application/pdf | - |
dc.language.iso | eng | - |
dc.publisher | 物性研究刊行会 | ja |
dc.subject.ndc | 428 | - |
dc.title | Kernel methods in computational biology | en |
dc.title.alternative | 計算生物学におけるカーネル法(数学者のための分子生物学入門,研究会報告) | ja |
dc.type | departmental bulletin paper | - |
dc.type.niitype | Departmental Bulletin Paper | - |
dc.identifier.ncid | AN0021948X | - |
dc.identifier.jtitle | 物性研究 | ja |
dc.identifier.volume | 81 | - |
dc.identifier.issue | 1 | - |
dc.identifier.spage | 142 | - |
dc.identifier.epage | 155 | - |
dc.textversion | publisher | - |
dc.sortkey | 015 | - |
dc.address | Ecole des Mines de Paris | en |
dc.address | 京大化学研究所 | ja |
dcterms.accessRights | open access | - |
出現コレクション: | Vol.81 No.1 |
このリポジトリに保管されているアイテムはすべて著作権により保護されています。