このアイテムのアクセス数: 138
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
2185-04.pdf | 8.77 MB | Adobe PDF | 見る/開く |
タイトル: | 学習における特異点構造の分析について |
その他のタイトル: | On the analysis of singularity structure in learning (Computer Algebra - Theory and its Applications) |
著者: | 鷲野, 朋広 ![]() 高橋, 正 ![]() |
著者名の別形: | WASHINO, TOMOHIRO TAKAHASHI, TADASHI |
発行日: | Apr-2021 |
出版者: | 京都大学数理解析研究所 |
誌名: | 数理解析研究所講究録 |
巻: | 2185 |
開始ページ: | 29 |
終了ページ: | 46 |
抄録: | 3層パーセプトロンである学習モデルの中間ユニット数が2から1に変化する特異領域の近くでは学習が停滞するプラトーが起きる[1].Guoらは特異領域の近くの学習のダイナミクスを5つのパターンに分けて考察している[2].学習モデルの座標系を変換することにより,変化の速いパラメータを固定して変化の遅いパラメータの軌道を調べる[3]. 甘利らによって特異領域の近くの学習の安定性やダイナミクスが求められている[1], [4].第1に学習モデルとしてMathmaticaにおいてニューラルネットワークを作成する第2に特異領域の近くにある真の分布が学習モデルによって実現される場合,学習モデルの初期値を変えることによって臨界直線に影響を受けて変化するダイナミクスについて考察する.第3に特異領域にある真の分布が学習モデルによって実現される場合,学習損失が減少するが,汎化損失が増加する過学習が起き,真の分布が学習モデルによって実現されない場合,学習の初期に汎化損失が学習損失より減少して小さくなり,増加して大きくなる過剰般化が起きる.過学習,過剰汎化についてパラメータの変化を調ベ,学習・汎化損失曲面上のダイナミクスの考察をする. |
URI: | http://hdl.handle.net/2433/264915 |
出現コレクション: | 2185 Computer Algebra - Theory and its Applications |

このリポジトリに保管されているアイテムはすべて著作権により保護されています。