イメージ図
手順
1.中心点を、データの中からランダムにk個選択する
2.データ毎に、k個の中心点との距離を計算し、最も近い中心点のクラスタに割り
当てる
3.クラスタごとに、データの平均値を求め、新たな中心点を選ぶ
4.中心点の変化がなくなる、あるいは、決められた回数、1~3をやる
留意点
・k-menas法では、最初に選択した中心点によって、結果が大きく左右されることがある
PR
「人工知能 人類最悪にして最後の発明」 を読んで、興味を持ったこと等を、
書いてみたいと思います。
ナノテクノロジーの発展を妨げている一見攻略不可能な問題の解決法を
人工知能が発見し、それによって、ナノテクノロジーが、加速度的に進歩する
という
なにか、こわい世界ですね。
テクノロジーをコントロールすることが、
これから、ますます、重要になってくるような気がします。
しかし、コントロールのための技術って、だんだろうな?
アンサンブル学習
・複数の分類モデルで、クラスを推測し、多数決で最終決定する
・1つ1つの分類器を、弱分類器という
・アンサンプル学習には、「バギング」や「ブースティング」と呼ばれる手法がある
・バギングは、学習用データから、ランダムにデータを抽出して、それぞれ、弱分類器を作成する
・ブースティングは、学習用データの重み付けを変えることで、弱分類器を作成する
平均は、極端な数値に左右されやすい。
そこで、最小値、最大値を除いて、平均をとることがある。
これを削除平均という。
1. 標本空間
・試行で起こりうるすべての結果の集合
・硬貨を1回投げる試行では、標本空間は、{表、裏}
・サイコロを1回投げる試行では、標本空間は、{1、2、3、4、5、6}
2.事象
・試行の結果のこと
3.独立事象
・一方の試行の結果が、他方に影響しない場合のこと