忍者ブログ

いけいけ理系NEO

情報処理試験など、理系の試験対策、関連知識、日記などです

機械学習 k-menas法

イメージ図

手順


1.中心点を、データの中からランダムにk個選択する

2.データ毎に、k個の中心点との距離を計算し、最も近い中心点のクラスタに割り
当てる

3.クラスタごとに、データの平均値を求め、新たな中心点を選ぶ

4.中心点の変化がなくなる、あるいは、決められた回数、1~3をやる

留意点


・k-menas法では、最初に選択した中心点によって、結果が大きく左右されることがある


PR

人工知能 人類最悪にして最後の発明 を読んで・・・


「人工知能 人類最悪にして最後の発明」 を読んで、興味を持ったこと等を、
書いてみたいと思います。
ナノテクノロジーの発展を妨げている一見攻略不可能な問題の解決法を

人工知能が発見し、それによって、ナノテクノロジーが、加速度的に進歩する

という

なにか、こわい世界ですね。

テクノロジーをコントロールすることが、

これから、ますます、重要になってくるような気がします。

しかし、コントロールのための技術って、だんだろうな?




機械学習 アンサンプル学習


アンサンブル学習

・複数の分類モデルで、クラスを推測し、多数決で最終決定する

・1つ1つの分類器を、弱分類器という

・アンサンプル学習には、「バギング」や「ブースティング」と呼ばれる手法がある

・バギングは、学習用データから、ランダムにデータを抽出して、それぞれ、弱分類器を作成する

・ブースティングは、学習用データの重み付けを変えることで、弱分類器を作成する




削除平均



平均は、極端な数値に左右されやすい。

そこで、最小値、最大値を除いて、平均をとることがある。

これを削除平均という。



確率に関する用語


1. 標本空間

 ・試行で起こりうるすべての結果の集合

 ・硬貨を1回投げる試行では、標本空間は、{表、裏}

 ・サイコロを1回投げる試行では、標本空間は、{1、2、3、4、5、6}

2.事象

 ・試行の結果のこと


3.独立事象

 ・一方の試行の結果が、他方に影響しない場合のこと