2014年10月2日木曜日

scikit-learn 学習はじめます

機械学習の勉強をせなならんとずっと思っていたので、
これからしばらく、scikit-learn の user_guide を順番にまとめながら、
機械学習を学んでいきたいと思います。 

 

 

 おおきな括りとしては以下の7つなので、順番にやって行く予定。

1. Supervised learning:
教師あり学習。学習したいデータに何らかのラベルがあるものが対象。

2. Unsupervised learning:
教師なし学習。学習したいデータにラベルがないものが対象。

3. Model selection and evaluation:
上の二つのモデルのパラメータ・性能の評価など。

4. Dataset transformations
学習したいデータの前処理。高次元のデータを、重要なものだけを選んだ低次元データにする。
(低次元データの方が学習しやすい / パフォーマンスが出やすい。) 

5. Dataset loading utilities
scikit-learn で遊ぶたえの学習データを用意しているので、その読み出し方。

6. Bigger data
より大きなデータのためのいろいろ。追加学習とか。

7. Computation performance
実行速度について 

 

たぶん、5 から始めるとおもちゃ (=toy data) がまず手に入るので、
 そこから始めようかな。

0 件のコメント:

コメントを投稿