機械学習の勉強をせなならんとずっと思っていたので、
これからしばらく、scikit-learn の user_guide を順番にまとめながら、
機械学習を学んでいきたいと思います。
おおきな括りとしては以下の7つなので、順番にやって行く予定。
1. Supervised learning:
教師あり学習。学習したいデータに何らかのラベルがあるものが対象。
2. Unsupervised learning:
教師なし学習。学習したいデータにラベルがないものが対象。
3. Model selection and evaluation:
上の二つのモデルのパラメータ・性能の評価など。
4. Dataset transformations
学習したいデータの前処理。高次元のデータを、重要なものだけを選んだ低次元データにする。
(低次元データの方が学習しやすい / パフォーマンスが出やすい。)
5. Dataset loading utilities
scikit-learn で遊ぶたえの学習データを用意しているので、その読み出し方。
6. Bigger data
より大きなデータのためのいろいろ。追加学習とか。
7. Computation performance
実行速度について
たぶん、5 から始めるとおもちゃ (=toy data) がまず手に入るので、
そこから始めようかな。
0 件のコメント:
コメントを投稿