斎藤です。IFからの機械学習と scikit-learn が学べる「Pythonデータ機械学習初級」に続き、「Python機械学習中級」をリリースしました。
以下の4つのパートがあります。
- クラスタリング
- 次元削減
- 決定木の良いモデルとは
- 機械学習中級・演習
Python機械学習中級の紹介
今回のリリースでは、以下の scikit-learn の全体的なカテゴリをわかりやすくしました。
- 前処理(欠損値、データのカテゴライズ)
- 分類(ロジスティック回帰、決定木、サポートベクターマシン)
- クラスタリング(K-means法)NEW !
- 次元削減(主成分分析)NEW !
モデル選択(決定木の良いモデルとは)が追加されています。NEW !
「決定木の良いモデルとは」の一部のクエストは、Python機械学習初級より移動しました。
- Pythonデータ処理初級と中級、Python機械学習初級も、解説をブラッシュアップしました。
- 「はじめての機械学習」パートに「scikit-learnとは」を追加しました。教師あり学習、教師なし学習を紹介しています。
クラスタリング
教師なし学習で、よく使われる手法です。顧客ごとの販売データを元に、顧客をクラスタリングしています。
次元削減
画像データを元に、教師なし学習の次元削減について学習します。
決定木の良いモデルとは
良いモデルとは、どういうモデルかについて、決定木モデルをベースに学習します。
機械学習中級・演習
復習するパートです。 PyQでは写経を通してやり方を学び、繰り返し実行することでプログラミングができるようにサポートします。
いかがでしょうか?
scikit-learn は、機械学習の入り口として広く使われてます。 しかし、多くの機能があって、全部を把握するのは大変です。
今回は、全体的な見方を補足することによって、学習しやすいように増補しました。
これからも、コンテンツを拡充していきたいと思いますので、よろしくお願いします。