Jupyter Notebookでscikit-learnを使って機械学習してみる

カテゴリ:Pythonの話

公開日:2020.07.15 最終更新日:2020.07.15
このエントリーをはてなブックマークに追加

こんにちは伊神です!

この記事ではJupyter Notebookでscikit-learnを使って機械学習する方法を紹介します。

Pythonは様々な用途で使われますが、ディープラーニングや分析などの機械学習が強いです。その機械学習についてscikit-learnライブラリを用いてご紹介します。

Jupyter Notebook

Jupyter Notebookについてはこちらを参考にして下さい。

scikit-learn

scikit-learnはpythonの機械学習ライブラリです。

機械学習の有名アルゴリズムを多く含んでいて、機械学習に必要なデータ処理などのツールも提供しています。

scikit-learnは以下の4つのカテゴリに分かれています。

  • 分類(classification)
  • 回帰(regression)
  • 次元圧縮(dimensionality reduction)
  • クラスタリング(clustering)

今回は「回帰(regression)」について紹介していこうと思います。
回帰分析は、データに基づいてある数値を予測することです。

出典:scikit-learn.org

サンプルコード

今回は「重回帰分析」というものを使って、ボストン市の様々な説明変数から適正価格を出します。

公式ドキュメントを参考にしました。

https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html

1.ライブラリのインポート

今回必要な必要なライブラリをインポートします。

2.データのインポート

ボストンの住宅情報データなどデータをダウンロードします。

3.ボストンの住宅データを元に価格を予想する

データを目的変数と説明変数に分ける

学習データと検証データに分割。predict()関数で予想。

4.グラフで表示

まとめ

今回はPythonの機械学習をscikit-learnライブラリを使用し紹介しました。

scikit-learnは様々なことができるのでぜひ調べてみて下さい!

一覧へ戻る