Pythonでスクレイピングして遊んでみる

カテゴリ:Pythonの話

公開日:2020.07.01 最終更新日:2023.08.22
このエントリーをはてなブックマークに追加

こんにちは!伊神です!

この記事では、「Pythonでスクレイピングする方法」について簡単にご紹介します。

具体的には「HPのHTML情報を取得」「画像をスクレイピング」をして遊んでみました!

また、弊社ではWebプロモーション成功事例集をまとめた限定資料を無料で配布しています。

Webマーケティングに興味がある方は、下記ページより目を通してみてください。

事前準備

今回はデータ分析用のツール「Jupyter Notebook」を使用します。

Jupyter Notebookとは

Jupyter Notebook(https://jupyter.org/ ) は、ブラウザ上で動作するプログラムの対話型実行環境です。

ノートブックと呼ばれる形式で作成したプログラムを実行し、実行結果を記録しながら、データの分析作業を進めることができます。

またwebで集客する方法を別の記事にまとめております。

詳しく解説しているので、web集客について深く知りたい方は、ぜひこちらもご覧ください。

web集客
【2023年更新】Web集客の方法と種類を無料・有料別に紹介!
今回の記事を読むことで、Web集客をして、実際に売上を伸ばすための最適な方法をご紹介します。

Jupyter Notebookをインストール

Anacondaという開発環境のパッケージを利用すると、Jupyter Notebookと共に、データ分析やグラフ描画など、Pythonでよく利用されるライブラリをまとめてインストールできるので便利です。

1. Python3をインストール

Pythonの公式(https://www.python.org/)からインストール

2. Anacondaをダウンロード

Anacondaの公式(https://www.anaconda.com/products/individual)からダウンロード

3. Jupyter Notebookをインストール

Jupyter Notebookの「install」ボタンを押しインストールを行います。

インストールが終わると、ボタンが「Launch」に変わりLaunchをクリックすると、Jupyter Notebookが起動します。

詳しいJupyter Notebookの使い方はこちらを参考にしてください

https://qiita.com/takuyanin/items/8bf396e7b6b051670147
https://code-graffiti.com/how-to-use-jupyter-notebook/

スクレイピングで遊んでみよう

HTMLを解析する

HTMLを簡単に解析できるライブラリ「Beautiful Soup」を使用します。

今回はinglow(https://inglow.jp/)のサイトをスクレイピングしました!

その他にも「id属性」や「class属性」の名前を使用して範囲を絞り込んで検索することもできます!!

画像をスクレイピング

流れとしては

Webスクレイピング→画像のURL抜き出し→URLから画像保存

いらすとやの「pc」で検索結果画像をirasutoya_pcファイルに保存する処理を行います!

こんな感じで画像をスクレイピングすることができます!!

今回はいらすとやでスクレイピングを行いましたが、Google画像検索や違うサイトの画像も同じようにスクレイピングできるのでぜひ試してみて下さい!!

※著作権や利用規約を確認してから行って下さい。

最後に

今回はPythonでスクレイピングして遊んでみました。

pythonには様々なモジュールがあり様々なことが簡単にできたりするので是非調べてみて下さい!






弊社inglowでは、これから広告の運用を考えられている方、あるいはこれから広告代理店に運用をお願いされる方向けに、「業界別Web広告の成功事例」をまとめた資料を無料配布しております。

下記のフォームに入力いただくだけで、無料で資料をダウンロードしていただけます。ぜひご利用下さい。

mihon

    このサイトはreCAPTCHAとGoogleによって保護されています。プライバシーポリシー利用規約が適用されます。

    一覧へ戻る