見出し画像

何度目のスクレイピングか[selenium,chromedriverの導入]

こんばんは。今日もお疲れ様です。

Pythonスクレイピング
に何度か挑戦しているのですが、
何度も敗れてきました。

それはかのChatGPTの力を借りても、できず
ついにGUIツールに手を出し、csvにてデータをゲットし、
流石に良心の呵責があり、

本記事を書くに至りました。

youtubeの超優良サイトを参考にさせていただきながら、
ローカル環境(自分のパソコンの中)で、実装してゆきたいと思います。

Google colabではなく、ローカル環境で実際に追いかけさせていただき、その中でトラブルシューティングをしながら追いかける内容となります。

Macをお使いの方には特に実践向けな内容にできればと思うので、
どうかお楽しみください。

参考文献

本文

以下、terminalでの操作を想定しています。

パッケージインストール

$ pip install selenium

こちらで、seleniumというパッケージをインストールします。

pipとは、pythonのパッケージを管理するためのツールです。

「pipというソフトを使って 使うところにダウンロードしてくるよ セレニウムというパッケージをね」という文法ですね。

パッケージとは、再利用できる便利関数を定義している、モジュール(ファイルのようばもの)の集まりです。
中には、ファイルの中にファイルがあったり、そのファイルの中にコードが入っていたりと、私自身のファイルのように複雑な重層構造になっています。
これらを全部まとめてダウンロードしてくる便利ツール(ソフト)がpipということです。

ChromeDriverのインストール

$ brew install chromedriver

こちらでhomebrewを用いて、
chromedriverをインストールしてゆきます。

brewが使えなかった方は、homebrewをまだインストールできていない可能性があります。

こちらのサイトのコードを全コピーして、$の後ろに貼り
実行してください。
少し時間がかかるかもしれません。

homebrewとは、ソフトなどをダウンロードする際、そのバージョンを管理してくれる便利なソフトです。
macユーザーの相棒と言って良い存在です。

ぜひこの機会にインストールされてみてください。

chromedriverとは、chromeという
おそらく一度はお見かけしたことがあるであろうブラウザを
コードでいじるためのドライバーです。

ドライバーとは、ハードウエアやソフトウエアを外から制御するためのソフトです。
ドライバーで外からこじ開けるイメージで覚えやすくなるのではないでしょうか?

あとがき

ご精読ありがとうございました!
シリーズものにするというより、一本一本まんぞくできるものにできればと思います。
よろしくお願いいたします。




ありがとうございます!!!!!!!!!!!!!