【スクレイピング】LINEのタイムラインをすべて取得してみる③

前回の記事の続きです。

自動操作でTL画面まで行くスクリプト

安全上、コード実行時に毎回ログインしなおすという仮定で書いていきます。

まずは、使用するライブラリをインポートします。最初は4個くらいしか使っていなかったのに、完成したら8個まで増えてました。。。

上の5個はseleniumのライブラリで、自動操作やスクレイピングに使用します。

他は正規表現や処理中の表示に使います。

次にユーザー情報を定義します。

前回の記事で入手したURLもここで定義します。

chromedriver_passはjupyterでスクリプトを実行する場合は必要です。chromedriverの実行ファイルまでのパスを定義してください。

また、ここでは情報をべた書きしていますが、本当は.envファイルに書いて、それを読み込んだほうが良いです。

次は、Chromeを起動して自分のTL画面までいくスクリプトを書いていきます。

ログインフォームに自動入力し、ボタンクリックしています。

認証するまでロードが長いのでtime.sleep(2)で2秒待っていますが、本当はseleniumに処理が完了するまで待つメソッドがあるらしいのでそれを使うべきだと思います。

こんな感じでChromeを自動起動→ログイン→TL画面遷移まで実装しました。

次回からスクレイピングしていきます。







コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です