るどさんのブログ

フリーランスプログラマーがライフハック的なことや他色々なことについて徒然なるままに語るブログ

【Python入門】検索サイトの検索結果をスクレイピングする

Webサイトの情報をプログラムで取得したい

そんなときはPythonでWebスクレイピングすれば簡単に取得できます。

以下のサンプルはSeleniumを使った方法です。

以下の手順を自動で行ってくれます。

①Yahoo検索サイトにアクセスして、キーワードに”青汁”を入力。

②検索ボタンを押す。

③広告を除いた一番上に表示された検索結果を取得。

④コンソールに表示する。

 

yahoo検索の検索結果をスクレイピングするサンプルプログラム
#!/usr/bin/env python
# -*- coding: utf8 -*-
import sys
import time

import json
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.keys import Keys

print("start")

options = Options()
#options.add_argument('--headless')
options.add_argument('--no-sandbox')
#options.add_argument('--disable-gpu')
browser= webdriver.Chrome(chrome_options=options)

url = "https://www.yahoo.co.jp/"
browser.get(url)

word = "青汁"
e = browser.find_element_by_id("srchtxt")
e.clear()
e.send_keys(word)

e = browser.find_element_by_id("srchbtn")
e.click()

e = browser.find_element_by_id("WS2m")

w = e.find_element_by_class_name("w")

text = w.text
print("%s" % (text))

print("end")