Qiitaは、技術系の記事を投稿するサイトであり、記事の品質に応じて「いいね」をもらうことができます。この記事では、Pythonを使用してQiitaの投稿の「いいね」数をスクレイピングする方法を説明します。
必要なライブラリ
このスクリプトを実行するには、次のライブラリをインストールする必要があります。
- requests
- beautifulsoup4
スクリプトの解説
以下のPythonスクリプトは、指定されたQiitaの記事のURLから「いいね」数を取得するものです。
import requests
from bs4 import BeautifulSoup
url = "https://qiita.com/XXXXX/YYYYY" # 対象のQiita記事のURL
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
likes = soup.select_one(".st-ActionCount__count").text
print("いいね数:", likes)
上記のスクリプトでは、requestsモジュールを使用して指定されたURLからHTMLを取得し、beautifulsoup4ライブラリを使用してHTMLをパースしています。次に、CSSセレクタを使用して、「いいね」数を取得しています。
QiitaのHTML構造は定期的に変更される可能性があるため、CSSセレクタが正しく動作しない場合は、HTMLの構造を確認し、適切なセレクタを使用してください。
結論
Pythonを使用してQiitaの投稿の「いいね」数をスクレイピングする方法を紹介しました。上記のスクリプトを使用することで、PythonでWebスクレイピングをする上での基礎を学ぶことができます。