卓越飞翔博客卓越飞翔博客

卓越飞翔 - 您值得收藏的技术分享站
技术文章11201本站已运行3223

Python 批量抓取公众号,下载公众号话图片


import requests
import re
 
# 输入话题链接
topic_url = input("请输入话题链接:")
 
# 提取__biz和album_id参数
biz = re.search(r'__biz=(.*?)&',topic_url).group(1)
album_id = re.search(r'album_id=(.*?)&',topic_url).group(1)
 
# 构造请求头
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}
 
# 发送请求获取网页源代码
response = requests.get(topic_url, headers=headers)
 
# 使用正则表达式匹配出图片链接和标题
img_links = re.findall('data-src="(.*?)"',response.text)
titles = re.findall('data-title="(.*?)"',response.text)
 
# 遍历标题和图片链接,下载图片并保存
print("正在下载图片...")
for i,j in zip(titles,img_links):
    img_url = j.replace("amp;","")
    img_data = requests.get(img_url,headers=headers)
    with open(i+'.jpg','wb') as f:
        f.write(img_data.content)
print("下载完成!")
卓越飞翔博客
上一篇: Python内网终端开放端口扫描程序
下一篇: Python代码 统计阿里云每日统计账户余额,然后通过钉钉发送到钉钉群
留言与评论(共有 0 条评论)
   
验证码:
隐藏边栏