这篇教程Python自动爬取图片并保存实例代码写得很实用,希望能帮到您。
一、准备工作用python来实现对百度图片的爬取并保存,以情绪图片为例,百度搜索可得到下图所示 
f12打开源码 
在此处可以看到这次我们要爬取的图片的基本信息是在img - scr中
二、代码实现这次的爬取主要用了如下的第三方库 import reimport timeimport requestsfrom bs4 import BeautifulSoupimport os 简单构思可以分为三个小部分 1.获取网页内容 2.解析网页 3.保存图片至相应位置 下面来看第一部分:获取网页内容 baseurl = 'https://cn.bing.com/images/search?q=%E6%83%85%E7%BB%AA%E5%9B%BE%E7%89%87&qpvt=%e6%83%85%e7%bb%aa%e5%9b%be%e7%89%87&form=IGRE&first=1&cw=418&ch=652&tsc=ImageBasicHover'head = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 Edg/92.0.902.67"} response = requests.get(baseurl, headers=head) # 获取网页信息 html = response.text # 将网页信息转化为text形式 是不是so easy 第二部分解析网页才是大头 来看代码 Img = re.compile(r'img.*src="(.*?)"') # 正则表达式匹配图片soup = BeautifulSoup(html, "html.parser") # BeautifulSoup解析html #i = 0 # 计数器初始值 data = [] # 存储图片超链接的列表 for item in soup.find_all('img', src=""): # soup.find_all对网页中的img python数据可视化Seaborn画热力图 python数据可视化Seaborn绘制山脊图 |