您当前的位置:首页 > IT编程 > python
| C语言 | Java | VB | VC | python | Android | TensorFlow | C++ | oracle | 学术与代码 | cnn卷积神经网络 | gnn | 图像修复 | Keras | 数据集 | Neo4j | 自然语言处理 | 深度学习 | 医学CAD | 医学影像 | 超参数 | pointnet | pytorch | 异常检测 | Transformers | 情感分类 | 知识图谱 |

自学教程:python爬取分析超级大乐透历史开奖数据第1/2页

51自学网 2021-10-30 22:55:24
  python
这篇教程python爬取分析超级大乐透历史开奖数据第1/2页写得很实用,希望能帮到您。

博主作为爬虫初学者,本次使用了requests和beautifulsoup库进行数据的爬取

爬取网站:http://datachart.500.com/dlt/history/history.shtml —500彩票网
(分析后发现网站源代码并非是通过页面跳转来查找不同的数据,故可通过F12查找network栏找到真正储存所有历史开奖结果的网页)

如图:

在这里插入图片描述

爬虫部分

from bs4 import BeautifulSoup #引用BeautifulSoup库import requests     #引用requestsimport os      #osimport pandas as pdimport csvimport codecslst=[]url='http://datachart.500.com/dlt/history/newinc/history.php?start=07001&end=21018'r = requests.get(url)      r.encoding='utf-8'text=r.textsoup = BeautifulSoup(text, "html.parser")tbody=soup.find('tbody',id="tdata")tr=tbody.find_all('tr')td=tr[0].find_all('td')for page in range(0,14016): td=tr                                                        
matplotlib 范围选区(SpanSelector)的使用
用pip给python安装matplotlib库的详细教程
万事OK自学网:51自学网_软件自学网_CAD自学网自学excel、自学PS、自学CAD、自学C语言、自学css3实例,是一个通过网络自主学习工作技能的自学平台,网友喜欢的软件自学网站。