淘先锋技术网
首页
1
2
3
4
5
6
7
关于爬虫的前提准备
Python的准备
Pip:用来下载对应的包。但是使用默认的下载人速度会比较慢,建议使用新华大学进校园,即 Pip install -u
用户代理表示告诉服务器,我们是什么类型的浏览器。本质上就是告诉浏览器,我们可以接受什么水平的文件内容。
使用到的包
Beautiful soup.把复杂的html文档转换成一个复杂的树形结构。每个节点都是Python对象。
re 是正则包,通常使用compile()函数
符号
含义
.
一个字符
*
一个或多个
?
0次或1次
\d
数字