常用库
urllib
requests
1.请求
selenium
1.驱动浏览器的
2.自动化测试
chromedriver
https://chromedriver.chromium.org/
1.驱动浏览器
1.放到pip同级
phantomjs
下载 https://phantomjs.org/download.html
添加环境变量
1.无界面浏览器
lxml
1.xpath解析
beatifulsoup4
引入from bs4 import beautifulsoup
1.html解析库
pyquery
1.解析库
pymysql
存储库
pymongo
存储库
redis
存储库
flask
web库
django
web服务框架
jupyter
打开 jupyter notebook
1.记事本
2.运行脚本 ctrl+回车 运行
3.增加一行,按b, 删除一行按d
linux 安装
pip3 install requests selenium beautifulsoup4 pyquery pymysql pymongo redis flask django jupyter
splash
地址 https://github.com/scrapinghub/splash