[Python]第一个爬虫练习

news/2024/7/19 10:41:38 标签: 爬虫, python
import os
import io
import sys
import ssl
import urllib.request
#from importlib import reload

# 第一个爬虫练习
"""
url= "http://www.baidu.com"
data = urllib.request.urlopen(url).read()#
#data = data.decode('UTF-8')
print (data)
"""
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')

url = "https://www.douban.com"
request = urllib.request.Request(url)
ssl._create_default_https_context = ssl._create_unverified_context
responseurl = urllib.request.urlopen(request)
data = responseurl.read()
data = data.decode('utf-8')

print(data)
print(type(responseurl))
print(responseurl.geturl())
print(responseurl.info())
print(responseurl.getcode())

 

转载于:https://www.cnblogs.com/Start12/p/9342075.html


http://www.niftyadmin.cn/n/1661063.html

相关文章

java 图片中的二维码定位

java 图片中的二维码定位 使用技术:opencv 3.4.14 执行下载安装 import com.google.zxing.*; import com.google.zxing.client.j2se.BufferedImageLuminanceSource; import com.google.zxing.common.HybridBinarizer; import org.opencv.core.*; import org.openc…

shell及python脚本方式登录服务器

2019独角兽企业重金招聘Python工程师标准>>> 一、问题 在工作过程中,经常会遇见需要登录服务器,并且因为安全的原因,需要使用交互的方式登录,而且shell、python在工作中也经常用到,并且可以提供交互的功能。…

TransE 算法学习笔记

http://yaoleo.github.io/2017/10/27/TransE%E7%AE%97%E6%B3%95%E7%9A%84%E7%90%86%E8%A7%A3/ tranE是在模型中嵌入知识图谱等三元组类的一个方法,就像是句子利用词典嵌入一样。转载于:https://www.cnblogs.com/forPrometheus-jun/p/10516884.html

Git 安装 fatal: unrecognized command “/home/git/bin/gitolite-shell id_rsa“

2、错误2 上面的问题解决了,但是执行 git clone YourGitNameYourIP:gitolite-admin 还是报错,fatal: unrecognized command “/usr/share/gitolite/gl-auth-command admin" 这个命令找不到?直接在linux里面敲入,发现可以啊&…

StringBuffer的解读(二)

StringBuffer的解读(二) StringBuffer默认容量大小是16个字符。 StringBuffer后面append NULL的测试,代码如下:public class Test {public static void main(String[] args) {StringBuffer sb new StringBuffer("the")…

git将子目录拆分独立仓库并保存提交记录

git将子目录拆分独立仓库并保存提交记录 1. 需求说明 项目原来很大&#xff0c;将多个子模块柔和在一起&#xff0c;项目越做越大&#xff0c;这是需要将子模块拆分单独维护升级版本 2. 拆分独立仓库 2.1 将子目录拆分独立库 git subtree split -P <name-of-folder>…

软件工程第一次作业——制作个人简历

源码链接&#xff08;码云&#xff09;&#xff1a;https://gitee.com/chenlang1314/codes/zel6nka9duo5j7p83v4mq99 个人简历网址&#xff1a;qhucl245.ip2g55.tumm.top/index.html&#xff08;租的便宜服务器&#xff0c;如果出错&#xff0c;多刷新几次试试,将地址直接拷入地…

[转] 设置div的overflow:scroll,但是在手机上滑动的时候有点卡顿

设置div的overflow:scroll,但是在手机上滑动的时候有点卡顿&#xff0c;所以在这个div上加一个css: -webkit-overflow-scrolling : touch; 在苹果手机上使用-webkit-overflow-scrolling:touch会导致使用固定定位的元素&#xff0c;随着页面一起滚动&#xff0c;只有滚动停止时才…