爬多页图片

news/2024/7/19 10:01:00 标签: python, 爬虫, 图片

既然能爬单页的图片了,接下来就要爬多页的啦

任务:爬取某壁纸网站的壁纸

# -*- coding: utf-8 -*
import urllib
import re

def getHtml(url):
      page=urllib.urlopen(url)
      html=page.read()
      return html

def getImg(html):
    print'开始执行'
    reg =r'src="(.*?\.jpg)" alt="'
    imgre =re.compile(reg)
    imglist=re.findall(imgre,html)
    if i==1:
        x=0
    else:
        x=17*i
    for imgurl in imglist:
        urllib.urlretrieve(imgurl,'%s.jpg' % x)
        x+=1

之前的代码和爬单页的代码一样,那怎样实现爬多页呢,通过观察,一个网站的网页的网址是有一定的规律的
想我爬的这个
http://www.ivsky.com/bizhi/index_%s.html只有index后边的数字不同,并且是由1逐渐递增的
所以用一个for循环来遍历啊
  for i in range( 1, 5): url = "http://www.ivsky.com/bizhi/index_%s.html"%i html=getHtml(url) getImg(html)

爬取结果

(该网站每页由18张哦)




http://www.niftyadmin.cn/n/787728.html

相关文章

企业级实战——畅购商城SpringCloud-JAVA实战商城管理后台——查询所有品牌集合实现

QQ 1274510382 Wechat JNZ_aming 商业联盟 QQ群538250800 技术搞事 QQ群599020441 解决方案 QQ群152889761 加入我们 QQ群649347320 共享学习 QQ群674240731 纪年科技aming 网络安全 ,深度学习,嵌入式,机器强化,生物智能,生命科学。

python读文件readlines_Python File readlines() 使用方法

概述 readlines()方法用于读取所有行(直到结束符 EOF)并返回列表,该列表可以由 Python 的 for... in ... 结构进行处理。 如果碰到结束符 EOF 则返回空字符串。 语法 readlines()方法语法如下: fileObject.readlines( ); 参数 无。 返回值 返回列表&…

在Scala里面如何使用元组

元组在Scala语言中是一种十分重要的数据结构,类似数据库里面的一行记录(row),它可以将不同类型的值组合成一个对象,在实际应用中十分广泛。 先来看一个简单的tuple定义: val tuple("张三",25)//…

img外头包着a时底部出现的一小段高度的解决方法。图片水平垂直居中用css解决的方法。...

<a><img/></a>这种结构有时候在界面预览的时候会出现一段多出来的高度。这个高度&#xff0c;一开始我很奇怪是什么原因产生的。鼠标移动到a标签上会有高度出现&#xff0c;一开始我以为是a标签的高度。可是我看a是隐藏的&#xff0c;隐藏的不是不会有高度撑…

爬网站文字链接及标题

任务&#xff1a;还是那个壁纸网站&#xff08;就是之前这个啦https://blog.csdn.net/qq_40024605/article/details/79067580&#xff09;&#xff0c;这次要爬壁纸的文字标题及链接并写入文件保存 实现&#xff1a;# -*- coding: utf-8 -* import urllib import re #这个很重要…

企业级实战——畅购商城SpringCloud-JAVA实战商城管理后台——根据ID查询品牌实现,增加,删除,修改

QQ 1274510382 Wechat JNZ_aming 商业联盟 QQ群538250800 技术搞事 QQ群599020441 解决方案 QQ群152889761 加入我们 QQ群649347320 共享学习 QQ群674240731 纪年科技aming 网络安全 ,深度学习,嵌入式,机器强化,生物智能,生命科学。

java 集合_Java集合类

集合类存放于 Java.util 包中&#xff0c;主要有 3 种&#xff1a;set(集)、list(列表包含 Queue)和 map(映射)。Collection&#xff1a;Collection 是集合 List、Set、Queue 的最基本的接口。Iterator&#xff1a;迭代器&#xff0c;可以通过迭代器遍历集合中的数据Map&#x…

企业级实战——畅购商城SpringCloud-JAVA实战商城管理后台——条件搜索实现

QQ 1274510382 Wechat JNZ_aming 商业联盟 QQ群538250800 技术搞事 QQ群599020441 解决方案 QQ群152889761 加入我们 QQ群649347320 共享学习 QQ群674240731 纪年科技aming 网络安全 ,深度学习,嵌入式,机器强化,生物智能,生命科学。