用python 爬取网页图片

news/2024/7/19 8:50:46 标签: python, 爬虫
python">import re
import string
import sys
import os
import urllib

url="http://tieba.baidu.com/p/2521298181"#这个是某贴吧地址
imgcontent=urllib.urlopen(url).read()#抓取网页内容
reg = r'src="(.+?\.jpg)" pic_ext'
imgre = re.compile(reg)
urllist = imgre.findall(imgcontent)
#urllist=re.findall(r'src="(http.+?\.jpg)"',imgcontent,re.I)#提取图片链接
if not urllist:
	print 'not found...'
else:
	#下载图片,保存在当前文件夹的pythonimg文件夹下
	filepath=os.getcwd()+'\pythonimg'
	if os.path.exists(filepath) is False:
		os.mkdir(filepath)
	x=1
	print u'爬虫准备就绪...'
	for imgurl in urllist:
		temp= filepath + '\%s.jpg' % x
		print u'正在下载第%s张图片' % x
		print imgurl
		urllib.urlretrieve(imgurl,temp)
		x+=1
	print u'图片完成下载,保存路径为'+filepath


为方便调试python程序,以下贴出打印文件、模块以及行号的功能:

python">import sys

print sys._getframe().f_code.co_filename #获取当前文件名称;
print sys._getframe().f_code_name #获取函数名;
print sys._getframe().f_lineno  #当前行


转载于:https://www.cnblogs.com/mfrbuaa/p/4383057.html


http://www.niftyadmin.cn/n/1654384.html

相关文章

操作系统中的调度问题

1、调度时机:创建新的进程后、运行进程退出时、进程因为I/o或其他原因阻塞时、发生I/o中断(完成了i/o的阻塞进程变为了就绪进程) 2、调度算法应用环境: 批处理系统,交互式系统,实时系统, 不同的…

Memcache与Memcached介绍及安装配置

Memcache学习总结1-Memcache与Memcached介绍及安装配置 也许大家一看到Memcache和Memcached会有点晕,这两者有什么关系又有什么区别呢,下面先给大家说下Memcached,Memcached是一个高性能的分布式内存对象缓存系统,用于动态Web应用…

2范数和F范数的区别

2范数和F范数是不同的。 2范数表示矩阵或向量的最大奇异值,max⁡(svd(X)) 而 F范数表示矩阵所有元素平方和的开方根 sqrt(∑_(x_(i,j∈X))▒x_(i,j)^2 )转载于:https://www.cnblogs.com/yinwei-space/p/4388468.html

L4--离散存储[链表]

定义 n个节点离散分配;彼此通过指针相连;每个节点只有一个前驱节点,每个节点只有一个后续节点;首节点没有前驱节点,尾节点没有后续节点。专业术语: 首节点:第一个有效节点尾节点:最后…

BZOJ 1070: [SCOI2007]修车(最小费用最大流)

建图很神奇..建完图其实就是裸的费用流了..--------------------------------------------------------------#include<cstdio>#include<cstring>#include<algorithm>#include<iostream>#include<vector>#include<queue>#define rep(i,n) …

第四天 how can I 坚持

今天&#xff0c;一个大学同学&#xff0c;研究生毕业来北京了&#xff0c;入职人人网&#xff0c;月薪12k&#xff0c;倍感压力山大&#xff0c;好好考虑下自己的未来&#xff0c;该怎么走。想考研了&#xff0c;毕业三年了&#xff0c;感觉一直在混日子。今天在外边玩了一天&…

AOJ 0525 - Osenbei

http://acm.hust.edu.cn/vjudge/problem/viewProblem.action?id50785 翻译&#xff1a;http://blog.csdn.net/acm_10000h/article/details/40988419 1 #include <iostream>2 #include <cstdio>3 #include <cmath>4 #include <vector>5 #include <c…

二分法查找的循环实现与递归实现

二分法查找&#xff0c;就是在一列按顺序排列的数中查找某个数&#xff0c;以下是C循环实现与递归实现 #include <iostream>using namespace std; int findit(int a[],int b); int main() {int a[100];int b;int c;for(int i0;i<100;i){a[i]i;}cin>>b;c findit…