Java爬虫技术批量下载美女图片不是事

news/2024/7/19 8:41:53 标签: java, string, url, 爬虫, 图片

先上福利图:
这里写<a class=图片描述" title="" />

需求:利用爬虫将网上的图片下载到本地,然后超大图标预览。这里的文件命名是以时间年月日+标题命名。这里的网站就不告诉大家了,你们都比我懂。。。然后下载完后,把url写进txt中,下次爬取先从txt中判断是否存在,存在则不爬取该链接。

/*业务 start*/
            String s_url = s_[0];
            //判断url是否写入
            if(!checkTxtEsist(txtFileName,s_url)){
                String dirName = s_[2];
                String time = s_[4].replaceAll(timeReplace, string">"");
                File dirFile = new File(baseDir+time+dirName);
                if(!dirFile.exists()){
                    dirFile.mkdirs();
                    logger.info(string">"创建文件夹-'{}'成功",time+dirName);
                }
                //统计页数
                String htmlSource2 = _cmsUtil.getHtmlResourceByUrl(s_url,encoding);
                htmlSource2 = htmlSource2.replaceAll(string">"\\s", string">"");
                pat2 = pat2.replaceAll(string">"\\s", string">"");
                Pattern pattern2 = Pattern.compile(pat2);
                Matcher matcher2 = pattern2.matcher(htmlSource2);
                String result2 = string">"";
                while(matcher2.find()){
                    result2 += matcher2.group(1);
                }
                int pageNum = _bigDataUtil.serachWord(result2, string">"<span>");
                if(pageNum == 0){
                    pageNum = 1;
                }

                //下载图片
                for(int i = 0 ; i < pageNum; i++){
                    String s_url3 = s_url +string">"/"+ (i+1);
                    String htmlSource3 = _cmsUtil.getHtmlResourceByUrl(s_url3,encoding);
                    htmlSource3 = htmlSource3.replaceAll(string">"\\s", string">"");
                    pat3 = pat3.replaceAll(string">"\\s", string">"");
                    Pattern pattern3 = Pattern.compile(pat3);
                    Matcher matcher3 = pattern3.matcher(htmlSource3);
                    while(matcher3.find()){
                        String picUrl = matcher3.group(2);
                        logger.info(string">"正在爬取图片:{}",picUrl);
                        _cmsUtil.downImages(baseDir+time+dirName, picUrl);
                    }
                }


                //写入追加txt
                try {
                    _txtUtil.addTxtContent(txtFileName, s_url+string">",");
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
            /*业务 end*/
            //需要util方法可以联系QQ490647751

可以加Q490647751,回复‘开通VIP获取Java爬虫技术批量下载美女图片不是事’获取代码学习。


http://www.niftyadmin.cn/n/785488.html

相关文章

2021亚太数据收集网站

针对2021年亚太&#xff0c;与以往题目不同。今年有了三个题目&#xff0c;其中第三题依旧是收集数据&#xff0c;进行综合评价&#xff0c;提出建议的题目。这种类型的题目&#xff0c;可以参考2020年亚太B,2021年美赛E&#xff0c;以及刚刚过去几周的2021数维杯D题。 对于A,B…

第十届“认证杯”数学中国数学建模国际赛(2021年小美赛)

比赛时间:2021年12月03日上午8点-2021年12月07日上午8点(本周五上午八点开赛&#xff0c;下周二上午八点结束) 时长:四整天 题目类型&#xff1a;与美赛相似。 MCM&#xff08;A、B题&#xff0c;比较注重理论和思路&#xff09; ICM&#xff08;C、D题&#xff0c;比较注重…

百度地图api疯狂打call找美食,一口一个么么哒

需求&#xff1a;吃货兼路痴的小编想了一个好注意&#xff0c;就是用爬虫爬取美食网站的信息&#xff0c;爬取地址就可以了&#xff0c;然后数据保存下来。有了地址数据&#xff0c;然后用百度地图&#xff0c;将地址转为地图坐标&#xff0c;然后再显示在地图上&#xff0c;然…

CSS3高仿百度外卖头像波浪效果

好Q啼的头像&#xff0c;说好的波浪捏&#xff0c;浪到哪里去了&#xff0c;别急&#xff0c;静静欣赏动态效果&#xff1a;链接&#xff1a;https://pan.baidu.com/s/1gfAM3y7 密码&#xff1a;wxn6 技术&#xff1a; 1、css water wave 实现波浪效果 2、css translateY 实…

MBR分区操作-增加、扩展、删除

MBR分区操作-增加、扩展、删除 GPT分区参考 http://www.blogjava.net/haha1903/archive/2011/12/21/366942.html l fdisk 显示磁盘信息&#xff1a; [rootlocalhost ~]# fdisk -l 编辑磁盘sdb [rootlocalhost ~]# fdisk /dev/sdb Command (m for help): m Command action a …

一起艳学Springboot开发微信公众号(一)

暖冬已至&#xff0c; 圣诞老人就要背着大包裹降临剩单节了&#xff01; 人美心善的艳艳也带来了剩单专属福利教程–Springboot微信开发&#xff0c; 尽情享受这一波礼物风暴吧~ 1、springbootspringmvcmybatis开发的。 2、热加载 spring-boot-devtools 3、修改Spring加载…

java对象与json对象之间的转换

jar包:import net.sf.json.JSONObject; 1.解析json字符串 将json字符串转换为json对象&#xff0c;然后再解析json对象:。JSONObjectjsonObject JSONObject.fromObject(jsonStr); 根据json中的键得到它的值Stringname jsonObject.getString("name");int age jsonO…

java开发腾讯AI,共探人工智能

前言&#xff1a;跟你们说说羊群效应嘛&#xff0c;听过的切勿吐槽&#xff0c;就是1000只羊在一边吃草&#xff0c;这时来了一只狗&#xff0c;汪汪几声&#xff0c;1000只养竟然跑到另一边。对&#xff0c;是竟然&#xff0c;1000只羊打不过一只狗&#xff1f;每只羊舔一下那…