JSpider是一个用Java实现的WebSpider

news/2024/7/19 11:16:29 标签: java, 爬虫

JSpider是一个用Java实现的WebSpider,JSpider的执行格式如下:

jspider [URL] [ConfigName]

URL一定要加上协议名称,如:http://,否则会报错。如果省掉ConfigName,则采用默认配置。

JSpider 的行为是由配置文件具体配置的,比如采用什么插件,结果存储方式等等都在conf\[ConfigName]\目录下设置。JSpider默认的配置种类 很少,用途也不大。但是JSpider非常容易扩展,可以利用它开发强大的网页抓取与数据分析工具。要做到这些,需要对JSpider的原理有深入的了 解,然后根据自己的需求开发插件,撰写配置文件。


http://www.niftyadmin.cn/n/1779770.html

相关文章

ie的hasLayout

在ie中,一个元素要么自己对自身的内容进行计算大小和组织,要么依赖于父元素来计算尺寸和组织内容。为了调节这两个不同的概念,渲染引擎采用了 hasLayout 的属性,属性值可以为true或false。当一个元素的 hasLayout 属性值为true时&…

快速排序(Quick Sort)

快速排序是初学者比较难理解的几个算法之一,这里尽可简单化地讲解,希望能帮到大家。 快速排序基本步骤: 从数列中挑出一个元素,称为"基准"(pivot)。重新排序数列,所有元素比基准值小的…

Java从入门到放弃(六)集合框架之ArrayList源码(2)

上一篇文章Java从入门到放弃(五)集合框架之ArrayList(1)介绍了ArrayList的构造方法和add方法。对于随机插入,ArrayList是把要插入位置后面的元素全部后移,然后把元素插入到指定位置,如果集合内元素比较多的时候&#x…

jQuery 3教程(二):jQuery选择器

原文地址:jQuery 3教程(二):jQuery选择器Introduction jQuery最方便的地方便是各种选择器。jQuery选择器完美兼容CSS 3选择器,甚至还有更强大的功能。 $ 在jQuery程序中,最常见的就是$符号,那么$到底是什么意思呢&…

java\sdk\platform-tools\adb.exe' and can be executed.

遇到问题描述:运行android程序控制台输出The connection to adb is down, and a severe error has occured. You must restart adb and Eclipse.Please ensure that adb is correctly located at D:\java\sdk\platform-tools\adb.exe and can be executed.解决问题&…

Java从入门到放弃(七)集合框架之ArrayList的坑

1、快速失败和安全失败1&#xff09;、快速失败在用迭代器遍历一个集合对象时&#xff0c;如果遍历过程中对集合对象的内容进行了修改&#xff08;增加、删除、修改&#xff09;&#xff0c;则会抛出ConcurrentModificationException。如下&#xff1a;List<Integer> lis…

Uniy 组件式泛型单例模式

我们知道,在Unity中,所有对象脚本都必须继承MonoBehavior脚本,才能使用Unity内置的脚本功能;通常我们可以用静态类来取代单例模式,但是静态类方法的缺点是&#xff0c;它们必须继承最底层的类----Object。这意味着静态类不能继承MonoBehaviour&#xff0c;因此&#xff0c;我们…

c语言捕捉异常

闲暇之日阅读lua源码&#xff0c;发现原来C语言除goto之外的另一个处理异常的方法。既为setjump longjump两个函数&#xff0c;setjump相当于try&#xff0c;longjump相当于catch。与goto不同的是&#xff0c;longjump是全局的&#xff0c;比goto的作用范围更广。下面贴出简单用…