WebSpec自动访问页面的使用

news/2024/7/19 8:44:35 标签: 爬虫, javascript, python

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

WebSpec自动访问页面的使用 博客分类: 搜索引擎,爬虫 java  

WebSpec是Watij自动化测试项目里面的一个类。Watij工具调用ie、firefox等浏览器对网页进行测试,也就是说可以解析javascript,对于那些需要手工操作的填表单等工作都可以用Watij模拟。

 

下面以自动点击baidu,并填入“黄河”为搜索关键词进行搜索作为例子。

先用Dreamweaver查看baidu首页的源代码。

 

 

[html]  view plain copy
 
  1. <div id="m"><p id="lg"><img src="http://www.baidu.com/img/baidu_sylogo1.gif" width="270" height="129" usemap="#mp"><map name="mp"><area shape="rect" coords="40,25,230,95" href="http://hi.baidu.com/baidu/" target="_blank" title="点此进入 百度的空间" ></map></p><p id="nv"><a href="http://news.baidu.com">新 闻</a> <b>网 页</b> <a href="http://tieba.baidu.com">贴 吧</a> <a href="http://zhidao.baidu.com">知 道</a> <a href="http://mp3.baidu.com">MP3</a> <a href="http://image.baidu.com">图 片</a> <a href="http://video.baidu.com">视 频</a> <a href="http://map.baidu.com">地 图</a></p><div id="fm"><form name="f" action="/s"><span class="s_ipt_wr"><input type="text" name="wd" id="kw" maxlength="100" class="s_ipt"></span><input type="hidden" name="rsv_bp" value="0"><input type="hidden" name="rsv_spt" value="3"><span class="s_btn_wr"><input type="submit" value="百度一下" id="su" class="s_btn" onMouseDown="this.className='s_btn s_btn_h'" onMouseOut="this.className='s_btn'"></span></form><span class="tools"><span id="mHolder"><div id="mCon"><span>输入法</span></div></span></span><ul id="mMenu"><li><a href="#" name="ime_hw">手写</a></li><li><a href="#" name="ime_py">拼音</a></li><li class="ln"></li><li><a href="#" name="ime_cl">关闭</a></li></ul></div>  

 

 

输入框对应的源代码:<input type="text" name="wd" id="kw" maxlength="100" class="s_ipt">

“百度一下”按钮对应的源代码:<input type="submit" value="百度一下" id="su" class="s_btn" onMouseDown="this.className='s_btn s_btn_h'" onMouseOut="this.className='s_btn'">

 

 

用WebSpec打开baidu的url,并填入“黄河”,点击搜索:

 

[html]  view plain copy
 
  1. public void run(){  
  2.         WebSpec spec = new WebSpec().ie();  
  3.         if(spec.ready())  
  4.         {     
  5.             spec.open(url);  
  6.             spec.pauseUntilReady();  
  7.             spec.find.input().with.name("wd").set.value("黄河");  
  8.             spec.find.input().with.id("su").click();  
  9.             System.out.println(spec.source());  
  10.         }  
  11.         else{  
  12.             System.out.println("not ready");  
  13.         }  
  14.         spec.close();  
  15. }  

 

 

 

下载:

http://sourceforge.net/projects/watij/files/

 
API:
http://watij.com/webspec-api/
 
好酷的自动化测试框架,超酷的自动化请求爬虫框架!
 
从watij升级后,发现,这个已经远远地超过了httpclient,大大提高了开发效率!
 
http://blog.csdn.net/waleking/article/details/7271003
http://blog.sina.com.cn/s/blog_66ed71e1010132j1.html
 

转载于:https://my.oschina.net/xiaominmin/blog/1599571


http://www.niftyadmin.cn/n/972704.html

相关文章

如何创建一个AJAX的请求对象,如何用ajax来创建一个XMLHttpRequest对象

我每次创建一个对象&#xff0c;都要这样复杂吗&#xff1f;如下代码:JScript code:"testAjax.htm" 文件&#xff1a;复制代码代码如下:function ajaxFunction(){var xmlHttp;try{// Firefox,Opera 8.0,SafarixmlHttpnew XMLHttpRequest();}catch (e){// Internet Ex…

maven的安装、路径配置、修改库文件路径和eclipse中的配置、创建maven工程。

注&#xff1a;本文来源于&#xff1a;杨四郎2018 《maven的安装、路径配置、修改库文件路径和eclipse中的配置、创建maven工程》一、maven的安装 首先&#xff0c;先到官网去下载maven。这里是官网的地址&#xff1a;http://maven.apache.org/download.cgi 请选择最新的版本…

Linux中一个文件10行内容,如何输出5-8内容到屏幕

题目是这样的&#xff0c;Linux中一个文件10行内容&#xff0c;如何输出5-8内容到屏幕首先我们模拟一下这样的环境&#xff1a; [rootlocalhost question]# pwd /root/question [rootlocalhost question]# seq 1 10 > q.txt [rootlocalhost question]# cat q.txt 1 2 3 4 …

EM算法之求解三硬币模型

看了好几天的EM算法&#xff0c;还是看的一头雾水。借由三硬币模型&#xff0c;尝试使用EM算法。 1、EM算法流程 1. E步&#xff1a;对完全数据的对数似然函数log(P(Y,Z|θ))log(P(Y,Z|θ))求关于P(Z|Y,θ(i))P(Z|Y,θ(i))的数学期望。      EZ|Y,θ(i)[log(P(Y,Z|θ))]…

$.ajax(出错,$ .ajax总是会出错,为什么?

我的代码是这样的&#xff1a;var WebServiceURL "CityFixWS.asmx"; //the same as above. only with…$(document).on("pagecreate", "#LoginPage", function () {wireEventsLoginPage();});function wireEventsLoginPage() {$(#LPBtnCheckUse…

Maven配置文件setting.xml详解

注&#xff1a;本文来源于&#xff1a;大话JAVA的那些事 《Maven配置文件setting.xml详解》<?xml version"1.0" encoding"UTF-8"?> <settings xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XML…

全部文章 Maven

Maven原 Maven中<resources>标签详解&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&...2018-07-25 16:36:46阅读数 2631评论数 0原 Maven中<resources>…

PLSA模型简介

knitr::opts_chunk$set(echo TRUE) 1、文档生成 对于某一篇特定的文章&#xff0c;其生成过程可以看做如下方式&#xff1a; 1 . 为这篇文章制造一个特定的doc_topic的骰子 2 . 先掷doc_topic骰子&#xff0c;产生一个主题 3 . 找到对应主题的topic_word骰子&#xff0c;投…