Web-harvest里面的<script>标签,其自带的例子:
<var-def name="birthday">2/10/2008</var-def>
<var-def name="web_harvest_day_variable">
<script return="nameDay.toUpperCase()"><![CDATA[
tokenizer = new StringTokenizer(birthday.toString(),"./-\\");
day = Integer.parseInt(tokenizer.nextToken());
month = Integer.parseInt(tokenizer.nextToken());
year = Integer.parseInt(tokenizer.nextToken());
Calendar cal = Calendar.getInstance();
cal.set(Calendar.DAY_OF_MONTH,day);
cal.set(Calendar.MONTH,month);
cal.set(Calendar.YEAR,year);
switch(cal.get(Calendar.DAY_OF_WEEK))
{
case 0 : nameDay = birthday+" Sunday"; break;
case 1 : nameDay = birthday+" Monday"; break;
case 2 : nameDay = birthday+" Tuesday"; break;
case 3 : nameDay = birthday+" Wendsday"; break;
case 4 : nameDay = birthday+" Thursday"; break;
case 5 : nameDay = birthday+" Friday"; break;
default: nameDay = birthday+" Saturday"; break;
}
]]></script>
</var-def>
<file action="write" path="day.txt">
<template>The day when you were born was ${nameDay}.</template>
<var name="web_harvest_day_variable"/>
</file>
例子在<script>标签里面用了一种叫[url=
http://www.beanshell.org/home.html]beanshell[/url]的轻量级JAVA脚本语言,
在该脚本里面可以调用JAVA的各种基本的函数,使用起来比较灵活,但是有一点要注意的
是,在其里面不能直接调用平时JAVA里面的各种函数,而是要先进行类型的转换后才能进行
调用,比如上面和下面的例子中就是先进行转换再调用的:
<var-def name="hello">Hello to the world!</var-def>
<!-- 在script里面可以用外面定义的变量,但不能直接就拿来用,而是要先进行转化,比如说String要用到toString()
其它转换函数还有:
byte[] toBinary()
boolean toBoolean()
int toInt()
long toLong()
double toDouble()
Object[] toArray()
java.util.List toList()
Object getWrappedObject()
-->
<var-def name="test_str">
<script return="temp.toUpperCase()"><![CDATA[
temp = hello.toString();
]]></script>
</var-def>
<file action="write" path="script_1.txt">
<var name="test_str"/>
</file>
分享到:
相关推荐
[Web-Harvest数据采集之一]Web-Harvest基础-配置文件分析源码
[Web-Harvest数据采集之二]Web-Harvest基础-抓取java代码分析 配置文件 抓取类 开发要用到的jar包
Web-Harvest是Web数据挖掘工具。提供一种方法收集目标网页和挖掘有用的数据。为此,使用XSLT,XQUERY,Regular Exp等技术。 其网址在http://web-harvest.sourceforge.net/。 挖掘数据也称为WebScraping或...
Web-Harvest学习笔记,主要是异常类的使用,标签的使用,scraper的源码等操作
Web-Harvest手册
web-Harvest中文帮助手册 源代码和相关的jar文件,XPath,XQuery等等
里面有学习web_harvest的学习方法,还有一些源文件,其中-txt文件中文件可以直接运行XML文件进行操作,而另外的文件中用需要的JAR文件和导入到程序中使用的一些JAVA文件,希望对大家有用!
资源分类:Python库 所属语言:Python 资源全名:pytest-harvest-1.7.4.tar.gz 资源来源:官方 安装方法:https://lanzao.blog.csdn.net/article/details/101784059
NULL 博文链接:https://guoyiqi.iteye.com/blog/973965
Laravel开发-harvest-api 用PHP编写的Harvest API,针对Laravel进行了优化。
Laravel开发-laravel-harvest 用于Harvest API的Laravel包装。
web harvest的jar包 提供一个xml编辑环境
Laravel开发-laravel-harvest .zip
The main goal behind Web-Harvest is to empower the usage of already existing extraction technologies. Its purpose is not to propose a new method, but to provide a way to easily use and combine the ...
alfred-harvest, 在收获过程中,用于跟踪时间的Alfred工作流 ,,workflow,workflow,workflow,workflow 。让 帮你追踪时间。 这里工作流使你可以完全访问你的收获时间跟踪:查看今天的计时器启动/停止计时器查看...
1、导言 2、解析 3、总结
ckanext-distributed-harvester - 执行分布式 Harvest 作业的 ckan 扩展 此扩展扩展了 CKAN 插件 ckanext-harvest 以支持分布式收获功能。 插件安装 该扩展目前仅与 Message Broker 软件 RabbitMQ 兼容: :要安装...
Harvest是基于Web的时间跟踪工具。 该软件包是使用node.js和Harvest API V2构建的完整客户端API。 安装 npm install harvest-v2 验证 标头验证: let Harvest = require ( 'harvest-v2' ) ; let harvest = new ...