`

前嗅ForeSpider脚本教程-数据抽取脚本实战教程

阅读更多

今天,小编给大家带来的教程为:前嗅ForeSpider脚本教程-数据抽取脚本实战教程的,应用场景,数据在源码的html标签里写脚本。具体内容如下:

 

一.应用场景

当所需要的数据字段大部分需要配置脚本时,可将所有字段的抽取统一放在数据抽取脚本中。

可能用到的类:DOM、EXTRACT。

配置方法:选中数据抽取,点击“脚本窗口”,点击创建按钮。即可在新建的代码框内输入代码。

 

二.数据在源码的html标签里写脚本

目标数据可在源码中查找到。在目标网页右键,选择“查看源代码”,键盘点击“ctrl+F”,查找目标数据所在位置。

1.数据需要循环

场景:目标数据集中分布,如评论数据。

2.数据不循环

场景:目标数据分散分布。

示例:获取聚美优品网,关键词搜索之后的列表页的页数。查看源码,得知在源码中的位置。

由图可知,页码所在<div>的class属性值唯一,所以可以根据class属性值找到该<div>。

脚本实例:

 

var div = DOM.FindClass(“head_pageInfo”);  //获取目标数据节点位置

var num=DOM.GetTextAll(div).Middle("/",页).ToInt();  //获取目标数据,并转为int型

 

分享到:
评论

相关推荐

    VBS脚本教程--经典(包你学会)

    1. **基础语法**:VBS脚本的语法规则相对简单,包括变量声明(如`Dim`)、数据类型(如`String`, `Integer`)、流程控制(如`If...Then...Else`,`For...Next`循环)等。教程会用易于理解的方式讲解这些基本元素。 ...

    韩顺平.SSH框架视频教程-项目实战-校内网(含源代码、设计文档、关系图和数据库脚本)

    韩顺平.SSH框架视频教程-项目实战-校内网(含源代码、设计文档、关系图和数据库脚本) 网盘地址 已整理。 韩顺平.SSH框架视频教程-项目实战-校内网(含源代码、设计文档、关系图和数据库脚本) 网盘地址 已整理。

    shell教程-大量例子

    shell教程,包含大量的小例子,脚本信息,还有一些技巧。

    数据脚本生成器数据脚本生成器--

    数据脚本生成器--数据脚本生成器--数据脚本生成器--

    熊猫脚本助手-吾爱专版V1.5无需懂代码自己即可编写实现复杂脚本挂机自动化.exe

    熊猫脚本助手_吾爱专版支持用户自定义脚本,实现自动化挂机操作,极大地提高了用户的工作效率,软件内置了丰富的脚本库,涵盖了多种常见任务,如网页自动点击、数据抓取、定时任务等,用户可以根据自身需求选择合适...

    winhex脚本命令教程--中文版

    ### WinHex脚本命令教程详解 WinHex是一款高级的十六进制编辑器及磁盘分析工具,通过使用脚本,用户能够实现自动化处理各种复杂的任务,例如数据恢复、磁盘编辑、二进制数据编辑等。本文将详细介绍WinHex脚本的使用...

    自动输入脚本 -- 解决禁止粘贴问题

    本文将详细探讨如何使用Python编写自动输入脚本来解决一些网站禁止用户通过粘贴方式输入数据的问题。Python作为一种强大的编程语言,提供了多种库和模块来实现这种功能,如`pyautogui`和`pynput`。 首先,我们需要...

    Linux shell脚本入门教程 - blotemj.pdf

    Linux shell脚本入门教程 - blotemj

    Elasticsearch Painless Script入门教程--示例数据-sat.json

    Elasticsearch Painless Script入门教程--示例数据。 自Elasticsearch 5.x 引入Painless,使得Elasticsearch拥有了安全、可靠、高性能脚本的解决方案。Painless是Elastic开发并做了专门的优化,相较之前的脚本更...

    医学分析实例教程-含源码、数据与案例分析

    《医学分析实例教程》是一本全面讲解如何使用R语言进行医学数据分析的实战指南。它包含了丰富的源代码、实际数据集以及详细的案例分析,旨在帮助读者深入理解和应用R语言在医学统计分析中的各种方法。 首先,我们要...

    QlikView初级培训教程-脚本使用.pdf

    ### QlikView初级培训教程-脚本使用 #### 1. 脚本布局和语句 ##### 1.1 脚本结构 在QlikView中,脚本是用于加载和处理数据的关键组件。它由一系列指令组成,这些指令告诉QlikView如何加载数据并进行后续的数据...

    跨站脚本攻击-安全教程(en).PDF

    ### 跨站脚本攻击-安全教程 #### 知识点概述 跨站脚本攻击(Cross-Site Scripting,简称XSS)是一种常见的网络安全威胁,通常发生在网站应用程序未能正确过滤用户输入的数据时。这种攻击使得攻击者能够在受害者的...

    SQLServer导出带数据的脚本

    SQL Server 导出带数据的脚本 SQL Server 是一个功能强大的关系数据库管理系统,它提供了多种方式来导出数据库结构和数据。今天,我们将探讨如何使用 SQL Server Management Studio (SSMS) 导出带数据的脚本。 一...

    京东炸年兽脚本2022-【京东全民炸年兽js脚本+自动软件+教程】

    京东炸年兽脚本2022-【京东全民炸年兽js脚本+自动软件+教程】 2022年京东炸年兽的活动已经开启了,大家只要按照任务指令来做的话,拿大红包还是很轻松的哈,当然除了认真做任务之外,还有任务脚本和快捷指令可以来...

    史上最详细批处理脚本(BAT)教程-精华版

    ### 批处理脚本(BAT)教程精要 #### 第一章:批处理基础 ##### 第一节:常用批处理内部命令简介 **批处理**(Batch Scripting),是一种计算机编程语言,它允许用户创建一系列预定义命令的脚本文件,以实现自动化...

    Genesis2000、InCAM脚本图文教程

    编写C-shell脚本前,首先需要理解C-shell的脚本文件首行的作用。如果脚本首行以#!开始,后面紧跟一个程序名,系统会用那个程序执行后续的命令。如果首行以#开始,系统会用C-shell执行脚本。如果首行不是以#开始,...

Global site tag (gtag.js) - Google Analytics