`

(转)获取HTML页面内容后格式化显示的办法

阅读更多

获取html页面内容的方法有很多了,一般都是连接上以后取得页面的内容,然后进行分析。一般用JDK里面提供的  URL和URLConnection 类,就可以实现;当然,也可以用其他工具来实现,比如 httpunit(用这个有时候会有问题,如果页面里面有反盗链的设置或者其他一些有问题的代码,很可能就连接不上了)。 如果单纯只是想得到页面的内容,用JDK里面提供的类就足够。

得到了页面内容以后,怎么显示在我们自己的页面上面呢?特别是要显示在TEXTAREA这样的区域里面就会有点点麻烦。

因为我们获得的内容里面有html标记和javascript标记,或者css标记。

如果直接把这些内容打印出来,或者直接放到TEXTAREA里面,就会报错。。怎么来解决?

一般大家都会想到用字符串来替换,比如 把"<"替换成"[" 等等,或者用正则表达式,来过滤这些标记。

其实有一直很简单方法,就是把得到的页面内容放在<div></div>中间,例如:

<div id="content" style="display:none;">
.........
</div>

然后用javascript来取content,

function show()
{
 form1.content.value = document.getElementById("content").innerText;
}

这样就自动过滤了那些烦人的标记了哦!!

 

分享到:
评论

相关推荐

    在Java中轻松将HTML格式文本转换为纯文本(保留换行)

    Jsoup是HTML解析器 lang和lang3这两个包里有转换所需的工具类 org.jsoup jsoup 1.11.3 commons-lang commons-lang 2.6 org.apache.commons commons-lang3 3.4 第二步:直接使用即可: import org.apache....

    formattertattat:学习React,构建JSON格式化程序

    目录自动格式化代码更改页面&lt;title&gt; 安装依赖项导入组件代码分割添加样式表后处理CSS 添加CSS预处理器(Sass,Less等) 添加图像,字体和文件使用public文件夹更改HTML 在模块系统之外添加资产何时使用public...

    AngularJS 日期格式化详解

    AngularJS的日期格式化有两种形式,一种是在HTML页面,一种是在JS代码里,都是用到AngularJS的过滤器$filter

    精通正则表达式基于.NET ASP PHP JSP JavaScript

    JSPExample7.jsp text.html页面提交至该页,并显示提交数据 text.html 页面数据提交至JSPExample7.jsp JSPExample8.jsp 不同类型混合运算自动转换 JSPExample9.jsp 不同类型混合运算强制...

    html页面时间使用

    获取和格式化时间实用笔记1.日期格式化 Date.prototype.format = function(format) { var o = { "M+" : this.getMonth()+1, //month "d+" : this.getDate(), //day "h+" : this.getHours(), //hour "m+" : ...

    helper.rar

    当你访问的接口(打开的页面)返回的是一个JSON格式的数据,FeHelper会自动将内容进行格式化处理,便于您的查看 JSON查看器 把你的JSON代码粘贴到JSON查看器的输入框中,点击“格式化”,在下方便会以非常友好的方式...

    python自动获取网络音乐工具源代码修改版

    此外,我们还可以利用Python的第三方库如BeautifulSoup或者正则表达式来解析页面内容,提取音乐信息并保存到本地文件或数据库中。这样用户可以通过工具快速查找自己喜欢的音乐,建立自己的音乐库。另外,我们还可以...

    100个直接可以拿来用的JavaScript实用功能代码片段(1-10)

    25、原生JavaScript格式化CSS样式代码 26、原生JavaScript压缩CSS样式代码 27、原生JavaScript获取当前路径 28、原生JavaScriptIP转成整型 29、原生JavaScript整型解析为IP地址 30、原生JavaScript实现checkbox全选...

    淘宝已买到的商品数据爬虫.rar

    数据处理和存储:对提取的数据进行进一步处理和清洗,可以进行数据过滤、去重、格式化等操作。然后,根据需求可以将数据保存到文件、数据库或其他数据存储介质中。 页面翻页和动态加载内容处理:当需要跳转到下一页...

    python数据爬取美食网站xpath解析并将美食数据存入csv文件按照人气数据分析可视化

    主要实现了以下功能,实现了以下功能: 爬取数据:代码使用requests库发送HTTP请求,获取美食网站的页面内容。...用户可以通过这段代码快速获取美食网站的数据,进行数据分析和可视化显示人气排名前10的菜品。

    HTML DOM导航「HTML DOM Navigation」-crx插件

    -网页完全加载后,单击页面右上方的“ HTML DOM导航”图标-将鼠标悬停在页面中的任何元素上,以查看IRB格式和元素的前五位祖先-右键单击页面,然后在上下文菜单中选择“ HTML DOM导航-&gt;树格式”选项以查看(整个...

    JSP实用技巧集合,jsp编程的一些小技巧总结

    110.格式化输出数字和字符? 111.生成一定范围的随机数? 112.调用其它应用程序? 113.禁止列出站点文件目录? 114.防止用户直接输入文件名访问JSP? 115.防止表单重复提交? 116.使页面全屏显示? 117.在页面中屏蔽鼠标...

    ActionScript开发人员指南中文版

    动态加载显示内容 显示对象示例:SpriteArranger 第章:使用几何结构 几何结构基础知识 使用Point对象 使用Rectangle对象 使用Matrix对象 几何形状示例:对显示对象应用矩阵转换 第章:使用绘图API 绘制API的基础 ...

    IBM WebSphere Portal门户开发笔记01

    35、更改登录后跳转页面 151 36、PORTAL-LOGIC:IF LOGGEDIN用户是否登录与注销 152 37、引入主题头部输出连接部分 152 九、IBM WEBSPHERE PORTAL 主题与皮肤开发 153 一、初级入门:Portal的主题与皮肤开发: 153 二...

    php常用工具类,包含了JS弹窗,页面跳转,系统基本参数上传图片,html过滤,数据库输入过滤,清理session,各种验证,

    一个php常用的工具类,它包含了JS弹窗,页面跳转,系统基本参数上传图片,html过滤,数据库输入过滤,清理session,各种验证,格式化,获取ip地址,加载模板,图片水印,文件操作等等很多实用的功能工具,方便大家...

    从入门到精通HTML5——PDF——网盘链接

     1.4.3 使用可视化软件制作页面 10  1.4.4 使用浏览器浏览HTML文件 14  1.4.5 使用HTML开发的明日图书网 14  1.5 小结 15  1.6 习题 16  第2章 HTML文件基本标记 17  教学录像:44分钟  2.1 HTML头部标记 18...

Global site tag (gtag.js) - Google Analytics