`
- 浏览:
1290803 次
- 性别:
- 来自:
江苏
-
mxTidy - HTML Tidy for Python
抓取的html不处理一下很容易破坏页面的布局
官网的python封装好像不支持linux,囧
另外找了一个
mxTidy - HTML Tidy for Python
网站
http://www.egenix.com/products/python/mxExperimental/mxTidy/
下载
http://www.egenix.com/products/python/mxExperimental/
文档
http://www.egenix.com/products/python/mxExperimental/mxTidy/mxTidy.pdf
我看了半天文档,居然没有找到,不让他输出
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title></title>
的接口
只好自己山寨了一个
from mx import Tidy
def tidy(html):
html=Tidy.tidy(html,output_xhtml=1,wrap=0)[2]
begin="<body>"
return html[html.find(begin)+len(begin):html.rfind("</body>")].strip()
print tidy('<div>x<img src="xx"><p>')
<div>x<img src="xx" /></div>
htmltidy 的 python 封装(续)
Qiangning Hong
发送至 我
试过,激活tidy会导致进程crash,没有找到原因。
---------------------------
我一测试果然,不知道是封装烂,还是本身就烂
干脆用原始的版本,搞一个进程外调用吧
wget http://nchc.dl.sourceforge.net/sourceforge/tidy/tidy4aug00.tgz
然后安装,然后
from __future__ import with_statement
import subprocess
import os
def tidy(html):
with os.tmpfile() as temp:
with open(os.devnull,"w" ) as null:
print >>temp,html
temp.seek(0)
html=subprocess.Popen(
["tidy", "-utf8","-asxhtml"],
stdin=temp,
stderr=null,
stdout=subprocess.PIPE
).communicate()[0]
begin="<body>"
return html[html.find(begin)+len(begin):html.rfind("</body>")].strip()
tidy("<div>x<a>a")
分享到:
Global site tag (gtag.js) - Google Analytics
相关推荐
受clang-tidy-diff启发,Clang-Tidy Review仅对pull请求中的更改运行。 这使它变得既好又快速,并且对于尚不完全干净的项目很有用。 返回注释数,因此您可以决定警告是作为建议还是检查失败。 不会通过对同一行重复...
xcode_tidy:包装clang-tidy的python脚本,模拟clang-static分析器,可在Xcode中运行
Bo-Blog tidy模板
VSCode的Clang-Tidy 此扩展将集成到VS Code中。 特征 运行clang-tidy并在VS Code中显示其诊断信息。 注意:与在示例gif中相比,诊断花费的时间更长。 要求 必须安装Clang-Tidy。 默认情况下,扩展名将在PATH查找...
资源分类:Python库 所属语言:Python 资源全名:docker-tidy-0.1.7.tar.gz 资源来源:官方 安装方法:https://lanzao.blog.csdn.net/article/details/101784059
grunt-at-csstidy Alloyteam 团队规范工具系列——自动整理CSS代码工具。 grunt-at-csstidy 是基于 Grunt '0.4.x' 与 csscomb '3.x' 的Grunt插件。 整合了Alloyteam的团队规范,并解决了部分CSS语法树解析的兼容...
grunt-at-csstidy Alloyteam 团队规范工具系列——自动整理CSS代码工具。 grunt-at-csstidy 是基于 Grunt '0.4.x' 与 csscomb '3.x' 的Grunt插件。 整合了Alloyteam的团队规范,并解决了部分CSS语法树解析的兼容...
第4周--tidy_data
PHP实例开发源码—CSSTidy CSS分析和优化工具.zip PHP实例开发源码—CSSTidy CSS分析和优化工具.zip PHP实例开发源码—CSSTidy CSS分析和优化工具.zip
该资源为vl_simplenn_tidy.m,欢迎下载使用哦! 注明:DnCNN-matlab版本测试代码文件utilities中需要,下载好,复制粘贴到utilities文件中即可!
您可以使用和brew install tidy-html5安装版本。 Linux –您应该能够使用系统的软件包管理器来安装整洁。 Windows – Windows二进制文件可用于版本。 为了使SublimeLinter执行tidy ,必须确保SublimeLinter可以使用...
clang-tidy-misra是clang-tidy的MISRA合规性检查程序的集合。 进步 该项目尚处于初期阶段,尚未经过广泛的测试! 是否以及如何检查每个规则: “支持者”列的说明: 待定:“待定”-完全没有看过规则 未选中:...
例子 用法 # .github/workflows/go-mod-tidy-pr.ymlname : go-mod-tidy-pron : schedule : - cron : " 0 0 * * 1 " # Weekly build workflow_dispatch :jobs : go-mod-tidy-pr : name : go-mod-tidy-pr runs-on : ...
python库。 资源全名:tidy_project-0.1.tar.gz
1、下载完之后 我们把解压到Tidy2.dll放到\Notepad++\plugins(安装目录的plugins下) 2、然后重启 Notepad++即可使用 3、需要格式化代码时,点击:Notepad++菜单->插件->Tidy2->Tidy (config1)
实现了 GJB 4.1.1.6, GJB 4.1.2.7, GJB 4.2.1.10, GJB 4.6.1.15, GJB 4.6.2.1, GJB 4.7.2.1, GJB 4.9.1.1, GJB 4.14.1.1, GJB 4.14.1.2
系统工具-文件下载-Tidy Up Mac版 5.1.2.zip
官方离线安装包,亲测可用
哈神大作。你值得拥有。相关中文翻译,百度有。先浏览下中文快速学习知识吧
eslint-config-tidy ESLint的Tidy风格 为什么? 一致性。 明晰。 简单。 安装 npm install eslint-config-tidy --save-dev 用法 您所要做的就是告诉您的linter使用此配置。 与使用(推荐) 在您的package.json...