`

python 解析xml(解决gb2312编码问题)

 
阅读更多
import urllib
import xml.dom.minidom               
url = 'http://223.202.45.187:8080/BillQueryService3/pub/query/billing/LogBandWidthByChannelID?Type=standard&RegionID=9050&ChannelCount=1&StartTime=20130911&EndTime=20130912&ChannelID1=46056'

if __name__ == '__main__':
    response = urllib.urlopen(url).read()
    doc = xml.dom.minidom.parseString(response.replace("GB2312","utf-8"))   
    root  =  doc.documentElement
    nodeList=root.getElementsByTagName("InData") 
    node=nodeList.item(0);
    print node.childNodes[0].nodeValue

<BandWidthDatas>
<InData>734967,804582,748431,700435,741438,790629,711222,785297,760371,879281,830852,667747,521595,591466,523582,596232,525482,521646,585350,590894,471779,495218,501089,522785,568087,516298,592462,560570,559551,663606,591116,532197,502947,587373,657666,564981,789629,892320,861506,666045,513198,516113,556784,382219,543530,852253,870274,626598,578371,581956,502750,561070,647509,609348,700398,556133,558517,1795000,1929277,1930552,1587964,1503018,979172,840592,991367,758422,526656,831452,878502,469387,855522,496229,447473,696246,722823,401733,402657,423735,635378,1540551,1252920,1461867,893117,707067,607637,594154,789271,843980,724784,804936,577846,757652,832049,947499,880607,720087,775329,934759,978645,803068,906384,874214,861754,1565193,1817977,1213644,1465298,1347389,1420933,1536785,1049131,1500526,1549579,1376343,1097279,3230237,2851553,2111527,1835563,1919216,2312424,2282630,2078254,1923741,1760418,2008574,2075676,3067038,3240775,2497667,2561080,2369818,2315820,2178929,1733992,1608287,1482467,1396103,2188629,3102358,2019556,2190123,2565644,2210615,1711603,1814254,1733067,1705588,2024283,1702695,1758020,2020507,1857479,1709575,1568892,1270235,1326908,1532812,1428638,1218445,1424708,1193779,1240165,1346645,1432530,1238506,1362267,1282136,1175855,1248302,1341789,1034955,1259787,961329,1289414,1342310,1174518,1269546,1129377,1102328,1221854,1395323,1590917,1322813,1902681,1308253,1789843,1903007,1369683,1409603,1449242,2380716,1340958,1654614,1317114,1465245,1529357,1591713,1433889,1670220,1618688,1690457,1465408,1379521,1490793,1531951,1455292,1450621,1195069,1401640,1145794,1080168,1175812,1028776,1066365,984952,934138,1040235,1140514,987066,824210,932885,1156897,1175121,965918,1111297,935694,977870,983840,1064438,916079,1069549,1192218,944294,900032,875097,909848,947157,1031544,899517,716283,829213,1198744,934569,822495,1013310,1230587,1050827,1731108,1552921,1397526,1438612,1416353,1424798,1360124,1367022,1266812,1189290,1195439,1270451,1085203,999244,1268162,1081781,986924,1026981,1008771,1021216,919458,921427,1096737,981464,1113669,1010843,802621,1085028,949214,958811,973648,1015204,926723,885322,897739,999079,930218,1114228,798395,739189,724534,770431,690081,666902,694693,1118018,599423,607569,696572,522615,562644,528183,573008,549234,574997,460402,442731,597562,485696,452766,365704,299791,392684,489297,442544,1660053,559529,453975,369781,403340,308204,424640,324732,299929,351675,412267,300087,356539,459041,424110,423831,364746,462399,348210,430134,496612,442855,332628,662960,433334,413039,435819,405867,374756,414264,356662,480472,336633,334113,356180,350322,297548,364154,407945,299995,330622,304129,332683,344510,280522,367045,361366,592740,1646051,394249,347948,349092,326759,385766,499077,371197,323002,411121,396095,419202,386872,425273,432689,371450,668124,474861,705197,828682,672870,675366,813503,795355,836554,733157,990117,765761,944861,1022581,1921460,1992838,1695212,1831779,1541186,1818039,1957435,1646411,1902510,1285266,1552405,1256307,2475268,2456613,1985066,2698468,2832225,2103389,2748432,1751707,1811439,1921550,1609594,1863545,2772701,3436475,3319181,3061922,1836621,2344195,2537610,2341312,2420511,1735777,1705224,1520220,2325041,2214416,2353633,2353664,2286993,1954483,1745312,1502533,2088155,2205358,1485198,1349934,2127168,1931649,1614977,1793171,1356623,1858905,1588347,1282158,1284027,1399066,1400769,1448384,1950174,1446398,1439969,1719046,1473635,1611261,1748211,1519365,1539319,1497638,1524792,1585318,1352348,1418220,1307308,1379955,1245545,1289584,1242751,1131553,1371001,1322266,1086547,1491898,1542348,1832589,1516676,1655508,1464823,1656897,1429998,1414577,1251325,1552593,1202537,1523697,1695120,1970189,1812949,1671501,1479295,1410004,1416660,1626993,1350815,1351374,1342072,1264197,1484656,1170365,1662184,1544690,1288538,1212562,1140891,1155569,1277611,885113,1099045,1125496,1413824,1280331,1368905,1362418,1129078,1333567,1315841,1139785,1108523,1498683,1384885,1101803,1219903,1119834,1246289,1109735,1118365,1095242,1080712,996819,1165898,988801,1025878,896924,1098847,1001020,971911,1224811,876390,843994,838953,1006624,770473,1022543,939497,966504,978833,940519,1033486,773550,901311,922494,826830,920623,1040724,1025869,938946,991959,877955,833190,928697,925425,1680577,1049644,874947,763486,1128969,1107442,875431,934978,903593,819502,743681,621233,917323,</InData>
</BandWidthDatas>
分享到:
评论

相关推荐

    Python爬虫基于lxml解决数据编码乱码问题

    lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高 XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言,它最初是用来搜寻XML文档的,但是它...

    基于Python获取docx/doc文件内容代码解析

    主要介绍了基于Python获取docx/doc文件内容代码解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

    Python中base64与xml取值结合问题

    Base64是一种用64个字符来表示任意二进制数据的方法。 用记事本打开exe、jpg、pdf这些文件时,我们都会看到一大堆乱码...dom=minidom.parse("D:\\pythonp\\ttt.xml") # 根据标签name获取值 names=dom.getElementsByTag

    Python算法实现笔记源码解析与实战

    本项目主要以Python编程语言为核心,包含完整的源码解析和实战案例,致力于通过实际编码加深对算法的理解和应用。项目共包括47个文件,具体文件类型分布如下: - Python源代码文件(.py): 39个 - 配置文件(.xml)...

    xsd2xml:来自xsd的python轻量级xml生成器

    它使用库解析给定的架构文档,然后填充一些硬编码的值。 请检查以下示例。 XSD &lt;? xml version = " 1.0 " encoding = " utf-8 " ?&gt; &lt; xs : element name = " empno " type = " xs:string " /

    python3解析库BeautifulSoup4的安装配置与基本用法

    前言 Beautiful Soup是python的一个HTML或XML的解析库,我们可以用它来方便的从网页中提取数据,它拥有强大的API和多样的解析方式。 Beautiful Soup的三个特点: ... Beautiful Soup位于流行的Python解析器(如lxml和h

    Python下利用BeautifulSoup解析HTML的实现

    Beautiful Soup 是一个可以从 HTML 或 XML 格式文件中提取数据的 Python 库,他可以将HTML 或 XML 数据解析为Python 对象,以方便通过Python代码进行处理。 文档环境 Centos7.5 Python2.7 BeautifulSoup4 ...

    python cookbook(第3版)

    6.7 利用命名空间解析XML文档 6.8 与关系型数据库的交互 6.9 编码和解码十六进制数 6.10 编码解码Base64数据 6.11 读写二进制数组数据 6.12 读取嵌套和可变长二进制数据 6.13 数据的累加与统计操作 第七章:...

    sub2xml:Python脚本将Premiere Pro的字幕转换为标题时间线

    sub2xml 受其他类似工具的启发,用于将Premiere Pro的字幕转换为标题/时间线的Python脚本,请参见[1],[2]和[3]。 该脚本执行以下操作: ... python-ass(用于解析ass文件) 枕头(用于str-width近似值) 用法 sub2x

    8583报文解析框架Simple8583.zip

    2)请求数据进入SimpleClient代理,SimpleClient根据传入的值解析xml文件(jaxb实现,做了缓存) 3)根据传入值的mti寻找对应的IsoPackage类,对找到的IsoPackage类进行clone(避免污染),对clone值中的域进行值...

    XML轻松学习手册--XML肯定是未来的发展趋势,不论是网页设计师还是网络程序员,都应该及时学习和了解

    &lt;?xml version="1.0" encoding="GB2312"?&gt; &lt;title&gt;XML轻松学习手册 &lt;author&gt;ajie &lt;Email&gt;ajie@aolhoo.com&lt;/email&gt; &lt;date&gt;20010115 &lt;/myfile&gt; 七. 关于XML的更多 好了,到现在你已经知道: 1.什么是XML; ...

    Beautiful Soup爬虫框架在Python爬虫开发中的重要性

    内容概要: Beautiful Soup是Python中的一个强大...Beautiful Soup有很多优点,如能够按照标签、属性、字符串等方式检索文档,可以修改文档的编码、属性等,在Python爬虫开发中,Beautiful Soup是非常重要的工具之一。

    面向新手解析python Beautiful Soup基本用法

    Beautiful Soup就是Python的一个HTML或XML的解析库,可以用它来方便地从网页中提取数据。它有如下三个特点: Beautiful Soup提供一些简单的、Python式的函数来处理导航、搜索、修改分析树等功能。它是一个工具箱,...

    json-c-0.7.rar_c json_json c_json 数据 格式_json-c vc_xml-json-c

     XML有丰富的编码工具,比如Dom4j、JDom等,JSON也有json.org提供的工具,但是JSON的编码明显比XML容易许多,即使不借助工具也能写出JSON的代码,可是要写好XML就不太容易了。  ◆解码难度  XML的解析得考虑子...

    Python Cookbook

    12.11 使用MSHTML来解析XML或HTML 461 第13章 网络编程 462 引言 462 13.1 通过Socket数据报传输消息 464 13.2 从Web抓取文档 466 13.3 过滤FTP站点列表 467 13.4 通过SNTP协议从服务器获取时间 468 13.5 ...

    1.Python异步库使用介绍.zip

    网络爬虫基础 网络爬虫的概述和原理 ...Python爬虫库的介绍 数据抓取与解析 HTML解析与XPath、CSS选择器的应用 JSON和XML数据的解析 ...应用所学知识解决真实世界中的爬虫和IO问题 爬虫和IO项目开发流程与实践经验分享

    seat_assignment:python编码项目

    座位分配 这是我为公司的编码挑战所做的编码项目。... 说明:编写一个python脚本,将包含在此文件夹中的XML座位图文件(seatmap1.xml,seatmap2.xml)解析为标准化的JSON格式,该格式至少以以下属性(按行)

    Python网络编程基础

    第8章 XML和XML-RPC 第3部分 E-mail服务 第9章 E-mail的编写和编码 第10章 简单邮件传输协议(SMTP) 第11章 POP 第12章 IMAP 第4部分 多用途的客户端协议 第13章 FTP 第14章 数据库客户端 第15章 SSL 第5部分 ...

    Python使用Beautiful Soup爬取豆瓣音乐排行榜过程解析

    Beautiful Soup是一款高效的Python网页解析分析工具,可以用于解析HTL和XML文件并从中提取数据。 Beautiful Soup输入文件的默认编码是Unicode,输出文件的编码是UTF-8。 Beautiful Soup具有将输入文件自动补全的...

    Python大数据之使用lxml库解析html网页文件示例

    lxml是Python的一个html/xml解析并建立dom的库,lxml的特点是功能强大,性能也不错,xml包含了ElementTree ,html5lib ,beautfulsoup 等库。 使用lxml前注意事项:先确保html经过了utf-8解码,即code =html.decode...

Global site tag (gtag.js) - Google Analytics