第一阶段的工作总结 - butterfly - ITeye博客

`

butterfly

浏览: 8759 次
性别:
来自: Sun Yet-sen Universi

最近访客更多访客>>

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

butterfly：我按照楼主的blog里写的修改了代码： URLConne ...
关于如何获取网页代码的问题
dengyin2000：你可能需要设置请求的user-agent参数.请看我的blog ...
关于如何获取网页代码的问题

第一阶段的工作总结

博客分类：

bussiness

工作编程单元测试 junit

阅读更多

昨天终于把抽取网页信息的和与数据库连接的两部分代码写完并测试了，基本上还是可以运行滴，只是还是有些小bug，这都是源于编程时想的不够仔细。在这过程中碰到了几个困难：

1。网页的源代码采用的字符编码问题。因为网页的源代码里是夹杂着中文字符的，所以我先以字节流的形式将整个源代码文件的内容读入一个字节数组里(byte[])，然后通过String类的构造函数String(byte[], String charset)构造一个新的字符串，其中charset是网页的源代码所选定的字符编码方式，这样得到的新的字符串就是用java里默认的Unicode编码表示的了。其实String(byte[], String charset)就是将用charset编码的字符串转换成用Unicode编码表示的字符串。因为我一开始没有注意到这个编码问题，所以弄了很久，呵呵。

2。对于一些防止别人采集信息的网站，如何去取得该网站的网页源代码文件。譬如我们要取得的信息就来源于一个采取了防止别人采集信息的网站。我们试过用HttpClient等工具，但结果还是不理想，这部分工作仍需努力。

3。测试。我们现在测试只是沿用刚开始学编程时候的方法，就是一步一步的debug，现在开始要学习如何进行单元测试了。学JUnit吧。

分享到：

IBM的两个开源工具包：UIMA和IODT | 关于如何获取网页代码的问题

2007-01-29 13:22
浏览 1159
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

乡学习实践活动第一阶段工作总结.doc: 乡学习实践活动第一阶段工作总结.doc

先进性教育活动第一阶段工作总结.docx: 先进性教育活动第一阶段工作总结.docx

【消防安全百日阶段总结】XX百日安全活动第一阶段工作总结.doc: 【消防安全百日阶段总结】XX百日安全活动第一阶段工作总结.doc

中心学校廉政风险防控管理工作第一阶段工作总结.doc: 中心学校廉政风险防控管理工作第一阶段工作总结.doc

医院先进性教育活动第一阶段工作总结.docx: 医院先进性教育活动第一阶段工作总结.docx

高职高专人才培养工作水平评估学院第一阶段工作总结.pptx: 高职高专人才培养工作水平评估学院第一阶段工作总结.pptx

热电公司2006年行风建设第一阶段工作总结.doc: 热电公司2006年行风建设第一阶段工作总结.doc

区卫生系统学习实践活动第一阶段工作总结.doc: 区卫生系统学习实践活动第一阶段工作总结.doc

初中美术欣赏课教学方法探究课题第一阶段工作总结.docx: 初中美术欣赏课教学方法探究课题第一阶段工作总结.docx

完美版资料小学消防安全百日攻坚行动第一阶段工作总结..docx: 教育精品资料

出版社科学发展观活动第一阶段学习调研阶段工作总结.docx: 出版社科学发展观活动第一阶段学习调研阶段工作总结.docx

三讲一鼓劲活动教育局第二阶段工作总结PPT.pptx: 三讲一鼓劲活动教育局第二阶段工作总结PPT.pptx

百日安全活动第一阶段安全工作总结.docx: 百日安全活动第一阶段安全工作总结.docx

企业发展观第一阶段小结精品工作总结.pdf: 企业发展观第一阶段小结精品工作总结.pdf

信息科技有限公司x情防控领导小组,第一阶段（截至复工前）工作总结.doc: 信息科技有限公司x情防控领导小组,第一阶段（截至复工前）工作总结.doc

【制造类】工厂制造业人力资源部年度工作总结及规划.doc: 第一章 20xx年工作总结 2 （一）、建立健全合法规范的人力资源管理制度 2 1、建立绩效导向的薪酬体系 2 2、建立培训制度及计划。 3 3、明确岗位说明书 5 4、初步完成公司主经营流程图及相关表格 5 （二）、根据组织...

近期毕业设计工作总结1: 近期毕业设计工作总结：完成毕业论文绪论部分的撰写，进入到第二章的撰写阶段。学习LSTM神经网络模型和Attension机制。阅读学习《Seq2Seq with

1月-英盛网2019第一阶段学习笔记.docx: 怎么用产品思维写工作总结教你用软文思维写工作总结问题分析与解决三步骤、有效汇报的演讲技巧结果思维笔记

超市综合管理信息系统的设计: 第一阶段多数工作和编写的资料是第二阶段的输入。第一阶段最终的产品有以下两部分：实际的可行性研究报告它包含对系统基本功能的描述以及利润/成本分析。系统的初步设计它对于估价成本和利润是必要的，是第二...

Global site tag (gtag.js) - Google Analytics