- 浏览: 319779 次
- 性别:
- 来自: 上海
最新评论
-
libaogui777:
前辈,您好, 使用PDFbox 提取内容遇到一个问题,想请教您 ...
java进行pdf解析-----pdfbox -
xin_hany:
提示惊醒了一下,解决了一个让人惆怅的问题,
danga的MemcachedClient的几个缺陷 -
roroyangivan:
牛B啊。。。我觉得 这种 回答。。。阿里的的CTO 都 HOL ...
怎样才是一个好的架构? -
406657836:
今天知道了一个线程创建时会给stack分配1M内存?一个线程默 ...
jvm线程的stack -
linzx0212:
受教了……
danga的MemcachedClient的几个缺陷
文章列表
对pdf解析有不少成熟技术,经过选型,我最后选定用pdfbox。
前面那个flash上传的是pdf,实际保存到数据库的也是pdf,但中间还有个过程:转换为text文本,并抽取作者、时间、标题、、、之类的信息进行索引(用的lucene)
因为pdfbox原生提供了生成luceneDocument的类,所以不需要什么编程,只针对特殊需求hack了几个小地方,因此就不贴代码了。
这个贴的目的就是推荐一下pdfbox,以后需要用到pdf->text的,这个工具值得使用。
【2009-8】
动态treetable
关键字:tree,table,还有jquery
用的还是jquery插件,以上一系列插件的使用都比较简单——当然前提是这些插件都没有bug,并且人品好。很可惜, 我就遇到了不少问题,不过都解决了。
这次是要显示一个树,
需求如下:
PDF 报表:名称改为“公告维护”,要求首先对公告的分类进行选择。采用左右两栏式,左边列出已经维护的该上市公司所有公告。一级菜单:公告年度,二级菜单:公告类别。右边为维护页面。公告的分类为:公告年度,公告类别(定期公告、临时公告),确定后刷新左边的目录。维护公告名称。选择 PDF 文档并上传,上传成功后刷新左边目录。
...
用flash写了一个动态的文件上传功能,当然也用了jquery的flash插件和jqUploader插件,就是hack了不少代码。
相比传统的html form提交,其优势是flash对本地文件的操作能力:可以在提交到服务器之前就显示文件的相关信息如大小;另外进度条的滚动不需要用ajax对后台轮训,可靠性强,负载小。
flash仍然可以与页面交付,传递数据、调用函数等等。二者基本无缝。
下图中间部分为flash,最底部的文字提示是flash上传结束后触发js生成的html。
【2009-8】
代码以后再上
话说我开始逐渐脱离群众,开发得越来越少。还好最近做了半个月的编程,还是搞weblogic 8.1,
用了该死的struts1.3.8,还有spring ,轻轻改一个action或者一个bean,重启吧,不重启马上就给你脸色看:ClassCastException唰的蹦出来
一天起码重启100次,一次要等30秒以上,也就是说,一天7小时的工作时间(其实真正有效率的开发时间大概能有5小时),其中有50分钟也就是10~20%的时间浪费在重启上,
更不用算这种支离破碎、敲一榔头冷却半天的开发方式对心情的折磨对效率的践踏了。真是死的心都有!
我真是无比怀念servlet+jsp的时 ...
【转】Getting real
刚才偶然看到的,
这本小书是37signals公司写的,一家小公司,没听说过36signals吧,哈哈,
但你一定知道ROR,震惊的是,ROR就起源于这家小公司。。。
小书一本,完整的章节请看 http://gettingreal.37signals.com/GR_chn.php
节选:
首要任务 chapter 4
什么理念才是伟大的
通过亲切友善和人性化来把自己和大公司区分开来
竭尽全力将你的软件定位在一个点上。你的软件代表的是什么?它到底是有关什么的?在你开始设计或写任何代码之前你必须清楚地 ...
开发技术调查的统计结果和图表。
这个结果是我从几十个excel表中用java统计出来的,还很有意思。
java代码以后补上
【2009-6】
展示下linux强大的命令行——一行命令搞定日志分析
最近有需要分析sql日志。
有更简单的方法,在linux或者cygwin里用命令行可以更简单地达到目的,如下,
这是我的cygwin里的运行结果 ,分析同一个sql的出现次数。
用IronTrackSql监视sql执行
很好用,推荐下。
安装和使用:
参考 http://www.javayou.com/diary/3356
安装过程:
IronTrackSQL是利用p6spy这个项目来进行SQL监控的,要在我们的项目中引入这个东西是很简单的,而且不需要改动任意一行代码,你需要做的就是把驱动程序类换一下而已。
在
你配置数据库连接池的地方将驱动类换成 com.p6spy.engine.spy.P6SpyDriver,然后把 spy.properties
文件拷贝到源码根目录,让它自动编译到类路径中,并且修改这个文 ...
[转]程序员的前途
QUOTE:
在
IT行业由超常趋向平常的阶段,社会关注热点转移,程序员的社会平均薪资水平
由高向低回落,引起了许多人对程序员前程的思考。按专家或行业资深人士的说法,程序员有两条进阶路线。一条是技术路线,由程序员,经系统分析师、系统设计
师、项目经理、产品经理,直到架构设计师为归宿。另一条是领导路线,由程序员,经开发小组负责人、工程负责人,奋斗到项目经理。
勿庸置
疑,每种说法都有存在的个例支持。实际上,能走常规进阶路线的毕竟是少数人,大多数程序员在吃过青春饭后,面临着前途选择问题。这与运动员、航空乘务员、
舞蹈演员等的职业境遇是类似的。相比之下,程序 ...
国外开发者博客中有一篇有趣的文章,将程序员按水平像软件版本号那样划分为不同的版本。相对于在招聘时分为初级,中级,高级程序员,直接表明需要某种语言N版本的程序员或许更方便直接。根据作者的观点,可将WEB开发者 ...
tomcat很熟悉吧?天天用~~
往下看就没有几个敢这么自认了,
大家可以尝试访问这样的地址 : http://localhost:8080/manager/serverinfo
http://localhost:8080/manager/jmxproxy/?qry=
*%3Aj2eeType=Servlet%2c*
jmxproxy是一个servlet,为tomcat的核心jmx提供一个网页形式的访问.我们熟悉的weblogic控制台也是这么一个东西,想想,console里的链接参数是不是都长得这样: *MBean*,
更多细节可以参考:http://tomcat.apache ...
printf函数和java.util.Formatter
import java.util.Date;
import junit.framework.TestCase;
public class FormatterTest extends TestCase {
public void testString() {
System.out.println(String.format("%1$6s is a %2$10s", "this", "word"));
System.out.println ...
今天发现一个问题,不解.
TaskStatistic类源码
/**
*
*/
package cn.tohot.webdown.statistic;
import java.util.concurrent.Executors;
import java.util.concurrent.ScheduledExecutorService;
import java.util.concurrent.TimeUnit;
import org.apache.log4j.Logger;
import cn.tohot.webdown.persist ...
今天试用e2php,失败.
发现一段apache 2.2错误日志:
PHP
Warning: PHP Startup: Unable to load dynamic library
'../php/ext\\php_mysql.dll' -
\xd5\xd2\xb2\xbb\xb5\xbd\xd6\xb8\xb6\xa8\xb5\xc4\xc4\xa3\xbf\xe9\xa1\xa3\r\n
in Unknown on line 0
PHP Warning: PHP Startup: Unable to load
dynamic library '../php/ext\\ ...