`
8366
  • 浏览: 799795 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论

大型网站用户行为记录的一个实现--基于clickStream(第二部分)

阅读更多

 

 

在上一节,我们已经可以使用clickstream 记录用户的行为日志了,可以按照我们的格式要求将日志记录根据log4j定义的格式记录在一个按日生成的日志文件中,这些用户的行为类似我们用 逗号分隔成 这个样子

 

每条日志 的组成是(当然你可以定义更多的日志记录的关注点):

 

用户名,IP地址,访问路径

 

admin,127.0.0.1,/oa/
admin,127.0.0.1,/oa/login.do
admin,127.0.0.1,/oa/address.do?method=list
admin,127.0.0.1,/oa/worklog.do?method=list
admin,127.0.0.1,/oa/sms.do?method=list
admin,127.0.0.1,/oa/notice.do?method=list
admin,127.0.0.1,/oa/meeting.do?method=list
Caught java.net.SocketException closing conneciton.

 

可是将日志记录在文件中 并不是一个好的方式,至少 比如来了一个需求,让分析下 这个路径 /oa/address.do?method=list  被访问了多少次,或者admin 登录了多少次,你就无能为力了,因此 我们考虑通过一个定时任务,每天将日志文件分析一下,插入到数据库中,以后我们 就可以 通过 SQL 这个强大的 语言 ,挖掘用户的行为了

 

 

而这个定时任务实现起来也很容易,附件中就是一个简单的实现,我使用fatjar 打了一个包 运行后 如下图

 

 

 

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics