`
shuai1234
  • 浏览: 996874 次
  • 性别: Icon_minigender_1
  • 来自: 山西
社区版块
存档分类
最新评论

(转)利用clickstream跟踪用户(点击量)

    博客分类:
  • java
 
阅读更多
自己翻译的,不正确的地方大家别笑话,请帮着指出来啊,谢谢。Sleepy

项目主页:http://www.opensymphony.com/clickstream/
具体的例子可以看clickstream-1.0.2.war

Clickstream 概述

一个用来跟踪正在你的站点上访问的用户所到达位置细节的工具。它允许你跟踪访问你的站点的“点击流”或者“传输路径”。请访问JIRA的更新日志 来了解Clickstream最近的发展。

特性

" 当用户会话产生时,开始跟踪点击流。(通过一个监听器)
" 跟踪用户产生的每次点击信息。(通过一个过滤器)
" 当用户会话终止时,将完整的点击流记录到文件或者PrintStream中。
" 设法发现用户是不是机器人,并进行适当的过滤(目前可以检测252种机器人)

安装

clickstream-1.0.2.jar and commons-logging.jar放到[web应用程序根目录]/WEB-INF/lib里,把下面的代码加到[web应用程序根目录]/WEB-INF/web.xml里面:


 <filter>
<filter-name>clickstream</filter-name>
<filter-class>com.opensymphony.clickstream.ClickstreamFilter</filter-class>
</filter>
 
<filter-mapping>
<filter-name>clickstream</filter-name>
<url-pattern>*.jsp</url-pattern>
</filter-mapping>
 
<filter-mapping>
<filter-name>clickstream</filter-name>
<url-pattern>*.html</url-pattern>
</filter-mapping>
 
<listener>
<listener-class>com.opensymphony.clickstream.ClickstreamListener</listener-class>
</listener>
 


根据上面的配置,Clickstream会跟踪所有对jsp或者html文件的请求.无论什么时候,只要一个HttpSession失效了,对那个会话的完整点击流就会被记录。如果你想跟踪对其他类型的点击(例如.txt或者pdf文件),只需要添加更多的filter-mapping就可以了。

下面是一个完整的web.xml的例子

 <?xml version="1.0" encoding="ISO-8859-1" ?> 
<!DOCTYPE web-app (View Source for full doctype...)> 
<web-app>
<display-name>Opensymphony Clickstream Example</display-name> 
<filter>
<filter-name>clickstream</filter-name> 
<filter-class>com.opensymphony.clickstream.ClickstreamFilter</filter-class> 
</filter>
<filter-mapping>
<filter-name>clickstream</filter-name> 
<url-pattern>/*</url-pattern> 
</filter-mapping>
 
<listener>
<listener-class>com.opensymphony.clickstream.ClickstreamListener</listener-class>
</listener>
</web-app>


你可以利用clickstreams.jsp
 <%@ page import="java.util.*,
com.opensymphony.clickstream.Clickstream" %>
 
<%
Map clickstreams = (Map) application.getAttribute("clickstreams");
 
String showbots = "false";
if ("true".equalsIgnoreCase(request.getParameter("showbots")))
showbots = "true";
else if ("both".equalsIgnoreCase(request.getParameter("showbots")))
showbots = "both";
%>
<html>
<head>
<title>All Clickstreams</title>
</head>
 
<body>
<h1>All Clickstreams</h1>
 
<a href="?showbots=false">No Bots</a> |
<a href="?showbots=true">All Bots</a> |
<a href="?showbots=both">Both</a>
 
<p> 
<% if (clickstreams.isEmpty()) { %>
  No clickstreams in progress.
<% } else {
synchronized(clickstreams) {
Iterator it = clickstreams.keySet().iterator();
int count = 0;
while (it.hasNext())
{
String key = (String)it.next();
Clickstream stream = (Clickstream)clickstreams.get(key);
 
if (showbots.equals("false") && stream.isBot())
{
continue;
}
else if (showbots.equals("true") && !stream.isBot())
{
continue;
}
 
count++;
try {
%>
<%= count %>. <a href="viewstream.jsp?sid=<%= key %>"><b><%= (stream.getHostname() != null && 
!stream.getHostname().equals("") ? stream.getHostname() : "Stream") %></b></a> <font size="-1">[<%= stream.getStream().size() 
%> reqs]</font><br>
<%
}
catch (Exception e)
{
%>
An error occurred - <%= e %><br>
<%
}
}
}
}
%>
</p>
</body>
</html>
 

和viewstream.jsp来显示系统当前的Clickstream活动。
 <%@ page import="java.util.*,
com.opensymphony.clickstream.Clickstream,
com.opensymphony.clickstream.ClickstreamRequest" %>
 
<%
if (request.getParameter("sid") == null)
{
  response.sendRedirect("clickstreams.jsp");
  return;
}
 
Map clickstreams = (Map)application.getAttribute("clickstreams");
 
Clickstream stream = null;
 
if (clickstreams.get(request.getParameter("sid")) != null)
{
  stream = (Clickstream)clickstreams.get(request.getParameter("sid"));
}
 
if (stream == null)
{
  response.sendRedirect("clickstreams.jsp");
  return;
}
%>
 
<html>
<head>
<title>Clickstream for <%= stream.getHostname() %></title>
</head>
 
<body>
<div align="right"><a href="clickstreams.jsp">All streams</a></div>
 
<h1>Clickstream for <%= stream.getHostname() %></h1>
 
<b>Initial Referrer</b>: <a href="<%= stream.getInitialReferrer() %>"><%= stream.getInitialReferrer() %></a><br>
<b>Hostname</b>: <%= stream.getHostname() %><br>
<b>Session ID</b>: <%= request.getParameter("sid") %><br>
<b>Bot</b>: <%= stream.isBot() ? "Yes" : "No" %><br>
<b>Stream Start</b>: <%= stream.getStart() %><br>
<b>Last Request</b>: <%= stream.getLastRequest() %><br>
 
<% long streamLength = stream.getLastRequest().getTime() - stream.getStart().getTime(); %>
<b>Session Length</b>:
  <%= (streamLength > 3600000 ?
    " " + (streamLength / 3600000) + " hours" : "") +
  (streamLength > 60000 ?
    " " + ((streamLength / 60000) % 60) + " minutes" : "") +
  (streamLength > 1000 ?
    " " + ((streamLength / 1000) % 60) + " seconds" : "") %><br>
 
<b># of Requests</b>: <%= stream.getStream().size() %>
 
<p><b>Click stream</b>:</p>
 
<table border="0" cellpadding="2">
<%
synchronized(stream) {
Iterator clickstreamIt = stream.getStream().iterator();
 
int count = 0;
while (clickstreamIt.hasNext())
{
count++;
String click = ((ClickstreamRequest)clickstreamIt.next()).toString();
%>
<tr><td><%= count %>:</td><td><a href="http://<%= click %>"><%= click %></a></td></tr>
<%
}
}
%>
</table>
</body>
</html>
 


配置

日志功能是非常基本的(你可以与log4j集成)。如果你需要更多更高级的日志功能,那就需要实现com.opensymphony.clickstream.logger.ClickstreamLogger接口并且提供任何你所希望的持久化方法。

默认情况下,Clickstream使用com.opensymphony.clickstream.logger.SimpleClickstreamLogger这个类来处理日志。这个logger只能向Jakarta的Commons Logging工具发送一个INFO日志声明,Commons Logging可以依次通知多个日志provider,包括log4j

可以通过创建一个clickstream.xml配置文件并且把它放在你应用程序的类路径中(通常是[web应用程序根目录]/WEB-INF/classes)来改变这种默认的行为。配置文件可能是如下的形式:

 <clickstream>
<!-- there can only be one logger -->
<logger class="com.opensymphony.clickstream.logger.SimpleClickstreamLogger"/>
 
<!-- there can be zero or more bot-hosts -->
<bot-host name="someBotHost"/>
 
<!-- there can be zero or more bot-agents -->
<bot-agent name="someBotAgent"/>
</clickstream>
 


如果你希望提供你自己的logger,请查看Clickstream 的javadoc文档

和容器有关的特定问题

当从控制台停止Clickstream应用程序时,BEA WebLogic 8.1 (SP2)会抛出NullPointerException异常(when setting the attribute NULL for the clickstreams in the ServletContext on contextDestroyed—这句话不会翻译,谁能帮帮忙),需要应用CR133558这个补丁(已经包含在weblogic的sp3中)。

外部文档
" 使用EAServer跟踪你的用户—Berndt Hamboeck所著的Sybase白皮书
" Servlet2.3 模型的过滤器代码—Jason Hunter所著的“谁在你的站点上,他们正在干什么”的一段。

http://blog.sina.com.cn/s/blog_4ae2ef25010006rc.html
分享到:
评论

相关推荐

    大型网站用户行为记录的一个实现--基于clickStream(第一部分)

    "大型网站用户行为记录的一个实现--基于clickStream(第一部分)"这篇博客探讨了如何利用clickStream技术来实现这一目标。clickStream是一种追踪用户在网站上点击行为的技术,它能够捕获用户从一个页面到另一个页面的...

    StatViz: graphical clickstream analysis-开源

    - **优化SEO策略**:通过分析用户访问路径,找出排名较低但访问量大的页面,进行针对性的优化。 - **提升用户体验**:根据会话跟踪,找出用户常停留或频繁跳转的页面,优化内容布局和导航结构。 - **评估营销活动...

    2013年中国数据库大会-44-云端漫步——利用Amazon AWS构建可伸缩的数据分析平台

    数据来源方面,主要来自于Web服务器的点击流(Clickstream)和定制的收集服务器(CollectServer)跟踪信息。兰亭集势对于数据处理的需求特点包括集群规模不大,集群使用不饱和,以及需要较大的计算弹性,这些特点...

    基于STM32的数控线性稳压电源设计:恒压恒流输出与过流保护

    内容概要:本文详细介绍了一种基于STM32单片机的数控线性稳压电源设计方案。该电源采用220V市电输入,经过工频变压器降压、全桥整流及电容滤波,最终输出稳定的直流电压。设计中采用了线性稳压调整器方案,通过STM32单片机控制TLC5615数模转换器,实现了电压的数控调整。系统具备恒压恒流输出、过流保护、温度监测等功能,并配有LCD1602显示屏和声光报警装置。所有设计资料(源程序、原理图、PCB)均经过验证,具有较高的学习和设计参考价值。 适合人群:电子工程专业学生、嵌入式系统开发者、硬件工程师。 使用场景及目标:适用于实验室、工业自动化等领域,需要稳定电源供应的场合。目标是帮助读者理解和掌握基于STM32的数控线性稳压电源设计方法,提高电源系统的可靠性和安全性。 其他说明:文中提供的设计资料详尽完整,有助于读者深入理解每个环节的工作原理和技术细节。

    LeddarTech客户案例研究.pdf

    LeddarTech客户案例研究.pdf

    mybatis-spring-2.0.6.jar中文文档.zip

    # 压缩文件中包含: 中文文档 jar包下载地址 Maven依赖 Gradle依赖 源代码下载地址 # 本文件关键字: jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 # 特殊说明: ·本文档为人性化翻译,精心制作,请放心使用。 ·只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; ·不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 # 温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件;

    毕业论文-手机壁纸-整站商业源码.zip

    毕业论文-手机壁纸-整站商业源码.zip

    毕业论文-二手跳蚤市场V5.4.1带微信支付、广告插件-整站商业源码.zip

    毕业论文-二手跳蚤市场V5.4.1带微信支付、广告插件-整站商业源码.zip

    毕业论文-体育新闻-整站商业源码.zip

    毕业论文-体育新闻-整站商业源码.zip

    aircompressor-0.8.jar中文文档.zip

    # 压缩文件中包含: 中文文档 jar包下载地址 Maven依赖 Gradle依赖 源代码下载地址 # 本文件关键字: jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 # 特殊说明: ·本文档为人性化翻译,精心制作,请放心使用。 ·只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; ·不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 # 温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件;

    傅里叶变换函数,Matlab脚本,可以直接调用

    傅里叶变换函数,Matlab脚本,可以直接调用

    【电子设计竞赛】基于FPGA和电阻应变片的简易电子秤设计:称重与功能实现详解

    内容概要:本文档是2016年TI杯大学生电子设计竞赛G题——简易电子秤的设计要求与评分标准。任务要求设计并制作一个以电阻应变片为称重传感器的简易电子秤,其支架高度不超过40cm,悬臂梁上粘贴电阻应变片。具体要求包括:能以克为单位显示重量(10分),称重范围5.00g~500g且误差控制在特定范围内(50分),可设置单价并计算物品金额及累加(15分),具有去皮功能(15分),以及附加功能(10分)。设计报告涵盖方案论证、理论分析、电路与程序设计、测试方案及结果、报告结构及规范性(共20分)。此外,强调称重传感装置需自制,测试时以砝码为标准。 适合人群:电子工程及相关专业的学生或对电子设计有兴趣的学习者,尤其是准备参加类似竞赛的学生。 使用场景及目标:用于指导参赛选手完成竞赛作品,帮助他们理解竞赛的具体要求、评分细则,从而有针对性地进行设计与制作,确保作品符合竞赛规则。 其他说明:文档不仅提供了详细的任务要求,还明确了评分标准,有助于参赛者全面把握设计重点,合理分配时间和精力。同时,对于非参赛者而言,也是一个很好的学习案例,有助于了解电子秤的工作原理及设计思路。

    灭火器识别数据集,识别率99.5%,分别率640x640,127张训练图,支持yolov7格式的标注框

    灭火器识别数据集,识别率99.5%,分别率640x640,127张训练图,支持yolov7格式的标注框

    spring-boot-configuration-processor-1.5.14.RELEASE.jar中文-英文对照文档.zip

    # 压缩文件中包含: 中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖 源代码下载地址 # 本文件关键字: jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 # 特殊说明: ·本文档为人性化翻译,精心制作,请放心使用。 ·只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; ·不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 # 温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件;

    电力电子学中开环控制三相模块化多电平转换器(MMC)及其PWM脉冲发生器的应用研究

    内容概要:本文详细介绍了三相模块化多电平转换器(MMC)在开环控制环境下的运行机制和技术细节。首先,文章解释了MMC的基本概念,强调其高电压等级、模块化设计和灵活的拓扑结构。接着,阐述了开环控制策略,尤其是PWM脉冲发生器的作用,它根据预设的电压和电流参考值生成PWM信号,用于控制各子模块的通断状态。然后,描述了每个臂由四个功率模块组成的子模块与功率配置,确保电能的高效转换。再者,讨论了MMC与RLC结构或更大电网的连接方法,使其能够模拟不同负载条件并提供稳定电力输出。最后,介绍了示波器的应用,通过实时监测关键参数来评估和优化MMC的性能。 适合人群:从事电力电子领域的研究人员、工程师和技术爱好者。 使用场景及目标:适用于希望深入了解MMC工作原理及其在实际电力系统中应用的专业人士。目标是掌握MMC的设计、控制和优化方法,提高电力转换效率和稳定性。 其他说明:本文提供了丰富的理论背景和技术细节,对于理解和应用MMC技术具有重要指导意义。

    基于python+NSGA2算法的供水管网水质监测点布局+源码+项目文档(毕业设计&课程设计&项目开发)

    基于python+NSGA2算法的供水管网水质监测点布局+源码+项目文档,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档 供水管网水质监测点/传感器布局优化 1.基于整数编码的NSGA2算法 2.最短监测时间与最大监测概率双目标函数 3.使用基于epanet的wntr库进行水力水质模拟,并处理结果 4.将处理结果代入NSGA2算法, 迭代计算出结果 5. 所有功能基本实现, 流程基本可以走通 程序概述 本程序主要是解决供水管网水质监测点的布局优化问题; 面向的是突发污染情况下的水质监测点选取,因此需要多节点进行水质污染注入实验; 之前的做法都是使用epanet的程序包,链接库,但USEPA之后开源了基于Python的水力水质模拟库WNTR; 因此本程序使用了WNTR进行水力水质模拟,编写了水质模拟、数据处理模块;用于解决污染实验的实现与数据收集处理; 由于选择监测点是布局优化问题,因此使用了常见的进化算法NSGA2——非支配遗传算法; 水质监测布局常用的目标是最小化监测时间和最大化监测事件,即一组监测点尽可能对污染事件发生响应最快,对污染事件监测到的数量最多即为最优,但两个目标属于负相关。 有关帕累托解、NGSA2算法请自行搜索其他资料。 本程序实现了水质模拟、数据处理、算法迭代的全部过程。

    双馈风机DFIG低电压穿越(LVRT)的MATLAB仿真模型:矢量控制与Crowbar电路设计

    内容概要:本文详细探讨了双馈风机(DFIG)低电压穿越(LVRT)能力的MATLAB仿真模型。首先介绍了转子侧变换器的控制策略,采用了基于定子电压定向的矢量控制方法,实现了有功无功解耦,并具备最大功率跟踪(MPPT)能力。其次,网侧变换器则采用电网电压定向的矢量控制策略,确保直流母线电压稳定,输入功率因数为1。此外,还深入解析了Crowbar电路的设计及其保护机制,当直流母线电压或转子电流超出设定阈值时,Crowbar电路将启动,防止系统损坏。仿真模型分为三层架构:风速模型和机械传动链、双PWM变流器控制层、电网故障模拟模块。最终通过仿真验证了系统的稳定性和有效性。 适合人群:从事风电系统设计、电力电子控制、MATLAB仿真等相关领域的工程师和技术人员。 使用场景及目标:适用于需要理解和优化双馈风机低电压穿越特性的研究人员和工程师。主要目标是掌握DFIG的LVRT控制策略,特别是矢量控制和Crowbar电路的工作原理,从而提高系统的可靠性和稳定性。 其他说明:文中提供了具体的MATLAB代码片段,帮助读者更好地理解各个控制环节的具体实现。调试过程中需要注意PI参数的设置和各控制环之间的参数匹配,以确保系统的最佳性能。

    汽车轮胎识别数据集,837张训练图 识别率99.5%,支持yolov5格式的标注

    汽车轮胎识别数据集,837张训练图 识别率99.5%,支持yolov5格式的标注

    脉振方波HFI高频注入技术:基于TI283x的模型代码与Matlab仿真解析

    内容概要:本文详细介绍了脉振方波HFI(高频注入模型)的技术背景及其在TI283x系列处理器上的实现方法。首先阐述了脉振方波HFI的基本概念和技术优势,接着展示了如何用C语言编写模型代码来生成和调制脉振方波信号。随后,利用Matlab进行了详细的仿真实验,包括创建仿真环境、定义参数、生成信号、配置仿真逻辑以及最终的数据分析。通过这一系列操作,不仅加深了对脉振方波HFI的理解,还验证了模型的有效性和可行性。 适合人群:从事高频信号处理、嵌入式系统开发的研究人员和技术爱好者,尤其是那些希望深入了解脉振方波HFI机制的人士。 使用场景及目标:适用于需要研究或开发高频注入技术的实际项目中,帮助开发者掌握从理论到实践的具体流程,提高技术水平。 其他说明:文中提供的代码片段和仿真步骤均经过测试,确保能够正常运行并得到预期效果。同时,附带的相关文档也为进一步学习提供了丰富的参考资料。

    毕业论文-8导航-整站商业源码.zip

    毕业论文-8导航-整站商业源码.zip

Global site tag (gtag.js) - Google Analytics