六狼论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

搜索
查看: 774|回复: 0

大型网站用户行为记录的一个实现--基于clickStream(第二部分)

[复制链接]

升级  41.67%

93

主题

93

主题

93

主题

举人

Rank: 3Rank: 3

积分
325
 楼主| 发表于 2013-1-30 00:56:10 | 显示全部楼层 |阅读模式
 
 
在上一节,我们已经可以使用clickstream 记录用户的行为日志了,可以按照我们的格式要求将日志记录根据log4j定义的格式记录在一个按日生成的日志文件中,这些用户的行为类似我们用 逗号分隔成 这个样子
 
每条日志 的组成是(当然你可以定义更多的日志记录的关注点):
 
用户名,IP地址,访问路径
 
admin,127.0.0.1,/oa/
admin,127.0.0.1,/oa/login.do
admin,127.0.0.1,/oa/address.do?method=list
admin,127.0.0.1,/oa/worklog.do?method=list
admin,127.0.0.1,/oa/sms.do?method=list
admin,127.0.0.1,/oa/notice.do?method=list
admin,127.0.0.1,/oa/meeting.do?method=list
Caught java.net.SocketException closing conneciton.
 
可是将日志记录在文件中 并不是一个好的方式,至少 比如来了一个需求,让分析下 这个路径 /oa/address.do?method=list  被访问了多少次,或者admin 登录了多少次,你就无能为力了,因此 我们考虑通过一个定时任务,每天将日志文件分析一下,插入到数据库中,以后我们 就可以 通过 SQL 这个强大的 语言 ,挖掘用户的行为了
 
 
而这个定时任务实现起来也很容易,附件中就是一个简单的实现,我使用fatjar 打了一个包 运行后 如下图
 

 
 
 
您需要登录后才可以回帖 登录 | 立即注册 新浪微博账号登陆

本版积分规则

快速回复 返回顶部 返回列表