分享

用户关系挖掘—网页理论

 旭龙 2010-10-09

写此文的目的是希望在看这个blog的达人能推荐给我数据挖掘相关的并且靠谱的:人、blog、书、项目。此文仅作谨慎的参考,欢迎批评指正,谢谢。

挖掘点一------用户基本资料挖掘

用户资料指用户的固有社会属性,在一定时期内固定的而且固有的特征。比如用户的名字,用户的大学,用户所在的公司。

1. 把用户信息和用户的关系结合起来。

a)比如我们会在用户系统消息和首页动态里显示最近生日的朋友。

b)在某个关系网(比如浙大)专门立一块地方叫今天生日的浙大人。

c)基于生日这个特性,我们会给每个当天生日的人送虚拟礼物,引导其朋友给TA生日祝福。

d)我们还会推荐给用户同年同月同日生的陌生人。

2.深挖用户的关联资料。 很多基本资料关联后往往能引起质变。

a)比如我们会把老家在杭州的浙江大学2008界新入学学生筛选到一起,帮助他们更快成立老乡会。

b)比如我们会把相同职业并来自相同学校的人筛选在一起,促进他们的行业校友圈子的形成。


挖掘点二-----用户临时行为挖掘

这个可能比较杂,也很难概括。举几个具体例子。

1.A用户想要卖掉一个MP3,B用户想要买一个二手MP3,我们把他们的信息让对方看到。这就是淘宝和口碑,是一个比较直接而且意识明确的交流,双方都是主动的,我们只要给他们一个展示平台和良好的搜索入口就可以了。

2.对用户的非明确性行为的分析会产生更有趣和更广泛的挖掘。比如我们检测到某北京用户在日志里写到最近想去西湖玩,而另一个天津用户也写道要去西湖,而另一个武汉用户写了一篇最近关于西湖的游玩日志。通过西湖这个关键字,我们是不是可以把这3个人互相推送,说不定他们之间会有什么火花产生。再举个IPHONE的例子,A用户在日志里写想要买个手机,然后我们把其它用户关于IPHONE信息聚集到一起推送给他,他会发现最近有什么人也在和我一起关注IPHONE,有几个人写了IPHONE的使用心得,而另一些人在某个地方用多少钱买了IPHONE。这些信息对A用户就非常有价值。对广告主来说,这是有价值的社区口碑营销。

3.另外还有更丰富的横向关联。比如我们发信A用户最近老是写关于怀孕的文章,那我们推给她另一个最近老是写生完小孩后减肥的文章,或者想怀孕的人肯定有丈夫,那在情人节快来的时候推给他一些“可以作为丈夫礼物”的广告---比如剃须刀。像怀孕、减肥和剃须刀之间的关联表就要求我们手动去建立,或者用大量的数据匹配来做大概率的关键词关联表。

挖掘点三-----用户点对点关系的挖掘(这是重点)

用户关系的挖掘非常丰富,我仍旧是举几个具体的例子。

1.比如临时的关系,我们检测到A用户和B用户都在使用同一个IP,我们就把他们推送给对方,那么他们的关系可能是邻居(使用动态IP的拨号用户),可能是同事(他们现实中已经认识,却不知道对方也在上桌板网,这个时候的推送非常让人惊奇),可能是同学,或者是同在一个网吧。为了让这个匹配规则更明确我们可能会结合其它的信息。比如我们发现某个IP是电信分配给企业用户的IP,而A和B在用该IP登陆桌板的时候一般都是在白天,那我们就可以大致判断他们是同事关系。

2.另一个比如二度关系,这个情况也有很多种,A和B是好友关系,在B的另外100个好友里很有可能有个叫C的人A也是认识的。我们把C找出来的方式也有很多种,我们发现A的老家是杭州,而B的好友里有个人(假设为C)老家也是杭州,那我们觉得相对C与B其他好友比起来更可能会认识A。再比如我们发现在A的好多个好友里面都有一个叫C的用户,那我们就觉得这个C和A可能是同一个圈子的人。再比如我们发现B的好友C加入了某个社团和A已经加入的社团(或者关系网)是重叠的,那我们就把C推荐给A,这样推送的C更可能是A认识的人。

3.再来讲一个非常直接的点对点关系,也是目前很多网站正在做的关系挖掘-----------------邮件联系人列表。我们会把用户(假设为A)的每一个邮件联系人列表(比如在邀请朋友,找朋友的时候我们会要求用户输入邮箱账号和密码从而得到他的联系人列表)保存起来,然后我们发现新来了一个用户B,他的注册邮箱在A的邮件联系人列表里,那我们就把他们两个互相推荐,因为他们在彼此的邮件联系人里,很可能之前就彼此认识。我们甚至可以发掘邮件联系人的二度关系,我们发现A的邮件联系人列表里有部分和B的邮件联系人列表重叠,虽然A和B没有直接的关系,但我们推测A和B可能是同一个圈子的人,比如是小学同学。

在具体操作的时候我们可以把这些关系做不同评级,并且叠加起来考虑。比如我们发现A和C都是同一年进入了同一个学校,而且A和C的qq邮箱联系人列表有很大部分重叠,那我们觉得A和C非常有可能是同学。把一些相关性不是很明显的因素叠加起来可能就会发现一个相关性非常高的用户关系。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多