1 问题及初解关于微信指数,我特别想了解的两件事情:
首先看看微信官方说法: 微信指数常见问题 官方的说法涉及两个问题的是“微信收录了大部分中文词汇和一部分常见英文词汇”及“微信指数的计算范围包含且只包含微信搜索、公众号文章及朋友圈公开转发的文章”。但我以为官方的回答只是简单的叙述且范围太大,没有细分整个内容,前者没有说微信收录关键词的标准,而后者则只说了范围而未涉及其各部分权重,所以以我的方法简单推测一下。 思考方式有两种,一方面可以从微信的角度考虑,我来设计微信指数会怎么做;另一方面则是根据数据表现来逆推。 微信角度
选择关键词来查找数据进行逆推,则需要考虑以下问题:
2 微信指数录入标准详细数据测试过程: 随机选择任意双韵母词双拼30个,三韵母词10个,观察其收录情况。
微信指数未收录词汇:受到、更是、形成、看过后、全身心、拼了命、如过往、听过课、我大概、把你们。 SD韵母词:速度、时代、萨德、上单、受到、收到、睡得、删掉、舍得、深度、三点、色达、山顶、上党、四大、设定、适当、上帝、谁大、圣诞。 微信指数未收录词汇:受到、睡得、适当、谁大。 GKY韵母词:郭可盈、够可以、高科园、给可以、刚开业、搞科研、工矿业。 微信指数未收录词汇:够可以、给可以、刚开业 是否可以得到三字词未收录率远高于双字词呢? 可以,事实上这些未收录的三字词内都含有已收录的双字词,如给可以—可以、刚开业—开业、拼了命—拼命、全身心—全身-身心等,我猜测三字词之所以未收录率远高于双字词在于其可拆分为另一个更有影响双字词,故而其不收录,如爱琴海、亚克力等不可拆分词则收录几率与双字词基本等同。 那么四字词及以上呢? 四字词:肆无忌惮、一路向北、如果同意、鬼话妖谭、哥还有她、自惭形秽、睡电热毯 如果同意、哥还有她、睡电热毯未被收录,而其他几个具有明确意义的则被收录。 一蓑烟雨任平生、一蓑烟雨、烟雨都被收录,而一蓑烟、一蓑烟雨任都未被收录。可以得到一个猜测,微信指数收录词需要具有明确意义,返回验证,是的、你呢都未被收录。 微信指数未收录“你想”却收录了“想你”,我猜测为微信指数倾向于收录具有完整含义的词,但是微信指数收录了“我想”却未收录“想我”,仔细分析这四个词,我猜测微信倾向于收录高频出现词汇。 “适当”这种常用高频词的未收录,让我猜测微信指数还在逐渐完善中。 微信生态(公众号、小程序)词汇 小程序 我使用记录中的小程序全部收录在微信指数中,为防止是我尝试的小程序都比较出名,故而在一些微信小程序商店里寻找新上架的小程序进行验证,确认小程序不是所有都收录入微信指数,如七天英语、圈子拼团等未被收录。 但是有一个疑惑在于1月9日小程序发布后,首发小程序其微信指数均暴涨,并且值极高,如小密圈1月9日峰值达到2847651、青芒杂志2455188等,而据小密圈创始人wulujia透露,其小程序初始激活人数为十几万,各大爆款公众号文章标题(文中提及不算,下文有解释)也未提及具体小程序的名称,似乎微信指数无法达到200W这个量级。 微信官方信息是“微信指数的计算范围包含且只包含微信搜索、公众号文章及朋友圈公开转发的文章”,但我表示怀疑,微信小程序可能计算在微信指数内,否则无法解释诸多小程序在1月9日的微信指数。 微信公众号 从我关注的个人公众号名称进行筛选:
事实上很奇怪,未被收录的三者,日常阅读过万,还偶有10W+,超过很多已经被收录的公众号名称,从热度和微信生态来讲,这几者都应该被收录,但实际上并没有。与此同时,嘀嗒嘀嗒、望月的博客的作者名均被微信指数收录,少加点班则没有。 还有一点,未开发原创及赞赏的公众号不会被收录入微信指数(样本量小,不确定其是否正确,但我就我关注到的情况是如此的)。 我猜测,微信公众号名称收录与热度(关注数、文章均阅读数、文章最高阅读数等)有关,但并不确定。 至于热词,其实没有什么好说的,因为其肯定是有一个热度阀值(阀值可能不单一也不固定,但是肯定存在一个判断机制),在微信指数判定其热度足够就会将其上线。 3 微信指数数值含义据官方消息得知,微信指数由三部分影响:微信搜索、公众号文章及朋友圈转发的公众号文章,其实质即公众号文章和微信搜索。 首先看以下截图: “马里亚纳海沟”微信指数 槽边往事1月29日10W+文章内容 由此可以看出,文章内容几乎对微信指数无影响或者极低可以忽略(多次比对确认,为了篇幅,只贴一组图)。 再看下列截图: 微信指数“美国消费者报告” 微信指数“美国消费者报告”有两个峰值,分别是2月21日与3月17日,与其关联的事件是【小道消息】发布的两篇一模一样的文章: 【小道消息】2月21日文章及阅读数 【小道消息】3月17日文章及阅读数 美国《消费者报告》同名公众号文章阅读数20628,其微信指数为29008;阅读数为27522,其微信指数为33336,由此得出的结论是什么呢? 公众号标题的阅读数对微信指数的影响因子在1-2之间,未达到2。但我以一个设计者的角度想,阅读数影响因子应该为整数,为1的可能性极大,那么为什么表现出来的影响因子超过1呢? 我猜测 微信文章阅读数是阅读人数,而有的人阅读次数不只1,故而其影响因子超过1,最后结论为微信文章标题其阅读数权重为1,且计入重复阅读。 微信文章阅读数影响因子确实为1,其表现出来大于1的原因在于忽略了朋友圈转发公众号文章的影响,则最后结论为微信文章标题其阅读数权重为1,不计入重复阅读,需考虑文章转发。(我倾向于此猜测) 再看下列截图: 微信指数“美国消费者报告” 同样是“美国消费者报告”的微信指数,其数值可达2及3,其应该是微信搜索带来的指数变化,因为公众号文章一般影响不可能如此低。由此可以看出,微信搜索次数的影响因子为1。 关于朋友圈转发公众号文章,我只有一个猜想。凡是在朋友圈点击进入文章内阅读的,已经在阅读数计数,故而其考虑的应该是转发文章在朋友圈的曝光(未点击进入),这应该是高影响因子,但其基数(转发量)低,故而其影响不是特别大,但仍然是一个重要影响。 而且其影响因子可能考虑微信朋友数或者朋友圈浏览量。 微信指数开放第二天的文章,其中多处不准确,在此致歉。 真开心,原创标识第一篇。 另外,微信指数的使用需要去除杂音 且最好和更多数据进行对比 安姐(朱赟yun)好几个杂音 |
|
来自: 产品经理是条狗 > 《PMCAFF精选文章》