分享

别以为你写原创有多了不起!不懂机器算法 笔下生花也是徒劳!

 统元论 2017-08-14

这篇小文是写给万千自媒体作者的,也是小编入驻头条号以来的一些个人心得,觉得靠谱的点个赞,有不同意见欢迎留言探讨。

腾讯网曾经给所有编辑的第一条要求:文章要在标题就进入高潮!视频在要20秒内进入高潮!前戏太长大家都受不了。所以,咱们就直接开始正题。

原创的作用没那么神

这真不是危言耸听,各家平台都口口声声说原创第一,内容为王。但问问身边那些苦哈哈写原创的作者们,你们对付出和回报满意吗?真如平台宣传的扶持原创吗?

花5分钟寻找热点,10分钟复制粘贴一篇文章,3分钟起一个语不惊人死不休的标题,前后不到20分钟。很有可能一篇推荐10万+的文章就此产生。而那些辗转反复写原创的人花上几个小时,到最后的结果要么不通过,要么推荐的可怜。

为什么?因为你没弄明白机器的算法,将来对小编的要求不再简单是能写能发能配图,这些现在已经算基础技能。未来的小编要理解怎么给机器打交道。

我给大家透露一些小秘密,这也是一个平台程序员跟私下喝酒吃饭时候跟我讲的。我本身不是技术,好多也听不懂,我把我理解后内容分享出来。

机器“算法”解析

自打你点了“发表”或者“提交”,平台机器收到的不仅仅是一篇文章,而是一个相当大的“数组”,里面包括两个大组,其一是辅助信息,包括你发表文章时间,文章类别,作者信息(包括评分、擅长领域、原创标签与否、过往文章点击率、转发率等综合评分),其二是图文信息。

第一步,机器首先会将文字(标题和内容)中的修饰词,介词,动词等全部过滤掉,剩下名词进行自动分词,截取到分词之后计算名词出现的频率,这样,你这篇文章的内容机器就知道了,并且机器会赋予你文章一个私人“信息指纹”。

第二步,机器会根据提取出来的“信息指纹”与系统里所有文章做比对,这里又有几个动作要同时进行,消除重复和热度赋值。

如果文章90%以上内容一致,机器会认为后发的文章有抄袭嫌疑,而不给推荐,有些媒体账号发问速度还没作者快,为什么还能给推荐?因为媒体机构不同与自媒体人,他们权重更高,即便自媒体人有原创标签,也会排在这些机构的后面。

比如今日头条最近不让自媒体人发社会新闻的原因也就在此,第一是因为自媒体人权威性不够,难免有造谣的嫌疑。二是抢在媒体账号前面发,那和微博有什么区别,对于鱼龙混杂的微博相比,在长篇内容质量上,各大平台还是有考量的。

在排除重复的步骤后,开始对比当天热门关键词库,这个词库是半人工办机器合成的,就是各大内容平台会在新闻平台里抓取一个时间段内所有文章,出现频率最高的词就是当天热点词,这里需要人工去添加和审核,因为很多广告词都会混在其中,如果你的词和词库里的词匹配。那恭喜你了,你获得了机器的初步认可。

第三步,机器会根据你账号的垂直领域和文章领域以及文章复杂程度做一个综合分析,推荐给相应领域的人。如果你本来写情感的突然写个财经领域内容。机器会降低你的初始分值,自然推荐量会减少。如果你全都是文字,自然也会降低初始分支,所以自媒体账号的垂直性很重要,图文相配也很重要。

第四步,评估用户反馈,包括点击率,收藏,点赞,评论,转发,停留时间等互动动作。文章会按照分类推荐1-5个类别的用户。每个平台的标准不一样,拿头条来说,最重要的是文章点击率,如果哪个分类推荐点击率在百分之十以上,那你的文章会集中推荐给这类用户。

第五步,当推荐量达到一定量级之后,判断标准会变化,从点击率逐渐到评论量,因为评论才说明文章真正受用户喜欢,而不是标题党。如果你是标题党,那这篇文章已经成功一半了。如果内容更好,那就等着推荐量继续飙升吧。

所以,起一个好标题,加有争议的内容才是王道,至于原创,可以暂时跟她说拜拜,至少等到你积累一定量粉丝之后,增加粉丝认可和粘度,输出自己的内容时候再谈原创,到时候可以说是动静随心了。

以上就是自媒体账号机器算法的大概思路,还有一些细节,以后文章慢慢分享,打字比较累,我在写这篇原创的时候,就已经知道,机器是不喜欢的,只给有缘人看到就好。有问题随时留言或者私信沟通。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多