不小心训练了一个AI学习了咪蒙的文章风格,获取了她的世界观,本文演示下此AI的能力。 1 预测 可以预测2个内容。一个是基于咪蒙以往对各种事物/人的描述,提炼出其对事对人的态度/看法,用于预测。 另一个应用是针对全网热门事件(通过爬虫监测提取),取一个有咪蒙风格的标题。 1.1 针对人/事,咪蒙是如何看待的? 这里针对: 离婚、男朋友、女朋友、开学、滴滴、延禧攻略 从数据上,挖掘下咪蒙是如何看待这些人或事的。 说明: 后面的数字是每个答案的准确率,准确越高,结果越可信; 基于公众号文章的历史数据的预测,并非本文作者的主观看法。 咪蒙觉得 离婚 : 1 好 0.6432416439056396 2 重要 0.5582666993141174 3 穷 0.532257080078125 4 成功 0.47986114025115967 5 胖 0.4722142815589905 这里让AI稍微多透露一些内容: 咪蒙觉得 离婚 对下面的人/事影响最大: 1 父母 0.6931270956993103 2 孩子 0.6799288392066956 3 爱情 0.6668329238891602 继续其他预测: 咪蒙觉得 男朋友 : 1 好 0.9179385900497437 2 有趣 0.7728292346000671 3 小 0.7394572496414185 4 成功 0.7342433929443359 5 重要 0.7158277034759521 咪蒙觉得 女朋友 : 1 好 0.5734760165214539 2 有趣 0.5382117033004761 3 最大 0.4727887511253357 4 成功 0.44332340359687805 5 贫穷 0.44006460905075073 咪蒙觉得 开学 : 1 最苦 0.3340543508529663 2 均匀 0.3158642053604126 3 显赫 0.31271547079086304 4 轻松 0.31070709228515625 5 和谐 0.29741978645324707 咪蒙觉得 滴滴 : 1 好用 0.4044570326805115 2 强韧 0.37111154198646545 3 不愧 0.3322722911834717 4 拗神馁 0.3318832516670227 5 意外 0.3258388042449951 咪蒙觉得 延禧攻略 : 1 愚蠢 0.42433181405067444 2 很嫩 0.3688957393169403 3 很重 0.35487544536590576 4 具体 0.34537771344184875 5 赤贫 0.3256300091743469 1.2 如何为热点事件,取一个有咪蒙风格的标题? 针对最近几天的全网热点事件: 军训后走路都不自然了 mh370写给2014的一封信 晒被大军五点起床占位 微信交学费摇一摇免单 不想上幼儿园用袋子背去 一生都离不开的调味料 个人税后月薪一万在上海是什么样的体验? 员工是否要对公司忠诚? 自如甲醛房数据 预测咪蒙会如何取文章的标题。 说明: 后面的数字是每个答案的准确率,准确越高,结果越可信; 基于公众号文章的历史数据的预测,并非本文作者的主观看法。 咪蒙对热点《 军训后走路都不自然了 》,会这么取标题: 1 挨了两刀后 我妈都不认识我了 2 一年一度的虐狗节 我却笑了一整夜 3 你减肥失败的9条原因 被我找到了 4 男朋友睡着了 我发现惊天秘密 5 深夜 男友收到了兄弟的暧昧消息 咪蒙对热点《 mh370写给2014的一封信 》,会这么取标题: 1 选择属于你的好时光 2 我受过最大的伤 就是看见你的自拍 3 多希望当初的你 能遇到现在的我 4 100万对你不算什么 够我一天生活费了 5 因为我高考失败 我的下属才是清华的 6 你减肥失败的9条原因 被我找到了 7 深夜 男友收到了兄弟的暧昧消息 咪蒙对热点《 晒被大军五点起床占位 》,会这么取标题: 1 女人到底想要什么样的惊喜 2 人是被自己的学习和经历所塑造的 3 没有人告诉过我 被摸胸就要报警 4 什么时候最自卑 身边人被夸的时候 咪蒙对热点《 微信交学费摇一摇免单 》,会这么取标题: 1 为什么微信只能点赞 不能点呸 2 愣着干吗 玩啊 3 新型父母 热爱工作 佛系养娃 4 颜值这种事 和体重毫 无 关 系 5 人生最紧张的时刻 对方正在输入 6 男女之间有纯友谊 笑skr人 咪蒙对热点《 不想上幼儿园用袋子背去 》,会这么取标题: 1 如果可以 我希望那天没让儿子去上幼儿园 2 有一种好看 叫前任看了想复合 3 毕业那天 我老板 做了这种事...... 咪蒙对热点《 一生都离不开的调味料 》,会这么取标题: 1 我的一生 是被父母嫌弃的一生 2 不在乎的才谦让 喜欢的都去抢 3 你的每次逃避 都要双倍偿还 4 去年的衣服配不上我了 去年的老公也是 咪蒙对热点《 个人税后月薪一万在上海是什么样的体验? 》,会这么取标题: 1 一个地方就能看清 你是在生活 还是在凑合 2 我听过的最大谎言是 你还年轻 咪蒙对热点《 员工是否要对公司忠诚? 》,会这么取标题: 1 我无数次想删掉那段傻逼回忆 2 我对所有人都很好 唯独想对你使坏 3 我不仅脸皮厚 我还不知道天高地厚 咪蒙对热点《 自如甲醛房数据 》,会这么取标题: 1 我暴瘦30斤的秘籍 今日大公开海量照片 慎入 2 我们欺骗自己的时候 不择手段 3 这三个字 胜过自由 胜过生命 胜过甜言蜜语...... 4 这个刺激的问题 你敢问男友吗 5 太刺激了 你租过房 那你租过床吗 2 技术原理 本文的AI是如何训练的?先了解下核心的技术原理: 点击下图get知识卡片 技能要求:机器学习、python、分词 3 AI训练目标: 符合全网用户阅读喜好 提取咪蒙文风中所使用的形容性的短句 为了达成这个目标,对评论数高的文章提高其权重。 4 AI训练步骤: 4.1 数据收集 爬取868篇公众号文章,包括标题+简介+正文。 4.2 数据处理与提取 从数据中根据词性、常用的短句、常用的形容词等,提取出属于咪蒙文风的词典。 4.3 词向量的训练 利用word2vec进行词向量的训练,并对评论数高的文章提高权重 以上为全文,再次强调,本文是AI基于大数据预测出来的结果,仅供参考。 |
|
来自: Mixlab交叉学科 > 《待分类》