分享

为什么大多数公司做不好搜索引擎

 树悲风 2020-12-25

这是半佛仙人的第440篇原创

1

在这个信息大爆炸的世界,一个人对热点信息的响应程度,一定程度上决定了他的受欢迎程度。

毕竟,人人都想有一个江湖百晓生那样的朋友,更想自己也成为这样受欢迎的人。

信息搜集和整理的能力,一定程度上取决于用了什么搜索工具。

过去我们的搜索,靠的是搜索引擎。

现在的搜索,是万物皆可引擎。

我们用微博搜明星,用淘宝搜商品,用豆瓣搜书、搜八卦,搜索引擎已然成为了我们生活中的一部分,成为我们抢占热点信息、不脱节的社交工具,更是成为了我们网络生活的全部。

我们需要用搜索对抗不知道外面在发生什么的焦虑,需要它来证实我们的猜测,好寻找心理认同,证明我们没有社交冷场。

举个不恰当的例子,哪怕发生了地震,我们的第一反应可能都不是逃生,而是打开手机,搜索“地震”,看看它有没有上热搜。

那么问题来了,我们的这种搜索真的能找到“真相”吗?

很多人并没有可靠途径来确保自己所查阅的信息是否真实和权威,所以这种搜索有可能引发群体性的“信息从众”,人云亦云。

从海量资讯中甄别信息真伪,是每个网民的困境。

也是所有搜索引擎正在面临的挑战。

我们的问题不是信息不够多。

而是太多。

2

判断一个搜索引擎好不好用,主要看三方面。

第一,高效。

第二,精准。

第三,稳定。

说白了就是看它能不能让用户高效地获取正确信息的问题。

这是市面上所有搜索引擎的痛点。

此外,搜索引擎还存在一些问题。

我们常说获取信息,有两种方式:

一种主动获取,一种是被动接受。

如今,想要主动去获取信息,已然是一种越来越稀缺的独立思考能力。

很多人虽然接受了信息检索的训练,但架不住现在网络平台的智能算法和推送能力大法好,导致了信息茧房的存在,大家需要花更多的时间精力去滤筛选信息。

这就增加了主动搜索的不确定的风险,搜不搜得到,以及可能会搜到什么内容非常不可控。

很多青少年甚至中老年人,前者缺乏一定的生活经验,后者欠缺必要的信息筛选训练。这两类人非常容易成为互联网诈骗的重灾区。

发现没,信息匮乏是个大问题,但信息大爆炸又带来了虚假信息难以辨别的问题。

相比之下,被动接受就要轻松得多,这种经由大数据处理之后的自动分发模式,让用户甚至不需要做什么,想看的东西自己就会冒出来。

不过这种被动接受并不意味着用户就可以选择躺平不动。事实上,绝大多数这种自动出现的信息都是无效无聊的,想要从中挑出一点有效信息,时间成本过高,回报过少。

甚至屡屡被爆出的数据泄露事件与谣言危机,在这种被动接受机制下很难得到有效地净化。

想成为合格的网上冲浪选手,用户必须要培养自己辨别筛选信息的能力,养成主动获取信息的习惯。

反过来从搜索引擎自身来说,这二十多年来,它能提供的服务已经越来越无法满足人们在碎片化的时间中快速寻求答案的需求。

以及“搜索引擎”商业化进程中不可避免诞生的竞价推广,关键词优化模式,用户根本分不清,自己搜到的是不是广告。

就说牛老师吧,他前几天感冒,感觉腮下淋巴结有点肿,他是随手搜了一下,却差点给我吓尿了,结果竟然显示说他这可能是艾滋的症状。

这个搜索引擎太不准了。

按照牛老师的生活习惯,应该把“可能”去掉,这个引擎还需要进步。

这恰好也说明了,搜索的精准率是一种刚需。

并且,搜索引擎所提供的这个答案,不应该只有正确答案的告知。搜索引擎应该意识到,用户的每分每秒都是黄金时间,经不起一点浪费。

它需要做的远比现在可以实现的更多,比如说帮助用户一步到位地解决问题,告知他们用什么手段解决以及在哪里解决。

但显然,这条路并不好走。

3

是当前存在难以攻克的技术难题吗?

是,但也不是。

搜索引擎本质上是一种信息获取方式。

理想情况下,对一套搜索引擎来说,它本身存储的信息当然是越全越好。

这就意味着,首先它需要靠爬虫技术爬取全网内容,并且有一套自己的清洗机制数据的能力,在对这些原始信息进行必要的处理后,建立自己的资料库或者说自己的大数据中心。

其次是构建索引环节,这相当于给每一个内容添加目录,便于搜索引擎根据用户的查询词来进行数据库检索。这就涉及到一个排列机制的问题,需要用到用户查询内容与网页内容的相关性分析、网页质量评价等技术。

尽管市面上所有的搜索引擎具体实现方式有差异,但所有的搜索服务的核心都是资料库+排列机制。

技术有差异,但是原理上基本没差别。

如果说资料库决定了搜索引擎的上限,那排列机制则决定有多接近上限。

答案很简单,排列机制直接跟效率挂钩。

不同的排列机制,直接决定用户第一眼看到什么信息,继而影响到他们的现实决策。

可见,效率才是搜索引擎的生死棋,也是影响用户执行的大杀器。

所以说下一个阶段,搜索引擎赛道上需要比拼的,已经不是数据的抓取技术、更不是数据存储。

在这个9块9就能学Python爬虫的大环境里,大家更看重的并不是真正的大千世界,而是那个跟自己有关系的世界。

现在搜索引擎需要做的,就是去理解用户真正想要的是什么。

并且在最短最快的时间里,给到他们最直接有效,独一无二的正确答案。

就像关于学Python,我会告诉你,善用搜索,不要钱。

4

引擎和信息的痛点,恰好给了“微信搜一搜”一个证明自己的机会。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多