分享

搭建一款像谷歌百度那样的本地搜索引擎(无需编程)

 树悲风 2019-03-08


在电脑未发明前,查资料不是一件容易的事,想要从一本书中找到某个关键词要花不少时间,更别说从图书馆里找了。数字化时代的到来,让资料查找上升了一个“维度”。

怎么形容这上升的一个维度呢?《三体Ⅲ》中做了精彩的比喻,说从四维看三维,三维完全暴露在四维之下,能看到无限的细节,从四维干预三维,可以完全无伤地把一个人的脑子取出来。

信息的数字化也是如此。 实物档案的数字化是一次划时代的变革,它让我们很轻易就能从海量信息中找到所需信息。不管是工作还是学习中,使用电子版的阅读材料和笔记记录,我们都能方便地进行知识管理和查找。

本文的主要内容正是本地搜索引擎的建立提供一些思路

01

文件搜索引擎


本地搜索引擎的建立可以参考谷歌、百度搜索引擎的做法,大致步骤是:

1、爬虫收集信息(我们自己制作/下载的电子文档

2、建立索引数据库(软件自动生成

3、用户使用搜索引擎(我们使用搜索软件

文件搜索的使用频率最高,通常只要做好“命名和分类”就能进行高效搜索,这一点在《文件管理》一文中已有介绍,适用于绝大多数情况。

使用的搜索软件包括:Listary + Everything

1、一般的文件:

按 Ctrl + Q 唤出 Listary 工具栏进行搜索

2、稍复杂的文件:

在 Listary 中设置关键字'e' 来调用 Everything 进行搜索。

3、当前目录的文件:

在 Listary 中设置关键字'ee' 来调用 Everything 进行搜索。

注意:不是调出 Listary 工具条搜索,而是直接在当前目录输入'ee',然后输入要搜索的内容。

02

图片搜索引擎

图片搜索和文件搜索的不同在于,很多时候搜索到的图片文件需要查看才能知道是不是要找的文件,所以搜索软件得要有预览功能。在新版 Everything 中就加入了图片预览功能。

1、通常的搜索方法:

在 Everyting 中使用通配符“pic:”就能进行图片过滤。

2、快捷的搜索方法:

省去每次搜索都要输入通配符“pic:”的烦恼,我们可以使用 Listary 来调用 Everything 搜索,同时加入搜索参数。

3、文档搜索预览:

Everything 也支持常见文档格式的搜索预览,包括 Word、PPT、Excel、PDF等。

03

全文搜索引擎

和图片搜索一样,我们也需要查看一些文档里面的内容,而不仅仅是文档名称。特别是你只模糊记得一些词语,而要找的文件名称叫什么都不知道的时候,全文搜索就派上大用处了。

换句话说,我们可以借助全文搜索功能来打造个人的电子图书馆

FileLocator Pro 正是一款为此而生的搜索软件,也可能是目前 Windows 下最好用的全文搜索软件。除了支持绝大多数文档文件外,也支持压缩文件的内容搜索,也支持通配符表达式。

1、普通的全文搜索:

在 Listary 中设置关键字'f' 来调用 FileLocator Pro 进行搜索。

这个方法主要是用于快速调用 FileLocator Pro,搜索范围和内容都在需要稍后进行。

2、当前目录的全文搜索:

在 Listary 中设置关键字'ff' 来调用 FileLocator Pro 进行搜索。

这是使用最多的情况,我们通常只需要对当前目录进行全文搜索,如果全盘搜索的话,花费的时间实在太久了。

3、建立索引数据库

FileLocator Pro 也支持文件的 Unicode 十六进制编码内容搜索,但用得上的情况很少。我们甚至要排除掉这个功能,因为查看一个较大文件的 Unicode 十六进制编码时,会因为读取内容过多而导致软件崩溃

此外,我还可以手动创造常用文件夹的索引数据库来加快全文搜索的速度。

结尾

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多