2009年10月情报探索第l0期(总144期)
百度与Google搜索语法比较分析
许赛路佘正平
(集美大学图书馆福建厦门361021)
摘要以百度和Google为例,对两者常用的搜索语法进行比较分析,并从用户的角度提出搜索语法的不足之处。
关键词百度Google搜索引擎搜索语法
中图分类号:G354文献标识码:A文章编号:1005—8095(2009)10—0070—02
随着互联网的发展,搜索引擎已成为搜集网上
信息资料最常用的导航工具。大多数的网络用户们
使用搜索引擎时,习惯于“关键词+回车键”的操作方
式。这是最简单、最省心的方式,但是,反馈的结果往
往伴随着无数的冗余信息,不一定令人满意。笔者认
为,搜索引擎各自为阵,不同搜索引擎的搜索语法总
是存在着一些差异,没有统一的搜索语法版本。给网
络用户带来诸多不便。这是最为关键的因素,致使网
络用户不愿意了解和学习搜索语法,从而不使用搜
索语法。本文以百度与Google搜索引擎为例.对两
者常用的搜索语法进行比较,分析其差异与共同点。
1逻辑搜索语法比较
当我们搜索信息时,如果使用两个或以上的关键
词。就必须用上布尔逻辑运算,例如:张晓风散文。常
用的逻辑运算包括:逻辑“与”、逻辑“或”、逻辑“非”。
百度与Google搜索引擎也含有逻辑搜索语法,其空
格就是默认的操作符。表示逻辑“与”。为了更清晰地
比较分析,两者对应的逻辑表达式与操作符分别列表
(见表1),其中A、B分别代表两个关键词。
存在着差异,要解决这种表达方式上的差异绝不是
一件技术上的难题,因此,各搜索引擎的逻辑搜索语
法是可以求得统一的。
2强制搜索语法比较
使用搜索引擎时,有3种情况需要采取强制性
的措施才能精确地搜索信息。
第一,强制停用词的搜索。所谓停用词是指由于
该关键词太常见、使用太频繁,且无实际意义的词。
比如:“的”、“地”、“啊”等。当在搜索框中输入停用词
时,搜索引擎会自动忽略这些词,而在该关键词前添
上“+”就可强制搜索。
第二,强制长关键词的精确匹配。长关键词在检
索时,它将被搜索引擎的分词软件切分成好几部分
组成元素。例如:时间空间理论,搜索引擎的分词软
件就将其切分成“时间”、“空间”、“理论”.百度的搜
索结果为44.1万条信息。为了使“时间空间理论”作
为一个不可分割的关键词。可以使用双引号“”将其
引起来,搜索引擎的分词软件就不会对其切分了,从
而起到精确匹配的效果。例如:“时间空间理论”.百
表1百度对Google对应的逻辑表达方式与操作符列表
Googte百度语法功能表达式
操作符说明操作符说明
用于同时搜索包括两逻辑与AB+、空格+必须是英文半角输入&、空格&必须是英文半角输人个以上关键词的情形
表示至少包含一个OR、J与A、B之间没有空逻辑或AlBOR
、lII与A、B之间要留有空格指定关键词的搜索格的要求
.但OR要大写
表示排除某一指定一与A之间要留有空格.逻辑非A
—B同Google关键词的搜索而与B之间不能有空格
布尔逻辑运算是搜索引擎中最简单、最实用的
搜索语法。通过列表可以更加清楚地发现,百度与
Google在逻辑搜索语法中,仅仅只有逻辑“非”是统
一的,逻辑“与”、逻辑“或”却存在着或者运算符、或
者书写格式的差异,网络用户的不方便可想而知了。
这种差异是否无法消除呢?对于布尔逻辑搜索语法
来说,无论是百度还是Google,抑或其他的搜索引
擎,其逻辑“与”、逻辑“或”、逻辑“非”的语法及功能
是相同的,仅仅只是逻辑运算操作符及书写格式上
收稿日期:2009—04-27
作者简介:许赛路(1964一)。男,馆员,本科学历。
70
度后的反馈结果就
只有386条信息,
精确度可谓非常高
了。Google与百度
都支持双引号的强
制搜索,且双引号
既可以中文状态输
入.也可以英文状
态输入。
第三,强制书刊名、文章名或歌曲名的搜索。待
搜索的关键词若为书刊名、文章名或歌曲名.可采用
中文书名号。中文书名号与双引号有异曲同工之妙,
被书名号括起来的内容也不会被拆分,从而达到精
确匹配。例如:在搜索框中输入《张晓风经典散文》,
百度的结果为ll3条信息,而没有加中文书名号的
搜索结果则有6660条信息,可见强制搜索的效果
非同一般。
2009年10月许赛路等:百度与Google搜索语法比较分析第10期(总144期)
百度与Google的强制搜索语法列表如表2。
表2百度与Google的强制搜索语法列表
l操作符表达式功能Google百度
++A强制停用词的搜索支持+不支持+
强制长关键涮的精一’没有中、英文“A”同Google确匹配搜索状态的要求
强制书刊名、歌曲名《》应足中文状态《》《A》同G
oogle等精确匹配搜索的书名号
通过表2可以更加明显地看到百度和Google
在强制搜索语法上的特点.两者在双引号及中文书
名号的搜索语法,已经达到了统一,仅仅只有“+”的
差异,百度不支持“+”的操作.而Google支持“+”的
操作。其实,双引号的功能已经涵盖了“+”的功能,使
用双引号后就不必要再重复使用“+”了。如果取消
“十”这条强制搜索语法,对于Google的强制搜索不
会有什么影响,这样,两者在强制搜索语法上也就求
得了完全统一.统一之后必将给予网络用户带来极大
的操作方便。否则。使用百度时必须了解百度的搜索
语法,使用Google时必须熟悉Google的搜索语法。
3通配符比较
通配符是一类键盘字符,常见有星号“木,’、问号
“?”等.当进行网络查找不知道关键词中的真正字符
或者不想键入完整单词时,可以使用它来代替真正
字符或完整的单词。Google使的通配符为星号
“
,属于全词通配符。所谓全词通配符是指星号“
代替一个英文单词或者任意一个汉字。例如:在
Google搜索框中输入intile:“搜索引术''’,此时的“’
代表一个中文汉字。百度不支持通配符,通配符在百
度中使用时,相当于空格的作用。例如:在百度搜索
框中输入爱因坦.或者输入爱因?坦,或者输入爱因
坦.其搜索结果都是一样的。反馈7750条搜索信
息。笔者认为,通配符的使用是智能式的搜索,这是搜
索引擎发展的一个方向,能给予用户更多的方便。在
这一方面.若百度向Google看齐,也采纳全词通配符
的搜索,岂不是又达到了两者在通配符上的统一。
4高级搜索语法比较
百度和Google的高级搜索语法较多.表3仅列
举几条较常用的搜索语法进行比较。
表3百度和Google常用的搜索语法比较
语法功能表达式GooSe百度
Intitle把搜索范围限定在网页标题中intitle:A支持支持
Site把搜索范围限定在特定站点中site:域名支持支持
Inurl搜索在url中含有关键词A的网页ihurl:A支持支持
Link搜索所有链接到某个url地址的网页link:A支持不支持
Filetype搜索某种指定后缀格式的文档资料filetype:,~缀名支持18种非HTML文件的搜索支持6种非HTML文件的搜索
Inanehor对网页锚点的搜索inanchor:A支持支持
Related搜索和指定页面相关或相似的网页related:A支持支持
Info提供一个和指定url更多信息的页面列表info:A支持支持
比较列表中的高级搜索语法。粗粗一看,似乎没
有什么很大的差异.除了Ⅱnk语法外.百度与
Google都支持同一的搜索语法。事实上并非这样,实
际使用时还是存在着差异。比如,Google要求语法表
达式的书写十分规范。语法命令词必须要全部小写,
否则就会出现错误性提示;命令词后的冒号“:”要紧
跟命令词,两者之间不得留有空格,且输入的冒号
“
:”必须是英文半角形式;冒号“:”与后面的跟随部
分(关键词、域名或者文件后缀名等)之间也不得有
空格。然而,使用百度的高级搜索语法就显得轻松自
如而随意了,因为,百度能将中文全角冒号“:”切换
成半角形式,不需要以英文状态输人冒号“:”,百度
也能自动删除冒号后面的空格。仔细分析比较百度
和Google高级搜索语法的特点,不难发现两者的语
法和功能,以及语法命令词都是相同的.仅仅只是书
写格式上存在着差异,在这方面,百度对于表达式的
后台转换、整合功能较完善,百度的搜索语法较适合
于我国用户的操作方式与习惯。如果两者从语法命令
词、表达式的书写格式都能达到统一,那么,对于使用
百度或Google的网络用户来说,是一件美妙的事。
总之,搜索引擎的搜索语法也能实现统一的标
准接口技术,亦即统一的语法版本。如果各大搜索引
擎商形成共识,制定出统一的文本规范。按照规范开
发搜索语法,那么,就能形成统一的搜索语法版本。
在技术实现上,也不是一件难事,只要各搜索引擎链
接统一的搜索语法就可以了。通过比较分析百度和
Google的搜索语法,不难发现两者之间虽然存在着
差异,但更多的是有很多共同点,若能求同去异,不
难形成统一的搜索语法版本,那么,不同搜索引擎链
接统一的搜索语法模块,一次性的语法学习,可以在
多个乃至任意个搜索引擎上使用,这是网络用户所
神往的。
参考文献
1王哲.网上搜索一点通.广州:广东人民出版社.2006
(1)
2毛晓燕.搜索引擎用户满意度研究的实证分析.图书
馆杂志,2008(3)
3Google帮助中心.http://www.google.com/suppord?hl=
ca,2009—02—27·
4百度搜索帮助中心.http:Ilwww.baidu.com/search/
jiqiaos.html,2009-02-27
(责任编辑:黄浩海)
71
|
|