分享

python实现全网搜索

 GTY_TSG 2021-07-30

第一部关于词性的搜索基于百度百科及维基百科,互补(这里先只贴出百度百科的部分),这一部分我从整段程序中提取出来重新写了一遍简单的,及利用百度搜索相关词条信息。

import requests

import urllib

import re

#

def getbaike(html):

p=re.compile(r''http://www\.baidu\.com/link\?url=(.*) target='_blank'')

baike=re.findall(p,html)

return baike

def gethtml(url):

page=urllib.urlopen(url)

html=page.read()

return html

def DelLastChar(str):

str_list=list(str)

str_list.pop()

return ''.join(str_list)

def getcontent(baikepage):

p=re.compile(r'content='(.*)'>')

content=re.findall(p,baikepage)

return content

def search():

print '魔镜:我是魔镜上至三百年,后知三百年:'

print '魔镜:你究竟想知道什关于世界上哪个东西的事情:'

searchitem=raw_input('我:')

payload={'wd':searchitem,'rn':'200'}

#百度搜索的参数

web=requests.get('http://www.baidu.com/s',params=payload)

page=urllib.urlopen(web.url)

#print web.url

html=page.read()

baike=getbaike(html)

#得到匹配的百度百科后缀

baike[0]=DelLastChar(baike[0])

#print baike[0]

baike[0]=str(baike[0])

baikeurl='www.baike.baidu.com/link?url='+baike[0]

#print baikeurl

baikepage=gethtml('http://'+baikeurl)

content=getcontent(baikepage)

if content:

print '魔镜:这是你要的答案:'

result=''.join(content[0])

print result

else:

print '魔镜:竟然连我也不知道?what the fuck!'

while 1:

search()

~~好吧,这一段是来逗比的

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多