SEO是英文Search Engine Optimization的缩写,中文译为“搜索引擎优化”。简单地说,SEO是指从自然搜索结果获得网站流量的技术和过程。更严谨些的定义可以表述为:SEO是指在了解搜索引擎自然排名机制的基础上,对网站进行内部及外部的调整优化,改进网站在搜索引擎中的关键词自然排名,获得更多流量,从而达成网站销售及品牌建设的目标。 定义很容易理解,实践中却有些迷惑。SEO博客、论坛上都有大量SEO技巧、经验分享,但其实仔细想来这些技巧都不是SEO独特的东西,或者说就没有一种真正叫SEO的东西。 什么是seo?我们先从搜索引擎技术架构聊起
这些都是搜索引擎面对的技术挑战。 下图是一个通用的搜索引笨架构示意图 1、抓取网页: 搜索引擎的信息源来自于互联网网页,通过网络爬虫将互联网的信息获取到本地. 因为互联网页面中有相当大比例的内容是完全相同或者近似重复的,“网页去重”模块会对此做出检測,并去除重复内容。 2、建立索引: 抓取到网页后,搜索引擎会对网页进行解析,抽取出网页主体内容和相关信息,(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等)。根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页建立索引。为了加快响应用户査询的速度,网页内容通过”倒排索引”这种高效查询数据结构来保存,而网页之间的链接关系也会予以保存。之所以要保存链接关系,是因为这种关系 在网页相关性排序阶段是可利用的,通过”链接分析”可以判断页面的相对重要性,对于为用 户提供准确的搜索结果帮助很大。 由于网页数量太多,搜索引擎不仅需要保存网页原始信息,还要存储一些中间的处理结果 使用单台或者少量的机器明显是不现实的。Google等商业搜索引擎为此开发了一整套云存储与 云计算平台,使用数以万计的普通廉价PC搭建了海量信息的可靠存储与计算架构,以此作为搜索引擎及其相关应用的基础支撑。优秀的云存储与云计算平台已经成为大型商业搜索引擎的核心竞争力。 上面所述是搜索引擎如何获取并存储海量的网页相关信息,这些功能因为不需要实时计算,所以可以被看做是搜索引擎的后台计算系统。 3、查询词分析 搜索引擎的最重要目的是为用户提供准确全面的搜索结果,如何响应用户査询并实时地提供准确结果构成了搜索引擎前台计算系统。 当搜索引擎接收到用户的査询词后,首先需要对查询词进行分析,希望能够结合查询词和用户信息来正确推导用户的真正搜索意图。在此之后,首先在缓存中査找,搜索引擎的缓存系统存储了不同的查询意图对应的搜索结果,如果能够在缓存系统找到满足用户需求的信息,则可以直接将搜索结果返回给用户,这样既省掉了重复计算对资源的消耗,又加快了响应速度; 4、搜索结果排序: 如果保存在缓存的信息无法满足用户需求,搜索引擎需要调用”网页排序”模快功能,根据用户的査询实时计算哪些网页是满足用户信息需求的,并排序输出作为搜索结果。而网页排序最重要的两个参考因素中,一个是内容相似性因素,即哪些网页是和用户查询密切相关的;另外 一个是网页重要性因素,即哪些网页是质量较好或者相对重要的,这点往往可以从链接分析的结果获得。结合以上两个考虑因素,就可以对网页进行排序,作为用户查询的搜索结果。 其实细心的小伙伴会发现,除了以百度、谷歌为代表的搜索引擎(全文搜索引擎)外,各大门户网站都有自己研发的搜索引擎,比如58同城自研搜索引擎E-search,淘宝网的Pora(Personal Offline Realtime Analyze ‘千人千面’),京东自研搜索引擎,此外当当网、腾讯社区、一点资讯,今日头条 都有自己的搜索引擎技术,各家搜索引擎各有千秋,淘宝网搜索引擎技术完全可以和百度媲美。
综上所述,博主给总结出两点 :网页排序最重要的两个参考因素中,一个是内容相似性因素,即哪些网页是和用户查询密切相关的;另外一个是网页重要性因素,即哪些网页是质量较好或者相对重要的,这点往往可以从链接分析的结果获得。结合以上两个考虑因素,就可以对网页进行排序,作为用户查询的搜索结果,你GET到了吗? 明白了搜索引擎的原理,我们再进行以下工作,做起来可能目标更清晰,更系统:
关键词分析其实也就是市场调查和行业竞争对手调查。做任何一个生意,不都得做用户需求调查,竞争对手调查吗?只不过工具不同,做SEO的关键词分析是看关键词搜索次数和返回竞争页面多少。 除非你是天才,或者有VC投资,花别人的钱办自己的事,不然甭管干什么,都得先做一下调查。 网站架构优化合理清晰的内部结构,利于搜索引擎抓取,利于用户浏览的内部链接,说到底其实就是个技术问题。告诉技术人员搜索引擎必须抓取网站页面,哪些东西不利于抓取,技术人员自然就会按规范去做,他甚至不必知道SEO这个词。 页面优化这也是个最基本的写作文的要求。你不可能把初一到初六所写的作文都叫“我的作文”,总得分成“我的爸爸”,“游香山”,“读红岩有感”等不同的题目吧。优化页面Title标签讲的也就是这个。 页面上其他该做的关键词优化,完全和写作文的基本要求没区别,上好中学语文就可以了。 外部链接建设这根本就应该是公司公关部门和市场部门的副产品。不知道大家是否注意访谈小鹏时他说的话,大公司的链接都是用户自己给的,人家根本不去做什么外部链接建设,很少的交换链接人家叫商业扩展,估计这事也不归SEO部门管。 你什么时候见微软、可口可乐会去建设外部链接呢?连纯粹的线上品牌Wiki也不做这事。真正牛的公司是不做外链的,只有我们这些小人物才吭哧吭哧干这个事。 流量分析出现SEO之前若干年,流量分析就是运营网站必做的事情。 所以看一圈下来,你会发现不知道到底什么是SEO。我们所做的SEO大部分是常识。 当然,可喜的是,常识往往是常人们做不到的,所以就会出现了所谓的SEO和SEO行业,而且至少还会红火个十年二十年。 最后说一句,seo的真谛是什么?答案:有效的大量收录,如果你想让你的网站每天10000ip,你的网站至少需要收录5000个有效页面,拙见,勿喷 |
|
来自: 昵称30086806 > 《seo》