QQ:2569318525 QQ:2569318525
当前位置:主页 > 新闻中心 > 网站优化 >

详解搜索引擎的组成部分:蜘蛛、指数、界面

时间:2013-07-17 11:18    来源:未知     作者:踏雪     点击:
搜索引擎的历史并不长,但搜索引擎为互联网所作出的巨大贡献却显而易见,搜索引擎改变了世界,改变了用户的使用习惯,让我们对互联网的未来充满信心。
  搜索引擎起步的时候做的并不好,第一个搜索引擎甚至没有分析网页的副本,而且没有排名的标准,为了深度挖掘商业潜力,这才推动搜索引擎渐渐发展,研发更先进的系统。
  第一个比较大的商业搜索引擎是在美国的斯坦福大学,它在2001年花65亿美元购买了@主页。在开始推广的时候,最大的竞争对手是网址站,主要是因为那时候搜索结果中很多都是垃圾邮件,而且人们还不习惯用搜索引擎。
  元标记是帮助搜索引擎排序的一个工seoer具,通常叫做关键词堆砌。一旦搜索关键词,那关键字和元标记就会告诉搜索引擎内容是在哪一页,在很短的时间做好中继标记工作,提供相关搜索结果,但随着一些企业的市场营销经验增加,他们很容易提高关键词的排名,那时候比较流行“贷款、贷款、贷款”之类的关键词堆砌,所以当时搜索引擎的垃圾信息泛滥成灾,造成许多用户的不信任感。
  那时候一些重要的搜索引擎包括:EINet银河、WebCrawler、莱科斯、Infoseek、Inktomi、Ask、AllTheWeb等。
  每一个搜索引擎都有三个主要部分组成:
  1、蜘蛛
  蜘蛛的工作职责是发现新的网页并收集这些网页的快照,然后分析该网页。
  蜘蛛以www.6998.net抓取页面为主,比如扫描网页,所有的搜索引擎都能够实现深层检索和快速检索。在深层检索中,蜘蛛可以查找和扫描网页内的所有内容;在快速检索中,蜘蛛不遵循深层检索的规则,只搜索重要的关键词部分,而不检查和扫描网页里的所有内容。
  大家都知道网站最重要的是快照时间,也就是说蜘蛛爬行和收录的网页速度越快,就说明这个网站在搜索引擎心中越重要,比如新华网和人民网,蜘蛛每小时爬4次以上,有的网站一个月也不见得能被蜘蛛爬一次。快照的抓取程度取决于网站内容的流行度、更新速度与网站域名的新旧。
  在蜘蛛的爬行规则中,如果有许多外部链接指向这个网站,那就说明这个网站比较重要,所以抓取这个网站的频率很高。当然,搜索引擎这样做也是为了省钱,如果都以同样的频率爬行所有网站,这样需要更多的时间和成本,才能得到更全面的搜索结果。
  2、指数
  蜘蛛在爬行的过程中,可能会重复检查网页的内容,然后查看网站内容是否是复杭州网站建设制其他网站的,以保证网站原创内容的指数,该指数的结果一般都是基本保持复制内容的排序搜索结果。当你进行搜索时,搜索引擎不会从网络上搜索,它会从指数中选择搜索结果,所以搜索得到的网页数量并不能代表整个网站,但蜘蛛会在后台扫描和保存网站的网页数量。
  在搜索结果数量中,谷歌1-10个搜索结果约为16.05万,还有每个区域的搜索结果排名,这些都可以用搜索引擎的算法指数来控制,或者说是控制一部分。
  每个搜索引擎在全国或全世界各地都建立数据中心,当你输入需要www.6998.net搜索的关键词的时候,会由于数据更新的时间不同而致搜索结果同步,所以在不同的地区就会出现不同的搜索结果。
  3、Web界面
  当你使用搜索引擎所看到的界面(比如google.com、baidu.com),搜索结果取决于复杂的算法,算法都是从指数内调用结果,通过查询并分析才能在前台显示,所以算法的制作时间比较长,谷歌在这个技术领域上领先。
  还有一些搜索引擎的“一站式”特性,这类特性在英文搜索上比较常见,一般来说,搜索引擎忽略“一站式”的话,这样的搜索结果将更加正确,比如搜索“猫,狗”的时候,搜索引擎会排除“猫和狗”,只搜索“猫”“狗”。
发布站点:意大利网站建设米兰做网站意大利网站优化
本文地址:http://www.huaxia.it/seo/201307174602.html
Copyright 2009-2022  画侠网络工作室版权所有  E-mail: admin@huaxia.it  客服QQ:792/02.61.72  手机:389-9265-八一七