日前,搜狐公司旗下自主品牌搜狗搜索引擎宣布,搜狗网页搜索3.0版本将于2007年1月1日正式上线,新版本将凭借其自主研发的服务器集群并行的抓取技术,成为全球首个中文网站收录量达到100亿的搜索引擎,并
以每天5亿网页的更新速度及独一无二的搜狗网页评级体系,在海量、及时、精准等搜索引擎基本指标上全面升级中文搜索引擎的用户体验,再次掀起搜索引擎新一轮技术革命。
海量:全球首个网页收录量达到100亿的中文搜索引擎
一直致力于后台技术研发和数据积累的搜狗,在2006年8月份的时候就成功支持了50亿中文网页的查询,成为了全球首个中文网页收录量达到50亿的搜索引擎,即将于2007年1月1日震撼上线的搜狗网页搜索3.0更是将数据量拓展到了100亿的惊人数字,再创全球中文网页收录量新高。
目前市场上各家搜索引擎对于中文数据的收录量远比英文数据的收录量低很多,导致了用户想要的信息找不到,这也是长期以来中文搜索引擎的用户满意度要比英文的低很多的一个主要原因,而数据量的大小,直接反映了搜索引擎研发团队的技术实力。
此次,搜狗技术团队采用了自行开发的文件系统和数据库,大幅提升了服务器利用率,并对后台的抓取、页面分析、滤重、索引、排序、反垃圾等一系列的功能模块都进行全方位的升级,以支持更大的容量的内容储备,向网友提供创纪录的百亿网页的信息资源,进一步拉开了与竞争对手的差距,重新定义了搜索引擎业界标准,奠定了搜狗技术团队行业绝对领先的地位。
及时:每天更新5亿网页,最新资讯最快1分钟即可被检索到
在及时性方面,搜狗网页搜索3.0通过智能分析技术,对于不同网站、网页采取了差异化的抓取策略,充分地利用了带宽资源来抓取高时效性信息,更是确保互联网上的最新资讯能够被用户及时检索到。
经过对互联网上的热点新闻事件搜索的测试,搜狗网页搜索3.0仅需1分钟时间就能完成从抓取到页面分析到建立索引到上线的全部过程,在第一时间呈现大量相关结果。在这样的速度下,每天搜狗的服务器集群并行更新5亿的网页,用户不必再专门到新闻搜索引擎上,就能获得最新资讯。
为了满足对及时性要求极高的用户的需求,搜狗还特意提供了按时间排序的功能,更加显示了搜狗网页搜索3.0强大的网页及时迅速的更新能力。
精准:评测指标业内领先 基于搜狗网页评级的结果排序