
【引子】2月20日《上海青年报》登了记者卢维兴写的一文,题目是:《雅虎Google联姻破裂 “Yahoo Slurp”全面铺开》(http://tech.tom.com/1121/1794/2004220-82857.html ),文章提到:“2月19日,雅虎中国向记者证实,已放弃使用Google的搜索技术,转而使用自己的搜索技术。“雅虎品牌的机器搜索‘Yahoo Slurp’将逐渐全面铺开。”此前一天,雅虎总部宣布了这一“离婚协议”。这标志着目前互联网最大的利益联姻就此破裂。”
【习惯】由于笔者在1995年10月上网之后几年,都习惯了用Yahoo搜索,一直到2000年开始用新浪网搜索,2001年用网易网搜索(当时是Power By Google),2002年之后主要用Baidu.com网搜索,偶尔也用Google搜索,因此搜索习惯己基本较为固定。
不过,有时为了寻找资料,也会同时去几个网站输入同一关键词,看看有什么不同结果。本文正是笔者从2000年开始,定期用自己的网名(ID)“sz1961sy”向国内可以说是最多用户的“三大中文搜索”:雅虎、百度与Google输入“sz1961sy”一词是结果分析,
【小比试】
〖测试时间〗2004年2月20日下午16:57至17:07分,共10分钟时间内。此时笔者没有向网上再发任何用sz1961sy为ID的新文章。
〖测试顺序〗1、雅虎 (http://cn.websearch.yahoo.com/search/web_cn?p=sz1961sy ) ---16:57
2、百度 (http://www1.baidu.com/baidu?tn=baidu&word=sz1961sy ) -------17:02
3、Google(http://www.google.com/search?q=sz1961sy&ie=UTF-8&oe=UTF-8&hl=zh-CN&btnG=Google%E6%90%9C%E7%B4%A2&lr=)---17:07
〖搜索结果〗
『项目一:首页显示』
1、雅虎 : “sz1961sy”相关网站 共找到 7008 个
2、百度 : 百度为您找到“sz1961sy”相关网页约3,730篇,用时0.110秒
3、Google: 已向英特网搜索 sz1961sy。共有 1,760 项查询结果。 搜索用时 0.23 秒。
〔此项评比〕雅虎>百度>Google 〔说明〕每页文章数都是10条
『项目二:首页至尾页』逐页点击,终于把以上出现的搜索结果真实情况一一作了鉴定:
1、雅虎 : “sz1961sy”---- 共找到 118 篇 (12页) ,...为提供最相关的结果,类似的网站已被省略。( web_cno_p=12&p=sz1961sy&o_l=0&b=100 )
2、百度 : “sz1961sy”---- 共找到 222 篇 (23页) (http://www1.baidu.com/baidu?lm=0&si=&rn=10&tn=baidu&ie=gb2312&ct=0&word=sz1961sy&pn=120&cl=3 ,是倒数第二页)
3、Google: 已向英特网搜索 sz1961sy。显示的 174 个类似的条目(18页)(searchq=sz1961sy&hl=zh-CN&lr=&ie=UTF-8&oe=UTF-8&start=170&sa=N )
〔此项评比〕百度>Google>雅虎
『项目三:搜索显示顺序』
1、雅虎 : 最新先出现,较早最后
2、百度 : 最新先出现,但是最后一页也是近期的
3、Google:较早先出现,最新出现不规律
〔此项评比〕百度>雅虎>Google
【笔者结论】通过“sz1961sy”一词的以上三项指标测试,笔者认为:以中文网页搜索而言
第一,百度的搜索实际有效结果比Google强、比雅虎更强;
第二,百度与雅虎的页面显示顺序比较符合用户、特别是中国人的阅读习惯;
第三,如果把从首页显示搜索结果数据与翻至搜索结果尾页实际有效结果之间作一个参数,笔者定义为“可信度”指标比较分析,可以看出:雅虎--118 /7008=1.68%;百度--222/3730=5.95%;Google--174 /1760=9.87% ,显然,Google搜索结果“可信度”指标最高,比雅虎搜索结果“可信度”高出8.19%、也比百度高出3.92%。雅虎搜索结果是最不具有“可信度”的。
【评论】本文虽不是一个严格意义上的《测试报告》,但它从一个侧面可以提供一些有用的直观资料,让大家明白一个基本道理:“搜索技术是一种硬功夫,中文搜索技术更是这种硬功夫中的真功夫”,各个搜索之间的距离仍然是很大,吹牛其实没有什么用,用户用事实说事。
2004.02.20. sz1961sy 写于北京中关村 21:08
当前位置: 