温州天比高科技专注:SEO搜索引擎优化关键词优化,企业网络营销战略合作伙伴!
24小时咨询热线:400-779-1890 工作时间:9:00~18:00 节假日不休

主题性页面级别技术(Topic-Sensitive PageRank)

日期:2009-8-28 8:27:46 人气: 标签:
主题性页面级别技术(Topic-Sensitive PageRank) 2002年,斯坦福大学的一名博士生塔赫尔. 哈维利瓦拉(Taher H. Haveliwala)发表   主题性页面级别技术(Topic-Sensitive PageRank)
2002年,斯坦福大学的一名博士生塔赫尔. 哈维利瓦拉(Taher H.
Haveliwala)发表了一篇非常有意思的论文,名为“Topic-Sensitive
PageRank(主题性页面级别计算系统)”。而更加有趣的是,一年之后哈维利瓦拉
成了Google的一份子。
“主题性页面级别计算系统”通过对随机查询用户的随机运动增加一个“偏
差”来处理基本的页面级别计算系统所存在的问题。这个新的随机查询用户具有
明确的查询目的,并更感兴趣于跟进那些具有某个特定主题的相关网页上的相关
链接。这是一个相对而言较为新颖的思路,它解决了搜索结果的质量性方面的一
系列关键性问题。
毫无疑问,哈维利瓦拉将成为搜索引擎业界中一个举足轻重的角色。他已经
在搜索技术的其它领域方面进行了一些实质性的研究工作,包括如何更有效计算
页面级别方面的一些比较有趣的研究。
在最初的研究论文中,哈维利瓦拉描述了他是如何利用斯坦福大学的网络数
据库,对应于ODP(开放目录)的16个顶级目录的16个主题来计算“主题性”页面
级别得分。虽然该研究的主题和数据数量(8千万个网页)十分有限,但能够看出
这种新系统可改善搜索结果,且具备对查询用户感兴趣于何种主题的理解能力。
就在去年,当我回过头来再阅读这篇论文时,我注意到哈维利瓦拉所描述的
这种系统对搜索引擎来说还存在着两个问题。不过下面我们将会看到,这两个问
题现在都能得到妥善解决了。
第一个问题是充分拓展主题的数量。要想改善搜索结果,16个主题自然是远
远不够的。但由于Google的页面级别计算系统的代价非常之高,因而除非新系统
能够提供一些改进的措施,否则Google不大可能实施这个新系统。但随着这一领
域在过去的一年中的深远发展,因而我相信现在在主题数量上已不是大问题了。
第二个问题就是如何决定一个查询条件可能对应的主题–- 当用户输入诸
如“自行车”一类的查询条件时,这个用户是想买自行车呢,还是想骑自行车旅
游呢?下面我将为大家简单阐述一下Google可能会怎样匹配一给定查询条件以
最恰当的主题,以及为什么一些查询条件更容易受到影响的原因。 资料转载,请注明天比高搜索引擎优化中心提供相关信息。
天比高科技为企业提供全套SEO服务,包括网站整站SEO网站优化,网站后期维护管理,搜索引擎关键词优化,符合SEO标准的网站建设,网络营销咨询等网站优化服务,咨询热线:400-779-1890