温州天比高科技专注:SEO搜索引擎优化关键词优化,企业网络营销战略合作伙伴!
24小时咨询热线:400-779-1890 工作时间:9:00~18:00 节假日不休

搜索引擎Yahoo 的分类原理

日期:2009-10-25 15:08:49 人气: 标签:
分类原理 InternetScoutProject的分类专家AimeeGlassel认为,印度著名分类专家和图 书馆专家阮岗纳赞的冒号分类法理论体系与Yah   分类原理
InternetScoutProject的分类专家AimeeGlassel认为,“印度著名分类专家和图
书馆专家阮岗纳赞的冒号分类法理论体系与Yahoo网络信息资源的主体目录之间
存在着密切的联系”,从而揭示了Yahoo应用分面分析方法进行网络信息资源的分
类实质。具体说来,可从以下几点来深入地理解Yahoo的分面分类原理或基本过
程。
1.采用宽泛的主题领域建立分类索引
为了使其分类体系既具有无限的容纳性,又具有相当的专指性,Yahoo采用
较为宽泛的主题领域,通过分析兼综合的方法建立较为完整的分类索引。这与分
面分类的思想不谋而合,因为将知识分为宽泛的类目即分面,多方面地反映主题
内容以避免列举式类表的线性单向式的结构正是阮岗纳赞冒号分类法的主要原
则所在。
2.根据上下文进行信息内容的组合
从Yahoo的分类结构外表看,也许会认为它与叙词表很相近,因为Yahoo也是
使用词汇而非符号来组成相应的概念词串。但是,从组合类目的能力看,它远远
比普通的叙词表复杂得多。通过分析Web页面的内容特征,得到由Yahoo分类体系
结构中某些类目词组成的概念词串或标引词串,将其放入相应的类目层次中。在
Yahoo的概念词串或检索词串中包含的独立的词汇都含有自身的名字,但是一旦
与其它词组合,则产生了一个上下文关系,拥有了一深层次的涵义。从这一点上
说来,与分面分类法也是极为相似的。
3.利用冒号标记信息内容
现以“20世纪60年代印度在肺结核治疗方面的研究”作为待分类标引的信息
内容来具体考察两者的标记制度:
在阮岗纳赞的冒号分类法中,该内容标引为:L,45;421;6;253;f.44‘N5
用词代替相应的符号,则为:
Medicine,Lungs;Tuberculosis:Treatment;X-ray:Research.India‘1950
如果将分面公式中的相应标点符号用冒号代替,由此所形成的字符串形式就
是在Yahoo中用于描述信息内容的方法,相应地表示为:
Health:DiseasesandConditions:Tuberculosis
可见两者在信息描述上何其相似!Yahoo利用冒号作为统一的分隔符进行了
信息内容的组织和描述,既保留了原先的分面标记的特点,又在一定程度上简化
了标记制度,从而极大地提高了信息分类标引的效率。
4.提供不同的分类路径入口
“虚拟的信息集合”是Yahoo的一大优点,体现在其拥有的概念模式和引用
次序(即分面排列次序)的灵活性上。在传统的图书馆中,一本书只能放在书架的
某一固定位置上。但在数字化的世界里,电子信息资源却不用再限制在唯一的物
理位置上。我们可以将某一信息源分到类目结构的不同位置上。通过将分面分析
方法应用到网络信息资源的组织中,Yahoo能够为某一信息源在其巨大的分类等
级结构中提供不同的路径分支入口,这样就使其能够从不同的路径,为检索相同
内容的不同用户提供服务,从而完成查询。
例如,现欲查找美国Wisconsin-Madison大学所在的网页,Yahoo就能提供如下
几种分类或检索路径:
(1)若从Regional:类目入手,则相应的分类路径为:
Regional:U.S.States:Wisconsin:Cities:Madison:Education:CollegesandUni
versities:
UniversityofWisconsin-Madison。
(2)若从Education类目入手,开始的几级路径为:
Education:HigherEducation:CollegesandUniversities,在
CollegesandUniversities目录下选择地理区域的子类目“UnitedStates@”后,
可以看到,又返回到Regional目录下,之后就与上述路径相同了。其中的奥妙就
在于符号“@”的运用,它提供类似于相关参照(crossreference)的作用,能够
指引用户由某一子类目进入Yahoo的浏览性等级结构的其它分支中。 资料转载,请注明天比高搜索引擎优化中心提供相关信息。
天比高科技为企业提供全套SEO服务,包括网站整站SEO网站优化,网站后期维护管理,搜索引擎关键词优化,符合SEO标准的网站建设,网络营销咨询等网站优化服务,咨询热线:400-779-1890