我要投稿
  • 您当前的位置:57365.com -> 技术教程 -> 网站建设教程 -> 搜索研究 -> 教程内容
  • [ 收藏本页教程 ]
  • Yahoo 优化和排名技术搜索研究教程

    教程作者:佚名    教程来源:不详   教程栏目:搜索研究    收藏本页
    关于YAHOO的优化和排名技术基础, 请参考 搜索引擎营销基础教程 - 在雅虎网站获得良好的排名 Yahoo推出的新搜索引擎机器人叫YahooSlurp。

    YahooSlurp跟GoogleBot一样,顺着每个HREF链接找到网站。它不会抓取SRC链接,如图片或框架。如果优化一个使用了框架的网站,要使用 <noframes> 标签。

    YahooSlurp可以跟踪动态页面链接,但Yahoo还是建议用文本链接来指向动态页面,因此做一个网站地图仍然是优化的好方法。YahooSlurp尊重一般robot.txt声明。

    yahoo不强调链接广泛度,yahoo很重视Meta标签,yahoo比google更重视域名中的关键词,yahoo会抓取html注释(用""引起来的文字、代码)

    Google注重语义分析和链接,Yahoo注重title和H1,H2,H3。 Google比Yahoo更新的快得多。

    把页面本身优化好,就能在Yahoo中取得很好的排名,而这些页面优化都是自己可以控制的,所以说Yahoo优化比Google优化更容易,所用时间更短,特别是对于热门关键词,两者的区别更明显。从另一个角度来说,能把Google优化好的人,不一定水平有多高,可能只不过是手头有较多的链接资源可以利用;若服务期过了以后,把指向你的链接一撤,你的排名就会掉下来。而若能把Yahoo优化好,说明你的网页优化本身是好的,你的排名基础是扎实的,你的服务商为你做了一些扎扎实实的工作。

    特别强调一下Google的强大的语义分析能力。在Google中搜"seo入门", 结果排在第一名的是一个关于"seo基础"的网页。这个网页针对"seo基础"作了很好的优化。我看了这个网页的源文件,没有出现一个"入门"。这个网站是个新站,没有多少外部链接,首页PR为0,为什么这个内页会排在很多含"seo入门"的网页之前?而且第一页中有七个页面都是针对"seo基础"的,并用红体字突出显示,足见Google把"入门"和"基础"看成极为接近的词。再在Yahoo中搜"seo入门",发现排在前三页的没有针对"seo基础"的,全都针对"seo入门"。Google知道哪些词在多大程度上词义相近。

    索引擎Yahoo的分类体系及性能评价

    目前很多的搜索引擎都是将人工编制的等级式主题目录和计算机检索软件提供的关键词等检索手段结合起来,完成网络信息资源的组织任务。Yahoo就是这种等级式主题指南类搜索引擎的典型代表。

    Yahoo的魅力,就在于它的可浏览式等级主题索引。按照主题建立分类索引,提供全面的分类体系结构,并结合高质量的检索软件,Yahoo成功地建立起了一套独特的信息管理和组织机制,使得对网络信息的全面检索变成现实。现对Yahoo的类目体系、分类原理、检索方式、性能评价等作进一步的探讨。

    一、类目体系

    Yahoo由14个基本大类组成,包括Art&Humanities(艺术与人文)、Business&Economy(商业与经济)、Computers&Internet(电脑与网际网路/网络)、Education(教育)、Entertainment(娱乐)、Government(政府)、Health(健康与医药)、News&Media(新闻与媒体)、Recreation&Sports(休闲与运动)、Reference(参考资料)、Regional(国家与地区)、Science(科学)、SocialScience(社会科学)、Society&Culture(社会与文化)。

    根据其拥有的信息或网站的多寡及知识组织的需要程度,每一个基本类目下细分不同层次的次类目或子类目,愈往下的子类目中的网站其主题愈特定。它建立了一个由类目、子类目等构成的可供浏览的相当详尽的目录等级结构。其类目设计合理,结构完整、全面,类目等级层次鲜明,各级详略、宽泛程度不一,从而为网上丰富的信息资源的归类,尤其是确切归类提供了基础。

    二、分类原理

    InternetScoutProject的分类专家AimeeGlassel认为,“印度著名分类专家和图书馆专家阮岗纳赞的冒号分类法理论体系与Yahoo网络信息资源的主体目录之间存在着密切的联系”,从而揭示了Yahoo应用分面分析方 法进行网络信息资源的分类实质。具体说来,可从以下几点来深入地理解Yahoo的分面分类原理或基本过程。

    1. 采用宽泛的主题领域建立分类索引

    为了使其分类体系既具有无限的容纳性,又具有相当的专指性,Yahoo采用较为宽泛的主题领域,通过分析兼综合的方法建立较为完整的分类索引。这与分面分类的思想不谋而合,因为将知识分为宽泛的类目即分面,多方面地反映主题内容以避免列举式类表的线性单向式的结构正是阮岗纳赞冒号分类法的主要原则所在。

    2. 根据上下文进行信息内容的组合

    从Yahoo的分类结构外表看,也许会认为它与叙词表很相近,因为Yahoo也是使用词汇而非符号来组成相应的概念词串。但是,从组合类目的能力看,它远远比普通的叙词表复杂得多。通过分析Web页面的内容特征,得 到由Yahoo分类体系结构中某些类目词组成的概念词串或标引词串,将其放入相应的类目层次中。在Yahoo的概念词串或检索词串中包含的独立的词汇都含有自身的名字,但是一旦与其它词组合,则产生了一个上下文关系,拥有了一深层次的涵义。从这一点上说来,与分面分类法也是极为相似的。

    3.利用冒号标记信息内容

    现以“20世纪60年代印度在肺结核治疗方面的研究”作为待分类标引的信息内容来具体考察两者的标记制度:

    在阮岗纳赞的冒号分类法中,该内容标引为:L,45;421;6;253;f.44‘N5

    用词代替相应的符号,则为:

    Medicine,Lungs;Tuberculosis:Treatment;X-ray:Research.India‘1950

    如果将分面公式中的相应标点符号用冒号代替,由此所形成的字符串形式就是在Yahoo中用于描述信息内容的 方法,相应地表示为:

    Health:DiseasesandConditions:Tuberculosis

    可见两者在信息描述上何其相似!Yahoo利用冒号作为统一的分隔符进行了信息内容的组织和描述,既保留了 原先的分面标记的特点,又在一定程度上简化了标记制度,从而极大地提高了信息分类标引的效率。

    4. 提供不同的分类路径入口

    “虚拟的信息集合”是Yahoo的一大优点,体现在其拥有的概念模式和引用次序(即分面排列次序)的灵活性 上。在传统的图书馆中,一本书只能放在书架的某一固定位置上。但在数字化的世界里,电子信息资源却不用再限制在唯一的物理位置上。我们可以将某一信息源分到类目结构的不同位置上。通过将分面分析方法应用到网络信息资源的组织中,Yahoo能够为某一信息源在其巨大的分类等级结构中提供不同的路径分支入口,这样就使其能够从不同的路径,为检索相同内容的不同用户提供服务,从而完成查询。

    例如,现欲查找美国Wisconsin-Madison大学所在的网页,Yahoo就能提供如下几种分类或检索路径:

    (1)若从Regional:类目入手,则相应的分类路径为:Regional:U.S.States:Wisconsin:Cities:Madison:Education:CollegesandUniversities:
    UniversityofWisconsin-Madison。

    (2)若从Education类目入手,开始的几级路径为:Education:HigherEducation:CollegesandUniversities,在CollegesandUniversities目录下选择地理区域的子类目“UnitedStates@”后,可以看到,又返回到Regional目录下,之后就与上述路径相同了。其中的奥妙就在于符号“@”的运用,它提供类似于相关参照(crossreference)的作用,能够指引用户由某一子类目进入Yahoo的浏览性等级结构的其它分支中。

    三、检索方式

    Yahoo能够提供简单检索和细节检索。前者主要检索其分类结构中的一级目录,后者可使用关键词构成布尔逻辑式进行检索,其检索软件主要由OpenText公司提供。两者的结合堪称珠联壁合:一个提供强大的高质量的主题指南目录,另一个则提供高水平的检索工具。而且,Yahoo在检索时,也不光检索自身的主题目录,同时也会相应地检索OpenText公司提供的收有100万Web文件的OpenText数据库。

    诚然,Yahoo在检索方式上上存在着一些缺陷,如:只能进行关键词检索,并且只支持布尔算符and和or,未提供near等,但通过在其主页的末尾提供了其它引擎如ALTAVISTA、LYCOS等的超链接,指引用户进入这些地方去搜索,从而弥补了Yahoo的若干缺陷。因此,从总体上说来,Yahoo仍然是WWW上最流行的查询工具之一。

    四、性能评价

    作为主题指南类搜索引擎的典范,Yahoo具有以下优点:

    1. 主题目录与检索软件的完美结合

    采用分面分析的方法,由信息管理专家编制主题目录,反映了人们在选择和组织信息时的知识和智慧,提高了目录编制的质量。同时,按照主题目录以人工为主对提交的网页进行筛选、归类和组织,也能不断克服单纯由搜索软件自动完成分类的缺陷,增强分类的条理性。嵌入相应的检索软件或工具,并与之相集成,提供高质、高效的检索服务,从而加快了系统的反映速度,提高了检索的准确性,使得检索结果更接近用户的信息需求。

    2. 信息检索难度的降低

    Yahoo的数据库按照14个大类(各大类下又包含数量不等的小类)组织,其分类体系非常详尽,因此是进行宽泛主题检索的良好起点,特别是对于那些新用户和模糊需求的用户而言,选择浏览可逐级展开的主题索引比构造检索式要自然得多。并且,在用户所在的类目下,显示了该级别的类目包含的条目数,如果用户认为数量过多,还可在此范围内使用关键词检索。Yahoo的目录特征和利用上下文的服务使得能够实现快速和容易的检索,从而在一定程度上降低了互联网信息检索的难度,提高了系统的用户友好性。

    3. 检索结果的分类选择

    Yahoo由分类路径入手,最终将检索结构分成类目输出,从而将极大地推动信息的选择。它还对结果列表中的相应内容进行必要加工,加上一些描述的词组或句子,方便用户浏览并选择:如:〔*〕或〔cool〕标记表明该结果项在内容和版面设计都优于其他项;〔new〕表明是最近3日内收录的最新内容;以及上述提及过的以“@”表示相关参照,以括号里的数字表示收录的文件数量等等。另外,Yahoo增加了结果显示的类型,可以以相关网站、相关网页、新
    我要投稿   -   广告合作   -   关于本站   -   友情连接   -   网站地图   -   联系我们   -   版权声明   -   设为首页   -   加入收藏   -   网站留言
    Copyright © 2009 - 20012 www.www.hxswjs.com All Rights Reserved.57365.com 版权所有