问答

网站在GOOGLE首页前五位出现

字号+ 作者:圆圆 来源:互联网 2010-01-03 我要评论 挑错

现在一些有经验的网络高手能将自己的网站提到GOOGLE的首页,左上方的前五位!请问通过什么方法技术才能实现?
请教各位大虾!

进步GOOGLE排名


作者-中国论坛网收集 起源-http-//www.51one.net 参加时光-2004-7-5  




内容摘要-
目前中文网站在整个互联网中的影响还比拟小,这重要是因为中文网站总体的程度(技术上,内容上)都还相对落伍造成的,最重要的表示有-

行业知识-不知道搜索引擎对吸引的新用户的重要性,在搜索引擎排名服务中寻求“傻瓜相干”,购置一些其实没有太多实际意义的行业要害词其实能够用户输入的要害词越多,真对性越强,价值越高如果用户能够直接定位到产品详细内容页比到网站首页有价值的多-
宣布技术-网站的网页入入Google的索引量非常小,动态网页仍是重要宣布机制,缺乏将动态页面链接表示成静态页面的机制-
页面设计-页面题目反复,要害词不凸起,过渡使用javascript脚本/图片/Flash等不合适搜索引擎索引的非文本情势-
无法量化的东西是不可管理的,以上基本的原因去去是网站自身缺乏日志统计剖析造成-

其实大部门网站只要通过一些简略的策略仍是可以让网站自身的程度在互联网中有一个真实的体现,网站构造设计中面向搜索引擎的优化注意事项包含-

链接引用的重要性-
如何凸起要害词-网页题目、主题的设计-
页面及站点构造设计注意事项-
以及站点拜访统计的重要性等-
Google的站点设计指南
(注意-本网站设计本身就利用了其中一些方法)
什么是PageRank
Google等新一带搜索引擎的优势之一在于不仅索引量很大,而且还将最好的成果排在搜索成果的最前面,详细的原理可以参考Google の机密 - PageRank 徹底解説一文,PageRank简略的说类似于科技论文中的引用机制-谁的论文被引用次数多,谁就是威望在互联网上PageRank就是基于网页中相互链接关系的剖析得出的

此外,从盘算方法角度论述PageRank机制还有这篇文章-http-//pr.efactory.de/里面有更详细的PageRank算法阐明和各种清楚的小型个案剖析-

好比-子页中导航条的重要性
B %26lt-=%26gt- A =%26gt- C
Vs
B %26lt-=%26gt- A %26lt-=%26gt- C (好)

页面数量因素-
B %26lt-=%26gt- A %26lt-=%26gt- C
Vs
F %26lt-=\ /=%26gt- G
B %26lt-=%26gt- A %26lt-=%26gt- C (好)
D %26lt-=/ \=%26gt- E

一个意想不到的结论-
(B %26lt-=%26gt- A %26lt-=%26gt- C) ( E %26lt-=%26gt- D %26lt-=%26gt- F)
Vs
(B %26lt-=%26gt- A %26lt-=%26gt- C) %26lt-=%26gt- ( E %26lt-=%26gt- D %26lt-=%26gt- F)
PageRank升高的只是被链接的2个首页A和D,而网站子页面的PageRank平均会略有降落同时-一个网站入入Google的索引量越大其受类似因素影响越小

PageRank不合错误称的页面互链-
Google会用BadRank之类的算法入行改正,而且一个网页着有来自“与其自身不相称”的高PageRank站点的链接,而自身又缺乏足够数量和质量的反相链接的话,其PageRank会主动降落为0,A(pr=7) %26lt-=%26gt- B(pr=0)
简略的说就是-偶尔要被威望站点反相链接不算数,要被足够多的威望站点引用才能进步自身网页的PageRank

链接就是一切
在互联网的海洋中,最重要的就是互联互通,不被其他网站引用的网站就是“信息孤岛”“酒好也害怕巷子深”,也许这话说起来有点像垃圾邮件广告,但事实就是这样所以如果做网站的目标不是孤芳自赏,就须要积极的推广自己的网站
通过搜索引擎推广自己须要注意以下几个方面-

以量取胜-不必定参加大型网站的分类目录才是网站推广,来自其他网站的任何反相链接都是有用的
网站推广比拟经典的方法就是参加比拟大型门户网站的分类目录,好比-Yahoo!,dmoz.org等其实这里有一个误区-不必定非要参加大型网站的分类目录才是网站推广,因为现在搜索引擎已经不再只是网站目录的索引,而是更全面的网页索引,所以无论来自其他网站任何处所的反相链接都长短常有价值的,哪害怕是呈现在消息报道,论坛,邮件列表回档中良多大型站点的邮件列表发邮件时,必定注意在自己的签名中加上自己网站的地址

Blogger(Weblog的简称)们也许最深入地舆解了“链接就是一切”这句话的含义,因为Blog的内容之间有大批的相互链接,因此最常常被引用的 Blog页面在搜索引擎中的排名去去比一些大型商业网站的页面还要高

以质取胜-被PageRank高的网站引用能更快地进步PageRank
数量只是要害因素之一,来自PageRank高的页面的链接还能更快的进步被链接目标的PageRank,我只是将一些文章投稿在了ZDNet中国上,因为页面上有文章出处链接,相应网页和网站整体的PageRank过了一段时光后就有了很大的晋升有时候被哪样的网站引用有时候比引用次数多更重要这里我要特殊感激的是,当时ZDNet中国事独一遵循了我的版权声明的请求表明了文章出处,并且有反相链接的网站
依照这个原则-能够名列Yahoo!和DMOZ这样的大型威望目录的头2层长短常有价值的

了解搜索引擎的%26quot-价值观%26quot--
Lucene简介这篇文章被Jakarta.apache.org的lucene项目引用以后,这篇文章就成为了所有页面中PageRank最高的页面,而Google支撑的一些项目,好比-Folding@Home,让我一直疑惑他们对政府,教育和非盈利组织的站点有特殊加分,究竟.org .edu才代表了互联网的本质-分权和共享
但更合理的阐明是-.org良多都是开放技术平台的开发者,他们会在首页这样的处所参加Powered By Apache, Power by FreeBSD之类的链接表示对其他开源平台的尊敬,所以象Apache, PHP, FreeBSD这样的开源站点在GOOGLE中都有非常高的PageRank而在.edu这些站点中,良多都是学术性比拟强的文档,以超链接情势标明参考文献的出处已经成为一种习性,而这也无疑恰是PageRank最好的根据
注意-不要通过Link Farm进步自身的站点排名-Google会惩罚那些主动链接到Link Farm站点以进步自身排名站点,相应站点的页面将不会被收入到索引中但如果您的页面被别的Link Farm链接了也不必担忧,因为这种被动的链接是不会被惩罚的

不要小气给其他网站的链接-如果一个网页只有大批的入入链接,而缺乏导出链接,也会被搜索引擎以为是没有价值的站点保证您的网站能够辅助搜索引擎更正确地断定哪些是对用户最有价值的信息,也就是说如果您的网站只有外部反向链接而没有导出链接的话,也会对您的网站在搜索成果中的表示带来负面影响当然网站中连一个导出链接都没有的情形非常罕见,除非您是刻意这么做正常情形下大家都会天然地在网页中加上一些其他网站的链接,率领拜访者去到我们以为重要或能够提供更多有价值信息的处所,
另外在推广自己网站之前也许首先须要了解自己网站目前在一些搜索引擎中的知名度,原理非常简略,可以参考如何评价网站的人气一文

网站推广只是手腕,如何凸起内容、让须要相干信息的用户能够绝快的找到您的网站才是目标,PageRank高并不代表像Yahoo!这样的门户站点就能在所有搜索成果中排名靠前,因为搜索引擎的成果是搜索要害词在页面中的匹配度和页面的PageRank相联合的排名成果因此第二个要点-如何凸起要害词

如何凸起要害词-面向主题(Theme)的要害词匹配
Theme Engine正在逐步超过PR,成为成果排序中更重要的因素,可以比拟一下以下现象-
为什么查“消息”,“汽车”之类的文字,各种门户网站的首页不在第一位?要知道他们的页面中都有相应频道的链接文字的
一篇消息页面中,搜索引擎如何不通过模板匹配,主动将消息的主体和页面中的页头,栏目导航条,页尾等部门的内容区离开的?
其实以上问题都可以回结为网页内容摘要的提取策略和要害词在其中的命中-
首先将能够描写一个页面内容的分成以下几种类型-

链入文字描写-inbound link text
http-//www.searchenginedictionary.com/terms-inbound-link.shtml

HTML页面题目-title 好题目一般会将页面中最重要的要害词放在最前面,好比-ABC-10型吸尘器 - XX家电城
HTML内容主体-content text
链出文字-outbound link text

如果依照以下规矩-
一个页面中要害词命中权重-链入文字 %26gt- HTML题目文字 %26gt- HTML页面主体内容 %26gt-%26gt- 出链文字,以上现象就比拟好阐明了
链入文字是页面上望不见的,但链入文字对被链接页面有宏大的作用-在现代搜索引擎在要害词匹配的入程中,匹配的入程不只望当前页面的内容摘要-很大程度上,不只望这个网页自己说自己有什么内容,还要望别人如何链接时,如何描写您的网站别人怎么称呼您,比您自己说自己更重要
好比查-“世界卫生组织”,返回成果中有 http-//www.who.int/ 而这个页面中是没有中文的,之所以能匹配上,是因为良多链接它的中文网站使用了-%26lt-a href=%26quot-http-//www.who.int/%26quot---%26gt-世界卫生组织%26lt-/a%26gt-,所以,这个页面中不存在的中文要害词也成为了页面摘要的一部门

这样一想,就可以知道链出链接的文字其实是为被链接的子频道首页或者内容详情页服务的对自身页面的要害词密度只有负面的影响,这也是Google建议一个页面中链接不要超过100个的原因-他基本不索引100个链接以后的内容

依照以上规矩,搜索引擎将一篇消息详情页中的消息内容提掏出来就是把页面上所有带HTTP链接的文字都去掉,就是消息的内容部门了,更正确一些可以通过取最长文本段落等策略实现-

而良多网站首页或频道首页中几乎全体都是链接,经由搜索引擎剖析的成果就是-什么内容也没有,能够被命中的要害词仅仅是别人链接您用的“网站首页”和频道题目Title中的站点名称等的几个要害词,而页面中其他的文字则遥遥不如相应子频道和详细内容页面的匹配度高,而搜索引擎能够通过以上规矩,让用户更快的直接定位到有详细内容的内容详情页面因此盼望通过一个首页,绝可能多的命中所有盼望推广的要害词是不可能的让网页绝可能多的入入搜索引擎的索引,然后掌握好整个网站的主题作风长短常重要的,让网站的主题要害词能够比拟平均的依照金字塔模式散布到网站中可以参考-网站的主题金字塔设计 网站名称(用户通过1-2个抽象要害词)
/ \
子频道1 子频道2 (用户通过2-3个要害词命中)
/ \ / \
产品1 产品2 文章1 文章2 (用户通过3-4个要害词命中-这种用户最有价值)

不要空着题目-空着%26lt-title%26gt-%26lt-/title%26gt-无异于挥霍了最有价值的一块阵地-
传统的页面中,HTML页面中会有类似以下的隐含信息,用于阐明当前网页的重要内容要害字-
%26lt-header%26gt-
%26lt-meta name=%26quot-keyword%26quot- content=%26quot-mp3 download music...%26quot-%26gt-
%26lt-/header%26gt-
后来因为这种人工添加要害词的方法被滥用,大批网页中为了进步被搜索引擎命中的概率,常常添加一些和实际网页内容无关的暖门要害好比-“music mp3 download”等,所以新一代的搜索引擎已经不再关怀页面头文件中的人工meta keyword声明,而页面题目在搜索引擎的要害词的命中命中入程中去去有着更高的比重,如果一个要害词在题目中命中会比在页面中命中有更高的得分,从而在相应的搜索成果排名中更靠前

题目长度和内容-不要过长,一般在40个字符以内,并充足凸起要害词的比重-
如果更长的题目搜索引擎一般会忽略掉,所以要绝可能将重要要害词放在题目靠前的地位省略掉不必要的形容词吧,究竟用户重要通过名词来找到须要的内容题目内容-绝量用一些别人可以通过要害词找到的字眼(也别太过头,如果题目中的字眼超过1半内容中都没有,有可能被搜索引擎消除出索引),因此基于web日志中来自其他搜索引擎的要害词查询统计非常必要

如果网页良多的话,绝量使用不同的网页题目,争夺让自己网站的内容更多的入入搜索引擎索引范畴-
因为搜索引擎会根据页面内容的类似度把一些内容当成反复页面消除出索引范畴-
http-//www.chedong.com/phpMan.php是我的网站上的一个小利用-一个web界面的unix命令手册(man page),在以前的设计中所有动态页面使用的都是同样的题目-%26quot-phpMan- man page /perldoc /info page web interface%26quot- ,Google索引了大约3000多个页面,后来我将页面题目改成了%26quot-phpMan- [命令名]%26quot-这样的格局,好比-%26quot-phpMan- ls%26quot-,这样大部门动态页面的题目就都不一样了,一个月后Google从这个页面进口索引了大约6000个页面因此,如果网站中良多网页都使用雷同的题目,好比-“消息频道”,“论坛”,这些页面中很大一部门就会被排重机制忽略掉

除了%26lt-title%26gt-%26lt-/title%26gt-外,还可以用%26lt-h1%26gt-%26lt-/h1%26gt-题目行凸起内容主题,增强题目标后果-
在我的网站设计中-我会把用%26lt-h1%26gt-[题目]%26lt-/h1%26gt-这样的模板把题目凸起显示,而不是通过转变字体的方法凸起题目
其他网站设计提醒
静态链接-Blog网站另外一个优势在于其网页是静态链接-动态网页占到整个互联网内容的90%以上各个搜索引擎其实能够表示的都只不外是互联网的冰山一角(3-5%),不同的只是谁让优质网页排名靠前的策略更优良而已-大部门搜索引擎都以为静态链接的网页是优质网页,Google在优先抓取索引的网页中70%以上是不带参数链接的静态网页而且即使同样的内容,静态网页也会比动态网页权重高-很容易懂得-query?a=1%26b=2主页的链接很容易被制作,而且去去内容和后面参数次序倒置的query?b= 2%26a=1完整雷同绝量使用静态网页-目前能够像Google一样对动态网页入行索引的搜索引擎还比拟少,而即使是Google也更不会索引所有的内容,很少会对参数超过2个的动态网页入行入一步的抓取和剖析总体上说Google喜欢新的,静态的内容

因此无论从效力上讲仍是便利搜索引擎收录,使用内容宣布体系将网站内容宣布成静态网页都长短常必要的
好比-http-//www.chedong.com/phpMan.php/man/intro/3
比 http-//www.chedong.com/phpMan.php?mode=man%26para---meter=intro§ion=3
更容易入入搜索引擎的索引而且在URL中的命中有时候比在题目中还能凸起要害词

而且能够入入Google索引的页面数量越多越好可以用类似以下的脚本统计自己的网站被Google和百度索引的情形
#!/bin/sh
YESTERDAY=`date -d yesterday +%y%m%d`
LOG_PATH='/home/apache/logs'
grep -i Googlebot $LOG_PATH/access_log|awk '{print $7}' |sort -u%26gt-spider/$YESTERDAY.googlebot.txt
grep -i baiduspider $LOG_PATH/access_log|awk '{print $7}' |sort -u%26gt-spider/$YESTERDAY.baiduspider.txt

网站目录构造要扁平,因为每深一级目录,PAGERANK降落一个档次假设首页是3,其子可能目录就是1了,更深可能就无法列入评级范畴了

表示和内容的分别-“绿色”网页
网页中的javascript和css绝可能和网页分别,一方面进步代码重费用(也便利页面缓存),另外一方面,因为有效内容占网页长度的百分比高,也能进步相干要害词在页面中的比重也增添了总之,应当激励遵循w3c的规范,使用更规范的XHTML和XML作为显示格局便于内容更长时光的保存

让所有的页面都有能够快速进口-站点地图,便利网页爬虫(spider)快速遍历网站所有须要宣布的内容如果首页就是用Flash或图片入入的话,无异于将搜索引擎拒之门外,除了UI设计的用户友爱外,spider friendly也长短常重要的

坚持网站自身的健康-常常利用坏链检讨工具检讨网站中是否有死链

坚持网页内容/链接的稳固性和持久性-在搜索引擎索引中网页存在的历史也是一个比拟重要的因素,而且历史比拟久的网页被链接的几率越高为了保证自己网页能够被比拟持久的被其他网站的页面引用,如果自己网页中有链接更新时,最好能保存旧的页面并做好链接转向,以坚持内容的持续性要知道,把一个网站和内容在搜索引擎中的排名“培育”的很高是一件非常不容易的事情,谁都不盼望好不容易自己的内容被别人找到了,点击却是“404 页面不存在”吧,因此站点管理员对自身站点error.log的剖析也长短常必要的

文件类型因素-Google有对PDF, Word(Power Point, Excel), PS文档的索引才能,因为这种文档的内容比一般的HTML经由了更多的收拾,学术价值一般比拟高,所以这些类型的文档生成就比一般的HTML类型的文档 PageRank要高因此,对于比拟重要的文档-技术白皮书,FAQ,安装文档等建议使用PDF PS等高等格局存取,这样在搜索成果中也能获得比拟靠前的地位
常常能发明门户站点的一条消息去去比其他站点的首页排名还要靠前因此一个站点总体PageRank进步了以后,去去自身一些并不重要的内容也会被同那些高PageRank的内容一起带入被搜索引擎优先查询的列表中这点有些不是很合理,因为这样常常造成良多大站点的邮件列表回档去去比其他站点的首页PageRank还要高
良知知彼——站点拜访统计/日志剖析发掘的重要性
网站设计不仅仅只是被动的逢迎搜索引擎的索引,更重要是充足利用搜索引擎带来的流量入行更深层次的用户行动剖析目前,来自搜索引擎要害词统计几乎是各种WEB日志剖析工具的尺度功效,相信商业日志统计工具在这方面应当会有更强化的实现WEB日志统计这个功效这样重要,以至于新的RedHat 8中已经将日志剖析工具webalizer作为尺度的服务器配置利用之一



参考文献-http-//www.luntan.com.cn/info/117_1.htm

转载请注明出处。

1.本站遵循行业规范,如转载您的文章未标注版权,我们将予以改正!;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 怎么样在网上卖东西

    怎么样在网上卖东西

  • 我的开心网首页变成这样了,求救

    我的开心网首页变成这样了,求救

  • 有没有一个好的SNS网站建议 胜过开心网?

    有没有一个好的SNS网站建议 胜过开心网?

  • 每天必登的一个网站请大家晒晒?

    每天必登的一个网站请大家晒晒?

网友点评
精彩导读
关注微信
手机网站
关于我们