404 访问的页面暂时不存在。
当网站进行调整、页面进行修改的时候,便会有网页被删除、改名或移动位置,这时候,虽然
相应内容的网页还存在于网站中,但使用原来的地址访问则无法访问,或者由于拼写错误导致一个
无效的链接,都将使服务器返回 404 状态码。
但是,Web 服务器默认的 404 错误页面,均十分简陋、呆板且对用户不友好,无法给予用户寻
找相应信息的更多线索,用户看到这类页面往往最直接的反应并是关闭浏览器窗口离开,这在很大
程度上给网站造成损失。毕竟,对网站来说,用户永远是最重要的资源,以这种方式损失用户更意
味着某种程度的失败。
这也是许多网站使用自定义 404 错误页面的原因。通过良好的自定义 404 页面,可以包含对网
站的相应介绍、用户可能感兴趣的内容链接或者网站内容导航链接、内容搜索功能等,能够有效地
帮助访问者找到其欲寻找的内容或相似的内容,提高用户在网站内浏览更多信息的机会。
正确定义404 错误页面:
1. 对于已经存在的信息由于路径改变而导致访问不了时,应该在IIS 中定义404 错误指向一个动
态页面,在页面里面使用 301 跳转到新的地址,此时服务器返回 301 状态码。
2. 当访问一个错误的链接时,将调用404 页面,但由于在IIS 里面设置的不同将导致返回不同的
状态码:
1. 404 指向的是一个htm 文件,此时页面返回的404 状态码,这是正确的。
2. 404 指向的是一个 URL,例如 /error.asp,如果不在页面里面进行设置,仅仅是返回提示
的HTML 代码,将导致页面返回 200 状态码,此时的危害在于,当很多页面找不到时,
都返回和访问正常页面时返回一样的 200 状态码,将使搜索引擎认为该链接存在,并以
错误页面的内容进行收录,当这样的链接很多时,将导致大量页面重复,使网站排名降
低。处理方法:在显示完提示内容后,增加语句: Response.Status="404 Not Found" ,
这样就保证页面返回404 状态码。
3. 避免在调用404 页面的时候返回302 状态码,容易被搜索引擎认为是重定向作弊。
4. 检测方法,使用HttpWatch 查看返回代码。参见:
在这个例子中,我请求的是
location.<!-- 使用Flash -->
<object width="480" height="385">
<param name="movie" value="url.swf?url=http://www.baidu.com"></param>
<embed src="url.swf?url=http://www.baidu.com" type="application/x-shockwave-flash"
width="480" height="385"></embed>
</object>
</body>
</html>
复制站点或内容:
通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同
一页面进行多次索引的行为。镜象站点(Mirror Sites)是此中典型。
《搜索引擎优化(SEO)从入门到精通》 第 39 页
----------------------- 页面 40-----------------------
QQ:495489975 QQ 群:51125130 MSN:supercsshotmail.com 手机:13911374501 网站:www.seo007.com
通常表现:一个网站有多个域名,多个域名都简单的指向同一个站点。
搜索引擎容易发现,通常会将网页降权。
解决这个问题:
1. IIS 里面演示配置。
2. 其他域名都指向一个包括以下内容的页面。
asp
Response.Status="301 Moved Permanently"
Response.AddHeader "Location", "http://www.supercss.com/"
Response.End
asp.net
Response.Status = "301 Moved Permanently";
Response.AddHeader("Location","http://www. supercss.com/);
3. 在镜像服务器放置一个robots.txt 文件,并设置成拒绝所有蜘蛛索引。
User-agent: *
Disallow:/
《搜索引擎优化(SEO)从入门到精通》 第 40 页
----------------------- 页面 41-----------------------
隐形页面:
指同一个网址下对不同的访问者选择性返回不同的页面内,搜索引擎得到了高度优化的网 页内容,而
用户则看到不同的内容。
这是一种非常高级的作弊方式,通常用户和搜索引擎都发现不了。
代码:区别蜘蛛代码(ASP )
包含指向作弊网页的链接:
做友情链接时,链接到作弊的网站,特别是在首页链接到作弊网站,将导致网站连带被惩罚。
避免被牵连:
1. 经常性的检查首页友情链接网站是否被搜索引擎惩罚。
2. 将有风险的链接以脚本的方式显示。
例如:<a href=’http://www.supercss.com’>非常代码网</a>
修改成:document.write(“<a href=’http://www.supercss.com’>非常代码网</a>”);
3. 将友情链接放在Iframe 页面里面。
4. robots.txt ,禁止所有的搜索引擎访问这些目录。
User-agent: *
Disallow: /links/
5. 针对Google 使用标记说明该页面的链接被忽略:
<meta name="Robots" content="index,nofollow" > 页面全部链接都无效
<a rel=”nofollow” > ⑥合彩 </a> 标记的这个链接无效
重复注册:
定义:在短时间内,将一个网页重复提交给同一个搜索引擎,其实,这种作法适得其反。
其实想让搜索引擎收录是很简单的。参见:如何让搜索引擎收录网站?
站点上加了恶意代码或者故意挂马:
现在搜索引擎能够分析出来,降低网页的信任度,并搜索结果里显示该警告提示。
例子:
参见:关于恶意软件警告:“该网站可能含有恶意软件,有可能会危害您的电脑。”
链接工厂:
“链接工厂”是这样一组网页,它们都与组中的其他网页相连。它故意这样设计,是为了在搜索引擎
的结果中提高排名。
搜索引擎对作弊的处罚
搜索引擎的惩罚会根据所犯的错误而定,具体显示现象:
1. 关键词排名降低。
2. 长时间不更新网页内容。
3. 收录减少,甚至为0。
4. 网站PR 值成 0。
发现网站被屏蔽后,应查找网站被屏蔽的原因,修改后,向搜索引擎提交申请,请求再次收录:
1. Google
《搜索引擎优化(SEO)从入门到精通》 第 41 页
----------------------- 页面 42-----------------------
要申请重新加入,请登录 Google Sitemap,选择"申请重新加入"链接,然后按照所示步骤操作。
权威指南:http://www.google.com/support/webmasters/bin/answer.py?answer=35843
2. 百度
首先请确认您的网站上已经没有作弊行为,然后请到 百度登录吧或发送邮件到spambaidu.com,
按照下面的内容进行说明,一般在一个月后可以被解除。
您应在申请解除惩罚的邮件中说明以下内容:
请说明您的网站地址
请说明您什么时间发现网站在百度消失的?
请说明您确认使用了何种被百度确认的作弊方法?
好的例子:
百度申请撤销信样例:
尊敬的百度客服:
您好!
首先我自我介绍一下,我是时尚Q 族www.lm5588.com 的站长,我叫自由幻想,我的网站建
立于 06 年的 10 月份,最近因为种种原因我把网站上的程序换了一下以后,百度的收录就成 0
页,我不知道为什么会这样的,我一直按照百度搜索引擎的里面协议规定的去做的,没有作弊
也没有违反你们的规定,麻烦尊敬客服帮我重新收录一下,非常感谢你们辛勤的工作,最后我
祝百度越办越好!!
自由幻想
2007 年7 月5 日
这位网页在信发出 1 周后,域名被恢复,现在收录达 1180 页。
3. 对于无法恢复的域名,最好的办法就是重新注册新的域名。
第八部分 Google 搜索引擎
Google PageRank
概述:
PR 值,即网页级别
Google 对网页级别的描述 :“作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大
的链接结构。实质上, 当从网页 A 链接到网页 B 时,Google 就认为“网页 A 投了网页 B 一票”。
Google 根据网 页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,
Google 还 要分析投票的网页。“重要”的网页所投出的票就会有更高的权重,并且有助于提高其它
网页 的“重要性”。
PR 值算法原理:
一个网页被多次引用,则它可能是很重要的;
一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;
一个网页的重要性被平均的传递到它所引用的网页。这种重要的网页称为权威网页。
参见:怎样查自己网站的反向链接?
《搜索引擎优化(SEO)从入门到精通》 第 42 页
----------------------- 页面 43-----------------------
影响 PR 值的因素:
1. 网站的导入链接质量。导入链接越多质量越高,该页面的PR 值就越高。
2. 导出链接数量。导出的越少,导出的链接获得的PR 值就越高。
反例:http://www.soft6.com/inc/link.shtml 导出链接过多。
3. 搜索引擎收录一个网站的页面数量。数量越多,内部链接就越多。
4. 首页PR的高低。
首页是推广的核心页面,所以网站首页PR 高低对内页各PR 也产生直接影响。
首页﹥一级页面﹥二级页面﹥三级页面……每深入一级,PR 降低 1 -2 个档次。
5. PR 值的更新:
Google 每个月进行一次彻底的数据更新,更新后的网站排名和导入链接都会有某 些变化,但其 PR
更新时间一般要延迟至 数据更新后三个月左右,而且网站的 PR 值相对稳定, 要上升或下降一级
PR 是很不容易的事情。
PR 值的作用:
1.网页比较重要,拥有了排名靠前的优先权。
2.具有了获得高质量导入链接的谈判优势。
3.搜索引擎会加快对网页数据的更新。
Google Dance
概述:
.Google Dance ,即Google 数据更新。
Google 有 8 个数据中心,共享超过一万台的服务器。一般在每月 15-20 号左右升级数据库库。
期间,新的网站被加入,无效网站被删除,对收录网站进行全面深度检索,也可能在这期间调整算
法。由于每次升级都会引起很多网站排名波动,俗称 Google Dance 。
Google Dance 对于 SEO 来说,涉及的注意事项如下:
1.网站的提交及更新时间。
在 Dance 期间,新网站被收录的机会增大,因此宜在 Dance 其间提交新网站及加大网站更新力度。
《搜索引擎优化(SEO)从入门到精通》 第 43 页