第三,搜索引擎优化行为对用户体验的破坏程度是线性分布的,百度反spam是机器自动识别和人工识别互补的体系。既然有识别就有判断的阈值,无论是自动识别还是人工识别,无论把阈值定在哪里,那些阈值附近的优化行为判断总是容易引起争议的。在所有支持中文的搜索引擎中,百度也许已经是反spam做得最努力的,但中国网民在百度的搜索体验仍然每天被spam严重破坏1500万次以上(spam网页出现在搜索结果前10名)。因为中文spam面广量多,因为百度反spam打击也面广量多,即使阈值附近的争议网址只占很少的几个百分点,也可能导致每天有几十个网站有资格对于被惩罚表示异议,这不是百度愿意看到的,但现实点说,无法指望短时间内大幅度减少这种问题,也无法指望能人工一一回复每个提出异议的网站。
另外,对于加入百度搜索联盟并且达到一定搜索量的网站,我们有一个优待政策:在发现自己被降权后可以申请立即复查一次,如果复查发现网站上已没有spam行为,则可以安排尽快取消降权。但这个权利只能用一次,一旦该网站在例行检查、网友举报、或不定期复查中被再次发现spam,那么无论谁也救不了它了。
caoz:hao123的发展思路是什么?第一,如果想加入新站点,目前是什么政策?据说收费了?费率多少?第二,以前被收录的站点会不会有政策处理上的变化?这是他们很关心的问题。
9238:
详细的发展思路是商业机密,我不能在此公开。但可以回答你一个具体的问题,所谓hao123已改为收费登录那是假的,每个频道只是卖少量广告(百度对广告的控制极严,没有在hao123原有基础上增加任何flash或banner,每个频道广告链接原则上不超过5个,不达到一定质量要求的网站即使广告也不卖给它,负责hao123用户体验的员工对广告有一票否决权),但现在肯定没有全面收费,今后的一段时间内也没有这个打算。以前被收录的站点不会有处理策略的变化,hao123的用户体验或者被收录网站的质量是挑选和更新的唯一标准。
caoz:百度mp3搜索的策略与mp3音乐站长群的矛盾如何化解
9238:
迄今为止百度的mp3信息几乎都是从百度的网页库中提取出来的,而百度的spider一直遵守国际通行的robots协议,不愿意被百度收录mp3信息的站长只要写一句robots协议就能阻止百度spider再收集信息(以前收集的信息需要等一段时间被更新后才消失),在百度的用户帮助信息中提供了详细的robots协议写作教程:http://www.baidu.com/search/robots.html
caoz:不知道百度对故意重复的定义是什么,比如donews首页的标题,有大量的IT重复出现,是否算做故意重复呢?又比如前几天突然被降权的9flash.com。他在页面里所重复的“flash”关键词,是不是属于“故意”面向搜索引擎做的呢?我们可以这么测试一下,把“flash展现的电影”和“电影”两个词比较,可以等同吗?不等同说明flash这个词在这里,是必要修饰词,把“flash音乐”和“音乐”两个词比较,可以等同吗?不等同说明flash这个词在这里,是个必要的修饰词,下面的不用解释了,我觉得这个其实很容易理解,如果在对方站点里出现的某些关键词在该站点的内容和连接表述中,属于必要修饰词,并且该关键词所出现的段落和连接有其正确的表述价值,那么这种重复,就不能说是“故意重复”,我不知道百度认同否?
2 百度降权,封杀站点的标准是什么
9238:
反spam的唯一目的是提高用户搜索体验。我们不会为了反spam而反spam,不会对所有违反规则的网站施加相同的惩罚,关键在于,用户查看某个关键词的搜索结果时,你的网站对用户是否有价值、这个价值是否值得你排在那个位置?
即使donews对IT重复了,如果在IT这个关键词的搜索结果中没有排在非常不该排的位置,没有对用户搜索体验造成明显破坏,那么理想状态下donews仍不会受惩罚。9flash如果只对flash关键词优化,那么不太容易受到惩罚,但如果对电影关键词优化,那么很容易受到惩罚。
明白的说,网站spam与否是网站的自由,百度无权干涉也没兴趣理睬,但如果哪个网站的行为或效果破坏了中国网民在百度搜索的体验,那么百度也有升级算法、降权、直至拒绝收录这个网站的权利和兴趣。其实各位站长完全没必要把百度怎么想当一回事,站长们只要把百度的搜索用户当一回事就行了,只要你的网站对用户有搜索价值,百度急着升级算法把你排到合适的位置都来不及呢,哪里敢把你降权什么的呢。
caoz: 故意制造大量链接指向某一网址的行为。
我觉得这个条款简直可以让所有的站点纳入作弊的范畴。
百度有个联盟,把代码投放到千万个站点上,算不算“故意制造大量连接指向某一网址”?这个是个玩笑,但是事实是,所有的站长,特别是那些没有能力做大幅度广告预算的个人站点,他们的网络推广途径的重要步骤,就是和大量的不同站点交换连接,交换连接,不就是“故意制造大量链接指向某一网址的行为”吗?这是其一。如果我做了一个站点,我又申请了blog,我又申请了donews,我又申请了什么什么,我又泡论坛,那么我肯定会把我的站点连接放在