搜索引擎背后隱含著很大的經(jīng)濟利益,更容易被搜索到是提高點擊率的一個重要途徑,也是互聯(lián)網(wǎng)“注意力經(jīng)濟”的一個重要指標(biāo),搜索引擎與作弊網(wǎng)站之間的矛盾,不光是技術(shù)上的攻防游戲,實際上是一個嚴(yán)肅的產(chǎn)業(yè)問題
“芙蓉姐姐”成作弊工具
打開Goo
gle,選關(guān)鍵詞“芙蓉姐姐”點擊,再任選一個“芙蓉姐姐”出現(xiàn)較多的一篇點擊,接著出現(xiàn)兩種可能:第一,只數(shù)秒鐘,頁面便突然彈跳到“亞洲在線最大的寬頻影院”等等網(wǎng)頁。第二,出現(xiàn)無數(shù)的“芙蓉姐姐”,再任意選擇一個“芙蓉姐姐”點擊,出現(xiàn)與第一種可能一樣的頁面———其內(nèi)容與“芙蓉姐姐”絲毫無關(guān),撲入眼里的是女人半裸的身體或半裸的乳房。
這便是一次完整的“作弊網(wǎng)站”體驗。

例如上面這個網(wǎng)站,屬于非常典型的SPAM,它在網(wǎng)頁標(biāo)題中堆積大量無關(guān)關(guān)鍵詞,或者在網(wǎng)頁的meta
keywords中堆積大量無關(guān)關(guān)鍵詞。 網(wǎng)站畫面截圖(來源:eNet硅谷動力)
幾乎沒有一次例外,當(dāng)網(wǎng)絡(luò)上有某一個詞成為熱點時,它必將成為作弊網(wǎng)站(亦被搜索引擎稱為“垃圾網(wǎng)站”)最為熱門的“作弊工具”。這一次輪到“芙蓉姐姐”。
在互聯(lián)網(wǎng)搜索引擎領(lǐng)域,作弊網(wǎng)頁已達到泛濫成災(zāi)的地步。
這是據(jù)芙蓉姐姐走紅的7月12日的統(tǒng)計。以“芙蓉姐姐”為關(guān)鍵詞,通過Google進行查詢,約有1,030,000個相關(guān)網(wǎng)頁。查看前40篇的網(wǎng)頁,約有15條比較符合“芙蓉姐姐”的內(nèi)容,占37.5%,有25條不符合“芙蓉姐姐”的內(nèi)容,占62.5%。
除了最近兩天剛排到第一位的門戶網(wǎng)站新浪外,第二位是Mblogger,第三的是,均名不見經(jīng)傳。以排在前10位的來分析,除新浪外,幾乎全是在BSP(Blog Service Provider托管服務(wù)提供商)上申請的BLOG網(wǎng)站(中文稱“博客網(wǎng)站”),而在搜索結(jié)果的摘要內(nèi)容上,這些網(wǎng)頁類似于專題的形式,滿目都是“芙蓉姐姐”,任意點開其中一個,大多彈出的是性感電影手機注冊下載或鈴聲下載等頁面。
在百度里,以“芙蓉姐姐”為關(guān)鍵詞,找到相關(guān)網(wǎng)頁約1,340,000篇,在前40篇中,排在前面的主要是網(wǎng)易、TOM、新浪女性、QQ等門戶網(wǎng)站的專題,而在Google中,這些內(nèi)容均被作弊的blog擠出前40篇之外。
據(jù)一位不愿透露名字的反spam(垃圾網(wǎng)站)專家王某介紹,百度這種搜索結(jié)果,并非百度偏好門戶專題新聞類內(nèi)容,根本原因在于,百度已將上文提到的Google前40篇內(nèi)大部分的作弊網(wǎng)頁自動刪除掉了,結(jié)果比較符合“芙蓉姐姐”的網(wǎng)頁內(nèi)容自然在搜索中排得靠前了。
以“芙蓉姐姐”為關(guān)鍵詞對照百度和Google兩個主要搜索引擎的搜索結(jié)果,可以感受到百度搜索的用戶體驗要比Google好,因為在Google中查找意味著需要在一堆“垃圾”中尋找有效的網(wǎng)頁。
作弊聯(lián)盟
有意思的是,百度屏蔽這些垃圾網(wǎng)站時,遭到了這些網(wǎng)站在技術(shù)層面上的攻擊。
“百度一下”關(guān)鍵詞“反百度聯(lián)盟”會發(fā)現(xiàn),在百度網(wǎng)站上有無數(shù)條有關(guān)“反百度聯(lián)盟”的信息。自6月1日“反百度聯(lián)盟”網(wǎng)站上線以來,目前已有2000多人次簽名。
該網(wǎng)站上線之初,氣勢較大,但最近幾乎沒有了動靜。
“反百度聯(lián)盟”發(fā)起人為一個網(wǎng)名為“踏雪無痕”的網(wǎng)友,據(jù)稱,其“美人魚”個人文學(xué)網(wǎng)站于去年底被刪除。該聯(lián)盟在宣言中表示,該聯(lián)盟是為了反對百度公司對廣大站長和網(wǎng)友不公正而成立的同盟組織,本同盟成立的目的是“為了收集百度公司對待站長和網(wǎng)友不公正的證據(jù),促進監(jiān)督百度公司走向公正”。但是,該聯(lián)盟成立一個半月以來,至今沒有發(fā)現(xiàn)該聯(lián)盟握有多少百度“對待站長和網(wǎng)友不公正的證據(jù)”。
而百度對待“反百度聯(lián)盟”的態(tài)度是“兼容”,直接通過“百度一下”,即可獲得該聯(lián)盟的所有信息。但據(jù)稱,百度對此聯(lián)盟相當(dāng)重視,從該網(wǎng)站一出現(xiàn),便組織專業(yè)人員對聯(lián)盟成員及聯(lián)盟成立原因進行調(diào)查,最終得出結(jié)論,從已明示網(wǎng)站站名的該聯(lián)盟成員來看,被百度屏蔽的網(wǎng)站無一例外都曾違反了百度的搜索引擎反垃圾網(wǎng)頁規(guī)則。
業(yè)內(nèi)專業(yè)人士認(rèn)為,成立反百度聯(lián)盟是一件不正常的事情,這就像成立“假冒偽劣俱樂部”或“垃圾郵件聯(lián)盟”一樣,是不為一個社會所容的。
目前,搜索引擎領(lǐng)域的垃圾網(wǎng)站,已到了泛濫成災(zāi)的地步。其發(fā)展趨勢完全等同于當(dāng)年垃圾郵件,已像蝗災(zāi)一樣,不僅危害搜索引擎,也直接危害互聯(lián)網(wǎng)。
據(jù)百度PM總監(jiān)俞軍介紹,與作弊網(wǎng)站的斗爭,將是互聯(lián)網(wǎng)上一個長久的過程,目前雙方的博弈與全球反病毒在技術(shù)與形式方面已沒有什么區(qū)別。
俞軍認(rèn)為,從某種角度來說,幾乎是垃圾網(wǎng)站在推動著搜索引擎的進步。
在搜索引擎發(fā)展初期,搜索引擎的專業(yè)人員一直在思考,如何讓搜索者以最快速度搜索到最有價值、最為相關(guān)的結(jié)果,因而發(fā)明了metatag———這是一種“超文本標(biāo)志語言”,在互聯(lián)網(wǎng)體系中的作用是表明該網(wǎng)頁或網(wǎng)站的屬性。
起初,meta tag是很好用的。那時候,誠實的web站點管理員(webmaster)們?nèi)鐚嵉靥顚懢W(wǎng)站摘要,如實地列出跟他的網(wǎng)站最相關(guān)的關(guān)鍵字,搜索引擎?zhèn)冏ト、索引、檢索這些誠實的meta tag,并作為搜索結(jié)果排序的重要依據(jù)。為了有效提高搜索結(jié)果,有專門的網(wǎng)絡(luò)人員研究SEO(搜索引擎優(yōu)化),專門為網(wǎng)站提高搜索結(jié)果而進行優(yōu)化。
然而,人們越來越發(fā)現(xiàn),搜索結(jié)果的排序,是一個巨大的利益空間——如果誰的網(wǎng)站或網(wǎng)面能夠排在搜索結(jié)果的前列,誰就有可能獲得最大的“廣而告之”效益而產(chǎn)生巨大利益。因而,許多“覺醒”過來的網(wǎng)站為了追逐這一利益空間而開始追求頁面瀏覽量(pageview)——打開一個頁面,卻可包含數(shù)個頁面元素,從而獲得眾多的點擊數(shù)(Hits)——點擊數(shù)則是“注意力經(jīng)濟”的一個重要指標(biāo)。
而到了這個地步,一度推動技術(shù)進步的“搜索引擎優(yōu)化”(SEO)已異化成“搜索引擎作弊工具”(英文簡稱“SEO SPAM”)。
從Google的“芙蓉姐姐”的搜索結(jié)果便可看到這一典型的作弊:在metatag中塞進成堆的關(guān)鍵字,或塞進跟自己的網(wǎng)站內(nèi)容無關(guān),但是非常流行的關(guān)鍵字———但當(dāng)你打開它時,它又迅速地跳轉(zhuǎn)入作弊網(wǎng)站設(shè)定的網(wǎng)頁頁面中。