如今信息科技的發展已經帶來了信息的爆炸式增長,每天都有數以億計的海量信息在互聯網中產生,大家想要從根牙磐錯的數據海洋裡找到想要的信息,搜索引擎無疑是最好的幫手。
過去二十餘年間,作為全球最大的搜索引擎,谷歌搜索更是許多人認知互聯網世界的橋樑。可如今這座大橋似乎變了。
01
近日,專注SEO(搜索引擎優化)的科技博客Vincent Schmalbach指出了一個讓人意外的變化,即谷歌不再試圖索引整個網絡,而是變得極具選擇性,並拒絕索引大多數內容。按照相關文章中作者的說法,谷歌搜索現在似乎是在“默認不索引”的基礎上運行,只有當搜索引擎察覺到真正的需求時,才會將內容包含在其索引中。
作者舉例到,在過去建立一個新的域名時,即使沒有外鏈,新域名也會在一個小時或更快的時間內被谷歌搜索索引。確實,在SEO這個概念興起之前,谷歌搜索對於內容如同饕餮般貪婪,一個新的博客、新的網站在建立之後很快就會被收錄。但隨著SEO的泛濫,谷歌與SEOer之間的貓鼠遊戲也來到了高潮,谷歌方面希望索引高質量內容以滿足用戶的需求,而SEOer則想要讓更多的網頁出現在谷歌搜索排名的前列,從而獲得更多廣告收入。
谷歌持續不斷更新搜索引擎的算法,以期在浩瀚的數據海洋裡篩選出有價值的內容,SEOer則一直在試圖破解谷歌搜索的“黑匣子”,找出算法中的秘密。鬥而不破無疑是谷歌和SEOer對抗的主旋律,雙方都在Google Search Console的框架下進行攻防。顯而易見,如果谷歌搜索真的開始進行選擇性索引,也不會是因為SEO。
需要注意的是,谷歌搜索發生如此劇烈的變動,暫時沒有得到官方的確認。不過,谷歌搜索確實在2019年8月出現了無法對網絡上的新內容進行索引,彼時谷歌給出的解釋是BUG,所以不排除這次谷歌搜索又出現了BUG。並且谷歌一直在持續性地審查內容索引,以減少搜索中的無用內容,也導致會經常性地出現一些網站被取消索引的情況。
02
當然,絕大多數SEOer相信這一次谷歌搜索變得極具選擇性、拒絕索引大多數內容不是BUG,因為2019年的互聯網環境與今天有著巨大的區別,那就是AIGC已經橫空出世。以ChatGPT為代表的AIGC技術率先在圖文領域實現了突破,在多模態大語言模型的加持下,AI生成的內容與人創作的內容之間變得已經越來越難以分辨。
在2022年之前,AI繪畫的特徵是“不會畫手部”,彼時相當多畫師以此為依據相信AI對於繪畫的衝擊不過是幻想,但隨著Midjourney V5的出現,AI繪畫工具已經在細節上毫無瑕疵,隨後發生的事情就是遊戲美術、約稿畫師大面積失業。既然繪畫都已然被AI重塑,就更遑論文字了。
從ChatGPT到文心一言、從Gemini到Kimi,AI大模型輸出的文字可能缺乏文采、也談不上個人風格,但絕對語句通順、且有邏輯性。
簡單來說,由Kimi、GPT-4生成的文章或許無法讓人感受到文字的美感和力量,也缺乏“人味”,但已經有了閱讀的價值。要不然Character.AI等專注虛擬角色扮演的產品,如今不可能風靡全球,科學家也不會使用AI來處理數據、編寫代碼,並幫助他們撰寫論文了。
03
那麼問題就來了,AI只是工具,有的人用它讓世界更美好,自然就會有人用它來作惡。
早在AIGC技術出現之前,基於自動化腳本的內容農場(Content Farm)、社交機器人(Social media bots)就已經在互聯網上氾濫了。只不過當時由於技術方面的限制,在行文、邏輯上還存在硬傷,一般人一眼就能看出不對,比如“XX到底是怎麼回事呢?XX相信大家都很震驚,下面就讓小編帶大家一起了解吧。”
早前,內容農場的腳本只能做到簡單的內容拼接重組,相比人類創作者凝聚了智慧火花的文字顯得呆板而無趣。從腳本到AI大模型,機器編輯圖文的能力就出現了質的飛躍。這時候有“聰明”的SEOer發現,“內容為王”有另外一種實現途徑,因此用AIGC生成內容就成了自2023年以來網站站長圈子裡的潮流。
新聞網站評級公司NewsGuard在去年夏季出具的報告顯示,使用AI生成內容的假新聞網站正在呈指數級增長。某些SEOer批量建設由AI生成內容填充的網站顯然不是為了“圖一樂”,而是為了賺錢。基於谷歌親自建立的在線廣告網絡,SEOer只需在他們的網站頁面指定位置加入一段谷歌Adsense代碼、即可加入廣告聯盟,然後把網站的流量用廣告來變現。
沒錯,SEOer之所以要針對谷歌搜索進行優化,正是因為谷歌不僅掌握了流量分配的權力,還擁有流量變現的開關。AIGC之於SEOer就像是一個效率放大器,所以當然會有人前赴後繼地嘗試用AI生成的內容來博得谷歌搜索的青睞。然而遺憾的是,即便當下的AIGC在生成內容層面有了歷史性的進步,但相比於平均水平的內容創作者依然有所不足,而且在幻覺缺陷的影響下還會成為謠言製造機,因此也就有了“AI正在汙染互聯網”這樣的說法。
04
對此,國內的內容平臺,如微信、抖音、知乎、微博會要求創作者在創作時自主添加“內容由AI生成”的標籤。可創作者使用AI批量炮製內容就是為了賺流量錢,又怎麼會主動給內容打上“AI”標籤、從而導致內容被限流呢。海外市場的情況也大差不差,在識別AI生成內容的技術成熟前,谷歌搜索對於AI批量產出的內容也幾乎毫無辦法。
“一刀切”的做法固然有不合理之處,但對於谷歌搜索這樣一個具有壟斷性的互聯網基礎設施來說,除了推廣E-E-A-T(經驗、專業、權威、可信)體系、為知名網站提升權重,剩下的也就只能默認不索引新網頁了。所以谷歌可能是將當下所有新生成的網頁,都當作了AI生成的來對待。
原先谷歌搜索或許是黑名單機制,未來的谷歌搜索可能就要用白名單,但這對於新玩家來說可就一點都不友好了。
本文來自微信公眾號“三易生活”,作者:三易菌,36氪經授權發佈。





