谷歌搜索不再索引新網頁？罪魁禍首非ChatGPT莫屬

07-25

如今信息科技的發展已經帶來了信息的爆炸式增長，每天都有數以億計的海量信息在互聯網中產生，大家想要從根牙磐錯的數據海洋裡找到想要的信息，搜索引擎無疑是最好的幫手。

過去二十餘年間，作為全球最大的搜索引擎，谷歌搜索更是許多人認知互聯網世界的橋樑。可如今這座大橋似乎變了。

01

近日，專注SEO（搜索引擎優化）的科技博客Vincent Schmalbach指出了一個讓人意外的變化，即谷歌不再試圖索引整個網絡，而是變得極具選擇性，並拒絕索引大多數內容。按照相關文章中作者的說法，谷歌搜索現在似乎是在“默認不索引”的基礎上運行，只有當搜索引擎察覺到真正的需求時，才會將內容包含在其索引中。

作者舉例到，在過去建立一個新的域名時，即使沒有外鏈，新域名也會在一個小時或更快的時間內被谷歌搜索索引。確實，在SEO這個概念興起之前，谷歌搜索對於內容如同饕餮般貪婪，一個新的博客、新的網站在建立之後很快就會被收錄。但隨著SEO的泛濫，谷歌與SEOer之間的貓鼠遊戲也來到了高潮，谷歌方面希望索引高質量內容以滿足用戶的需求，而SEOer則想要讓更多的網頁出現在谷歌搜索排名的前列，從而獲得更多廣告收入。

谷歌持續不斷更新搜索引擎的算法，以期在浩瀚的數據海洋裡篩選出有價值的內容，SEOer則一直在試圖破解谷歌搜索的“黑匣子”，找出算法中的秘密。鬥而不破無疑是谷歌和SEOer對抗的主旋律，雙方都在Google Search Console的框架下進行攻防。顯而易見，如果谷歌搜索真的開始進行選擇性索引，也不會是因為SEO。

需要注意的是，谷歌搜索發生如此劇烈的變動，暫時沒有得到官方的確認。不過，谷歌搜索確實在2019年8月出現了無法對網絡上的新內容進行索引，彼時谷歌給出的解釋是BUG，所以不排除這次谷歌搜索又出現了BUG。並且谷歌一直在持續性地審查內容索引，以減少搜索中的無用內容，也導致會經常性地出現一些網站被取消索引的情況。

02

當然，絕大多數SEOer相信這一次谷歌搜索變得極具選擇性、拒絕索引大多數內容不是BUG，因為2019年的互聯網環境與今天有著巨大的區別，那就是AIGC已經橫空出世。以ChatGPT為代表的AIGC技術率先在圖文領域實現了突破，在多模態大語言模型的加持下，AI生成的內容與人創作的內容之間變得已經越來越難以分辨。

在2022年之前，AI繪畫的特徵是“不會畫手部”，彼時相當多畫師以此為依據相信AI對於繪畫的衝擊不過是幻想，但隨著Midjourney V5的出現，AI繪畫工具已經在細節上毫無瑕疵，隨後發生的事情就是遊戲美術、約稿畫師大面積失業。既然繪畫都已然被AI重塑，就更遑論文字了。

從ChatGPT到文心一言、從Gemini到Kimi，AI大模型輸出的文字可能缺乏文采、也談不上個人風格，但絕對語句通順、且有邏輯性。

簡單來說，由Kimi、GPT-4生成的文章或許無法讓人感受到文字的美感和力量，也缺乏“人味”，但已經有了閱讀的價值。要不然Character.AI等專注虛擬角色扮演的產品，如今不可能風靡全球，科學家也不會使用AI來處理數據、編寫代碼，並幫助他們撰寫論文了。

03

那麼問題就來了，AI只是工具，有的人用它讓世界更美好，自然就會有人用它來作惡。

早在AIGC技術出現之前，基於自動化腳本的內容農場（Content Farm）、社交機器人（Social media bots）就已經在互聯網上氾濫了。只不過當時由於技術方面的限制，在行文、邏輯上還存在硬傷，一般人一眼就能看出不對，比如“XX到底是怎麼回事呢？XX相信大家都很震驚，下面就讓小編帶大家一起了解吧。”

早前，內容農場的腳本只能做到簡單的內容拼接重組，相比人類創作者凝聚了智慧火花的文字顯得呆板而無趣。從腳本到AI大模型，機器編輯圖文的能力就出現了質的飛躍。這時候有“聰明”的SEOer發現，“內容為王”有另外一種實現途徑，因此用AIGC生成內容就成了自2023年以來網站站長圈子裡的潮流。

新聞網站評級公司NewsGuard在去年夏季出具的報告顯示，使用AI生成內容的假新聞網站正在呈指數級增長。某些SEOer批量建設由AI生成內容填充的網站顯然不是為了“圖一樂”，而是為了賺錢。基於谷歌親自建立的在線廣告網絡，SEOer只需在他們的網站頁面指定位置加入一段谷歌Adsense代碼、即可加入廣告聯盟，然後把網站的流量用廣告來變現。

沒錯，SEOer之所以要針對谷歌搜索進行優化，正是因為谷歌不僅掌握了流量分配的權力，還擁有流量變現的開關。AIGC之於SEOer就像是一個效率放大器，所以當然會有人前赴後繼地嘗試用AI生成的內容來博得谷歌搜索的青睞。然而遺憾的是，即便當下的AIGC在生成內容層面有了歷史性的進步，但相比於平均水平的內容創作者依然有所不足，而且在幻覺缺陷的影響下還會成為謠言製造機，因此也就有了“AI正在汙染互聯網”這樣的說法。

04

對此，國內的內容平臺，如微信、抖音、知乎、微博會要求創作者在創作時自主添加“內容由AI生成”的標籤。可創作者使用AI批量炮製內容就是為了賺流量錢，又怎麼會主動給內容打上“AI”標籤、從而導致內容被限流呢。海外市場的情況也大差不差，在識別AI生成內容的技術成熟前，谷歌搜索對於AI批量產出的內容也幾乎毫無辦法。

“一刀切”的做法固然有不合理之處，但對於谷歌搜索這樣一個具有壟斷性的互聯網基礎設施來說，除了推廣E-E-A-T(經驗、專業、權威、可信)體系、為知名網站提升權重，剩下的也就只能默認不索引新網頁了。所以谷歌可能是將當下所有新生成的網頁，都當作了AI生成的來對待。

原先谷歌搜索或許是黑名單機制，未來的谷歌搜索可能就要用白名單，但這對於新玩家來說可就一點都不友好了。

本文來自微信公眾號“三易生活”，作者：三易菌，36氪經授權發佈。

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論