百度百科屏蔽他引擎抓取,AI搜尋挑戰傳統搜尋。
“屬於傳統搜索的時代,已經徹底落幕了。”
2024年2月,全球IT分析與評估機構Gartner在一份報告中如此判斷。同時該機構預測,到2026年,傳統搜尋引擎的搜尋量將減少25%。
同時,從最近公佈的財報來看,2024年Q2,百度的網路行銷收入為192億元,年減 2%。這是連續6個季度以來,在網路廣告大盤保持成長的情況下,百度網路行銷收入首次陷入下滑。
身為曾經國內廣告收入最高的網路公司,百度早已不復存在輝煌,但最近一則消息還是引發了市場對這家公司的重新關注。 8月22日,百度百科開始屏蔽Google/必應等大多數搜尋引擎的抓取,阻止他們利用百度百科內的內容來訓練AI。
面臨營收的下滑,百度禁用其他搜尋引擎對百度內容的抓取,意欲何為? AI搜尋能夠拯救百度嗎?面對抖音、小紅書等垂直搜尋的競爭,傳統搜尋巨頭未來的路在何方?
內容平台與搜尋引擎的“版權之爭”,由AI挑起
2024年3月,Google因違規使用出版商內容訓練大模型Gemini,被法國政府處以2.5億歐元的罰款。 7月23日,AI搜尋引擎Perplexity被雜誌巨擘康泰納仕集團告上法庭。類似的衝突也發生在中國,8月16日,知網發函警告AI搜尋新創公司秘塔科技,稱其未經許可在AI搜尋結果中呈現知網的學術內容,構成嚴重侵權。
細看以上因為AI搜尋帶來的糾紛,搜尋引擎與內容平台之間的衝突存在著共通性的問題:
1.內容平台只有內容的傳播權,沒有所有權
無論是文章還是視頻,版權都屬於原創作者,平台只有傳播權。因此,如果AI搜尋公司使用了相關內容進行AI訓練,應由內容作者親自維權,而不是平台。先前《紐約時報》起訴OpenAI就是最好的例子。
2.以索引庫的形式進行整合,構成侵權
目前的AI搜尋大多會將從內容平台抓取的內容以索引庫的形式進行儲存。當用戶搜尋時,再利用AI技術將即時結果和索引庫內容整合在一起提供答案。這種提前儲存的方式,侵犯了內容平台的資訊網路傳播權。
3.技術原因導致過擬合問題,構成侵權
在少數情況下,AI模型會因為訓練技術問題出現過擬合問題,導致輸出的結果內容和訓練內容高度相似,而這種照搬、「洗稿」的行為,實質上是從對AI對網站內容的合理使用變成了抄襲,同樣侵權。
從這三點出發,再回看百度這件事。百度百科作為一個百科全書形式的內容平台,既擁有部分百科全書詞條的版權所有權,也擁有相關內容的傳播權。因此,百度百科禁止Google、必應等引擎的抓取,既存在版權保護方面的合理性,也不失為AI搜尋時代的一種「自我保護」。
事實上,長期以來,內容平台的利益與搜尋引擎都是深度綁定的,搜尋引擎平台帶來流量入口,內容平台提供優質內容的同時透過廣告等方式獲利,已經成為某種「默契」。然而,隨著AI的興起,新產業的出現打破了舊有的秩序。用戶獲取資訊的來源從網站連結變成了AI引擎,內容網站的利益受到影響,因此才會產生矛盾與爭議。
搜尋產業「改朝換代」的背後,AI搜尋如何拯救百度?
谷歌CEO桑達爾·皮查伊曾表示,「搜尋引擎的目的從來都不是搜索,而是提供優質內容。」AI搜尋則恰好捕捉到了這個痛點:傳統搜尋有著較長的資訊獲取鏈路,而AI則代替人腦,省去了使用者在不同網站之間跳轉、分辨和總結的時間。
同樣的關鍵字,AI搜尋可以將影片、圖片、文字、語音等多樣化的內容呈現在觀眾面前,而不再單一地局限於網站這一種形式,搜尋結果更準確。此外,AI搜尋在廣告內容的呈現上也能為用戶帶去更好的體驗。傳統搜尋引擎中的競價排名嚴重影響了有效資訊的密度,進而影響到用戶的搜尋體驗。
正是由於以上優點,AI搜尋正在逐漸佔據傳統搜尋的市場份額。中信證券研報顯示,2024年3月AI產品的訪問量中,AI搜尋佔比達24.2%,成為第二大使用情境。從這個角度來看,在不遠的將來,AI搜尋取代傳統搜尋會是大勢所趨。
事實上,百度在限制其他搜尋引擎對百度百科的內容進行抓取的同時,自身也在不斷地加大對AI搜尋的投入。目前百度的文心大模型日均調用量超6億次,第二季百度搜尋中已有18%的結果由AI產生。
然而,百度AI對搜尋的影響仍處在早期階段,「短時間內不僅難以展現出對業績的提升,甚至可能對收入產生負面影響。」放眼整個產業,除了百度以外,其他人都在加快自己的步伐。
在國際市場有Google、微軟、OpenAI、Perplexity。在國內市場,不僅有360AI、秘塔AI和天工AI三大搜尋引擎,還有Kimi、文心一言、豆包等內嵌AI搜尋功能的聊天模型產品。
不難看出,在這一輪AI重構搜尋的產業熱潮中,在Google、微軟、百度等科技巨頭以外,還出現了許多的大模型企業。這意味著在原有的Google、必應、百度之外,業界又多出了許多「攪局者」。百度當前的壓力可想而知。
搜尋迎來 “終局之戰”,百度不能再慢了
從用戶的角度來講,AI搜尋的確存在市場需求,也確實能夠改善現有的搜尋體驗,但是無論是AI搜尋還是傳統搜尋引擎,本質上都是通用搜索,而通用搜尋本身正在弱化。
而根據國外數據機構statcounter數據,在PC端,百度的滲透率在最近的一年內出現了下滑。此前,百度已不再是中國第一大桌面搜尋引擎 這一消息就曾登上熱搜。
與之相對的,是抖音,小紅書,知乎一類的內容平台對搜尋的佈局。
2020年初,位元組跳動推出頭條搜索,用「搜尋+資訊流」的內容模式直接對標百度。此後三年間,位元組跳動陸續推出了悟空搜尋和閃電搜索,2024年8月,抖音搜尋獨立App上線,使用基於抖音打造的內容搜尋引擎,成為位元組旗下第4個獨立的搜尋應用程式。
此消彼長的原因,主要是公域的內容品質出現了下降,優質的內容逐漸被抖音,小紅書,知乎等內容App分走。用秘塔AI首席營運官王益為的話說,「衣食住行、買點什麼,這些優質數據小紅書和抖音並不會向外公開,而且都是大家主動貢獻上去的,我們拿不到,傳統搜尋引擎也拿不到。
以影片大模型為例,先前,快手和OpenAI都發布了影片大模型。如今,快手已有超過160萬人使用過快手的視頻生成大模型可靈AI,累計生成超1600萬條視頻,而OpenAI的Sora至今還沒有公佈下一步的進展,也沒有實現規模化的應用。在這背後,快手擁有大量的短影片內容,可以說是居功至偉。
從這個角度來看,AI搜尋真正的對手早已不再是傳統搜索,而是垂直搜尋。傳統搜尋引擎公司的對手也並非AI新創公司,而是抖音、小紅書之類的內容廠商。
對於Google、百度這樣的傳統巨頭來說,如何利用自己的AI優勢和垂直APP的內容優勢去競爭,會是下一個階段需要重點考慮的問題。哪些場景是有了AI才可能做到的?哪些功能更能夠滿足使用者的需求?這就考驗各大科技巨頭們產品經理的能力了。
寫在最後,AI搜尋也許還未成為規模,但是AI工具卻早已成為我們工作生活的重要組成部分。 AI工具付費首選虛擬信用卡,NIUNIUCard平台就是一個專門提供開通國際虛擬信用卡的平台,有興趣的朋友可以加客服TG(@bullbull1999)諮詢了解。