名家專欄

百度的對手從來都不是OpenAI

2023/03/19 13:40

文 |

、元宇宙之心

文心一言千呼萬喚始出來，兩天內，百度股價先抑後揚，實現了一個大號V字反轉。

新聞發布會當天百度港股股價下跌後，隨着部分媒體和企業用戶陸續拿到內測邀請碼，文心一言真實的能力表現很快提振了資本市場對百度的信心。當晚美股开盤後，百度股價由跌轉漲，並在北京時間3月17日凌晨收盤後，實現了3.8%的漲幅。

反映到第二天港股市場上，截至17日午間，百度香港股價早間高开高走，大幅拉升，盤中漲幅最高近15%。

據了解申請文心一言API調用服務測試的企業已達7.6萬。

根據字母榜(ID:wujicaijing)實測，文心一言已經足以比肩ChatGPT（GPT-3.5），在中文理解上，甚至比後者略勝一籌。

在2022年四季度財報電話會上，李彥宏就曾提到，相比海外开發的大語言模型，文心一言的比較優勢在於更理解中國文化，更適合中文和中國市場。

而且，在多模態生成方面，GPT-4只是做到了能夠實現圖片輸入，輸出形式上仍只有文本一種形態。與之相比，文心一言已經能夠實現文本、圖片、音頻和視頻的全形態輸出，不過，據李彥宏介紹，由於生成視頻成本較高，暫時還無法做到對所有用戶开放。

在字母榜實際測試中，文心一言在完成對話的流暢度上也要好於ChatGPT。當然，造成這種體驗差異的原因之一，或許也在於文心一言才剛剛上线，還不像ChatGPT已經歷了上线半年的反饋調教。

根據官方公告，文心一言目前採用分批开放方案：3月16日起，獲得邀請測試碼的首批用戶，即可在文心一言官網體驗產品，其他C端用戶排隊預約，即可陸續體驗；企業客戶則可以訪問百度智能雲官網進行申請，排隊體驗文心一言API調用服務。

值得注意的是，相比微軟新必應對每日對話次數，以及每次對話輪次的限制，文心一言告訴字母榜，作爲一個人工智能語言模型，它沒有每天的對話限制。

如同GPT-4“考慮到大模型的競爭格局和安全隱患”而不再對外公布用了什么數據、怎樣訓練模型等核心機密問題之外，字母榜還在測試中發現，文心一言同樣有所保留，在問到“你每次回答最多可以輸出多少文字？”時，文心一言表示，“該問題涉及百度公司商業祕密，我不能回答每次回答最多可以輸出多少文字。”

與之對比，ChatGPT的回答被限制在約3000個單詞，GPT-4可以做出超過2.5萬個單詞的回答。

但無論是ChatGPT、GPT-4還是文心一言，目前都仍處在不斷完善的過程中，正如李彥宏所言，它們都仍有“胡說八道”的一面。

如文心一言，目前對英文語種、代碼場景的訓練還不夠多，表現還不夠好。“它們有時候會有很驚豔的表現，但不少場景下，細究起來還有明顯的bug，進步空間很大。”李彥宏說道。

這或許也是百度希望盡快將文心一言推向市場的原因之一，只有借助更大範圍內的真實人類反饋，文心一言才能獲得更高頻的進步迭代速度。

尤其在國內用戶尚無法注冊 ChatGPT的現實背景下，百度面對的競爭對手，除了OpenAI外，更大的壓力還在於同樣盯着AI大模型產品的一衆國內科技大廠。

ChatGPT的橫空出世，標志着互聯網產業的競爭重點將從應用層面進入模型層面。百度搶先發布文心一言，意味着百度在必定日趨激烈的大模型競爭中佔據了先發優勢。

在李彥宏現場演示的五個視頻中，文心一言通過“總結《三體》的核心內容”“續寫《三體》”“判斷於和偉和張魯一誰更高”等系列問題，展現出了總結、分析、內容創作生成和推理能力。

此外，文心一言還可以幫助公司起名字、想公司Slogan，撰寫公司新聞稿等，對於雞兔同籠這類考驗邏輯思維的數學題，也不在話下，按李彥宏的說法，“（文心一言）很像小學生的水平了。”

更讓人驚豔的則是文心一言在中文理解上的表現，如對“洛陽紙貴”的解釋，用“洛陽紙貴”寫一首“藏頭詩”，這都是ChatGPT無法做到的能力。

爲了驗證文心一言是否真的有李彥宏演示的那般強大，字母榜特意找來了曾令ChatGPT頭疼不已的部分問題，打算上手考考它。

第一題：小明的媽媽有四個孩子，其中三個分別是大熊、二熊和三熊，那么第四個孩子叫什么？

文心一言的回答是：小明的媽媽有四個孩子，其中三個分別是大熊、二熊和三熊。因此，第四個孩子叫做小明。

看來文心一言是懂腦筋急轉彎的。

再來第二題：小明騎自行車，一把把把把住了。這句話怎么理解？

文心一言的回答是：這句話的意思是小明在騎自行車時，一只手握住了車把手。這可能是因爲他需要控制自行車的速度或方向，或者是爲了保持平衡。也有可能是因爲他想要保護自己不受傷害。總之，這句話描述了小明採取的一種行動或姿勢來控制自行車的運動狀態。

理解多音多義字上，文心一言也過關了。

對於演示中沒有展現的編寫代碼、生成表格等能力，字母榜經測試發現，文心一言也具備對應實力。

不過，就像進入內測界面後給出的友情提示所說，其擅長中文，也會英文，其他語言正在學習的文心一言，盡管能夠生成方言，但目前還僅限於四川話、東北話、廣東話和台灣話。

同時，如OpenAI CEO山姆·阿爾特曼評價GPT-4仍有缺陷、存在限制，並在熟悉之後可能不會像初見時那樣驚豔一樣，文心一言稍不留神也會產生幻覺、生成錯誤答案，並出現推理錯誤。

作爲一款對標ChatGPT的產品，據百度CTO王海峰介紹，新一代知識增強大語言模型——文心一言，是在ERNIE及PLATO系列模型的基礎上研發而來，背後包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強等六大關鍵技術。

“前三項是這類大語言模型都會採用的技術，ERNIE和PLATO中也已經有應用和積累，在文心一言中又有了進一步強化和打磨；後三項則是百度已有技術優勢的再創新，也是文心一言未來越來越強大的基礎。”

如通過知識增強，大語言模型可以在調用更少參數的基礎上，達到效率更高、效果更好的目標；檢索增強，則保證了文心一言可以回答時下新近發生的事情。與之對比，GPT-4通常缺乏對其絕大部分數據截止後（2021年9月）發生的事件的了解，也暫不具備從其經驗中學習的能力。

面對與GPT-4之間存在的差距，留給百度的挑战在於，如何通過更高頻的產品迭代和應用創新，實現後來居上式的反超。

這種經歷對百度並不陌生。在搜索時代，百度就曾靠着上述策略實現了對谷歌的趕超，並一舉奪下國內搜索市場最大份額。

2018年8月，當外界傳出谷歌將重返中國市場，並計劃在未來6個月到9個月內在中國推出一個審查版的搜索引擎蜻蜓（Dragonfly）時，李彥宏顯得頗有些激動，曾發朋友圈表示：“這些年來，百度一直被認爲是佔了谷歌退出中國的便宜。我們無法證明一件沒有發生的事情……百度是後來者居上，通過技術和產品創新反超谷歌。到2010年，谷歌在市場份額持續下降的情況下退出中國時，百度的市場份額已經超過70%。如果現在谷歌回來，我們正好可以真刀真槍地再PK一次，再贏一次。”

現在，同樣跌落到跟隨者象限的谷歌和百度，都需要直面來自ChatGPT的挑战。

稍有不同的是，這次百度搶先谷歌，成爲全球科技大廠中第一個做出並對外發布類ChatGPT產品的公司。

正如谷歌雲CEO托馬斯·庫裏安所說：“我會告訴你這是一個新遊戲的第一分鐘，而遊戲從來沒有人能在一分鐘內完成。”

在方興未艾的生成式AI時代，百度尚有機會借助後續的產品更迭實現對領跑者OpenAI追趕。

據鈦媒體報道，文心一言很快將在四五月份迎來下一個版本或者新功能的發布，後續將以月或雙月的頻率展示文心一言新功能或新版本。

過去近三十年互聯網發展歷史中，中國科技公司正是靠着“小步快跑、快速迭代”的方法論，在應用創新上實現了對美國同類公司從模仿再到超越的過程。

面對眼下這場新的AGI競賽，環顧國內科技公司，百度最有可能在AI領域追趕乃至超越國外同行。在等來這個战略機遇之前，百度已經在AI領域堅守十年。

正如李彥宏所說：“無論是哪家公司，都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理，需要多年的堅持和積累，沒法速成。”

在2013年成立中國第一個深度學習研究院後，百度此後十年間向AI累計投入超1000億元資金，成爲中國大型科技互聯網企業中研發投入比例最高的公司之一，並相繼研發出首個國產深度學習框架飛槳，成爲國內至今唯一能與國際兩大主流框架 TensorFlow和PyTorch正面交鋒的深度學習框架，和百億參數中英雙語大模型PLATO-X、千億參數大模型“百度·文心”，以及知識增強大模型Ernie等等。

灼識咨詢曾在一份報告中將百度列入中國AI領導地位，除了深度學習框架飛槳居中國深度學習框架榜首外，還因爲百度不僅擁有中國最多的AI專利數量以及AI專利申請數量，還凝聚了中國最多的开發者，成爲中國最大的开放式AI平台。

國盛證券在ChatGPT產品報告中指出，這是一項屬於具備雲服務能力的大廠遊戲。

借助百度智能雲國內TOP4的頭部陣營地位，百度恰恰成爲登上牌桌的爲數不多參與者之一。更重要的是，百度借助芯片層的昆侖AI芯片，框架層的飛槳深度學習框架，模型層的文心大模型，以及應用層的搜索、自動駕駛、智能家居等產品，成爲全球範圍內寥寥無幾擁有全棧自研能力的AI公司之一。

消費互聯網用戶增長趨緩，且各家核心App基本觸達月活天花板後，中國科技大廠都在高喊着向產業互聯網轉型，开始在數字化、智能化浪潮中掘金。

一場圍繞大模型的新競賽在過去兩年間悄然打響。IDC發布的《2022中國大模型發展白皮書》顯示，自2020年起，中國的大模型數量驟增，僅2020年到2021年，中國大模型數量就從2個增至21個，和美國量級同等，大幅領先於其他國家。

除了百度文心大模型在市場格局中處於第一梯隊外，2021年4月，一衆科技大廠繼百度之後集中公开了各自的大模型產品，華爲公布了千億級參數規模的盤古大模型，阿裏巴巴達摩院發布了被稱爲中文版“GPT-3”的語言大模型PLUG，並在此基礎上於2022年9月推出通義大模型系列。晚到一步的騰訊，於2022年4月，對外披露了混元大模型。

與文心大模型相比，上述大模型在功能上基本類似，如都具備文生圖、文本轉視頻、自動生成文案等。

基於百度文心大模型的AI 藝術創作展示，用戶輸入文字，AI就能根據語意進行繪畫創作。

而且，這些科技大廠同樣在內部籌劃類ChatGPT產品。在百度爆出即將發布文心一言消息後，進入2月份，華爲對外表示在類似ChatGPT方向上從2020年开始就在布局；阿裏巴巴則透露阿裏版聊天機器人ChatGPT正在研發中，已處於內測階段；騰訊則被爆出針對類ChatGPT產品已成立混元助手項目組，聯合騰訊內部多方團隊構建大參數語言模型，希望“成爲國內的業界標杆”。

暫時尚未亮相大模型的字節跳動，也在近期被媒體報道稱在大模型上已有所布局，分別在語言和圖像兩種模態上發力，其中語言大模型團隊在今年正式組建，探索與搜索、廣告等下遊業務的結合，有望趕在今年年中推出大模型方案。

正在追趕OpenAI，乃至計劃超越前者的不止百度一家。這將是一場圍繞技術和速度的雙重賽跑。誰先上线產品，誰就有可能借助來自用戶的真實反饋掌握先機，從而隨着時間推移形成愈來愈強的馬太效應。

這也就不難理解李彥宏爲何在2月初給文心一言項目下了“三月完成內測上市”的死命令。

來自微軟的一組數據更能直觀感受生成式AI產品迭代的速度之快：從GPT到GPT-3，背後參數量從1.17億飆升到了1750億，增長近1500倍。

“大語言模型是個馬太效應非常明顯的行業，可以說如果落後18個月，就基本沒機會了，因爲先一步發布的產品已經迭代得非常先進了。”李彥宏如此感嘆。

這場GPT爭奪战中，時間就是生命，效率就是金錢。

來源：元宇宙之心

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標題：百度的對手從來都不是OpenAI

地址：https://www.torrentbusiness.com/article/28685.html

標籤：

百度的對手從來都不是OpenAI

你可能感興趣

一文讀懂AI智能體代幣化平台Virtuals Protocol

AI 的暴力美學 Arweave 的抗衡之道

鄧建鵬李鋮瑜：加密資產交易平台權力異化及其規制進路

一個跨越三輪周期的價投老VC面對這輪meme焦慮嗎？

BTC已近95000 再看幣圈微笑曲线

特朗普的移民政策會適得其反？

熱門文章

最新文章

百度的對手 從來都不是OpenAI

你可能感興趣

一文讀懂AI智能體代幣化平台Virtuals Protocol

AI 的暴力美學 Arweave 的抗衡之道

鄧建鵬 李鋮瑜：加密資產交易平台權力異化及其規制進路

一個跨越三輪周期的價投老VC面對這輪meme焦慮嗎？

BTC已近95000 再看幣圈微笑曲线

特朗普的移民政策會適得其反？

熱門文章

最新文章

百度的對手從來都不是OpenAI

鄧建鵬李鋮瑜：加密資產交易平台權力異化及其規制進路