想象一下,當你遇到問題時,有一個可以與你交談的搜索機器人,它可以讓你更容易找到答案(如果它不撒謊的話),這是多么方便的一件事。微軟、谷歌、百度和其他公司都在致力於此。
JIANG CHEN(陳江,音譯),一位曾在谷歌工作過的機器學習專家,當他第一次嘗試 ChatGPT 時就被迷住了,這個來自 OpenAI 的聊天機器人使用起來非常連貫,看起來信息量很大,如今已經成爲互聯網上的一個熱點。
但是,當陳試圖使用同樣的底層人工智能技術,爲他聯合創辦的初創公司 Moveworks 構建更好的搜索工具時,這項技術的影響力光環开始顯得暗淡了。Moveworks 使用人工智能來幫助員工篩選信息,如技術支持文件和人力資源頁面。陳的新人工智能搜索工具在從這些文件中提取各種有用信息方面做得很好,包括提供地址和電話號碼,但其中一些不是真的。“它的編造能力實在令人驚嘆。”陳說。
人們對 ChatGPT 的狂熱興奮,以及普遍認爲它可以重塑搜索引擎的說法是可以理解的。該聊天機器人可以通過綜合從網絡和其他來源抓取的數十億字節中的信息來訓練算法,爲問題提供復雜而精密的答案。ChatGPT 可以讓人體驗到一種更流暢的與機器互動的方式。
但這項技術的工作方式在某些方面與可靠檢索在线信息的搜索引擎的理念有着根本的不一致。網絡上已經有很多不准確的信息了,而 ChatGPT 也很容易產生新的虛假信息。它的底層算法並不直接從事實或鏈接數據庫中提取信息,而是生成一串單詞,目的是在統計上與訓練數據中的單詞相似,而不考慮真相。
盡管面臨着這樣的挑战,也許是受到 ChatGPT 令人眼花繚亂的演示的影響,網絡搜索巨頭和幾家初創公司也都正在迎頭趕上。微軟已經向 ChatGPT 的創造者 OpenAI 投資了大約 100 億美元,微軟也正在以某種方式將這種基礎技術添加到其排名第二的搜索引擎必應(Bing)中。
據報道,谷歌公司一段時間以來一直在开發類似的聊天機器人 LaMDA,該公司也在匆忙之中對 ChatGPT 做出了回應——發布了 ChatGPT 的競爭者 Bard。中國領先的搜索引擎百度也正在开發一款類似 ChatGPT 的中文機器人。
在科技巨頭們准備應對 ChatGPT 的同時,幾家初創公司已經推出了帶有類似聊天機器人聊天界面的搜索引擎。其中包括 You.com、Perplexity AI 以及 Neeva。
他們开發的工具說明了將 ChatGPT 式的技術應用於搜索的潛力和挑战。由語言和人工智能專家理查德·索切爾(Richard Socher)創立的 You.com 可以通過聊天界面提供答案。而且這些回答還帶有引文,可以幫助用戶追蹤某條信息的來源。
但該模型有時會將不屬於同一來源的信息結合起來。例如,詢問一個人的信息,可能會得到一個結合了多個同名同姓人員的履歷信息的答案。比如當被問及我的個人情況時,You Chat 准確地描述了我在《連线》雜志的職位,但也認爲我是特拉華大學的一名橄欖球隊跑衛和一名專業的創意人員。常規搜索可能會返回幾個威爾·耐特斯(Will Knights)的介紹頁面,而聊天機器人會將它們合並爲一個人。
像 ChatGPT 這樣的系統的另一個問題是,它的回答僅基於所訓練的數據。由於模型的規模和數據的規模,對整個模型進行再訓練可能要花費數百萬美元。當被問及最新的體育比分時,YouChat 會感到困惑,但卻知道紐約此刻的天氣如何。創立 You.com 的索切爾不想透露最新信息是如何被整合進來的,他認爲這是一種競爭優勢。
索切爾說:“我認爲現在很多聊天界面在某些方面比搜索體驗要好得多,但在其他方面顯然還差得多。我們正在努力減少所有這些問題。”
搜索初創公司 Perplexity AI 的創始人兼首席執行官阿拉溫德·斯裏尼瓦斯(Aravind Srinivas)曾在 OpenAI 工作過,他表示,用最新信息更新一個類似 ChatGPT 的系統所面臨的挑战,意味着它們需要與其他東西結合起來使用。他說:“單靠它們,永遠不可能成爲優秀的搜索引擎。”
Greylock Partners 的風險投資人山姆·莫塔梅迪(Saam Motamedi)投資了人工智能搜索公司 Neeva,他表示,目前還不清楚聊天式搜索界面的主要收入模式,其廣告的兼容性如何。谷歌和必應利用搜索查詢來植入廣告,這些廣告出現在返回鏈接列表的頂部。莫塔梅迪懷疑,爲了讓聊天式搜索界面變得可行,可能需要出現新的廣告形式,但目前還不清楚這些形式會是什么。而目前 Neeva 對無限制無廣告搜索收取訂閱費。
以谷歌的規模運行 ChatGPT 這樣的模型,其成本也可能被證明是個問題。OctoML 是一家幫助企業降低部署機器學習算法成本的公司,其聯合創始人兼首席執行官路易斯·塞茲(Luis Ceze)估計,運行 ChatGPT 搜索的成本可能是谷歌搜索的 10 倍,因爲每個答案都需要運行一個龐大而復雜的 AI 模型。
眼下這股“ChatGPT 狂熱”的規模讓一些熟悉這種底層技術的程序員和人工智能研究人員都感到十分意外。該機器人的核心算法名爲 GPT,由 OpenAI 於 2018 年首次开發,更強大的版本 GPT-2 於 2019 年發布。這是一種機器學習模型,旨在接收文本,然後預測接下來的內容,OpenAI 表明,如果使用大量文本進行訓練,該模型的表現會非常好。自 2020 年 6 月以來,該技術的第一個商業版本 GPT-3 已供开發人員使用,可以完成 ChatGPT 最近受到贊賞的許多事情。
ChatGPT 使用了底層算法的改進版本,但其能力的最大飛躍來自於 OpenAI 讓人類向系統提供反饋,告訴系統什么是令人滿意的答案。但就像之前的文本生成系統一樣,ChatGPT 仍然傾向於從訓練數據中重現偏見,以及“編造”看似合理但不正確的結果。
紐約大學(New York University)名譽教授加裏•馬庫斯(Gary Marcus)直言不諱地批評人工智能炒作,他認爲 ChatGPT 不適合搜索,因爲它對自己所說的內容沒有真正理解。他補充說,像 ChatGPT 這樣的工具可能會給搜索公司帶來其他問題,因爲它們會讓互聯網充斥着人工智能生成的、搜索引擎優化的文本。“所有的搜索引擎都會遇到問題,”他說。
亞歷克斯•拉特納(Alex Ratner)是華盛頓大學(University of Washington)的助理教授,也是致力於更有效地訓練人工智能模型的 Snorkel AI 公司聯合創始人,他稱 ChatGPT 標志着軟件所能做的事的“合理拐點”。但他也表示,要想弄清楚如何防止像 GPT 這樣的語言模型胡編亂造,可能還需要一段時間。他認爲,要想找到一種方法讓這些語言模型與新信息保持同步,以保持搜索的實時性,很可能需要採用新的方法來訓練底層人工智能模型。
這些解決方案需要多長時間才能發明出來並得到驗證,目前尚不清楚。即使有其他用例出現,比如將其作爲學習或編程夥伴,這項技術也可能還需要一段時間才能從根本上改變人們搜索答案的方式。Moveworks 公司的陳說:“這很了不起,我告訴團隊,人們會看到 ChatGPT 帶來的跨時代的變化,甚至會出現 pre-ChatGPT 和 post- ChatGPT 的說法。但它是否會取代搜索,則是另一個問題。”
來源:元宇宙之心
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:ChatGPT真能取代搜索引擎嗎
地址:https://www.torrentbusiness.com/article/24236.html
標籤: