AI發展卡關業者摸索新模式

2024/11/12 03:00

文 |

隨著用來訓練人工智慧（AI）的大型語言模型（LLM）進步速度變慢，OpenAI和其他AI業者正透過開發新的訓練方法，尋求克服AI模型發展瓶頸的方式，這可能重塑AI硬體的競爭版圖。

路透報導，ChatGPT問世後，科技業者不斷對外宣稱，透過更多數據和算力來「擴大」現有模型，定能持續改善模型。如今一些最傑出的AI科學家卻說，這個「大就是好」的觀點有其限制。

LLM每一輪的訓練都可能耗費數百萬美元，也較容易出現由硬體造成的故障，且研究人員要在可能長達數個月的訓練期結束後，才知道模型的最終效能。

另外，LLM需要大量數據，而目前的AI模型已用盡世上所有容易取得的數據。再者，訓練模型需要大量能源，各地電力短缺的情況，也使訓練受阻。

為克服這些困難，研究人員正探索一個能在推論階段，提升現有AI模型的方法，稱為「測試時運算」（test-time compute）。此方法讓AI模型能將更多力氣用在特定的困難任務上。

OpenAI已在其最新發表的模型「o1」中使用此方法。o1能用類似人類推理的方式，多步驟「思考」問題。知情人士表示，其他AI業者如Anthropic、xAI和Google DeepMind，也都開始發展這種方法的自家版本。

【美選熱話題】

▪ 2024美大選開票數據／6州變天翻轉關鍵搖擺州全被川普拿下
▪ 川普重返白宮！回顧美國近10任總統他們都曾創驚人紀錄
▪ 川普勝選關鍵「7大搖擺州」左右選情近3次開票結果比較
▪ 美總統怎選？5大QA看懂選舉人團制度致勝關鍵全靠「它」

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標題：AI發展卡關業者摸索新模式

地址：https://www.torrentbusiness.com/article/134227.html

AI發展卡關 業者摸索新模式