“百模”爭舸：群雄逐鹿的野心和背后的冷思考當前頭條

2023-06-02 14:46:21 |來源:21世紀經濟報道

21世紀經濟報道記者蔡姝越杭州報道

在生成式AI的大浪潮下，各路AI大模型已然形成群雄逐鹿的局面。

(資料圖)

今年以來，百度、阿里、華為、京東、360、網易等國內互聯網廠商，爭相公布了旗下的大模型布局。在眾多廠商展開大模型“軍備競賽”，并紛紛落地應用之時，有哪些技術熱點值得深入關注？國內大模型的未來發展趨勢如何？

5月31日，依托中國人工智能產業發展聯盟、人工智能關鍵技術和應用評測工信部重點實驗室，由中國信通院聯合人工智能工程化推進委員會大模型工作組、生成式人工智能工作組主辦的“大模型技術應用”分論壇，于5月31日在杭州夢想小鎮互聯網村正式舉辦。

論壇中，多位產學界人士對目前國內大模型的現狀進行了分析，聚焦大模型、生成式AI、對話式AI、知識計算、智能決策等多個熱點技術，深入探討相關技術、產品、生態等發展趨勢。

高速發展下的新機遇

“百模”大戰揭開帷幕，各領域AI大模型先后發布。大模型正從效率、質量、個性化等方面為內容生產帶來改革，不斷解放生產力。

其中，“涌現性”是生成式AI大模型的一大關鍵優勢。“原本訓練AI，可能需要人類‘手把手’去教學，機器才能學會某項技能。但在當下的發展階段，在不與AI交互的前提下，這項技術也能夠進行自主學習。AI技術所具備的‘涌現性’，也是它的一項突破性進展。”聲智科技數智人產品副總裁黃赟賀在發言中指出。

據悉，目前AI大模型的架構主要分為兩種，一種是Decoder-only（僅解碼器），這一類架構的優勢在于可以更容易完成文本生成任務，主流大模型如OpenAI開發的GPT系列、英偉達開發的Megatron-LM等均是采用此架構。另一種架構是Eecoder-Decoder（編碼器-解碼器），該架構可以更靈活地適應不同長度和不同類型的輸入和輸出序列，從而適應多種自然語言處理任務，谷歌研發的T5模型便屬于此架構。

阿里達摩院機器智能技術創新業務中心負責人陳海青指出，許多大模型利用Decoder-only架構訓練效率高的優勢，使得底層數據量能夠迅速擴展到龐大的規模。

以GPT為代表的大模型在近年來的快速演進和迭代，成為了該領域火熱發展的縮影。在GPT1到GPT3的發展過程中，底層數據量從1億飆升至萬億級別。“該模型每年平均有10倍的參數量變化，也成為了智能時代的‘摩爾定律’。”他說。

“大模型加速了通用人工智能時代的到來。而行業級大模型以及應用，其實是一個非常好的創業機會點。”百應科技技術負責人吳凱表示。他認為，一家科技型企業，技術和產品始終是企業的生命線，這就需要持續學習、不斷加強人工智能的技術深挖。

因此，當一項新技術誕生并高速發展時，能否快速學習并深度應用，對于眾多科技企業而言是一個“優勝劣汰”的過程。

拓爾思副總裁尹世杰指出，垂直場景落地正成為“百模大戰”核心角力點。在垂直領域，模型基座、高質量數據、專業領域Know-How、真實場景閉環及用戶反饋，是專業大模型成功的5大要素。

“百模”大戰下的冷思考

“在我制定（今天的）演講題目時，‘百模大戰’的說法便已興起。不難發現，在這過去的半年內，大模型領域的發展非常火熱。但是我有一個問題要問一下在座的各位，這樣的繁榮能夠持續多久？”

在發言開頭，拓爾思副總裁尹世杰便拋出了這樣一個問題。

21世紀經濟報道記者發現，在本次論壇中，與會嘉賓除了對國內大模型發展未來的作出展望，也分享了大模型在研發、升級過程中可能遇到的難點與迷思。

陳海青提到，雖然Decoder-only是多個主流大模型所采用的架構，但在進行訓練的過程中，是對大量的未標注文本數據進行無監督預訓練，因此較難找到高質量的數據，包括代碼、人類的指令和反饋等等。

簡言之，這類架構存在穩定性能的“先天不足”。因此，在ChatGPT正式發布之前，業內更偏向走Eecoder-Decoder路線。

此外，若定制大模型在專業領域中沒有足夠的切入度，也會失去實際應用的意義。尹世杰指出，若要做某個專業領域的大模型，就必須有專業領域的高手（參與研發）。以傳媒、金融、安全領域的大模型為例，如果僅是套用泛化的、通用的功能，很有可能難以回答以上行業實際操作中遇到的專業問題。

除了訓練因素，目前留給企業研發大模型的紅利期和窗口期并不長，則是大模型發展面臨的一大外部難點。黃赟賀便在發言中提到，目前B端客戶（企業）最關心的點在于，在委托相關公司開發大模型后，需要多久才能夠真正投入使用。“作為服務提供方，我們目前一般將大模型的交付周期控制在3個月，以求在短時間內進行交付，讓企業快速體驗和使用大模型。”

尹世杰也指出，無論是做toB或toC的大模型業務，能不能有實際的場景落地，以及落地以后能否給用戶帶來真實的價值，才是大模型發展過程中最關鍵的考驗。

關鍵詞：

標簽閱讀

“百模”爭舸：群雄逐鹿的野心和背后的冷思考當前頭條

2023-06-02
快播：圣象集團鄭州新設晟安廣茂家居，注冊資本200萬元

2023-06-02
美國債務談判樂觀現貨黃金窄幅震蕩

2023-06-02
華晨寶馬、寶馬中國召回部分國產及進口寶馬電動汽車

2023-06-02
美國經濟數據好壞參半金價震蕩上行

2023-06-02
每日速看!市場將聚焦非農就業報告金價短期看漲不變

2023-06-02
安全感滿滿！濟南街頭上演“公主抱”天花板，閆雷，好樣的！...

2023-06-02
輕創業的又一個風口：直播電商“全托管”，你“AI”了嗎？_每...

2023-06-02
環球即時看！“上火”了怎么辦？虛火和實火有什么區別？降錯...

2023-06-02
天天要聞：不同位置的頭痛，其誘發的疾病或也不同，不妨對照看看

2023-06-02
益生菌吃不對等于白吃！這 4 大誤區必須了解

2023-06-02
網貸無力償還怎么辦理停息掛賬？申請延期還款被拒怎么辦？

2023-06-02
老公借網貸的錢還不上老婆要還嗎？網貸無力還的解決辦法有哪些？

2023-06-02
網貸沒逾期還可以借其它網貸嗎？網貸無力還可以不還嗎？

2023-06-02
網貸非常多但是沒逾期過影響信用嗎？網貸逾期會有什么后果？

2023-06-02
逾期上門催收的流程是什么？網貸逾期被催收了怎么辦？

2023-06-02
逾期本地第三方上門是真的嗎？網貸逾期能協商還款嗎？

2023-06-02
晉城到鄭州客運中心站多長時間_從晉城到鄭州坐汽車多長時間

2023-06-02
讓科技向實而生，讓產業智變發生

2023-06-02
生來如此_關于生來如此介紹

2023-06-02

“百模”爭舸：群雄逐鹿的野心和背后的冷思考當前頭條

高速發展下的新機遇

“百模”大戰下的冷思考

標簽閱讀