第一經濟網歡迎您!
        當前位置:首頁>金融動態 > 正文內容

        “百模”爭舸:群雄逐鹿的野心和背后的冷思考 當前頭條

        21世紀經濟報道記者 蔡姝越 杭州報道

        在生成式AI的大浪潮下,各路AI大模型已然形成群雄逐鹿的局面。


        (資料圖)

        今年以來,百度、阿里、華為、京東、360、網易等國內互聯網廠商,爭相公布了旗下的大模型布局。在眾多廠商展開大模型“軍備競賽”,并紛紛落地應用之時,有哪些技術熱點值得深入關注?國內大模型的未來發展趨勢如何?

        5月31日,依托中國人工智能產業發展聯盟、人工智能關鍵技術和應用評測工信部重點實驗室,由中國信通院聯合人工智能工程化推進委員會大模型工作組、生成式人工智能工作組主辦的“大模型技術應用”分論壇,于5月31日在杭州夢想小鎮互聯網村正式舉辦。

        論壇中,多位產學界人士對目前國內大模型的現狀進行了分析,聚焦大模型、生成式AI、對話式AI、知識計算、智能決策等多個熱點技術,深入探討相關技術、產品、生態等發展趨勢。

        高速發展下的新機遇

        “百模”大戰揭開帷幕,各領域AI大模型先后發布。大模型正從效率、質量、個性化等方面為內容生產帶來改革,不斷解放生產力。

        其中,“涌現性”是生成式AI大模型的一大關鍵優勢。“原本訓練AI,可能需要人類‘手把手’去教學,機器才能學會某項技能。但在當下的發展階段,在不與AI交互的前提下,這項技術也能夠進行自主學習。AI技術所具備的‘涌現性’,也是它的一項突破性進展。”聲智科技數智人產品副總裁黃赟賀在發言中指出。

        據悉,目前AI大模型的架構主要分為兩種,一種是Decoder-only(僅解碼器),這一類架構的優勢在于可以更容易完成文本生成任務,主流大模型如OpenAI開發的GPT系列、英偉達開發的Megatron-LM等均是采用此架構。另一種架構是Eecoder-Decoder(編碼器-解碼器),該架構可以更靈活地適應不同長度和不同類型的輸入和輸出序列,從而適應多種自然語言處理任務,谷歌研發的T5模型便屬于此架構。

        阿里達摩院機器智能技術創新業務中心負責人陳海青指出,許多大模型利用Decoder-only架構訓練效率高的優勢,使得底層數據量能夠迅速擴展到龐大的規模。

        以GPT為代表的大模型在近年來的快速演進和迭代,成為了該領域火熱發展的縮影。在GPT1到GPT3的發展過程中,底層數據量從1億飆升至萬億級別。“該模型每年平均有10倍的參數量變化,也成為了智能時代的‘摩爾定律’。”他說。

        “大模型加速了通用人工智能時代的到來。而行業級大模型以及應用,其實是一個非常好的創業機會點。”百應科技技術負責人吳凱表示。他認為,一家科技型企業,技術和產品始終是企業的生命線,這就需要持續學習、不斷加強人工智能的技術深挖。

        因此,當一項新技術誕生并高速發展時,能否快速學習并深度應用,對于眾多科技企業而言是一個“優勝劣汰”的過程。

        拓爾思副總裁尹世杰指出,垂直場景落地正成為“百模大戰”核心角力點。在垂直領域,模型基座、高質量數據、專業領域Know-How、真實場景閉環及用戶反饋,是專業大模型成功的5大要素。

        “百模”大戰下的冷思考

        “在我制定(今天的)演講題目時,‘百模大戰’的說法便已興起。不難發現,在這過去的半年內,大模型領域的發展非常火熱。但是我有一個問題要問一下在座的各位,這樣的繁榮能夠持續多久?”

        在發言開頭,拓爾思副總裁尹世杰便拋出了這樣一個問題。

        21世紀經濟報道記者發現,在本次論壇中,與會嘉賓除了對國內大模型發展未來的作出展望,也分享了大模型在研發、升級過程中可能遇到的難點與迷思。

        陳海青提到,雖然Decoder-only是多個主流大模型所采用的架構,但在進行訓練的過程中,是對大量的未標注文本數據進行無監督預訓練,因此較難找到高質量的數據,包括代碼、人類的指令和反饋等等。

        簡言之,這類架構存在穩定性能的“先天不足”。因此,在ChatGPT正式發布之前,業內更偏向走Eecoder-Decoder路線。

        此外,若定制大模型在專業領域中沒有足夠的切入度,也會失去實際應用的意義。尹世杰指出,若要做某個專業領域的大模型,就必須有專業領域的高手(參與研發)。以傳媒、金融、安全領域的大模型為例,如果僅是套用泛化的、通用的功能,很有可能難以回答以上行業實際操作中遇到的專業問題。

        除了訓練因素,目前留給企業研發大模型的紅利期和窗口期并不長,則是大模型發展面臨的一大外部難點。黃赟賀便在發言中提到,目前B端客戶(企業)最關心的點在于,在委托相關公司開發大模型后,需要多久才能夠真正投入使用。“作為服務提供方,我們目前一般將大模型的交付周期控制在3個月,以求在短時間內進行交付,讓企業快速體驗和使用大模型。”

        尹世杰也指出,無論是做toB或toC的大模型業務,能不能有實際的場景落地,以及落地以后能否給用戶帶來真實的價值,才是大模型發展過程中最關鍵的考驗。

        關鍵詞:

        標簽閱讀


        亚洲永久网址在线观看| 国产成人综合亚洲亚洲国产第一页| 久久亚洲精品11p| 自拍日韩亚洲一区在线| 亚洲精品午夜久久久伊人| 婷婷亚洲综合五月天小说| 亚洲国产精品SSS在线观看AV| 日本亚洲国产一区二区三区| 国产亚洲成人久久| 伊人久久大香线蕉亚洲| 亚洲午夜久久久影院伊人| 亚洲精品无码不卡在线播HE| 中文字幕亚洲无线码| 国产亚洲综合网曝门系列| 亚洲国产精彩中文乱码AV| 亚洲成人在线电影| 91亚洲国产在人线播放午夜 | 久久久久久亚洲精品成人| 久久久久久久亚洲Av无码| 亚洲第一页在线观看| 亚洲人成在线播放| 亚洲综合av一区二区三区| 亚洲av无码专区在线观看亚| 国产成人亚洲午夜电影| 亚洲一区二区视频在线观看| 亚洲乱亚洲乱妇无码麻豆| 久久精品亚洲综合| 亚洲欧洲日本国产| 亚洲国产精品免费观看| 亚洲AV日韩AV一区二区三曲| 亚洲黄黄黄网站在线观看| 在线a亚洲v天堂网2019无码| 久久精品夜色国产亚洲av| 亚洲精品国产手机| 国产午夜亚洲精品| 国产精品亚洲二区在线| 亚洲中文字幕无码久久综合网| 久久亚洲免费视频| 亚洲午夜精品国产电影在线观看| 亚洲精品456人成在线| 大桥未久亚洲无av码在线|