【環球快播報】榕匯對話:創業者如何擁抱AIGC熱潮?新的創業機會在哪里?
2022-12-14 14:42:37 |來源:IPO早知道
"下一代生產力工具。"
【資料圖】
本文為IPO早知道原創
作者|Stone Jin
據IPO早知道消息,高榕資本榕匯日前聯合聲動活潑共同發起線上研討會,4位來自通用人工智能、3D內容生產與消費一站式平臺、投資以及內容領域的嘉賓圍繞「生成式AI」的話題展開了一次對話。
以下節選部分對話內容:
>> 丁教:今年是AIGC紅得發紫的一年,包括AI作畫產品以及最近令人感到特別驚艷的ChatGPT。為什么是今天這樣一個時間點AIGC走進大眾視野,背后是怎樣的技術在驅動?
袁泉:實際上,幾年前行業就用一些機器學習的方法(例如GAN)去生成圖像。但當時一方面是效果所限,也沒有與今天最熱的文生圖聯系起來。
當下這一波的AIGC熱潮,主要由OpenAI的兩個原創技術驅動。首先是以DALLE為標志的Diffusion Model(擴散模型),以及衍生出來的Stability.ai和Midjourney等開源工具,極大地推動了文生圖的發展。
另一方面是文本生成模型GPT。2017年,OpenAI第一次把Transformer和大規模訓練系統結合起來做文本生成,實現了非常好的效果;近幾年GPT取得了非常大的進展。目前AIGC進入到成長期,AI生成圖、生成文字、生成代碼、生成音樂等都在快速發展,同時能夠輔助人做一些提升效率的工作。OpenAI的成功不是偶然的,我們總結為三個“555”: 5年時間、50個對AGI(通用人工智能)最有理解力的人、5億美元的算力。
未來,我認為AIGC最重要的是從單模態到多模態的進化,例如一個神經網絡同時生成圖像、文字、語音等等,這方面的技術今天也在大踏步地前進。因此我們相信,在一些與內容相關的創作領域里,開始會有AI輔助人、甚至不排除在一些環節取代人。
>> 丁教:元象的浩智過往在圖形學引擎與計算機視覺領域有豐富的經驗。從技術的角度看,為何今年AI作畫領域率先出現了現象級出圈的產品?
黃浩智:實際上AI作畫在研究層面已經進行了很多年。近期大家比較強烈感知到AI作畫已經達到了可用的狀態,甚至超過了某些初階畫師的水平,背后得益于圖形生成技術、自然語言處理模型兩個方面的迭代。所以AI作畫的進步是CV與NLP兩個子領域交叉帶來的結果。
圖像生成技術領域,此前GAN、Imagen AI等生成式模型,本質原理是已經有了一個圖像,經過深度學習神經網絡處理,生成另外一幅內容相似的圖像。今年備受關注的Stable Diffusion等模型,采用的是Diffusion Model(擴散模型)。擴散模型比較特別的是,從原來基于一維的noise去訓練,變成基于完全2D的noise去建模,使用加噪-去噪的迭代來生成圖片,大家發現生成的圖像質量更高。因此之后有了一系列擴散模型相關的研究,帶來了技術突破。
另一方面,AI作畫之所以吸引人,是人們可以通過比較自然的語言描述就能生成相應的畫作。背后是大規模預訓練語言模型的功勞,將語言模型的特征提取出來、與圖像的特征進行映射,最后得到從語言到圖像的映射。
隨著互聯網多年的發展,我們已經積累了大量的文本和圖像數據,基于這些數據可以更好訓練模型,從而生成較為高質量的畫作。
>> 丁教:今天AIGC在海外市場有哪些創業機會正在爆發?
劉新華:區別于上一波判別式AI主要解決已有數據的分類和邊界問題,應用場景主要是大家熟悉的算法推薦、人臉識別等等;這一波生成式AI,重點是能夠生成和創造新數據,輸出的結果是發散性、多樣性的,利用人類已有數據打開了新的邊界,創造了全新的增量。
從今年8月至今,AIGC領域涌現出非常多的創新,例如GPT-3大模型生態已長出上百個不同領域的應用,背后不乏獨角獸公司。
在海外,AIGC不只是大廠的機會,也新起了很多創業公司。一類公司偏底層,在新場景中孕育大模型的突破,基于DALLE、GPT等產生很多新的模型;另外是在應用層中,出現很多新公司,包括生成文字、圖像、視頻、代碼、3D模型等等。
另外在細分行業中,也密集跑出了一些創業公司。例如Jasper.ai目前應用在營銷、電商和自媒體創作等領域。
>> 丁教:在觀察這些AIGC創業公司時,你會重點關注他們的哪些能力與指標?
劉新華:從投資角度看,判斷某個領域是否達到爆發臨界點,我們關注典型產品是否達到了產品市場匹配(PMF);在生成式AI這樣的前沿領域,我們還有個前置判斷:在PMF之前,哪些場景達到了AMF(AI Market Fit)。
AIGC達到AMF,有兩個重要的維度。首先,AI的能力基本達到了人類專業工種60%-70%的水平,即人類可用的標準。其次,基于AI的工具容錯率高,能提供可編輯性。在這兩個維度上,用戶量級大、數據可得性高、商業價值高的市場最容易爆發。
這次AIGC浪潮中大火的應用有一個重要共同特征是,越是在創意濃度高的市場中,生成式AI反而最有機會。因為這些領域往往容錯率高,人類沒有嚴苛單一的審美標準,愿意接受多樣性,另外工具提供較強的可編輯性讓人類方便進行二創。這一點是反共識的,正如OpenAI的CEO Sam Altman所說,“10年前人們都認為創意型工作將是最后一個被AI取代的人類工種,萬萬沒想到今天事實恰恰相反。”
因此除了創意工作,未來生成式AI在游戲、建筑設計、新藥研發、新材料發現等創意發散性高、容錯率高的領域,可能也會存在機會。
也有很多人對AIGC的準確率提出疑慮。那些熱度很高的AIGC公司首先準確率已經達到可用的閾值;我個人觀點是,如果要進一步持續提高AIGC的可用性,社區驅動下數據與模型協同的增長飛輪非常重要。
今年火爆的Jasper.ai、Stable Diffusion的社區都非常繁榮,未來優秀AIGC公司的社區能力是非常重要的。用戶社區不斷為模型貢獻數據,新數據帶動模型進一步進化,從而實現好的體驗、吸引更多用戶,形成了數據的網絡效應和用戶的網絡數據,二者相互促進,不斷帶動增長飛輪。
>> 丁教:現在啟元世界在生成式AI方面有怎樣的落地應用?在游戲或者更廣泛的領域,未來的目標和規劃是怎樣的?
袁泉:啟元世界從2017年開始在智能體/AI Being產品技術上不斷創新,應用于游戲、數字孿生、虛擬人等領域。
啟元世界最早做的決策大模型主要應用在游戲領域,AI生成一系列決策指令。目前在策略類游戲中(包括SLG、戰棋、卡牌等游戲品類)已經有比較多落地應用,智能體在其中主要起到“陪玩”的作用。比較有代表性的是啟元世界AI智能體在《星際爭霸II》中擊敗中國星際職業冠軍級選手。
未來我們的目標是讓智能體進化到“陪聊”乃至“陪伴”。在結束一局游戲之后,智能體還可以和你聊一聊,復盤玩得好不好,下一局怎么配合。所以從去年開始,啟元世界發力認知對話大模型,讓智能體能夠看懂游戲態勢并說話。
再往前走就是構建多模態、栩栩如生的智能體/AI Being,Ta的能力將逼近人,能夠理解上下文,以一種高情商的方式和用戶交流,也會寫作、會畫畫、會運動,類比于Human Being,這種AI Being是新的生命體。
>> 丁教:元象對于未來AI生成3D內容,有怎樣的判斷?是否已經有了一些實際案例?
黃浩智:首先元象有一個信念是,未來的媒介形態會向3D互動形式或者更加聚合和多模態的方向演進。現實世界天然就是3D的,用戶對這種媒介形式感到非常親切。
但對比AI生成文字、圖像和視頻,目前生成3D內容還處于非常初級的階段,原因在于3D內容數據的稀缺性。3D內容由于生產門檻比較高、周期比較長,目前主要靠PGC(Professional Generated Content)等專業內容團隊去生產,積累過程比較緩慢。
但近期我們也看到3D內容兩個趨勢,為未來的AI生成奠定基礎。首先是隨著3D內容或元宇宙相關應用的崛起,3D內容積累速度加快。另一方面,基于現實世界進行三維重建的技術也在迭代,不斷降低3D內容生成難度。例如2020年提出的NeRF技術,只需輸入多角度帶相機位姿的圖像,就可以訓練得到一個NeRF模型,根據這個模型就能渲染出任意視角下的清晰照片。
短期來看,在3D內容數據比較少的情況下,元象如何加速AI生成3D內容的速度?我們的思路是以圖片為媒介來解決,即從文字到圖片、再從圖片到3D內容的生成。近期谷歌就用NeRF模型嘗試從文字到生成3D內容。
目前元象對于3D世界中的人、景、物三個類別,都在嘗試AI生成。在人方面,我們判斷人的動作生成(點擊了解元象技術方案,下同)將率先迎來爆發。隨著目前動作捕捉技術、可穿戴設備的發展,對于人物動作捕捉的數據不斷積累;此外,擴散模型等生成式模型也可以用來做動作數據的生成。
場景方面,目前元象迭代比較多輪的是大世界生成技術,通過AI的方式幫助大規模和復雜場景的生成。
舉個例子,如果我們想生成深圳城市3D路網,要怎么做?首先內部美術團隊可以用2D圖形勾勒道路;之后我們利用GAN、擴散模型等技術去生成路網模型;再結合地理位置信息、航拍等數據,利用CV最擅長的識別和分割類任務,對路網進行劃分和判別,不同位置設置相應的3D模型,進而將路網3D化。
>> 丁教:與海外相比,國內在AIGC領域將出現怎樣的創業機會?更可能分布在哪些方向,例如To B還是To C?
劉新華:首先可以明確的是,國內所有創業者都將受益于生成式AI的創新和生態。大模型的涌現和指數級的能力迭代,以及開源社區的繁榮、API的大量開發和開放,都會讓中國的創業者從中獲益。而且大模型的泛化能力和通用性極強,無需對場景和模型重復訓練(即Zero-shot),由此而來的低成本準入門檻、數據飛輪效應和廣泛的場景適應能力,都能讓國內的創業者可以在巨人的肩膀上做組合式創新。
但國內也會形成不一樣的創業公司生態。底層平臺的創業難度相對大,但也的確存在國產替代機會,特別是在本土數據特別豐富的場景中。
此外在一些新場景中的底層平臺,國內創業者也有創新機會,例如3D場景、游戲、制造業、建筑業等。
國內最可能涌現創業公司的機會或許在應用層。To B方向應該最先有潛力爆發,例如海外這一波生成式AI公司中商業化最成熟的Jasper.ai就是SaaS模式,瞄準有高頻、大規模文字生產有需求的營銷、自媒體、電商等細分場景。To C方向,我相信有可能涌現下一代抖音/快手/騰訊視頻的機會,但可能更多是大廠的機會。當然,AIGC作為新一代生產力工具,也有針對開發者的To D公司出現,例如今天海外已經涌現Copilot這類代碼生成工具。
微軟GitHub AI編程工具Copilot
再暢想未來,生成式AI還有一個有意思的方向——個性化模型,可能每個人在未來都能有自己的模型,帶來AIUGC的浪潮。例如一位網紅,可以基于過往的視頻訓練自己的模型,未來可以根據模型生成極度個性化、極度個人風格的內容。
袁泉:這里我回應一下新華總說的,我們也判斷國內第一波出來的AIGC公司應該是SaaS類的。但也有一些有趣的事情在發生,隨著AIGC能力的大幅度提升,單個用戶每個月的消費可能就是幾十塊錢,購買決策成本很低。用戶覺得這個工具對自己提升效率,或者寫作、畫畫確實有用,就購買了。所以在某些場景下,To B和To C的界限在快速模糊化。
從這個維度上看,過往國內很多AI公司主要是做To B大客戶或者To G這種特別重的模式,AIGC為我們打開了新的想象力。
>> 丁教:那么隨著AIGC的火爆,國內AI公司的商業環境會更好嗎?未來如何尋找自己的增量空間?
袁泉:坦白說今年的外部環境對于AI公司來說非常有挑戰性,但啟元世界最信仰的還是通用人工智能技術(AGI),即深度學習加強化學習的范式和方法論。無論是我們在一個相對封閉的場景中訓練,比如讓智能體從零開始學會玩一款游戲;還是AIGC的破圈,把通用智能延伸到了更大的范疇,拿全網語料去訓練一個初始的認知大腦,再通過各個場景的用戶數據和反饋,不斷修正與迭代這個大腦形成更強的能力,背后的技術都是一樣的。
AGI背后,是全世界理論上最好的兩家公司OpenAI和DeepMind在牽引著這個大的范式在大踏步前進,長期來看越來越有信心。兩年前,在GPT-2出來的時候還沒有太多的感知,但是當GPT-3發布之后,國外很多公司開始研究、獲得先機。
如今國內開始感受到如火如荼的氛圍,AIGC就像是“冬天里的一把火”,點燃了大家,相信明后年在應用層面會迎來一個突破爆發的階段。最先火起來的應用可能是和互聯網以及通用常識比較相關的應用,例如營銷文案。但未來再往前走要做成各個垂類的Jasper.ai,例如游戲中的2D資產、元象做的3D內容以及一些專業化要求更高的領域。再進一步,即我們所信仰的——多模態融合的更高階形態的內容生成形式。
此外我認為國內創業者還是要敢于去想一些更大、更有想象力的事情。舉個例子,隨著國內大模型的開放,基于這一大模型的認知能力、對話理解能力,是否有可能打造下一個AI時代的搜索引擎?我覺得永遠應該往這些方向去快速探索和試錯。
>> 丁教:國內AIGC創業者是否擁有一些優勢?
袁泉:我認為國內AIGC創業團隊,相比海外團隊有兩點優勢,首先是對場景和用戶的理解。有一種觀點認為,AIGC最后的贏家不一定是AI公司,而是對各個行業、場景、用戶理解得最透的公司。中國團隊在這方面的實力是不容小覷的,例如移動互聯網領域,我們做成了支付、購物以及像抖音、快手這類超級內容平臺。
其次是中國創業環境就是唯快不破,在一個特別新的領域,最初可能只是一些朦朧的想法,但需要快速提升組織能力,快速迭代試錯,把真正的機會、好的產品形態給打磨出來。
>> 丁教:如果本身不是AI技術公司,如何學習AIGC,并利用這樣的機會和成長態勢獲益?
黃浩智:首先我認為要結合自己的行業去思考獨特方向。例如我是做服裝品牌的,能用AIGC做什么?原本不知道應該生產什么樣的衣服銷售效果好,我可能就去設計一下prompt,描述一下這件衣服長什么樣,生成圖片,從中篩選去小批量投放廣告,根據數據反饋幫助后續設計的決策。
另外,如果你的公司在技術能力上更強,有一件確定的事可以做,就是去決定自己的輸入和輸出。因為一些數據源只有某些公司才有,而且今天大家可以利用云訓練資源去訓練自己的模型,輸出的就是特定領域的內容。值得一提的是,輸入的內容可以不只是自然語言描述,還可以是數據分析描述、法律文書等等。
>> 丁教:有人擔心AIGC可能取代人類,也有人認為AIGC的能力還不夠強,未來人類如何與AI共生?
劉新華:AIGC不能完全替代人類的工作,但的確是人類的強大助手,不是替代而是增強。我們要保持足夠開放的態度,因為人工智能進化的速度不在于起點有多低,而在于進化有多快。今天AIGC作為新一代的生產力工具已經出圈,我們每個創業者、開發者、創作者,都應該關注AIGC的進步。結合各自的領域,建議大家去體驗ChatGPT、Jasper.ai、Midjourney、Stability.ai等產品,可能都會有非常有趣的發現。
而且未來AIGC領域的創業者要去思考:你的產品要和現有工作流無縫打通,讓現有工作流更高效,這樣低摩擦的集成更容易推動AIGC的商業化普及。例如Jasper.ai的產品體驗做得非常好,不但橫向跟用戶創作所有主流工作流都能集成,而且縱向集成SEO和營銷優化工具、多語言翻譯器以及識別版權問題的合規工具等等,并且工作流支持二創和再編輯。所以優秀的AIGC產品,不是和人類抗衡,而是更好與人類現有工具相結合,發揮出人類特長;同時也讓AI能夠更快進步、去適應特定場景。也正是這種“無侵入體驗”,使得Jasper公司成立不到二年,取得10萬付費用戶、ARR超過9000萬美元、年用戶留存率超過57%的佳績。
隨著AIGC的應用,也會涌現新的工種,例如生成式AI的訓練師或者提示工程師,“如何寫一個好的prompt,讓AI更好理解你,生產出更好的東西”,都是我們可以思考的潛在方向。
放眼未來10年,也許會發生很多意想不到的事情或者出現新物種。例如原本令時尚行業設計師引以為傲的是審美能力,但未來AI能力加上優秀的設計師,可能會超越過去的框架、創造出全新的審美。
展望未來,隨著我們向通用人工智能不斷逼近,AI勢必是人類的朋友。正如英偉達CEO黃仁勛所說,未來AI將協助解決人口和勞動力短缺問題,提高整個社會的生產力和繁榮程度。
關鍵詞:
標簽閱讀
-
【環球快播報】榕匯對話:創業者如何擁抱AIGC熱潮?新的創業...
2022-12-14 -
快報:2022版熊貓紀念幣100克精制金幣現在市場價是多少(2022...
2022-12-14 -
觀速訊丨第24屆冬奧會金銀紀念幣價格表(2022年12月14日)
2022-12-14 -
全球熱點!控股權生變?成都路橋控股股東全部股份遭司法凍結...
2022-12-14 -
環球滾動:【最新調研】中國疫苗市場發展現狀,疫苗市場規模將...
2022-12-14 -
今日熱議:2022吉祥文化金銀幣價格表(2022年12月14日)
2022-12-14 -
2022年虎年金銀幣價格表(2022年12月14日)
2022-12-14 -
受國內經濟拖累 英國股市成最不受歡迎市場
2022-12-14 -
世界滾動:亞一黃金價格今天多少一克(2022年12月14日)
2022-12-14 -
【獨家焦點】咳嗽喉嚨癢怎么辦?做好這幾點有助緩解癥狀!
2022-12-14 -
當前聚焦:強化中老年免疫力:接種疫苗是中老年人獲得特異性...
2022-12-14 -
當前資訊!金點電力能源晨報187期
2022-12-14 -
世界實時:華特達因:公司沒有治療新冠的藥物
2022-12-14 -
當前最新:免疫力是戰勝病毒的強大“武器”,保護免疫力做好...
2022-12-14 -
天天實時:業績承壓,上美集團上市后能否挽回頹勢?
2022-12-14 -
全球熱點評!拓普集團(601689)定增進一步提升產能 滿足在手訂單持...
2022-12-14 -
環球聚焦:中國首個城市官宣入境“0+0”!
2022-12-14 -
大V的腳步, 我跟不上
2022-12-14 -
環球熱文:銀行定期存款,1年期跟3年期,哪個更劃算?別再存錯了
2022-12-14 -
建設銀行定期存款到期會自動轉存嗎? 為什么不建議定期存款...
2022-12-14