新模型接連炸場AI視覺迎來GPT-3時刻，微美全息(WIMI.US)先聲奪人進入爆發期_今日報

2023-04-24 10:46:56 |來源:

短短一周不到，視覺領域接連迎來新模型“炸場”，圖像識別門檻大幅降低——這場AI熱潮中鮮見動靜的Meta(META.US)終于出手，推出Segment Anything工具，可準確識別圖像中的對象，模型和數據全部開源。

據悉，Meta的項目包括模型Segment Anything Model(SAM)、數據集Segment Anything 1-Billion mask dataset(SA-1B)，公司稱后者是有史以來最大的分割數據集。

引起業內轟動的便是這一SAM模型，正如名字“Segment Anything”一樣，該模型可以用于分割圖像中的一切對象，包括訓練數據中沒有的內容。

【資料圖】

在交互方面，SAM可使用點擊、框選、文字等各種輸入提示(prompt)，指定要在圖像中分割的內容，這也意味著，用于自然語言處理的Prompt模式也開始被應用在計算機視覺領域。并且對于視頻中物體，SAM也能準確識別并快速標記物品的種類、名字、大小，并自動用ID為這些物品進行記錄和分類。

AI視覺迎來GPT-3時刻

對于SAM工具，英偉達(NVDA.US)人工智能科學家Jim Fan將Meta的這項研究稱作計算機視覺領域的“GPT-3時刻”之一——其分割方法可以通用，可對不熟悉的物體和圖像進行零樣本泛化，初步驗證了多模態技術路徑及其泛化能力。

進一步來說，SAM可以靈活集成于更大的AI系統。例如，理解網頁的視覺和文本內容;在AR/VR領域，將頭顯用戶視線作為提示來選擇對象，然后將其“提升”到3D中;對于內容創作者，SAM可提取圖像區域以進行拼貼或視頻編輯;SAM還可通過定位動物或物體在視頻中進行研究和跟蹤。

AI視覺有望飛躍式提升

公開資料顯示，計算機視覺模擬大腦完成對圖像的處理和解釋，實現對相應場景的多維理解。以圖像、視頻為代表的視覺數據是互聯網時代信息的主要載體之一，賦以人工智能模型感知并理解這些海量的視覺數據的能力，有助于提高人工智能自主適應環境的能力。

作為人工智能(AI)和深度學習的子領域，計算機視覺可訓練卷積神經網絡(CNN)，以便針對各種應用場合開發仿人類視覺功能，利用圖像和視頻進行數據分割、分類和檢測。

國盛證券預計，預計1-5年內，多模態發展將帶來AI泛化能力提升，通用視覺、通用機械臂、通用物流搬運機器人、行業服務機器人、真正的智能家居會進入生活;5-10年內，結合復雜多模態方案的大模型有望具備完備的與世界交互的能力，在通用機器人、虛擬現實等領域得到應用。

首創證券翟煒在研報中指出，META發布了視覺大模型SAM，緊接著智源研究院視覺團隊也推出通用分割模型SegGPT，通用視覺大模型之戰也打響。視覺大模型能把任意圖像從像素陣列解析為視覺結構單元，像人類視覺那樣理解各類場景，這對自動駕駛、安防、智能家居、工業視覺等眾多行業都將帶來飛躍式提升。

西部證券指出，Meta此次推出SAM，預示著大模型在多模態發展方面更進一步，布局計算機視覺/視頻的廠商有望持續受;還有券商補充稱，SAM模型突破了機器視覺底層技術。

微美全息(WIMI.US)有望進入爆發期

目前，中國計算機視覺廠商具有基于基礎算法進行改進和優化并形成各自特有算法的技術能力，而作為全球領先的AI視覺解決方案提供商微美全息(WIMI.US)將成為受益者之一，據悉，該公司專注于計算機視覺全息云服務，為全球規模、覆蓋產業鏈、業績等方面較優秀的全息云產業綜合實體之一，目標是成為有潛力、有國際影響力的全息云平臺。

公開資料顯示，微美全息(WIMI.US)目前已經將計算機視覺技術與虛擬現實技術相結合，開發了基于計算機視覺的三維人機交互系統。在人機之間構建自然直觀的三維交互環境，并構造三維用戶界面，實現和諧的、“以人為中心”的人機交互界面。

在微美全息的三維人機交互系統中，采用了視覺作為有效的輸入模態。計算機視覺是一種引導系統并與視覺世界交互的人工智能技術，其從獲取的輸入中識別對象并提供最終結果。計算機視覺中包含了獲取、轉換和分析數字圖像等任務，可協助人類完成識別任務、啟用交互等，并基于訓練數據集進行評估。使人機通訊信息交換量更大、形式更豐富，發揮人機彼此不同的認知潛力。

在AI視覺算法技術能力方面，微美全息開發了聚和聚類算法，用于支持新一代互聯網的算法處理需求。聚類算法是一種機器學習算法，它將相似的數據點組合在一起形成簇(Cluster)，聚合聚類新型算法能夠自適應地根據圖像特征進行聚類，能夠處理不同類型、尺寸和分辨率的圖像，并且能夠結合機器學習和深度學習技術，實現更高級別的圖像處理和分析。

隨著深度學習、計算機視覺算法和虛擬現實技術的迅猛發展，微美全息開發的AI視覺相關應用在許多行業中都有廣泛的應用，如金融、醫療、制造業、社交網絡、市場營銷等。同時，由于市場需求也在不斷擴大，微美全息的AI視覺應用前景將進入新的爆發期。

AI視覺市場規模快速增長

國海證券陳夢竹在研報中表示，2021年中國計算機視覺技術核心產品、帶動相關產業市場規模達990億元、3079億元，預計2025年分別達1873億元、5771億元。

從全球來看，2022年全球視覺人工智能市場銷售額達到了113.51億美元，預計2029年將達到218.10億美元，年復合增長率(CAGR)為10.51%(2023-2029)。中國市場在過去幾年變化較快，2022年市場規模為28.12億美元，約占全球的24.77%，預計2029年將達到61.72億美元，屆時全球占比將達到28.30%。

總之，隨著視覺技術、深度學習、高精度成像等技術的持續發展，視覺人工智能的應用場景將持續擴展。視覺人工智能無論在速度、精度、還是環境要求方面都存在著顯著優勢，能夠替代人類視覺，更好的助力工業自動化、各行各業智能化的發展。

本文來源：財經報道網

關鍵詞：

標簽閱讀

新模型接連炸場AI視覺迎來GPT-3時刻，微美全息(WIMI.US)先聲...

2023-04-24
焦點短訊！COMEX期貨漲0.05% 暫報1994.0000美元/盎司

2023-04-24
北京住總10億元ABN將付息優先A級利率4.5%、B級利率4.9%_焦點關注

2023-04-24
觀點：5月份，你工資卡里或多一筆錢！

2023-04-24
4月24日重點數據和大事件前瞻|世界熱訊

2023-04-24
4月24日早間5家公司出現利好消息世界新視野

2023-04-24
新鮮早科技丨三星電子因侵權被美判罰3.03億美元；谷歌將AI芯...

2023-04-24
【熱聞】美經濟數據高于預期國際黃金空頭延續

2023-04-24
專家：二次感染新冠風險逐漸增加，癥狀會輕一些_觀焦點

2023-04-24
鮑威爾強調控制通脹重要性黃金趨勢下跌

2023-04-24
環球速讀：全脂奶不僅易誘發肥胖，還不健康？它和脫脂奶有何...

2023-04-24
光庫科技鈮酸鋰高速調制器芯片及器件產品應用于人工智能等領域

2023-04-24
你家還在吃西紅柿嗎？多虧菜販子提醒，我也是才知道，趕緊看看

2023-04-24
巴比食品公司目前經營情況良好，門店業務和團餐業務保持正常...

2023-04-24
【天天速看料】國盛智科公司數控機床和智能自動化生產線產品...

2023-04-24
天天看熱訊：國家重點研發計劃“工業軟件”專項啟動會順利召開

2023-04-24
快消息！奧密克戎有新變種，“二陽”案例增加，病毒學專家：...

2023-04-24
天天時訊：長城汽車，“流血轉型”

2023-04-24
蘋果手機為什么突然沒有聲音了（蘋果手機突然沒聲音）

2023-04-24
創新之道，以系統謀劃為要

2023-04-24

新模型接連炸場AI視覺迎來GPT-3時刻，微美全息(WIMI.US)先聲奪人進入爆發期_今日報

標簽閱讀

新模型接連炸場AI視覺迎來GPT-3時刻，微美全息(WIMI.US)先聲...

焦點短訊！COMEX期貨漲0.05% 暫報1994.0000美元/盎司

北京住總10億元ABN將付息優先A級利率4.5%、B級利率4.9%_焦點關注

觀點：5月份，你工資卡里或多一筆錢！

4月24日重點數據和大事件前瞻|世界熱訊

4月24日早間5家公司出現利好消息世界新視野

新鮮早科技丨三星電子因侵權被美判罰3.03億美元；谷歌將AI芯...

【熱聞】美經濟數據高于預期國際黃金空頭延續

專家：二次感染新冠風險逐漸增加，癥狀會輕一些_觀焦點

鮑威爾強調控制通脹重要性黃金趨勢下跌

環球速讀：全脂奶不僅易誘發肥胖，還不健康？它和脫脂奶有何...

光庫科技鈮酸鋰高速調制器芯片及器件產品應用于人工智能等領域

你家還在吃西紅柿嗎？多虧菜販子提醒，我也是才知道，趕緊看看

巴比食品公司目前經營情況良好，門店業務和團餐業務保持正常...

【天天速看料】國盛智科公司數控機床和智能自動化生產線產品...

天天看熱訊：國家重點研發計劃“工業軟件”專項啟動會順利召開

快消息！奧密克戎有新變種，“二陽”案例增加，病毒學專家：...

天天時訊：長城汽車，“流血轉型”

蘋果手機為什么突然沒有聲音了（蘋果手機突然沒聲音）

創新之道，以系統謀劃為要

上市企業

安杰思科創板上市排隊不足五個月...

天宜上佳擬2.7億元收購晶熠陽90%...

華虹半導體擬募資180億元沖擊科...

北交所發布北證50成份指數首發樣...

何氏眼科、普瑞眼科11月7日上市...

金融動態

看天下