AI“百模大戰”風向變了?360、美圖先后出招,視覺大模型上演“神仙打架” 當前快看
本報(chinatimes.net.cn)記者趙奕 胡金華 上海報道
【資料圖】
隨著AI大模型研發應用熱潮持續高漲,記者注意到,賽道內的玩家開始將重心從語言大模型轉向視覺大模型。近期,Adobe、Meta、360、美圖等多家國內外互聯網頭部企業紛紛發表大模型成果,為本就火熱異常的AI市場再添了一把火。
“人工智能在視頻領域的應用越來越受到重視。”中國通信工業協會兩化融合委員會副會長吳高斌向《華夏時報》記者表示,這些大型AI模型的發布為企業間的競爭帶來了新的動力。企業之間的競爭將促進技術創新和進步,同時也將帶來更好的產品和服務。競爭還將促進企業間的合作和共享資源,從而更好地滿足市場需求。
海內外視覺大模型“神仙打架”
在鱗次櫛比的語言大模型、多模態大模型紛紛涌現之后,“視覺大模型”成為又一個兵家必爭之地。日前,美圖發布AI視覺大模型MiracleVision,一同發布的還有AI視覺創作工具WHEE、AI數字人生成工具DreamAvatar、美圖AI助手RoboNeo等7款產品。
據介紹,MiracleVision具有強大的視覺表現力和創作力,能從繪畫、設計、影視、攝影、游戲、3D、動漫等視覺創作場景反推技術演化。與市面上其他大模型不同,它尤其擅長亞洲人像攝影、國風國潮、商業設計等生成方向。
美圖公司創始人、董事長兼首席執行官吳欣鴻在接受《華夏時報》記者采訪時表示:“美圖大模型的核心優勢是‘懂美學’,C端用戶基礎足夠大,大模型冷啟動的獲客成本低,美圖目前有2.43億的月活用戶,全球VIP會員數為719萬,能在短時間去驗證產品成功與否。不同于其他廠商,美圖大模型聚焦于美學(畫面畫質設計等),未來如果非要競爭,會在美學上面去‘卷’。”
無獨有偶,360也日前正式發布“360智腦-視覺大模型”。 360創始人周鴻祎表示,大語言模型是構建視覺大模型的基礎,多模態能力增強的核心是借助了大語言模型的認知、推理、決策能力。同時,視覺大模型也是“360智腦”的重要能力組成,能夠看懂圖片,未來還能看懂視頻、聽懂聲音。
海外企業也已經開始在視覺大模型上布局。日前,社交媒體巨頭Meta宣布,將向研究人員開放一個名為I-JEPA的“類人”人工智能模型的部分組件,該模型可以比現有模型更準確地分析和完成未完成的圖像,而不是像其他生成式人工智能模型那樣,只根據附近的像素進行推斷。
Meta公司首席人工智能科學家楊立昆曾公開指出,當前的GPT自回歸模型存在缺乏規劃、推理的能力,未來GPT系統或將被拋棄,并給出了他認為的正確答案——世界模型。據稱I-JEPA是第一個基于其愿景關鍵組成部分的AI模型,能比現有模型更準確地分析和完成未完成的圖像。
除此之外,Meta還發布了語音生成AI模型“Voicebox”,支持從文本中生成語音,能夠根據僅兩秒長的樣本匹配音頻風格,并將文本樣本轉換為另一種語言,在給定單獨的語音樣本的情況下,并能夠以說話者的原始語音朗讀翻譯后的文本內容,目前支持六種語言:英語、法語、德語、西班牙語、波蘭語和葡萄牙語。
而早在今年4月,Adobe便將其Adobe Firefly功能(類ChatGPT產品)集成在Premiere Pro、After Effects、Audition、Remix等音視頻產品矩陣中,為用戶提供一鍵生成內容、剪輯、調色、更換音樂等功能。
從“語言大模型”到“視覺大模型”
《中國人工智能大模型地圖研究報告》顯示,從全球已發布的大模型數量及分布來看,中國和美國大幅領先,超過全球總數的80%。同時,歐洲、俄羅斯、以色列等越來越多的研發團隊也在投入大模型研發。但值得注意的是,我國在計算機視覺等領域的大模型還較少。
究其原因,北京智源研究院訪問首席科學家顏水成向《華夏時報》記者表示:“現在視覺模型發展稍微滯后的主要原因,是因為視覺大模型吃算力吃得比文本要大很多,所以我們也期待芯片更快速的發展,甚至有可能把非GPU其他的芯片融合在一起來做。現在大家見到的模型一般千卡級比較常見,但可能明年就有人會用萬卡級來做。”
而在北京智源人工智能研究院院長黃鐵軍看來,視覺領域是大模型領域下一個浪潮的重點。他指出,視覺大模型和語言大模型背后的思想方法和基本路線是異曲同工的,只是輸入的數據變成了圖像和視頻,訓練出來的模型則具有一定的通用視覺語言能力,一種是之前提到的AIGC(人工智能自動生成內容),可以生成圖像和藝術品,“還有一種更基本的能力,就是看到世界之后,得首先能把這個世界(萬物)分清。”
對于視覺大模型的發展,不少機構也表達出看好的態度。中金研究發布的研報認為,計算機視覺未來有望實現更高程度的自動化、高精度和低功耗,進一步豐富元宇宙的內容生態,降低進入門檻。計算機視覺的進步引領了三維重建和動捕技術快速成熟,并逐漸在各自的領域積累技術進步。計算機視覺未來有望迎來更高程度的自動化、更高的精度,以及更低的功耗,逐漸在移動端實現更好的視覺效果,被應用在大量下游行業,逐漸邁向連接物理世界和數字世界的長期愿景。
中信證券研究也表示,在設計領域,大模型引領數字設計走向智能設計,相關工業設計軟件結合GPT等技術,可應用在設計規劃、布局優化、插件助手、草圖繪制等場景,工業設計軟件有望在AI升級的大趨勢下迎來新一輪生產力革命。
責任編輯:徐蕓茜 主編:公培佳
關鍵詞:
您可能也感興趣:
為您推薦
AI“百模大戰”風向變了?360、美圖先后出招,視覺大模型上演“神仙打架” 當前快看
世界速看:法國金融特警隊搜查巴黎奧組委總部
福利院內新添智能儀器!為老人們帶來安全無味消殺
排行
最近更新
- AI“百模大戰”風向變了?360、美圖先后出招,視覺大模型上演...
- 每日短訊:中國海警局新聞發言人就美“斯特拉頓”號炮艦過航...
- 昆侖萬維的“離婚概念股”火了,投資者該怎么辦?
- 短訊!這個大叔不簡單 從億元老板變身龍舟隊“掌舵人”
- 艾草菖蒲菜場價格直接飆漲100%,你家的餐桌今天湊齊五黃了嗎...
- 銀川燒烤店爆炸事故:安全是一切生產活動前提|新京報快評 ...
- 觀速訊丨端午到,湖南多地暴雨持續
- 當前熱點-索賠超70億元!這一巨頭“在逃前掌門”現身!狀告三...
- 70后老板,拿下河南跨境電商“第一股”,一年進賬54億
- 團代表故事丨00后姚少華:小小年紀返鄉種菜,成青年致富帶頭...
- 端午節上演龍舟競渡 “體驗+融入”讓中國傳統文化更鮮活
- 繪涼扇、折香囊、制彩陶 鄭州多家文博場館推出豐富多彩假日活動
- 醫療器械召回信息公開(江西易琛醫療器械有限公司)-即時看
- 天天熱門:被他人使用QQ號實行詐騙
- 運營商財經網康釗:中國第四大保險公司原董事長出了大事
- 研發效能認證學員作品:談敏捷開發團隊轉型中的協作化與自動...
- “雙減”下我省校園科技競賽火熱開展 讓中小學“走近科學”...
- 藝術 | 弘揚科學家精神 廣播劇《陳芳允》上線央廣
- 【全球熱聞】西海岸高爾夫溫泉別墅跟藍洋溫泉大河花園養老分...
- 世界播報:華脈科技擬借道定增易主 接盤方成立僅三個月尚無實...
- 天天最資訊丨我國成為全球生態治理典范
- 信息生命周期管理五大關鍵影響 全球熱文
- 建筑工程保險適用于哪些被保險人
- 每日資訊:社區健康大講堂 助力“幸福和諧星”
- 全球觀察:吉林省氣象局與華云集團簽訂協議 深化國省部門合作
- 息縣張陶鄉:牛羊產業“加速度” 鄉村振興添動能|世界今日訊
- 焦點短訊!那些主動延期畢業的大學生:選擇活在“自己的社會...
- 世界快資訊丨信陽市人民醫院開展“河南紅會送醫計劃”義診志...
- 昆山鉑特麗醫療美容正規嗎 世界短訊
- 1克便宜100多元,淘金者涌入水貝黃金市場