首頁 智能 > 正文

巨頭創(chuàng)企搶吃數(shù)字人紅利,拼得到底是啥?對話新壹科技CEO雷濤

智東西


(資料圖片)

作者 | 周炎

編輯 | 云鵬

大模型爆火以后,在元宇宙中“失意”的數(shù)字人再次成為行業(yè)關(guān)注的生意。

今年以來,科技企業(yè),電商平臺都推出數(shù)字人生成平臺。從東方證券發(fā)布的虛擬數(shù)字人行業(yè)報告來看,2030年,我國虛擬數(shù)字人的市場規(guī)模有望達到2700億元。

然而,目前無論是直播領(lǐng)域還是創(chuàng)投領(lǐng)域,依然沒有出現(xiàn)爆款的數(shù)字人平臺,數(shù)字人在商用落地方面仍然面臨著難題。不僅如此,高額的成本依舊是數(shù)字人大規(guī)模落地前的“絆腳石”。

就在上月,新壹科技使用了董事長韓坤的數(shù)字人形象主持了一場國內(nèi)首個視頻大模型的發(fā)布會。會上,新壹科技發(fā)布了基于大模型的AIGC視頻生成平臺“秒創(chuàng)平臺”、商用數(shù)字人平臺“新壹數(shù)字人平臺”。

▲新壹科技董事長韓坤數(shù)字人形象主持發(fā)布會

據(jù)新壹科技CEO雷濤介紹,未來一年里,中國將至少新增100萬個數(shù)字人,未來將實現(xiàn)數(shù)字人“人人可擁有”。隨著私域經(jīng)濟的進一步發(fā)展,數(shù)字人將在視頻領(lǐng)域破圈。

在數(shù)字人競賽升溫的當下,智東西對話新壹科技CEO雷濤,新壹科技副總裁、AIGC業(yè)務(wù)負責(zé)人陳鵬,來探究一個注冊剛一年多的公司是如何打造出中國版的“Midjourney”、“Runway”、“Character.ai”的“集大成者”?在數(shù)字人打造成本依舊較為高昂的當下,是什么讓雷濤認為,今年,中國將至少新增100萬個數(shù)字人?下一步,數(shù)字人平臺比拼的焦點到底是什么?

▲新壹科技CEO雷濤演示數(shù)字人平臺

一番交流下來,我們看到了這個在視頻領(lǐng)域摸爬滾打20年團隊,如何抓住AIGC時代機遇再度崛起,以及未來在數(shù)字人賽道發(fā)展的野心。

一、科幻電影不再需要“群演”了,AIGC釋放視頻領(lǐng)域生產(chǎn)力

在ChatGPT推出后半年多時間里,AI大模型“井噴”,百度、華為、360等互聯(lián)網(wǎng)企業(yè)接連推出接入大模型的數(shù)字人平臺,然而大模型究竟如何為數(shù)字人賦能?數(shù)字人如何真正應(yīng)用到千行百業(yè)中去?仍然是入局者的痛點問題。

今年以來,由RunwayML參與制作的《瞬息全宇宙》斬獲奧斯卡最佳女主角,AI生成視頻就引起了行業(yè)的廣泛關(guān)注,IR、Ten24等公司也將靜態(tài)重建技術(shù)完全商業(yè)化,服務(wù)于好萊塢大型數(shù)字人制作。可以看到,國外這種AI數(shù)字人參與視頻制作的模式已經(jīng)趨近成熟化,同時為數(shù)字人落地提供了一個可實施的方向。

在國內(nèi)的AIGC創(chuàng)業(yè)公司中,新壹科技算是可以與前者對標的公司。上月,新壹科技在視頻大模型發(fā)布上演示了基于自家大模型打造的AIGC視頻平臺“秒創(chuàng)”、商用數(shù)字人平臺“新壹數(shù)字人平臺”的能力。

簡單而言,有一天像《三體》《流浪地球》這樣的科幻電影的預(yù)告片,很多鏡頭將不再需要拍攝,只要這個對著“秒創(chuàng)”平臺輸入一段話或一張圖片,即可實現(xiàn)圖文轉(zhuǎn)視頻。如果需要人物,那么還可以通過“新壹數(shù)字人平臺”完成相關(guān)數(shù)字人的訓(xùn)練。

▲新壹科技推出的視頻大模型生成的內(nèi)容

據(jù)雷濤介紹,未來,中國電影預(yù)告片將會在很大程度上被“AI”所接管,數(shù)字人將在很大程度上代替目前的群演。而更加顛覆性的事情可能是,每一個用戶都能成為自己影片的“導(dǎo)演”。

為了探究AICG時代視頻領(lǐng)域生產(chǎn)力將如何釋放?數(shù)字人在視頻領(lǐng)域應(yīng)用又將擦出怎么的火花?我們與新壹科技CEO雷濤,新壹科技副總裁、AIGC業(yè)務(wù)負責(zé)人陳鵬進行了深入交流。

據(jù)雷濤介紹,目前大部分通用大模型沒有從實用場景出發(fā),從而導(dǎo)致其實用性不強,難以真正重塑生成。而新壹科技推出的視頻大模型,在使用通用大模型的基礎(chǔ)上,還利用曾經(jīng)在秒拍、微博等平臺積累的數(shù)據(jù)集進行訓(xùn)練,其中文本數(shù)據(jù)可以達到百億級、圖片視頻數(shù)據(jù)量可以達到20億左右。

▲新壹科技CEO雷濤演示秒創(chuàng)平臺

據(jù)陳鵬介紹,相較于ChatGPT等通用大模型使用的數(shù)據(jù)集而言,該公司積累的數(shù)據(jù)集經(jīng)過了“安全合規(guī)”的審核。同時,此前運行的過程中還進行了數(shù)據(jù)標注、結(jié)構(gòu)化等工作,在打造視頻大模型的過程中,還對數(shù)據(jù)進行了清洗,這都進一步保證了AIGC視頻生成平臺“秒創(chuàng)”、商用數(shù)字人平臺“新壹數(shù)字人平臺”中數(shù)據(jù)的質(zhì)量。

▲新壹科技數(shù)字人平臺訓(xùn)練出來的數(shù)字人“伊人”

此外,為了保證圖文轉(zhuǎn)視頻的精準度,新壹科技持續(xù)優(yōu)化視頻大模型中素材的匹配度,目前精準匹配可以達到千萬級,泛匹配可以達到20億的規(guī)模,這將進一步推動視頻領(lǐng)域生產(chǎn)力的提高。

當視頻能用“大模型”生產(chǎn)了,那真人出鏡的部分如何解決呢?還要一段段去錄、一段段去剪來完成嗎?

新壹科技的數(shù)字人平臺就是這樣的實際需求從而落地的。目前,新壹科技的數(shù)字人通過多模態(tài)AI合成技術(shù),可以將真人錄制的視頻和音頻素材生產(chǎn)寫實數(shù)字人,該平臺目前可以在24小時完成一個數(shù)字人的訓(xùn)練。開篇所提到的董事長韓坤的數(shù)字人形象就是這樣訓(xùn)練出來。

二、視頻領(lǐng)域20年“老兵”,抓住AIGC時代機遇,滿足垂直場景需求

能夠在如此短的時間就推出國內(nèi)首個視頻大模型,并推動多款應(yīng)用落地的的企業(yè)背后又有著怎樣的人才、技術(shù)以及行業(yè)優(yōu)勢?

公開信息顯示,新壹科技注冊于2022年1月,算是一家非常年輕的創(chuàng)業(yè)公司。能夠推出國產(chǎn)首個視頻大模型以及推出數(shù)字人平臺落地,與他們的團隊有很大的關(guān)系。

▲公開信息顯示,新壹科技成立于2022年

他們曾是在視頻領(lǐng)域摸爬滾打20多年的老玩家,移動互聯(lián)網(wǎng)時代火爆全網(wǎng)的應(yīng)用秒拍、小咖秀都是該團隊推出的產(chǎn)品。這些年來,新壹科技培養(yǎng)出了一支代碼過硬的工程師隊伍。

而更早之前,這個團隊則親手打造了中國首個上市的視頻公司酷6網(wǎng),CEO此前還擔(dān)任過搜狐娛樂互動中心主編。

目前新壹科技AIGC團隊共有100人左右,這個“很懂視頻”的團隊在2年前意識到當下“萬物皆可視頻化”的趨勢,然而制作視頻過程中設(shè)計到人力的工序。于是,團隊就開始思考:如何使用AI的方式生成視頻,既滿足用戶圖文轉(zhuǎn)視頻的需求,又提高視頻的生產(chǎn)力?

陳鵬稱,當時2021年12月份開始啟動項目的時候,甚至沒有AIGC這個概念,“直到去年,隨著stable Diffusion和Midjourney的爆火,我們才知道原來行業(yè)給我們一直做的事情其實下了定義。”

據(jù)雷濤稱,基于新壹科技視頻大模型,目前公司打造數(shù)字人的成本大大降低,同時數(shù)字人的表情等也更加真實自然。相較于未接入大模型的平臺、新壹科技的數(shù)字人還擁有文本理解能力和多輪對話能力。

▲訓(xùn)練數(shù)字人時的工作場景

據(jù)陳鵬回憶,在過去的幾年里為了讓數(shù)字人實時無延遲地回答問題都花費了團隊大量的心血。不過可喜的是,目前,相較于接入ChatGPT的數(shù)字人而言,新壹科技打造的數(shù)字人接入自家公司的視頻大模型,一方面無需考慮到數(shù)字出境、數(shù)據(jù)審查的問題,另一方面,垂直大模型的參數(shù)量也較小,因此推理的速度將會大大加快。

雷濤認為,AIGC時代下光有技術(shù)是不夠的,還有能提供直接使用的場景,這樣技術(shù)才能被更高頻率、更大范圍地應(yīng)用起來,而在這方面,垂直領(lǐng)域的玩家具有先天的自身優(yōu)勢,因為它本身就更懂市場。

在雷濤看來,目前私域經(jīng)濟成為趨勢,行業(yè)專家、律師、理財顧問等群體有私域運營的需求。但這里就會面臨一種情況:他們想要對一件事情發(fā)表觀點,但是他可能自身在視頻面前的表現(xiàn)力不強,或者沒有足夠的時間出境,這時,有一個數(shù)字人幫他出鏡,這樣就會很好滿足這部分人的需求。

▲新壹科技數(shù)字人平臺的2D寫實數(shù)字人可代替真人出鏡

雷濤預(yù)計,在未來一年里,新壹科技將打造100萬個數(shù)字人。目前,新壹科技的數(shù)字人平臺同時面向To B端和To C端,To B端主要面向一些大客戶的定制化需求,例如目前該公司正在與蔚海燦娛合作,專攻“明星數(shù)字人”市場。此外,To C端也正開放給具有打造個人IP需求的視頻創(chuàng)作者們。

未來,新壹科技還計劃進軍影視領(lǐng)域。在雷濤看來,以目前技術(shù)發(fā)展階段來看,數(shù)字人還只能承擔(dān)邊緣性的人物角色,同時數(shù)字人在影視領(lǐng)域大規(guī)模落地還有很長的路要走。

對于目前數(shù)字人在電商直播、養(yǎng)老等領(lǐng)域落地,雷濤還指出,數(shù)字人目前還不能完成真人在直播間中銷售的全流程工作,同時真正起到對老人的陪伴作用仍需技術(shù)上的攻克,“目前行業(yè)設(shè)想的許多場景,離真正實現(xiàn)仍有一段距離。”

結(jié)語:數(shù)字人不再是“吉祥物”,新壹科技推動數(shù)字人在“視頻創(chuàng)作”領(lǐng)域落地

事實上,在過去幾年,數(shù)字人雖然作為“資本的寵兒”,但一直都是“吉祥物”般的存在,在具體行業(yè)落地方面一直存在瓶頸。

新壹科技基于自身20年視頻領(lǐng)域經(jīng)驗,打造出的視頻大模型進一步推動了視頻生產(chǎn)力的提升,同時基于大模型的數(shù)字人平臺不僅可以節(jié)省數(shù)字人生產(chǎn)成本,而且還使數(shù)字人進一步擁有了“靈魂”。在私域經(jīng)濟不斷發(fā)展的當下,普通人打造個人IP的需求更加強烈,這將進一步推動數(shù)字人在視頻領(lǐng)域的落地。

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團隊 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - www.zzkede.cn All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號-3