重塑未來!訊飛星火領跑國產大模型?
互聯網曾經近乎重寫了所有行業,通訊、購物、支付、打車、點餐等等,人們生活的方方面面幾乎被重塑。
如今大模型再次給予人們充分的想象空間。
第一財經提到,從樂觀的角度來看,ChatGPT可以取代一些重復性較強、規律性較為單一的工作,但同時它也可以釋放出更多的生產力,讓人們關注更有想象力、情感、思辨性的部分,并催生出AI提示工程師、AI調教師、AI創意師等一批新興職業。
【資料圖】
簡單來說,大模型相當于一個全新的系統,這個全新的系統可以大幅降低很多行業的門檻,未來也會有很多產品構建需要用到大模型,而人們的創造性勞動,將通過這個全新的系統得到大幅釋放。
根據中國科學技術信息研究所的不完全統計,目前國內已經發布了70多個大模型,不少產品都展現出了驚人的爆發力。
拿科大訊飛來說,基于訊飛星火認知大模型研發的功能落地學習機、辦公本等產品之后,科大訊飛今年再次突破高增速,618銷售額同比增長125%,并在多個品類中摘獲銷售額冠軍。
這一點,同樣體現在資本市場。6月20日,AI概念股表現搶眼,科大訊飛漲近7%,復權股價同樣創歷史新高。科大訊飛成交102億元,在兩市居首。
剛好筆者可以使用訊飛星火大模型了,最近也看到了不少有趣的測試,我們就一起看看現在的AI大模型發展到什么程度了。
1、錯別字識別哪家強
高考作文想必大家都看膩了,前陣子看到《智商稅研究中心》的這篇校對測評的設問還挺特別。
篇幅有限,拎出幾個比較能拉開差距的問題,來跟大家一起分享看看。
首先是字詞方面。
“洛陽親友如相問,就說我在岳陽樓。”將“相問”錯拼成“翔問”,考驗一下各家大模型的基本功。
訊飛星火:
文心一言:
通義千問:
360智腦:
GPT4:
訊飛星火、文心一言、通義千問、GPT4都順利完成基礎的校對,只有360智腦,追問之下仍表示無誤。
再來看語病方面。
校對語病的例子中整體表現不佳,不過讓AI直接識別判斷是否有歧義,還是能看出一點國產AI大模型之間的差距。
例如,“這句話有歧義嗎:在床上‘葛優癱’了一天,他突然想起來了。”
訊飛星火:
文心一言:
通義千問:
360智腦:
GPT4:
這里雖然幾乎全軍覆沒,不過訊飛星火還是指出了“可能存在一些解讀上的歧義”,一直表現不錯的GPT4沒能看出歧義還是有點意外。
最后看下指正校對錯誤后,AI大模型能否承認錯誤接受指正。
訊飛星火:
文心一言:
通義千問:
360智腦:
GPT4:
這部分訊飛星火意外地跟GPT4表現得旗鼓相當,反應迅速,簡潔明了,承認錯誤后直接給出了校對后的句子;文心一言還要再進一步給出指令才會給出答案;而通義千問和360智腦則是“積極認錯,堅決不改”。
校對文本錯誤在某種層面上,反映了大模型的基礎能力,地基打好了,才能有更多上探的空間。
總體來說,在基礎的校對能力上,訊飛星火算是國產大模型中最接近GPT4水平的;其他表現也中規中矩;至于360智腦,用360掌門人周鴻祎在360首發時的話來說,360智腦還只是個“孩子”,距離完善使用還有相當的一段路要走。
2、“數學高手”
寒窗苦讀十余年,無論教育制度怎么改,除了語文,還有一個怎么也躲不掉的,就是數學。
數學的重要性不言而喻,它培養了我們的邏輯思維能力。但相對于大模型擅長的文本內容,數學能力在一定程度上算是大模型的弱項
不過上個月才出的訊飛星火意外地表現有些驚喜。
訊飛星火首發后,知名科技行業觀察者《差評》,就曾對訊飛星火作出過全面測評,在數學測驗部分,也展示了訊飛星火基礎的數學能力,全部答對毫無壓力。
經典的雞兔同籠問題,即使變換參數和問法也能全部答對。
用《差評》文中的話來說,訊飛星火做數學題,有一種過于強大,可以和GPT4掰掰手腕的感覺。
這種感覺,將國產大模型的回答都放一起后則更加強烈。
《科創板日報》就曾在一篇文章中,對文心一言、科大訊飛、360智腦幾家比較有代表性的大模型進行測評展示。
例如,“某次數學競賽共20道題,評分標準是:每做對一題得5分,每做錯或不做一題扣1分。小華參加了這次競賽,得了64分。問:小華做對幾道題?”
正確答案應該是14題,我們看一下各家大模型的作答。
文心一言:
360智腦:
訊飛星火:
可以看到只有訊飛星火答對了,文中展示的另一道小升初數學題,同樣也只有訊飛星火答對。
《科創板日版》在文章開頭也指出,科大訊飛星火認知在數理能力表現尤為突出。
那到底能突出到什么程度呢?
我們繼續對訊飛星火加大難度看看。
大模型在數學領域的表現有著見微知著的效果,因為這需要結合大語言模型和計算引擎兩者的能力。在復雜邏輯條件下,學習多步驟推理,這對計算資源和數據,有著海量需求,對算力也有著極高的要求。
訊飛星火在數學方面能力的展示,更是一家企業數據資源和算力水平的展示。對于國產大模型來說,數學能力是意義非常的。
不過,大模型不是一朝一夕就能訓練完成的,如何落地?能不能落地?也是企業需要考慮的。
3、落地前景
大模型的出現注定是要破舊立新的,技術的發展回歸到現實生活中,還是要看它的實際應用能力。
《娛樂資本論》做過一期市面上主流的5款大模型,一共90個回答的橫評,想必耗費了不少時間精力,整體評價也是比較中肯的,頗具參考意義。
可以先看一下這張最終測試評分表。
大模型這種屬于比較底層的框架,我們勢必要做出自己的由中文語料訓練而成的大模型。所以我們不可避免地會與ChatGPT相比較。
從上圖來看,目前在落地應用方面,訊飛星火在主流國產大模型中,離ChatGPT是最近的。
具體到案例中,我們截取小紅書帶貨的商業文案來看一下。
文案較長,內容有所折疊,不過總的來說,文中展示的兩個作答還是比較貼切的。
星火自設了一款手機型號進行更準確的數據呈現,內容和邏輯這種長處不作過多分析,主要拉開差距的地方還是要求中的emoji表情。
相較于文心一言和天工未能察覺出需要在文案和題中帶有emoji表情,星火的emoji甚至還有關聯性,直接拿去發小紅書基本也足夠了。
《TMT時報》的記者也對文心一言、通義千問、訊飛星火的商業文案能力做過測試。
文心一言:
通義千問:
訊飛星火:
文心一言雖然洋洋灑灑寫了不少,不過作為海報文案還需再精簡一番;通義千問整體表現不錯,不過相對更側重中秋,而失了商業主體的主導作用;訊飛星火完成度依舊出色,也更突出所設定的AI醫療公司的保護健康的作用,是可以直接拿來使用的程度。
其實訊飛星火在落地應用方面,還做出了不小的嘗試。
訊飛星火升級到V1.5版本后,新增了星火助手功能,人手一個賈維斯不再是幻想。
目前經審核上傳的星火助手多達500多個,遍及各個行業和細分領域,還支持自己創建,并不斷調試出符合自己需求的專屬小助理。
除了我們比較能想象到的日常辦公,筆者對其中的腦暴部分更加感興趣,比如這個“小說靈感記錄員”。
從動物社會結構,到智慧與力量的平衡,再到文化傳承等等,這對創作類相關行業的增益可想而知。
星火助手發布時間還并不長,整體來看,仍有不少需要調試改進的地方。
不過,隨著時間的推移,星火助手在落地能力以及前景等方面已經展示出了相當的潛力。
4、尾聲
中國科學技術信息研究所發布的一份報告顯示,從全球已經發布的大模型分布來看,在大模型數量上,中國和美國超過全球總數的80%,中國從2020年進入大模型快速發展期,目前與美國保持同步增長態勢。
除了大模型,應用端也呈現出爆發式增長的態勢。
中國經營報在3月的一篇文中提到,天眼查數據顯示,截至當時,人工智能相關企業258.8萬余家,其中,2022年新增注冊企業73.2萬余家,新增注冊企業增速41.5%;近三年(2020~2022年)人工智能相關企業新增注冊企業增速均超過40%。
大模型以及大模型相關的企業,正在如雨后春筍般涌現。
時代的機遇下,作為國產大模型的重要代表之一,訊飛星火也已經隱隱有了燎原之勢。
關鍵詞:
您可能也感興趣:
為您推薦
全球球精選!鹽田港:子公司深汕運營公司經營的小漠港已逐步開展汽車整車滾裝業務
《陰陽師》共赴尋森之涂活動獎勵介紹
新華人壽原董事長萬峰被開除黨籍:靠金融吃金融,收受巨額財物|世界播報
排行
最近更新
- 重塑未來!訊飛星火領跑國產大模型?
- 大型無人機FH-98國內首次夜航轉場成功
- 環球短訊!《好運設計》的學與思
- 我國最大海上油田累計生產原油突破5億噸
- 人工智能賦能千行百業 領航數字生產力躍升蝶變_焦點快看
- 世界快報:近30名外籍友人參訪呼和浩特:民眾熱情,喜歡這座城市
- 市十六屆人大常委會第十三次會議閉會-全球聚看點
- 承載式車身,三個版本可選,入門級轎卡Rampage正式發布
- 信息:這一新技術,讓飛行模擬機代際升級!讓更多智慧“照進...
- 全新一代凌云官圖發布!樹立中級性能SUV價值新標桿|全球快訊
- 注意!21日至25日湘中湘南有持續性暴雨大暴雨 前沿熱點
- 每日視訊:房貸降息后以前的貸款跟著降嗎?一文簡單探討房貸...
- 【全球快播報】“千萬工程”調研行丨扮靚海上花園 煥發發展...
- 公共場所英文標識出現謬誤?廣州市民可來糾錯贏好禮! 天天...
- 招生錄取批次如何劃分?廣東省教育考試院詳解
- 最新:赴一場美食盛宴 找一段城市記憶 寶雞市渭濱區新民巷...
- 夏天梨形身材姑娘怎么穿?這幾款單品可以買起來,既遮腿粗還涼快
- 2023年端午檔大片云集,你最“粽”意哪一部?|每日熱門
- 溫州發布雷電黃色和暴雨橙色預警!接下來的端午假期……
- “千萬工程”調研行丨扮靚海上花園 煥發發展活力——浙江溫...
- 天天熱文:中國天眼FAST發現軌道周期最短脈沖星系統 為經典...
- 羅馬諾:阿森納接近簽下哈弗茨,球員轉會費總額6500萬鎊
- 熱門:《秀我中國 | 新時代中國鄉村志(第四集):千年梯田...
- “中國天眼”發現軌道周期最短的脈沖星雙星系統
- 北部戰區空軍某臺站:差異化訓練攻克體能短板_天天快消息
- 全球球精選!鹽田港:子公司深汕運營公司經營的小漠港已逐步...
- 分享酥皮月餅的做法及配方 ,我這樣做酥皮月餅(輕糖輕油)...
- 萬科企業(02202.HK):王蘊獲選舉為職工代表董事
- 昆工科技(831152):與云之端網絡(江蘇)股份有限公司簽訂戰略...
- 邱禮濤編劇《獵金之旅》正式立項 聚焦金融行業 新資訊
今日要聞
- 公共場所英文標識出現謬誤?廣州市民可來糾錯贏好禮! 天天最資訊
- 全球看點:東阿阿膠因未按時履行法律義務被強制執行1041萬 一季度末賬上現金60億
- 世界快報:近30名外籍友人參訪呼和浩特:民眾熱情,喜歡這座城市
- “酷暑經濟”帶熱國產汽水,高毛利能否夾縫求生-環球滾動
- 貴陽高新區:知識產權服務進企業?“面對面”紓困解難促發展|每日速訊
- 去美國的機票大約多少錢_去美國機票一般多少錢
- 杭州高新區(濱江)AIGC發展論壇舉行
- 觀察:西部(重慶)科學城簽約重點招商項目14個??合同投資額227億元
- 全新一代凌云官圖發布!樹立中級性能SUV價值新標桿|全球快訊
- 環球短訊!煙臺高新區2家企業入選山東省“一企一技術”研發中心