首頁 新聞 > 創(chuàng)新 > 正文

“人工智能訓(xùn)練師”究竟做些啥

最近,人社部公布了一批新職業(yè),其中有個新職業(yè)叫作“人工智能訓(xùn)練師”。聽起來高大上的人工智能還要人來訓(xùn)練?誰能訓(xùn)練這些看不見、摸不著的人工智能?“人工智能訓(xùn)練師”究竟做些啥?關(guān)鍵是,掙得多不多?

帶著這些問題,經(jīng)濟日報記者近日走訪了百度(山西)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地。這里是目前國內(nèi)從業(yè)人員與產(chǎn)值規(guī)模第一的單體數(shù)據(jù)標(biāo)注基地,入駐企業(yè)35家,AI數(shù)據(jù)標(biāo)注師從業(yè)人員超過2300人。

“我是數(shù)據(jù)標(biāo)注員,中專學(xué)歷,每天工作8小時,大概能掙300多元。”面對記者的問題,山西麟諾網(wǎng)絡(luò)科技有限公司的李宇龍自豪地給出了答案。這個收入對在太原生活的年輕人來說算高水平了——數(shù)據(jù)顯示,2019年,太原市城鎮(zhèn)居民人均可支配收入36362元。不過,李宇龍說自己不算最高的,“我有的同事一天能掙1000多元”。

李宇龍學(xué)歷不高,原本與人工智能沒什么關(guān)系。2018年,山西麟諾網(wǎng)絡(luò)科技有限公司成立,李宇龍經(jīng)朋友介紹來到這家公司。

“當(dāng)時我也不知道數(shù)據(jù)標(biāo)注員是做啥的,更沒聽說過人工智能。老板就交給我一套規(guī)則,讓我按照規(guī)則在電腦上認(rèn)車道線。”那時20歲出頭的李宇龍正是肯學(xué)的時候,短時間內(nèi)就熟悉了規(guī)則,還總結(jié)出標(biāo)注車道的新規(guī)律。

作為這項新職業(yè)的老員工,李宇龍已轉(zhuǎn)型培訓(xùn)師,除了日常工作,還承擔(dān)起公司新員工的培訓(xùn)教學(xué),“有的同事會轉(zhuǎn)型做項目或者內(nèi)容審核員,還是有上升空間的”。

“數(shù)據(jù)標(biāo)注技術(shù)門檻低,招工人群范圍廣泛,對于促進就業(yè)作用顯著。”山西麟諾網(wǎng)絡(luò)科技有限公司負(fù)責(zé)人李應(yīng)維告訴記者,目前公司招聘的員工以大專生為主;標(biāo)注規(guī)則由百度與相關(guān)領(lǐng)域?qū)<夜餐贫ǎ⑿纬煽刹僮鬈浖脚_提供給企業(yè),對員工簡單培訓(xùn)就能上手。以人臉為例,目前他們能實現(xiàn)對約150個特征點的標(biāo)注。大致標(biāo)注規(guī)則是數(shù)據(jù)標(biāo)注師看到雙眼皮就標(biāo)記雙眼皮,看到獅子鼻就標(biāo)記獅子鼻,讓機器自己理解與學(xué)習(xí)。標(biāo)注特征點越多,AI就越能精確識別人臉。

看似簡單的工作,背后是龐大數(shù)據(jù)基礎(chǔ)做支持。算法、算力與數(shù)據(jù)是人工智能發(fā)展的三大要素,其中數(shù)據(jù)是人工智能發(fā)展的燃料。每天,人類社會產(chǎn)生的海量數(shù)據(jù)必須經(jīng)過清洗與標(biāo)注,換成人工智能熟悉的語言才有價值。因此,人工智能訓(xùn)練師主要任務(wù)就是數(shù)據(jù)采集和標(biāo)注,特別是數(shù)據(jù)標(biāo)注。如果說人工智能是個孩子,數(shù)據(jù)標(biāo)注師就是帶領(lǐng)這個孩子認(rèn)識世界的啟蒙老師。有了足夠多、足夠好的數(shù)據(jù),AI才能學(xué)會像人一樣去感知、思考和決策,更好地為人類服務(wù)。

人工智能產(chǎn)業(yè)發(fā)展之初,數(shù)據(jù)采集與標(biāo)注需要人力完成的部分比較多,現(xiàn)在數(shù)據(jù)平臺已有了持續(xù)學(xué)習(xí)能力,大部分采集與標(biāo)注工作人工智能自己就可完成,實現(xiàn)預(yù)標(biāo)注與自動標(biāo)注。因此,目前數(shù)據(jù)標(biāo)注工作以機器輔助與人工標(biāo)注結(jié)合為主。除了眼底檢查片、肺部X光片等技術(shù)含量較高有專業(yè)要求,大多數(shù)員工均能按照規(guī)則,在平臺上完成語音、人臉、道路的標(biāo)注操作,只要能熟練操作電腦即可。

郭梅是新職業(yè)的受益者。34歲的她原本在山西一家煤礦做監(jiān)控員,為照顧到太原上學(xué)的孩子,她到學(xué)校附近的數(shù)據(jù)標(biāo)注基地求職。經(jīng)過公司崗前培訓(xùn)與團隊幫助,她從起初每天標(biāo)注兩三百張圖,提升到每天能完成1300多張。

數(shù)據(jù)標(biāo)注員的工作隨著人工智能發(fā)展需求不斷調(diào)整。前幾年人工智能發(fā)展伊始,語音識別、人臉、圖像等識別需求大;近幾年無人駕駛進入發(fā)展快車道,郭梅與李宇龍的主要工作就改成無人車、地圖、3D點云等數(shù)據(jù)標(biāo)注,天天看的是車道線、行人、障礙物。

“還有一些語音識別項目,比如我們接了一些方言語音數(shù)據(jù)標(biāo)注項目,這就需要招聘當(dāng)?shù)厝藖硗瓿闪恕?rdquo;李應(yīng)維說。

有了足夠技術(shù)基礎(chǔ),數(shù)據(jù)標(biāo)注員還能教會人工智能新任務(wù)。疫情期間,戴口罩的人臉識別需求激增。“根據(jù)客戶需求,山西數(shù)據(jù)標(biāo)注基地采集了大量戴口罩人臉照片,由數(shù)據(jù)標(biāo)注師對眉毛、眼鏡、顴骨等人臉關(guān)鍵點精準(zhǔn)標(biāo)注,訓(xùn)練人工智能完成了戴口罩人臉圖像識別。”百度(山西)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地負(fù)責(zé)人尉赤說,“人們能在不摘口罩情況下實現(xiàn)精確體溫測量,或是通過人臉閘機,背后就是這些數(shù)據(jù)標(biāo)注員在訓(xùn)練人工智能。”

艾瑞咨詢發(fā)布的《中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)白皮書》預(yù)測,隨著全球人工智能產(chǎn)業(yè)、物聯(lián)網(wǎng)、5G的爆發(fā)式增長,到2025年,全球每年產(chǎn)生的數(shù)據(jù)量將從2016年的16.1ZB猛增至2025年的163ZB,其中80%至90%是非結(jié)構(gòu)化數(shù)據(jù),需要經(jīng)過清洗與標(biāo)注才能被喚醒價值。在我國,每年需要標(biāo)注的語音數(shù)據(jù)超過200萬小時,圖片則有數(shù)億張。因此,人工智能數(shù)據(jù)標(biāo)注師的崗位需求將持續(xù)增長。尉赤透露,今年基地新招了500多人,未來5年計劃培養(yǎng)5萬名AI數(shù)據(jù)訓(xùn)練師,并引入更多AI合作伙伴。李應(yīng)維也預(yù)計,到明年自家企業(yè)用工將翻一番,從160多人擴展到300人左右。未來,數(shù)據(jù)標(biāo)注將成為創(chuàng)造大量就業(yè)需求的新興職業(yè)領(lǐng)域。(佘 穎)

關(guān)鍵詞: 人工智能訓(xùn)練師

最近更新

關(guān)于本站 管理團隊 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2018 創(chuàng)投網(wǎng) - www.zzkede.cn All rights reserved
聯(lián)系我們:33 92 950@qq.com
豫ICP備2020035879號-12