數(shù)據(jù)是人工智能的“燃料”,而數(shù)據(jù)標注則是人工智能訓練師的重要工作之一。8月15日,記者走進位于海口數(shù)字科技創(chuàng)新平臺的百度智能云(?)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地時,人工智能訓練師王振揚正與同事分組開展數(shù)據(jù)采集和標注工作,為人工智能“煥新”升級提供源源不斷的數(shù)據(jù)支持。
每一個擁有“聰明大腦”的人工智能背后,都有無數(shù)個人工智能訓練師在提供大數(shù)據(jù)支持。當前,?谡ν苿訃覕(shù)據(jù)標注基地試點建設(shè),一批又一批人工智能訓練師得以在這里扎根生長,助推人工智能由技術(shù)研發(fā)走向千行百業(yè)。
□本報記者 王子豪/文 康登淋/圖
當好人工智能的“老師”
開車出門,可根據(jù)車流量實時調(diào)整放行時長的AI信號燈緩解擁堵;手機拍照,AI可識別出場景、花草類別,并優(yōu)化鏡頭參數(shù);撰寫文稿,AI能在數(shù)秒內(nèi)完成校對糾錯,并給出修改建議……當前,人工智能正快速走進大眾生活,而人工智能訓練師則是幕后不可或缺部分。
王振揚在進行數(shù)據(jù)采集和標注。
人工智能訓練師是干啥的?作為一名熱衷于挑戰(zhàn)自我的“技術(shù)宅”,帶著對新行業(yè)的疑問和憧憬,2023年11月,畢業(yè)于計算機專業(yè)的王振揚成為了最早一批入職百度智能云(?)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地的員工。“AI猶如一張白紙,我們通過向它‘投喂’經(jīng)過人工篩查及加工的海量文本和圖像數(shù)據(jù),讓AI模型更能理解人類的世界!蓖跽駬P告訴記者,隨著AI技術(shù)的廣泛應(yīng)用,他們所加工的數(shù)據(jù)類型也從單純的文本拓展到了圖像、語音、視頻等領(lǐng)域,工作效率得到了明顯提升,“我第一天工作的時候處理600條數(shù)據(jù)花了十多個小時,如今快的話只需七八個小時就能處理800條數(shù)據(jù)。我們提供的‘養(yǎng)分’越多,AI大模型的學習效率也就能得到成倍增長,為用戶輸出更加準確且有價值的內(nèi)容,惠及更多用戶群體!
從“開拓者”到“引路人”
人工智能訓練師的職業(yè)前景如何?來自觀研天下數(shù)據(jù)中心的統(tǒng)計數(shù)據(jù)顯示,2023年全國數(shù)據(jù)標注行業(yè)規(guī)模達到60.8億元,同比增長約19.69%,未來仍有望保持快速增長。置身人工智能“新藍!,這讓王振揚對未來發(fā)展信心十足。
“今年5月,我順利通過了人工智能訓練師高級工認證考試。同時,我也開始嘗試帶領(lǐng)團隊,將職業(yè)目標從提高自我工作效率改變?yōu)樵黾訄F隊整體產(chǎn)出!蓖跽駬P告訴記者,他正努力探索從“開拓者”到“引路人”的身份轉(zhuǎn)變,通過開展內(nèi)部培訓等方式,幫助更多行業(yè)新人“少走些彎路”。
記者在采訪時了解到,如今,在百度智能云(?)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地,越來越多行業(yè)新人在這里完成人工智能訓練師的職業(yè)生涯成長蛻變。當前,百度智能云正與?谑袛y手打造人工智能數(shù)據(jù)底座,助力?诋a(chǎn)業(yè)、平臺、企業(yè)加快數(shù)字化轉(zhuǎn)型,推動?跀(shù)字經(jīng)濟高質(zhì)量發(fā)展。截至今年5月,?诨乩塾嬋腭v本地數(shù)據(jù)標注企業(yè)9家,現(xiàn)場從業(yè)人員達1000余人。
今年3月,?谑行畔⒅行氖着34名工作人員成功通過人工智能訓練師考試并獲頒證書。?谑行畔⒅行南嚓P(guān)負責人介紹,下一步?谶將成立人工智能工作室,持續(xù)拓寬數(shù)字人才培養(yǎng)的領(lǐng)域和層次,為相關(guān)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型提供智力支撐。
新職業(yè)名片
人工智能訓練師是指使用智能訓練軟件,在人工智能產(chǎn)品實際使用過程中進行數(shù)據(jù)庫管理、算法參數(shù)設(shè)置、人機交互設(shè)計、性能測試跟蹤及其他輔助作業(yè)的人員,主要負責從各種來源收集數(shù)據(jù),并對數(shù)據(jù)進行預處理和清洗,從而優(yōu)化提高人工智能大模型準確性和性能。