年均復(fù)合增長率超20%,四部門發(fā)文促進數(shù)據(jù)標(biāo)注產(chǎn)業(yè)發(fā)展釋放了哪些信號?
人工智能背后的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)被關(guān)注,國家層面首次對數(shù)據(jù)標(biāo)注產(chǎn)業(yè)進行系統(tǒng)謀劃。
1月13日,國家發(fā)展改革委、國家數(shù)據(jù)局、財政部、人力資源社會保障部聯(lián)合印發(fā)《關(guān)于促進數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展的實施意見》(以下簡稱《實施意見》)?!秾嵤┮庖姟钒傮w要求、主要任務(wù)、保障措施三個部分,其中主要任務(wù)共計13條,圍繞深化需求牽引、增強創(chuàng)新驅(qū)動、繁榮產(chǎn)業(yè)生態(tài)、優(yōu)化產(chǎn)業(yè)支撐四個方面提出相關(guān)政策舉措。
《實施意見》提出到2027年,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)專業(yè)化、智能化及科技創(chuàng)新能力顯著提升,產(chǎn)業(yè)規(guī)模大幅躍升,年均復(fù)合增長率超過20%,培育一批具有影響力的科技型數(shù)據(jù)標(biāo)注企業(yè),打造一批產(chǎn)學(xué)研用聯(lián)動的創(chuàng)新載體,建設(shè)一批成效明顯、特色鮮明的數(shù)據(jù)標(biāo)注基地,形成相對完善的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)生態(tài),構(gòu)建創(chuàng)新要素聚集、產(chǎn)業(yè)鏈上下游聯(lián)動、區(qū)域協(xié)同發(fā)展的新格局。
為數(shù)據(jù)標(biāo)注產(chǎn)業(yè)提供全面指導(dǎo)
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)是對數(shù)據(jù)進行篩選、清洗、分類、注釋、標(biāo)記和質(zhì)量檢驗等加工處理的新興產(chǎn)業(yè)。培育壯大數(shù)據(jù)標(biāo)注產(chǎn)業(yè)對于提升數(shù)據(jù)供給質(zhì)量,推動人工智能創(chuàng)新發(fā)展具有重要支撐作用。
2020年2月,數(shù)據(jù)標(biāo)注員作為人工智能訓(xùn)練師的一個工種,就已被正式納入國家職業(yè)分類目錄。2024年5月,國家數(shù)據(jù)局發(fā)布了承擔(dān)數(shù)據(jù)標(biāo)注基地建設(shè)任務(wù)的城市名單,四川成都、遼寧沈陽、安徽合肥、湖南長沙、海南海口、河北保定、山西大同等7個城市承接了數(shù)據(jù)標(biāo)注基地建設(shè)任務(wù)書。
北京市社會科學(xué)院副研究員王鵬向澎湃新聞記者表示,隨著人工智能技術(shù)的快速發(fā)展,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)作為人工智能訓(xùn)練和應(yīng)用中的關(guān)鍵環(huán)節(jié),迎來了前所未有的發(fā)展機遇。然而,當(dāng)前數(shù)據(jù)標(biāo)注行業(yè)也面臨著行業(yè)標(biāo)準(zhǔn)缺乏、標(biāo)注質(zhì)量參差不齊、技術(shù)和人力資源需求不匹配等問題,制約了行業(yè)的健康發(fā)展。《實施意見》的出臺為數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的高質(zhì)量發(fā)展提供了全面的規(guī)劃和指導(dǎo)。
經(jīng)濟學(xué)家余豐慧也提及上述因素,并指出數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的發(fā)展不僅在于促進數(shù)字經(jīng)濟的健康發(fā)展,推動人工智能等前沿技術(shù)的應(yīng)用,同時可創(chuàng)造大量的就業(yè)崗位。
《實施意見》在深化需求牽引方面,給出了兩個方向,一是釋放公共數(shù)據(jù)標(biāo)注需求,其中提及鼓勵政府部門和企業(yè)協(xié)同開展政務(wù)大模型所需數(shù)據(jù)的標(biāo)注和訓(xùn)練,推動數(shù)據(jù)標(biāo)注服務(wù)納入政府采購范疇。二是挖掘企業(yè)數(shù)據(jù)標(biāo)注需求,其中提及,實施“國有企業(yè)數(shù)據(jù)效能提升行動”,加大企業(yè)數(shù)據(jù)開發(fā)利用,釋放企業(yè)數(shù)據(jù)標(biāo)注需求。圍繞醫(yī)療健康、人力資源、數(shù)字貿(mào)易、自動駕駛、低空經(jīng)濟等場景,以業(yè)務(wù)創(chuàng)新拉動數(shù)據(jù)標(biāo)注需求。
“《實施意見》強調(diào)了創(chuàng)新驅(qū)動在數(shù)據(jù)標(biāo)注產(chǎn)業(yè)發(fā)展中的重要性,包括支持關(guān)鍵技術(shù)攻關(guān)、推動技術(shù)融合創(chuàng)新等,也對企業(yè)有一些優(yōu)惠政策,包括研發(fā)費用加計扣除、高新技術(shù)企業(yè)稅收優(yōu)惠,旨在降低企業(yè)研發(fā)成本,鼓勵企業(yè)加大研發(fā)投入。”王鵬說。
具體來看,《實施意見》在開展關(guān)鍵技術(shù)攻關(guān)中提到,依托國家重點研發(fā)計劃、國家科技重大專項等,加強跨領(lǐng)域跨模態(tài)語義對齊、4D標(biāo)注、大模型標(biāo)注等數(shù)據(jù)標(biāo)注領(lǐng)域的關(guān)鍵技術(shù)攻關(guān)應(yīng)用。
在加大財稅金融支持力度方面,《實施意見》明確,落實研發(fā)費用加計扣除、高新技術(shù)企業(yè)稅收優(yōu)惠等政策。鼓勵有條件的地方加大數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的支持力度。各地區(qū)各部門可結(jié)合實際,統(tǒng)籌安排數(shù)據(jù)產(chǎn)品和標(biāo)注服務(wù)采購費用。充分利用各地發(fā)放的數(shù)據(jù)券、算法券和算力券等,降低數(shù)據(jù)標(biāo)注企業(yè)成本。鼓勵各類產(chǎn)業(yè)基金、專業(yè)投資機構(gòu)加大數(shù)據(jù)標(biāo)注產(chǎn)業(yè)投資力度,引導(dǎo)社會資本有序參與。
在提升標(biāo)注公共服務(wù)能力方面,《實施意見》表示,要建設(shè)數(shù)據(jù)標(biāo)注公共服務(wù)平臺,按照規(guī)范化接入和互聯(lián)互通要求,打造全國數(shù)據(jù)標(biāo)注公共服務(wù)“一張網(wǎng)”。
培育一批數(shù)據(jù)標(biāo)注龍頭企業(yè)
《實施意見》的發(fā)布,哪些企業(yè)可能受益?
對此,王鵬向澎湃新聞記者表示,一是數(shù)據(jù)標(biāo)注企業(yè),特別是具有技術(shù)優(yōu)勢和規(guī)模優(yōu)勢的企業(yè),將受益于政策的支持和市場的擴大;二是人工智能企業(yè),數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的高質(zhì)量發(fā)展將為人工智能企業(yè)提供更高質(zhì)量、更豐富的訓(xùn)練數(shù)據(jù),有助于提升人工智能模型的準(zhǔn)確性和效率;三是相關(guān)產(chǎn)業(yè)鏈企業(yè),包括數(shù)據(jù)采集、處理、分析等環(huán)節(jié)的企業(yè),將受益于數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的快速發(fā)展和產(chǎn)業(yè)鏈的完善。
值得關(guān)注的是,《實施意見》在培育繁榮生態(tài)方面,第六條提出著力壯大經(jīng)營主體,培育一批數(shù)據(jù)標(biāo)注龍頭企業(yè),鼓勵通過資源整合、并購重組等方式做大做強,推動數(shù)據(jù)標(biāo)注企業(yè)規(guī)?;?、標(biāo)準(zhǔn)化、集約化發(fā)展。支持和鼓勵科技創(chuàng)新型數(shù)據(jù)標(biāo)注企業(yè)承擔(dān)基礎(chǔ)研究、技術(shù)攻關(guān)、產(chǎn)業(yè)應(yīng)用等重點任務(wù),提高產(chǎn)業(yè)鏈協(xié)同創(chuàng)新水平。培育一批深耕行業(yè)的數(shù)據(jù)標(biāo)注瞪羚企業(yè)、獨角獸企業(yè)。第七條提及,積極完善產(chǎn)業(yè)生態(tài),暢通數(shù)據(jù)采集、標(biāo)注、人工智能應(yīng)用產(chǎn)業(yè)鏈,推動數(shù)據(jù)標(biāo)注產(chǎn)業(yè)上下游協(xié)同發(fā)展。
人工智能數(shù)據(jù)標(biāo)注產(chǎn)業(yè)上下游鏈條是怎樣的?
2024年11月,中國信通院曾發(fā)布“人工智能數(shù)據(jù)標(biāo)注產(chǎn)業(yè)圖譜”,圖譜收錄了來自全國各地500余家深耕數(shù)據(jù)標(biāo)注產(chǎn)業(yè)鏈上下游企業(yè),覆蓋超過16個行業(yè)領(lǐng)域。其中,上游是高質(zhì)量數(shù)據(jù)集開發(fā)和治理,包括算法服務(wù)、技術(shù)服務(wù)、平臺服務(wù)、交易服務(wù)、人力服務(wù);中游是數(shù)據(jù)資源提供和應(yīng)用,包括公共數(shù)據(jù)、行業(yè)企業(yè)數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù);下游是能力支持與生態(tài)發(fā)展,包括人才培養(yǎng)、生態(tài)培育、數(shù)據(jù)安全、標(biāo)注應(yīng)用。
咨詢公司Grand View Research的數(shù)據(jù)顯示,2022年全球數(shù)據(jù)標(biāo)注的市場價值為22.2億美元,預(yù)計到2030年將增長到171億美元。
澎湃新聞記者也曾探訪國內(nèi)頭部互聯(lián)網(wǎng)企業(yè)的人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地,在基地一間間的辦公室中,每個電腦前都坐著一名AI數(shù)據(jù)標(biāo)注師,他們將根據(jù)各自分配的任務(wù)對圖像、語音、視頻、文本進行標(biāo)注。AI數(shù)據(jù)標(biāo)注師技術(shù)門檻并不高,經(jīng)過一定的培訓(xùn)就能上崗,招工人群范圍廣泛,一些中?;蚋咧袑W(xué)歷的人員也可勝任這項工作。
《實施意見》也關(guān)注到標(biāo)注人才隊伍建設(shè)方面的工作,提出要以人才項目計劃和科技項目等為抓手,培育和引進高端專業(yè)人才。制(修)定人工智能訓(xùn)練、數(shù)據(jù)標(biāo)注相關(guān)職業(yè)國家職業(yè)標(biāo)準(zhǔn)。深化產(chǎn)學(xué)研融合,鼓勵行業(yè)聯(lián)盟、高校、科研院所與企業(yè)建立長期合作機制,加大數(shù)據(jù)標(biāo)注實踐項目、繼續(xù)教育和公共實訓(xùn)基地建設(shè)合作力度。
據(jù)悉,下一步,國家發(fā)展改革委、國家數(shù)據(jù)局、財政部、人力資源社會保障部將強化數(shù)據(jù)標(biāo)注產(chǎn)業(yè)頂層規(guī)劃,協(xié)調(diào)解決產(chǎn)業(yè)發(fā)展過程中存在的重大問題。加強政策解讀和案例征集等宣傳推廣,營造數(shù)據(jù)標(biāo)注產(chǎn)業(yè)發(fā)展的良好氛圍。
澎湃新聞記者 吳雨欣