春節(jié)期間,浙江省杭州文化廣播電視集團的《杭州新聞聯(lián)播》節(jié)目,使用AI數(shù)字人進行新聞播報,且做到了零失誤率,引發(fā)社會關注。
數(shù)字人是指利用數(shù)字技術打造的、模擬人類特征并存在于非物理世界的虛擬人物。近年來,隨著5G、AI、VR等新一代信息技術的蓬勃發(fā)展,數(shù)字人的精細度和智能化水平不斷提升,一大批數(shù)字人走上不同工作“崗位”,加速融入日常生活。
接入大模型,變得更“聰明”
據(jù)了解,《杭州新聞聯(lián)播》已有6位數(shù)字人主播“上崗”,都擁有近似真人的形象以及逼真的表情動作。在經(jīng)過前期的畫面采集、聲音采集以及算法訓練之后,數(shù)字人主播已具備在直播態(tài)新聞播報中準確播報新聞的能力,因此有了新聞主播回家過年、AI主播“上崗”替班的情況。
一般而言,數(shù)字人通過數(shù)字建模手段實現(xiàn),涵蓋計算機圖形學、動作捕捉、圖形渲染、語音合成、深度學習等多項技術。杭州電視臺新聞主播雨辰說,她的數(shù)字分身“小雨”還在第一時間接入了DeepSeek-V3,所以相比之前,“小雨”變得更加“聰明”——不僅能理解人類語言、播報新聞,還能進行文稿審核和新聞素材整合。
其實,這并不是數(shù)字人主播首次面對觀眾。
在中阿衛(wèi)視中國新聞中心,去年春節(jié)就已用上數(shù)字人主播。“大家好,我是主持人畢諾,歡迎收看今天的《東方新視窗》……”在編輯機前,中阿衛(wèi)視中國新聞中心編輯通過簡單操作,讓數(shù)字人主播“畢諾-D”完成了一條新聞的出鏡和阿拉伯語口播。據(jù)中阿衛(wèi)視相關負責人介紹,沒有數(shù)字人的時候,一條兩三分鐘的新聞出鏡播報,前前后后至少要二三十分鐘。真人主播可能念錯,就要重新錄。一檔10分鐘的新聞節(jié)目,一共要忙兩三個小時。有了數(shù)字人,二三十分鐘就全部制作完畢。
業(yè)內人士觀察到,以往電視臺采用數(shù)字人主播,更多是在網(wǎng)絡端、新媒體端的嘗試,之后又在一些特別節(jié)目、晚會中應用,現(xiàn)在,數(shù)字人主播逐漸進入常態(tài)化的日播或周播節(jié)目。數(shù)字人之所以在廣電媒體領域廣泛應用,一方面是數(shù)字人的言行舉止可以進行預設和調整,提高了可控性;另一方面,數(shù)字人可以輕松切換姿態(tài)、發(fā)型等特征,不需額外支出播報場地、化妝師、服裝等費用,有利于節(jié)目形態(tài)創(chuàng)新。同時,數(shù)字人還能夠快速生成播報視頻,助力新聞單位搶抓時效性。
中國互聯(lián)網(wǎng)協(xié)會專家咨詢委員會委員、網(wǎng)絡文化與數(shù)字傳媒工委會主任武鎖寧接受本報采訪時表示,近年來,AI及數(shù)字人技術逐漸成為推動傳媒行業(yè)變革的關鍵力量,正重構內容生產(chǎn)模式,提供一種“人機雙軌制”的新型協(xié)作范式,即AI處理簡單的標準化內容,如天氣播報、新聞快訊等;人類則聚焦復雜的有創(chuàng)造性工作,如深度報道、新聞評論等?!拔磥?,隨著大模型在邏輯推理、自主決策等方面的提升,數(shù)字人將賦予新聞內容更強的互動性和個性化,推動人機交互進入全新階段,進而實現(xiàn)更加靈活、高效的內容生產(chǎn)和傳播?!?/p>
電商直播間,可“一鍵開播”
除了作為新聞主播在電視節(jié)目里嶄露頭角,數(shù)字人也在線上直播間“上崗”提供服務了。
“歡迎各位朋友來到直播間,我們是……”除夕當天,在某飲料品牌的直播間里,主播熟練地講起了開場白。事實上,這位主播是以該品牌負責人形象為原型制作的數(shù)字人。
為什么會試水數(shù)字人直播?該品牌表示,在春節(jié)假期這個時間段內,優(yōu)質的真人主播稀缺且合作成本高,于是他們決定嘗試一下當下很火的數(shù)字人直播。利用此前品牌負責人直播時的一段錄屏片段,他們復刻出了一個高度擬真的數(shù)字形象,并挑選了適配這一形象的具有極強感染力的音色,趕在年前制作完成。
“春節(jié)不打烊”的直播間里,數(shù)字人主播的智能問答能力能實時為用戶答疑解惑,智能互動和智能暖場能力則能有效促進互動、提升帶貨氛圍。數(shù)據(jù)顯示,春節(jié)期間,在這一飲料品牌使用數(shù)字人的直播中,CVR(從用戶點擊廣告到成為一個有效激活或者注冊甚至付費用戶的轉化率)指標提升了50%以上。
國家發(fā)展改革委等部門印發(fā)的《關于打造消費新場景培育消費新增長點的措施》提出,在明確標識和規(guī)范監(jiān)管的基礎上,探索利用人工智能大模型、虛擬現(xiàn)實全景和數(shù)字人等技術,拓展電商直播場景。記者了解到,在電商直播這一行業(yè),真人主播成本較高,長時間直播容易疲勞,因此有工作時長限制。相較之下,數(shù)字人主播可以7×24小時在線,AI生成直播腳本,輕松實現(xiàn)“一鍵開播”,可謂“低投入、高產(chǎn)出、續(xù)航久”,因此吸引了不少商家“嘗鮮”。
據(jù)百度AI全棧式數(shù)字人直播解決方案慧播星相關負責人介紹,在技術上,只需一段3-40分鐘的真人直播片段,即可生成對應的數(shù)字人形象,做好腳本、互動問答等配置后,數(shù)字人主播就能高效開播,做到聲音與口型匹配,口播準確,大幅度動作流暢自然。在腳本方面,大模型可以根據(jù)指令一鍵生成全文,也可以對輸入的文本進行仿寫、擴寫、精簡、潤色等;在智能互動方面,數(shù)字人能回答直播間用戶的問題、根據(jù)用戶需求講解商品,在領券、促單、邀請評論、調度素材展示商品細節(jié)等環(huán)節(jié)也能應對自如。
業(yè)內人士分析,數(shù)字人直播帶貨在創(chuàng)意創(chuàng)新、成本控制等方面具備優(yōu)勢。與真人主播團隊在培訓、薪資等方面的支出相比,數(shù)字人直播只需一臺電腦和一名運營,可大幅降低成本。不過,有用戶反饋,目前一些直播間的數(shù)字主播不夠靈活流暢,套用AI模板,無法提供滿意的解決方案等。相對于真人主播交流中的復雜內容,數(shù)字人主播的相關技術支持還不夠完善,需要持續(xù)進行升級和積累。
商業(yè)前景好,風險要注意
AI技術的廣泛介入,極大提升了數(shù)字人的交互能力、內容生成能力及智能化水平。目前,虛擬偶像、虛擬主播、數(shù)字員工已成為數(shù)字人中商業(yè)化應用最好、最具人氣的類別。2024首屆中國數(shù)字人大會發(fā)布的《中國數(shù)字人發(fā)展報告(2024)》預計,2025年中國數(shù)字人核心市場規(guī)模將達480.6億元,帶動產(chǎn)業(yè)市場規(guī)??蛇_6402.7億元。
AI在處理大量數(shù)據(jù)、執(zhí)行重復性任務方面具有顯著優(yōu)勢;且AI遵循算法和程序,能減少人為失誤,顯著提升效率。但是,隱私保護、數(shù)據(jù)安全、倫理問題等仍是未來數(shù)字人發(fā)展中不可忽視的風險。
武鎖寧表示,數(shù)字人技術廣泛落地,還需要建立數(shù)字形象授權認證體系、完善AI內容溯源機制、構建人機協(xié)作倫理框架等。“我們正在推動數(shù)字人應用標準的制定,推進數(shù)字人術語、管理、服務等基礎共性標準,數(shù)字身份多模態(tài)交互等關鍵技術標準,以及數(shù)字客服、數(shù)字員工等重點領域服務標準的研究與應用,建立健全數(shù)字人的標準體系?!蔽滏i寧說。
本報記者 葉 子
《人民日報海外版》(2025年02月28日 第 08 版)