人工智能讓新聞主播“分身”有術
來源:中國知識產權報
日前,一年一度的“3·15”維權晚會如期舉行,今年中央電視台請來了一位幫手——以主持人姚雪鬆為原型的AI(人工智能)合成主播“姚小鬆”,播報預告“3·15”晚會相關消息。而在剛剛閉幕的全國兩會期間,新華社繼去年推出以邱浩為原型的AI合成主播后,再次推出以屈萌為原型的AI合成主播“新小萌”,向世界播報我國兩會盛況,引來眾多外媒關注甚至“驚嘆”。
這些AI合成主播運用搜狗分身技術,能夠在提供文字的情況下自主播報,與真人看起來幾乎無異。作為融媒體發展的積極探索,人工智能如何讓新聞主播“分身”有術,是否真的在淘汰傳統新聞主播的路上又前進了一步?
主播“分身”實現24小時播報
在今年兩會新聞播報中,觀眾可以看到“新小萌”已從過去AI合成主播“坐著”播新聞,升級為具有肢體動作的“站著”播報,其長相、聲音、表情和主持人屈萌幾乎達到了以假亂真的程度。這正是搜狗分身技術在傳媒業的具體應用。
“搜狗分身技術可以實現機器逼真地模擬人類說話時的聲音、嘴唇動作、表情以及肢體語言,創造出人類的AI分身,從而代替人類從事一些低腦力勞動,將人類從繁瑣單一的工作中解放出來。”搜狗語音技術交互中心負責人陳偉在接受中國知識產權報記者採訪時介紹,運用搜狗分身技術,通過錄入真人主播的手勢、表情、語音,隻需幾個小時的視頻資料就能訓練出主播的虛擬“分身”。當“分身”制作完成后,隻需輸入文本,合成主播就能聲情並茂地播送新聞,而且不會出現真人播報時容易出現的口誤等問題。
對於極重時效的傳媒業,AI合成主播的意義顯而易見。陳偉認為,一方面,AI合成主播大大縮短新聞制作流程,無論何種場景都能快速上崗,還能做到24小時不間斷播報,保証了新聞時效性﹔另一方面,該技術將主播從技術含量較低的播報中抽身出來,騰出更多的時間和精力錄制訪談類、深度報道類節目。
截至目前,新華社的AI合成主播已生產幾千條新聞報道,參與了包括第五屆世界互聯網大會、首屆中國國際進口博覽會、2019春運、春節、兩會等若干重要新聞的報道。
“分身”專利提升智能化水平
雖然搜狗最早於去年7月對外公布“分身”技術,但陳偉介紹,AI合成主播並不是花幾個月就突擊出來的,而是搜狗從2012年就開始投入語音識別相關研究以來,融合了多項前沿技術的集大成者。
具體來說,AI合成主播在模型訓練方面,主要涉及人臉關鍵點檢測、人臉特征提取、人臉重構、唇語識別、情感遷移、深度學習等多項技術,還需要結合語音、圖像等多模態信息進行聯合建模,生成與真人無異的AI分身模型,而在提供文本進行輸出時,又會涉及語音合成、唇形合成、表情合成等技術。其中,語音合成是通過機械的、電子的方法產生人造語音的技術,搜狗採用了目前最先進的端到端基於神經聲碼器的技術,可以讓發音的真實度大大提升。
出門問問信息技術有限公司知識產權高級經理胡延對搜狗的人工智能技術進行了初步檢索,從檢索結果來看,2015年至2018年搜狗在語音和視覺處理等人工智能關鍵技術方面的專利申請量呈現顯著增長趨勢,其中大部分是在國內進行專利布局,也有一少部分通過《專利合作條約》(PCT)途徑提交國際專利申請﹔從專利類型來看,發明專利申請佔比達到了99.5%﹔從分類號來看,視頻圖像處理、自然語言處理、自然語言合成、語音處理及合成等領域的專利申請數量基本持平,可見搜狗對這些關鍵技術的研究投入比較均衡﹔涉及“AI合成主播”的關鍵技術,搜狗也提交了相關專利申請,不僅包括面部、唇形合成等技術,還對皮膚如何進行處理等技術細節也進行了專利布局。
“對我們而言,分身技術的發展還只是起點,未來還有很多需要突破的難點。但我們一直在通過提交專利申請,進行相關布局。”陳偉表示。
AI技術助力融媒體發展
在AI合成主播驚艷亮相之初,有人覺得,表情僵硬,感情欠缺,也有人驚呼,新聞主播將面臨失業危機。
實際上,在“人負責腦力思考,機器負責運行和計算”的現階段,AI合成主播還有很大的局限性。搜狗CEO王小川曾表示,AI技術分為感知技術和認知技術。在感知聲音、圖像等技術方向上,機器基本有機會可以做到跟人一樣好。但是在認知技術方向上,機器背后的推理、知識、思考,以語言為核心的邏輯性內容,機器的處理能力則是有限的。
在胡延看來,目前AI合成主播還只是根據輸入的文本信息進行播報,表情不夠豐富,也缺乏互動能力,結合語境的能力有限,隻能在相對簡單的場景下應用,比如普通的播音場景,而在對語言和情感要求高的場景下,目前新聞主播還是無法取代的。
對於陳偉而言,眼下他主要解決的還是逼真度的問題。“AI合成主播無法避免與真人對比。隨著觀眾的期望越來越高,就會關注主播的微表情,比如開心時有些眉毛上揚或者微抖動以及語音合成在情感和情緒上的處理等,這些都是需要攻克的問題。”當然,他希望未來“能夠給用戶創造出具有自然交互與知識計算能力的分身模型和分身能力”。
值得關注的是,在媒體加速轉型發展的當下,借力AI已成大勢所趨。不少新聞媒體單位積極探索人工智能與新聞場景的深度融合。胡延認為,AI技術在數據採集、處理等方面具有優勢,可極大提升傳媒業的效率,提供更豐富的新聞產品形態,也有助於媒體精准營銷。新華社相關負責人表示,與搜狗合作推出AI合成主播,是新華社運用人工智能技術,推動媒體融合發展的重要舉措。雙方將結合自身業務發展需要,以AI合成主播項目為核心,在人工智能應用於新聞採編領域開展全方位合作。(劉仁)
分享讓更多人看到
推薦閱讀
相關新聞
- 評論
- 關注