2月8日,在北京冬奧會自由式滑雪女子大跳臺決賽中,中國選手谷愛凌憑借最后一跳的出色發(fā)揮逆轉(zhuǎn)奪冠,AI合成主播“小聰”用手語解說了這個激動人心的奪冠時刻。作為全球首個手語AI合成主播,“小聰”利用深度合成技術,為聽障人士獲取信息帶來極大便利。
作為人工智能領域的新應用,深度合成技術以深度學習、虛擬現(xiàn)實為代表的生成合成類算法制作文本、圖像、音頻、視頻,因較強娛樂性在社交媒體平臺廣受關注。相關研究顯示,在國內(nèi)外主流音視頻網(wǎng)站、社交媒體平臺上,2021年新發(fā)布的深度合成視頻數(shù)量較2017年增長10倍以上。
但大規(guī)模普及也導致濫用案例頻出。不久前,國家網(wǎng)信辦公布《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定(征求意見稿)》,對深度合成內(nèi)容的用途、標記、使用范圍以及濫用處罰作出具體規(guī)定。業(yè)內(nèi)認為,管理新規(guī)的即將出臺,意味著深度合成將迎來規(guī)范化發(fā)展關鍵期。
應用豐富 帶動產(chǎn)業(yè)快速發(fā)展
清華大學人工智能研究院、國家工業(yè)信息安全發(fā)展研究中心等日前聯(lián)合發(fā)布的《深度合成十大趨勢報告(2022)》指出,2017年以來,深度合成內(nèi)容被大量創(chuàng)作和傳播,數(shù)量逐年高速增長。
技術不斷成熟是深度合成內(nèi)容快速增長的重要原因。自2017年開始,深度合成領域新發(fā)表論文數(shù)量和開源項目均以每年30%的速度增長。“研究論文持續(xù)增多,開源技術工具、大量代表性方法集中涌現(xiàn),使得深度合成內(nèi)容的效果更加逼真、制作更加高效。”北京瑞萊智慧科技有限公司CEO田天告訴記者,縱觀計算機行業(yè)發(fā)展,開源項目已成為推動產(chǎn)業(yè)進步的強大力量,深度合成在開源社區(qū)中備受青睞,將繼續(xù)推動該技術在產(chǎn)業(yè)中落地。
通過升級傳統(tǒng)內(nèi)容制作方法,深度合成在影視制作、廣告營銷、社交娛樂等領域應用不斷豐富,包括AI合成主播、虛擬偶像、修復歷史老照片等。2021年,虛擬偶像洛天依登上央視春晚,2022年,已經(jīng)“出道”10年的她再次現(xiàn)身元宵晚會舞臺。公開數(shù)據(jù)顯示,2020年6月至2021年5月,共有32412位虛擬主播在嗶哩嗶哩開播,同比增長40%。
與此同時,越來越多的企業(yè)機構開始利用深度合成技術提供面向公眾的產(chǎn)品和服務,涵蓋圖像、視頻、音頻、文本等多個領域。語音合成已經(jīng)成為人機交互的重要一環(huán),被應用于智能客服、語音導航、有聲讀物、語音助手等場景,多家企業(yè)機構已發(fā)布基于深度神經(jīng)網(wǎng)絡技術合成音頻的商用開放平臺,而以文本為形式的深度合成在新聞報道、詩文創(chuàng)作、聊天問答等方面顯現(xiàn)出巨大的創(chuàng)作效率和潛力。
此外,“元宇宙”等新商業(yè)思維的提出也為深度合成提供更廣闊的應用場景。“深度合成將重新定義虛擬數(shù)字化空間,從傳播社會學意義上看,一個新的人類生存場景將以深度合成技術為基石展開。”清華大學新聞與傳播學院常務副院長陳昌鳳說。
風險加劇 檢測技術持續(xù)更新
深度合成激發(fā)新形式內(nèi)容創(chuàng)造的同時,也帶來新威脅、新挑戰(zhàn)。《深度合成十大趨勢報告(2022)》分析認為,深度偽造影響新聞對真相的記錄,對虛假內(nèi)容高難度甄別也降低了事實核查的有效性。在社會重大突發(fā)事件上,深度合成技術可能被用于操作輿論意見,借助社交媒體,使虛假信息短時間內(nèi)發(fā)酵。
隨著負面風險日益加劇,以及合成質(zhì)量不斷提升,基于生物特征的傳統(tǒng)鑒別方式越來越難以發(fā)揮作用。“目前對深度合成內(nèi)容的自動化鑒別主要依靠人工智能技術完成。”浙江大學網(wǎng)絡空間安全學院院長任奎介紹,訓練人工智能模型需要大量真實和偽造數(shù)據(jù),人臉和音頻數(shù)據(jù)都是高度敏感的個人信息,難以獲取,而偽造數(shù)據(jù)也包含各種不同方法合成的數(shù)據(jù),這都給構建自動化檢測能力帶來不小挑戰(zhàn)。
新型偽造方法的層出不窮,加上檢測算法存在結構性缺陷,反深度偽造檢測技術面臨“強對抗性”。田天解釋說,這類似于“貓鼠游戲”,深度合成和檢測在不斷學習攻防過程中會自我進化,規(guī)避上一代對抗技術,因此檢測技術需要持續(xù)更新與迭代優(yōu)化。
目前學術界和產(chǎn)業(yè)界均已對反深偽檢測投入了大量研究,谷歌、微軟等機構均推出深度合成視頻認證的方法或產(chǎn)品。在國內(nèi),瑞萊智慧推出的深度偽造內(nèi)容檢測平臺DeepReal,擁有工業(yè)級的檢測性能和應對實網(wǎng)環(huán)境對抗變化的檢測能力。“深度偽造檢測面臨持續(xù)的攻防和博弈,未來還需融合多模態(tài)內(nèi)容的取證分析、基于數(shù)字水印的溯源技術等多方面能力,實現(xiàn)精準識別。”清華大學人工智能研究院基礎理論研究中心主任朱軍說。
構建多維度治理機制
近年來,針對深度合成技術惡意使用所帶來的問題,世界各國紛紛出臺管理法律法規(guī),探索深度合成的治理路徑。歐盟將深度合成納入《通用數(shù)據(jù)保護條例(GDPR)》等現(xiàn)有法律框架規(guī)制,德國、新加坡、英國、韓國等國家,均有適用于深度合成技術相關犯罪案件審理的法律法規(guī)。
我國正積極探尋建設有效治理機制。自2019年11月起,先后出臺的《網(wǎng)絡音視頻信息服務管理規(guī)定》《網(wǎng)絡信息內(nèi)容生態(tài)治理規(guī)定》《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》等文件,均對生成合成類內(nèi)容提出不同程度的監(jiān)管要求。
中國工程院院士鄔賀銓認為,治理深度合成不能搞“一刀切”,要持續(xù)發(fā)展技術,避免阻礙其正向應用與創(chuàng)新。其衍生出的安全問題需從源頭解決,引導人工智能學術界、產(chǎn)業(yè)界不斷加強技術研發(fā),并擴展深度合成溯源、深度合成鑒定等方面的研究,防范倫理安全風險和合規(guī)風險。
引導深度合成技術良性發(fā)展,需探索多維度治理機制。中國社科院哲學所科技哲學研究室主任段偉文建議,加強對深度合成的技術、法律和倫理問題展開系統(tǒng)性前瞻性跨學科研究,對其可能出現(xiàn)的高風險應用場景采取有針對性的治理與監(jiān)管。
中科院自動化所研究員曾毅則倡導產(chǎn)學研發(fā)展自律自治,他表示,在法律法規(guī)未形成體系化之前,產(chǎn)業(yè)界自身應強化理論先行意識,防范濫用、嚴禁惡用。
在對外經(jīng)濟貿(mào)易大學法學院副教授許可看來,社會層面應加大宣傳普及力度,強化公民對深度合成等人工智能技術的認識,提高全社會防范意識。
田天對此有相同看法,他認為深度偽造的本質(zhì)問題是透明度不足,因此提高公眾對深度合成技術的認知尤為重要,只有將門檻降低到所有受眾能夠在共同框架下認識、討論、理解這個問題的時候,深度合成技術才能健康良性發(fā)展。
業(yè)內(nèi)專家建議,各方應當落實好新的規(guī)范要求,在此前提下不斷追求技術突破,開拓深度合成技術應用場景,形成對人工智能產(chǎn)業(yè)的帶動效應。(文章采集自經(jīng)濟日報,如涉及版權問題請聯(lián)系我們刪除)