發(fā)表時間:2024-11-07 10:37:02
文章作者:小編
瀏覽次數(shù):
當(dāng)前,識別AI生成內(nèi)容的技術(shù)手段均未成熟。如何在潛在風(fēng)險,治理成本、目標(biāo)成效之間取得合理平衡成為關(guān)鍵所在。建議小步試錯,探尋科學(xué)的風(fēng)險管理方案。
內(nèi)容治理邏輯的擴展:人類原創(chuàng)還是AI生成?
對于AI生成內(nèi)容在未來全部信息內(nèi)容中所占比例,不同機構(gòu)的預(yù)測口徑有所不同,從20%-90%不等[2]。但不容否認(rèn)的是:隨著生成式AI技術(shù)應(yīng)用的普及,AI生成內(nèi)容比例正在逐步攀升。有研究顯示,僅僅從2023到2024的一年間,包含AI生成內(nèi)容的網(wǎng)頁數(shù)量就激增了2848%[3]。與此同時,內(nèi)容生產(chǎn)模式的變革也在推動著內(nèi)容治理邏輯的悄然變化,從過去針對內(nèi)容性質(zhì)——是否違法有害,擴展至針對內(nèi)容來源——是否為AI生成。
在AI生成內(nèi)容早期階段,大模型廠商從提升模型透明度,支持權(quán)利保護(hù)等目標(biāo)出發(fā),嘗試開展標(biāo)識工作。特別在版權(quán)方面,盡管對AI生成內(nèi)容的可版權(quán)性仍存在較大爭議,但明確其內(nèi)容性質(zhì)來源,仍然有助于可能的權(quán)利人主張其權(quán)益,激勵社會公眾利用新工具進(jìn)行內(nèi)容創(chuàng)作;同時,也有利于明確模型廠商與使用主體之間的權(quán)責(zé)分界,前者在生成階段有更多管控能力,而后者需對生成內(nèi)容的后續(xù)傳播利用承擔(dān)更多責(zé)任。
政府、社會公眾對標(biāo)識的推動,主要源于AI生成內(nèi)容對信息傳播秩序的潛在風(fēng)險。AI生成偽造虛假信息的案例時有發(fā)生。如合成虛假災(zāi)情、新聞擾亂公共秩序[4],利用AI換臉合成虛假色情圖片視頻侵犯個人名譽等等[5]。有害信息,不論是人類生成,還是AI生成,均可以被傳統(tǒng)的內(nèi)容治理所覆蓋,同樣可以采取刪除、屏蔽等措施最大程度消除其影響。然而,推動內(nèi)容治理擴展更重要的考慮是:生成式AI大幅提升了內(nèi)容生產(chǎn)的效率,多模態(tài)內(nèi)容更豐富、交互更逼真,如果一旦被大規(guī)模應(yīng)用于謠言等虛假內(nèi)容的制造,將可能造成公眾對于真實信息的混淆,引發(fā)公眾對媒體的普遍不信任[6]。盡管到今天,AI生成技術(shù)在新聞媒體等內(nèi)容產(chǎn)業(yè)的應(yīng)用程度并沒有此前預(yù)想的那么高,也并未看到AI生成內(nèi)容對媒體傳播秩序的實際沖擊,但隨著AI的持續(xù)推進(jìn),這種擔(dān)憂仍然是真實存在的。
如何把AI生成內(nèi)容區(qū)分出來?
區(qū)分AI生成內(nèi)容首先是一個技術(shù)問題[7]。目前,識別的技術(shù)路徑主要包括生成內(nèi)容檢測和來源數(shù)據(jù)追蹤兩個方向。前者主要通過尋找數(shù)字內(nèi)容所包含的生成特征來確定內(nèi)容是否由AI生成或篡改。后者則是通過對數(shù)字內(nèi)容全生命周期的相關(guān)信息(是否由AI生成、修改)的獨立記錄來間接反映數(shù)字內(nèi)容的性質(zhì)。然而對于AI內(nèi)容識別,目前尚缺乏成熟可靠的技術(shù)方案。
1.內(nèi)容檢測路徑
內(nèi)容檢測是最為直觀的解決方案。雖然目前在人類的感官層面,AI生成內(nèi)容與人工創(chuàng)作內(nèi)容已相差無幾,但是在細(xì)節(jié)層面,仍然存在著可被機器或者技術(shù)專家所覺察的特征。
在圖像內(nèi)容中,涉及圖像邊緣、紋理等細(xì)節(jié)的處理時,AI生成內(nèi)容會出現(xiàn)像素級的不一致;涉及比例與對稱性、光照與陰影等現(xiàn)實物理特征時,AI生成內(nèi)容會出現(xiàn)細(xì)微的錯誤;在視頻內(nèi)容中,涉及物體運動軌跡、光照與陰影的變化時,AI生成內(nèi)容會表現(xiàn)出輕微的不自然、缺乏連貫性或物理規(guī)律的異常;同理,在音頻、文本等AI生成信息中也都存在類似微小的區(qū)別。
然而,即使AI生成內(nèi)容在眾多方面與人工內(nèi)容存在差異,成熟的、高效且可靠的合成內(nèi)容檢測技術(shù)尚不可得。評估AI生成內(nèi)容檢測的技術(shù)主要需要考慮以下要素:通用性、可解釋性、效率、魯棒性、計算成本等。在圖像領(lǐng)域,已經(jīng)出現(xiàn)了利用深度學(xué)習(xí)模型、機器學(xué)習(xí)模型和統(tǒng)計模型等多種模型進(jìn)行檢測的技術(shù),但是通用性、魯棒性普遍表現(xiàn)不佳。據(jù)報道,使用不同方法在不同的訓(xùn)練和測試子集中獲得的準(zhǔn)確率僅為從61%到70%。當(dāng)合成圖像經(jīng)過后處理(如壓縮和調(diào)整大?。瑱z測準(zhǔn)確率將會進(jìn)一步降低,難以在實踐中可靠運作。
2.數(shù)據(jù)跟蹤路徑
來源數(shù)據(jù)跟蹤是對“內(nèi)容性質(zhì)識別”的間接解決方案。來源數(shù)據(jù)跟蹤并不依賴內(nèi)容本身,而是通過對于內(nèi)容的變動(生成、修改等)進(jìn)行記錄,從側(cè)面反映內(nèi)容的真實性、完整性。當(dāng)前的來源數(shù)據(jù)跟蹤方法主要包括顯式標(biāo)識和隱式標(biāo)識。
(1)顯式標(biāo)識
顯式標(biāo)識最大特點是可以直接被人感知,提示告知效果顯著,但其實踐效果還有待評估。顯式標(biāo)識包括內(nèi)容標(biāo)簽和可見水印等。內(nèi)容標(biāo)簽與數(shù)字內(nèi)容分離存在(如在特定場景中的周邊提示),無法在生成合成內(nèi)容的全生命周期都起到區(qū)分效果;而可見水印僅限于內(nèi)容的一部分,容易被裁剪或移除;當(dāng)可見水印被應(yīng)用在整個內(nèi)容的大部分區(qū)域,會降低數(shù)字內(nèi)容的質(zhì)量。
(2)隱式標(biāo)識
隱式標(biāo)識是指在生成合成內(nèi)容或數(shù)據(jù)中添加的,不能被用戶直接感知、但能通過技術(shù)手段處理的標(biāo)識。目前主要有數(shù)字水印和元數(shù)據(jù)記錄兩種技術(shù)路徑。
數(shù)字水印是機器可讀的水印,可通過對內(nèi)容進(jìn)行肉眼不可見的擾動來嵌入附加來源信息?;诒粩_動方式的不同,可以分為基于LSB的水印、離散余弦變換(DCT)水印、LLM水印等。但數(shù)字水印的效果同樣存在疑問。復(fù)雜算法生成的水印需要大量的計算資源來讀取,成本高效率低;簡單算法生成的水印容易被去除和篡改,安全性不足。
元數(shù)據(jù)記錄則是另一種方法,通過將內(nèi)容變動生成的元數(shù)據(jù)獨立儲存在與數(shù)字內(nèi)容相同的文件中,用以提供于其內(nèi)容屬性、來源等信息。基于獨立儲存的特征,這種方法雖然相較之下效率更高,但也存在明顯缺陷。首先,元數(shù)據(jù)需要長時間存儲,還需要投入資源進(jìn)行管理和查詢優(yōu)化,增加了成本;其次,元數(shù)據(jù)原則上可以被任意的添加、修改、抹除,很難保證完整性與真實性。雖可以通過數(shù)字指紋或簽名技術(shù)來提升安全性,但這也會帶來額外成本;再次,規(guī)避元數(shù)據(jù)記錄的門檻較低。用戶可以通過截圖或外部設(shè)備拍攝等非下載方式繞過元數(shù)據(jù)記錄。
不論是數(shù)字水印還是元數(shù)據(jù),隱私標(biāo)識面臨的最大挑戰(zhàn)是其技術(shù)目標(biāo)的實現(xiàn)對治理生態(tài)提出了很高要求。考慮到網(wǎng)絡(luò)傳播鏈路的復(fù)雜性,寫入隱式標(biāo)識,并進(jìn)行讀取、驗證,最終對用戶進(jìn)行提示,完成這一閉環(huán)需要生態(tài)主體的高度協(xié)作,兼顧算法的保密性與跨平臺的互通識別。若缺乏成熟的技術(shù)和治理規(guī)范,不僅不能實現(xiàn)來源辨別的目的,且可能會加劇欺騙或混淆的風(fēng)險。
產(chǎn)業(yè)界對于AI生成內(nèi)容標(biāo)識的自發(fā)探索
在全球范圍內(nèi),人工智能企業(yè)、大型網(wǎng)絡(luò)平臺基于透明度、可信賴等原則,圍繞AI生成內(nèi)容的標(biāo)識,已自發(fā)展開探索。大模型方面,ChatGPT生成的圖像內(nèi)容使用元數(shù)據(jù)記錄進(jìn)行標(biāo)識[8];Meta AI創(chuàng)建或編輯的圖像包含可見水印[9]。國內(nèi)企業(yè)開發(fā)的人工智能系統(tǒng)如元寶、豆包、文小言等都均已其生成的圖像添加顯式標(biāo)識。互聯(lián)網(wǎng)平臺方面, Meta規(guī)定用戶需要對所分享的包含經(jīng)數(shù)字手段(如使用AI)生成或修改的逼真視頻或擬真音頻的內(nèi)容進(jìn)行標(biāo)識[10],同時,Meta也正在進(jìn)行相關(guān)嘗試,如檢測到的圖像是由平臺旗下AI生成,將為其添加標(biāo)識。[11]X對于利用AI虛構(gòu)或者模擬真實人物的媒體內(nèi)容,或者通過AI改變媒體內(nèi)容從而扭曲其含義的媒體內(nèi)容會添加顯式標(biāo)識以提供額外的背景信息或者直接刪除該內(nèi)容[12]。國內(nèi)平臺如小紅書、微博等也已上線用戶自主聲明功能[13]。
國內(nèi)外的探索實踐,體現(xiàn)了以下共同點:其一、首先選擇在圖像、視頻等最可能產(chǎn)生混淆誤認(rèn)的領(lǐng)域進(jìn)行嘗試,大模型企業(yè)在生成階段對內(nèi)容進(jìn)行顯性標(biāo)識;其二、傳播平臺對用戶進(jìn)行提示,在用戶分享利用AI生成的逼真內(nèi)容時主動聲明,同時基于元數(shù)據(jù)等技術(shù)探索標(biāo)識路徑。此外,國外更多體現(xiàn)為企業(yè)自發(fā)形成產(chǎn)業(yè)聯(lián)盟,推進(jìn)開放的技術(shù)標(biāo)準(zhǔn)的形成[14]。
AI生成內(nèi)容標(biāo)識:基于動態(tài)風(fēng)險的治理探索
AI生成內(nèi)容帶來了與以往完全不同的風(fēng)險,推動著各方嘗試明確AI生成與人類創(chuàng)造的邊界。然而,針對AI生成內(nèi)容的標(biāo)識,目前尚未形成成熟的技術(shù)解決方案??傮w上,出于“防患于未然”的風(fēng)險預(yù)防思路,標(biāo)識工作處于一種自發(fā)探索的狀態(tài)。與之對應(yīng)的,在全球治理規(guī)則層面,目前大多是一些籠統(tǒng)的原則性要求,對于標(biāo)識的實現(xiàn)方式尚無細(xì)致規(guī)定,從而為實踐探索留有了較大空間。
1.在不斷試錯驗證的過程中,探尋合理的風(fēng)險管理方案
建議采取開放推薦的方式,鼓勵相關(guān)主體積極探索包括內(nèi)容檢測、數(shù)字水印等在內(nèi)的多種技術(shù)方式。對于元數(shù)據(jù)的跨主體讀取與驗證方式,通過AB實驗等方式不斷完善,在得到普遍實踐認(rèn)可的技術(shù)框架之后,再逐步進(jìn)行擴展。對于標(biāo)識的反刪除反篡改的攻防,更是一個“魔高一尺,道高一丈”的過程,需要行業(yè)各主體進(jìn)行協(xié)同應(yīng)對。此外,公眾對標(biāo)識的了解與應(yīng)用痛點,也決定了標(biāo)識工作將會在動態(tài)中尋求最佳實踐。
2.基于場景區(qū)分不同主體的治理角色
對于AI生成內(nèi)容,AI生成技術(shù)的提供者與部署者具有明確的主體角色差異,需適配不同規(guī)則。例如:歐盟《人工智能法》依據(jù)主體角色的不同,相應(yīng)建立了不同的標(biāo)識規(guī)范。其第50條2款規(guī)定AI系統(tǒng)的提供者應(yīng)當(dāng)實現(xiàn)其輸出內(nèi)容可以以機器可讀的格式標(biāo)記;第4款規(guī)定生成或操縱構(gòu)成深度偽造的圖像、音頻或視頻內(nèi)容的AI系統(tǒng)的部署者應(yīng)當(dāng)披露該內(nèi)容是人為生成或操縱的??梢姡罢吒鼜娬{(diào)技術(shù)的“開發(fā)者”重在提供“機器可讀”的技術(shù)方案,“部署者”重在對深度偽造的內(nèi)容“披露”其性質(zhì)。
3.避免大而全,將治理資源聚焦在“真正的風(fēng)險領(lǐng)域”
全面標(biāo)識聽起來“大而美好”,但實質(zhì)上卻可能有礙于標(biāo)識目的的實現(xiàn),讓真正具有風(fēng)險的內(nèi)容融入普遍被標(biāo)識的信息海洋,易使公眾信息過載,控制風(fēng)險的作用大打折扣,在此背景下,可考慮限定標(biāo)識的范圍。
一是在領(lǐng)域上的限定。鑒于AI生成技術(shù)的通用性,在信息傳播領(lǐng)域之外有大量的生成應(yīng)用(如滿足模型訓(xùn)練的數(shù)據(jù)合成、服務(wù)于加工潤色目的的AI生成,如地圖、游戲渲染;B端的AI辦公場景等等),在這些內(nèi)容傳播風(fēng)險較小的領(lǐng)域,標(biāo)識工作并不具有優(yōu)先緊迫性,或可以通過負(fù)擔(dān)較小的方式探索;
二是對標(biāo)識內(nèi)容上的限定。將有限資源集中于風(fēng)險較高的領(lǐng)域。正如我國《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》所采取的思路——“對于導(dǎo)致公眾混淆或者誤認(rèn)的,應(yīng)當(dāng)在生成或者編輯的信息內(nèi)容的合理位置、區(qū)域進(jìn)行顯著標(biāo)識,向公眾提示深度合成情況。這也反映了當(dāng)前國內(nèi)外標(biāo)識實踐的共識。正如Meta的內(nèi)容政策:“當(dāng)我們確信部分AI內(nèi)容不會違反我們的政策時,我們會在審核隊列中刪除這些內(nèi)容。這使得我們的審核資源可以更多的關(guān)注于那些可能違反我們規(guī)則的內(nèi)容?!?/span>
過度標(biāo)識的負(fù)外部性已有所浮現(xiàn)。據(jù)報道,僅通過圖像編輯軟件的AI功能對照片進(jìn)行除塵、去斑等微小的操作就會導(dǎo)致照片上傳到社交平臺時被標(biāo)記為“AI生成”[15]。此類標(biāo)識可能會引發(fā)“反向混淆”,讓公眾將人工創(chuàng)作內(nèi)容誤認(rèn)為“生成合成內(nèi)容”,對于知識產(chǎn)權(quán)、人格權(quán)益保護(hù)乃至公共信任產(chǎn)生不利的影響。為避免過度標(biāo)識,還需重點探索“標(biāo)識的例外規(guī)則”。
4.培養(yǎng)公眾在AI時代的“信息素養(yǎng)”
多么完美的識別規(guī)則,最終也只能起到輔助判斷的作用,無法替代公眾對信息內(nèi)容作最后的真?zhèn)闻袛啵瑐€人永遠(yuǎn)是自己“選擇相信內(nèi)容”的最終把關(guān)人。信息爆炸的時代,越需提升對信息真實與否的敏感度。正如網(wǎng)絡(luò)原住民比他們的上一輩,會更加謹(jǐn)慎地審視網(wǎng)絡(luò)信息一樣,在AI時代,人們更要告別“無圖無真相”的判斷準(zhǔn)則。以標(biāo)識規(guī)則為契機,培養(yǎng)公眾面對網(wǎng)絡(luò)內(nèi)容的理性判斷,形成AI時代個人“信息素養(yǎng)”,是內(nèi)容治理中更為關(guān)鍵的一環(huán)。
關(guān)注多享有數(shù),持續(xù)為您分享行業(yè)熱點要聞!
四川多享信息技術(shù)有限公司是一家專注于數(shù)字化服務(wù)、系統(tǒng)開發(fā)、新媒體營銷、農(nóng)村電商的專業(yè)互聯(lián)網(wǎng)公司,公司位于成都高新區(qū)天府二街,成立16年,擁有豐富開發(fā)經(jīng)驗,至今已助力5000+中小企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型升級。
研發(fā)了B2C商城系統(tǒng)、私域電商系統(tǒng)、分銷商城系統(tǒng)、S2B2b2C供應(yīng)鏈電商系統(tǒng)、小程序商城系統(tǒng)等,支持中臺云倉、供應(yīng)商、自營商城、直播、短視頻、分銷、零售商管理、運營商管理、營銷工具、數(shù)據(jù)分析、會員儲值、積分商城等功能,幫助企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型,助力降本增效,獲取更多收益!
- 01-09淘寶推出「送禮物」功能:領(lǐng)取時限24小時,春節(jié)「送禮大戰(zhàn)」愈演愈烈
- 01-06如何構(gòu)建數(shù)據(jù)產(chǎn)品:2025年數(shù)據(jù)行業(yè)開啟的新技能
- 01-02工信部:推動“5G+工業(yè)互聯(lián)網(wǎng)”創(chuàng)新發(fā)展
- 12-31豆包定價一元的野心:字節(jié)跳動打響AI突圍戰(zhàn)
- 12-27直播內(nèi)容卷出新高度,行業(yè)還有紅利嗎?
- 12-26十年一輪回,微信“送禮物”能否復(fù)制紅包奇跡?
- 12-26《2025全球消費者趨勢》,消費者更深思熟慮了
- 12-252024 AI大模型年度十大關(guān)鍵詞發(fā)布
- 12-25政企辦公應(yīng)用「鴻蒙化」勢頭正勁
- 12-242025年7個令人關(guān)注的數(shù)據(jù)治理趨勢
- 12-24從 OpenAI 12 天發(fā)布會里,我們看到了行業(yè)的四個關(guān)鍵問題
- 12-23互聯(lián)網(wǎng)入口不再屬于瀏覽器,未來是對話式AI的
- 12-23人工智能時代的數(shù)據(jù)戰(zhàn)略
- 12-20第三季度我國上市互聯(lián)網(wǎng)企業(yè)市值大漲 環(huán)比上升25.4%
- 12-20政策春風(fēng)助力零售業(yè),AI+SaaS引領(lǐng)數(shù)字化轉(zhuǎn)型與增長新機遇
- 12-19微信小店灰測“送禮物”功能
- 12-192024年十大科技進(jìn)步,除了AI還有這九個
- 12-18私域運營深度解析:6大策略提升客戶生命周期價值
- 12-18為什么說AI落地營銷,才是真正的科技平權(quán)?