谷歌為AI生成文本“打水印”
谷歌旗下“深層思維”公司的研究人員設計了一種“水印”,可以無形地標記人工智能生成的文本,並將其提供給數百萬聊天機械人用戶。該研究成果日前發表在英國《自然》雜誌上。
隨着大語言模型(LLM)在質量、連貫性、覆蓋範圍和專業性方面的進步,區分其生成的高質量合成文本和人工書寫文本變得越來越困難。鑒於大語言模型在教育、軟件開發和網絡內容生成中的廣泛使用,人工智能生成文本的識別和歸屬對於確保安全和負責任使用該技術至關重要。
各國都希望通過水印來識別人工智能生成文本並限制意外或故意濫用問題,以幫助鑒別和打擊虛假新聞和學術造假等,同時避免因使用人工智能生成內容訓練而導致未來模型質量下降的問題。但迄今開發的水印都較容易被移除,或者用於欺詐。
此前,“深層思維”公司已經開發出圖像水印技術——SynthID,可以識別並應用在人工智能生成圖像上。在此基礎上該公司開發了一種被稱為SynthID-Text的文本水印技術,可以將水印應用於文本。
在文本生成過程中加入浮水印比圖像浮水印更具挑戰性。“深層思維”團隊採用的SynthID-Text浮水印技術,通過在詞彙選擇上加入隱秘但有規律的調整,利用加密金鑰將每個可能的詞彙標記為候選選項。這些選項會在一系列“錦標賽”中進行對比,最終“獲勝”的詞彙將用於文本生成。這種“錦標賽”過程如同解鎖一個密碼鎖,每一輪比賽代表鎖中的一位數字,顯著增加了浮水印被篡改或刪除的難度。
SynthID-Text系統的競標賽採樣方法不僅提升了浮水印的抗干擾性,也提高了浮水印的“不可擦除”性。研究人員測試發現,即便通過另一AI模型對帶浮水印文本進行改寫,該系統依然能夠識別出隱藏浮水印。這種抗干擾性對於內容較長的文本尤其顯著,而在較短文本中則表現稍弱。這種設計讓刪除浮水印的難度大大增加,也使得偽裝成AI生成文本的“假浮水印”操作更為困難。
據悉,區分AI生成文本的能力已成為應對假新聞、學術作弊等問題的重要工具,同時有助於避免AI模型“自我污染”——即通過AI生成內容訓練AI模型,導致內容失真。
在一次史無前例的大規模測試中,谷歌的Gemini大型語言模型(LLM)生成的二千萬條回覆中,含水印文本的品質評級與無浮水印文本相當。這一成就令業界感到興奮,馬里蘭大學的電腦科學家Furong Huang指出:“谷歌採取這一步對於科技社區來說是令人振奮的,相信未來大多數商業工具都會採用類似的浮水印。”
水 登