谷歌旗下“深層思維”公司的研究人員設(shè)計了一種“水印”,可以無形地標記人工智能生成的文本,并將其提供給數(shù)百萬聊天機器人用戶。該研究成果日前發(fā)表在英國《自然》雜志上。
隨著大語言模型在質(zhì)量、連貫性、覆蓋范圍和專業(yè)性方面的進步,區(qū)分其生成的高質(zhì)量合成文本和人工書寫文本變得越來越困難。鑒于大語言模型在教育、軟件開發(fā)和網(wǎng)絡(luò)內(nèi)容生成中的廣泛使用,人工智能生成文本的識別和歸屬對于確保安全和負責(zé)任使用該技術(shù)至關(guān)重要。
各國都希望通過水印來識別人工智能生成文本并限制意外或故意濫用問題,以幫助鑒別和打擊虛假新聞和學(xué)術(shù)造假等,同時避免因使用人工智能生成內(nèi)容訓(xùn)練而導(dǎo)致未來模型質(zhì)量下降的問題。但迄今開發(fā)的水印都較容易被移除,或者用于欺詐。
此前,“深層思維”公司已經(jīng)開發(fā)出圖像水印技術(shù)——SynthID,可以識別并應(yīng)用在人工智能生成圖像上。在此基礎(chǔ)上該公司開發(fā)了一種被稱為SynthID-Text的文本水印技術(shù),可以將水印應(yīng)用于文本。
該技術(shù)將水印整合到大語言模型本身文本生成的步驟中,以一種隱秘但公式化的方式標記模型選擇的單詞,而這可以用密鑰檢測到。與其他方法相比,這樣產(chǎn)生的水印更容易被檢測到,而且應(yīng)用它不會減慢文本的生成速度和質(zhì)量。此外,由于密鑰復(fù)雜,移除水印或使用水印欺詐變得更加困難,即使使用第二個大語言模型來解釋文本,水印仍然可以被檢測到。
目前,“深層思維”公司已將該水印技術(shù)開源,開發(fā)人員可以將這種水印應(yīng)用于他們的模型。
(責(zé)任編輯:沈曄)