久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频

您當前的位置: 首頁 > 新聞 > 其他

用ChatGPT寫作業?新算法給AI生成文本加水?。褐眯哦雀哌_99.999999999994%

來源:量子位   編輯:非小米 時間:2023-02-08 07:32人閱讀

AI生成文本,又遇新對手!

憑借識別AI生成文本中的“水印”,一種新算法能夠準確判斷文本到底是誰寫的。

無需訪問模型參數、API,結果置信度高達99.999999999994%。

用ChatGPT寫作業?新算法給AI生成文本加水?。褐眯哦雀哌_99.999999999994%

方法一經發布就引來大量網友圍觀。這回拿ChatGPT“作弊”,怕不是要更難了?

要知道,最近一段時間,ChatGPT先是成為美國高中生的寫作業利器,后面幫專業媒體寫稿子,引發巨大恐慌。如Nature、紐約教育部等,都針對ChatGPT發布禁令。

馬里蘭大學學者們提出的這一新方法,為解決這些麻煩提出了個新思路。

不少網友都覺得,這個方法提出的正是時候,而且效果看著也不錯。

有學者還和美國高中生喊話,你們要做好準備了!

作者表示,方法代碼將在2月15日免費開源。

計算文本由AI生成的概率

所謂模型水印,人類無法看到,但是計算機可以。

這是一種現在被常用于大規模語言模型(LLM)中的方法,能讓AI生成的文本帶有“特殊標記”。即把信號嵌入到生成的文本中,讓算法能從一小段token中檢測出來。

最近,OpenAI方面也表示,考慮在ChatGPT中添加水印,以降低模型被濫用帶來的負面影響。

這篇最新論文的作者,就想驗證下這個想法到底靠不靠譜。他們通過給LLM中嵌入水印,然后再進行檢測。其中水印的嵌入不會影響文本生成質量。

具體來說,大規模語言模型每次生成一個token,每個token將從包含大約5萬個詞匯的詞匯表中進行選擇。

在新token生成之前,該方法會從基于最近已生成的token為隨機數生成器(RNG)提供“種子”,以此來壓一個水印。

然后使用RNG,能將詞匯表分為黑名單白名單,并要求LLM接下來只能從白名單中選擇詞匯。

如果整段文本中,白名單中的詞匯越多,就意味著越有可能是AI生成的。

黑白名單的區分,基于一個原則:

人類使用詞匯的隨機性更強。

舉例來說,如果在“美麗的”后面生成詞匯,水印算法會將“花”列入白名單,將“蘭花”列入黑名單。

論文作者認為,AI更可能使用“花”這個詞匯,而不是“蘭花”。

然后,就能通過計算整段文本中白名單token出現的情況,來檢測水印。

如果一共有生成了N個token,所有的token都使用了白名單詞匯,那么這段文字只有2的N次方分之一概率是人類寫的。

即便這段文字只有25個詞組成,那么水印算法也能判斷出它到底是不是AI生成的。

但作者也表示,水印有時候也不一定完全靠譜。

比如模型輸出了“SpongeBob Square”,下一個單詞一定會是“Pants”吧?但是Pants會被標記到黑名單里,即認為是只有人才會寫的詞。

(注:SpongeBob SquarePants是《海綿寶寶》動畫片的英文,可理解為一個專有名詞)

這種情況會嚴重影響算法的準確性,因此作者將其定義為低熵token,因為模型幾乎不會有更好的選擇。

對應來看,也會有高熵token,比如“海綿寶寶感覺____”這個句式里,能填入的詞匯太多了。

對于這一情況,作者選擇針對高熵token制定更強的規則,同時保留低熵token,確保水印質量更好。

與此同時,他們還添加了波束搜索(Beam search),允許LLM能夠排布一整個token序列,以避免黑名單詞匯。

這么做,他們能確保LLM使用白名單詞匯的概率在大約80%左右,而且不影響文本生成質量。

舉例來看,對于下面這段文字,水印算法認為它有99.999999999994%的可能是由AI生成的。

因為在這段文字中,包含36個token。如果是人類寫的,那么文本中應該包含9±2.6個白名單詞匯(白名單詞匯的概率約為25%)。

但這段文字中,包含了28個白名單詞匯。

計算來看,這段文字由人類寫出的概率,僅有0.0000000000006% (6乘以10的-15次方)。

用ChatGPT寫作業?新算法給AI生成文本加水?。褐眯哦雀哌_99.999999999994%

如下標注的是文本中的黑名單token。

用ChatGPT寫作業?新算法給AI生成文本加水?。褐眯哦雀哌_99.999999999994%

需要注意的是,如果想要水印正常發揮作用,并不受到攻擊,就必須對文本進行一些標準化處理,并且需要檢測某些類型的對抗性提示。

這一方法是對外公開的,將在2月15日開源代碼。

加一個隨機秘鑰,也能變成保密模式并且托管到API上,這能保證水印不會被篡改。

論文中使用的模型是Meta開源的OPT-1.3B模型。

由于不用訪問底層模型,所以該檢測方法的速度很快,成本也不會很高。

而且可以使用標準語言模型生成帶水印的文本,不用再重新訓練。

網友:似乎很容易繞過?

巴特,不少網友覺得,這個方法的具體實踐效果可能遠不及理想,質疑之聲迭起。

有人提出:

如果我在AI生成的文字基礎上,修改幾個詞,還能被查出來嗎?那在替換成近義詞后,檢測準確率會下降多少?

畢竟大家往往不會一字不改、直接用AI生成的內容。

用ChatGPT寫作業?新算法給AI生成文本加水?。褐眯哦雀哌_99.999999999994%

對此,論文通訊作者、馬里蘭大學副教授Tom Goldstein回答稱:

對于一段自帶水印的文字,至少得修改40%-75%的token,才可能成功去除水印。

(如果用其他程序修改內容話),為發生同義詞攻擊,導致生成內容的質量很低。

用ChatGPT寫作業?新算法給AI生成文本加水?。褐眯哦雀哌_99.999999999994%

簡而言之,想要通過換近義詞來消除水印,得大篇幅修改,而且若不是人親自手動修改的話,效果會很拉胯。

還有人提出:

對于專門設計過的低熵token序列,應該能檢測出水印。但是,長度和檢測率之間(存在一些矛盾),它們的優先級應該如何權衡?

對此,Tom教授表示:

根據設定,使用波束搜索時,絕大多數(通常是90%)的token在白名單上,即使是低熵token,也會被列入白名單。

所以,至少得修改一半以上的token,才能刪除水印,而這需要一個超級強大的LLM模型才行,一般人很難接觸到。

不過,研究者們也在論文中承認,這種方法確實存在一些局限性。

比如,檢測水印的z統計量,只取決于白名單大小參數γ和生成白名單的哈希函數,和其他不少重要的參數并沒有什么相關性。

這就讓他人可以在下游水印檢測器上做手腳,可以改變水印采樣算法,重新部署水印,最終讓原本生成的水印失效。

就連OpenAI CEO Sam Altman也表示:

創造完美檢測AI抄襲的工具,從根本上來說是不可能的。

(盡管他說OpenAI打算啟用水印大法)

但話說回來,人們為了限制AI生成文字的負面影響,還是煞費苦心——

之前就有人搞出了一個檢測ChatGPT的網站,名曰GPTZero,只需要把相應的內容粘進去,幾秒內就能分析出結果。

用ChatGPT寫作業?新算法給AI生成文本加水?。褐眯哦雀哌_99.999999999994%

論文地址:https://arxiv.org/abs/2301.10226

本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。

如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com

標簽: 大模型 ChatGPT

相關文章

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频
亚洲精品美女在线观看| 洋洋av久久久久久久一区| 亚洲午夜久久久| 欧美日韩天堂| 亚洲视频中文字幕| 一区二区三区久久| 国产精品美女999| 欧美精品播放| 日韩亚洲在线| 一区二区三区黄色| 国产伦精品一区二区三区四区免费| 亚洲影院一区| 欧美一级淫片aaaaaaa视频| 国产亚洲精品资源在线26u| 久久深夜福利免费观看| 久久露脸国产精品| av成人免费观看| 亚洲字幕一区二区| 在线观看国产精品网站| 亚洲国产精品悠悠久久琪琪 | 久久精品国产91精品亚洲| 香蕉尹人综合在线观看| 在线观看欧美日韩| 亚洲免费av观看| 久久免费少妇高潮久久精品99| 亚洲国产精品毛片| 夜夜爽夜夜爽精品视频| 国内精品久久久| 亚洲伦伦在线| 黄色日韩网站| 一区二区免费看| 伊人久久综合| 亚洲午夜在线观看| 亚洲国产激情| 亚洲影院在线观看| 日韩视频精品在线| 欧美激情一区二区在线| 国产精品老女人精品视频| 麻豆精品一区二区综合av | 久久久久久午夜| 欧美成人一区二区三区在线观看| 红桃视频欧美| 亚洲深夜福利网站| 亚洲日本一区二区三区| 午夜精品在线观看| 中文日韩在线| 欧美国产视频在线| 久久综合九色| 国产一区二区精品久久91| 亚洲精一区二区三区| 黑人一区二区三区四区五区| 一区二区三区国产盗摄| 亚洲国产高清aⅴ视频| 欧美一区二区三区四区在线观看地址 | 亚洲一区二区在线观看视频| 亚洲片在线资源| 久久久久久久高潮| 久久av一区二区| 国产精品免费看| 中文一区字幕| 国产精品99久久久久久久久| 欧美激情1区2区| 亚洲国产片色| 91久久久久久久久| 久久精品综合网| 久久久免费av| 国产在线乱码一区二区三区| 亚洲午夜久久久久久久久电影院 | 国产精品对白刺激久久久| 最新高清无码专区| a4yy欧美一区二区三区| 欧美日韩成人精品| 9人人澡人人爽人人精品| 一区二区三区三区在线| 亚洲一区二区成人| 亚洲欧美日韩中文播放| 国产精品乱看| 午夜国产精品影院在线观看| 欧美一区高清| 国产一区二区三区免费观看| 久久aⅴ国产欧美74aaa| 久久综合狠狠综合久久综合88| 国产视频精品网| 久久视频一区| 亚洲福利视频免费观看| 欧美日韩一区二区免费视频| 亚洲人成艺术| 亚洲欧美日韩人成在线播放| 国产精品久久久久久久app| 亚洲欧美激情在线视频| 久久全球大尺度高清视频| 在线免费不卡视频| 欧美国产在线视频| 一本到12不卡视频在线dvd| 香蕉免费一区二区三区在线观看| 久久综合中文| 日韩视频免费| 午夜精品一区二区三区在线视 | 亚洲国产婷婷香蕉久久久久久99| 米奇777在线欧美播放| 亚洲人www| 欧美一区二区三区男人的天堂 | 国产美女搞久久| 久久免费视频观看| 一二美女精品欧洲| 久久成人免费网| 亚洲精品久久久久久久久久久 | 欧美gay视频激情| 一区二区三区高清视频在线观看| 久久精彩视频| 99视频精品全部免费在线| 国产精品入口| 免费在线日韩av| 新片速递亚洲合集欧美合集 | 亚洲欧美激情诱惑| 伊甸园精品99久久久久久| 欧美日韩精品免费观看视频| 欧美一区二区三区另类| 99re热这里只有精品视频| 久久午夜色播影院免费高清| 99亚洲一区二区| 在线播放日韩专区| 国产麻豆精品久久一二三| 欧美经典一区二区三区| 欧美在线亚洲一区| 一区二区免费在线播放| 亚洲国产欧美日韩精品| 久久精品最新地址| 午夜视频久久久| 亚洲图片欧美日产| 亚洲人成网站精品片在线观看| 国产欧美在线| 国产精品有限公司| 欧美私人网站| 欧美人与禽猛交乱配| 久久尤物电影视频在线观看| 欧美与黑人午夜性猛交久久久| 亚洲网站啪啪| aa级大片欧美| 99视频精品| 日韩亚洲欧美综合| 亚洲日韩视频| 亚洲精品日韩综合观看成人91| 免费看黄裸体一级大秀欧美| 久久精品亚洲国产奇米99| 亚洲欧美国产77777| 亚洲一区二区在线观看视频| 日韩一本二本av| 一区二区三区.www| 一区二区三区黄色| 亚洲一级一区| 亚洲欧美日韩在线观看a三区| 亚洲小说春色综合另类电影| 亚洲深夜福利| 亚洲免费人成在线视频观看| 亚洲欧美精品中文字幕在线| 亚洲一区日本| 久久av一区二区三区漫画| 久久国产欧美日韩精品| 久久久xxx| 欧美成人一区在线| 亚洲人午夜精品免费| 亚洲精品美女在线观看| 一区二区激情| 午夜精品福利在线观看| 久久精品五月| 欧美a级理论片| 欧美精品一区二区三区蜜臀| 欧美日韩精品一区二区三区四区| 欧美日韩国产小视频| 国产精品久久久久久久久久ktv| 国产精品毛片高清在线完整版| 国产一区二区剧情av在线| 极品av少妇一区二区| 91久久线看在观草草青青| 夜夜嗨av一区二区三区四季av| 亚洲一区二区三区在线视频| 欧美一级淫片播放口| 久久综合999| 亚洲欧洲一区二区三区久久| 在线一区亚洲| 久久久久国产精品人| 欧美美女bbbb| 国产一区二区三区黄| 亚洲精品三级| 久久精品99国产精品| 欧美高清视频一区二区| 在线亚洲激情| 老妇喷水一区二区三区| 国产精品国产馆在线真实露脸| 国内精品国产成人| 亚洲小说春色综合另类电影| 久久视频国产精品免费视频在线 | 欧美影院在线| 最新中文字幕一区二区三区| 亚洲欧美精品在线| 欧美91福利在线观看| 国产日韩av在线播放| av成人天堂| 嫩草伊人久久精品少妇av杨幂|