以假亂真的AI生成式圖片,AI自己分辨不出來了。
這張馬斯克和機器人女友的照片,5個鑒別器里有2個都覺得是真的:
還有這張人類和3米巨人的合照,居然5個鑒別器一致判斷為真:
(資料圖片)
啊這,AI鑒別器似乎不太靠譜的亞子。
這就是《紐約時報》最近做的一項測試,他們找來了市面上五個常見的AI鑒別器,分別喂給它們100多張照片做測試。
結果發現,AI鑒別器不僅會把AI照片錯認成真的,也會把真實照片劃定為AI生成的。
而且不同鑒別器之間的水平差距也不小。
具體表現如何?一起來看
加點顆粒(Grain)就能騙過鑒別器
在這項測試中一共使用了5個AI鑒別器,分別是:
Umm-maybeIlluminartyA.I or NotHiveSensity
測試的內容包括AI和人類創作的圖片,分別喂給每個鑒別器,看它們會怎樣判斷。
使用的AI創作工具包括Midjourney、Stable Diffusion、Dall-e等。
《紐約時報》主要展示了這樣幾個例子。包含5張AI創作的圖片,以及2張真人拍的照片。
從統計結果來看,五個鑒別器中只有Hive全部判斷正確。
Umm-maybe的表現最差,只判斷對了兩張圖。
舉例來看,這張照片是AI生成的,聽說還在2月的一場攝影比賽中拿下大獎,這道題就難倒了大部分鑒別器。
但這張純AI生成的照片,就沒有逃過大部分鑒別器的法眼。
對于人類創作的照片,AI鑒別器的正確率比較高,兩張照片都只有Umm-maybe鑒別器判斷錯誤。
此外他們還專門測試了藝術畫,發現大部分AI鑒別器能判斷出這是真人畫的。
對比另一幅AI創作的,同樣也是四個鑒別器判斷正確。
(Umm-maybe啊……是真的不太行)
值得一提的是,如果對AI圖像進行一些加工處理,AI鑒別器會失效。
比如這張Nike男的照片,一開始有4個鑒別器判斷它是AI生成的。
但如果給圖片加一些顆粒,AI鑒別器就會將這張圖片的AI含量從99%,判斷為僅有3.3%。
最后,我們也測試了一些能上手實測的鑒別器(Umm-maybe、Illuminarty、A.I or Not)。
結果顯示,對于“馬斯克在蘇聯”這張圖,Umm-maybe覺得它有85%的概率是人類創作的。
Illuminarty覺得它是AI創作的概率僅有5.4%。
只有A.I or Not確定了它是AI生成的。
AI鑒別的判斷標準是啥?那么AI到底是怎么鑒別真偽的?
普遍來說,它們和人類的判斷標準不太一樣,人類一般以圖像內容的合理性為依據,而AI更多是從圖像的參數入手,比如像素的排列方式、清晰度、對比度等。
所以這就解釋了開頭那張巨人照片,為啥所有鑒別器都覺得很真。
在AI畫畫大火一年多以后,如今市面上已經出現了非常多鑒別器。
有的就是直接放在Hugging Face上供大家免費使用,有的則是已經成立公司,只提供API接口形式。
比如Hive就是一家提供商業解決方案的公司,從如上的測試結果可以看到,Hive的表現效果也是最好的,幾乎都能判斷正確。
而在這之前他們的主要業務是為平臺網站提供數據審核服務,圖像視頻文字都支持,服務的平臺有Reddit、Quora等。
關鍵詞: