Kanada’daki Waterloo Üniversitesi’ndeki araştırmacılar, insanların yapay zeka görüntülerini gerçek görüntülerden ayırt edip edemeyeceğini belirlemek için dikkat çekici bir çalışma gerçekleştirdi.
Araştırmacılar, 260 katılımcıdan, Google aramasıyla toplanan 10 görseli ve Stable Diffusion veya DALL-E (deepfake görseller oluşturmak için kullanılan iki yapay zeka programı) tarafından oluşturulan 10 görseli gerçek veya sahte olarak tanımlamalarını istediler.
Sahte görseller için gelen görüşler şöyle oldu…
(maviler doğru tahmin, kırmızılar yanlış tahmin)
Sonuçlara göre, katılımcıların yüzde 85’inin görüntüleri doğru bir şekilde tanımlayabilmesi beklenirken ancak yalnızca yüzde 61’inin doğru tahminde bulunduğu ortaya çıktı.
Springer Link’te yayınlanan çalışma, insanların görselleri gerçek veya sahte olarak tanımlamasının en yaygın nedeninin gözler ve saç gibi ayrıntılara bakmak olduğunu, daha genel nedenlerin ise resmin “tuhaf görünmesi” olduğunu buldu.
Katılımcıların resimlere sınırsız bir süre boyunca bakmalarına ve küçük ayrıntılara odaklanmalarına izin verildi; bu, yalnızca çevrimiçi olarak inceliyor olsalardı büyük olasılıkla yapmayacakları bir şeydi.
Waterloo Üniversitesi Bilgisayar Bilimleri alanında doktora adayı ve çalışmanın baş yazarı Andreea Pocol, “İnsanlar ayrım yapma konusunda sandıkları kadar becerikli değiller” dedi.
GÖRSELLERİ YANLIŞ SINIFLANDIRDILAR
Araştırmacılar, ayrıca insanlardan, diğerlerinin yanı sıra Twitter, Reddit ve Instagram’da gerçek görüntüler ile yapay zeka tarafından oluşturulan görüntüleri tanımlamalarını isteyen bir anket yayınladılar.
Katılımcılar, yanıtlarını göndermeden önce bunun neden gerçek ya da sahte olduğuna inandıklarını söylediler.
Araştırma, katılımcıların neredeyse yüzde 40’ının görselleri yanlış sınıflandırdığını, bunun da “insanların gerçek görselleri sahte olanlardan ayırma konusunda iyi olmadığını, yanlış ve potansiyel olarak tehlikeli anlatıların yayılmasına kolayca izin verdiğini” gösterdiğini söyledi.
Ayrıca katılımcıları cinsiyete (erkek, kadın veya diğer) göre ayırdılar ve kadın katılımcıların en iyi performansı sergilediğini, kabaca yüzde 55 ila 70 doğruluk oranıyla tahminlerde bulunduğunu, erkek katılımcıların ise yüzde 50 ila 65 doğruluk oranına sahip olduğunu buldular.
Bu arada, kendilerini “diğer” olarak tanımlayanların sahte ve gerçek görselleri yüzde 55 ila 65 doğruluk oranıyla tahmin etme aralığı daha düşüktü.
Katılımcılar daha sonra yaş gruplarına göre sıralandı ve 18 ila 24 yaş arasındakilerin doğruluk oranının 0,62 olduğunu bulundu. Katılımcılar yaşlandıkça doğru tahmin etme olasılıklarının azaldığı, 60 ila 64 yaş arası kişiler için sadece 0,53’e düştüğü de ortaya çıktı.
Araştırmacılar bu çalışmanın önemli olduğunu, çünkü “deepfake teknolojisinin daha karmaşık hale geldiğini ve son yıllarda yaratılmasının daha kolaylaştığını”, bunun da “toplum üzerindeki potansiyel etkileriyle ilgili endişelere yol açtığını” söyledi.