최근 Royal Society Open Science 저널에 발표된 연구에 따르면, AI가 생성한 얼굴 이미지가 매우 높은 수준의 현실감을 지니고 있어, 얼굴 인식 데이터베이스에서 선발된 ‘슈퍼 인식자’ 그룹조차 진짜와 가짜를 구별하는 데 어려움을 겪고 있다고 합니다. 이 그룹은 얼굴 인식 임무에서 상위 2%에 해당하는 성과를 낸 자원봉사자들로 구성되어 있습니다. AI는 현실의 얼굴 사진과 구별하기 어려운 극사실적인 얼굴 이미지를 생성할 수 있게 되었습니다.
딥페이크(deepfake) 얼굴은 두 단계의 AI 알고리즘인 생성적 적대 신경망(GAN)을 통해 생성됩니다. 우선, 진짜 이미지를 기반으로 가짜 이미지가 생성된 후, 이 이미지는 진짜인지 평가하기 위해 분류기로 전달됩니다. 여러 번의 반복을 거치면서 가짜 이미지는 분류기를 통과할 수 있을 만큼 충분히 개선됩니다. 현재 알고리즘은 매우 발전하여 많은 사람들이 가짜 얼굴이 진짜 얼굴보다 “더 진짜처럼” 보인다고 믿는 극사실주의(hyperrealism) 현상이 발생하고 있습니다.
이번 연구에서, 케이티 그레이(Katie Gray) 레딩 대학교(영국) 심리학 부교수는 슈퍼 인식자 그룹과 일반 그룹을 대상으로 실험을 진행했습니다. 첫 번째 실험에서 참가자들은 10초 동안 얼굴 이미지를 보고 판단을 내렸습니다. 일반 그룹은 약 30%의 정확도로 맞혔고, 슈퍼 인식자 그룹은 41%에 불과했습니다. 두 그룹 모두 진짜 얼굴을 가짜로 잘못 판단한 비율은 각각 46%와 39%였습니다.
다음 실험은 새로운 자원봉사자들로 이루어졌으며, 이들은 AI 이미지에서 흔히 발생하는 오류에 대한 5분간의 훈련을 받은 후 첫 번째 테스트를 실시했습니다. 이 훈련은 비정상적인 헤어라인, 치아의 배열, 비자연스러운 피부 질감, 지나치게 균형 잡힌 얼굴 등의 오류들에 대한 것이었습니다. 훈련 후 결과는 뚜렷하게 개선되어 일반 그룹은 51%, 슈퍼 인식자 그룹은 64%의 정확도를 기록했습니다. 그럼에도 불구하고 진짜 얼굴을 가짜로 잘못 판단한 비율은 두 그룹 모두 첫 번째 실험과 유사한 결과인 각각 49%와 37%였습니다.
그레이 교수는 슈퍼 인식자 그룹이 AI 얼굴을 발견하기 위해 이미지 오류 외의 다른 신호를 활용할 수 있다고 평가했습니다. 훈련을 받은 사람들은 자세히 관찰하는 데 더 많은 시간을 할애했으며, 이는 느리게 진행하고 세부 사항을 살펴보는 것이 가짜 이미지를 탐지하는 데 도움이 된다는 것을 보여줍니다.
그러나 이번 연구는 훈련 직후의 효과만을 평가했기 때문에 이 효과가 얼마나 지속될지는 불확실합니다. 메이케 라몬(Meike Ramon) 스위스 베른 응용과학대학교의 데이터 과학 교수는 “이 훈련 방법을 장기적인 효과가 있는 개입으로 간주할 수는 없다. 재검증이 이루어지지 않았기 때문”이라고 언급했습니다. 또한 라몬 교수는 두 실험의 참가자들이 서로 다르기 때문에 훈련이 개인의 기술 향상에 어느 정도 도움이 될지는 확실하지 않다고 덧붙였습니다.