IT

1장의 사진과 음성 데이터로 말하는 영상을 제작하는 기술

오델리아 2019. 6. 23. 14:16

1장의 사진과 음성 데이터로 "사람이 말하는 영상"을 만들어내는 기술을 삼성과 임페리얼 칼리지 런던의 AI 연구자들이 새롭게 개발했다. 



유명 여배우의 포르노 또는 가짜 뉴스를 무진장 만들 수 있게됨으로써 그 위험성이 매우 우려가되는 페이크 기술 또한 크게 발전했다고해서 화제가되고 있다.


딥 페이크는 기계 학습으로 대량의 훈련 데이터를 캡처 한 영상을 기존의 영상과 겹치는 것으로 "가짜" 영상을 만들어내는 것이며, 이번 연구에서도 기계 학습 기술이 사용되었다. 한 장의 사진으로 만들어 낸 딥 페이크는 100% 리얼이라는 것은 아니지만, 그 완성도는 실로 놀라운 것이었다.




예를 들어 알베르트 아인슈타인의 사진과 강의 음성을 겹쳐서 실제로는 이루어지지 않은 강의의 영상을 만들어내는 것이 가능하다. 아래에 그 영상이 있다.




또한 "괴승", "괴물"이라고 표현되는 그리고리 라스푸틴에 비욘세의 "Halo"를 노래하게하는 것도 가능하다.




현대의 사진을 이용한 보다 리얼 한 것이 아래. 이것은 음성과 사진 한장을 더해 만든것뿐만 아니라 "감정 표현"을 더한 것으로 되어있다.




이 영상은 "진짜와 분간 할 수없다" 등 완성도는 그렇게 없는것 같다. 그러나 딥 페이크 기술은 무서운 속도로 발달하고 있으며, 일반인이 쉽게 딥 페이크를 만들 수있는 소프트웨어의 등장도 가까워졌다고 볼 수있다.