Picture by Midjourney. 왼쪽 그림은 ’강남 스타일의 패션으로 강남에 모여든 사람들’이라고 작성해서 넣은 텍스트 입력 내용을 미드저니가 1분만에 그려낸 것이고 오른쪽은 ’인공지능 로봇이 함께 일하는 신문사’라는 내용을 넣었더니 만들어준 결과다.
미드저니(Midjourney)가 인간의 상상력을 어디까지 끌고 갈까?
미드저니는 글을 쓰면 그것을 그림으로 표현해주는 AI 프로그램이다. 립모션(LeapMotion)의 공동 설립자인 데이빗 홀츠(David Holtz)가 이끄는 연구소에서 만든 미드저니는 텍스트의 자극을 받은 인공지능이 시각적 이미지를 생성하는 툴이다. 홀츠는 신흥 기술의 선두 개발자라고 할 수 있다. 미드저니는 기계 학습을 이미지를 생성하는 데 그 수준이 충격적이까지 하다.
미드저니를 사용하려면 일단 디스코드(Discord)에 가입되어 있어야 한다. 디스코드에 가입을 한 후에 화면에서 /imagine이라고 쓰고 Prompt가 깜빡이는 옆에 나의 상상력을 발휘한 글을 쓰면 AI가 그 텍스트를 꽤 잘 알아듣고 멋진 그림을 제공하는데 하나도 아니고 무려 4개나 동시에 제공한다. AI가 그림을 만들어내는 시간은 약 1분이다.
이러한 툴은 이미 전에도 있었다. 그 대표주자는 달리2(DALL-E2)였다. 달리2가 제한된 사람만 사용하고 그림의 수준이 상당히 낮았던 것에 비하면 미드저니는 모든 사람에게 열려 있고 그림의 수준이 높은 정도가 아니라 충격적인 수준이다.
이에 대해 인간의 표현 능력이 더 약해지지 않을까라는 의문과 질문이 생겨났고 이에 대해 데이빗 홀츠는 ‘미드저니가 인간의 능력을 향상하도록 하지 인간을 대체하지는 않을 것’이라고 설명했다. 그가 이 도구를 만든 이유는 ‘인간의 상상력’을 확장하기 위함이다.
지난 8월 미국 콜로라도주가 주최한 회화 공모전에서 우승을 차지한 ‘우주 오페라 극장(Théâtre D’opéra Spatial)’은 미드저니가 생성한 이미지였고 미드저니는 논란의 중심에 서게 되었다.
제이슨 앨런(Jason M. Allen)이라는 사람이 ‘우주 오페라 극장’을 생성하는 데 미드저니(Midjourney)를 사용했다고 공모전에 나가면서 밝혔고 그가 상을 받자 저작권 논란에 휩싸이게 되었다. MIT 테크놀로지 리뷰는 “적대적 생성 신경망(GAN)을 활용한 이미지 생성 도구들이 널리 사용되기 시작하자 추상적 텍스트와 이미지 생성의 간격은 극적으로 좁혀졌다.”라고 분석했다.
[이 기사는 AI 인턴 기자와 NJT 기자가 협업해서 쓴 글입니다.]