Photo by Midjourney. War of chatbots.
챗GPT의 대항마가 탄생했다.
스탠퍼드대학 연구팀이 개발한 대항마는 DetectGPT(이하 디텍트GPT). 영어 단어 Detect는 ‘감지하다’는 의미를 갖고 있다. 디텍트GPT는 AI 또는 기계로 작성된 콘텐츠를 감지하는 GPT이다. 스탠포드 대학의 연구팀이 만든 이 새로운 GPT는 테스트 결과 95%의 정확도를 나타냈다고 한다.
현재 독자분들이 읽고 있는 이 기사도 AI가 작성한 것인데 DetectGPT가 AI 작성 기사인지 아닌지를 판별하게 된다는 것이다. 이는 스탠퍼드대의 박사 과정 학생과 컴퓨터 과학자 팀이 함께 개발한 것이다. 언어 분석, 기계 학습 및 자연어 처리와 같은 방법의 조합을 사용하여 생성된 텍스트를 감지하는 것이 디텍트GPT이다.
디텍트GPT는 GPT-2 모델에서 생성된 문장을 감지할 수 있다고 한다. 이는 콘텐츠의 정확성을 확인해야 하는 블로거 및 콘텐츠 제작자에게 유용하다고 한다. 또한, 디텍트GPT는 오픈AI사가 만들어 선풍을 일으키고 있는 ChatGPT 및 유사 기술을 감지하도록 설계되었다고 한다.
스탠포드 연구자들은 이 소프트웨어가 대학에서 학생들이 논문을 쓰거나 과제를 써서 제출할 때 부정행위를 감지하기 위해 사용될 수 있다고 알렸다.
디텍트GPT의 알고리즘은 스탠퍼드 연구원이 개발한 대규모 언어 모델(LLM)을 기반으로 한다. LLM은 매우 큰 텍스트 데이터 세트에서 훈련되는 AI 기반 시스템이다. 소프트웨어는 이러한 LLM을 사용하여 유사한 시스템에서 생성된 콘텐츠를 식별하여 교사와 다른 사람들이 잠재적인 부정행위가 발생하기 전에 이를 식별하도록 돕는다.
(여기서부터는 NJT 기자 고유의 글) 이는 바람직하다. 챗GPT 내용을 그대로 사용하는 것이 아니라 인간과의 협업을 위해 사용하는 것이 더 바람직하기 때문이다. 그러나 GPT가 현재 GPT-2와 GPT-3에서 머무는 현 상황에서 이와 같은 노력이 의미가 있지만 GPT의 수준이 GPT-4, GPT-5 이렇게 높아지면 식별하고 구별하는 것은 별 의미가 없을 것으로 보인다.
워낙 높은 수준에서 콘텐츠가 나오면, 즉 인간이 도저히 따라갈 수 없는 수준까지 올라가면 식별하는 것은 큰 의미가 없게 될 것이다. 챗GPT가 생성해내는 콘텐츠의 수준이 매우 높고 그것이 인류의 발전에 도움이 된다면 굳이 식별해서 사장할 이유는 없는 것이다.