(서울=연합인포맥스) 강수지 기자 = 오픈AI가 인공지능(AI) 모델의 학습을 위해 데이터를 수집하는 과정에서 출판사 및 언론사들이 저작권에 대한 대가를 요구하며 소송을 제기하고 있다.
1일 비즈니스인사이더에 따르면 미국 탐사보도센터(The 데이터무단사용quot오픈AI저작권소송잇따라국제뉴스기사본문Center for Investigative Reporting)는 지난주 오픈AI와 마이크로소프트를 상대로 소송을 제기했으며 뉴욕타임스 등 매체도 유사한 소송을 진행 중이다.
오픈AI는 책과 인터넷에 공개된 기사 등 모든 공개 데이터를 사용해 챗GPT를 학습시키는데 이제 저작권을 소유한 이들이 작업에 대한 대가를 요구하고 있다.
데이터 학습은 AI 모델 개발에 필수적이다. 오픈AI뿐만 아니라 주요 기술 기업은 새로운 데이터 출처를 확보하기 위해 분주하며, 메타(NAS:META)는 한때 세계 최대 출판사 중 하나인 사이먼 앤드 슈스터를 인수하는 방안까지 고려했다.
그러나 이러한 노력에도 출판사들은 이들 기업이 저작권 데이터를 무단으로 사용한다고 비난하고 있으며 대가를 지불하라고 요구한다. 메타와 오픈AI는 미국 저작권청에 제출한 의견서에서 인터넷에 저작권 자료를 올리는 것은 '공개 이용 가능' 상태이므로 공정한 사용이라고 주장했다.
탐사보도센터는 이번 소송이 오픈AI가 전 세계 창작자들의 저작권 작품을 착취하여 구축됐기 때문이라고 주장한다.
탐사보도센터의 모니카 바우어라인 대표는 소송 발표에서 "오픈AI와 마이크로소프트는 우리의 이야기를 허락 없이 사용해 그들의 제품을 더 강력하게 만들었다"며 "이는 공정하지 않을 뿐 아니라 저작권 침해"라고 말했다.
지난 5월에는 작가 길드의 집단 소송이, 지난해 12월에는 뉴욕타임스가 유사한 소송을 제기했다.
이후 오픈AI는 여러 뉴스 조직과 라이선스 계약을 체결하기 시작했다. 회사는 AP통신과 월스트리트저널 및 뉴욕포스트의 발행사, 애틀랜틱, 프리사 미디어, 르몽드 신문, 파이낸셜 타임스, 비즈니스 인사이더 모회사 악셀 스프링거와 라이선스 계약을 체결했다.
그러나 지속적인 학습을 위해서 몇 건의 계약만으로는 부족할 것이다.
한 가지 해결책은 실제 세계에서 수집된 데이터가 아닌 인공적으로 생성된 합성 데이터를 사용하는 것이지만, 샘 올트먼 오픈AI 최고경영자(CEO)는 생산된 데이터 품질에 대한 우려를 표명한 바 있다.
sskang@yna.co.kr
(끝)
본 기사는 인포맥스 금융정보 단말기에서 2시간 더 빠른 10시 36분에 서비스된 기사입니다.