AI가 돈 안 내고 조선일보·MBC 기사 학습해도 될까
한국방송협회·이해민 조국혁신당 의원 공동 간담회
“뉴스콘텐츠와 생성형AI 공존 위해 합리적 보상 중요”
▲생성형 AI로 만든 이미지.
"(지상파3사가) 네이버를 상대로 소송을 준비하면서 KBS 콘텐츠가 어떻게 학습되는지 봤다.
(폐지 수집하는) 할머니들의 리어카에 GPS를 붙여 살핀 보도로 방송대상까지 받았다.
그러나 AI에 검색하면 KBS 기자가 심혈을 기울여 만들었다는 사실은 탈색된 채 '리어카 끄는 노인의 삶을 볼 수 있다'고만 한다.
" (최근영 KBS 지식재산권부장)
"네이버가 검색 시장에서 지배적인 뉴스제휴계약을 하면서 우월적 지위를 남용해 AI 개발을 위해 무단으로 학습했다.
네이버는 제휴 약관에 의해 공정하게 쓴 거라고 주장하지만 우리는 무단 학습으로 보고 있다.
" (신한수 한국신문협회 디지털협의회장)
지난 28일 오후 서울 영등포구 국회의원회관에서 한국방송협회와 조국혁신당 AI특별위원회(위원장 이해민)가 공동주최한 <생성형AI 시대, 뉴스 콘텐츠 저작권 보호와 활용방안> 세미나가 열렸다.
이날 신문·방송업계 관계자들은 한국의 대표 포털인 네이버가 생성형AI인 하이퍼클로바 및 하이퍼클로바X 학습에 뉴스콘텐츠를 사용하고 값을 제대로 지불하지 않고 있다고 반발했다.
업계는 저작권자들의 창작물이 보호되면서 생성형AI가 활성화하는 방식으로 가야 한다고 입을 모았다.
한쪽의 희생으로 생성형AI만 발전하는 상황은 안 된다는 것.
KBS·MBC·SBS 지상파 3사는 지난 1월 네이버를 상대로 저작권 침해 및 부정경쟁방지법 위반으로 인한 손해배상 청구와 학습금지 청구 소송을 제기했다.
지난 2월엔 전국 53개 주요 일간신문과 뉴스통신사를 회원사로 둔 한국신문협회가 네이버를 상대로 공정거래위원회 제소를 추진하겠다고 밝힌 뒤, 지난달 공정위에 신고를 마쳤다.
▲미국과 우크라이나의 정상회담 사진을 지브리 스튜디오풍으로 구현한 AI 이미지.
이날 발제를 맡은 최승재 세종대 교수는 "오픈AI의 챗GPT는 지브리 스타일 이미지 생성으로 5억 명의 이용자를 추가로 확보했다.
이용자들은 GPU(그래픽 처리장치)가 녹아내릴 정도의 성공 이면에 이런 스타일을 쓰는 것에 대해 단순히 재밌다는 생각만 해봤을 것이다.
이면의 저작권 문제를 생각해봐야 한다"고 말했다.
이어 뉴욕타임스가 저작권 침해를 이유로 챗GPT 개발사 오픈AI에 소송을 제기한 사례를 소개했다.
뉴욕타임스는 2023년 12월 "자사가 개발한 수백만 건의 기사가 정보의 원천으로 챗봇을 훈련하는데 쓰였고 이제는 신뢰할 만한 정보 제공자로서 경쟁하고 있다"고 주장했다.
최승재 교수는 "뉴욕타임스는 소장에서 우리 기사가 단순 학습용 데이터로 불릴 수 없는 이유는 1831년 뉴욕타임스를 설립해 양질의 기사를 만들기 위해 매우 노력하고 있기 때문이라고 말한다.
전쟁터에서 총알 맞고 죽을 각오로 기사를 쓰고 있다.
2022년 12월31일 기준 뉴욕타임스에는 5800명이 일하고 있다"라고 말한 뒤 "그런데 우리(뉴욕타임스)가 아무런 보상을 받을 수 없어 기사를 못 내면 이럴 경우 무엇을 학습해야 하나. 이 질문에 대해 생각해봐야 한다"라며 현 상황에 시사점을 던졌다.
한국 정부는 외려 AI학습을 위해 빗장을 풀어주려 한다.
2023년 7월 기획재정부는 서비스산업의 디지털화 전략을 통해 AI 산업 육성을 이유로 "TDM(Text and Data Mining, AI 학습용 데이터) 저작권 침해 면책 규정을 명확화할 것" 등을 밝혔다.
그러자 같은 해 8월 한국온라인신문협회는 <생성형 AI의 뉴스 저작권 침해 등에 관한 우리의 입장> 성명서에서 △뉴스 콘텐츠 저작권자인 언론사의 권리 존중 △TDM(Text and Data Mining) 면책 규정 도입 반대 △AI학습 시 뉴스 콘텐츠에 대한 정당한 대가 지불 등 3대 원칙을 공식 표명했다.
한국온라인신문협회는 신문사들의 온라인 부문 및 계열사를 대표하는 협회다.
최승재 교수는 현 상황을 가리켜 "한마디로 돈을 안 내겠다는 거다.
(인공지능 발전을 위해) 돈 안 내고 조선, 동아, 경향 기사를 써도 된다는 이야기다.
그렇게 하는 게 맞나"라고 물었다.
그러면서 "합리적 보상체계가 중요하다.
합리적인 수준을 찾아가는 과정이 필요하다"라고 강조했다.
신한수 신문협회 디지털협의회장도 "최근 분위기가 기술 발전 산업 발전에 맞춰져 있다.
뉴스 콘텐츠 산업이 어떻게 지속 가능하게 발전할 수 있게 할 것인지 소홀히 여겨지고 있다"며 "저작권자들의 밥그릇 지키기가 명백히 아니다.
학습용 데이터를 투명하게 공개하고 검증받고 신뢰도와 안정성을 확보했을 때 글로벌 경쟁력이 생긴다고 본다.
필수적으로 한국어 데이터가 있어야 지속 가능한 발전이 이뤄진다.
저희는 이제 이런 차원에서 학습용 데이터 부문에서 사회적 합의가 필요하다고 본다"고 주장했다.
▲2023년 7월 신문협회보.
네이버를 대상으로 법적대응을 한 이유에 관해 신 회장은 "정당한 (대가를) 지급해라, 언론이 같이 상생하는 생태계 조성을 위해 노력해달라. 민주주의 사회의 근간이 흔들린다.
이런 주장을 하다 보니 왜 너희는 해외업체는 가만두고 국내 업체만 대응하냐고 묻는다"며 "우리나라 AI 발전이 바쁜데 왜 이러냐고 묻는다.
우리 기업한테 말해야 해외 기업에 대해서도 문제 제기할 수 있다"라고 설명했다.
안재형 SBS 법무팀장은 "챗GPT는 다른 생성형 AI가 자신을 학습하지 못하게 한다.
데이터를 학습하는 건 문제가 없고, 학습한 걸 제3자가 학습하는 건 금지한다고 했는데 아이러니한 상황"이라고 지적했다.
최진훈 MBC 법무팀장도 "사석에선 지금처럼 모두가 AI에 열광하는 식으로 논의가 이뤄지면, 결국 인류의 멸망이 될 수도 있다고 얘기한다.
그렇게 되지 않도록 AI 사용자든 권리자든 창작자든 고민이 필요하지 않나"라고 지적했다.
공공데이터 확보에 노력을 기울여야 한다는 주장도 나왔다.
노창희 디지털산업정책연구소장은 "정부 차원에서 공적 데이터를 확보하는 게 굉장히 중요해 보인다.
방송사 입장에서 시장성은 없지만 데이터로 가치 있는 걸 정부가 사준다는 걸 고려해봤으면 한다"며 "곧 시행을 앞둔 기본법은 진흥에 방점이 있다.
창작자를 보호함으로써 산업 성장에 기여할 수 있다.
우리나라가 인공지능에 있어서는 경쟁력이 떨어지지만, 콘텐츠에선 경쟁력이 높아 콘텐츠를 레버리지 삼아서 인공지능을 붐업시킬 필요가 있다.
정부가 적극적으로 레거시 미디어 사업자들에게 인공지능 잘 활용할 수 있도록 지원해줘야 한다"라고 제언했다.
백지연 국회 입법조사처 입법조사관도 "AI 발전은 해야 하고 데이터를 다 사려면 돈이 너무 많이 든다.
공공데이터가 확보돼야 한다.
최근 추경에서 문체부는 공공데이터를 사오기 위한 예산 25억 원을 확보했다.
굉장히 적다.
과기부와 문체부가 다양한 저작물을 구입해 공공데이터를 구축하는 게 필요하다"라고 했다.
저작권자 요청이 있다면 제한적으로라도 학습데이터 공개를 할 수 있도록 만들어야 한다고도 했다.
백지연 입법조사관은 "지브리 사례를 보면, 오픈AI가 학습 여부를 공개 안 해서 이용자들은 지브리풍을 해달라고 하는데, AI가 지브리풍을 학습한 건지 알 수 없다.
학습 안 했다면 소비자 기만, 학습했다면 저작권 문제로 가는 것"이라며 "기업은 어떤 데이터를 학습했는지 다 공개하면 영업비밀을 공개하는 셈이라고 주장하는데, 저작권자 요청에 의해서만이라도 제한적으로 공개해야 한다.
신문협회 방송협회가 이의제기하듯이 불안정한 환경에서는 어떤 발전도 이뤄질 수 없다.
협상의 기본은 만들어 나가야 한다"라고 조언했다.
김수정 과기정통부 데이터진흥과장은 "콘텐츠에 대해 가치를 잘 쳐주는 문화가 필요하다고 생각한다.
LLM 추경예산을 확보했는데 대부분 GPU 관련 예산이다.
TDM 면책 규정 관련해서 FTA를 하면서 미국 걸 가져왔는데 해석 범위가 미국과 다르다는 걸 우리도 안다"라며 "우리나라 AI 생태계를 최고로 만들어주고 싶은 마음이 크지만, 미디어 콘텐츠도 최고로 쳐줘야 한다"라고 말했다.
김혜창 한국저작권위원회 정책연구본부장은 "AI 정확도를 높이려고 하는 시도들에서 가장 먼저 협상 사례가 뉴스 저작물이다.
문체부와 함께 논의하고 있다.
보상 수준이 어느 정도인지 시각차가 클 거다"라며 "사업자는 데이터로 바라보고 있고, 미디어업계는 창작물로 바라보고 있다.
뉴스콘텐츠 보상을 논의하면서 (TDM) 면책이 발생할 수 있도록 고려해야 한다"라고 말했다.
▲28일 오후 서울 여의도동 국회의원회관에서 한국방송협회와 조국혁신당 AI특별위원회(위원장 이해민)가 공동 주최한 '생성형AI 시대, 뉴스 콘텐츠 저작권 보호와 활용방안' 세미나가 열렸다.
사진=이해민 의원실
[관련 기사 : 생성형AI 학습용 저작권 면책 방안에 "대놓고 베끼라는 것" 반발]
[관련 기사 : "생성형 AI 개발과 뉴스저작권 문제 같이 고민해야 선순환 구조될 것"]
[관련 기사 : 신문협회 이어 온신협도 "생성AI 뉴스 학습 시 정당한 대가 지불하라"]
[관련 기사 : "언론, 생성형 AI 학습에 뉴스 활용 증거 확보 노력 기울여야"]
[관련 기사 : 한국신문협회 "생성AI, 뉴스 데이터 학습 저작권 침해 방지해야"]
KBS 탐사보도 AI에 물었더니…누가 제작한지 알려주지도 않았다