

2022년 11월 OpenAI가 ChatGPT(Generative Pre-Trained Transformer)를 출시한 이후 현재 상당한 인기를 얻고 있는데, 이는 방대한 텍스트 데이터를 기반으로 학습된 대형 언어 모델(Large Language Model, ‘LLM')을 진화시킨 결과로 만들어진 초거대 AI 모델이다.
우선 초거대 AI 모델 챗봇의 활용 면에서는 기존 AI 기반 챗봇의 결과물과는 비교할 수 없을 정도로 그 결과물의 정확도와 완결성이 상당하다. 실제 ChatGPT가 생성한 결과물 자체가 사람이 작성한 것인지 AI가 작성한 것인지 분간하기 어려워 교육계나 학계에서는 그대로 이용하는 경우가 많아지면서, 뉴욕시 공립학교에서는 과제 대필 행위를 우려하여 ChatGPT 사용을 금지하기로 하였고, 국제학술지 ‘네이처’는 ChatGPT와 같은 대형 언어 모델에 기반한 인공지능은 연구 논문의 저자로 인정되지 아니하고 그러한 인공지능을 사용할 경우 논문에 명시해야 한다는 가이드라인을 발표하기까지 하였다. 그리고 이런 생성 결과물의 완결성이 커짐에 따라 자연스럽게 더욱 논란이 되는 것이 저작권 침해 문제이다. 실제 ChatGPT로 작성되는 글이나 소스 코드는 방대한 데이터를 학습한 결과로 자동 생성된다고 알려질 뿐, 구체적으로 어떠한 내용에 근거하여 도출된 것인지 알 수 없고, 생성된 결과물에도 별도 출처가 표기되어 있지 않다. 그러한 점에서 사용자가 초거대 AI 모델 챗봇의 검색 결과물을 내부적으로 참조할 때를 차치하고 사용자가 그 결과물을 대외적으로 사용하거나 활용할 경우, 언제든지 표절 문제가 발생할 수 있다. 이 경우 공정사용이라는 카테고리를 벗어날 수 있어 AI 챗봇 사용자에 대한 저작권 침해 문제가 발생할 수 있다. 한편, 초거대 AI 모델 챗봇을 개발할 때 여러 오픈소스를 사용하는데, 오픈소스 소프트웨어의 라이선스에서는 copyright의 반대개념으로서 copyleft의 원칙상 사용하고 있는 라이선스 조건을 준수해야 하는데, 대표적인 것이 저작권 표시, 출처 표시, 일정한 경우 소스코드 공개 등이다. 이러한 문제도 현실화 되었는데, 그 일례로 오픈소스 소프트웨어 권리자들이 2022년 11월 캘리포니아주 북부 지방법원에 초거대 AI 모델 챗봇에 대해 집단 소송을 제기하였고, 저작권 관리정보 삭제, 오픈소스 라이선스 위반이 그 주된 청구원인이다.
AI에 대한 공정이용 특칙, 권리부여 등 다양한 논의가 정리되어, 이해관계 조정을 통한 AI 산업의 안정적인 발전과 이에 대한 활용이 제대로 이루어지길 기대한다.
이근우 변호사 (법무법인 화우)