• Legalinsight
  • Legaledu
  • 법률신문 법률정보

    연구논단

    인공지능과 데이터법

    정상조 교수(서울대 로스쿨) 입력 :
    글자크기 : 확대 최소
  • 인쇄
  • 메일보내기
  • 기사스크랩
  • 스크랩 보기
  • 159295.jpg

    인공지능(AI)은 제4차 산업혁명을 이끌어갈 핵심기술이다. 그러나, 소프트웨어 없는 컴퓨터가 고철덩어리에 불과한 것처럼, 데이터 없는 인공지능은 아무런 가치가 없다. 이제 데이터가 토지, 노동, 자본 이상으로 중요한 생산요소가 되고 데이터 자체가 거래대상으로 된 경제, 데이터자본주의(data capitalism)가 시작되었다. 토지에 대한 소유권이 중요했던 것처럼, 이제는 (1) 누가 데이터를 지배할 수 있는 권리를 보유하는지, (2) 어느 범위에서 데이터의 자유로운 수집과 이용이 허용되는지, 그리고 (3) 데이터를 둘러싼 공정한 경쟁질서는 무엇인지가 데이터자본주의 하에서 가장 중요한 화두가 되었다.



    1) 데이터에 대한 권리

    인공지능은 방대한 분량의 데이터를 학습, 분석해서 일정한 패턴을 찾아내고 그 패턴에 따라서 결과를 예측한다. 그 결과는 번역일 수도 있고 그림이 될 수도 있고 암진단일 수도 있다. 인공지능 학습에 투입되는 데이터는 그 유형이 다양하고 그 보호도 다양한 법률에 의해서 이루어질 수 있다. 

     
    개인정보를 포함한 데이터는 개인정보보호법의 보호대상이 된다. 데이터 가운데 저작권법의 보호를 받는 저작물, 편집저작물, 또는 데이터베이스에 해당되는 데이터도 있다. 데이터가 저작권법상 보호받을 수 없는 경우에도, 부정경쟁방지 및 영업비밀보호에 관한 법률(부정경쟁방지법) 또는 콘텐츠산업진흥법의 보호대상으로 될 수도 있다. 또한, 데이터의 유형을 불문하고 경제적 가치를 가진 데이터로서 비밀로 관리된 데이터라면 영업비밀로 보호될 수 있을 것이다.


    법률상의 권리 뿐만아니라 계약상의 권리에 의해서도 데이터를 지배하고 그 수집과 이용을 제약할 수 있다. 예컨대, 데이터를 확보한 웹사이트가 크롤러(crawler), 스파이더(spider) 등의 로봇에 의한 데이터 접근 및 이용을 금지하는 약관을 두거나 그 루트 디렉토리에 ‘robots.txt’와 같은 로봇배제표준(robot exclusion standard)을 채택할 수 있다.


    인공지능이 정보주체 또는 권리자의 허락을 받아서 데이터를 수집하고 이용하면 문제 없겠지만, 이용허락 여부가 불명확하거나 또는 로봇처럼 허락없이 기계적으로 데이터를 수집해서 이용한 경우에 권리침해 내지 법위반 여부에 관한 법해석상 어려운 문제가 제기될 수 있다.


    2) 데이터의 수집과 이용

    개인정보의 경우에 2020년 법개정에 따라서 인공지능에 의한 가명정보 및 익명정보의 이용이 활성화될 것으로 예상된다. 그러나 인공지능이 수집해서 이용하는 데이터가 개인을 알아볼 수 있는 개인정보에 해당되는 경우에는 정보주체의 동의를 받아야 한다. 다만, 인터넷 상 이미 공개되어 있는 개인정보를 수집해서 이용하는 경우에도 정보주체의 동의를 받아야 하는지는 여전히 불명확하다. 예컨대, 로봇이 인터넷 상 성명과 함께 이미 공개되어 있는 사진이나 동영상 등 개인정보를 수집하는 것만으로 그 개인의 프라이버시를 침해한다고 단언할 수 없지만, 정보주체의 허락 없이 그러한 개인정보를 수집하는 것이 적법하다고 말하기도 어렵다.


    저작물 또는 데이터베이스의 경우에는, 데이터의 이용이 저작권제한 또는 공정이용에 해당된다면 권리자의 허락없어도 그 수집과 이용이 적법하게 이루어질 수 있다. 공정이용 여부의 판단에 있어서 4가지 요소를 고려해야 한다. 첫째, 이용의 성격에 있어서 비영리성은 공정이용의 판단에 긍정적인 요소가 되겠지만, 영리적인 이용이더라도 ‘변형적 이용 (transformative use)’이나 ‘비표현적 이용(non-expressive use)’은 또 다른 긍정적 요소가 될 수 있다. 인공지능에 의한 데이터의 수집과 이용이 저작물로서의 본래의 심미적 용도가 아니라가 검색이나 문자인식 등 새로운 용도를 위한 것이라면 소위 ‘변형적 이용’으로 볼 수 있다. 인간은 저작물에 표현된 사상이나 감정을 향유하는데 반해서, 인공지능에 의한 저작물의 수집과 이용은 데이터분석과 같은 ‘비표현적 이용’으로 저작물의 가치나 시장에 악영향을 미치지 않는다는 점에서 공정이용의 판단에 긍정적인 요소가 될 수 있다. 


    인공지능에 의한 데이터 이용은 주로 변형적 이용에 해당된다면, 공정이용의 두 번째 요소 ‘저작물의 종류 및 용도’는 커다란 변수가 되기 어려울 것이다. 그러나, 세 번째 요소 ‘이용분량’은 다소 판단하기 어려운 변수가 된다. 인공지능에 의한 데이터 투입단계에서는 모든 데이터가 전부 투입되어 분석의 대상이 되기 때문에 이용분량은 많고 공정이용에 불리한 요소가 될 수 있다. 그러나, 인공지능의 분석단계에서는 저작물의 사상이나 감정과 무관한 비표현적(non-expressive) 데이터만을 추출해서 이용한다. 인공지능은 데이터분석으로 통해서 통계학적으로 반복빈도가 높은 패턴데이터를 찾아서 저장해서 산출단계에 이용하기 때문에 저작물의 이용분량은 미미한 경우가 많다. 구글도서나 이미지검색 사례에서 볼 수 있는 바와 같이, 산출단계의 이용분량이나 이용정도가 미미한 경우에는 투입단계의 이용분량이 많다는 이유만으로 공정이용을 부인할 수 없을 것이다. 


    공정이용의 네 번째 요소 ‘원저작물의 시장 또는 가치에 미치는 영향’은 언제나 중요한 요소이지만 인공지능에 의한 데이터의 이용에 관한 판단은 쉽지 않다. 문자인식이나 음성인식을 위한 인공지능의 경우에는, 원저작물의 시장과 인공지능 서비스의 시장이 전혀 다르기 때문에, 원저작물의 시장 또는 가치에 미치는 영향이 크지 않다. 그러나 인공지능에 의한 저작물 소비가 급증하면서 저작물의 시장과 가치도 변화하고 있다. 특히, 음악이나 그림 또는 소설이나 뉴스를 생산하는 창작형 인공지능의 경우에는 그 산출물이 인간의 표현을 거의 완벽하게 모방하게 되고, 인공지능이 동일한 시장에서 인간과 경쟁하는 관계에 놓일 수 있다.


    3) 데이터를 둘러싼 경쟁

    개인정보보호법이나 저작권법의 보호대상에 해당되지 않는 데이터는 원칙적으로 인공지능에 의한 자유로운 접근과 이용 및 경쟁이 가능하다. 그러나, 우리 부정경쟁방지법과 콘텐츠산업진흥법은 일정한 요건 하에 그러한 데이터의 무단이용행위를 위법한 것으로 금지하고 그에 대한 손해배상의무를 규정하고 있다. 그렇다면, 공정이용에 해당되는 데이터 수집이나 이용도 그 데이터 보유자의 노력의 결과에 무임승차하는 위법헹위로 부정경쟁방지법 또는 콘텐츠산업진흥법상의 책임을 추궁할 수 있을까? 


    저작권법과 달리 부정경쟁방지법 또는 콘텐츠산업진흥법은 공정이용의 예외를 두고 있지 않다. 그러나, 공정이용에서와 유사한 요소들을 무임승차에 대한 항변사유로 고려할 필요는 있다. 예컨대, 로봇에 의한 데이터의 수집과 인공지능에 의한 분석이 부정경쟁방지법상 공정한 상거래관행이나 경쟁질서에 반하는 것인지 여부를 판단함에 있어서 저작권법상의 공정이용에서와 유사한 기준을 준용하는 것이 바람직하고 필요하다. 콘텐츠산업진흥법상 콘텐츠제작자의 영업상 이익의 침해여부를 판단함에 있어서도, 인공지능에 의한 데이터의 변형적, 비표현적 이용은 데이터보유자의 이익을 심각하게 침해하지 않고 소비자 편익을 제고한다고 볼 여지가 충분히 있다.


    데이터에 대한 권리 및 법적보호는 데이터의 생산을 촉진하는 기능을 갖고 있지만, 권리과잉 내지 지나친 보호는 수집과 이용을 위축시키고 장기적으로 생산까지 위축시키는 악순환을 초래할 수 있다. 따라서, 데이터 무단이용의 위법성은 데이터를 둘러싼 공정한 경쟁질서 즉 데이터의 생산과 수집 및 이용의 효율적인 균형점을 고려해서 판단해야 한다. 데이터자본주의 하에서 데이터에 대한 권리의 남용이나 데이터 수집의 제한에 의한 경쟁제한은 독점규제법의 위반에 해당될 수도 있다. 특히, 경쟁업체의 로봇에 의한 데이터 접근을 금지하거나 방해하는 것이 공정한 경쟁을 제한하는 결과를 초래한다면 독점규제법 위반의 문제가 제기될 수도 있다. 



    4) 입법론

    데이터에 대한 권리는 개인정보보호법, 저작권법, 부정경쟁방지법 등에 의해서 보호되는데 반해서, 로봇에 의한 데이터의 수집과 이용은 어떠한 경우에 어느 범위에서 적법한 것인지 불명확한 실정이다. 데이터를 둘러싼 경쟁이 치열해지면서 권리침해 및 불공정경쟁 여부에 관한 분쟁도 증가할 것으로 예상된다. 특히 저작권법상 공정이용에 해당되는지 여부의 판단기준이 추상적이고, 부정경쟁방지법에는 공정이용에 유사한 권리제한 내지 예외사유가 없다. 인공지능 기술은 발전하고 있지만, 인공지능에 의한 데이터의 수집과 이용의 적법성 여부에 관한 선례는 부족해서 그 판단을 예측하기도 어렵다.


    데이터에 대한 권리의 범위 또는 그 수집과 이용의 적법성이 불명확하고 예측이 곤란하면, 인공지능의 발전을 위한 투자와 혁신이 위축될 수 있다. 유럽과 일본은 보다 명확한 기준을 제시하기 위해서 일정한 저작권제한사유를 추가로 도입하는 법개정을 한 바 있다. 우리나라 저작권법에는 영미법계의 공정이용과 같은 일반조항이 있지만, 보다 명확한 법규정을 선호하는 대륙법계 실무경향은 여전히 지배적이다. 따라서, 데이터분석 또는 저작물의 비표현적 이용 등에 국한된 별도의 저작권제한사유를 추가로 도입하는 방안을 적극 검토해볼 필요가 있다.

     

     

    정상조 교수(서울대 로스쿨) 


    최근 많이 본 기사