생성형 AI가 풀지 못한 숙제 part.2
2023.09.08

생성형 AI가 풀지 못한 숙제 part.2

: 금융 분야에서의 생성형 AI와 학습 데이터 이슈

박정관(법무법인 율촌 전문위원)


| Intro


생성형 AI가 연일 발전을 거듭하고 있다. 자연스럽게 사람들의 관심은 생성형 AI에서 가장 중요한 부분 중 하나인 학습용 input 데이터에 쏠리고 있다. 지난번 원고(생성형 AI가 풀지 못한 숙제 part.1 : 데이터 이용과 저작권 이슈› - 클릭 시 바로 이동)에서는 학습용 데이터를 둘러싼 콘텐츠 제공자들과 생성형 AI 회사 간의 논쟁, 정부 정책 방향, 그리고 시사점을 살펴보았는데 이번에는 그림1에서 보듯이 금융 분야의 생성형 AI와 학습 데이터 이슈를 검토해 보고자 한다.

<그림1- 금융 학슴용 input 데이터(저자 작성)>

금융 분야에서도 생성형 AI는 앞으로 눈부신 발전을 이루고 업계와 소비자에게 큰 도움이 될 것으로 예측하고 있다. 특히 금융 분야에서 생성형 AI는 다음과 같은 활용 사례를 제공할 것으로 보인다[1].
  • 이상 거래 상황 탐지(fraud detection): 실시간으로 이상 거래를 탐지하고 사기 상황이 발생하면 즉시 경고
  • 리스크 관리(risk management): 리스크를 식별하고 합리적으로 평가하며, 자산을 효율적이고 효과적으로 운용
  • 효과적인 대출 결정(loan decision making): 대출을 신청한 사람의 능력과 자격을 평가
  • 마케팅(marketing): 초개인화된 컨텐츠를 생산하여 텍스트, 오디오, 비디오 채널을 통해서 마케팅 목표 달성
  • 운용 프로세스 개선(operations transformation): 금융 서비스와 관련된 금융 회사 내부 프로세스와 고객 관련 프로세스에서 혁신 달성
생성형 AI는 대규모 데이터셋에서 관련 정보를 추출하고, 사람이 미처 찾지 못한 패턴을 찾아서 짧은 시간 안에 데이터를 분석할 것이다. 이를 통해 생성형 AI는 밤과 낮을 구분하지 않고 고객과 내부 직원의 질문에 답을 하고, 계좌 운용을 도와주게 될 것이다[2]. 하지만, 가장 중요한 부분은 지금까지 로보 어드바이저의 역할보다 훨씬 개인화(personalized)된 맞춤형 상담과 상품이 제공될 것이고 이를 위해 더욱 개인화된 대량의 학습용 input 데이터가 필요하게 될 것이란 점이다[3].


| 학습용 input 데이터 - 마이데이터(MyData)와 리스크


생성형 AI에는 고품질의 많은 학습용 input데이터가 필수적이다. 일반 분야에 비해 돈이 오가는 금융 분야는 더욱 그렇다. 금융 분야 생성형 AI를 위해서는 뉴스 기사, 각종 논문, 각 회사의 수익 보고서, 블로그, 웹문서, SNS 등 다양한 인터넷상의 자료가 학습용 데이터로 활용될 것으로 전망하고 있다. 그렇지만 앞서 언급한 것같이 초개인화된 맞춤형 상품이 비즈니스 모델로 여전히 유효하기 때문에 개인 데이터가 필수적이다.

다행히 우리나라는 금융 분야에 마이데이터(MyData) 제도가 도입되어 있다. 금융 기관들과 빅테크들은 금융위원회 허가를 받은 후 마이데이터 제도를 통해서 개인들의 금융 관련 데이터를 수집할 수 있었다[4]. 금융 분야 마이데이터는 2021년 1월 금융위원회로부터 사업자 허가를 받은 이후 준비 과정을 거쳐서 2022년 1월부터 본격적으로 서비스를 제공했다. 올 3월 현재 약 64개 마이데이터 사업자가 금융권에 진입했으며, 마이데이터 서비스 가입자가 1,000만명을 넘어서는 사업자도 나타나고 있다[5]. 

아래 그림2에서와 같이 마이데이터는 개인이 전송요구권을 요구하게 되면 여러 기관에 흩어진 나의 자산을 한번에 조회하고, 자산 종합분석을 통해서 상품추천과 종합 솔루션을 제공해 주는 서비스이다. 또한, 나에게 맞는 카드 추천 서비스도 제공한다. 아울러, 부동산/자동차의 시세 관리부터 건강 관리 서비스도 제공하고 있다. 지금까지 고액 자산가들이 영업점에서 VIP 서비스를 받은 것처럼 일반 소비자도 마이데이터를 통해서 원하는 금융 서비스를 제공받는 것을 목표로 한다.

<그림2 - 마이데이터 서비스의 이해(출처: 마이데이터 종합포털(mydatacenter.or.kr))>

더 나아가 8월 17일 개인정보보호위원회는 과기정통부, 금융위원회, 보건복지부 등과 함께 금융 분야 마이데이터를 비롯해 모든 분야에 마이데이터 서비스를 활성화시키겠다고 얘기하면서 ‘국가 마이데이터 혁신 추진전략’을 발표했다[6]. 즉, 그동안 금융 분야만 수집하는 마이데이터 제도가 있었는데 다른 모든 분야에 있는 나의 데이터도 한 곳에 모아서 국민의 데이터 주권도 보장하고 데이터 경제도 활성화되도록 하겠다는 것이다[7].

이를 통해서 볼 때 금융 분야 생성형 AI가 학습할 수 있는 input 데이터는 더욱 크게 늘어날 것으로 보인다. 즉, 기존에는 내가 금융 거래한 데이터에 한정해서 금융 회사가 나를 알고 맞춤형 상품을 추천했는데 이제는 보건의료, 통신, 인터넷, 전기, 수도, 교통, 교육, 고용노동, 부동산, 복지, 유통, 여가 분야에서도 나의 데이터를 수집해서 맞춤형 상품을 추천하겠다는 것이다. 이처럼 생성형 AI의 학습 데이터가 늘수록 맞춤형 상품이 더 정밀해지니 input 데이터가 늘어나는 것은 생성형 AI 회사 입장에서나 소비자 입장에서 긍정적인 부분일 수 있다.

다만, 마이데이터가 생성형 AI의 학습용 input 데이터에 활용되는 데 아직까지 다음과 같은 리스크도 있다는 것을 간과해서는 안된다. 

  1. 마이데이터를 통해 축적된 자료가 오히려 소비자들에게 가격차별의 수단으로 사용될 우려도 있다[8]. 개인신용정보 ‘전송요구권’을 통해서 그동안 내가 거래한 금융 회사 등에 나의 정보를 내가 선택한 마이데이터 사업자에게 전송할 수 있게 되었다. 또한, 개인정보보호법에 따라 다른 분야로도 이 전송요구권이 확대될 예정이다. 이렇게 하는 중요한 이유 중 하나는 신용이 충분하지 못한 이른 바 ‘신 파일러’(thin filer; 사회 초년생이나 주부, 노약자 등 금융 거래 이력이 없거나 부족한 사람들)에게 대출 등의 기회를 제공하기 위해서 시작하는 것이다. 하지만 실제로는 AI 알고리즘이 그동안 금융 데이터를 학습하다 보면 거꾸로 기존의 편향을 영구화하거나 특정 집단을 차별하게 될 수도 있다.  
  2. 게다가 전송요구권을 국가가 나서서 법적으로 강제하는 곳은 아직까지 우리나라밖에 없다는 것이다[9]. 마이데이터를 처음 시작한 선진국들은 시장에서 자율적으로 이 제도를 운영하고 있다. 개인이 필요하면 금융기관에서 나의 데이터를 다운로드 받아서 필요한 곳에 전달한다. 반면, 우리나라의 경우 정부가 나서서 마이데이터를 하나의 사업으로 키우려고 하는 것이다. 그렇다 보니 소비자들은 자신의 데이터가 마이데이터 사업자에게 전달되고 이를 마이데이터 사업자가 계속 축적하고 있음에도 불구하고 자신이 직접 관여하고 통제할 수 있다고 느낄 수 있는 부분이 별로 없다. 결국 나의 데이터로 돈을 버는 곳은 따로 있는 것이다.
  3. 또한, 사업자 입장에서는 소비자의 데이터에 대해 전송 요구가 들어오면 의무적으로 내어 주어야 하는데, 이때 의무적으로 주어야 하는 자와 받고자 하는 자 사이에 비용 처리 문제로 갈등이 생길 수 있다. 마이데이터가 정부의 계획처럼 금융 분야를 넘어서 사회 전 분야로 확대된다면 이 갈등은 더욱 커질 수 있다. 생성형 AI는 갈수록 발전하고 있는데 학습용 input 데이터로 활용하려는 마이데이터에 이러한 리스크가 있다는 점을 알고 유의할 필요가 있다. 

| 미국의 규제 동향


금융 분야 생성형 AI의 학습용 데이터에 대한 미국의 규제는 한국처럼 아직까지 분명히 드러나지는 않고 있다. 그럼에도 불구하고 사용되는 input 데이터에 개인의 데이터가 포함되는 것을 크게 우려하고 있다. 지난 7월 미국FTC(Federal Trade Commission; 연방거래위원회)는 ChatGPT를 만든 Open AI에 대한 조사를 시작했다[10]. 미국 FTC는 한국의 공정거래위원회와 개인정보보호위원회를 합친 직무를 수행한다. FTC는 Open AI가 소비자보호법을 위반했는지 여부를 조사하면서 ChatGPT를 학습시키기 위해 사용된 데이터를 어떻게 확보했는지, 데이터 수집 과정에서 입수한 개인 데이터를 어떻게 취급하고 있는지, 알고리즘을 조작하지는 않았는지 등 세세한 질문을 포함해 20페이지에 달하는 공문을 보냈다.

유럽은 생성형 AI 등장 이후 인공지능법도 통과시키고 AI 회사인 디지털플랫폼 회사들에 대해 규제가 강하다고 알려져 있다. 유럽이 이렇게 하는 이유는 유럽에 강력한 AI 회사가 없기 때문이라고 얘기하기도 한다. 따라서 일부 사람들은 한국은 생성형 AI에 대해 미국처럼 유연한 모델, 즉 기술혁신을 우선시하는 환경으로 가야 한다고 얘기한다. 하지만, 생성형 AI 회사가 많은 미국 역시 혁신 기술로 인한 리스크를 알기 때문에 규제를 해야 한다는 생각에 큰 이견이 없는 것으로 보인다. 

미국 법무부(DOJ; Department of Justice)는 검색 광고 및 온라인 광고를 하고 있는 구글이 공정한 경쟁을 해친다고 여겨서 구글을 분할해 매각해야 한다는 소송을 진행 중이다[11]. 또한, FCC(Federal Communications Commission; 연방 커뮤니케이션 위원회) 위원장 출신이면서 미국에서 가장 유명한 씽크탱크 중 하나인 브루킹스 연구소의 톰 휠러(Tom Wheeler)는 생성형 AI가 미칠 리스크가 매우 크기 때문에 유럽처럼 리스크별로 구분해서 규제해야 한다고 주장한다. 톰 휠러에게 의견을 같이 하는 사람들은, 장기적으로는 생성형 AI의 위험성이 크기 때문에 별도의 규제기구를 만들어야 하며, 단기적으로는 기존 규제기관인 FTC에 더 많은 규제 수단을 만들어 주어야만 한다고 주장하고 있다[12].

평범한 미국 국민들 역시 7월 18일부터 21일 사이에 실시된 설문 조사에서 응답자의 72%가 생성형 AI의 발전은 속도를 늦춰서(slow down) 진행하기를 원하는 것으로 나타났다[13]. 미국에서 이처럼 생성형AI를 규제해야 한다는 분위기가 커진 것은 생성형 AI 역시 개인 데이터를 활용한 비즈니스 모델을 그대로 유지하고 있기 때문이다. 생성형 AI의 혁신적인 모델은 그동안 빅테크들이 활용했던 비즈니스 모델을 그대로 이용할 것이고 그로 인해 프라이버시 이슈, 빅테크의 집중으로 인한 경쟁 이슈, 가짜 뉴스 이슈 등 그동안 나타났던 문제들이 더 심화될 것에 대한 우려가 있기 때문이다. 이로 인해 미국은 연방 의회 차원이 아니고 주(States) 단위에서도 생성형 AI에 대한 규제를 늘리고 있다[14].


| 시사점


생성형 AI 발전에 대한 기대와 열기가 정말 뜨겁다. 생성형 AI 모델 개발에 기업들은 사활을 걸고 있다. 금융 분야 학습용 input 데이터에 대한 부분도 마찬가지이다. 다만, 마이데이터 등 개인 데이터를 금융 분야를 넘어서 다른 부문으로 확대함으로써 학습용 input 데이터로 활용하고 데이터 경제를 활성화시키겠다는 정부의 의지는 미국에서 이루어지는 규제 논의와 약간의 온도 차가 나는 것이 사실이다.

물론 한국의 처한 위치가 미국과 같은 선진국과는 다를 수 있다. 한국은 아직 한참 더 따라 가야 한다고 생각할 수 있다. 생성형 AI와 학습 input 데이터에는 현실주의와 민족주의가 더 중요한 문제라고 생각할 수 있다. 하지만, 생성형 AI 모델 발전과 학습용 데이터 논쟁으로 인한 콘텐츠 제작자들의 우려, 개인 데이터에 대한 학습 등에 대해 우려하는 미국의 모습을 보면서 한국도 너무 급하게 서두르지만은 않는 것이 좋을 것 같다는 생각이 든다.

오히려 학습용 input 데이터로 활용될 마이데이터 이슈에 대해서 지금이라도 더 개인들의 신뢰를 쌓는 것이 좋지 않을까? 중장기적으로 볼 때 마이데이터에 대해 개인의 이해를 구하고 통제할 수 있는 권한을 더 부여하는 것이 생성형 AI 시대에 데이터 생태계 활성화 및 학습용 input 데이터 확보에 더 도움이 될 것으로 보인다. “끝”.

| 참고 문헌

  • Christopher T. Zirpoli(2023) Generative Artificial Intelligence and Copyright Law, Congressional Research Service, 2023. 5. 11
  • 문병기(2023) 미 작가들 “AI 훈련에 콘텐츠 무단 사용 말라”…빅테크 상대 집단 소송, 동아일보, 2023.8.1
  • 박종원(2023) 머스크, MS에 소송 예고, 파이낸셜뉴스, 2023.4.19
  • State of Israel Ministry of Justice(2022) Opinion: Use of Copyrighted Materials for ML. 2022.12.18
  • 김은성(2023) 데이터 도둑 사용 제동걸까…문체부, 10월 AI 활용방안 발표. 경향신문, 2023.7.23
  • Trishla Ostwal(2023) The New York Times Updates Terms of Service to Prevent AI Scraping its content, ADWEEK, 2023.8.10
  • Anna Nicolaou & Madhumita Murgia(2023) Google and Universal Music negotiate deal over AI ‘deepfakes’. Financial Times, 2023.8.9
  • Lina Khan(2023) Lina Khan: We must regulate A.I. Here’s How. The New York Times, 2023.5.3


| 주석

  1.  Jagreet Kaur (2023) Generative AI in Banking and Finance Industry, XENONSTACK, 2023.5.11
  2.  Krause, D. (2023). ChatGPT and Generative AI: The New Barbarians at the Gate. Available at SSRN 4447526.
  3.  Krause, D. (2023). ChatGPT and Generative AI: The New Barbarians at the Gate. Available at SSRN 4447526.
  4.  금융위원회(2023) 초거대 AI 시대, 데이터 기반의 지속적 혁신 경쟁을 위한 금융데이터 정책 간담회 개최, 보도 자료, 2023. 3.14
  5.  김시소(2023) 금융 마이데이터, ‘1사 1000만’ 시대 열렸다, 전자신문, 2023.8.6
  6.  개인정보보호위원회, 과기정통부, 금융위원회, 보건복지부(2023) 국가 마이데이터 혁신 추진전략, 2023. 8.17
  7.  이인애(2023) 마이데이터, IT서비스 업계 새 수익원으로 급부상, IT Chosun, 2023.8.21
  8.  백연주(2023) 금융 마이데이터의 현황과 향후 과제, 금융브리프, 32권 09호
  9.  Park, J. K., Park, S. K., & Lee, B. G. (2021). Priority of Challenges for Activation of MyData Business: K-MyData Case. KSII Transactions on Internet & Information Systems, 15(10).
  10.  Brian Fung(2023) FTC is investigating ChatGPT-maker Open AI for potential harm to consumers, CNN, 2023.7.13
  11.  박재영, 임형준(2023) “구글을 분할하라”…정부가 기업에 이래도 되냐고요?, 매일경제, 2023.8.20
  12.  Derek Robertson(2023) 5 questions for Tom Wheeler, Politico, 2023.7.21
  13.  Sigal Samuel(2023) What normal Americans – not AI companies – want for AI, Vox, 2023.8.18
  14.  Hillary Brill(2023) Forget Washington – US States Drive Tech Policy, CEPA, 2023.8.17
상기 콘텐츠의 모든 저작권은 BC카드 신금융연구소 (이하 'BCiF')에 있으며, 무단 도용을 금합니다.
본 자료를 인용 및 발췌하고자 할 경우 출처를 명확하게 표기해야 합니다.
박정관
법무법인 율촌에서 전문위원으로 활동하고 있는 그는 미래창조과학부, 방송통신위원회를 거치며 방송 및 통신 정책과 관련된 전문 실무 경험을 축적하고, 미래전파공학연구소에서 ICT정책연구실장을 역임했습니다. 고려대학교에서 영문학을 전공한 그는 영국 City University, Westminster University 에서 각각 커뮤니케이션정책학 석사 학위를 취득했고, KDI국제정책대학원에서 공공정책학 석사 학위를 취득했습니다. 연세대학교 정보대학원에서 마이데이터 분야와 관련된 논문으로 박사 학위를 취득했습니다. 현재 호서대학교 기술경영전문대학원에서 겸임교수로도 활동하고 있습니다.