
우리는 국민주권정부이며 AI 3강을 기치로 하는 한편, 지난 26일 저녁 국가정보자원관리원의 배터리 하나 화재로 정부 주요 전산망이 마비되는 시대에 살고 있다. 데이터의 중요성은 두말 할 나위가 없다. 이번 사태에서 다시한번 실감했으며 AI 역시 데이터가 없다면 무용지물이다. 데이터는 대한민국 미래 먹거리를 결정할 AI의 ‘연료’로 얼마나 양질의 데이터를 효과적으로 활용하는 데에 성공여부가 달려있다.
국민에게 데이터 주권은 있는가?
대한민국 데이터 현실은 어떠한가, 이와 함께 데이터가 과연 국민주권정부의 ‘국민주권’과 과연 무관한가 돌아봐야 한다. 다시 말해 데이터 주권이 어디에 있는가라는 질문이다. 대답을 먼저 한다면 슬프게도 대한민국에 사는 우리는 ‘데이터 주권’과 거리가 멀다. 내가 생산한 데이터가, 나로 인해 만들어진 정보가, 누군가의 허가와 무엇인가의 승인을 거쳐야만 접근할 수 있다.
산업자본주의 세계에서 노동의 결과가 누군가의 소유가 되고, 금융자본주의 시대에서 내가 사는 집이 금융권 채권의 일부가 되는 것과 동일하게 작동되고 있다. 다가오는 AI자본주의시대에 데이터는 생산자인 시민의 소유이며 권리에서 소외되고 있다. 이런 현실은 왜, 어떻게, 만들어졌고 우리는 본인의 주권을 뺴앗기고 있다는 현실마저 인식하지 못한 채 살고 있는가에 대해 한발자욱만 가까이 가서 살펴보자.
정부기관인 한국사회보장정보원에 의하면 126개 지자체 포함 정부기관들이 소득‧재산‧인적파악(24개 기관, 48종의 정보), 증명서 발급 참고 정보(48개 기관, 663종의 정보), 사례 관리와 중복 수급(5개 기관, 18종의 정보) 등 총 1,901종 데이터를 관리하고 있다. 숫자만 보면 현란하다. 그리고 체계적으로 관리되고 있는 것 같은 착각이 든다.
그러나 필자의 눈에는 산산조각으로 파편화되어있고 그 이면에는 싸일로(silo)라고 불리는 부처간 장벽과 이기주의 그리고 관행이 도사리고 있음을 본다. 우리 일상에서 개인이 필요한 본인의 데이터조차 중앙정부, 지자체를 막론하고 저마다의 홈페이지에서 몇 번의 승인과 클릭을 거쳐야 확인할 수 있다.
과학기술계는 더하다. 지난 9월 5일 대통령이 함께 한 바이오혁신 토론회에서도 개인정보법 등 중첩된 규제로 데이터 활용이 과대하게 제약받고 있다는 의견도 나왔다. 지난 문재인 정부의 2020년 7월 이른 바 ‘한국판 뉴딜’의 10대 과제 중 첫 번째로 데이터 댐 구축과 신속 개방을 천명할 정도로 데이터의 비효율적 활용의 극복이 거론되었다. 해외 역시 마찬가지다, 올해 6월 미국 의회는 과학기술 패권을 위한 초당파적 선언으로 미국과학가속화프로젝트 (American Science Acceleration Project, ASAP)을 발표했는데 5대 과제 중 첫 번째가 ‘데이터 사일로 해체’에 초점을 두고 있다.
행복순위 1위 핀란드의 데이터 주권
그렇다면 전 세계 모두 같은 고민을 안고 있는가 라는 의문이 생긴다. 남들도 그렇다면 우리도 그럴 수 있지 라며 체념도 가능하다. 그러나 세상은 넓고 알려진 사실들이 많다. UN의 행복순위 국가 8년 연속 1위를 차지하고 있는 유럽 노르딕의 핀란드만 살펴봐도 그렇다. 핀란드는 AI를 2018년부터 행정부에 적용할만큼 데이터 활용에 앞선 나라다. 정부민간 가릴 것 없이 데이터 100% 디지털화했고 통합했으며 공개했다.개인이 생산한 데이터는 누구라도 자신의 핸드폰으로 자신의 의료정보 등을 어떤 제약이나 허가없이 볼 수 있으며 일찌감치 명실상부한 ‘데이터 주권’을 누리고 있다.
2016. 12에 발표한 핀란드 정부의 디지털 9대 원칙 중 하나를 보면 국민에게 새로운 정보는 단 헌번만 요청한다고 한다. 심지어 노클릭(No-Click)으로 국민이 요구하지 않아도 필요한 데이터를 전달하고자 하는 고민까지 하고 있다. 그에 비해 대한민국은 어느 부처, 지자체 홈페이지를 가도 클릭, 클릭, 클릭이 반복된다. 수요자인 국민과는 동떨어진 철저한 공급자 위주로 ‘데이터 주권’과는 거리가 먼 대한민국이다.
다가오는 AI 시대에 국가경쟁력은 데이터에 달려 있다 해도 과언이 아니다. 미래 먹거리와 데이터가 관련된 사례 하나를 소개하자면, 의료 데이터와 유전자 정보를 활용한 고부가가치 바이오의료 시장이 있다. 로슈, 화이자 같은 대형제약사들이 글로벌 시장을 장악하기 위해 소리없는 전쟁을 벌이고 있는 현장이다.
유전자 정보 등 의료 데이터 상업화는 노르딕 소국 아이슬랜드의 디코드(deCode)라는 기업이 1996년 국민들 혈액을 수집하면서 시작했고, 이어서 영국이 2006년 최초의 정부차원에서 바이오뱅크(BioBank)라는 거대 프로젝트를 시작했다. 그리고 핀란드는 비교적 늦은 2017년 핀젠(FinnGen) 프로젝트로 이어졌다. 그런데 2019년 대형제약사들이 핀란드로 줄지어 몰려가는 사건이 발생했다. 이유는 간단했다. 핀란드가 의료 관련 유전자 정보 데이터를 통합하고 개방한 것이다.
핀란드 정부는 2019년 4월 '국민의료·사회보장 데이터 2차 활용법’을 통과시켜 국내에서 해외 민간기업도 연구목적으로 사용할 수 있도록 전면 공개했다. 발표가 난 직후 화이자, 노바티스 등 11개 세계 굴지의 제약사들이 앞다투어 핀란드로 몰려갔다. 핀란드 정부가 계획했던 800억원 프로젝트 예산 3분의 2를 그들이 내겠다고 자청했다. 핀란드 안에 연구소를 세우고 핀란드 청년들에게 고품질 일자리를 만들었다.
핀란드 중부 탐페라 대학에서는 1년 사이에 20개 의료 스타트업이 생겼다. 단 한 건의 제도혁신으로 글로벌 기업들 제 발로 찾아와 투자 및 최첨단 일자리 창출한 결과는 ‘통합’된 데이터를 기반이 있었기에 ‘공개’도 가능했다. 거대제약사들이 핀란드로 몰려가는 상황을 목격한 영국은 뒤늦은 2023년 11월에 유전자 정보 데이터를 공개했지만 이미 늦었다.
국민주권정부, 데이터 주권시대를 기대한다
그렇다면 한국은? ‘국가 바이오 빅데이터 구축 사업’이란 이름으로 2021년 시작했으나 우여곡절 끝에 2024년 공식적으로 재출발했다. 예산은 핀란드의 8배인 6,039억원이고 혈액모집은 국민의 2%인 백만명을 목표로 했다. 반면에 핀란드 혈액모집은 국민 10%에 가까운 50만으로 5년째인 2023년에 초과달성했다.
그러나 현재 한국 홈페이지에는 필수적인 혈액모집 숫자가 없다. 2021년 시작한 프로젝트에서 필자가 목격한 마지막 혈액 모집 숫자는 2023년 7월 1만5천명으로 목표의 1.5% 수준이었고 현재 재 출발한 홈페이지에는 기록 자체가 없다. 핀란드 걑은 해외 거대기업의 유치는? 물론 한 건도 없다.
좀 심하게 말한다면 모방하는 것도 제대로 못하는 대한민국 현실이다. 왜 이런 차이가 생겼났는가. 답은 간단하다. 핀란드는 모든 데이터를 ‘통합’과 ‘공개’를 원칙으로 하고, 한국은 앞서 말했듯 126개 기관 1,901종 데이터로 상징되는 ‘파편화’되어 있고, 철벽같은 관료주의 ‘사일로’에 갇혀있는, 국민의 데이터 주권이 극소수 손에 좌우되게끔 이중삼중으로 겹쳐져 있는 과도한 규제 때문이다.
나는 소망한다. ‘국민주권정부’에서 국민 개인이 생산하는 데이터가 일부부처 또는 사적 이익집단의 소유물이 아니길 소망한다. 데이터가 주권자의 권리에서 소외되지 않아 ‘통합’되고 ‘공개’되어 핀란드처럼 글로벌 대기업들이 줄을 이어 연구소와 기업을 세우고 청년들 일자리를 만들 수 있는 나라가 되길 소망한다.
AI 시대에 데이터가 효과적으로 통합되고, 신뢰도 높게 관리되고, 정의롭게 공개되어 글로벌을 선도하는 대한민국이 되길 진심으로 소망한다.
