새소식
제품 서비스 새소식 채용 회사소개 블로그 문의하기인공지능 두 번째 전문가 좌담은 ‘인공지능 시대, 어떻게 활용할 것인가’라는 주제로 진행되었다. 산업 분야 전문가들이 생각하는 AI의 본질부터 데이터 수집과 활용 방법, 일자리 대체 전망, AI 인력 수요까지 다양한 이야기를 다루었다. 특히, 많은 사람들이 궁금해 하는 일자리 문제와 관련해선 이전의 신기술과 마찬가지로 새로운 직업이 창출될 것으로 보는 예상과 기존의 경로와는 다를 것이라는 우려가 공존했다. 아울러 AI를 논할 때 빠지지 않는 데이터의 중요성과 규제 이슈에 대한 현장 관계자들의 허심탄회한 생각도 들어봤다. 클라우드 규제 완화를 비롯해 기술 오픈에 대한 가치를 인정해주는 사회적 분위기 조성의 중요성과 AI 협업문화를 저해하는 연구소·학교의 제도적 요인 개선에 힘써야 한다는 쓴소리도 마다하지 않았다.
생생한 현장의 목소리를 담은 산업계 전문가 좌담, 궁금하다면 지금 바로 클릭 click!
▶ 일시: 2020년 11월 2일 16:00~17:30
▶ 장소: 컨퍼런스하우스 달개비(서울시)
▶ 참석자(가나다순)
김동민 제이엘케이 대표
서중해 KDI 경제정보센터 소장(좌장)
유용균 한국원자력연구원 미래전략본부 지능형컴퓨팅연구실장
이재훈 딥서치 VP of Product Development
주철휘 엔쓰리엔클라우드 인공지능연구소장
#1. 인공지능의 본질: 기계가 생각할 수 있는가?
· 서중해: 오늘은 ‘인공지능 시대, 어떻게 활용할 것인가’를 주제로 산업계의 의견을 듣고자 자리를 마련하였습니다. 현장에서 AI를 활용해 경제적인 성과와 가치를 창출하시는 네 분을 모셨습니다. 본격적으로 시작하기에 앞서 먼저 AI에 대한 근본적인 질문을 드리고 싶습니다. 튜링 머신을 구상한 수학자이자 컴퓨터 과학자 앨런 튜링(Alan Turing)이 1950년에 발표한 논문「계산 기계와 지성(Computing Machinery and Intelligence)」에서는 ‘기계가 생각할 수 있는가?(Can Machines Think?)’라는 질문을 제기합니다. 관련 자료들을 살펴보니 극단적으로 의견이 대립하더군요. 이와 관련해 현업에서 AI를 활용하는 네 분의 생각은 어떤지 자유롭게 말씀해 주셨으면 좋겠습니다.
· 김동민: ‘생각’에 대한 개념 확립이 선행되어야 할 것 같습니다. 만약 생각을 새로운 것을 만들어 낼 수 있는 능력이라고 정의한다면 현재 AI는 충분히 그러한 방향으로 나아가고 있다고 봅니다. 코로나19 확산 이후로 AI가 데이터 조합으로 신약을 개발할 수 있는가를 상당히 많이 연구했습니다. 이를 통해 느낀 점은 사람이 학습이나 기억을 기반으로 새로운 것을 생각해 내는 것처럼 AI도 데이터를 활용해 새로운 물질을 만들어 낸다는 것입니다. 당연히 검증 절차는 필요합니다. 하지만 우리는 유독 기계에만 엄격한 잣대를 가지고 평가하는 경향이 있습니다. 사람의 아이디어도 검증을 거쳐야만 실현되는데 AI가 판단을 잘못하거나 예측이 빗나가면 사회적으로 파장이 커요. 무한정 생산되는 데이터를 조합하여 새로운 것을 만들어 내는 작업은 머신러닝이 인간보다 훨씬 빠릅니다. 이 점을 인간 대신 생각하는 기능 내지는 영역으로 볼 수 있지 않을까요. 기계의 원리적인 부분에 대해서 이해를 충분히 거친다면 지금보다 더욱 잘 활용할 수 있을 것입니다.
· 주철휘: AI가 인간 수준의 감정과 상식을 기반으로 의사결정을 하는 단계는 현재로서는 어렵다고 생각합니다. 미래학자 레이 커즈와일(Ray Kurzweil)은 2045년에 특이점(singularity)이 올 것으로 예측했어요. 예를 들면, 기계가 인간처럼 나무의 밑동을 보고 어떻게 걸터앉을지를 즉흥적으로 생각할 수 있는 수준을 말하는데 이에 도달하려면 데이터 없이도 추론이 가능해야 합니다. 그런데 현재는 적합한 데이터가 주어져야만 양질의 예측이 가능한 수준이지요. 최근 AI 언어처리 알고리즘인 ‘GPT-3(Generative Pre-trained Transformer 3)’가 많이 회자되는 이유도 딥러닝 3대 석학 중 한 명인 얀 르쿤(Yann LeCun)이 회의적인 입장을 표명했기 때문입니다. 얀 르쿤에 따르면, 언어 모델을 확장해 지능적인 기계를 만들려는 것은 프로펠러 비행기로 달에 가려는 것과 같다고 합니다. 프로펠러 비행기로 고도비행 기록을 깰 수는 있지만, 달에 가기 위해선 완전히 다른 접근법이 필요합니다. GPT-3모델이 5,000억 개의 단어(token)를 학습했다고는 하지만 아직까지는 한계가 있는 것입니다.
※ 자세히 들여다보기 1 |
· 유용균: 역사를 보면 AI의 정의 자체도 계속해서 변화해 왔습니다. 초창기 과학자들은 AI를 ‘인간처럼 생각하는 기계’로 여기고 인간과 같은 수준의 기계를 구현한다는 일념 하나로 연구에 매진했는데 생각보다 성과가 나오지 않았습니다. 그러자 ‘합리적으로 생각하는 기계’로 단계를 낮추었고, 현실적으로 목표를 수정하여 ‘합리적으로 행동하는 기계’로 정의한 것입니다. 그렇기 때문에 현재 학문적으로 보는 AI와 외부에서 생각하는 AI에 간극이 있는 셈입니다. 마틴 포드(Martin Ford)의 「AI 마인드-세계적인 AI 개발자들이 알려주는 진실」에 의하면 AI 학자들은 인간과 같은 지능을 구현하는 시기를 2100년으로 예견했습니다. 일반 사람들이 생각하는 인간과 같은 AI는 아직까지 요원한 것입니다.
※ 자세히 들여다보기 1 - AI 알고리즘이 일관적인 문장을 형성하는 능력과 실제 유용성 간에는 큰 차이가 존재함을 시사※ 자세히 들여다보기 2
출처: Stuart Russell & Peter Norvig(2009), p.2 |
· 서중해: AI 기술에 대한 산업계의 생각과 입장은 학계와는 다소 상이할 것으로 생각됩니다. 현재 진행하고 있는 사업을 말씀해 주시고 이와 함께 AI 적용 분야에 대한 소개를 곁들여 주시면 좋을 것 같습니다.
#2. 인공지능 기술과 활동 영역: 국내 AI 적용 사례
· 서중해: AI 기술에 대한 산업계의 생각과 입장은 학계와는 다소 상이할 것으로 생각됩니다. 현재 진행하고 있는 사업을 말씀해 주시고 이와 함께 AI 적용 분야에 대한 소개를 곁들여 주시면 좋을 것 같습니다.
· 주철휘: 엔쓰리엔클라우드(N3NCLOUD)는 멀티클라우드와 자동 머신러닝 플랫폼을 개발하는 기업입니다. 개념을 짚고 넘어가자면 멀티클라우드는 2개 이상의 프라이빗(private) 또는 퍼블릭(public) 클라우드 서비스를 단일 환경처럼 관리할 수 있는 기술을 의미합니다. 자동 머신러닝이란 AutoML(Automated Machine Learning)이라고 하며, 데이터 수집과 정제, 모델 구축과 훈련 및 평가, 서비스 제공까지의 단계별(end-to-end) 파이프라인을 자동화하는 것을 말합니다. 기업의 입장에서 모델을 만드는 궁극적인 목적은 제품과 서비스를 창출하기 위함입니다. 현재 대부분이 모델 개발 쪽에 많은 노력들을 기울이고 있습니다. 하지만 시간이 지나면 결국 소비자에게 전달되는 과정에서 빅데이터 저장·관리 성능이 중요해질 것입니다. 실제로 사진을 보고 고양이라고 판별하는 그 자체를 모델이라고 했을 때, 모델과 훈련에 소요되는 시간은 각각 5%~10%, 20%이고, 나머지 대부분의 시간은 데이터의 수집과 정제, 성능평가에 소요됩니다. 최근 ‘프로젝트는 많으나 프로덕트는 없다.’는 말이 회자되곤 합니다. 즉, 많은 기업이 AI에 뛰어들고 있지만 실질적으로 상품이나 서비스를 제공하고 수익을 창출하는 확실한 비즈니스 모델이 아직까지는 나오지 않고 있는 상황입니다.
<표> 공유 범위와 서비스 운용형태에 따른 클라우드 분류
출처: ETRI(2019) 재구성 |
※ 자세히 들여다보기 3 |
· 김동민: 지난 2019년 12월 의료 AI 업체로서는 처음으로 코스닥 기술특례 상장에 성공했습니다. 데이터, 알고리즘, 제품화 부분에서 차별화된 성과를 거둔 덕분이라고 생각합니다. 사실 저희는 알파고가 등장하기 전인 2015년부터 의료 AI를 시작했습니다. 데이터에 대한 인식이 전반적으로 낮은 시기여서 어려움이 있을 것이라 생각했지만 운이 좋게도 한국에서 해답을 찾을 수 있었습니다. 한국이 PACS(병원 내 영상을 모아두는 시스템) 보급률 97%로 전 세계에서 1위였던 만큼 전산화가 잘 되어 있었기 때문입니다. 병원 내부에 상당히 많은 영상데이터가 존재했고, EMR(전자의무기록) 등 의료 분야의 IT 인프라가 잘 마련돼 있어서 데이터 자체가 풍부했습니다. 이렇듯 기술적인 측면에서 의료적 지식을 녹일 수 있는 환경이 충분히 구축되어 있었기 때문에 2016년 국내 처음으로 의료기기 3등급 허가를 위한 여러 임상실험을 진행할 수 있었습니다. 특히, 뇌경색에 대한 연구를 진행할 때는 ‘한국인 뇌MR영상 데이터센터’에서 10년 동안 수집한 14,000명 환자의 140만 장 MR 영상 데이터를 활용했습니다. 각 장마다 주석(annotation)이 달린 고품질의 데이터를 기반으로 전 세계적으로 선도해서 제품을 출시할 수 있었습니다.
· 서중해: 사업 아이디어를 어디에서 착안한 것인지 궁금합니다.
· 김동민: 2014년 즈음 제가 일본에 있었을 때 한 전시회에서 충격을 받은 적이 있습니다. 사실 일본에서는 2012년부터 영상에 있어선 딥러닝 툴로 어느 정도 성과를 낼 수 있다는 게 점차 기정사실화되어 가던 중이었습니다. 때마침 그 전시회에서도 로봇이 박스 안에 담겨있는 나사들을 하나씩 집어 세우는 과정을 시연하더군요. 처음에는 실패했지만 학습을 통해 점점 성공해 나가는 것을 현장에서 목격하고 머신러닝에 대한 인식이 많이 바뀌었습니다. 그 후부터 머신러닝과 딥러닝 관련 툴들을 찾아보다가 의료 사이언스 분야의 여러 MR 영상에서 데이터를 얻게 되면서 본격적으로 사업을 시작하게 되었습니다.
· 서중해: 사실 AI 그 자체도 중요하지만 AI가 여러 산업으로 파급돼서 활용성과 효율성이 높아지면 국민경제 전체로 큰 영향을 미치게 됩니다. 그래서 경제학자들은 AI가 일반목적기술(GPT)인지 여부를 판단하곤 하는데, GPT의 잠재력을 실현할 수 있는 정책이 앞으로의 과제입니다. 한국원자력연구원은 원자력 기술 개발과 시설 운영 등 국가적으로 중요한 업무를 수행하고 있습니다. 또한 유용균 실장께서는 ‘AI프렌즈’라는 커뮤니티 활동도 한다고 들었습니다. 원자력연구원에서는 AI를 어떻게 활용하는지 그리고 운영진으로 참여하고 있는 AI프렌즈 커뮤니티는 어떤 곳인지 말씀해 주시면 좋겠습니다.
· 유용균: 한국원자력연구원의 지능형컴퓨팅연구실은 연구소의 데이터 분석을 전담하는 조직으로 올해 창설되었습니다. 주로 원자로의 안전 진단 및 시뮬레이션 가속화를 위한 AI 연구를 수행하고 있는데요. 기계의 이상 여부를 점검하기 위해서 과거에는 사람이 직접 신호파형을 보고 분석했다면 현재는 AI를 활용해 정확성을 높이고 인적 오류를 낮추는 것이 가능해졌습니다. 뿐만 아니라 원자력 발전소의 핵반응, 에너지 형성 등 복잡한 물리현상에 대한 시뮬레이션을 가속화하는데도 AI가 큰 기여를 하고 있습니다.
다음으로 AI프렌즈는 AI 적용에 관심 있는 출연연구소, 기업, 개인으로 구성된 커뮤니티입니다. AI 분야가 빠르게 발전하는 원동력은 높은 개방성과 공유 문화라고 생각합니다. 이러한 문화를 연구소에 도입하여 부서/연구소 사이 소통 장벽을 허물어 보자는 것이 초기 취지였습니다. AI프렌즈는 AI 이론 자체를 깊게 연구하는 것 보다는 AI를 어떻게 하면 잘 응용할 수 있는지에 관심이 많습니다.
AI가 GPT라는 점에는 100% 동의하는 입장입니다. 어떤 공학적 문제를 풀기 위해서 모든 수단을 동원하는 것처럼 그러한 도구 중의 하나로 AI를 활용할 수 있다고 생각합니다.
#3. 이슈점검①: AI와 데이터
· 서중해: 올해 KDI에서 관심을 가지고 있는 분야 중 하나는 항상 AI와 함께 논의되곤 하는‘데이터’입니다. 김동민 대표께서는 출발선상에서 좋은 데이터를 얻을 수 있었기에 훨씬 더 이점이 있었다고 이해가 됩니다. 그런데 데이터를 구할 수 없거나 데이터는 있는데 활용을 하지 못하는 경우가 상당수 존재하는 것도 사실입니다. 데이터를 어떻게 수집하고 AI에 접목할지 그리고 궁극적으로 비즈니스 가치를 어떻게 창출할지 등을 짚어주면 좋겠습니다.
· 주철휘: 제가 이전에 보건복지부 산하 AI 신약개발지원센터의 부센터장을 맡으면서 겪은 바는 김 대표와 조금 다릅니다. 제약 쪽은 디지털화된 데이터를 수집하는 데 다소 어려움이 있었습니다. 여기에서 말하는 데이터란 장부에 수기로 작성하는 것이 아니라 컴퓨터에 입력 가능한 디지털 형태의 고품질 데이터를 의미합니다. 제이엘케이의 경우, 병원이라는 우리나라 특수상황 덕분에 좋은 성과를 거두었던 것 같습니다. 그러나 일반적으로는 인프라를 구축하고 난 이후에 데이터 문제와 맞닥뜨리는 경우를 많이 보게 됩니다. AI를 기업이나 산업에 적용하려면 AI를 활용했을 때 효과가 있는 분야와 없는 분야를 구분하는 것이 먼저입니다. 그런데 현재는 AI 기술이 급부상하니까 모든 부분에 적용하려는 경향이 있는 것 같습니다. 쉽게 특징을 추출할 수 있는 작업은 굳이 AI를 활용할 필요가 없습니다.
· 서중해: 그렇다면 AI를 적용해 효과를 거두려면 어떤 노력들이 필요할까요?
· 주철휘: 제가 IBM에서 왓슨(Watson; 자연어 형식으로 된 질문들에 답할 수 있는 AI 컴퓨터 시스템으로 최근에는 의료 영역으로 확장해 의료 이미지 분석 등에 사용) 프로젝트를 수행하면서 느낀 것은 AI는 인터넷이나 모바일과 달리 데이터에 기반한 전환(data-driven transformation)을 가져온다는 점입니다. 즉, 데이터가 산업의 근간이 되어야 합니다. 어떤 데이터가 나한테 주어질 수 있고, 어떤 데이터를 먼저 확보해야 하는가에 대한 생각이 선행되어야 합니다. 정부 또는 일부 기업에서 무작정 달려들었다가 데이터를 준비하는 데 시간을 소비하는 경우를 많이 봤습니다. 앞으로는 데이터를 기반으로 AI를 훈련시키고, 결과에서 나오는 통찰력으로 산업 경쟁력을 제고해야 합니다. 이러한 접근 방식을 취하고 안목을 키우는 것이 무엇보다 중요합니다.
· 서중해: 안목을 얻으려면 결국 경험이 축적되는 과정이 필요하다는 말씀 같습니다. 제이엘케이의 경우, 이전과 반대로 지금은 데이터와 관련해 어려운 점이 없는 것인가요?
· 김동민: 물론 초기에 어느 정도 성과는 이뤘지만 본격적으로 사업화를 시작하면서 첫 번째로 부딪힌 것은 서비스였습니다. 현장에서 필요로 하는 것과 저희가 구현해야 되는 기술의 차이를 많이 느꼈습니다. 주요 고객층인 의사, 교수 등 의료계에서 요구하는 기술 수준이 높아졌기 때문인데요. 예를 들어 순간적인 뇌 분석을 통해 현재 상태를 진단하는 기술에서 한발 더 나아가 3~5년 후 경과에 대한 예측을 바라기 시작했습니다. 이에 부응하는 AI를 개발하려면 전향적으로 수집되는 데이터나 심지어 과거 데이터와 융·복합된 데이터가 필요합니다. 환자가 과거 어떤 질병을 앓았는지부터 시작해 의료 영상을 찍고 3~5년 뒤 경과는 어떠한지를 종합적으로 융합해야 되는 거죠. 데이터 구성 자체의 차원이 지금과는 완전히 달라집니다. 그리고 이를 분석하기 위한 다른 차원의 알고리즘 구현이 필요합니다.
"주 고객층이 원하는 기술 수준 높아져, 지금과는 다른 차원의 데이터와 알고리즘 필요"