1. 1
AI 에 대한 7 가지 오해와 진실
소프트라인 R&D 센터 이호성
최근의 AI는 과거 하둡을 연상시킬 정도로 압도적 관심을 받고 있다. 수 년 간 ‘빅데이터 =
하둡’ 이라는 잘못된 인식이 유지된 것처럼 AI도 마치 뭔가 새로운 소프트웨어를 구매하고
신규 시스템을 구축하면 활용할 수 있는 만능 통치약처럼 이해되고 있다. 이런 오해에서
벗어나야 ‘남이 하니 나도 한다’ 의 주박에서 벗어나 진정한 data-driven organization 으로 나아갈
수 있다.
참고문서
• Robin Bordoli : The 7 Myths ofAI
http://www.datasciencecentral.com/profiles/blogs/the-7-myths-of-ai-by-robin-bordoli
AI 를 접하는 임원들의 자세
• 요즘 기업 임원들은 주요 미디어에서 다루는 AI에 대한 수많은 기사들을 보면서 크게 두
가지 의문점을 가지고 있다.
• 의문 1. AI와 관련한 사업기회는 실재하는가?
답변 : 실재한다. 오늘날의 기업들은 과거 인간의 지능을 필요로 했던 업무를 자동화하기
위해 AI를 활용하고 있다. 자동화를 통해 해당 업무의 볼륨을 100 배 이상 늘리고, 비용은
1/10 으로 줄이는 사례도 있다.
• 의문 2. AI를 어떻게 비즈니스에 적용하는가?
답변 : 간단한 답변은 어렵다. 이를 위해서는 먼저 AI에 대한 환상과 오해를 해소해야 한다.
실체를 먼저 파악한 이후에나 비즈니스 프로세스에 AI를 효과적으로 적용할 수 있는
프레임워크를 마련할 수 있을 것이다.
오해 1. AI 는 마법이다
2. 2
• 대부분의 주류 언론들은 AI를 마치 마법이나 신화처럼 묘사하고 있으며, 구글, 페이스북,
애플, 아마존, 마이크로소프트 같은 AI 선구업체들을 대마법사처럼 칭송하고 있음.
• 이러한 묘사는 전혀 도움이 되지 않음.
• 기업들이 AI를 도입하려면, 기업의 임원들이 AI를 이해해야 함.
• AI는 마법이 아니라 데이터, 수학, 패턴, 반복의 결과물이라는 점을 분명히 알아야 함.
• AI에 대한 이해를 위해 다음의 3 가지 핵심 개념에 대해 이해할 필요가 있음.
• 훈련용 데이터 (Training Data : TD) : 훈련용 데이터는 머신이 학습을 위해 활용하는 최초
데이터 집합. 훈련용 데이터는 입력값과 사전에 답변된 결과값으로 구성되어 있으며,
머신러닝 모델은 주어진 데이터 셋 속에서 일반화된 패턴을 찾아 결과값을 예측함. 예를
들어, 입력값은 고객과 고객지원 담당자 사이에 주고받은 이메일이 첨부된 지원요청
티켓이 되고, 결과값은 회사의 내부 분류 정의에 따라 지원요청 티켓에 1 부터 5 까지
할당하는 값이 될 수 있음.
• 머신러닝 (Machine Learning : ML) : 머신러닝은 훈련 데이터로부터 패턴을 학습하는
소프트웨어로서 이 패턴을 새로운 입력값에 적용하여 결과값을 예측할 수 있음. 예를 들어,
고객과 고객지원 담당자 사이에 주고받은 이메일이 첨부된 지원요청 티켓이 접수되었을
때 머신러닝 모델은 이 티켓의 분류값을 예측하고 예측값의 정확도를 반환함. 머신러닝의
핵심적인 기능은 정해진 규칙을 적용하지 않고 학습한다는 것. 따라서, 새로운 데이터가
들어오면 규칙을 조정하게 됨.
• 사람의 개입 (Human-in-the-loop : HITL) : 사람의 개입은 AI의 세 번째 핵심 요소. 머신러닝
모델은 완벽하지 않음. 훌륭한 머신러닝 모델도 기껏해야 70%의 정확도. 따라서, 사람이
개입된 워크 플로우가 필요하며 모델의 정확도가 떨어질 때는 사람이 개입하여 정확도를
향상시키거나 예측값을 보정할 필요가 있음.
• AI는 마법이 아니라 위 세가지 핵심 요소의 결합. (AI = TD + ML + HITL)
오해 2. AI 는 엘리트기업들의 전유물이다.
• 언론에서는 마치 AI가 아마존, 애플, 페이스북, 구글, IBM, 마이크로소프트, 세일즈포스,
테슬라, 우버 등 머신러닝 전문가 조직을 보유한 수백억원 이상의 투자가 가능한 엘리트
테크 업체들만의 고유 영역인 것처럼 암시하고 있으나, 이것은 전혀 사실이 아님.
• 오늘날 기존 비즈니스 프로세스에 AI를 적용하는 것은 1 억원 이하의 비용으로도 가능하다.
3. 3
• AI는 거대 엘리트 기업들의 전유물이 아니다. 그 문은 모두에게 열려있다.
오해 3. AI 로는 어마어마한 규모의새로운것을 해야한다.
• 주요 언론에서 다루는 AI 관련 기사들은 자동주행차, 자율형 드론 배달 등 미래지향적인
화려한 이야기들을 다룸.
• 구글, 테슬라 우버 등은 자율주행 자동차 시장을 선점하기 위해 공격적인 투자를 감행.
• 이런 이야기들을 보고 들으면서 마치 AI는 엄청난 투자가 필요한 완전히 새로운 무언가를
하는 것이라는 인식을 가질 수 있음. 이는 잘못된 인식.
• AI를 활용해 훨씬 적은 비용으로 기존 비즈니스에 직접적인 도움을 줄 수 있는 현실적인
아이템들도 많음. (고객과 주고받은 이메일 및 SNS 데이터 등의 비정형 데이터 분석으로
고객감성 분석 등)
• 고비용의 ‘화려한’ 엄청난 프로젝트를 할 수도 있지만, 저비용의 ‘지루한’ 프로젝트로도
충분히 그 가치를 발휘할 수 있음.
오해 4. 데이터보다 알고리즘이중요하다.
• 다양한 매체에서 AI라는 주제를 다룰 때 주로 머신러닝 알고리즘에 초점을 맞추어 마치
알고리즘이 가장 중요한 요소인 것처럼 보일 수 있음.
4. 4
• 마치 이 알고리즘들이 인간의 두뇌와 같은 것처럼 묘사하고 있으며, 알고리즘이 모든
마술을 부려 궁극적으로 인간의 두뇌를 뛰어넘을 것처럼 이야기하고 있음. (알파고가 커제,
이세돌을 격파!)
• 이런 자극적인 주제만 접하다 보니 “딥 러닝” 이라는 단어가 AI의 총아인 것처럼 주목을
받고, AI가 마치 인간의 두뇌를 만드는 능가하는 거대 시스템을 만드는 것으로 오해.
• 그래서 많은 기업들이 머신러닝 전문가들을 고용하면서, 이들이 완벽한 알고리즘을
만들어 내기를 기대하고 있음.
• 그러나, 모든 AI 기술은 고품질, 대용량 데이터에 기반해야 한다는 사실은 자주 잊혀지고
있음.
• 알고리즘에만 집중하고 알고리즘이 학습할 기반이 되는 데이터에 신경을 쓰지 않는다면,
AI에 대한 기대치와 결과물에는 큰 차이가 있을 수밖에 없음.
• 알고리즘을 훈련시킬 데이터의 확보 및 구축에 대한 어떤 계획이나 예산없이 상용
머신러닝 서비스 (MS, 아마존, 구글, IBM 등) 에 먼저 투자하는 것은, 주유소에 갈 수 없는
상황에서 자동차를 구매하는 것과 마찬가지임.
• 알고리즘을 훈련시킬 데이터의 품질과 양은 알고리즘 만큼이나 중요한 요소라는 점을
명심해야 함.
오해 5. 인간보다기계가뛰어나다.
• 지난 30 년동안 다양한 매체에서 인간을 능가한 기계 (machine) 에 대한 이야기를 다루었음
• 이러한 이야기들을 통해 마치 기계가 모든 면에서 인간을 뛰어넘을 것이고, 그것이 지금
현실로 벌어지고 있다는 오해를 갖게 하였음. 이는 현재 벌어지고 있는 상황과 전혀 다름.
• 알파고가 이세돌을 이겼다고 해서 ‘기계가 인간을 이겼다’ 고 말할 수 없음. 정확한 표현은
‘기계와 많은 인간들이손잡고 이세돌 한 명을 이겼다’ 임. 즉, 기계만의 역량으로 인간을
5. 5
이긴 것이 아니라, 기계와 인간이 서로의 부족한 부분을 보완하여 거둔 승리라는 뜻.
• 위 그림은 기계가 잘하는 일과 인간이 잘하는 일을 나누어 보여주고 있음.
• 기계는 정형 데이터에 대한 연산에 엄청나게 뛰어남. (좌측 그림처럼 Eigen 벡터를
탐색하라)
• 인간은 주어진 데이터의 의미와 문맥을 이해하는 데에 뛰어남. (우측 그림 중에서 호피무늬
드레스를 찾아라)
• 따라서, AI 는 기계와 인간이 서로의 약점을 보완하여, 과거에는 인간만이 할 수 있었던 일을
기계와 인간이 함께 훨씬 효율적으로 수행할 수 있도록 해줌.
오해 6. AI 로 인해 기계가 인간을 대체할것이다.
• 주요 미디어들은 기계가 인간을 점령하는 디스토피아적 미래를 그리는 컨텐츠를 자주
보여주고 있음. 오랜 시간이 지난 후에는 사실일 수도 있으나, 가까운 미래에는 벌어질 수
없는 일.
• 또한, 이는 기계와 인간의 협업을 저해하고 있음.
6. 6
• 현재의 AI는 기계와 인간이 협업을 계속함에 따라 장기적으로 업무의 효율성만이 아니라
업무 범위 자체를 넓힐 수 있음.
• 예를 들어, 접수한 고객 불만 사항을 자동분류하는 머신러닝 모델을 도입한다고 가정
(대부분의 기업은 100% 사람의 손으로 분류하고 있음). 이 모델이 하루에 1 만건의
불만사항을 70%의 정확도로 분류해 낼 수 있다면 나머지 30%는 사람이 참여해야 함
(Human-in-the-loop).
• 사람이 입력한 30%의 분류 결과값이 다시 모델에 입력값으로 제공되면, 모델의 정확도가
다시 올라가게 됨.
• 이 과정을 반복적으로 수행하면 모델의 정확도는 계속 향상되며, 하루 1 만건이 아니라
2,3 만건을 처리할 수 있게됨. 그리고, 과거에 이러한 단순 분류를 하던 사람들은 보다
부가가치가 높은 업무에 집중하도록 할 수 있음.
• 위 그림의 녹색 영역은 인간이 수행하는 범위 (머신러닝 모델의 정확도가 낮은 업무), 파란
영역은 기계가 수행하는 범위 (머신러닝 모델의 정확도가 높은 업무).
7. 7
• 모델의 정확도가 점차 높아져서 기계가 수행하는 업무양이 늘어나고, 정확도가 높은
업무는 기계에게 대부분 맡기고, 인간은 모델이 처리하지 못하는 업무에 집중함으로써
인간과 기계가 협업하여 처리 업무양이 전체적으로 늘어나는 모습을 보여줌.
• 결국 인간과 기계가 AI 를 통해 협업하여 업무 효율성을 향상시키는 것이지, 기계가 인간을
밀어내는 상황이 아님.
오해 7. AI = 머신러닝
• AI와 머신러닝 (알고리즘) 의 개념을 혼동하는 데에서 발생하는 오해.
• 그만큼 AI에 대한 전반적인 이해도가 많이 떨어진다는 것을 방증하고 있음.
• 이 오해가 상용 머신러닝 서비스에 투자만 하면 자동적으로 마법처럼 AI 기반
어플리케이션을 활용할 수 있을 것이라는 환상으로 이어지고 있음.
• 머신러닝은 AI의 하위개념이며 AI 어플리케이션을 구성하는 하나의 요소.
• 전술한 바와 같이 데이터 없는 머신러닝은 기름없는 자동차. 어디도 갈 수 없는 비싼 금속
덩어리.
• 인간의 관여없는 머신러닝은 맞지않는 총. 인간의 개입이 있어야 비즈니스에 활용할
정도의 정확도를 보장할 수 있으며, 인간의 개입을 통해서만 정확도를 향상시킬 수 있음.
AI 의 7 가지 진실
• 진실 1. AI = TD (Training Data) + ML (Machine Learning) + HITL (Human-in-the-loop)
• 진실 2. 모든 기업은 AI를 활용할 수 있다.
• 진실 3. 화려한 프로젝트가 아닌 단순한 기존 비즈니스 문제를 해결하기 위해 AI를 활용할
수 있다.
• 진실 4. 머신러닝 알고리즘과 데이터의 양/질은 둘 다 똑같이 중요하다.
• 진실 5. 기계와 인간은 상호 보완적인 존재다.
• 진실 6. AI는 인간의 능력을 증강해 준다.
• 진실 7. AI = TD (Training Data) + ML (Machine Learning) + HITL (Human-in-the-loop)