비즈니스 세계로! 인공지능 기술 동향


김말희  ||  한국전자통신연구원 책임연구원
허태욱  ||  한국전자통신연구원 책임연구원
이일우  ||  한국전자통신연구원 책임연구원
비즈니스 세계는 맑고 잔잔한 호수가 아니다. 끊임없이 변하는 고객의 요구와 사회변화, 산업구조변화, 규제변화 등을 반영해야 한다. COVID-19는 사람들의 생활양식 및 산업구조를 크게 변화시키고 있으며, 인공지능 기술도 예외 없이 변화하는 환경의 영향을 받고 산업을 변화시키고 있다. 컴퓨터 비전, 자연어처리 등의 주요 분야에서 눈부신 발전을 지속해 왔고, 그 수혜를 입은 비즈니스 사례도 속속 등장하고 있다. 하지만 기술적ㆍ윤리적으로 아직도 시장의 충분한 신뢰를 얻지 못한 것 또한 사실이다. 인공지능 기술의 산업 및 사회 저변화를 위해서는 동적이고 변화가 많은 비즈니스 기술 환경에 대한 고려와 윤리적 책임성을 묻는 고객에 대한 배려가 동시에 요구된다. 본 고에서는 대표적인 ICT 시장조사 및 기술 컨설팅 회사인 가트너와 IDC의 데이터 및 분석기술 관련한 보고서들을 중심으로 최근의 인공지능 기술 동향에 대해 살펴보고자 한다.


*   본 내용은 김말희 책임연구원(☎ 042-860-1590, mariekim@etri.re.kr)에게 문의하시기 바랍니다.

**   본 내용은 필자의 주관적인 의견이며 IITP의 공식적인 입장이 아님을 밝힙니다.

***   본 연구는 산업통상자원부(MOTIE)와 한국에너지기술평가원(KETEP)의 지원을 받아 수행한 연구 과제입니다. (No. 20202020900290)


I. 인공지능 기술 수준

 컴퓨터 비전(Computer Vision), 자연어처리(Natural Language Processing) 기술은 인공지능 분야에서 가장 많이 진보되고 또한 많이 활용되고 있는 기술 분야이다. 컴퓨터 비전은 딥러닝 기술 진보에 있어서 가장 공헌이 큰 분야라고 봐도 무방하다. 컴퓨터 비전은 인간의 눈과 뇌가 담당하는 시각 인지 기능을 컴퓨터를 이용해서 시뮬레이션하는 기술 분야이다. 디지털 이미지, 비디오와 같은 시각적 데이터를 입력으로 받아서 객체 인식, 객체 위치 트래킹, 새로운 데이터 생성 등의 결과를 제공한다. CCTV를 분석해서 특정인의 동선과 현재 위치를 파악하는 기술은 영화에서 많이 인용되고 있고, 실제 현장에서도 활용되고 있다. 최근 GAN(Generative Adversarial Network) 기반 생성 모델(Generative Model)의 출현은 컴퓨터 비전의 새로운 장을 열었다. 주어진 입력 정보에 기반하여 의도하는 시각적 데이터를 생성할 수 있다. DeepDream, DeepFake와 같은 기술들은 스틸 이미지 혹은 비디오 이미지를 생성하는 기술이다. DeepFake를 이용한 합성 이미지 및 비디오 데이터 유통은 사회적으로 그리고 법적으로 큰 문제가 되고 있다. 최근 국내에서는 텍스트 정보를 넣어주면 동영상을 생성해주는 기술(Designs.ai, GliaStudio, waynehills 등)들이 제품으로 출시되어 유튜브와 같은 미디어 플랫폼 확산에 큰 역할을 하고 있다. 이러한 컴퓨터 비전 기술의 진보는 GPU(Graphical Processing Unit)와 같은 효율 높은 연산처리자의 등장뿐 아니라, ImageNet, CityScapes, Fashion MNIST, Kinetics-700과 같은 잘 구성된 데이터셋이 제공되었고, 인터넷에서 필요한 데이터를 손쉽게 확보할 수 있었던 이유가 크다. 컴퓨터 비전 기술인 이미지 분류, 객체 검출 및 트래킹, 내용 기반 이미지 검색 등의 기능 모듈들은 IBM, Google, Amazon, Microsoft 등 플랫폼 사업자들에 의해서 손쉽게 활용할 수 있도록 제공되고 있다.
 자연어처리 기술은 인간의 대화 수준과 거의 동일한 방식으로 텍스트 또는 음성 데이터를 이해하고 응답하는 기술이다. 자연어처리 기술에는 음성to텍스트, 텍스트to음성, 광학 문자 인식, 요약, 번역, 질의응답(Question and Answering: QA), 문서to텍스트 등 다양한 분야가 있다. 기술의 성숙도도 꽤 높은 편이어서 이미 많은 기업에서 자연어처리 기술을 비즈니스에 활용하고 있다. 은행 및 금융 서비스, 보험, 의료, 제조, 공공 부문 등과 같은 산업에서 수익성과 운영 효율성을 높이기 위해서 자연어처리 기술을 사용한다. 자연어처리 기술 경쟁은 GPT-3(Generative Pretrained Transformer) 및 대형 언어 모델들을 통해서 가속화하고 있다. BERT, RoBERTa, ALBERT, XLNet, StructBERT, T5 및 OpenAI의 GPT-2 및 GPT-3는 가장 일반적으로 사용되는 사전 훈련된 자연어처리 모델들이다[1]. BBC는 자사가 제공하는 프로그램 및 콘텐츠에 대해 시청자와 청취자의 요청에 맞춤형으로 응답하는 음성비서 서비스를 제공 중이며, Microsoft Azure가 제공하는 자연어처리 기술을 활용한다. 매스미디어 회사인 Hearst Newspapers에서는 콘텐츠 분류 기술로 Google Cloud의 자연어처리 API를 이용하고 있다. 금융 분야에서는 QuiBot이 IBM Watson의 자연어처리 기술을 이용하고 있고, 글로벌 공급망 솔루션 기업 GEP 역시 Microsoft Azure가 제공하는 자연어처리 기술을 이용해서 인공지능 기반 공급망 관리 플랫폼(사용자 식별, 위치 식별, 공급업체 추천, 계약에 관련된 조항에 대한 법적 준수 여부 확인 등)을 운영하고 있다.
 [그림 1]과 같이 가트너에서 개발한 인공지능 성숙도 모델은 5가지 레벨로 구성되며, 인공지능을 사용하고자 하는 조직의 인공지능 수준을 포지셔닝한다[2]. 이러한 모델을 검토하는 이유는 기업에서 인공지능을 비즈니스에 적용하고자 할 때, 현재 자사의 수준을 확인해보고 적절한 인공지능 전략을 수립하기 위해서이다.
 첫 단계인 레벨1 단계는 인공지능 기술을 알게 되는 시기로 관망 단계이다. 레벨2 단계는 PoC(Proof of Concept) 단계로 파일럿 프로젝트들이 실험적으로 진행된다. 레벨3 단계는 제품으로 하나 이상의 인공지능 프로젝트가 진행되고 전문가와 기술자들이 비즈니스에 활용되는 단계이다. 레벨4 단계는 모든 디지털 프로젝트들이 인공지능을 고려하게 되며, 인공지능을 탑재한 제품과 서비스들이 새로운 비즈니스 모델로 출시되는 단계이다. 마지막으로 레벨5 단계는 인공지능이 기존 프로세스나 제품과의 통합 수준이 아니라, DNA와 같이 기본 요소로서 제품과 서비스들에 활용되는 단계이다. 현재 인공지능 시장의 전반적인 수준은 레벨3 단계로 평가되고 있으며, Microsoft, Google, IBM, Amazon 등이 제공하는 인공지능 플랫폼 활용을 기반으로 레벨4로 진입할 것으로 기대되고 있다.

<자료> TGartner, “The CIO’s Guide to Artificial Intelligence,” 2019.

[그림 1] AI 성숙도 모델

 본 고에서는 ICT 관련 기술 시장 전망 및 기술 컨설팅을 제공하는 대표적인 기업 IDC와 가트너 보고서들을 중심으로 비즈니스 관점에서 바라본 인공지능 기술 동향에 대해서 살펴보고자 한다. II 장에서는 인공지능 기술의 비즈니스 환경을 살펴보고, III 장에서는 비즈니스 환경에 효율적으로 대응하기 위한 인공지능 기술 동향을 살펴보고자 한다. 마지막으로 IV 장에서 본 고의 결론을 제시한다.


 


II. 인공지능 기술의 비즈니스 환경

 인공지능의 기술 발전에는 여러 가지 요소들이 필요하지만 제일 중심에는 데이터, 연산처리 장치, 오픈소스 생태계 그리고 고객이 있다.
 인공지능 기술 발전에 있어서 핵심 요소 중 하나는 데이터이다. 특히, 데이터 기반 인공지능 기술(기계학습 및 딥러닝) 개발의 경우에는 데이터가 핵심이다. 기계학습 기술의 대전제는 유사 패턴을 가진 많은 데이터를 보고 학습한 모델을 이용하면, 사용자가 인지하고 싶은 패턴에 대한 응답을 신뢰도 높게 제공할 수 있다는 것이다. 따라서, 그동안에는 많은 양의 학습 데이터가 필요하며 데이터가 많을수록 좋은 성능의 인공지능 기술을 만들어낼 수 있다고 보았다. 실제로, 컴퓨터 비전 및 자연어처리 관련해서 엄청난 양의 데이터를 이용해서 학습한 딥러닝 모델들이 높은 성능의 결과를 보였다. 그런데 실제 비즈니스 환경에서는 많은 양의 학습 데이터를 준비하기가 쉽지 않으며, 최근 COVID-19와 같은 사건은 사건 이전의 패턴을 기반으로 사건이 진행 중인 시점 그리고 사건 이후 시점의 질의에 대한 정확한 답변을 내놓기가 어렵게 되었다. 이전과 이후의 데이터가 보유한 패턴이 상이해졌기 때문이며, 이 현상을 data drift[3]라고 한다. 따라서, 빅데이터 환경이 아닌 환경에서의 성능 높은 인공지능 기술에 대한 요구가 증대하고 있다. 또한, IoT 장치의 증가와 함께 시계열 데이터 생성이 매우 용이해졌으며, 데이터는 시간의 흐름과 함께 발생하는 현상들을 추적하거나 혹은 이상 상황에 대한 검출에 많이 활용되고 있다. 이러한 시계열 데이터는 시간의 흐름에 따라서 과거의 패턴이 그대로 반복되지 않고 지속해서 변화가 일어나는 특성이 있다. 많은 IT 기기들을 활용하는 공장, 건물, 금융, 물류 등의 비즈니스에서는 실시간 정보의 흐름과 이상 상황의 검출이 비즈니스 투자수익과 직접적 관계를 갖게 됨에 따라서 시계열 데이터 저장 및 분석에 대한 요구가 증대하고 있다[4].
 각 기업이 사일로 형태로 데이터를 수집 및 저장하고, 이를 활용하여 분석 서비스를 제공할 수도 있으나, 수집에 큰 비용이 소요되고 또한 통합적 분석을 통한 상황인식이 필요한 경우 다른 기업이 수집한 데이터가 유용할 수도 있다. 최근에는 다양한 분야에서 다양한 방식으로 측정되고 수집된 데이터를 공유하고자 하는 움직임이 증가하고 있다. 이러한 데이터 공유는 변화하는 비즈니스 환경에 효과적으로 대응하기 위한 연대적 성격이 강하며, 클라우드를 이용하여 공유하고 있다[5]. 기술적 흐름으로는 data lake, data fabric 등이 클라우드 형태로 구축되어 활용되고 있다.
 미래적인 관점에서 데이터 관련 가장 중요한 이슈는 아마도 데이터 거버넌스 혹은 소유권 관리 문제가 될 것이다. GDPR(General Data Protection Regulation)[6]은 EU가 2016년 제정하고 2018년부터 시행하고 있는 개인정보보호 법령으로 위반 시 과징금 등 행정처분이 부과될 수 있다. EU 내 사업장이 없더라도 EU를 대상으로 사업을 하는 경우 적용대상이 될 수 있다. 이러한 흐름에 맞춰 독일 기업인 도이치 텔레콤의 자회사인 T-Systems은 Google cloud를 활용한 Sovereign 클라우드 서비스 Sovereign 클라우드 : 메타데이터를 포함한 모든 데이터가 법률적으로 주권(해당국가)에 머물도록 보장하고, 모든 상황에서 데이터에 대한 외부 액세스가 통제되도록 설계 및 구축된 클라우드를 구축 및 제공할 예정이다[7]. 공공 서비스와 헬스 분야를 대상으로 서비스를 제공할 계획이다. 공용 클라우드 서비스의 확장성, 탄력성과 안정성을 활용하는 동시에 민감한 데이터 처리에 대한 기능도 제공할 것이다.
 데이터 처리 장치 관련해서는 높은 처리 능력을 갖춘 GPU, TPU(Tensor Processing Unit) 등의 프로세서들이 출시되고 있다. 점차 엣지 장치에도 이러한 프로세서들이 탑재되고 있다. 데이터가 수집된 곳에서 처리되는 것이 실시간성과 프라이버시 측면에서 유리하다. 현재까지 클라우드 중심의 중앙집중식 데이터 저장ㆍ분석이 수행되던 흐름에서 점차 분산 저장ㆍ분산 분석 기술인 엣지 컴퓨팅 기술에 대한 요구가 증대하고 있다. IDC에 따르면, 엣지 인프라 및 엔드포인트 인공지능 프로세서의 성장은 2021년 162억 달러에서 2026년까지 31.3%의 CAGR(연간복합성장률)로 631억 달러의 매출을 창출할 것으로 보고 있다[8].
 인공지능 기술 발전의 핵심 요인 중 하나는 오픈소스 생태계이다. Github로 대표되는 오픈소스 생태계는 다수의 알고리즘과 딥러닝 모델들이 오픈되어 있어서 이를 활용하여 손쉽게 필요한 모델을 재생산해낼 수 있다. 코드 저장소에는 인공지능 플랫폼인 tensorflow와 pytorch 등에 바로 탑재해서 실행함으로써, 코드를 검증ㆍ수정ㆍ재활용할 수 있는 기계학습 및 딥러닝 코드들이 다수 제공되고 있다. Google의 경우 colab이라는 클라우드 서비스를 통해 하드웨어 인프라를 소유하지 않아도 Google이 제공하는 오픈소스나 github의 오픈소스들을 업로드해서 실행해보고 편집도 할 수 있다. 실제로 인공지능 교육 프로그램들이 colab 환경을 많이 이용해서 개발자들을 학습시키고 있다.
 마지막으로 인공지능 기술의 수요처인 고객과 관련한 고객 경험(Customer Experience: CX) 기술 개발이 확산하고 있다. 결국, 기술은 고객사에 이전되고 고객사의 제품은 제품 고객에서 판매되어야 생명을 유지할 수 있다. 따라서 많은 기업은 고객 경험 만족도를 높이기 위한 기술들을 개발하고 있다. IDC가 2021년 5월부터 2022년 3월까지 조사한 19개국 임원 평균 44.1%가 디지털 전환 투자를 견인하는 가장 중요한 우선순위로 고객 만족을 뽑았다[9]. 2022년 개최된 Enterprise Connect 행사에서는 Google이 인공지능을 활용한 새로운 형태의 고객 서비스 플랫폼을 선보였다[10]. 다른 한편으로는, COVID-19와 기후 위기와 같은 지구 지속 가능성에 대한 위협이 커질수록 친환경적이고 친사회적인 기업 및 기술에 대한 요구가 확대되고 있다. 고객의 구매 선호도는 제품이나 서비스의 가격과 능력에만 초점을 맞추는 것이 아니라 사회 내에서 판매자의 사회적 책임 및 신뢰도에 의해 영향을 받는다는 것이다. 또한, 고객들은 사회적 편견이나 불공정과 같은 사회적 이미지를 갖는 기업의 제품과 서비스에 대한 구매를 보류하는 움직임을 보인다. 바야흐로 비즈니스 세계에서의 성공은 기술 및 서비스 제공에서 기능성과 품질 보장은 기본이고, 책임성 및 윤리성에 대한 고려도 중요하게 되었다.


 


III. 인공지능 기술 동향

 인공지능 기술 동향은 한마디로 “연구실에서 벗어나 다이나믹 비즈니스 세계로”라고 정리될 수 있다. 이러한 관점에서 몇 가지 주요 기술 동향을 정리해보면 다음과 같으며, 각 기술은 별도로 존재하지 않고 서로를 강화하는 관계이다.

1. 맥락 데이터에 기반한 인공지능 기술

 비즈니스 환경에서 잘 정제된 빅데이터를 준비하고 관리하는 것은 매우 어렵다. 대부분의 비즈니스 환경에서는 시계열 데이터가 많이 이용되는데 이러한 데이터의 경우에는 오래전 데이터가 현재나 미래의 데이터 특성을 반영하지 못하는 경우가 많다. 가트너는 새로운 인공지능 학습 데이터의 흐름을 “From Big to Small and Wide”[3]라고 명명했다. 데이터에 지나치게 의존하는 딥러닝 접근 방식보다는 실제 또는 인식된 데이터 부족으로 인해 발생하는 인공지능 진입장벽을 낮추기 위해 작고 광범위한 데이터 접근 방식이 필요하다. 또한, 다양한 정형 및 비정형 데이터 소스를 통합하여 예측 능력을 강화하고 개선할 수 있으며, 특히 의사 결정자에게 활용한 맥락 정보를 함께 제공함으로써 분석된 정보에 대한 신뢰를 높일 수 있다고 보았다. 필요한 경우, 합성 데이터를 사용하여 부족한 수집 데이터를 보완하기도 한다. 이러한 필요에 따라서, 데이터 공유 기술 및 생태계 그리고 멀티모달 데이터를 이용한 인공지능 기술에 대한 요구가 함께 증대되고 있다. 적은 데이터로 높은 성능을 보이기 위한 기술로서 few-shot learning, self-supervised learning, transfer learning 등의 기술들이 연구되고 있다. 맥락 데이터(context data)는 데이터 마켓플레이스, 소셜 미디어, 사물인터넷, 디지털 트윈 등 다양한 기술 매체를 통해서 획득된다.

2. 변화하는 상황에 대한 적응형 인공지능 기술

 비즈니스 세계는 끊임없이 변화한다. 인공지능 기술은 변화하는 환경에 지속적으로 적응하면서 성능 품질을 보장해야 한다. 기존의 인공지능은 대용량의 학습 데이터를 이용하여 사전학습 후, 이를 배포하여 추론 서비스에 활용하는 형태이다. 즉, 시간에 따라서 변화하는 환경에 대한 대응 능력이 떨어지는데 이러한 문제를 해결하기 위한 것이 적응형 인공지능(Adaptive AI) 기술이다[5]. 적응형 인공지능 기술은 지속해서 새로운 패턴을 학습함으로써 data drift 문제를 해결할 수 있다. 또 다른 측면으로는, 일반적인 모델을 기반으로 활용하다가 특정 도메인 혹은 개인의 영역에서 지속적으로 적응형 인공지능 기술을 적용하면 결국에는 개인 맞춤형 혹은 특정 도메인 맞춤형의 인공지능 서비스를 제공할 수 있게 된다. 적응형 인공지능의 기본 방법은 학습 데이터를 추가로 준비하여 재학습을 지속해서 수행하는 것으로 관련 연구가 다양하게 진행되고 있다. 가장 단순하게는 새로 유입되는 데이터로 재학습을 지속적으로 수행하는 online learning이 있다. 일 진보한 기술로는 이전 학습된 모델의 특정 파라미터들은 유지하고 새로 유입된 데이터를 이용해서 일부 파라미터들만 재학습하거나 혹은 구조를 튜닝하여 재학습하는 transfer learning 방식이 있다. Transfer learning은 대용량 데이터셋으로 잘 학습된 모델을 재활용해서 빠르게 성능을 향상시킬 수 있어서 많이 활용된다. 하지만 transfer learning의 경우, 다른 데이터셋 기반 다른 태스크를 학습하다 보니 원래 학습시키는 태스크에 대한 정보를 잊어버리는 문제가 있는데, 이를 catastrophic forgetting이라고 부른다. 일부 파라미터만의 재학습으로 이전 학습을 통해서 파라미터들이 갖고 있던 그들 간의 상관관계 정보를 잃게 될 수 있다. 이러한 문제를 해결하고자 하는 적응형 인공지능 기술이 continual learning 혹은 lifelong learning이다. 하나의 모델을 조금씩 업그레이드시키면서 여러 태스크를 처리할 수 있도록 만드는 방법이다. 이와는 다르게 엔지니어링 측면에서의 적응형 인공지능 기술에는 인공지능 엔지니어링 기술이 있다.

3. 인공지능 엔지니어링

 인공지능 엔지니어링(AI Engineering)은 DataOps, ModelOps 및 DevOps를 포함하여 인공지능 서비스의 중단 없이 모델을 개발ㆍ운영ㆍ유지 관리하는 모든 것을 포함하는 분야이다[5]. 인공지능 엔지니어링은 모델의 개발 측면이 아니라 이미 개발된 여러 인공지능 모델 및 기술들을 비즈니스 문제에 맞춰서 조직화하고 운영하고, 이를 모니터링하고 필요할 때 다시 학습하거나 재조직하는 일련의 모든 시스템 기능을 포함하는 것이다. 각 모델의 성능이 아무리 우수해도 변화하는 비즈니스 문제 해결에 적합하게 사용하는 것은 또 다른 세계이다. 가트너는 2026년까지 적응형 AI 시스템을 구축 및 관리하기 위해 AI 엔지니어링 방식을 채택한 기업은 운영되는 AI 모델의 수에서 동종 기업보다 최소 25% 이상의 성과를 낼 것으로 전망하였다[5]. 여기에 사용되는 인공지능 기술은 다만 딥러닝, 기계학습만을 포함하지 않고, 룰 기반의 인공지능, 퍼지 기술 등 다양한 데이터 분석 기능을 포괄적으로 사용할 수 있어야 한다.

4. 복합 인공지능

 복합 인공지능(Composite AI)은 서로 다른 인공지능 기술을 결합하여 학습의 효율성을 향상하는 것을 말한다[11]. 지식 표현 수준을 확장하고 궁극적으로 더 광범위한 비즈니스 문제를 보다 효율적으로 해결할 수 있다. 즉, 해결할 문제가 복잡한 문제일 때 여러 인공지능 기술을 복합적으로 사용하여 해결할 수 있다는 장점이 있다. 특히, 잘 정제된 학습용 빅데이터가 제공되지 않지만, 도메인 지식이 존재하는 경우에 유용하게 활용할 수 있다. 도메인 지식을 사용함으로써 결과에 대한 더 나은 해석 가능성을 제공하고, 이벤트에 대한 높은 복원력을 제공함으로써 보다 높은 수준의 지능을 제공할 수 있다. 따라서, 비즈니스 문제의 정의와 기술(description)이 매우 중요해졌으며, 잘 정의된 비즈니스 문제로부터 적합한 인공지능 기술의 조합을 설계할 수 있다.

5. 멀티모달 인공지능

 복합 인공지능(Composite AI)은 서로 다른 인공지능 기술을 결합하여 학습의 효율성을 향상하는 것을 말한다[11]. 지식 표현 수준을 확장하고 궁극적으로 더 광범위한 비즈니스 문제를 보다 효율적으로 해결할 수 있다. 즉, 해결할 문제가 복잡한 문제일 때 여러 인공지능 기술을 복합적으로 사용하여 해결할 수 있다는 장점이 있다. 특히, 잘 정제된 학습용 빅데이터가 제공되지 않지만, 도메인 지식이 존재하는 경우에 유용하게 활용할 수 있다. 도메인 지식을 사용함으로써 결과에 대한 더 나은 해석 가능성을 제공하고, 이벤트에 대한 높은 복원력을 제공함으로써 보다 높은 수준의 지능을 제공할 수 있다. 따라서, 비즈니스 문제의 정의와 기술(description)이 매우 중요해졌으며, 잘 정의된 비즈니스 문제로부터 적합한 인공지능 기술의 조합을 설계할 수 있다.

<자료> Hugging Face, “AI model generating images from any prompt!,” 2022.

[그림 2] DALLㆍE mini를 이용하여 생성한 이미지

 멀티모달 인공지능(Multimodal AI)은 다양한 데이터 유형(이미지, 텍스트, 음성, 수치 데이터)을 복합적으로 처리하는 인공지능 패러다임이다. 다양한 모달리티의 데이터를 결합해서 사용하거나 혹은 입력과 출력이 서로 다른 모달리티인 인공지능 기술이다. 최근에는 OpenAI가 발표한 DALLㆍE와 CLIP이 유명한데, DALLㆍE는 텍스트를 입력으로 넣어주면 출력으로 이미지 데이터가 생성되는 기술이며, CLIP은 zero-shot learning의 한 방법으로서 이미지 데이터와 텍스트 데이터를 같이 학습시켜서 학습 과정에서 보지 못한 클래스의 이미지도 분류할 수 있는 기술이다. DALLㆍE mini 사이트에서 텍스트를 입력으로 넣어서 쉽게 이미지를 출력해볼 수 있다([그림 2] 참조). 사전에 학습된 자연어처리 모델과 이미지 처리 모델들이 활용 가능해지면서 이들을 활용한 다양한 시도들이 이루어지고 있다. 현재의 멀티모달 인공지능 기술은 기능 동작의 수준이며, 더욱 진화될 것으로 전망된다. 전문가들은 이미 수준에 올라온 자연어처리 기술의 다음 버전은 멀티모달 정보를 활용한 언어처리 기술 고도화라고 보고 있다[1].

6. 인공지능 민주화

 인공지능 민주화(AI democratization)란 Augmented AI를 포함한 인공지능 도구들을 이용해서 데이터 과학자와 인공지능 전문가를 대체함으로써 시티즌 개발자 환경을 조성하는 것을 의미한다[11]. AutoML 기술을 이용하거나, Microsoft, Amazon, Google이 제공하는 사전 제작, 드래그 앤 드롭 또는 로우코드/노코드 인공지능 도구를 이용할 수 있다. 이를 통해서 인공지능 기술개발 및 활용에 대한 진입장벽을 낮추고, 인공지능 솔루션 구축 비용을 절감할 수 있다. 또한, 이러한 도구의 사용은 인공지능 전문가를 양성하는데도 매우 효과적이다. ImageNet과 같은 이미지 데이터의 공개, github를 통한 다수의 딥러닝 코드들의 공개가 인공지능 기술 활성화를 견인했던 것과 마찬가지로 인공지능 기술의 민주화는 다양하고 혁신적인 인공지능 솔루션 양산을 견인할 것이다. 그러나, 한편으로는 인공지능 민주화에 대한 경고성 이야기가 나오고 있다[12]. 자격을 갖춘 엔지니어에 의해 설계된 정교한 인공지능 시스템도 편향, 설명 가능성 문제 및 기타 결함을 가질 수 있다. 일차적으로, 적절한 훈련 또는 적절한 제어 없이 개발된 시스템 자체가 다양한 편향과 오류를 내재할 수 있다. 또한, 이러한 시스템을 이용해서 개발된 서비스들은 이차적으로 의도적 혹은 비의도적 차별이나 심각한 오류를 유발할 수 있다. 개발자들 혹은 서비스 운용자들이 개발 결과물의 편향성이나 오류 등에 대한 검토를 반드시 고민해야 하는 이유이다.

7. 책임 있는 인공지능

 책임 있는 인공지능(Responsible AI)은 기업이 인공지능을 채택할 때 고려해야 하는 비즈니스적 측면과 윤리적인 측면을 포괄하는 용어이다[11]. 여기에는 비즈니스 및 사회적 가치, 위험, 신뢰, 투명성, 공정성, 편견 완화, 설명 책임, 안전, 개인정보보호 및 규제 준수가 포함된다. 책임 있는 인공지능을 가능하게 하는 기술들로는 differential privacy, FedML, XAI(eXplainable AI) 등이 있다. Differential privacy는 데이터 생성기술로서 익명성을 유지할 수 있도록 하며, 통계 노이즈를 도입함으로써 개인정보보호 기능을 강화하는 기술이다. FedML은 로컬서버와 중앙서버가 협력해서 글로벌 모델을 학습하는 기술이다. 로컬 환경에서 로컬 데이터를 각자 분석해서 모델을 학습하고 중앙에서는 모델들을 통합함으로써 전체 모델의 학습이 이루어진다. 따라서, 이러한 환경에서는 로컬 데이터의 프라이버시가 보호된다. 그 외에 인공지능 모델의 결과에 대한 설명을 제공하는 XAI 기술인 LIME(Local Interpretable Model-agnostic Explanations), SHAP(SHapley Additive exPlanations) 등이 있다.

8. 생성 인공지능

<자료> Portrait AI, “Portrait Avatar Generator,” 2022.

[그림 3] 생성 모델을 이용한 서비스(AI Portraits Ars)

 생성 인공지능(Generative AI)은 데이터의 분포를 학습하고, 이를 기반으로 새로운 데이터를 생성하는 기술이다[11]. 옷이나 동물의 패턴 등을 달리 매칭시켜 보는 기술에서 완전히 새로운 미디어 콘텐츠를 생성할 수도 있다. 2017년 워싱턴대학교에서 오바마 전 미국 대통령의 가짜 영상을 만들어서 화제가 되었던 DeepFake가 대표적이며, 생성기술을 이용한 예술 활동 커뮤니티도 생겨났다. AIArtists.org는 예술가의 창의력과 인공지능 기술을 결합하여 예술작품을 만들어내는 커뮤니티이다. 이러한 예술 활동을 GAN art라고 한다. 초상화를 그리는 인공지능 기술(AI Portraits Ars)은 IBM Watson과 MIT의 AI 연구소에서 개발한 것으로 사진을 입력으로 넣어주면 15세기 유럽 초상화의 이미지로 변환해준다([그림 3] 참조). 학습 데이터가 유럽인으로 한정되어 있어서 입력 데이터의 얼굴을 백인 유럽인으로 편향되게 생성한다는 지적을 받고 있다.
 최근에는 의약품이나 재료 설계에 생성 인공지능 기술을 이용하여 연구 및 개발에 드는 비용을 절감하고 있다[13],[14]. KAIST는 신약후보물질을 빨리 찾는 인공지능 모델(단백질-리간드 상호작용 예측 인공지능 모델)을 만들었는데, 물리 화학적 지식을 딥러닝 모델에 적용하여 부족한 데이터를 합성해서 사용했다고 한다[15]. 인공지능 신약개발 플랫폼(KAIDD)는 신약개발 프로세스의 다양한 부분에 인공지능을 활용하는데, 빅데이터와 인공지능을 이용해서 약물 설계 및 후보 물질 도출 시스템을 개발했다고 한다[16]. 제약 분야 이외에도 생성 인공지능은 제조, 미디어, 건축, 인테리어 디자인, 엔지니어링, 자동차, 우주항공, 국방, 의료, 전자 및 에너지 산업 전반에 있어서 혁신의 기회를 제공할 것으로 전망된다.
 인터넷 매체를 통해서 지식의 많은 부분을 습득하고 있는 지금 시대에서는 허위 정보(disinformation)는 실제로 심각한 우려를 낳고 있다. DeepFake뿐 아니라, GPT-3와 같은 모델을 사용하여 허위 또는 오해의 소지가 있는 에세이, 트윗 또는 뉴스 기사를 작성할 수 있다. 생성 인공지능 기술은 다양한 분야에 있어서 새로운 기회인 동시에 사회적 위험을 안고 있다. 생성 인공지능 기술에 대해서 책임 있는 기술적, 제도적 접근이 필요한 이유이다.

9. 엣지 인공지능

 엣지 인공지능(Edge AI)은 중앙서버 혹은 클라우드에 데이터를 전송하지 않고, 데이터를 수집한 로컬(엔드 포인트, 게이트웨이, 엣지 서버) 장치에 인공지능 기술을 내장하여 서비스를 제공하는 기술이다[11]. 현재까지는 주로 학습은 중앙서버에서 처리하고, 학습된 모델을 엣지에 내려주면 엣지에서는 추론 서비스를 제공하는 경우가 많다. 최근에는 엣지 장치가 고도화되고, 또한 모델 압축 기술들이 좋은 성능을 보임으로써 경량의 모델을 엣지 장치에서 학습하는 기술들이 개발되고 있다. 엣지 인공지능이 주목을 받는 이유는 가트너에 따르면 2025년까지 117억 개의 사물인터넷 장치가 있을 전망이고, 데이터의 75%가 중앙집중식이 아닌 외부에서 생성될 것으로 예측되기 때문이다[11]. 이렇게 생성된 데이터의 프라이버시 문제, 실시간적 처리 문제, 네트워크 트래픽 문제 등을 해결하기 위한 가장 좋은 솔루션이 엣지 인공지능이다. 엣지 장치에 비전 인식 인공지능 기술을 탑재하여 시각적 검사를 제공하는 서비스는 제조, 에너지 및 소매 분야에서 유용한 응용 사례이다. 관련한 기술로는 TinyML, FedML, 모델 압축 기술 등이 있다.

 


Ⅳ. 결론

 본 고에서는 시장조사기관의 보고서를 중심으로 인공지능 기술 동향을 9가지 카테고리로 정리해 보았다. 인공지능 기술 분야는 광범위하고 다양하며 각 분야의 기술적인 성숙도나 산업 혹은 사회에서의 채택 수준도 다양하다. 전반적으로는 연구실 수준의 안정된 환경에서 이제는 상품과 서비스에 적용되는 시기로 본다. 비즈니스 세계는 이해관계자가 다양하고, 기술 적용 환경은 동적이며 안정적이지 못하다. 인공지능 기술의 산업과 사회 수용성을 높이기 위해서는 동적인 비즈니스 환경에서의 안정적인 성능 보장과 사회 윤리적 관점에서의 점검 및 고려가 필요하다.
 니콜라스 카는 “생각하지 않는 사람들:인터넷이 우리의 뇌 구조를 바꾸고 있다”[17]에서 뇌의 신경 가소성을 이야기한다. 광범위한 인터넷 사용으로 인해서 인간의 뇌는 암기하고 정리할 필요가 없어졌다. 따라서, 이와 관련된 인식 관련 기능들이 쇠퇴해 가고 있다고 한다. 인간의 감각과 뇌의 활동을 통한 인식 기능이 인공지능에 위임되어 가면, 결국 인간이 담당하는 부분은 감정만 남게 되지 않을까. 인간을 보조하는 기술을 개발할 것인지, 인간을 증강하는 기술을 개발할 것인지, 인간을 대체하는 기술을 개발할 것인지에 대한 고찰과 사회적인 합의가 필요한 시점이다. 이브 헤롤드는 “아무도 죽지 않는 세상: 트랜스휴머니즘의 현재와 미래”에서 인간의 뇌, 심장을 포함한 거의 모든 부분이 기술로 대체 가능한 인간 강화 시대가 올 수 있다[18]. 기술로 증강된 새로운 종의 본질과 정체성에 대한 고찰과 기술로 대체할 수 없는 현재 인류의 고유성에 대한 고민이 필요한 시기이다.

 



[ 참고문헌 ]

[1] IDC, “IDC Perspective: The Business Value of Natural Language Processing Applications in 2022. 7. Enterprises,” 2022.
[2] Gartner, “The CIO’s Guide to Artificial Intelligence,” 2019.
[3] Gartner, “Top Trends in Data and for 2021: From Big to Small and Wide Data,” 2021.
[4] IDC, “Why the Demand for Time Series Databases and Analytics Is on the Rise,” 2022.
[5] Gartner, “Top Trends in Data and Analytics, 2022,” 2022.
[6] KISA, “GDPR 소개”, 2022.
[7] IDC, “European Big Data and Analytics Software Events,” 2022.
[8] IDC, “Worldwide Edge and Endpoint AI Processing Forecast, 2022-2026,” 2022.
[9] IDC, “IDC Perspective: Creating Customer Trust with Sentiment Measurement - Achieving CX Success Using Data and Artificial Intelligence,” 2022.
[10] Gartner, “Quick Answer: Why Should CSP CIOs Care About the AI Capabilities Announced at the Enterprise Connect Event?,” 2022.
[11] Gartner, “Building a Digital Future: Emergent AI Trends,” 2022.
[12] AnandSRao, “Democratization of AI,” Toward Data Science, Aug. 17, 2020.
[13] Andrew E. Blanchard, et el., “Using GANs with adaptive training data to search for new molecules,” Journal of Cheminformatics Vol.13, Article number: 14, 2021.
[14] Aninditha Ramesh et el., “GAN Based Approach for Drug Design,” ICMLA 2021.
[15] 노다은, “KAIST, 신약 후보 물질 2배 빨리 찾는 ‘인공지능 모델’ 개발”, 충청신문, 2022.
[16] 인공지능신약개발플랫폼, “KAIDD innovation in New Medicine Development through Artificial Intelligence”, 2022.
[17] 니콜라스카, “생각하지 않는 사람들:인터넷이 우리의 뇌 구조를 바꾸고 있다”, 청림출판, 2011, pp.290-321.
[18] 이브 헤롤드, “아무도 죽지 않는 세상:트랜스휴머니즘의 현재와 미래”, 꿈꿀자유, 2020, pp.307-338.

* 본 자료는 공공누리 제2유형 이용조건에 따라 정보통신기획평가원의 자료를 활용하여 제작되었습니다.