알파고 동영상 식별·데이터 분류 단계
번역 '머신러닝'머지않아 인간 앞질러

'인공지능(Artificial Intelligence·AI)'이란 사람처럼 생각하고 느끼며 움직이는 기계를 개발하는 컴퓨터 과학으로, 인간의 뇌와 뉴런신경망을 모방해 언젠가는 컴퓨터나 로봇들이 인간처럼 사고하고 행동하게 하려는 것이다. 애플폰의 '시리', 삼성폰의 'S보이스'가 인간의 목소리를 분석해 명령을 수행하는 '인공 지능'을 사용하고 있다. 로봇 진공청소기·내비게이션·비디오 게임· 검색 엔진 등에서도 광범위하게 인공지능을 사용하고 있지만, 인공지능 능력이 낮아서 대부분 사람들은 그것이 인공지능이라고 생각하지 않고 있다.

이세돌과 '알파고'의 바둑 대결 후 영화 <터미네이터>에서 인간이 자신을 제거하려는 것을 미리 알아채고 먼저 인간을 공격하는 스스로 학습하고 생각하는 인공지능인 스카이넷(Skynet)처럼 인공지능이 인간을 이길 수도 있는 무서운 힘이 있다고 느끼게 되었다. 하지만 이 대국에서 '알파고'는 오직 이길 수 있는 확률만 따져서 착수를 결정할 뿐이었다.

'인공신경망'은 생물학의 신경망(동물의 뇌)에서처럼 통계학적 학습 알고리즘을 기계학습과 인지과학에서 사용하는 것이다. 우리는 사진만으로도 개와 고양이 같은 동물들을 쉽게 구분하지만 컴퓨터는 구분하지 못한다. 컴퓨터가 동물의 종류를 구분하기 위해 '머신러닝'이라는 기계학습방법이 고안되었고, 데이터를 분류하기 위한 많은 기계학습 알고리즘이 개발되었다. 구글은 배움의 과정 없이 컴퓨터가 스스로 학습하는 방식으로 여러 가지의 동영상에서 고양이 동영상을 식별하는 '딥러닝' 기술을 개발한 상태이다.

머신러닝은 많은 데이터를 컴퓨터에 입력하고 비슷한 것끼리 분류해 판단하도록 학습하는 방법이다. '알파고'에서 사용한 '딥러닝'은 인간이 사물을 구분하듯이 인공신경망을 이용해 수많은 데이터를 분류하고, 패턴을 발견하여 컴퓨터가 판단하도록 하는 기계학습인 '머신러닝'의 한 종류이다.

거대기업들이 인공지능 개발의 생태계를 장악하기 위하여 자신들이 만든 기술들을 개방하고 있다. 구글은 2015년 자체 개발한 머신러닝 기술인 '텐서플로' 소스를 공개했다. 머신러닝의 핵심은 데이터의 양이므로 데이터 양이 많을수록 성능이 좋아진다. 거대기업들이 소스를 개방하는 것도 외부에서 생산된 데이터를 자신들이 이용하기 위함이다. 페이스북도 이미 확보한 15억 명에 이르는 고객들의 다양한 포스팅의 데이터를 확보하고, 시스템 상에서 음성인식 서비스를 훈련할 때는 GPU를 활용하고, 얼굴인식기능 등을 구현할 때는 스마트기기의 CPU를 이용한다.

얼마 전 우리나라에서도 인공지능과 전문번역사 간 번역 대결이 있었다. 이 결과 인간 번역사는 49점을 받았고, 참여한 3개 인공지능의 평균 점수는 20점이었다. 아직은 기계번역 문장이 어색하고 복잡한 의미를 혼동하는 문제가 있다. 그러나 기계번역은 법률·의학 등 특정 전문 용어를 반복해 쓰는 영역에서는 번역 품질이 월등히 좋다. 최근 빅데이터를 학습해 문장의 맥락을 이해하는 '신경망 자동번역(NMT)'이란 기술이 도입된 이후 범용 번역에서도 번역 품질이 비약적으로 좋아지고 있으며, 향후 2~3년 안에 전문번역사에 뒤지지 않는 번역이 나올 것이다.

123.jpg

현재까지 개발된 머신러닝의 기술수준은 꿀벌이나 개미의 뇌 수준 정도이다. 특정 문제해결에 특화했기 때문에 그 영역에서는 인간의 능력을 넘어서고 있다. 전 세계의 IT업계는 물론 산업계 전체를 인공지능이 강타하고 있다. 이에 따라 업계는 저마다 인공지능을 화두로 새로운 제품을 선보이고 있다. 우리나라도 세계의 흐름을 빨리 따라잡고, 21세기 먹거리인 인공지능 개발의 선두 주자가 되어야 한다.

기사제보
저작권자 © 경남도민일보 무단전재 및 재배포 금지