[한겨레]
8명 전문팀 비밀작업 착수…뉴스피드가 열쇠
미래 행동 예측…또다른 빅브라더 탄생 우려전세계 페이스북 이용자는 7억명. 세계인들이 사용하는 소셜 미디어중 가장 많은 이용자를 갖고 있다.
1분마다 페이스북에서는 엄청난 일이 벌어진다. 246만개의 새로운 포스트가 올라오고, 180만명이 ‘좋아요’(likes)를 누른다. 60초마다 추가되는 데이터 양이 무려 350기가바이트나 된다.
그런 페이스북이 인공지능을 갖추게 되면 어떤 일이 벌어질까?
벤처투자기업 DST(디지털 스카이 테크놀로지)의 최고경영자인 러시아 출신의 기업인 유리 밀너(Yuri Milner)는 지난 2010년 11월 페이스북에 거액을 투자하면서 이런 말을 했다고 한다.
“제 생각에 10년 내에 당신은 소셜 네트워크에 질문을 던지고, 답변을 듣게 될 텐데 그것이 컴퓨터가 한 답변인지 사람이 한 것인지 알지 못하는 수준이 될 것입니다. 반대로 질문을 받았을 때에도, 그 질문이 사람이 한 것인지 인공지능이 한 것인지 잘 모르게 될 것입니다. 이런 질문에 대한 답변을 할 때마다 컴퓨터가 알고리즘을 더욱 정교하게 만드는 데 도움이 되겠지요.”(출처:http://health20.kr/2044)
컴퓨터가 인간의 뇌처럼 학습하고 추론하는 깊이학습 주목그의 말처럼 페이스북이 인공지능 기술을 갖춰 내가 올린 포스트의 숨은 행간까지 읽어낸다면?
“이르면 10년 안에 그런 일이 현실로 나타날 것”이라고 했던 밀너의 말에 답변이라도 하듯, 최근 페이스북이 이용자를 보다 더 깊이, 더 명확하게 이해할 수 있는 새로운 문을 만드는 작업에 착수했다. 그 문을 만드는 도구가 바로 ‘깊이학습’(deep learning)이라는 이름의 인공지능 기술이다.
페이스북 내에서 AI팀으로 불리는 8명의 그룹이 이에 관한 연구 작업을 시작했다. 이들 중에는 구글에서 영입한 깊이학습 전문가, 안면인식 신생기업 페이스닷컴의 공동설립자, 컴퓨터 영상 전문가 등이 포함돼 있다.
페이스북 쪽은 뇌세포 네트워크와 비슷한 방식으로 데이터를 처리하는 깊이학습 시스템을 페이스북의 방대한 데이터에 적용할 경우, 이용자들의 새로운 특성을 찾아내고 광고 소구층을 새롭게 설정할 수 있을 것으로 보고 있다.
원래 ‘깊이학습’은 구글이 앞서 개발한 것으로, 미국 매사추세츠공대(MIT)가 발행하는 과학전문지 <테크놀로지 리뷰>에 의해 지난 봄 ‘올해의 10대 혁신기술’로 꼽힌 바 있다. 한마디로 컴퓨터가 인간의 뇌처럼 스스로 학습하고 추론까지 해내게 하는 시스템이다.
‘깊이 학습’은 겉으로 명확하게 언급되지 않았더라도 페이스북의 텍스트에 담겨 있는 필자의 정서나 사건 같은 것들을 이해할 뿐 아니라, 사진 속의 대상을 인식하고, 나아가 그 사람의 미래 행동을 보다 정밀하게 예측해내는 일을 할 수 있는 잠재력을 갖추고 있다는 평가를 받고 있다.
하지만 이들 연구팀이 구체적으로 뭘 하고 있는지는 베일에 싸여 있다. 다만, 페이스북의 CTO(최고기술책임자)인 마이크 쉬뢰퍼는 ‘뉴스 피드(news feed)’야말로 페이스북의 ‘킬러 앱’이라며, 깊이학습을 이용하는 명확한 방법 중 하나는 개인별 최신 업데이트 목록인 뉴스피드를 개선하는 것이라고 말한다.
페이스북 쪽에서는 이미 기존의 기계학습(machine learning) 기술을 이용해 평균적인 이용자들이, 예컨대 1500개의 업데이트 목록 중에서 자신들에게 중요하다고 생각되는 것 30~60개를 골라서 볼 수 있도록 하고 있다. 쉬뢰퍼는 이용자들이 갈수록 더 많은 데이터를 생산하기 때문에, 콘텐츠를 엄선해내는 기술을 더 정교하게 만들 필요가 있다는 말로 깊이학습 시스템의 필요성을 말한다.
“데이터 양은 늘어나고, 이용자들은 친구를 늘려가고 있으며, 모바일기기 덕분에 더 자주 페이스북에 접속한다. 사람들은 친구를 기다리거나 커피숍에 있을 때 항상 스마트폰을 꺼낸다.” 쉬뢰퍼는 깊이학습을 활용할 경우, 페이스북 이용자들은 어떤 사진을 공유해야 최상의 효과를 거둘 수 있는지 등을 판단하는 데 큰 도움을 받을 수 있다고 말한다.
나와 친구들의 포스트, 검색기록 등 살펴 이용자의 특성 파악현재까지 깊이학습 연구에서 페이스북은 경쟁업체인 구글, 마이크로소프트을 뒤쫓아가고 있는 상태다. 이 분야의 실력자들을 영입한 구글은 지난해 유튜브 비디오의 정지화면들을 분석해 고양이 등 대상물을 인식하는 자가학습 소프트웨어를 만든 바 있다. 이에 기반이 되는 기술은 나중에 구글의 음성인식 서비스의 오류 비율을 줄이는 데도 사용됐다. 반면 마이크로소프트는 영어를 중국어로 실시간 음성 번역하는 시스템을 만드는 데 깊이학습 시스템을 활용했다.
전통적인 기계학습 방식은 학습 소프트웨어에 데이터를 제공하기 전에, 전문가가 수작업으로 데이터의 어떤 부분을 집중적으로 들여다봐야 하는지 결정해줘야 하기 때문에 느릴 수밖에 없다.
하지만 깊이학습 시스템은 별다른 인간 개입 없이도 학습을 할 수 있다. 왜냐하면 데이터의 어떤 부분이 가장 중요한지 스스로 판별해낼 수 있기 때문이다.
페이스북의 인공지능 기능이 나의 포스트, 친구들의 과거 포스트, 검색기록 등을 살펴 겉으로 드러나지 않은 이용자의 특성을 파악해 나의 속마음을 뚫어보게 되는 날도 이제 시간 문제가 돼가는 듯하다.
페이스북은 이 기능을 개발하는 목적으로 이용자의 편의와 마케팅 활용을 내세우고 있다. 하지만 모든 동전엔 양면이 있듯, 또 다른 형태의 온라인 빅브라더가 탄생하는 건 아닌지 우려스러운 측면을 생각하지 않을 수 없다. 생각이 거기까지 미치면 머리카락이 쭈뼛 선다.
RECENT COMMENT