얼굴을 가진 AI: 인간 같은 감정을 전달하는 대화형 아바타

기계와 대화하는 데는 뭔가 불편한 점이 있는데, 특히 많은 기계가 얼굴이 없다는 점을 생각하면 더욱 그렇습니다.

인류는 수세기에 걸쳐 미세한 표정을 읽어내고, 눈가 주변의 미세한 경직에서 진심을 가늠하며, 눈맞춤을 통해 신뢰를 쌓아오며 진화해 왔습니다. 따라서 시각적 요소를 제거하고 상호작용을 화면의 텍스트나 육체 없는 목소리로만 축소할 때, 우리는 인간에게 근본적으로 부자연스러운 방식으로 소통하라고 요구하는 셈입니다.

이것이 바로 Trulience가 해결하고자 했던 문제입니다. 그리고 Trulience의 성장 부문 책임자인 리처드 보들러(Richard Bowdler)와 이야기를 나눈 후, 저는 우리가 단순히 더 나은 그래픽 이상의, 훨씬 더 심오한 변화를 목격하고 있다는 확신을 갖게 되었습니다. 우리는 인간과 AI 사이의 인터페이스가 단순한 거래적 관계에서 벗어나, 실제로 대화처럼 느껴질 수 있는 형태로 진화하는 것을 지켜보고 있습니다.

모든 것의 시작이 된 이야기

대부분의 기술 기업은 기술적 통찰이나 시장 기회에서 그 기원을 찾습니다. 트룰리언스의 창업 이야기는 그보다 더 개인적인 것이며, 솔직히 말해 우리가 애초에 왜 기술을 만드는지 다시금 상기시켜 주는 그런 이야기입니다.

공동 창업자 중 한 명인 마렉은 이미 주요 에드테크 플랫폼인 블랙보드(Blackboard)에 비디오 스트리밍 기술을 매각하며 성공적인 엑시트를 경험한 바 있습니다. 그는 편안하게 은퇴할 수도 있었습니다. 하지만 그는 요양원에 계신 할머니를 계속 떠올렸습니다. 가족과는 멀리 떨어져 있고, 가끔 방문하거나 과로에 시달리는 직원들과 나누는 짧은 대화 외에는 교류가 거의 없는 할머니의 모습이었습니다. 그 이미지는 그를 괴롭혔습니다. 풍요로운 삶을 살아온 이 여성이 이제 정신적, 정서적 자극이 거의 없는 상태로 시들어가고 있다는 사실이 말이죠.

“이 문제에 대해 인간적인 해결책뿐만 아니라 기술적인 해결책도 있을지 궁금하네요,” 마렉은 생각했습니다. 지금 우리가 겪고 있는 AI 붐이 일어나기 훨씬 전인 약 5년 전에 심어진 그 아이디어의 씨앗이 바로 트룰리언스(Trulience)가 되었습니다.

이 창업 배경에서 가장 인상적인 점은 전체 미션을 어떻게 정의했는지다. “어떻게 더 나은 아바타를 만들까”가 아니라 “AI에 얼굴과 몸을 부여해 더 인간답게 만들 방법은 무엇일까”라는 질문이었다. 미묘하지만 결정적인 차이이다. 기술이 인간 간의 연결을 위해 존재하는 것이지, 그 반대가 아니다.

초창기의 고된 작업

리처드가 그 초창기 시절을 묘사할 때, 나는 공감이 가며 웃음을 참을 수 없었다. 우리 둘 다 이 분야에 오래 몸담아 왔기에, 아바타를 활용한 XR 경험을 구축할 때 거대한 360도 캡처 케이지가 필요했던 시절을 기억하고 있다. 피사체를 모든 각도에서 둘러싸도록 카메라 배열을 배치하는 리그 구조 말이다.

“거창한 스튜디오 구축, 무거운 장비 운반, 서라운드 카메라로 가득 찬 360도 캡처 케이지, 그리고 빡빡한 촬영 일정,” 리처드가 회상했다. 꽤 기초적인 아바타 하나를 만드는 데만도 막대한 초기 투자가 필요했다. 어떤 각도에서든 현실적인 움직임을 구현할 수 있을 만큼 충분한 촬영 자료를 확보하기 위해, 가능한 모든 각도에서 피사체를 포착하는 데 며칠을 쏟아부어야 했다.

하지만 시각적인 과제는 전쟁의 절반에 불과했다. 더 큰 문제는? 이 아바타들이 실제로 대화를 나눌 수 있게 만드는 것이었다.

“우리는 아바타가 의미 있고 자연스럽게 대화할 수 있도록 만들려고 노력했습니다,” 리처드가 설명했습니다. “이제 대규모 언어 모델(LLM)과 그 위에 구축된 음성 AI 레이어가 폭발적으로 증가하면서, 우리는 선택의 폭이 너무 넓어 오히려 고민이 될 정도입니다. AI와 대화를 나눌 수 있고 그 흐름이 놀라울 정도로 자연스럽죠. 하지만 그 당시에는 꽤 까다로운 일이었습니다.”

리처드가 회사에 재직해 온 기간 동안만 해도 기술은 극적으로 진화했습니다. 그들은 캡처 케이지에서 모션 캡처 슈트(트래킹 도트가 가득한 그 검은 슈트 말입니다)로 넘어갔고, 언리얼 엔진 기반 개발에서 더 효율적인 기법으로 전환했습니다. 특히 지난 6개월 동안 발전 속도는 놀라울 정도였습니다. 리처드는 이 기술에 대한 수요가 폭발적으로 증가한 이유가 바로 제품이 마침내 실제 적용이 가능한 성숙 단계에 도달했기 때문이라고 지적했습니다.

아키텍처: ‘자신의 두뇌’를 가져오기

여기서부터 기술적으로 흥미로운 부분이 시작됩니다. 트룰리언스(Trulience)는 제가 보기에 정말 훌륭한 아키텍처적 결정을 내렸습니다. 그들은 전체 스택을 독점하려 하지 않습니다. 대신, 자신들을 시각적 프론트엔드(얼굴과 몸)로 포지셔닝하고, 고객들이 ‘자신의 두뇌’를 가져오도록 허용하는 것입니다.

“우리는 대규모 언어 모델(LLM)과 음성 AI 거대 기업들의 어깨 위에 서 있습니다,”라고 리처드는 설명했습니다. “어떤 언어 모델이든, 어떤 음성 AI 기술이든 연결할 수 있으며, 우리는 서로 잘 어우러지는 조합을 찾기 위해 다양한 조합을 실험합니다.”

이러한 모듈식 구조 덕분에 트룰리언스는 자신들이 가장 잘하는 일, 즉 초현실적인 인간 아바타나 캐릭터(상표권이 없는 미키 마우스나 푹신한 강아지 같은 것)를 만드는 데 집중할 수 있으며, 대화 계층에는 최고 수준의 AI 모델을 활용할 수 있습니다. 그들은 다양한 언어 모델, 서로 다른 호스팅 옵션(사설 또는 공용), 그리고 여러 버전을 조합해 실험하며 최적의 조합을 찾습니다. 음성 측면에서는 지연 시간을 최소화하고 자연스러움을 극대화하기 위해 다양한 음성-텍스트 변환 및 텍스트-음성 변환 솔루션을 테스트합니다.

하지만 리처드가 공유한 흥미로운 사실이 하나 있습니다. 바로 ‘너무 빠른 것’도 문제라는 점입니다. 그들은 음성-음성 기술을 통합했는데, 테스트를 통해 약 500밀리초 미만의 응답 속도는 인간에게 이상할 정도로 즉각적으로 느껴진다는 사실을 발견했습니다. 실제 인간 대화에는 자연스러운 멈춤이 있기 때문에, 이는 환상을 깨뜨립니다. 우리는 정보를 처리하고, 예측 기계와 대화하는 것이 아니라 실제로 내 말을 듣고 있다는 느낌을 받기 위해 그 짧은 멈춤이 필요합니다.

“우리는 필요한 만큼 빠르다는 지점에 도달했습니다. 필요한 것보다 더 빠르죠,”라고 리처드는 말했습니다. 시스템을 의도적으로 늦춰 더 인간적인 느낌을 주려는 것은 즐거운 고민입니다.

90%의 문제: 립싱크

더빙이 엉성한 외국 영화를 본 적이 있다면, 입모양과 대사가 맞지 않을 때 얼마나 어색한지 잘 알 것이다. 뇌는 어쩔 수 없이 그 부분에 집중하게 되고, 이는 콘텐츠에 몰입하는 능력을 저해한다. AI 아바타의 경우 립싱크는 훨씬 더 중요할 뿐만 아니라 기하급수적으로 더 복잡해진다.

“립싱크와 입 모양이 전체의 90%를 차지한다고 할 수 있죠,”라고 제가 말하자 리처드는 즉시 동의했습니다. “립싱크가 조금이라도 어긋나는 순간, 마법은 깨져버립니다.”

기술적 난관은 엄청납니다. 소리에 따라 입 모양이 달라지는데, 업계에서는 이를 ‘비세임(visemes)’이라고 부릅니다. ‘m’ 소리는 입술을 오므려야 하고, ‘O’ 소리는 입술을 둥글게 벌려야 합니다. “th”는 혀를 이빨 사이에 넣어야 합니다. 이제 각기 고유한 음소와 입 모양을 가진 수십 개의 언어로 이를 확대해 보세요. 아랍어, 힌디어, 중국어 — 각 언어는 새로운 난제를 안겨줍니다.

트룰리언스(Trulience)에는 립싱크와 입 모양에만 전념하는 전담 팀이 있습니다. 화려한 일은 아니지만, 절대적으로 필수적인 작업입니다. 제가 본 그들의 모든 아바타가 그 환상을 유지하는 이유는, 이 기초적인 요소를 제대로 구현하는 데 투자했기 때문입니다.

다국어 지원을 위해 트룰리언스는 현명한 접근 방식을 취합니다. 즉, 이미 존재하는 것을 다시 만들지 않는 것입니다. 언어 감지와 번역은 주로 제3자 제공업체를 통해 LLM(대규모 언어 모델) 계층에서 이루어집니다. 트룰리언스는 대화에 필요한 어떤 언어든 아바타가 입 모양을 정확하게 표현할 수 있도록 하는 데 집중합니다. 이는 모든 것을 자체 개발하기보다 각 업무에 가장 적합한 도구를 통합하는 그들의 모듈식 철학을 보여주는 또 다른 사례입니다.

실제 영향: 데모를 넘어

기술은 그것이 해결하는 문제의 가치만큼만 의미가 있습니다. 그렇다면 이러한 대화형 아바타들은 실제로 어디에서 변화를 만들어내고 있을까요?

리처드는 제 마음에 깊이 남는 이야기를 들려주었습니다. 바로 문맹 인구를 대상으로 한 인도의 의료 프로젝트였습니다. 많은 농촌 지역에서 문해력은 의료 서비스를 포함한 각종 서비스 이용에 있어 여전히 큰 장벽으로 남아 있습니다. 텍스트 기반 인터페이스는 무용지물입니다. 글을 읽거나 숫자를 세는 데 어려움이 있다면, 번호를 누르는 방식의 전화 안내 시스템조차 제대로 작동하지 않습니다.

“우리는 인도에서 아바타를 통해 문맹 사용자들이 자연어를 사용해 의료 서비스를 이용할 수 있게 하는 프로젝트를 진행했습니다,”라고 리처드는 설명했습니다. 아바타는 사용자의 현지 언어로 말을 걸며 질문을 하고, 대화 형식으로 절차를 안내합니다. 사용자는 자연스럽게 응답하고, 아바타는 이를 이해하고 상황에 맞게 대응합니다. 읽을 줄 알 필요도 없고, 복잡한 탐색 과정도 필요 없습니다. 그저 사람 간의 대화일 뿐입니다.

이는 틈새 시장용 사례가 아닙니다. 문해력을 전제로 하는 기술로 인해 체계적으로 배제되어 온 인구 집단이 필수 서비스에 접근할 수 있도록 민주화하는 것을 이야기하는 것입니다.

이러한 활용 사례는 다양한 산업 분야로 확대되고 있습니다. 전자상거래 기업들은 고객 온보딩을 위해 아바타를 도입하여, 기존의 양식 기반 프로세스를 대화형 경험으로 대체하고 있습니다. 사용자는 양식 입력란을 한 번도 보지 않고도 질문을 하고, 설명을 듣고, 복잡한 워크플로를 완료할 수 있습니다. 아바타가 자연스럽게 안내해 주기 때문입니다.

코칭 및 자기계발 분야 역시 아바타가 크게 확산되고 있는 분야입니다. 수천 명의 고객과 동시에 소통하면서도 각자에게 맞춤형 관심을 줄 수 있는 피트니스 코치나 비즈니스 멘토를 상상해 보세요. 전문가는 자신의 지식과 성격을 한 번만 기록하면, 아바타가 그 전문성을 확장 가능한 형태로 구현해 줍니다.

리처드는 “전문 지식에 대한 접근을 민주화하고 코치 및 창작자들의 시간을 확보해 주는 아바타의 잠재력”이 엄청나다고 언급했습니다. 리더십 코치는 월 1만 달러의 비용을 감당할 수 있는 최고 경영진과 일할 수 있고, 아바타는 월 99달러 요금제를 담당함으로써 중소기업 소유주와 창업가들도 동일한 전문 지식을 이용할 수 있게 해줍니다. 전문가는 잠자는 동안에도 수익을 창출하고, 더 많은 사람들이 전문가의 가용 시간에 제한받지 않고 지식을 활용할 수 있게 됩니다.

고객 서비스는 아마도 가장 명백한 적용 분야일 뿐만 아니라 가장 영향력 있는 분야 중 하나일 것입니다. 고객은 전화 안내 시스템이나 채팅 인터페이스를 거치는 대신, 자신의 계정을 확인하고 이력을 파악하며 실제로 문제를 해결할 수 있는 아바타와 소통합니다. 아바타는 무한한 인내심을 가지고 있으며, 기분이 나쁜 날도 없고, 같은 질문을 만 번째로 받아도 처음과 같은 열정으로 처리할 수 있습니다.

경쟁 우위: 클라이언트 측 렌더링

기술 창업가라면 누구나 자사의 차별화 요소에 대해 이야기하는 것을 좋아하는데, 리처드에게 트룰리언스(Trulience)의 차별점이 무엇인지 물었을 때 그의 대답은 즉각적이었습니다. 바로 '클라이언트 측 렌더링'이었습니다.

“우리의 핵심 차별화 요소는 아바타의 클라이언트 측 렌더링으로, 이를 통해 플랫폼을 경쟁사보다 훨씬 저렴하고 확장성 있게 만들 수 있습니다.”라고 리처드는 설명했습니다. 이는 매우 중요한 사항이며 자세히 살펴볼 가치가 있습니다.

대부분의 아바타 플랫폼은 서버 측 렌더링을 사용하는데, 이는 비디오의 모든 프레임이 회사 서버에서 생성되어 사용자에게 스트리밍된다는 것을 의미한다. 이 방식은 막대한 컴퓨팅 자원을 필요로 한다. 눈 깜빡임, 입술 움직임, 미묘한 표정 하나하나를 렌더링하기 위해 고성능 GPU가 끊임없이 작동하는 모습을 상상해 보라. 비용은 사용량에 비례하여 증가한다. 사용자가 늘어나면 서버, GPU, 인프라가 더 많이 필요해진다.

트룰리언스는 이 모델을 뒤집었습니다. 그들은 사용자의 기기(휴대폰, 노트북, 브라우저)에서 아바타를 렌더링합니다. 아바타 데이터와 명령어는 효율적으로 전송할 수 있을 만큼 작으며, 최신 기기들은 로컬에서 렌더링을 처리할 만큼 충분히 강력합니다. 비용 절감 효과는 엄청납니다. 트룰리언스는 새로운 사용자가 생길 때마다 서버 인프라를 확장하는 대신, 이미 사용자들의 손에 있는 수십억 대의 기기를 활용합니다.

이는 확장성 측면에서 엄청난 의미를 갖습니다. 경쟁사는 아바타 상호작용 1분당 X달러를 지불할 수 있습니다. 트룰리언스는 계산 부담을 떠안지 않기 때문에 그보다 훨씬 적은 비용만 지불합니다. 따라서 더 경쟁력 있는 가격, 더 높은 마진, 혹은 두 가지를 모두 제공할 수 있습니다.

이러한 아키텍처 설계는 지연 시간과 안정성도 개선합니다. 데이터가 멀리 떨어진 서버까지 왕복할 필요가 없습니다. 렌더링은 로컬에서 이루어지므로 응답 시간이 빨라지고 장애 지점이 줄어듭니다. 인터넷 연결에 문제가 생겨도 아바타는 사용자의 기기에서 실행되므로 계속 작동합니다.

경쟁이 치열한 시장에서 앞서 나가기

아바타 시장은 점점 더 혼잡해지고 있습니다. 매주 새로운 기업들이 등장하며, 모두 차세대 인간-AI 상호작용을 약속합니다. 그렇다면 Trulience와 같은 기업은 어떻게 경쟁 우위를 유지할 수 있을까요?

“우리는 고객 성공, 신뢰할 수 있는 파트너, 그리고 탄탄한 제품 전략에 집중합니다,”라고 리처드는 말했습니다. 단순해 보이며, 거의 너무 단순해 보일 정도입니다. 하지만 그들의 운영 방식을 지켜보면 그 말이 납득이 갑니다.

고객 성공이란 단순히 계약을 성사시키는 것보다 실제 배포와 결과에 집착하는 것을 의미합니다. 그들은 초기 고객과 긴밀히 협력하여 무엇이 잘 작동하고, 무엇이 문제가 되며, 어떤 기능이 실제로 성과를 내는지 파악합니다. 이러한 피드백 루프는 제품 개발에 반영되어, 이론적인 사용 사례가 아닌 실제 필요에 맞춰 제품을 구축하도록 보장합니다.

신뢰할 수 있는 파트너가 중요한 이유는, 앞서 논의했듯이 트룰리언스가 전체 스택을 독점하려 하지 않기 때문입니다. 그들의 성공은 최고 수준의 대규모 언어 모델(LLM), 음성 AI 제공업체 및 기타 인프라와 원활하게 통합하는 데 달려 있습니다. 파트너를 신중하게 선택하고 그 관계를 유지함으로써, 개별 구성 요소가 진화하더라도 종단 간(end-to-end) 경험이 견고하게 유지됩니다.

제품 전략은 결국 집중력에 달려 있습니다. “우리는 초점을 점점 좁혀가는 기간이 필요합니다,”라고 리처드는 인정했습니다. “고전적인 사고방식이자 ‘chasm(격차)을 건너기’ 이론은 항상 ‘폭은 1인치, 깊이는 1마일’을 추구합니다. 교두보를 선정해 완벽하게 공략하고 한 분야에서 지배력을 확보해야 합니다. 그러면 더 강력한 역량으로, 더 수월하게 다른 분야를 공략할 자격을 얻게 됩니다.”

이는 성장 리더의 성숙한 사고방식입니다. 뜨거운 시장에서는 모든 기회를 쫓고, 모든 사람에게 모든 것을 제공하려는 유혹이 있습니다. 하지만 그렇게 하면 기업은 방향을 잃게 됩니다. 한 분야를 장악하는 편이 낫습니다. 가치를 입증하고, 사례 연구를 구축하며, 반복 가능한 프로세스를 만든 다음, 그 강점을 바탕으로 확장하는 것이죠.

유연한 통합: 노코드에서 완전한 제어까지

제가 항상 묻는 질문이 하나 있습니다. 개발자들은 실제로 이 기술을 어떻게 통합할까요? 이 답변은 누가 여러분의 플랫폼으로 구축할 수 있는지를 결정하기 때문에 중요합니다.

Trulience는 모든 범위를 지원합니다. 한쪽 끝에서는 노코드 도구를 제공합니다. 기술적 지식이 없는 팀도 드래그 앤 드롭 인터페이스를 통해 아바타 경험을 구축할 수 있게 해줍니다. 마케팅 팀은 엔지니어링 티켓을 제출하지 않고도 고객 서비스 아바타를 만들 수 있습니다. 제품 관리자는 코드 한 줄도 작성하지 않고 대화 흐름을 프로토타이핑할 수 있습니다.

반면, 더 깊은 제어가 필요한 개발자를 위해 포괄적인 API와 SDK를 제공합니다. 프로그래밍 방식으로 아바타의 외관을 커스터마이징하고 싶으신가요? 이를 위한 API가 있습니다. 대화 흐름에 사용자 정의 로직을 삽입해야 하나요? 가능합니다. 기존 사용자 인증 및 데이터 시스템과 통합하고 싶으신가요? 완벽하게 지원됩니다.

“드래그 앤 드롭 도구부터 심층적인 제어를 위한 API 및 SDK에 이르기까지, 노코드 방식과 개발자 친화적인 통합을 모두 지원합니다,”라고 리처드는 설명했습니다. 이러한 유연성 덕분에 Trulience는 전담 엔지니어링 팀을 보유한 대기업은 물론, 제한된 기술 자원으로 신속하게 움직여야 하는 소규모 기업 모두에게 서비스를 제공할 수 있습니다.

이러한 철학은 “자신의 두뇌를 가져오라(bring your own brain)”는 접근 방식을 반영합니다. 즉, 사람들에게 도구를 제공하고 방해하지 않는 것입니다. 일부 고객은 제공되는 기능을 그대로 사용할 것이고, 다른 고객은 광범위하게 맞춤화할 것입니다. 두 가지 모두 타당하며, 모두 지원됩니다.

윤리, 어린이, 그리고 책임감 있는 AI

부모로서 리처드는 AI 아바타의 윤리에 대해 독특한 관점을 제시합니다. 우리는 인간과의 상호작용을 설득력 있게 흉내 낼 수 있는 기술을 개발할 때 따르는 책임에 대해 이야기를 나누었습니다.

“부모이자 옹호자로서, 저는 윤리적인 AI 개발과 아바타의 투명성이 중요하다고 강조합니다,”라고 리처드는 말했습니다. 이는 단순한 기업의 사회적 책임 쇼가 아닙니다. 아이들이 상호작용하게 될 기술을 개발할 때는 그 책임이 매우 큽니다.

투명성은 매우 중요합니다. 사용자는 자신이 사람과 대화하는 것이 아니라 AI 아바타와 대화하고 있다는 사실을 알아야 합니다. 이는 당연해 보이지만, 실제로는 신중한 설계 선택이 필요합니다. 시각적 표시, 명확한 라벨링, 그리고 명시적인 공개가 모두 중요합니다. 목표는 사람들이 사람과 대화하고 있다고 믿게 속이는 것이 아니라, 그것이 무엇인지에 대해 솔직함을 유지하면서도 자연스럽게 느껴지는 인터페이스를 만드는 것입니다.

특히 어린이의 경우 고려해야 할 사항이 훨씬 더 많아집니다. 아이들은 더 쉽게 영향을 받고, 현실과 시뮬레이션을 구분하는 능력이 떨어지며, 조작에 더 취약합니다. 리처드는 아이들이 기술의 혜택을 누릴 수 있도록 하면서도 보호해 줄 수 있는 연령에 적합한 경험, 부모 통제 기능, 콘텐츠 제한을 주장합니다.

데이터 프라이버시 문제도 있습니다. 아바타 대화는 사용자의 우려, 질문, 감정 상태 등 풍부한 데이터 세트를 생성합니다. 이 데이터는 가치 있지만 민감한 정보입니다. 책임감 있는 플랫폼은 강력한 개인정보 보호 조치, 명확한 데이터 정책, 그리고 진정한 사용자 동의를 갖추어야 합니다.

업계는 아직 이 문제를 해결해 나가는 중이지만, 스캔들이 터져 대화가 불가피해진 뒤에야 대처하기보다 지금부터 이러한 문제들을 고민하고 있는 트루리언스(Trulience)의 태도가 마음에 듭니다.

페이팔(PayPal)의 순간

우리 대화에서 가장 기억에 남는 순간 중 하나는 리처드가 현재의 아바타 도입 현황을 온라인 결제의 초기 시절과 비교했을 때였습니다.

“사실 페이팔 이전 시대에 온라인 결제가 사람들의 머릿속에 자리 잡았던 위치와 현재 온라인 결제가 차지하는 위치를 비교해 보면, 우리는 지금 인간-컴퓨터, 인간-아바타 상호작용 측면에서 일종의 ‘페이팔 이전 시대’에 있습니다,”라고 그는 말했습니다.

이 비유를 한번 생각해 보십시오. 1990년대 후반, 웹사이트에 신용카드 번호를 입력하는 것은 위험하고, 거의 어리석게 느껴졌습니다. 사람들은 온라인 사기를 몹시 두려워했습니다. 온라인 거래의 위험을 감수하기보다는 차라리 차를 몰고 가게에 가곤 했습니다. 은행과 상인들은 보안 및 사기 방지 방안을 제대로 마련하지 못했습니다. 전체 생태계가 미성숙한 상태였습니다.

그러다 페이팔이 등장했습니다. 보안이 완벽해서가 아니라(사실 완벽하지 않았습니다), 온라인 결제가 충분히 안전하고 편리하며 보편적으로 느껴지게 만들어 사람들이 시도해 볼 용기를 갖게 했기 때문입니다. 일단 시도해 보고 잘 되자, 그 행동은 일상화되었습니다. 오늘날 우리는 온라인 결제를 할 때 두 번 생각하지 않습니다. 우리는 결제 정보를 어디에나 저장해 둡니다. 위험이 사라진 것은 아니지만, 우리의 편안함 수준은 근본적으로 바뀌었습니다.

우리는 지금 AI 아바타와 관련해 페이팔 등장 전의 그 시점에 있습니다. 어떤 사람들에게는 이 기술이 너무 새롭기 때문에 재미있으며, 호기심을 자극하는 장난감처럼 느껴집니다. 다른 사람들에게는 무섭거나 거부감을 줍니다. “세상에는 이런 기술이 존재한다는 사실조차 모르는 사람들이 아주 많습니다,”라고 리처드는 언급했다.

하지만 사람들이 ChatGPT나 유사한 인터페이스를 통해 대규모 언어 모델(LLM)을 경험하게 되면서, AI 대화에 대한 편안함을 키워가고 있다. 얼굴과 몸을 더하는 것은 논리적인 다음 단계다. 상호작용은 더 자연스럽고, 더 몰입감 있으며, 더 인간다워진다. 그리고 온라인 결제와 마찬가지로, 일단 사람들이 시도해 보고 잘 작동하면 그 행동은 일상화될 것이다.

“사람들은 필연적으로 LLM과의 상호작용에 익숙해질 것입니다. 이미 ChatGPT를 통해 그러하고 있죠. 하지만 휴머노이드나 아바타와의 상호작용으로 나아가는 것이 바로 사람들이 향할 방향입니다,”라고 리처드는 예측했다.

나는 그가 옳다고 생각한다. 우리는 인간-컴퓨터 상호작용의 근본적인 변화를 목격하고 있으며, 아직 초기 단계라 이 분야에서 개발자와 기업들이 그 진화 과정에 막대한 영향을 미칠 수 있을 것이다.

예상치 못한 열정: 기억력과 뉴로피드백

저는 게스트들에게 항상 현재 맡고 있는 역할이 아니었다면 AI의 어떤 분야를 탐구하고 싶었는지 묻곤 합니다. 리처드의 대답은 저를 완전히 놀라게 했습니다.

“저는 인간의 기억 발달 분야를 전공했습니다. 그래서 예전에는 기억력 대회 같은 것들에 푹 빠져 지내기도 했죠,”라고 그는 말했습니다. 기억력 대회라니 — 카드 한 덱을 외우거나 파이(π)를 수천 자리까지 읊는 사람들이 하는 대회 말이다.

하지만 더 흥미로운 이야기가 있다. 리처드는 신경피드백과 관련된 프로젝트도 진행했다. 신경피드백이란 감정 상태를 읽어내고 실시간으로 오디오를 생성하는 비침습적 뇌-컴퓨터 인터페이스다. 목표는 뇌 신호가 서로 다른 오디오 출력과 연동되도록 하여, 다양한 감정 상태를 제어하고 탐색함으로써 오디오 풍경을 누비는 것이었다.

“정말 멋지고, 진행하기 정말 재미있었어요,” 리처드는 진심 어린 열정을 담아 말했다. “아마도 앞으로도 그 분야에서 무언가를 하며 시간을 보낼 것 같아요.”

그는 가장 문자 그대로의 의미에서 인간-컴퓨터 상호작용의 최전선에서 살아가는 사람이다. 뇌 신호를 이용해 컴퓨터를 제어하고, 기억이 작동하는 방식을 탐구하며, 이제는 AI에 인간의 얼굴을 부여하고 있다. 이러한 관심사들이 하나로 모이는 것은 당연하다. 이 모든 것은 기술을 더 인간적이고, 더 직관적이며, 더 자연스럽게 만드는 것에 관한 것이기 때문이다.

“바로 최전선이 제 행복의 장소예요. 그 경계선에서 기상천외한 일들을 해내는 거죠,” 리처드가 웃으며 말했다.

미래를 내다보며

대화가 마무리될 무렵, 나는 이 기술이 가져올 더 광범위한 영향에 대해 생각하게 되었다. 우리는 단순히 더 예쁜 챗봇을 만드는 것이 아니다. 우리는 인간과 AI가 상호작용하는 방식을 근본적으로 바꾸고 있으며, 그 변화는 교육, 의료, 상업, 엔터테인먼트, 접근성 등 모든 분야에 연쇄적인 영향을 미치고 있다.

트룰리언스가 구축 중인 기술은 최종 목표가 아닙니다. 리처드는 이 점을 분명히 했습니다. “기초적인 수준에서 시각적 초현실주의 측면에서 더 할 일이 그리 많지는 않다고 봅니다. 입모양 동기화 같은 미묘한 부분들이 있긴 하죠. 하지만 이제 진짜로 중요한 건 확장하는 겁니다. 널리 보급하고 채택을 촉진하는 것이죠.”

제품은 준비되었습니다. 이제 문제는 도입과 확산입니다. 얼리 어답터와 개념 증명(PoC) 단계에서 어떻게 주류 시장으로 나아갈 수 있을까요? 신뢰를 쌓고 정당한 우려를 해소하면서 시장의 가능성을 어떻게 알릴 수 있을까요?

이 글을 읽고 있는 개발자 여러분에게 기회는 분명합니다. 인프라는 성숙해가고 있으며, API도 존재하고, 활용 사례도 입증되었습니다. 몇 년 뒤가 아니라 오늘 바로 아바타 경험을 구축하기 시작할 수 있습니다. 지금 매력적인 응용 프로그램을 찾아내는 기업과 개발자들은 상당한 선점 효과를 누리게 될 것입니다.

그 외 모든 분들께 전하는 메시지는 더 간단합니다. 이 기술은 더 이상 공상과학 소설 속 이야기가 아닙니다. 현실이며, 이미 이용 가능하며, 여러분이 매일 접하는 곳에서 모습을 드러내기 시작했습니다. 보험 상품을 선택하는 데 도움을 주는 그 아바타? Trulience와 같은 기술이 뒷받침하고 있습니다. 24시간 내내 이용 가능한 개인 코치도 마찬가지입니다. 여러분의 학습 스타일에 맞춰 조정되는 교육 튜터는요? 짐작하셨겠지만, 바로 그 기술입니다.

우리는 AI에 얼굴을 부여하고 있으며, 이를 통해 기술을 더욱 인간적으로 만들고 있습니다. 이는 추구할 가치가 있는 진보라고 생각합니다.

리처드와의 대담 전체를 시청해 보세요:

Trulience의 기술은 trulience.com에서 직접 체험해 보시고, 미리 제작된 아바타와 상호작용해 보실 수 있습니다. Agora의 대화형 AI 인프라를 활용한 개발이 관심 있는 개발자분들은 agora.io를 방문하여, 당사의 실시간 커뮤니케이션 플랫폼이 이러한 몰입형 경험을 어떻게 구현하는지 확인해 보시기 바랍니다.

‍

Learn more about Agora's video and voice solutions

Ready to chat through your real-time video and voice needs? We're here to help! Current Twilio customers get up to 2 months FREE.

Complete the form, and one of our experts will be in touch.

Try Agora for Free

Try for Free

열

앱 빌더

유연한 강의실

SDK 다운로드

지원 계획 및 가격