Back to Blog

아이디어에서 AI 앱까지: Dify가 AI 개발을 어떻게 간소화하는가

저는 최근 아시아 전역을 자주 오가며, AI 붐의 이면을 지탱하는 인프라를 구축하는 사람들을 만나고 있습니다. 대부분의 대화는 모델, 벤치마크, 지연 시간에 집중되어 있습니다. 하지만 도쿄에서 양용러(Yongle Yang)와 나눈 대화는 조금 달랐고, 어쩌면 더 중요한 주제를 다뤘습니다. 바로 누가 실제로 AI 애플리케이션을 개발할 수 있는지, 그리고 그들의 앞길을 가로막는 장애물은 무엇인지에 대한 이야기였습니다.

양 씨는 Dify의 솔루션 아키텍트이며, 그가 추구하는 해답은 간단명료하다. 바로 ‘누구나 해야 한다’는 것이다. 이러한 신념은 현재 수천 명의 개발자와 비개발자가 AI 제품을 출시하는 방식을 변화시키고 있다.

AI를 구현 가능한 기술로 만들기 - 플랫폼의 철학

양은 Dify를 단순한 도구로 묘사하지 않는다. 그는 이를 ‘무언가를 만들어가는 방식’이라고 설명한다. 이름에서 알 수 있듯이—‘Do It For Yourself(직접 해보자)’—이는 직접 손을 더럽혀봐야 비로소 무언가를 이해할 수 있다는 CEO의 신념에서 비롯된 것이다. 이러한 철학은 단순한 브랜딩이 아니다. 이는 플랫폼의 모든 기능에 깔려 있는 설계 원칙이다.

Dify는 프롬프트, 지식베이스, 컨텍스트, 코드 로직, API 통합, 모니터링 등 프로덕션급 AI 애플리케이션을 구축하는 데 필요한 모든 구성 요소를 한곳에 모아주는 LLM 운영(Ops) 플랫폼입니다. 하지만 이는 단순히 편의성만을 위한 것이 아닙니다.

오늘날 대부분의 기업에서 AI 도입의 가장 큰 걸림돌은 인재나 예산이 아닙니다. 바로 기술적 온보딩입니다. “기업들은 어떤 형태의 AI 활용이든 기술적 온보딩을 진행하는 데 정말 큰 어려움을 겪고 있습니다,”라고 양은 말했다. 그의 해결책은 간단하다. “Dify를 사용해 AI 챗봇을 구축하는 데 필요한 내용을 누구에게든 10분 만에 가르쳐 드릴 수 있습니다.” 이는 단순한 영업 구호가 아니다. 이는 그가 이 지역 전역의 고객사들을 통해 반복적으로 목격해 온 현상이다.

AI 개발이 복잡하게 느껴진다면, 잘못된 계층을 보고 있는 것입니다

Dify의 핵심은 워크플로 캔버스입니다. 이는 개발자가 노드를 연결하여 정교한 AI 파이프라인을 구축할 수 있는 시각적 인터페이스입니다. 각 노드는 HTTP 요청, Python 또는 JavaScript 실행, 대규모 언어 모델(LLM) 상호작용, 지식베이스 쿼리 등 특정 기능을 처리합니다. 복잡한 인프라 지식이 필요하지 않습니다.

그렇다면 개발자는 실제로 무엇을 고려해야 할까요?

양 씨는 “그들은 단지 프로젝트의 전체적인 그림만 신경 쓰면 됩니다”라고 말했다. 구성 요소들은 자동으로 처리됩니다. 그리고 더 나아가고자 하는 팀들을 위해, Dify의 마켓플레이스는 마이크로소프트와 구글부터 아고라(Agora)의 대화형 AI 엔진과 같은 플랫폼에 이르기까지 모든 타사 도구와 안전하고 안정적인 API 연동을 가능하게 합니다. 양 씨는 우리와의 대화가 오갔던 주간에 직접 이 엔진을 테스트해 보기도 했습니다.

그의 평가는 직설적이었습니다. “Dify 내에서 TTS 및 STT 상호작용을 직접 구축하는 것과 비교하면, Agora 통합은 차원이 다릅니다. 5분 만에 비공개 정보를 활용한 실시간 챗봇을 만들었는데, 모바일과 데스크톱 모두에서 원활하게 작동하며 모든 것이 빠르고 정확합니다.”

단일 에이전트 대 다중 에이전트: 아키텍처의 문제

이번 대화에서 가장 실용적인 부분 중 하나는 양 씨가 에이전트 설계에 대해 밝힌 견해였는데, 이는 대규모 언어 모델(LLM)을 활용해 개발하는 모든 개발자가 결국 마주치게 되는 문제다. 그의 답변은 분명했다. 그는 다중 에이전트 방식을 신봉하는 사람이다.

차라리 스마트 에이전트 하나만 만들어서 끝내면 어떨까요?

“사무 보조가 필요하다면 다중 에이전트 시스템이 필요할 겁니다,”라고 그는 말했다. 그가 선호하는 아키텍처는 사용자의 의도를 해석하고 작업을 전문화된 하위 에이전트들에게 분배하는 마스터 에이전트를 사용합니다. 이메일 작성, 일정 관리, 데이터 검색을 각각 담당하는 하위 에이전트들이죠. 각 하위 에이전트는 특정 기능을 위해 설계되었으며 해당 기능에서 신뢰할 수 있습니다. 마스터 에이전트는 전체 조율을 담당합니다. Dify는 LLM의 자체 판단에 따라 동기화를 자동으로 처리합니다.

여기서 얻을 수 있는 통찰은 간단합니다. 단일 에이전트 시스템과 다중 에이전트 시스템은 서로 경쟁하는 개념이 아닙니다. 다중 에이전트 시스템은 단순히 단일 에이전트 개념을 확장하고 조정해 놓은 것에 불과합니다. 복잡성이 사라지는 것이 아니라, 추상화되어 숨겨질 뿐입니다. 개발자는 그저 워크플로를 정의하기만 하면 됩니다.

아이디어에서 제품까지 - 그냥 설명만 해주세요

이번 대화에서 가장 미래 지향적인 부분은 Dify의 향후 방향성에 대한 논의였다. 양은 현재 개발 중인 기능에 대해 설명했다. 바로 워크플로 프롬프트 IDE로, 개발자가 입력값과 원하는 출력값을 명시하며 자연어로 사용 사례를 입력하면, 완벽하게 구성된 워크플로 캔버스가 자동으로 생성되는 시스템이다. “사용 사례를 입력하기만 하면 모든 것이 하나로 통합됩니다. 바로 사용할 수 있는 완벽한 워크플로가 완성되는 것이죠.”

일정은 2~3개월 정도입니다. 만약 설명대로 출시된다면, 논의의 초점은 “이걸 어떻게 만들까”에서 “다음에는 무엇을 만들까”로 완전히 바뀌게 될 것입니다.

주목할 만한 다른 두 가지 신규 기능은 웹훅(Webhook) 및 트리거(Trigger) 지원으로, 이를 통해 외부 이벤트 발생 시 워크플로가 자동으로 실행될 수 있게 되며, 출시 첫날부터 더 많은 타사 통합 기능이 포함된 마켓플레이스의 지속적인 확장이 이루어질 예정입니다.

나를 대체할 AI를 개발하라

양 씨는 직관과는 달리 들릴 수도 있는 조언을 남기며 말을 마쳤는데, 곰곰이 생각해 보면 그렇지 않다는 것을 알게 된다.

“항상 자신을 대체할 수 있는 프로젝트를 만들려고 노력해야 합니다.”

자신의 업무 흐름에서 반복적이고 시간이 많이 소요되는 부분을 찾아보세요. 이를 처리할 수 있는 AI를 구축하세요. 모델이 발전함에 따라 여러분의 업무를 더 잘 수행하게 될 것입니다. 그러면 여러분은 더 창의적인 업무, 더 큰 영향력을 발휘할 수 있는 과제, 그리고 실제로 인간의 판단이 필요한 일로 업무의 수준을 높일 수 있습니다. 그런 다음 그 업무들 역시 자동화하세요.

이는 악순환의 고리이며, 바로 이러한 사고방식이 변화의 흐름을 앞서가는 개발자와 변화에 뒤늦게 대응하는 개발자를 가르는 기준이 됩니다.

이것 말고도 더 많은 내용이 있으니, 전체 대화를 확인해 보세요.

전체 대화를 시청하세요: https://www.youtube.com/watch?v=EoXAPh7HGCg

RTE Telehealth 2023
Join us for RTE Telehealth - a virtual webinar where we’ll explore how AI and AR/VR technologies are shaping the future of healthcare delivery.

Learn more about Agora's video and voice solutions

Ready to chat through your real-time video and voice needs? We're here to help! Current Twilio customers get up to 2 months FREE.

Complete the form, and one of our experts will be in touch.

Try Agora for Free

Sign up and start building! You don’t pay until you scale.
Try for Free