제품

실시간 번역베타

열악한 네트워크 조건과 시끄러운 환경에서도 사람의 음성을 이해하고 자연스럽게 반응할 수 있는 능력을 모든 AI 모델에 부여하세요.
Conversational AI Engine
지원되는 플랫폼
항목을 찾을 수 없습니다.
제품

대화형 AI 엔진

열악한 네트워크 조건과 시끄러운 환경에서도 사람의 음성을 이해하고 자연스럽게 반응할 수 있는 능력을 모든 AI 모델에 부여하세요.
Stylized glowing AI orb and a microphone icon labeled 'Your AI Agent'
지원되는 플랫폼
항목을 찾을 수 없습니다.
를 사용하여 건물을 짓는 고객
아고라와 오픈AI
grepp logoWYZE logokileon logokumu logoScaler logoParallel logoJorJin logoAnotherBall logoEllie logozigbang logo
grepp logoWYZE logokileon logokumu logoScaler logoParallel logoJorJin logoAnotherBall logoEllie logozigbang logo

모든 LLM으로 지연 시간이 짧은 AI 음성 에이전트 만들기

Conversation AI Engine - Any AI model, any voice

모든 AI 모델, 모든 음성

주요 LLM 제공업체부터 완전 맞춤형 모델까지 모든 AI 모델을 연결하고 텍스트 음성 변환(TTS) 서비스 및 음성을 선택할 수 있는 완벽한 유연성을 제공합니다.
AI 아바타 아이콘

대화형 AI 아바타

대화형 아바타를 지원하여 AI 에이전트에게 음성과 동기화되는 얼굴을 제공하여 더욱 매력적인 경험을 제공합니다.
Reduced response delay

응답 지연 감소

지연 시간이 매우 짧아 사용자와 AI 간의 대화 흐름이 더욱 자연스러워지며, 주요 LLM의 음성 모드보다 최대 3배 빠릅니다.
Intelligent interruption handling

지능적인 중단 처리

고급 음향 알고리즘을 통해 실시간 중단 처리가 가능하므로 음성 AI 에이전트는 사용자가 중단하거나 일시 중지를 요청하는 것을 인식하면 즉시 말을 멈출 수 있습니다.
Background noise suppression

배경 소음 억제

내장된 소음 억제 및 에코 제거 기능이 배경음과 소음 간섭을 차단하여 어떤 환경에서도 AI가 사람의 말을 명확하게 듣고 이해할 수 있도록 합니다.
Selective attention locking

선택적 주의 잠금

선택적 주의 알고리즘을 통해 AI가 주 화자에게만 집중할 수 있도록 하여 배경의 다른 화자로부터 방해 요소를 걸러냅니다.
한 번의 실시간 보기 다음과 같은 지표의 경우 가장 중요하죠
단일 대시보드를 사용하여 전 세계의 모든 활성 세션을 모니터링할 수 있습니다.가장 많이 사용되는 메트릭을 추적하세요. 동시 사용자 및 채널부터 네트워크 지연 시간 등에 이르기까지 여러분에게 중요합니다.

당신의 시야는 제한되지 않습니다.

대화형 화이트보드를 사용하면 맞춤형 브랜딩과 다양한 기능을 갖춘 협업 앱을 빠르게 구축할 수 있습니다.당사 플랫폼을 사용하면 맞춤화되고 매력적인 학습 환경을 쉽게 만들 수 있습니다.
  • 유연한 API는 사용자 지정 브랜딩과 광범위한 디지털 화이트보드 기능을 지원합니다.
  • 실시간 음성 및 영상 통화, 대화형 스트리밍 및 신호 처리를 쉽게 통합할 수 있습니다.
  • 파일을 미리 로드하고 공유하고 주석을 달아 사용자의 대역폭을 절약하고 모든 동적 콘텐츠를 보존할 수 있습니다.
또한 HIPAA, GDPR 및 CCPA 규정을 준수하므로 안심할 수 있습니다.

OpenAI의 실시간 API가 실제로 작동하는 모습을 확인해 보세요

자연스럽고 확장 가능한 음성 AI를 빠르게 구축하세요.

Make AI voice conversations more natural

AI 에이전트와 자연스러운 대화 지원

모든 AI 모델에 초저지연으로 사람의 음성을 명확하게 이해하고 응답하여 실제와 같은 대화를 할 수 있는 기능을 제공하세요. 내장된 중단 처리, AI 에코 제거 및 배경 소음 제거 기능은 어떤 환경에서도 정확한 음성 처리를 보장합니다.
Make AI voice conversations more natural

AI 에이전트와 자연스러운 대화 지원

Eliminate latency and scalability challenges

지연 시간 및 네트워크 문제 제거

지능형 라우팅 및 고급 최적화 기능을 갖춘 아고라의 글로벌 네트워크를 사용하여 지연 시간 및 패킷 손실로 인한 일반적인 문제를 방지하고 네트워크 상태가 좋지 않은 환경에서도 모든 디바이스에서 최적의 실시간 성능을 보장합니다.
Eliminate latency and scalability challenges

지연 시간 및 네트워크 문제 제거

Get to market faster

시장 출시 기간 단축

모든 디바이스 유형과 주요 개발 플랫폼을 지원하여 몇 분 안에 음성 AI 에이전트를 애플리케이션에 통합할 수 있습니다. 아고라의 기존 실시간 인프라를 활용하여 안정적이고 반응이 빠른 음성 AI 환경을 빠르게 배포하세요.
Get to market faster

시장 출시 기간 단축

다음에 대한 녹화 옵션:

클라우드 레코딩
클라우드에서 녹화물을 저장, 검색 및 공유할 수 있습니다.
문서로 이동
온프레미스 레코딩
보안 및 기밀 유지를 위해 로컬 서버에 저장합니다.
문서로 이동
웹 페이지 기록
전체 웹 브라우저 화면 경험을 기록합니다.
문서로 이동

아고라 미디어 서비스

Recording icon
레코딩
보관, 검토 또는 배포를 위해 오디오 스트림, 비디오 스트림 및 웹 페이지를 녹음합니다.
Live icon
미디어 게이트웨이
RTMP/SRT 프로토콜을 사용하여 미디어 스트림을 Agora 음성 및 비디오 채널로 직접 푸시하고 미디어 스트림에서 고급 트랜스코딩 처리를 활성화하여 배포를 용이하게 합니다.
Cloud Transcoding
Beta
Obtain audio and video source streams from hosts in RTC channels and perform transcoding, audio mixing, and video compositing.
Download icon
미디어 풀
라이브 또는 녹화된 비디오 및 오디오 콘텐츠를 가져와 Agora 채널에 직접 인제스트하여 Agora 세션에 참여도를 높이세요.
미디어 푸시
Agora 채널에서 CDN (콘텐츠 전송 네트워크) 으로 오디오 및 비디오 스트림을 푸시하여 하이브리드 참여 경험으로 시청자를 확장하세요.

퀵스타트 가이드

빠른 시작 안내서를 보고 Agora와 Open AI를 시작하고 실행하세요.

내 코드

아고라 SDK

유연한 SDK로 사용자 경험을 맞춤화 하세요
문서로 이동
항목을 찾을 수 없습니다.
내 코드

아고라 SDK

Agora의 Video SDK를 사용하여 최고의 유연성과 사용자 지정으로 실시간 비디오를 빌드하고 앱에 통합하세요.
문서로 이동
항목을 찾을 수 없습니다.
코드 없음

앱 빌더

Agora의 App Builder는 코드 없는 비주얼 디자이너를 사용하여 제품에 실시간 비디오를 제공하는 가장 빠르고 쉬운 방법입니다.
문서로 이동
로우 코드

아고라 UI 키트

로우 코드 UI Kit 라이브러리를 사용하여 단 몇 줄의 코드로 앱에 실시간 비디오를 추가할 수 있습니다.
문서로 이동
내 코드

아고라 SDK

유연한 SDK로 처음부터 경험을 맞춤화하세요.
항목을 찾을 수 없습니다.
문서로 이동
로우 코드

아고라 UI 키트

코드 수가 적은 UIKit 라이브러리와 함께 단 몇 줄의 코드를 사용하여 실시간 통신 및 스트리밍을 통합합니다.
문서로 이동

문서화

이 프로젝트는 Agora API 사용 방법을 이해하는 데 도움이 되는 일련의 API 예제를 제공합니다.
문서로 이동

Agora 콘솔에서 AI 노이즈 억제 확장 프로그램을 활성화합니다.

Activate the 대화형 AI 엔진 extension in the Agora Console.

내 코드

아고라 SDK

Build and integrate Live Streaming with the most flexibility and full customization using Agora's Video SDK.
항목을 찾을 수 없습니다.
문서로 이동
코드 없음

앱 빌더

Agora의 App Builder는 제품에 실시간 음성 채팅, 비디오 채팅 및 라이브 스트리밍을 추가하는 가장 빠르고 쉬운 방법입니다.
문서로 이동
내 코드

아고라 SDK

Agora의 Interactive Whiteboard SDK를 사용하여 최고의 유연성과 완전한 사용자 지정을 통해 실시간 시각적 협업 기능을 구축하고 애플리케이션에 통합하십시오.
항목을 찾을 수 없습니다.
문서로 이동
로우 코드

패스트보드

사전 구축된 UI와 사용자 지정 플러그인을 포함하는 기능을 사용하여 실시간 시각적 협업을 더 빠르게 구축할 수 있습니다.
지금 사용해보기
보안, 개인정보 보호 및 규정 준수
Agora는 ISO/IEC 27001, 27017, 27018, 27701 및 SOC 2 보안 표준 인증을 받았으며 GDPR, CCAP, COPPA 및 HIPAA와 같은 개인 정보 보호 규정을 준수합니다.Agora는 서비스 제공에 필요한 인터넷 프로토콜 (IP) 주소 및 운영 정보를 제외한 최종 사용자 데이터를 수집하거나 저장하지 않습니다.
ISO 27001:2022
ISO 27017:2015
ISO 27018:2019
ISO 27701:2019
히파아
GDPR
SOC2 유형 1&2
CCPA
코파
HOW TO INTEGRATE?
Streamlined 3-step integration process:
01
Activate Agora Conversational AI Engine
Unlock real-time Speech-to-Text (STT) and Text-to-Speech (TTS) capabilities, enabling seamless conversational interactions. 
02
Integrate Agora Edge Chip on Hardware
Optimize microphone, speaker, and system efficiency to ensure ultra-low-latency and high-fidelity conversations.
03
Deploy AI Voice Agents
Enable interactive, multilingual, and user-customized conversations for a wide range of IoT applications.

Integrated chipset and module

대화형 AI 기술을 Beken의 고성능 IoT 칩 모듈에 구축한 이 턴키 솔루션은 모든 커넥티드 장난감에 음성 AI를 쉽게 통합할 수 있도록 지원합니다.
“아고라의 대화형 AI 기술과 최적화된 AI 하드웨어를 통해 차세대 장난감은 자연스럽게 생각하고 반응하며 상호 작용할 수 있게 되었습니다. 주변 환경에 반응하고 사용자와 유창하게 상호작용할 수 있는 로봇과 장난감의 미래를 열게 되어 기대가 큽니다.”
펑페이 장
CEO, Riselink
사용 사례   

모든 애플리케이션에 AI 음성 인터랙션 추가

아고라의 대화형 AI 플랫폼은 산업 전반에 걸쳐 다양한 사용 사례를 지원합니다.
24/7 customer support 

연중무휴 고객 지원

일반적인 쿼리를 처리하고 문제를 해결하며 고객에게 프로세스를 안내할 수 있는 AI 기반 음성 에이전트로 24시간 연중무휴 지원을 제공하세요.
IoT

IoT

대화형 AI를 IoT 디바이스, 스마트 글래스, 시계 등에 원활하게 통합하세요. 언어 사용자 인터페이스(LUI)로 사용자 경험을 향상시키는 직관적인 핸즈프리 인터랙션을 구현할 수 있습니다.
Help customers find products, compare items, and make purchasing decisions. Provide suggestions and answer customer questions in real time.

가상 쇼핑 도우미

고객이 제품을 찾고, 상품을 비교하고, 구매 결정을 내릴 수 있도록 지원하세요. 제안을 제공하고 고객의 질문에 실시간으로 답변하세요.
AI를 사용하여 라이브 이벤트를 진행하여 시청자와 실시간으로 소통하고 자동화된 콘텐츠 조정 기능을 제공합니다.

라이브 AI 호스트

AI를 사용하여 라이브 이벤트를 진행하여 시청자와 실시간으로 소통하고 자동화된 콘텐츠 조정 기능을 제공합니다.
대화형 AI를 통해 고객의 이야기를 듣고 조언을 제공하며 필요한 경우 전문가에게 연결해 주는 정신 건강 지원을 제공하세요.

정신 건강 지원

대화형 AI를 통해 고객의 이야기를 듣고 조언을 제공하며 필요한 경우 전문가에게 연결해 주는 정신 건강 지원을 제공하세요.
코스 정보, 일정 관리 및 학업 리소스를 통해 학생들을 지원하세요. 대화형 온디맨드 튜터링 세션과 숙제 지원을 제공하세요.

라이브 튜터링

코스 정보, 일정 관리 및 학업 리소스를 통해 학생들을 지원하세요. 대화형 온디맨드 튜터링 세션과 숙제 지원을 제공하세요.
게이머가 실제와 같은 AI 캐릭터와 함께 게임을 플레이하고 소통할 수 있도록 지원하여 게임에 생동감을 불어넣으세요. AI 기반 NPC의 대화로 더욱 역동적이고 매력적인 게임 환경을 조성하세요.

AI 기반 플레이어 및 NPC

게이머가 실제와 같은 AI 캐릭터와 함께 게임을 플레이하고 소통할 수 있도록 지원하여 게임에 생동감을 불어넣으세요. AI 기반 NPC의 대화로 더욱 역동적이고 매력적인 게임 환경을 조성하세요.
신입 사원에게 온보딩 프로세스를 안내하고 질문에 답하고 필요한 리소스를 제공하세요.

직원 온보딩

신입 사원에게 온보딩 프로세스를 안내하고 질문에 답하고 필요한 리소스를 제공하세요.

Integrated chipset and module

로보포엣의 AI 반려 로봇인 퍼주는 아고라의 ConvoAI 디바이스 키트를 활용하여 실시간 정서적 지원과 개인화된 상호작용을 제공합니다.
“아고라의 AI 기술은 장난감과 로봇이 자연스럽고 매력적인 방식으로 상호 작용할 수 있게 해줍니다. 실시간 음성 처리, 감성 AI, 고급 음성 기능을 갖춘 아고라는 인간과 기계의 원활한 상호작용을 가능하게 하고 탁월한 성능과 안정성을 보장합니다.”
유나 팬
공동 창립자 겸 CTO, 로보포엣
Mouse cursor illustration

패스트보드

Agora의 인터랙티브 화이트보드를 최신 Fastboard SDK와 쉽게 구축하고 통합할 수 있습니다. 이 SDK는 사전 구축된 UI와 사용자 지정 플러그인을 포함하는 기능을 통해 동일한 화이트보드 기능을 제공합니다.
지금 사용해보기
항목을 찾을 수 없습니다.
대화형 AI 엔진에 미리
액세스하세요.
대기자 명단에 등록하여 아고라의 새로운 대화형 AI
엔진에 가장 먼저 액세스하세요.
추가 정보 요청하기
전문가와 연결하여 질문에 답하고, 요구 사항에 대해 논의하고, ConvoAI 디바이스 키트에 대한 자세한 내용을 확인하세요.

FAQs

What is Agora Voice Calling?

Agora Voice Calling is a real-time voice API that lets developers embed high-quality, ultra-low latency voice chat into any application. It supports one-to-one calls, group voice chat, and large-scale audio rooms across devices and platforms.

Which platforms does Agora Voice Calling support?

Agora Voice Calling supports Android, iOS, Web, Windows, Electron, Flutter, React Native, Unity, and Unreal Engine. This allows teams to build consistent voice experiences across mobile, web, desktop, and immersive environments.

How does Agora deliver HD audio quality with low latency?

Agora uses a 48 kHz sampling rate with full-bandwidth audio capture and intelligent routing over its global real-time network. This minimizes latency, jitter, and packet loss to deliver clear, stable voice calls—even on unstable networks.

Does Agora support AI-powered voice features?

Yes. Agora Voice Calling includes AI-powered features such as Noise Suppression, Real-Time Speech to Text, and seamless integration with large language models and text-to-speech engines to enable intelligent, voice-driven experiences.

Can I record voice calls and audio sessions?

Yes. Agora supports flexible voice recording in the cloud or on premises. Developers control audio formats, storage locations, and recording quality to support playback, analytics, moderation, or compliance needs.

What is 3D Spatial Audio and when should I use it?

3D Spatial Audio simulates real-world sound positioning, making conversations feel more immersive and natural. It’s commonly used in gaming, social audio rooms, virtual workspaces, and metaverse-style experiences.

How quickly can I launch a voice calling experience?

You can integrate Agora Voice Calling within hours using SDKs, documentation, and sample apps. For teams that want to move faster, Agora App Builder offers a no-code option to deploy voice chat without custom development.

What applications are best suited for Agora Voice Calling?

Agora Voice Calling is ideal for education platforms, multiplayer games, social apps, collaboration tools, live shopping, customer engagement, and IoT devices—any use case that requires reliable, real-time voice communication at global scale.

FAQs

What is Agora Video Calling?

Agora Video Calling is a real-time video API that lets developers embed high-quality, low-latency video calls into web, mobile, and native applications. It supports everything from 1:1 calls to large-scale video experiences with full customization.

Which platforms are supported by Agora’s Video Calling SDK?

Agora Video Calling supports Android, iOS, Web, Windows, Electron, Flutter, React Native, Unity, and Unreal Engine—making it easy to deliver consistent video experiences across devices and operating systems.

How does Agora ensure reliable video quality in poor network conditions?

Agora uses intelligent routing and adaptive video optimization to reduce jitter, lag, and packet loss. The platform dynamically adjusts video quality in real time to maintain smooth, uninterrupted calls—even on slow or unstable networks.

What collaboration features are available with Agora Video Calling?

Agora supports advanced collaboration features such as screen sharing, interactive whiteboards, multi-user video layouts, and real-time messaging. These features make it well suited for meetings, education, telehealth, and collaborative work apps.

Can I record video calls and meetings?

Yes. Agora provides flexible video call recording options, allowing you to record securely to the cloud or on local servers. Developers control video format, resolution, storage location, and access permissions to meet compliance and operational needs.

Does Agora support multi-camera or multi-audio setups?

Yes. Agora supports multi-track audio and video, making it possible to publish multiple camera feeds or microphone streams within a single session. This is ideal for live production workflows, virtual events, and advanced conferencing scenarios.

How fast can I launch a video calling experience?

You can ship a video calling app within hours using Agora SDKs, documentation, and sample apps. For even faster deployment, Agora App Builder provides a no-code option to launch video, voice, and live streaming features without custom development.

What use cases are best suited for Agora Video Calling?

Agora Video Calling is ideal for education, remote work, gaming, social apps, live shopping, and telehealth. Any application that requires scalable, real-time video communication with global reach and low latency can benefit from Agora’s platform.

FAQs

What is Agora Real-Time Chat?

Agora Real-Time Chat is a customizable chat SDK that lets developers add secure, scalable messaging to real-time video, voice, and live streaming applications. It supports one-to-one messaging, group chat, and large community channels.

Which platforms are supported by Agora’s Chat SDK?

Agora’s Chat SDK supports Android, iOS, Web, Windows, Flutter, React Native, and Unity, making it easy to deliver consistent messaging experiences across mobile, desktop, and cross-platform apps.

What messaging features does Agora Chat support?

Agora Chat supports rich media messaging including emojis, images, files, GPS locations, structured messages, and voice notes. Core messaging features also include offline messaging, message recall and deletion, read receipts, typing indicators, presence, and push notifications.

How does Agora ensure chat security and compliance?

Agora Chat uses TLS/SSL encryption for data in transit and encrypted file storage to protect user data. The platform also supports privacy compliance features such as user data deletion and secure message handling.

Does Agora Chat include moderation and community safety tools?

Yes. Agora Chat includes built-in content moderation to help filter profanity, offensive language, and inappropriate images or text. Developers can also integrate third-party moderation tools for additional control.

Can Agora Chat support multilingual users?

Yes. Agora Chat supports multilingual message translation with automatic, on-demand, or push-based translation options, enabling users to communicate in their preferred language.

How quickly can I launch a chat experience with Agora?

Developers can launch a chat experience within hours using Agora SDKs, documentation, and sample apps. For faster implementation, Agora UI Kit provides a low-code option to add messaging with minimal development effort.

What use cases are best suited for Agora Real-Time Chat?

Agora Real-Time Chat is ideal for education platforms, gaming communities, social apps, collaboration tools, live commerce, and telehealth—any application that requires reliable, secure, and engaging real-time messaging.

FAQs

What is Agora Real-Time Speech to Text?

Agora Real-Time Speech to Text is a cloud-based live transcription and subtitling service that converts real-time audio into accurate text for live audio and video applications. It enables captions, transcripts, and AI-powered workflows without impacting real-time performance.

How does Real-Time Speech to Text work in live audio and video sessions?

Agora’s cloud-based transcription processes audio streams in real time and converts speech into text with low latency. Transcripts can be delivered as live captions to participants, stored for later review, or exported for downstream processing.

Can I integrate Real-Time Speech to Text with large language models (LLMs)?

Yes. Real-time transcripts can be integrated with large language models to generate summaries, meeting notes, action items, feedback, or translations. Transcripts can also be exported as .vtt files for seamless LLM processing without affecting RTC performance.

Does Agora support multiple speakers and overlapping speech?

Yes. Agora supports real-time speaker recognition and labeling for up to three simultaneous speakers. Each speaker can be transcribed separately, improving accuracy in conversations with interruptions or overlapping dialogue.

What languages are supported by Agora’s Real-Time Speech to Text?

Agora supports all major languages and regional dialects. Each channel can transcribe up to two languages simultaneously, making it ideal for multilingual meetings, events, and global applications.

Can I generate captions for recorded audio or video?

Yes. Agora supports transcription for cloud-recorded audio and video, enabling closed captions (CC) during playback and searchable transcripts for reviewing important discussion points.

How does Agora ensure transcription accuracy at scale?

Agora uses advanced AI techniques to reduce silence, lower Word Error Rate (WER), and maintain accuracy even with accents, overlapping speech, poor audio quality, or unstable networks. The solution scales from one-to-one sessions to millions of participants with consistent accuracy.

Is Real-Time Speech to Text secure and compliant?

Yes. Agora is ISO and SOC 2 certified and supports compliance with GDPR, CCPA, and HIPAA. Live captions and transcripts can be encrypted using the same security mechanisms as Agora’s real-time audio and video streams.

FAQs

What is Agora Recording?

Agora Recording is an extension that allows developers to record audio streams, video streams, interactive content, and web pages for archive, review, compliance, or redistribution. It supports cloud, on-premises, and webpage recording options.

What types of content can I record with Agora?

Agora Recording can capture audio, video, screen content, whiteboards, chat messages, and live streaming elements. You can record single streams or multiple streams separately, making it easy to edit, combine, or repurpose content later.

What’s the difference between single-stream and multi-stream recording?

Single-stream recording combines audio, video, and content into one synchronized file. Multi-stream recording captures each audio, video, or content stream separately, giving you greater flexibility for post-production, analysis, or moderation workflows.

Where are recordings stored?

Recordings can be stored in the cloud or on-premises, depending on your deployment needs. Agora supports third-party cloud storage providers such as Amazon S3, Microsoft Azure, Google Cloud, Alibaba Cloud, Tencent Cloud, and others.

Can Agora Recording support moderation and compliance requirements?

Yes. Agora Recording supports screenshots for moderation, customizable capture intervals, digital watermarks, and content moderation tools. These features help enforce community guidelines, protect intellectual property, and meet regulatory or organizational requirements.

How secure is Agora Recording?

Agora Recording is built with enterprise-grade security, including end-to-end encryption for calls, transmission, and storage. It supports globally distributed clusters, automatic backups, proxy services, and LAN deployment to meet strict data security and privacy needs.

How quickly can I integrate recording into my application?

Developers can integrate Agora Recording in as little as 30 minutes using RESTful APIs. The service is designed to be easy to embed, test, and deploy, with automatic uploading and backup to ensure recordings are not lost.

What use cases are best suited for Agora Recording?

Agora Recording is ideal for virtual events and webinars, large-scale live streaming, customer service quality assurance, education and online classes, and telehealth consultations—any scenario where capturing, reviewing, or distributing real-time interactions is essential.