EXTENSION

リアルタイム翻訳ベータ

Break down language barriers with live speech-to-text translation solutions.
A man with a headset leads a virtual meeting, with live English transcription on the left and a Spanish translation subtitle that reads, "El enfoque principal fue mejorar la participación de nuestros clientes," alongside video feeds of other participants.
サポート対象プラットフォーム
RESTful API
EXTENSION

会話型AIエンジン ベータ版

Break down language barriers with live speech-to-text translation solutions.
サポート対象プラットフォーム
RESTful API
で構築しているお客様
アゴラとオープンAI
grepp logoWYZE logokileon logokumu logoScaler logoParallel logoJorJin logoAnotherBall logoEllie logozigbang logo
grepp logoWYZE logokileon logokumu logoScaler logoParallel logoJorJin logoAnotherBall logoEllie logozigbang logo

Features

Speech to speech or to text icon
Live translation
Live speech-to-text translation to keep the conversation flowing seamlessly in real-time communication or live streaming.
Multi-language translation icon
Multi-language translation

Manage multilingual interactions with speech translation of up to two source languages into five target languages with support for 30+ languages.

Use with Real-Time Speech-to-Text icon
High accuracy
Advanced Speech Recognition (ASR) captures spoken language and converts it to text accurately using sophisticated speech recognition technologies.
Translation transcripts icon
Translated captions
Easily readable translated live captions are continuously delivered to all participants. Video text track (VTT) files can be stored in the cloud for future reference, AI analysis, or compliance.
Support for # languages icon
Ultra-low latency translation
Ensure seamless translation for real-time communication with end-to-start latency of less than 1 second and an average end-to-end latency of under 3 seconds.
LLM integration icon
LLM integration
Process translated text using custom large language models (LLMs) or integrate with additional AI services to enhance capabilities and streamline workflows.
agoraによる献身的なサポートのイメージ

必要なときに専任の専門家のサポートを受けましょう

スケーラビリティ、パフォーマンス、運用効率の向上を体験してください。1 対 1 のコンサルティング、問題の分類、戦略的なプロダクションエスカレーションなど、さまざまなご要望にお応えします。専任の専門家チームが、比類のないサポート体験を提供することに全力を注いでいます。
グローバルサポートエキスパート
最適な解決時間
満足を保証します
サポートプランを見る
会話型AIエンジンを搭載したボイスエージェントと対話しましょう。
今すぐ試す
1 つのリアルタイムビュー 次のような指標については 最も重要な
1 つのダッシュボードを使用して、世界中のすべてのアクティブなセッションを監視できます。最も多い指標を追跡できます。 同時接続ユーザー数やチャネルからネットワークレイテンシーまで、あなたにとって重要なことです。

あなたのビジョン、制限なし。

Interactive Whiteboardを使用すると、カスタムブランディングと豊富な機能を備えたコラボレーションアプリをすばやく構築できます。当社のプラットフォームでは、カスタマイズされた魅力的な学習環境を簡単に作成できます。
  • 柔軟な API は、カスタムブランディングと広範なデジタルホワイトボード機能をサポートします。
  • リアルタイムの音声通話とビデオ通話、インタラクティブなストリーミング、シグナリングを簡単に統合できます。
  • ファイルのプリロード、共有、注釈付けによってユーザーの帯域幅を節約し、すべての動的コンテンツを保持できます。
また、HIPAA、GDPR、CCPAへのコンプライアンスにも安心してお使いいただけます。

OpenAI のリアルタイム API の実際の動作をご覧ください

Enable seamless global communication with instant translation

Agora’s Real-Time Translation provides accurate live translation in ultra-low latency.
Language barriers icon

Remove language barriers

Real-time translation of spoken content into up to five target languages using advanced neural machine translation models.
Language barriers icon

Remove language barriers

Advanced Speech Recognition (ASR) icon

Expand your audience

Expand your audience globally with instant language translation combined with a global network for real-time video and voice to attract and engage users anywhere.
Advanced Speech Recognition (ASR) icon

Expand your audience

High accuracy with ultra-low latency icon

Enable global connections

Allow your users to connect and communicate seamlessly with anyone worldwide via voice or video chat.
High accuracy with ultra-low latency icon

Enable global connections

以下のレコーディングオプション:

クラウドレコーディング
記録をクラウドに保存、取得、共有します。
ドキュメントに移動
オンプレミス録画
セキュリティと機密保持のため、ローカルサーバーに保存してください。
ドキュメントに移動
Web ページの録画
Web ブラウザーの画面エクスペリエンス全体を記録します。
ドキュメントに移動

アゴラ・メディア・サービス

Recording icon
レコーディング
オーディオストリーム、ビデオストリーム、およびWebページを録画して、アーカイブ、レビュー、または配信します。
Live icon
メディアゲートウェイ
RTMP/SRTプロトコルを使用してメディアストリームをAgora音声およびビデオチャネルに直接プッシュし、メディアストリームの高度なトランスコーディング処理を可能にして配信を容易にします。
Download icon
メディアプル
ライブまたは録画したビデオやオーディオコンテンツを取り込み、Agoraチャンネルに直接取り込むことで、Agoraセッションのエンゲージメントをさらに高めましょう。
メディアプッシュ
オーディオとビデオのストリームを Agora チャンネルからコンテンツ配信ネットワーク (CDN) にプッシュすることで、ハイブリッドなエンゲージメント体験で視聴者を増やしましょう。

Made for developers

クイックスタートガイド

Agora と Open AI を使い始めるためのクイックスタートガイドをご覧ください。
会話型AIエンジンの仕組み

Made for developers

あなたのコード

アゴラ SDK

柔軟な SDK を使用して、最初からエクスペリエンスをカスタマイズできます。
あなたのコード

アゴラ SDK

AgoraのVideo SDKを使用して、柔軟性とカスタマイズ性を最大限に高めながら、リアルタイム動画を作成してアプリに統合できます。
コードなし

アプリビルダー

Agoraのアプリビルダーは、コード不要のビジュアルデザイナーを使用して、ビデオを製品にリアルタイムで取り込む最も速くて簡単な方法です。
ドキュメントに移動
ローコード

アゴラ UI キット

ローコードの UI Kit ライブラリを使用して、わずか数行のコードでリアルタイム動画をアプリに追加できます。
ドキュメントに移動
あなたのコード

アゴラ SDK

柔軟な SDK を使用して、最初からエクスペリエンスをカスタマイズできます。
RESTful API
ドキュメントに移動
ローコード

アゴラ UI キット

ローコードのUIKitライブラリを使用すると、わずか数行のコードを使用してリアルタイム通信とストリーミングを統合できます。
ドキュメントに移動

Documentation

ドキュメンテーション

このプロジェクトでは、Agora API の使用方法を理解するのに役立つ一連の API 例を紹介します。
View Agora documentation on Real-Time Translation
RESTful API
ドキュメントに移動

AgoraコンソールでAIノイズ抑制拡張機能を有効にします。

Activate the Real-Time Translation extension in the Agora Console.

あなたのコード

アゴラ SDK

AgoraのVoice SDKを使用して、最大限の柔軟性と完全なカスタマイズで音声通話を構築および統合できます。
RESTful API
ドキュメントに移動
コードなし

アプリビルダー

Agoraのアプリビルダーは、リアルタイムのボイスチャット、ビデオチャット、ライブストリーミングを製品に追加する最も速くて簡単な方法です。
ドキュメントに移動
あなたのコード

アゴラ SDK

AgoraのInteractive Whiteboard SDKを使用して、最も柔軟で完全なカスタマイズを実現しながら、リアルタイムのビジュアルコラボレーション機能を構築してアプリケーションに統合できます。
RESTful API
ドキュメントに移動
ローコード

ファストボード

事前構築された UI とカスタムプラグインを含める機能により、リアルタイムのビジュアルコラボレーションをより迅速に構築できます。
今すぐ試してみる
セキュリティ、プライバシー、コンプライアンス
アゴラは、ISO/IEC 27001、27017、27018、27701、およびSOC 2のセキュリティ基準の認定を受けており、GDPR、CCAP、COPPA、HIPAAなどのプライバシー規制を満たしています。Agoraは、サービスの提供に必要なインターネットプロトコル(IP)アドレスと運用情報以外のエンドユーザーデータを収集または保存しません。
ISO 27001:2022
ISO 27017:2015
ISO 27018:2019
ISO 27701:2019
ヒパー
GDPR
SOC2 タイプ 1 & 2
CCPA
コッパ
HOW TO INTEGRATE?
Streamlined 3-step integration process:
01
Activate Agora Conversational AI Engine
Unlock real-time Speech-to-Text (STT) and Text-to-Speech (TTS) capabilities, enabling seamless conversational interactions. 
02
Integrate Agora Edge Chip on Hardware
Optimize microphone, speaker, and system efficiency to ensure ultra-low-latency and high-fidelity conversations.
03
Deploy AI Voice Agents
Enable interactive, multilingual, and user-customized conversations for a wide range of IoT applications.
By building our Conversational AI technology into Beken’s high-performance IoT chip modules, the turnkey solution makes it easy to integrate voice AI into any connected toy. 
“With Agora’s conversational AI technology and our optimized AI hardware, we’re enabling the next generation of toys to think, respond, and interact naturally. We are excited to usher in the future of robotics and toys, ones that can react to the environment around them and interact fluently with users.” 
Pengfei Zhang
CEO, BEKEN
ユースケース

Elevate your global communication

Translate audio for real-time communication and integrate with LLMs to optimize business operations and connect audiences worldwide.
A professor stands in front of a whiteboard with engine diagrams and calculations, accompanied by a bilingual transcript in English and Korean explaining engine components and their characteristics.
Education
Offer courses and learning materials in multiple languages, promoting inclusive education and reaching students worldwide.
A basketball player in a red jersey dunks the ball during a game, with the scoreboard showing a close score and the text "Unglaublicher Zug! Der Spielstand ist jetzt 68-65" displayed below.
Virtual Events
Host global webinars and conferences with real-time translation, enhancing engagement and participation from international audiences.
A virtual meeting with four participants shown on screen, alongside notes in Italian summarizing key points, pending questions, and action items for a business discussion.
Meetings
Enable seamless communication within multinational teams, ensuring everyone is on the same page regardless of language differences.
 A smiling vendor stands behind a variety of fresh vegetables at a market, with a shopping option overlay showing a basket of produce and a "Koop Nou" (Buy Now) button.
Live Shopping
Provide multilingual customer support and shopping experiences, breaking down language barriers and increasing international sales.
A doctor speaks to a smiling patient during a virtual consultation, with the text "Ik heb je vitamine D-rapporten klaar..." displayed below.
Telehealth
Real-time translation bridges language gaps between healthcare providers and patients, ensuring clear understanding of symptoms, diagnoses, and treatment plans.
A smiling woman holds a bifana sandwich at a vibrant market, with the text "Adorando esta Bifana" displayed below.
Social
Connect users globally by offering real-time translations in chats, comments, and live interactions, fostering a more connected community.
Robopoet's Fuzzoo, an AI companion robot, leverages Agora's ConvoAI Device Kit to deliver real-time emotional support and personalized interaction.
"Agora’s AI technology enables toys and robots to interact in a way that feels natural and engaging. With real-time voice processing, emotional AI, and advanced speech capabilities, Agora makes seamless human-machine interaction possible and ensures exceptional performance and reliability." 
Yuna Pan
Co-Founder and CTO
Mouse cursor illustration

ファストボード

Agoraのインタラクティブホワイトボードを最新のFastboard SDKと簡単に構築して統合できます。これにより、ビルド済みのUIとカスタムプラグインを含めることができるため、まったく同じホワイトボード機能がすべて提供されます。
今すぐ試してみる
アイテムが見つかりません。
Request more information
Connect with our experts to answer your questions, discuss requirements, and provide more detail on the ConvoAI Device Kit

FAQ(よくある質問)

Agoraの会話型AIエンジンは他の音声AIソリューションとどう違いますか?

アゴラは、低遅延の応答とリアルタイムの割り込み処理により、より自然な音声対話を可能にします。また、内蔵のバックグラウンドノイズ抑制、エコーキャンセル、選択的注意ロックにより、どのような環境でもAIがユーザーの声を明確に認識できます。さらに、アゴラのグローバルリアルタイムネットワークにより、世界中どこでも安定した接続と高いパフォーマンスを提供します。

Agoraの会話型AIエンジンで接続可能なLLMは?

アゴラの会話型AIエンジンには、OpenAI互換のLLMを接続できます。具体的には、OpenAIのGPTモデル、Google Gemini、DeepSeek、およびOpenAI互換のカスタムモデルが利用可能です。さらに、今後追加のLLMのサポートも予定されています。

音声AIエージェントの導入に必要な技術は?

音声AIエージェントを実装するには、LLM(大規模言語モデル)とテキスト読み上げ(TTS:Text-to-Speech)サービスをアゴラの会話型AIエンジンに接続する必要があります。これにより、LLMや音声を自由にカスタマイズし、最適な音声AI体験を提供できます。

「カスケードモデル」とは?

カスケードモデルは、

  1. 音声→文字変換(STT)
  1. LLMによる処理
  1. 文字→音声変換(TTS)
    の順でAI応答を生成するプロセスを指します。
Agoraの会話型AIエンジンでLLMを作成できますか?

いいえ、本エンジンは既存のLLMとの音声対話を可能にするものであり、 LLMの作成やトレーニング機能はありません。