よくあるご質問
- VMFi Ai
- 2月13日
- 読了時間: 7分
更新日:18 時間前
TranSpeech FAQ

Q: 騒音の多い環境における音声認識精度はどの程度ですか。 A: ステージ上のマイク音源を使用した場合、音声認識精度は最大で約99%に達します。
Q: 翻訳後の字幕表示までの遅延時間(話者の発話から字幕表示まで)はどのくらいですか? A: 4G(12Mbps)通信環境下では、約0.5秒程度です。
Q: 対応言語数はどれくらいですか。また、専門用語辞書(技術講演・法人向け用語など)の追加は可能ですか。
A: 現在、9言語に対応しています。専門辞書の作成・登録機能については、現在開発中です。
Q: 導入にあたり、会場ではどのようなハードウェアや環境設定が必要ですか。(マイク、PC、ネットワーク等)
A: ・音声入力機器:会場ミキサー(Line Out)、有線/無線マイクからの音声出力
・PC/専用端末:インターネット接続可能なPC、または弊社提供の専用端末
・表示機器:プロジェクター、LEDビジョン、テレビモニター
・ネットワーク環境:安定した有線回線、またはスタッフ専用の Wi-Fi システムは既存の会場AV設備と連携可能で、会場条件に応じて柔軟に構成を調整できます。
Q: システムは常時インターネット接続が必要ですか。オフラインモードはありますか。
A: リアルタイム音声認識および翻訳処理のため、安定したインターネット接続が常時必要です。現在、完全なオフラインモードは提供しておりません。
Q: 展示会や講演において、複数言語の字幕(例:日本語・中国語・英語)を同時に表示できますか。
A: 単一の音声入力に対し、リアルタイムで単一言語の字幕を出力します。複数言語での表示が必要な場合は、言語ごとに複数のサービスを同時に稼働させることで対応可能です。国際会議、展示会、グローバル発表イベントに適しています。
Q: 設定および設置にはどのくらいの時間がかかりますか?
A: 通常、現地での設定およびテストには約10~30分程度を要します(機材接続、音声確認、言語設定、表示テスト等)。大規模イベントや複雑な会場の場合は、前日の事前テストを推奨しています。
Q: 講演終了後に字幕データや文字起こしデータを取得することは可能ですか?
A: 現時点では、字幕ログや文字データの提供は行っておりません。 Q: 話者の訛りが強い場合や、話速が速い場合、または高度な専門用語が多い場合の対応力はいかがですか。 A: 一般的な訛りや通常~やや速い話速に対しては、安定した認識性能を有しています。専門分野特有の用語や略語が多い場合でも理解補助として有効ですが、認識精度は実際の音声条件により変動します。
Q: 上記に関連して、事前に専門用語や表現を入力することは可能ですか。
A: 今後は、イベント前に専門用語、ブランド名、人名、特定表現のリスト、または使用予定のプレゼン資料をご提供いただくことで、専用語彙設定を行い、認識および翻訳精度の向上を図ることが可能になる予定です。 Q: イベント中にネットワーク障害が発生した場合、システムはどのように対応しますか。自動再接続されますか。 A: ネットワーク異常が発生した際には、接続状態をリアルタイムで表示し、自動的に再接続を試みます。安定した回線の利用に加え、予備回線の準備を推奨しております。 Q. TranSpeechで日本語字幕を表示した際、句読点(、。)の位置が不自然です。日本の習慣に合わせた正しい位置に変更するにはどうすればよいですか?
A. ご利用のブラウザ(Google Chrome)のフォント設定を変更することで、正しい位置に表示させることが可能です。以下の手順に沿って設定をお願いいたします。
【設定手順】
Google Chromeの右上にあるメニュー(︙)から「設定」を開きます。
左側のメニューから「デザイン」を選択し、「フォントをカスタマイズ」をクリックします。
「標準フォント」の項目を、任意の「日本語フォント(例:メイリオ、游ゴシックなど)」に変更します。
上記の設定を行っていただくことで、句読点が日本の習慣通りの正しい位置に表示されるようになります。 詳細につきましては、以下の設定手順の図解(スクリーンショット)も併せてご参照くださいませ。

=============================================================================
TransDisplay FAQ

Q: 本装置は何言語に対応していますか。
A: 現在、32言語に対応しており、今後も順次拡充予定です。
Q: 自動言語識別機能の精度はどの程度ですか。どのように来訪者の言語を判別しますか。
A: 本システムは自動言語識別(Auto Language Detection)機能を備えており、音声が明瞭でネットワーク環境が安定している場合、言語判別精度は約90%以上を実現しています。音声の特徴、音声モデルの照合、文脈情報をもとにリアルタイムで判定を行い、概ね2文程度の発話で言語を識別します。利用者が事前に言語を手動選択する必要はありません。
Q: インターネットが利用できない、または通信速度が極端に低い環境でも動作しますか。オフラインやローカル処理は可能ですか。
A: 本システムはクラウド型AI音声認識・翻訳サービスを中核としており、安定したインターネット接続が必要です。現在、完全なオフライン動作やローカル処理には対応していません。通信状況が不安定な場合は自動的に再接続を試み、遅延の低減を図ります。重要な設置場所では、予備回線の併用を推奨します。
Q: 本装置はどのような場所に設置できますか。(空港、駅、観光案内所、ホテルフロントなど) A: 本装置は、以下を含むさまざまな公共・商業施設での利用に適しています。
行政サービス窓口、空港案内カウンター、会議センター、商業施設のインフォメーション、小売店舗カウンター、交通案内窓口、ホテ ルフロント、観光案内所 など。
Q: 音声認識と翻訳エンジンのセキュリティは大丈夫ですか。
A: すべてのデータ通信はHTTPS/TLSなどの暗号化通信を採用しており、音声・テキストデータは未承認の用途に使用されることはありません。高い情報セキュリティを確保しています。
Q: 一方向・双方向のリアルタイム会話以外に、3言語以上での同時対話に対応できますか。 A: はい、可能です。単一の音声入力をリアルタイムで複数言語の字幕として変換・表示でき、3言語以上の同時表示にも対応しています。複数人・多言語による同時対話については、プロジェクト単位での構成設計・評価が可能です。 Q: 導入後の保守・アップデートの流れはどのようになっていますか。翻訳言語や辞書の更新は容易ですか。
A: 本システムはクラウド型アップデート方式を採用しており、機能追加や言語モデルの更新に際してハードウェア交換は不要です。データベースはすべてオンラインで更新され、利用者は常に最新の内容を使用できます。将来的には管理者が管理画面から言語設定を変更でき、専門用語や特定表現も迅速に追加・更新可能となる予定です。保守運用はシンプルです。
Q: 本装置は、現場の既存システム(受付システム、CRM、観光情報システムなど)と連携/API接続は可能ですか。 A: 将来的に対応予定です。API連携機能を提供し、受付システム、会員管理、CRM、各種情報システムとのデータ連携が可能となる見込みです。具体的な連携方法については、プロジェクト段階で協議いたします。 Q: 複数の来訪者や多言語利用者を同時に処理した場合、パフォーマンスに影響はありますか。
A: 本システムはクラウドアーキテクチャを採用しており、利用状況に応じてリソースを柔軟に調整できます。適切な設計のもとでは、多言語・同時利用による大きな性能低下はありません。高トラフィックが想定される場合は、事前に容量評価および最適化を行います。
Q: 音声データや翻訳後のテキスト記録はどこに保存されますか。後から取得することは可能ですか。 A: 現在、クラウド上に音声・テキストの記録は保存しておらず、事後取得もできません。お客様のプライバシー保護を最優先としています。 Q: GDPRやISO 27001などの情報セキュリティ規格に準拠していますか。 A: クラウドサービスはGDPRに準拠しています。現在、ISO 27001(情報セキュリティマネジメント)の認証を申請中です。
Q: 翻訳字幕以外に、画面で画像や動画を表示することはできますか。 A: 現在は、現場でのリアルタイム翻訳字幕表示のみを提供しており、字幕中に画像を挿入する機能はありません。ただし、一定時間操作がない場合に、顧客が設定したマーケティング用動画コンテンツを自動再生する設定は可能です。


![VMFi、リアルタイムAI翻訳ソリューション「TransDisplay」を東京都のスタートアップ拠点「TIB」にて展示中。4月には「Japan Startup Summit[春]」への出展も決定!](https://static.wixstatic.com/media/38e62f_e95035a7074b499a9fb2dcf3fbb3fdac~mv2.png/v1/fill/w_980,h_735,al_c,q_90,usm_0.66_1.00_0.01,enc_avif,quality_auto/38e62f_e95035a7074b499a9fb2dcf3fbb3fdac~mv2.png)

コメント