用語集

ASR

ASRは「Automated Speech Recognition」の略称で、日本語で「自動音声認識」とも呼ばれています。マイクロフォンや録音デバイスを通じて取得された、人間の言語や発話内容などの音声データを、コンピューターが理解できる形式のテキストに変換する技術のことを指します。

ASRはさまざまな分野において幅広く利用されています。たとえば検索エンジンに搭載されている音声検索機能や音声で作動するスマートホーム機器などは、私たちの生活においてもっとも身近な存在と言えるでしょう。そのほかにも自動言語翻訳や自動字幕生成、文字起こし、コンタクトセンターにおけるバーチャルエージェントなど、ASRを活用している機能やアプリケーションは多岐にわたります。

昨今のASR(自動音声認識)技術は、単なる文字起こしの役割にとどまらず、人間と機械の音声コミュニケーションを実現する重要な役割を担っています。たとえば音楽を流すのも、調べものをするのも、電話をかけるのも、機器の操作を覚える必要はもはやありません。ただ人間を相手にするのと同じように話しかけるだけで実現できるのです。ASRは私たちの生活の利便性を向上させるにあたり、いまや欠かせない存在となっています。

コミュニケーションAPIサービス
「Vonage」のご紹介

vonagepoe_primary

Vonageは、電話やSMS・ビデオ・チャット・SNSなど、さまざまなコミュニケーションチャネルをWeb・モバイルアプリケーションやビジネスへ組み込めるクラウドAPIサービスです。自動電話発信や電話転送、対話型IVR、自動SMS通知や二要素認証など、多岐にわたるサービスを実現できます。

Vonage Voice API

Vonage Voice APIは録音や音声認識、IVRなど、通話に必要なあらゆる機能をプログラムでコントロールできるAPIです。

世界中の電話番号を用いたPSTN(公衆回線網)やSIP、Web RTCでの発着信機能を利用できます。また日本国内を含む約80カ国の電話番号を提供しており、ダッシュボード上から簡単に番号取得のお申し込みが可能です。

料金は通話秒数に応じた従量課金制です。また通話の録音・保存や日本語での音声認識、テキストの読み上げなどは無料で利用できます。そのため、不要なコストをかけずに音声通話のコミュニケーションチャネルを自社サービスに連携させられます。