用語集

TTS

TTSは「Text-To-Speech」の略称で、入力された任意のテキストを人工の音声に変換する技術のことを指します。コンピューターを使って人間の音声を人工的に作り出す「音声合成」のうち、テキスト音声合成方式と呼ばれるものになります。現在ではその中でも「コーパスベース合成方式」と呼ばれる方式が主流となっています。

音声合成の歴史は古く、数十年前から駅の案内放送やゲーム機、カーナビなどで活用されてきました。しかし近年ではIoTの普及もあり、TTSを搭載できるインターフェースも多様化しています。そのためデジタル機器の音声アシスタント機能やオーディオブック、コールセンターの自動応答など、TTSの技術をより身近なところで感じられるようになりました。

また昨今ではAIの発展に伴い、より人間の肉声に近い、感情的な発話が可能です。従来では対応しきれなかった日本語と外来語(または外国語の単語)が混ざったテキストの読み上げも、より自然に発音できるようになっています。

かつては機械音っぽさが拭えなかった音声合成ですが、今では自然なコミュニケーションを行えるツールとして、幅広い分野で重宝されています。

コミュニケーションAPIサービス
「Vonage」のご紹介

vonagepoe_primary

Vonageは、電話やSMS・ビデオ・チャット・SNSなど、さまざまなコミュニケーションチャネルをWeb・モバイルアプリケーションやビジネスへ組み込めるクラウドAPIサービスです。自動電話発信や電話転送、対話型IVR、自動SMS通知や二要素認証など、多岐にわたるサービスを実現できます。

Vonage Voice API

Vonage Voice APIは通話に必要なあらゆる機能(転送、録音、音声認識、IVRなど)をプログラムで制御できるAPIです。数行のコードを既存システムに組み込むだけで、PSTN(公衆回線網)や SIPでの発信・着信機能を利用できるようになります。また日本を含む約80カ国の電話番号を提供しており、購入した電話番号を自由に使うことができます。

たとえばVonageから電話番号を購入して自社サービスの問い合わせ先とし、顧客からの着信に対して音声認識を行い、その内容をもとにあらかじめ用意しておいた回答を合成音声で再生して自己解決を促す、といった一連の流れをVonage Voice APIだけで実現できます。

また有人対応が必要な場合にはオペレーターに電話を転送し、その内容を録音して、以降の応対に役立てることも可能です。

さらに後述する「Vonage AI Studio」を用いれば、そうしたフローをノーコード/ローコードで実現できます。

さまざまな機能をリーズナブルに利用できるため、スモールスタートがしやすいほか、組み合わせによって柔軟にニーズに寄り添う機能開発が可能です。