近年、さまざまな社会情勢の影響からテレワークを採用する企業が増えています。そんな中、社内会議など通話が必要な場面で活用されているのが、ソフトウェアの音声通話技術「VoIP」です。
この記事では、現代のテレワーク環境に欠かせない「VoIP」について、音声通話を実現する基本的な仕組みを紹介します。
VoIPは「Voice over Internet Protocol」の略称で、インターネットやイントラネットなどのIPネットワーク上で、音声による通話を実現する技術のことを指します。「ブイ・オー・アイ・ピー」もしくは「ヴォイプ」と発音します。
VoIPでは音声情報を小さなデータにまとめてパケット化し、IPネットワークを通じて分割で伝送します。この技術を搭載した電話は、従来の固定電話に代わる役割を担います。
VoIPでは音声データをIPネットワーク上で送受信するため、固定電話機に比べると料金を安く抑えられる、といったメリットがあります。
企業における音声データの伝送技術としては、長らくVoPN(Voice over Packet Network)を利用した方式が活用されてきました。VoPNはその名の通り、パケット通信網を利用して音声データを送受信する技術のことを指します。VoIPはいわば、VoPNのうちの一種であるといえます。
近年ではパソコンだけに限らず、家庭用ゲーム機や家電製品などのIoT機器の分野にもIPネットワークを利用した通信方式が普及してきています。IP網を利用した通信環境が整うにつれて、VoIPの需要は今後ますます高まっていくでしょう。
VoIPを利用した音声通話では、IPネットワーク上で音声データをやり取りする必要があります。実際にどのような仕組みで音声通話が実現しているのでしょうか。
ここでは、IP電話の音声が通話相手に届くまでの例を紹介します。
最初に、IP電話が発信者の声を受け取る過程を見てみましょう。
IP電話は、IP電話に対して発された声(=音声信号)をIPネットワーク上で転送可能なデジタル信号に変換します。その後、デジタル信号はVoIPゲートウェイと呼ばれる機器に送り出され、通話相手に送るためデジタル化が行われます。
以下、音声信号がデジタル化されるステップです。
このようにしてデジタル化されたデータはIPパケットと呼ばれます。
たくさんのIPパケットに分割された音声は、インターネットを通じて通信相手へと送り出されます。
IPネットワーク上ではデータの紛失や転送中の破損もありえます。このような場合に備えて、TCPと呼ばれるプロトコルを利用して、データに破損や不足した状態がないか確認を取りながらデータ送信が行われます。
本来このような処理の前には、電話機同士を接続する処理が必要です。電話機同士の接続には、「SIP」や「H.232」などの技術が用いられます。
通話相手のIP電話に届けられたIPパケットは、そのままでは聞くことができません。受信側のVoIPゲートウェイによって、発信するときにデジタル化したのとは逆の順番で、電気信号に戻す必要があります。
VoIPゲートウェイで復号されたデータは、順次IP電話機に転送されます。
VoIPゲートウェイで電気信号に復元されたデータは、IP電話機によって音声信号に変換されます。
音声信号は、IPネットワークを通ってきたデジタル信号とは異なり、アナログ信号です。送信側が送ったデジタルデータを正しく音声信号に戻すためには、音声信号を電気信号に変換したときと同じ方式を使って変換する必要があります。この変換に利用されているのが「コーデック」と呼ばれる圧縮形式です。
以上がVoIPによる音声通話の基本的な仕組みになります。実際には「次々と送られる音声データを処理する」などといった動作も並行して行われ、音声通話が実現しています。
冒頭にも紹介した通り、VoIPはIPネットワークを利用して音声通話を実現する技術の総称です。VoIPを利用した音声通話には、プロトコルと呼ばれる通信規格が複数使われています。
VoIPを実現するための代表的なプロトコルが「SIP」と「RTP」です。続いては、これらのプロトコルについて詳しく解説します。
SIPは、IPネットワーク上で「呼制御」と呼ばれる機能を実現するためのプロトコルです。呼制御は電話機同士の通信に必要となる、発信や着信、応答、切断といった基本機能のことです。
SIP機能を備えたIP電話機は、発信側と受信側のそれぞれにUA(User Agent)と呼ばれる機能端末を持っています。IP電話網を管理するSIPサーバーは、UAの情報を自身のデータベースに登録し、通信に備えます。
UAには、それぞれ端末固有の識別子であるSIDが割り当てられます。電話を発信する際は、電話をかけたいUAのSIDを指定して電話を発信し、受信側も発信元のSIDから相手を特定できるという仕組みです。
SIPを利用した通信が確立されたIP電話同士の通信には、「RTP(Real-time Transport Protocol)」と呼ばれるプロトコルが利用されます。
RTPは分割された連続的なデータの送受信についてのみ定められた、非常にシンプルなプロトコルです。通常のIP電話の場合、音声信号をおおよそ20msごとに1パケットへ分割して送受信します。つまり1秒間に約50回データのやり取りがあるということです。
RTPでは多くの通信で使われているTCPではなく、UDPを利用します。多少のデータ欠損やロスがあっても、リアルタイムに音声通話が成立することを重視して動くように設計されているのです。
TCPはデータ通信において、双方が常に相手の状況やデータの到達を確認して、細かな制御を行うプロトコルです。信頼性が高い分、データの到着に遅延が発生したり通信不能になったりしやすいデメリットがあります。
しかしUDPの通信では、相手にどのようにデータが到達しているかを確認しません。このため通信の開始や相手が受け取ったことの確認などの手間が省けるため、通信が軽くなるのです。
VoIPを使用したIP電話には、大きく2種類の電話機が存在します。ここでは、その特徴を紹介します。
1つ目はハードウェアタイプです。その名の通り、従来の家庭用電話機のような、アナログな形状をした端末を利用します。
LANケーブルを接続してIPネットワークに直接接続するタイプの電話機は、VoIPゲートウェイが無くても、最初から音声をデジタルデータとして扱えることが特徴です。
一方、アナログ電話機をIP電話として利用する場合には、VoIPゲートウェイを導入して音声をデジタルデータに変換する必要があります。
2つ目はソフトウェアタイプです。パソコンやスマートフォンに専用のソフトウェアをインストールして利用するもので、「ソフトフォン」とも呼ばれています。パソコンを利用するため、必要に応じてイヤホンやマイクを接続して利用する必要があります。
専用のハードウェアを準備する必要がないため、
といった費用面におけるメリットがたくさんあります。またソフトウェアをアップデートするだけで新たな機能を簡単に取り入れられるのも大きな特徴です。
ソフトフォンについて詳しく知りたい方は、こちらの記事もぜひご覧くださいませ。
VoIPによるIP電話を実現するためには、大きく分けて3つの機器が必要になります。どのようなものがあるのか、一つずつ解説していきます。
IP電話機における、電話交換機の役割を備えた中央管理装置です。IPアドレスと電話番号の相互変換や通信帯域管理などを行う機器で、ハードウェアタイプとソフトウェアタイプがあります。
管理範囲内のIPネットワークに存在しているIP電話機はすべてVoIP網制御装置に登録され、専用のSIDが割り当てられます。IP電話機同士はSIDを利用して受発信・内線通話を行います。
また外線電話の場合は、利用する電話番号とIP電話機の対応付けや呼制御の機能を担います。
ちなみに近年では「PBXの機能をIP電話の通信網で利用できる」電話交換機ことIP-PBXが主流になりつつあるようです。
IP電話機は、通話に必要不可欠な音声を送受信する装置です。前述のとおり、従来のアナログ電話機のような外見をしたハードウェアタイプと、パソコンやスマートフォンにインストールして利用するソフトウェアタイプがあります。
IP電話機は、IPネットワークを利用して音声データを送受信します。IP電話専用の機器を準備しなくても、次に紹介するVoIPゲートウェイを導入すれば、従来の家庭用電話機をIP電話機として再利用することも可能です。
またソフトウェアタイプのIP電話機の場合、専用の機器を購入する必要がなく、設置場所も取られないため、オフィスのレイアウト変更や急な増設にも柔軟に対応できるようになるでしょう。
VoIPゲートウェイは、家庭用電話機が扱うアナログな音声データを、VoIPが取り扱えるデジタルデータに変換する中継器の役割を果たします。
またデジタルデータのIPパケットへの分割や、受信したIPパケットの復号まで、家庭用電話機に不足している機能をVoIPゲートウェイが補います。VoIPゲートウェイがIPネットワークを介した通信に必要な機能を担うことで、相手との音声通話が可能になるのです。
ちなみにVoIPゲートウェイが必要なのは、従来の家庭用電話機をIP電話へ再利用する場合です。IPネットワークに直接接続できるIP電話機やソフトフォンにはすでにVoIPゲートウェイ相当の機能が組み込まれているため、専用機器を導入する必要がありません。
Vonageは、電話やSMS・ビデオ・チャット・SNSなど、さまざまなコミュニケーションチャネルをWeb・モバイルアプリケーションやビジネスへ組み込めるクラウドAPIサービスです。自動電話発信や電話転送、対話型IVR、自動SMS通知や二要素認証など、多岐にわたるサービスを実現できます。
コミュニケーションに関わる機能を自社で1から開発するのには多大な工数がかかります。通信の暗号化といったセキュリティ対策など考慮せねばならない点も多く、そのために実装を諦めてしまう企業も少なくありません。
しかしVonage APIと連携すれば、それらの工数をすべてVonage側が担ってくれます。お客様側でのインフラ開発はもちろん、ネットワークの構築・維持コストも必要ありません。ただ数行のコードを書き加えるだけで、自社サービスをマルチチャネル化できるのです。
Vonage Voice APIは録音や音声認識、IVRなど、通話に必要なあらゆる機能をプログラムでコントロールできるAPIです。
世界中の電話番号を用いたPSTN(公衆回線網)やSIP、Web RTCでの発着信機能を利用できます。また日本国内を含む約80カ国の電話番号を提供しており、ダッシュボード上から簡単に番号取得のお申し込みが可能です。
料金は通話秒数に応じた従量課金制です。また通話の録音・保存や日本語での音声認識、テキストの読み上げなどは無料で利用できます。そのため、不要なコストをかけずに音声通話のコミュニケーションチャネルを自社サービスに連携させられます。
この記事では、VoIPがどのような仕組みで構成されているかを紹介し、使われているプロトコルや導入に必要な機器について解説しました。
VoIPを利用した音声通話の技術は、インターネットの普及とともに急速に拡大しています。音声通話の仕組みを理解して、自社でリモート会議を行う際も、冷静に準備できるようにしてみてください。