私たちが日常よく目にする音声ファイルにはMP3があります。
ですが、MP3以外にもAAC, WAV, m4a, Ogg, FLAC, ALAC, APE, Vorbis, Opusなど様々なものがあります。
例えば、Opusはあまり聞きなれませんが、Skype、Discord、Google Meetなど世界中で広く普及している主要なビデオ会議システムにも採用されている音声フォーマットです。
また、AACは拡張子が.aacのものや.m4aがあったりと、一見すると非常にわかりにくいことがあります。
ここではこれらの音声フォーマットは何が違うのか?それぞれの特徴やメリット、デメリットについてまとめています。
音声フォーマットの一覧
mp3, AAC, wav, m4a, ogg, flac, ALAC, APE, Vorbis, Opusなどの音声ファイルの種類や特徴を一覧にまとめると以下のようになっています。
音声フォーマット | 拡張子 | 形式 | 主な特徴 | 普及度 | 開発元 | 可逆性 |
---|---|---|---|---|---|---|
MP3 | .mp3 | コーデック | 高い圧縮率 | ◎ | ドイツの研究機関 | 非可逆圧縮 |
AAC | .aac | コーデック | 高い圧縮率(MP3の進化版) | ◎ | ドイツの研究機関 | 非可逆圧縮 |
M4A | .m4a | コンテナ | AACやALACを格納できる | ○ | Apple | – |
WAV | .wav | コーデック | 非圧縮 ファイルサイズが大きい | ○ | MicrosoftとIBM | 可逆圧縮 |
ALAC | .m4a, .m4b | コーデック | 無損失音声圧縮フォーマット | △ | Apple | 可逆圧縮 |
Ogg | .ogg | コンテナ | オープンソース Vorbis、Opus、FLACなどを格納可能 | △ | Xiph.Org Foundation | – |
Vorbis | .ogg | コーデック | オープンでロイヤリティフリー | △ | Xiph.Org Foundation | 非可逆圧縮 |
Opus | .opus | コーデック | オープンでロイヤリティフリー 音声通話や音声チャット、オーディオストリーミングなどのリアルタイム通信に特化 新しい | ○ | Xiph.Org Foundation | 非可逆圧縮 |
FLAC | .flac | コーデック | 無損失圧縮 オープンソース | ○ | ジョシュア・モーズ | 可逆圧縮 |
APE | .ape | コーデック | 無損失圧縮。高い圧縮率。 圧縮に時間がかかる(CPU、メモリを使用) | △ | Monkey’s Audio | 可逆圧縮 |
以下でそれぞれの詳細やメリデメについて解説しています。
MP3(.mp3)とは何か?
MP3(MPEG-1 Audio Layer 3)は、音声データを高い圧縮率で保存することができる音声フォーマットです。
拡張子は「.mp3」です。
音楽やオーディオコンテンツをデジタル形式で保存する際に広く使用されています。音声ファイルの中でも一番有名なのがMP3です。そのため、PCやスマホなどほとんどのデバイスで再生することができます。
MP3は高圧縮のためファイルサイズを小さくすることができます。また、高圧縮の割に音質の劣化が少なく、非常に万能な音声フォーマットです。
なお、MP3は1993年にドイツの研究機関であるFraunhofer-Gesellschaftとその姉妹機関であるFraunhofer Institute for Integrated Circuitsが開発しました。
AAC(.aac)とは何か?
AAC(Advanced Audio Coding)は、MP3と同様に、高音質の音声を比較的小さなファイルサイズで保存することができます。
AACは、MPEG-2やMPEG-4規格の一部として開発され、主にiTunesやiOSデバイスなどのApple製品で広く使用されています。圧縮のアルゴリズムが優れているため、高音質の音声を圧縮するのに向いています。
AACファイルは通常、拡張子が「.aac」(または「.m4a」)であることで識別されます。
ちなみに、AACはMP3と同じくドイツのFraunhofer-GesellschaftとFraunhofer Institute for Integrated Circuitsの研究者らが開発しました。
AACとMP3の違い
AACはMP3よりも効率的な圧縮アルゴリズムを使用しており、同じ音質であればMP3よりも小さなファイルサイズで保存できることがあります。
そのため、高音質のオーディオコンテンツをデジタル形式で配信する際に広く利用されています。
MP3が1993年開発に対し、AACが1997年なので、MP3よりもより進化した音声フォーマットです。
M4A(.m4a) .aacとの違い
M4A(.m4a)はAACと非常に関係性が深いものです。時にはM4A=AACとなります。紛らわしいのですが、M4AとAACには次のような違いがあります。
AACは音声を圧縮するための「コーデック(暗号化形式)」です。
一方、M4Aは音声を格納するための「コンテナ」です。音声ファイルであるAACやALACなどを格納することができます。
M4Aの中に入っている音声がAACの場合は、M4A=AACとなりますが、AAC以外の場合は違う音声になります。
M4AはAppleが開発し、MPEG-4 Part 14規格の一部として定義されたファイル形式です。MPEG-4は、国際標準化機構(ISO)と国際電気標準会議(IEC)によって開発された規格であり、多くの技術者や研究者によって共同で開発されたものです。
WAV(.wav)とは何か?
WAV(Waveform Audio File Format)は、非圧縮の音声データを保存するためのフォーマットです。MicrosoftとIBMが開発しました。
非圧縮のため非常に高品質な音を提供します。
WAVファイルは一般的に、PCM(Pulse Code Modulation)形式でエンコードされた音声データを保存するために使用します。
PCMはアナログ音声をデジタルデータに変換する際に使用される一般的な方法であり、音声信号を一定の時間間隔でサンプリングし、各サンプルを数値データとして表現します。
WAVファイルは、非圧縮の音声データを保存するため、高品質な再生が可能ですが、ファイルサイズが大きくなる傾向があります。そのため、WAVファイルは、高品質のオーディオやプロフェッショナルなオーディオ制作でよく使用されます。
ALAC(.m4a, .m4b)
ALAC(Apple Lossless Audio Codec)は、Appleによって開発された無損失音声圧縮フォーマットです。
無損失圧縮は、オーディオデータを効率的に圧縮しながらも、元の音質を完全に保持することができる圧縮形式です。
ALACは、オーディオファイルを圧縮することでストレージスペースを節約することができますが、圧縮されたファイルを再生する際にはオリジナルの音質を失うことはありません。
これにより、高品質の音楽をより少ないスペースで保存したり、高品質のオーディオストリーミングサービスを提供するために使用されます。
ALACはAppleのiTunesなどの製品やサービスで広く使用されていますが、他の一般的なプレーヤーやオーディオデバイスでもサポートされています。
音質の劣化がないため、音楽愛好家やオーディオファイルの品質にこだわる人々に好まれます。
ALACで圧縮した音声ファイルはM4AやM4Bなどのコンテナに入れるため、拡張子は「.m4a」や「.m4b」になります。
Ogg(.ogg)とは何か?
Oggは、音声やビデオなどのメディアファイルを保存するためのコンテナです。拡張子は.oggです。
非営利団体のXiph.Org Foundationによって開発されたオープンソースのマルチメディアフォーマットです。
Oggコンテナは、さまざまな種類のメディアデータを格納するための柔軟性がありますが、主に音声ファイルを保存するために使用されます。
Vorbis、Opus、FLACなどのさまざまなコーデックでエンコードされた音声データを含むことができます。
Oggはオープンソースのためライセンス料や制限がありません。このため、オープンソースのアプリケーションやプロジェクト、Webおよびストリーミングメディアのためのプラットフォームで広く採用されています。
Oggは映像も入れられる?
Oggコンテナ形式は、主に音声データを保存するために使用されますが、理論上は動画データも含むことができます。
しかし、実際には、Oggに動画を格納することはあまりありません。これは、動画形式を保存するには他のコンテナと比較して入れられる情報や機能が少ないためです。そのこともあってOggをサポートしているデバイスやソフトウェアは少ないのが現状です。
動画データを格納する場合、一般的にはより広くサポートされている動画コンテナ形式である、例えば、Matroska(.mkv)、MP4(.mp4)、WebM(.webm)などがより一般的に使用されます。
Vorbis(.ogg)とは何か?
Vorbis(ボアビス)は音声データを圧縮するためのオープンでロイヤリティフリーな音声コーデックです。
Oggと同じく非営利団体のXiph.Org Foundationが開発したものです。このため、VorbisはOggコンテナ形式に組み込むことができます。
Vorbisは、効率的な圧縮アルゴリズムを使用して音声データを圧縮します。同じ音質の音声をより小さなファイルサイズで保存することができます。
Vorbisは高音質のオーディオストリーミングやオーディオ配信、ゲーム音声などのさまざまな用途で広く使用されています。
オープンソースであるため、誰でも自由に使用し、改良することができます。このため、Vorbisは商業的なプロジェクトやオープンソースのアプリケーション、ウェブ上での音声コンテンツなど、さまざまな領域で広く利用されています。
Opus(.opus)とは何か?
Opusは音声データを圧縮するためのオープンでロイヤリティフリーな音声コーデックです。
音声通信のための次世代のコーデックとして開発され、高品質の音声を効率的に圧縮することができます。
音声通話や音声チャット、オーディオストリーミングなどのリアルタイム通信に最適化されています。
Opusの特徴はなんと言っても、低遅延で高品質の音声通信を提供することです。このため、音声通話や音声チャット、音声ストリーミングなどのアプリケーションに広く使用されています。
Skype、Discord、Google Meetなどの主要なビデオ会議システムもOpusを使っています。
Opusは多くの利点を持っています。高音質であると同時に低遅延であり、可変ビットレート(VBR)圧縮をサポートしており、ネットワークの帯域幅を最適化します。また、複数の音声コーデックの機能を組み合わせたものであり、さまざまなアプリケーションや環境に適した柔軟な選択肢を提供します。
非営利団体のXiph.Org Foundationによって開発され、オープンソースのプロジェクトとして管理されています。そのため、誰でも自由にOpusを使用し、改良することができます。ロイヤリティフリーであり、商業的なプロジェクトや個人のプロジェクトでも自由に使用することができます。
FLAC(.flac)とは何か?
FLAC(Free Lossless Audio Codec)は、音声データを無損失で圧縮するためのオープンソースの音声コーデックです。
つまり、圧縮されたデータは、元の音声ファイルからの情報損失なしに再生できます。
ファイルサイズを縮小するだけでなく、音質を保持することができるため、高品質の音楽ファイルの保存や転送に適しています。
オープンソースのプロジェクトとして開発され、その仕様と実装は一般に公開されています。そのため、誰でもFLACを自由に使用し、改良することができます。
FLACは、高品質の音声データを効率的に圧縮するための効果的なアルゴリズムを使用しており、圧縮率は一般的に50%〜70%程度になります。この圧縮率は、元の音声データの特性に依存しますが、音楽やオーディオブックなどの一般的なオーディオファイルであれば、効率的に圧縮することができます。
FLACは、音楽愛好家やオーディオファイルの品質にこだわる人々に広く使用されています。特に、高品質のオーディオファイルを保存したり、オーディオCDからのリッピングしたりする際によく使用されます。FLACファイルは、ほとんどのメディアプレーヤーやオーディオソフトウェアでサポートされており、一般的なオーディオフォーマットの1つとなっています。
米国のソフトウェア開発者であるジョシュア・モーズが中心となって開発されました。FLACは、2000年に最初のバージョンがリリースされました。
APE(.ape)とは何か?
APE(Monkey’s Audio)は、音声データを無損失で圧縮するための非常に効率的なコーデックです
圧縮されたファイルは元の音声からの情報損失がないため、完全な音質で再生できます。
Monkey’s Audioが開発したもので、WindowsやLinuxなどのオペレーティングシステムで利用可能です。オープンソースではなく、商業的なライセンスも必要です。
非常に高い圧縮率を実現し、圧縮されたファイルはFLACやWAVよりも小さなサイズで保存できます。
しかし、APEは一般的に圧縮速度が遅く、エンコードやデコードに多くのCPUリソースを必要とすることが知られています。
APEは、主に音楽愛好家やオーディオファイルの品質にこだわる人々によって使用されます。
まとめ
高圧縮した音声ファイルでは、今はMP3が強い時代ですが、将来的AACの方が主流になってくるでしょう(もうなってる?)
また、無損失データとしてはオープンソースのFLACが主流に。そして、音声通話や音声チャットなどのリアルタイム音声通信に特化したOpusもより普及してくることでしょう。
コメント