私たちが日常よく目にする音声ファイルにはMP3があります。
ですが、MP3以外にもAAC, WAV, m4a, Ogg, FLAC, ALAC, APE, Vorbis, Opusなど様々なものがあります。
例えば、Opusはあまり聞きなれませんが、Skype、Discord、Google Meetなど世界中で広く普及している主要なビデオ会議システムにも採用されている音声フォーマットです。
また、AACは拡張子が.aacのものや.m4aがあったりと、一見すると非常にわかりにくいことがあります。
ここではこれらの音声フォーマットは何が違うのか?それぞれの特徴やメリット、デメリットについてまとめています。
音声フォーマットの一覧
mp3, AAC, wav, m4a, ogg, flac, ALAC, APE, Vorbis, Opusなどの音声ファイルの種類や特徴を一覧にまとめると以下のようになっています。
音声フォーマット | 拡張子 | 形式 | 主な特徴 | 普及度 | 開発元 | 可逆性 |
---|---|---|---|---|---|---|
MP3 | .mp3 | コーデック | 高い圧縮率 | ◎ | ドイツの研究機関 | 非可逆圧縮 |
AAC | .aac | コーデック | 高い圧縮率(MP3の進化版) | ◎ | ドイツの研究機関 | 非可逆圧縮 |
M4A | .m4a | コンテナ | AACやALACを格納できる | ○ | Apple | – |
WAV | .wav | コーデック | 非圧縮 ファイルサイズが大きい | ○ | MicrosoftとIBM | 可逆圧縮 |
ALAC | .m4a, .m4b | コーデック | 無損失音声圧縮フォーマット | △ | Apple | 可逆圧縮 |
Ogg | .ogg | コンテナ | オープンソース Vorbis、Opus、FLACなどを格納可能 | △ | Xiph.Org Foundation | – |
Vorbis | .ogg | コーデック | オープンでロイヤリティフリー | △ | Xiph.Org Foundation | 非可逆圧縮 |
Opus | .opus | コーデック | オープンでロイヤリティフリー 音声通話や音声チャット、オーディオストリーミングなどのリアルタイム通信に特化 新しい | ○ | Xiph.Org Foundation | 非可逆圧縮 |
FLAC | .flac | コーデック | 無損失圧縮 オープンソース | ○ | ジョシュア・モーズ | 可逆圧縮 |
APE | .ape | コーデック | 無損失圧縮。高い圧縮率。 圧縮に時間がかかる(CPU、メモリを使用) | △ | Monkey’s Audio | 可逆圧縮 |
以下でそれぞれの詳細やメリデメについて解説しています。
なお、動画のフォーマット形式についてもまとめていますので、よかったら下記記事もご参考ください。
【動画の拡張子の特徴と違い】動画ファイル形式の一覧(mp4, webm, mkv, avi, asf, mov, flv, mts, m2ts)メリット・デメリット
MP3(.mp3)とは何か?
MP3(MPEG-1 Audio Layer 3)は、音声データを高い圧縮率で保存することができる音声フォーマットです。
拡張子は「.mp3」です。
音楽やオーディオコンテンツをデジタル形式で保存する際に広く使用されています。音声ファイルの中でも一番有名なのがMP3です。そのため、PCやスマホなどほとんどのデバイスで再生することができます。
MP3は高圧縮のためファイルサイズを小さくすることができます。また、高圧縮の割に音質の劣化が少なく、非常に万能な音声フォーマットです。
なお、MP3は1993年にドイツの研究機関であるFraunhofer-Gesellschaftとその姉妹機関であるFraunhofer Institute for Integrated Circuitsが開発しました。
- 高圧縮率のため、同程度の音質を維持しながらファイルサイズを大幅に削減できる。
- ファイルサイズが小さいため、WEB上で共有したり、携帯音楽プレーヤーやスマートフォンなどで再生できる。
- MP3は標準化された規格のため、ほとんどのデバイスでMP3ファイルを再生することが可能
- 音声データを圧縮するため、高い圧縮率を実現する一方で、一部の音声情報を失うことがある。
- 高品質な音楽ファイルをMP3形式で保存すると、音質が劣化する可能性がある。
- 圧縮は非可逆的であるため、一度圧縮された音声データを元の音声データに戻すことはできない。
- MP3は特許技術であり、MP3フォーマットを使用する場合にはライセンス料が必要となることがある(MP3を商業目的で使用する場合に追加のコストが発生する可能性がある)
AAC(.aac)とは何か?
AAC(Advanced Audio Coding)は、MP3と同様に、高音質の音声を比較的小さなファイルサイズで保存することができます。
AACは、MPEG-2やMPEG-4規格の一部として開発され、主にiTunesやiOSデバイスなどのApple製品で広く使用されています。圧縮のアルゴリズムが優れているため、高音質の音声を圧縮するのに向いています。
AACファイルは通常、拡張子が「.aac」(または「.m4a」)であることで識別されます。
ちなみに、AACはMP3と同じくドイツのFraunhofer-GesellschaftとFraunhofer Institute for Integrated Circuitsの研究者らが開発しました。
AACとMP3の違い
AACはMP3よりも効率的な圧縮アルゴリズムを使用しており、同じ音質であればMP3よりも小さなファイルサイズで保存できることがあります。
そのため、高音質のオーディオコンテンツをデジタル形式で配信する際に広く利用されています。
MP3が1993年開発に対し、AACが1997年なので、MP3よりもより進化した音声フォーマットです。
- MP3よりも高音質。同じビットレートで圧縮しても、AACの方が音質が向上する。
- MP3よりも効率的な圧縮アルゴリズムを使用しているため、より小さなファイルサイズで音声を保存できる。
- 多くのデバイスやプレーヤーでサポートされている(iTunesやiOSデバイス、Androidデバイスなど、様々なプラットフォーム利用可能)
- 持続的に進化している(新しいバージョンやプロファイルが開発され、より高い音質や効率性が実現されている)
- AACは特許技術であり、AACフォーマットを使用する場合にはライセンス料が必要となることがある(商業的な使用において追加のコストが発生する可能性がある)
- 圧縮は非可逆的。一度音声データを圧縮すると、元の音声データには戻すことがでない。
M4A(.m4a) .aacとの違い
M4A(.m4a)はAACと非常に関係性が深いものです。時にはM4A=AACとなります。紛らわしいのですが、M4AとAACには次のような違いがあります。
AACは音声を圧縮するための「コーデック(暗号化形式)」です。
一方、M4Aは音声を格納するための「コンテナ」です。音声ファイルであるAACやALACなどを格納することができます。
M4Aの中に入っている音声がAACの場合は、M4A=AACとなりますが、AAC以外の場合は違う音声になります。
M4AはAppleが開発し、MPEG-4 Part 14規格の一部として定義されたファイル形式です。MPEG-4は、国際標準化機構(ISO)と国際電気標準会議(IEC)によって開発された規格であり、多くの技術者や研究者によって共同で開発されたものです。
WAV(.wav)とは何か?
WAV(Waveform Audio File Format)は、非圧縮の音声データを保存するためのフォーマットです。MicrosoftとIBMが開発しました。
非圧縮のため非常に高品質な音を提供します。
WAVファイルは一般的に、PCM(Pulse Code Modulation)形式でエンコードされた音声データを保存するために使用します。
PCMはアナログ音声をデジタルデータに変換する際に使用される一般的な方法であり、音声信号を一定の時間間隔でサンプリングし、各サンプルを数値データとして表現します。
WAVファイルは、非圧縮の音声データを保存するため、高品質な再生が可能ですが、ファイルサイズが大きくなる傾向があります。そのため、WAVファイルは、高品質のオーディオやプロフェッショナルなオーディオ制作でよく使用されます。
- 非圧縮形式で音声を保存するため高品質
- 一切圧縮されていないため、再生時の音質劣化がほとんどない
- ほぼすべてのオーディオ再生ソフトウェアやデバイスでサポートされている
- 互換性の問題が少ない
- WAVファイルは非圧縮形式であるため、オーディオの編集や処理が容易
- 音声データが圧縮されていないため、オーディオ編集ソフトで正確な編集が可能
- 非圧縮形式のため、同じ長さのオーディオを保存する場合、他の圧縮形式に比べてファイルサイズが大きくなる
- ファイルサイズが大きいため、ストレージや帯域幅を効率的に使用することができない
- インターネット経由での配信やストリーミングには不向き
- 非圧縮形式であるため、他の一部の圧縮形式に比べて環境への依存性が高い
- 一部のプレーヤーやデバイスで再生や使用に問題が生じる可能性がある
ALAC(.m4a, .m4b)
ALAC(Apple Lossless Audio Codec)は、Appleによって開発された無損失音声圧縮フォーマットです。
無損失圧縮は、オーディオデータを効率的に圧縮しながらも、元の音質を完全に保持することができる圧縮形式です。
ALACは、オーディオファイルを圧縮することでストレージスペースを節約することができますが、圧縮されたファイルを再生する際にはオリジナルの音質を失うことはありません。
これにより、高品質の音楽をより少ないスペースで保存したり、高品質のオーディオストリーミングサービスを提供するために使用されます。
ALACはAppleのiTunesなどの製品やサービスで広く使用されていますが、他の一般的なプレーヤーやオーディオデバイスでもサポートされています。
音質の劣化がないため、音楽愛好家やオーディオファイルの品質にこだわる人々に好まれます。
ALACで圧縮した音声ファイルはM4AやM4Bなどのコンテナに入れるため、拡張子は「.m4a」や「.m4b」になります。
- 無損失圧縮形式であり、オーディオデータを効率的に圧縮するがオリジナルの音質を完全に保持できる。
- オリジナルの音声データと同等の高品質の音声のため非常に高品質
- Apple製品との互換性が高い
- ALACファイルは非圧縮のオーディオファイルよりも大きなファイルサイズになる。
- Appleが開発したフォーマットのため、互換性が限られる
- WindowsやAndroidなどの非Apple製品では、ALACファイルをネイティブで再生できるプレーヤーが少ない。
- Appleによって開発されたコーデックのため、使用する際にはライセンス料が必要となる場合がある
Ogg(.ogg)とは何か?
Oggは、音声やビデオなどのメディアファイルを保存するためのコンテナです。拡張子は.oggです。
非営利団体のXiph.Org Foundationによって開発されたオープンソースのマルチメディアフォーマットです。
Oggコンテナは、さまざまな種類のメディアデータを格納するための柔軟性がありますが、主に音声ファイルを保存するために使用されます。
Vorbis、Opus、FLACなどのさまざまなコーデックでエンコードされた音声データを含むことができます。
Oggはオープンソースのためライセンス料や制限がありません。このため、オープンソースのアプリケーションやプロジェクト、Webおよびストリーミングメディアのためのプラットフォームで広く採用されています。
Oggは映像も入れられる?
Oggコンテナ形式は、主に音声データを保存するために使用されますが、理論上は動画データも含むことができます。
しかし、実際には、Oggに動画を格納することはあまりありません。これは、動画形式を保存するには他のコンテナと比較して入れられる情報や機能が少ないためです。そのこともあってOggをサポートしているデバイスやソフトウェアは少ないのが現状です。
動画データを格納する場合、一般的にはより広くサポートされている動画コンテナ形式である、例えば、Matroska(.mkv)、MP4(.mp4)、WebM(.webm)などがより一般的に使用されます。
- オープンソースのためライセンス料や制限がない。
- VorbisやOpusなどの高品質なオーディオコーデックをサポートしている。
- 効率的な圧縮アルゴリズムを使用しており、音声データを比較的小さなファイルサイズで保存可能
- 主に音声ファイルを保存するためのコンテナ形式として設計されており、動画データを格納するための機能が他の動画コンテナ形式よりも限られる。
- MP3やAACと比較して、対応していないデバイスが多い。
- 開発が一時期停滞していたため、新しい機能や改善が他のフォーマットよりも遅れている。
Vorbis(.ogg)とは何か?
Vorbis(ボアビス)は音声データを圧縮するためのオープンでロイヤリティフリーな音声コーデックです。
Oggと同じく非営利団体のXiph.Org Foundationが開発したものです。このため、VorbisはOggコンテナ形式に組み込むことができます。
Vorbisは、効率的な圧縮アルゴリズムを使用して音声データを圧縮します。同じ音質の音声をより小さなファイルサイズで保存することができます。
Vorbisは高音質のオーディオストリーミングやオーディオ配信、ゲーム音声などのさまざまな用途で広く使用されています。
オープンソースであるため、誰でも自由に使用し、改良することができます。このため、Vorbisは商業的なプロジェクトやオープンソースのアプリケーション、ウェブ上での音声コンテンツなど、さまざまな領域で広く利用されています。
- 効率的な音声圧縮アルゴリズムで高音質。
- オープンソースであり、ロイヤリティフリーであるため、商業的なプロジェクトや個人のプロジェクト利用可能。
- 音声データを比較的小さなファイルサイズで圧縮することが可能。
- 一般的な音楽プレーヤーやデバイスでサポートされているコーデックよりも普及していない。
- Vorbisは、他の一般的なオーディオフォーマット(例: MP3やAAC)と比較して、標準化された形式としての普及が限られる。
Opus(.opus)とは何か?
Opusは音声データを圧縮するためのオープンでロイヤリティフリーな音声コーデックです。
音声通信のための次世代のコーデックとして開発され、高品質の音声を効率的に圧縮することができます。
音声通話や音声チャット、オーディオストリーミングなどのリアルタイム通信に最適化されています。
Opusの特徴はなんと言っても、低遅延で高品質の音声通信を提供することです。このため、音声通話や音声チャット、音声ストリーミングなどのアプリケーションに広く使用されています。
Skype、Discord、Google Meetなどの主要なビデオ会議システムもOpusを使っています。
Opusは多くの利点を持っています。高音質であると同時に低遅延であり、可変ビットレート(VBR)圧縮をサポートしており、ネットワークの帯域幅を最適化します。また、複数の音声コーデックの機能を組み合わせたものであり、さまざまなアプリケーションや環境に適した柔軟な選択肢を提供します。
非営利団体のXiph.Org Foundationによって開発され、オープンソースのプロジェクトとして管理されています。そのため、誰でも自由にOpusを使用し、改良することができます。ロイヤリティフリーであり、商業的なプロジェクトや個人のプロジェクトでも自由に使用することができます。
- 高品質な音声。低ビットレートから高ビットレートまで、幅広いビットレートで高品質の音声を実現。
- 低遅延。 リアルタイム通信用に設計されており、低遅延で音声を送信することが可能。
- 音声通話や音声チャットなどのリアルタイムコミュニケーションに適する。
- 可変ビットレート(VBR):VBR圧縮をサポートしており、音声データの帯域幅を最適化することが可能。(ネットワーク帯域幅の効率的な利用ができる)
- 音声通話、音声チャット、オーディオストリーミングなど、さまざまなアプリケーションに広く使用されている。
- オープンソースのプロジェクトかつロイヤリティフリー
- 一部のアプリケーションやデバイスでは、Opusのサポートが不十分な場合がある。
- 比較的新しいコーデックであり、しっかりと標準化されていない。
FLAC(.flac)とは何か?
FLAC(Free Lossless Audio Codec)は、音声データを無損失で圧縮するためのオープンソースの音声コーデックです。
つまり、圧縮されたデータは、元の音声ファイルからの情報損失なしに再生できます。
ファイルサイズを縮小するだけでなく、音質を保持することができるため、高品質の音楽ファイルの保存や転送に適しています。
オープンソースのプロジェクトとして開発され、その仕様と実装は一般に公開されています。そのため、誰でもFLACを自由に使用し、改良することができます。
FLACは、高品質の音声データを効率的に圧縮するための効果的なアルゴリズムを使用しており、圧縮率は一般的に50%〜70%程度になります。この圧縮率は、元の音声データの特性に依存しますが、音楽やオーディオブックなどの一般的なオーディオファイルであれば、効率的に圧縮することができます。
FLACは、音楽愛好家やオーディオファイルの品質にこだわる人々に広く使用されています。特に、高品質のオーディオファイルを保存したり、オーディオCDからのリッピングしたりする際によく使用されます。FLACファイルは、ほとんどのメディアプレーヤーやオーディオソフトウェアでサポートされており、一般的なオーディオフォーマットの1つとなっています。
米国のソフトウェア開発者であるジョシュア・モーズが中心となって開発されました。FLACは、2000年に最初のバージョンがリリースされました。
- 無損失の音声圧縮のため、圧縮されたデータは元の音源からの情報損失がなく、完全な音質で再生できる。
- 圧縮されたファイルは、オーディオCDと同等またはそれ以上の音質を持つ。
- 効率的な圧縮アルゴリズムを使用しているため、元の音声ファイルを比較的小さなファイルサイズで保存できる。
- オープンソースのプロジェクトであり、誰でも自由に利用し、改良できる。
- 広く普及しており、ほとんどのメディアプレーヤーやオーディオソフトウェアでサポートされている。
- 無損失圧縮を行うため、一般的に圧縮されたオーディオファイルよりも大きなファイルサイズになる
- ストリーミングサービスやオンラインラジオには不向き
APE(.ape)とは何か?
APE(Monkey’s Audio)は、音声データを無損失で圧縮するための非常に効率的なコーデックです
圧縮されたファイルは元の音声からの情報損失がないため、完全な音質で再生できます。
Monkey’s Audioが開発したもので、WindowsやLinuxなどのオペレーティングシステムで利用可能です。オープンソースではなく、商業的なライセンスも必要です。
非常に高い圧縮率を実現し、圧縮されたファイルはFLACやWAVよりも小さなサイズで保存できます。
しかし、APEは一般的に圧縮速度が遅く、エンコードやデコードに多くのCPUリソースを必要とすることが知られています。
APEは、主に音楽愛好家やオーディオファイルの品質にこだわる人々によって使用されます。
- 無損失の音声圧縮のため、元の音声ファイルからの情報損失なく、完全な音質で再生可能
- 非常に効率的な圧縮アルゴリズムを使用しているため、圧縮されたファイルは小さなファイルサイズで保存される。
- 可逆圧縮であり、元の音声ファイルを正確に再現することができます。
- 一般的なオーディオフォーマットと比較して、あまり普及していない。
- エンコードおよびデコードに多くのCPUリソースを必要する(高圧縮率の設定や大きなファイルサイズの場合、処理に時間がかかる)
- ストリーミングサービスやオンラインラジオには不向き
- ライセンスが必要
まとめ
高圧縮した音声ファイルでは、今はMP3が強い時代ですが、将来的AACの方が主流になってくるでしょう(もうなってる?)
また、無損失データとしてはオープンソースのFLACが主流に。そして、音声通話や音声チャットなどのリアルタイム音声通信に特化したOpusもより普及してくることでしょう。
コメント