音楽ファイル形式ってどんな種類があるの?それぞれの特徴をまとめました。
近年、デジタルミュージックが主流になり、CDを聴く機会が減ったと言う方も多いのではないでしょうか?
今やネットから直接アーティストのMP3を購入できるようになりました。
MP3と言えば音源からの圧縮率が高く、ハードウェアのサポートも整備されていますので、現在は互換性も気にすることないですね。
しかし、元の音質に戻せない性質から、どうしても音質は劣化します。
例えば、WAVとMP3を聴き比べてみると音質の違いは一目瞭然です。とは言え、MP3は元々人間が聞き取りにくい音を圧縮していますので、圧縮率を低く設定することでCD音質に近いままの圧縮も可能です。
今回は音楽ファイル形式の種類と、それぞれの音楽ファイル形式の特徴を備忘録も兼ねて書いておきたいと思います。
目次
可逆圧縮方式と非可逆圧縮方式とは?
音楽ファイルは無圧縮、可逆圧縮、非可逆圧縮の3種類に分類されます。
無圧縮
無圧縮はその名の通り、圧縮されていないファイルです。当然ファイルサイズは大きくなり、ハードディスクなどに保存する際に容量を食います。しかし、圧縮されていないことから、音質が良いです。
可逆圧縮
可逆圧縮は、一度圧縮しても元のデータに戻すことができます。このことからデータが劣化しない為、「ロスレス(Lossles)圧縮」とも呼ばれています。ファイルサイズを減らせる上に、音質劣化も防げるので人気があります。
非可逆圧縮
非可逆圧縮は一度圧縮したデータを元に戻すことはできません。データ劣化はしますが、ファイルサイズを大幅に減らすことができます。
音楽ファイル形式の種類
音楽ファイル形式の種類や特徴を下に挙げておきます。圧縮方式を踏まえた上で、ご自分に合った形式を見つけてみて下さい。
WAVE(WAV)
- Waveform Audio File Format
- 読み方(ウェーブ)
- Windowsで使われる標準の音声形式。圧縮する前の音楽ファイルでCDとほぼ同じ音質。
- 無圧縮
- 拡張子は.wav
AIFF
- Audio Interchange File Format
- 読み方(アイフ)
- Macの標準音声形式。圧縮する前の音楽ファイルでCDとほぼ同じ音質。
- 無圧縮
- 拡張子は.aif
MP3
- MPEG-1 Audio Layer-3
- 読み方(エムピースリー)
- カラー動画像の圧縮方式であるMPEG-1のMPEG Audio規格に分類される圧縮方式。その為、正式名称はMPEG Audio Layer-3と言う。MPEG Audio規格は音声情報圧縮技術で、Layer1が4分の1、Layer2が8分の1、Layer3が最高12分の1の圧縮率を得ることができる。人間の聞き取りにくい周波数帯の音を圧縮することで、CD並みの音質を保ったままデータ量を圧縮することができる。音質をほぼ保ったままの圧縮率はLayer1とLayer2である。
- 非可逆圧縮
- 拡張子は.mp3
WMA
- Windows Media Audio
- 読み方(ダブリューエムエー)
- Microsoft社が開発した同社製品の標準音声圧縮形式。Windowsなどに搭載されているマルチメディア技術を構成する技術の1つ。人間の聞き取りにくい周波数帯の音を圧縮することで、CD並みの音質を保ったままデータ量を圧縮することができる。
- 非可逆圧縮
- 拡張子は.wma
Ogg Vorbis
- Ogg Vorbis
- 読み方(オッグボービス)
- Ogg Projectが開発した音声圧縮形式。MP3やWMAなどは、著作権や特許の問題から、企業が自由に扱えるファイルではありません。Ogg Vorbisはそう言った問題のないフリーな音声圧縮形式です。音質もMP3と同程度と言われていますが、対応機器がまだ少ない印象。
- 非可逆圧縮
- 拡張子は.ogg
AAC
- Advanced Audio Coding
- 読み方(エーエーシー)
- 動画再生を目的とした規格のMPEG2や、マルチメディアアプリケーションの総合規格であるMPEG4で使用される音声圧縮方式。iTunes Storeの楽曲や地上デジタル放送、BSデジタル放送にも採用されている。
- 非可逆圧縮
- 拡張子は.aac .mp4 .m4a
RealAudio
- RealAudio
- 読み方(リアルオーディオ)
- 米リアルネットワークス社が開発した音声圧縮方式と、その配信システムの総称。インターネットでの音声コンテンツ再生などに使用される。同社が提供するマルチメディア再生ツールのReal Playerで扱われる音声ファイル。
- 非可逆圧縮
- 拡張子は.ra .rm .ram
Flac
- Free Lossless Audio Codec
- 読み方(フラック)
- Oggプロジェクトで採用されている可逆圧縮コーデック。コーデックとは圧縮と伸長、つまりエンコードとデコードを可能にする機器やソフトウェアの事。可逆圧縮なのでデータ劣化が無く、変換速度も速いことから人気がある。
- 可逆圧縮
- 拡張子は.flac
APE
- APE
- 読み方(エーピーイー、エイプ)
- 「Monkey’s Audio」と言う音声データ圧縮ソフトで圧縮された音楽ファイル形式。WAVEファイルを可逆圧縮することが可能で圧縮率が高い。その反面、伸張時のハードウェア負荷や、バージョンによる互換性の問題もある。伸張せずそのまま扱う分には対応機器も増えており、容量節約が優先事項ならば第一選択肢となる印象。
- 可逆圧縮
- 拡張子は.ape
TTA
- The True Audio
- 読み方(ティーティーエー)
- フリーウェアGPL(GNU General Public License)の音声圧縮規格。デコード速度やハードウェア負荷はFLACに劣るが、圧縮速度が速く圧縮率もそこそこ。圧縮率はMonkey’s Audioに劣る。FLACとAPEと比べた場合、総合的にバランスが取れている。
- 可逆圧縮
- 拡張子は.tta
WavPack
- WavPack
- 読み方(ウェブパック)
- David Bryantが開発したフリーかつオープンソースの可逆音声圧縮コーデック。非可逆圧縮モードも兼ね備えている。圧縮率やエンコード速度、デコード速度はTTAと同程度。
- 可逆圧縮
- 拡張子は.wv
TAK
- Tom’s lossless Audio Kompressor
- 読み方(ティーエーケー)
- FLACのコードをベースに開発されたフリーの可逆圧縮音声形式。Monkey’s Audio並みの高い圧縮率とFLAC並みのエンコード速度、デコード速度を持つ。Exact Audio CopyやFoobar2000を使っているならtakは非常に便利。cueシート対応。
- 可逆圧縮
- 拡張子は.tak
MAQ
- MASTER QUALITY AUTHENTICATED
- 読み方(エムエーキュー)
- 英国の高性能オーディオ及びビデオコンポーネントシステムを開発しているメーカー「Meridian Audio」が開発した新しい音声フォーマット。サンプリング周波数が高いほどファイルサイズを抑えることができると言う特徴がある。可逆圧縮に対応しており、MAQ対応再生機器ではマスタークオリティで再生することができる。FLACコンテナに格納して配信されている場合は、FLAC対応機器で再生できる。その場合はCD音質で再生される。
- 可逆圧縮
- 拡張子は.mqa
説明文を要約するに辺り、以下のサイトを参考にしました。
参考:『ウィキペデイア』
参考:『e-Words』
参考:『weblio辞書』
参考:『ASCII.jpデジタル用語辞典』
音楽ファイル形式一覧表
上記で挙げたそれぞれの特徴を踏まえた上で、一覧表を作りました。
※汎用性については現在販売されているデジタルオーディオプレイヤーの対応フォーマットを参考に独断で書いています。
ファイル形式 | 圧縮方式 | 音質劣化 | 汎用性 |
WAVE | 無圧縮 | なし | ◎ |
AIFF | 無圧縮 | なし | ○ |
MP3 | 非可逆圧縮 | あり | ◎ |
WMA | 非可逆圧縮 | あり | ○ |
Ogg Vorbis | 非可逆圧縮 | あり | △ |
AAC | 非可逆圧縮 | あり | ○ |
RealAudio | 非可逆圧縮 | あり | × |
FLAC | 可逆圧縮 | なし | ◎ |
APE | 可逆圧縮 | なし | ○ |
TTA | 可逆圧縮 | なし | × |
WavPack | 可逆圧縮 | なし | × |
TAK | 可逆圧縮 | なし | × |
MAQ | 可逆圧縮 | MAQ対応機器で再生した場合はなし。FLACで再生した場合はあり | × |
サンプルレートとビットレートと量子化ビット数
音楽ファイルを扱っているとよく耳にするのが「サンプリングレート」と「ビットレート」と「量子化ビット数」です。この3つの用語の意味を理解しておくと、音楽ファイルを扱う上で幅も広がります。
サンプリングレートとは?
まず、「サンプリング」とはアナログ信号を一定間隔の時間や座標で区切り(離散化)、有限の桁数の数値に変換(量子化)することを指します。これを日本語で「標本化」と言います。標本化されたデータをそのまま記録する方式が、よく目にする「PCM」のことです。リニアPCMとも呼ばれていてLPCMと表記されていたりします。ハイレゾの一部を除くデジタル音源の大半はリニアPCMです。
そして、「サンプリングレート」とはアナログ信号をデジタル信号に変換(A/D変換)する際の単位時間当たりの標本化回数のことです。サンプリング周波数とも言われています。
自然界に存在する音や光の波形をコンピューター上で処理するには数値化が必要です。サンプリングレートはその数値化を行う回数をHz(ヘルツ)と言う単位で表します。
一般的にはこのサンプリングレートが高いほど高音質と言われています。例えば、CD音源で使用されているWAVファイルのサンプリングレートは44.1kHzです。これは毎秒441000回サンプリングが実行されていることになります。
量子化ビット数とは?
「量子化ビット数」とはサンプリングで離散化したデータ1つ1つに与えられる情報量のことです。ビット深度とも言われています。
単位は8bit,16bit,24bit,32bitと言うように表わします。
例えば、一般的な音源に使われている16bitの場合、サンプリングで離散化したデータに2の16乗である65536段階の情報量が与えられていることになります。※1bitは「0か1」の2段階で表現される。
つまり、量子化ビット数が大きいほど情報量も多くなり、高音質になります。
ビットレートとは?
「ビットレート」とは1秒当たりのデータ量のことです。単位はbps(bit per second)で表します。
データ量が多い=ビットレートが高いので、音質は良くなりますがその分容量も大きくなります。
ビットレートはサンプリングレートと量子化ビット数を掛け合わせたもので、数式でも計算できるようになっています。
例:16bit 44.1kHzの場合
- 44,1(kHz) × 16(bit) × 2(ステレオ2チャンネル)= 1,411.2(kbps)
ハイレゾについて
ハイレゾとは「High Resolution」略で「高解像度」を意味します。
音楽業界で言うハイレゾとは、JEITA(一般社団法人 電子情報技術産業協会)によると、CDスペックを超えるデジタルオーディオが望ましいとされています。
具体的にはリニアPCMにおいて「サンプリングレート」「量子化ビット数」のどちらかがCDスペックより上回っているものとされています。※DAT/DVDフォーマットのサンプリングレート48kHZ、16bitも含む。
音楽業界では、CD音源のサンプリングレートと量子化ビット数が標準となっています。しかし、DAT/DVDのフォーマットも含まれるので、
- サンプリングレートが48kHz
- 量子化ビット数が16bit
のどちらかを上回っている音源はハイレゾ音源と定義されています。
ハイレゾ音源は、
- サンプリングレートが48kHz
- 量子化ビット数が24bit
のように少なくともどちかのスペックがCD音源を上回っています。
また、一般社団法人 日本オーディオ協会では「ハイレゾオーディオロゴ」の定義と定め、この条件を満たした録音機器や再生機器にはハイレゾオーディオロゴが表示されています。
ハイレゾ音源の音楽ファイル形式は、FLACやDSDやMQAと言った音楽フォーマット販売されています。
DSDとは何か?
DSDとはDirect Stream Digital(ダイレクト・ストリーム・デジタル)の略称で、1999年にフィリップスとソニーによって次世代のコンシューマーオーディオのSuper Audio CDで採用されたデジタル信号です。
サンプリングレートはCD(44.1kHz)の64倍である2.8224MHz、更に高音質な128倍の5.6448MHzが存在します。
サンプリングレートの項目でも説明しましたが、サンプリングの過程で8bit,16bit,24bit,32bitと言うように量子化されたデータをそのまま記録する方式が「リニアPCM」方式です。
対して、DSDは1bit固定で量子化します。つまり「0か1」の2段階で表現されています。しかし、サンプリングレートはCDの64倍あるので、ビットレートはCDの4倍になります。
- 例:2.8224(MHz) × 1(bit) × 2(ステレオ2チャンネル)= 5.6448(Mbps)
これをkbpsに変換すると5,644.8(kbps)となり、データ量はCD音源1,411.2(kbps)の4倍です。
つまり、PCMが縦軸の量子化ビット数で情報量を確保しているのに対し、DSDでは横軸(時間軸)で量子化ビット数の密度を細かくすることにより情報量を確保しています。
まとめ
今回まとめた音楽ファイル形式の他にも、あまり知られていない音楽ファイル形式はあります。
マイナーな形式は汎用性が悪いので扱いづらいです。
基本的に、PC、家庭用オーディオプレイヤー、ポータブルオーディオプレイヤー、スマートフォンなどで聴く分にはWAV、MP3、FLAC辺りにしておけば無難だと思います。Apple製品の場合はAACですかね。
昔は、圧縮率の高さに惹かれてMonker’s AudioでAPEファイルにして音楽をPCに保存していました。
しかしHDDやSSD、USBなどが大容量化するにつれ、そんなに容量を気にする必要もなくなった為今は使っていません。その頃はAPE対応のデバイスも少なかったので不便に感じることがありましたので。
今はMP3プレーヤーを見てもAPEに対応しているものが増えていますので昔よりは選択肢が増えた印象です。
それぞれの違いを大まかに頭に入れて、自分好みのフォーマットを見つけてみてください。