見出し画像

最近あまり気にしなくなった音声圧縮技術

近年は、携帯音楽プレーヤーやスマートフォンなどで扱える保存容量が大きくなっているためか、できるだけ音質を保ちつつファイル容量を小さくする需要が少なくなってきていると思う。

どちらかというと、youtubeをはじめとする動画媒体での利用が増えてきていて、映像圧縮技術を気にする場面のほうが多いかもしれない。

しかしまぁ、インターネッツ老害で懐古厨の筆者は、音声圧縮技術に焦点を当てて記事を書くことにする。

★ロスレスとロッシー

音声圧縮をする際に、音質の劣化が無いロスレス(可逆圧縮)と、音質の劣化があるロッシー(非可逆圧縮)の分類がある。

ロスレスはエンコード前から音質の劣化が起こらないものの、データ容量はあまり減らせない。

CDをパソコンに取り込んで保存しておく場合や、音声素材として再エンコードしたい場合などの用途が考えられる。

例えば、FLACALACMonkey's AudioThe True AudioTAKといった種類がある。

一方、ロッシーは人間の耳には分かりにくい範囲で音質の劣化が起きるものの、データ容量をかなり減らせる。

インターネットを介したストリーミング配信での利用や、携帯端末から音楽を聴く場合など、回線の速さや記憶容量が制限される状況では、この圧縮方式が向いていると考えられる。

有名なMP3AACWMAVorbisMusepackなどの種類がある。

なお、動画の音声部分はこちらのロッシー方式(多くはAAC)が使われている。

★CD音質の話

近年、ハイレゾで録音された音楽が普及してきている。

ここでは標準的なCD-DAの規格を基準に解説する。

実際の音(アナログ)を電子データとして圧縮する(デジタル)際に、量子化ビット数やサンプリング周波数、チャンネル数などの仕様を決める必要がある。

CDの場合、量子化ビット数は16ビット、サンプリング周波数は44.1kHz(=44,100Hz)、チャンネル数は2(=ステレオ)となる。

かんたんに説明すると、1秒間に4万4100回サンプリング(標本化)を行い、1つのサンプルにつき16ビットのデータ量で波形を表現している、これを2チャンネル分行う、という意味になる。

ビットレートを計算すると、44100*16*2=1411200
→1411.2kbps
となる。

パソコンからこのまま(非圧縮)の状態で音声ファイルとして扱う場合は、WAVEファイルとなり、拡張子.WAVなどを付けられる場合が多い。

1分で約10.5MB、1時間で約630MBとなるため、昔のパソコンなどではこのままだと扱いにくく、圧縮する必要があった。

★ロスレスの代表格FLAC

Windows、Mac、LinuxといったOSのパソコンのほか、最近の携帯用音楽プレーヤーでは多くのもので利用可能である。フリーライセンスということで、多くの機器において利用できる。

ロスレスを採用したいが迷う場合は、FLACを選ぶことをおすすめしたい。

https://ja.osdn.net/projects/flac/

★昔から使われているMP3

1990年代に登場し、今でも使われているMP3。拡張子は.mp3など。

ビットレートは32kbps~320kbpsまでに対応し、概ね128kbps~192kpbsで使われることが多い。そのため、非圧縮(1411.2kbps)からデータ量が約1/11~1/12まで圧縮できると言われる。

当初、MP3の技術に特許がかかっていたため、あまり使われなかったが、フリーで利用できる「午後のこ~だ」や「LAME」といったエンコーダが登場したことによって、一気に普及した。なお、2017年に特許が切れたらしい。

おすすめのMP3エンコーダはLAME。

プリセットを利用すると、煩雑なコマンドラインオプションを覚えなくても、好みの音質/ビットレートでMP3にエンコードできる。

★主流になってきたAAC

音声単体としてもMP3に代わり主流になっており、動画用の主流な圧縮方式がmp4(H.264+AAC)ということから、この用途としては独占に近い印象を受けるAAC。音声単体の場合の拡張子は.m4aなど。

主なエンコーダはiTunes、Nero AACqaacなど

(筆者がググった限りにおいて)リスニングテストでは、qaacが最も音質が良いとされる。

個人的には、昔からNero AACを使ってきたので、エンコードオプションに馴染んでいることもあって、Nero AACが好み。

AACには、いくつか派生した規格がある。単に「AAC」と呼ぶ場合、一般的に広く使われるAAC-LCを指す。

AAC-LCにSBRの機能を追加したHE-AAC。64kbps程度のビットレートで有利とされる。

AAC-LCにSBRとPSの機能を追加したHE-AACv2。24~48kbps程度のビットレートで有利とされる。

しかし、近年はネット回線の高速化、データ保存領域の大容量化のためか、AAC-LC以外の規格が使われる場面はほとんど見かけない(筆者の主観です)。

★まとめ

手持ちのCDをパソコンなどに保存したいときに、ロスレスかロッシーかを検討し、さらに、どうやってエンコードしようか迷った際の参考程度になれば良いかなと思います。

あとは、ストリーミング配信や動画編集において、ビットレートやらなんやらの設定するときの参考にもひょっとしたらなるかもしれません。

るんるーん♪