タケノコ畑の置手紙

ちょっとしたプログラムのこととかをにわかなりに書いてみるブログ

ちょっとした音とwavデータの話

前回はなんの説明もなく音を鳴らしてみたので、まずは音についてを話していきます。

音ってなに?(恒例)

「物が動き、こすれ、ぶつかって出る空気の震え(=疎密波)が耳に届いて聞こえるもの。」

はい。ご存知の通り空気の振動のことでございます。

 

これを電子データとして記録したものがwavデータです。

f:id:TaKeNoKo46:20180526001446p:plain

例えば1Hzのsin波を1秒間に20回の間隔で縦軸の値を測定します。

上の図の場合、値を並べると[0.0, 0.3, 0.6, 0.8, 0.9, 1.0, 0.9, 0.8, ・・・]

この時の測定間隔を標本化周波数(もしくはサンプリングレート)、縦軸の値をわける段階数を量子化ビット数といいます。

 

 

私たちが聴く音源、例えばCDを例に挙げると標本化周波数が44.1kHz、量子化ビット数が16bitといった音質になっています。

つまり1秒間に44,100回記録、それを2^16=65535段階に分けているということですね。

 

一般的によく使われる周波数は44.1か48kHzですが、これには深いわけがあります。

人間の耳は約20kHzまでの音しか認識できないとされているため、その範囲を表現するには2倍の40kHzで十分なのです。

定めた人は「40だと上から文句言われそうだしちょっと大きめの48にすっか!」みたいなことを言っていたんじゃないかと思います。(違う)

サンプリング定理というものによると標本化周波数 / 2 Hzまでが元の波形を復元できるギリギリのラインらしいです。感覚的にわかる感じもしますね。

 

量子化ビット数のほうは単純に音質に影響してきます。段階が大きいほど滑らかな波形を再現しやすく、小さいほどデータの間に差ができてしまってノイズが混じります。

サンプルを置いとくので差を確かめてみてください。※VOICEROID注意

 16bit

 8bit

京町セイカさんにご協力いただきました。(ダイマ)

www.ah-soft.com

8bitのほうがちょっとホワイトノイズ(?)っぽいものが聞こえると思います。

えっ?違いが判らない?  ・・・人間の耳なんてそんなもんです。

 

余談ですが音楽ファイルのmp3ってあるじゃないですか。

あれって純粋な波形のwavとは違って余分な16~20kHz分のデータを削り圧縮したものなんですよ。

というのも上のほうで「人間は20kHz!」と高らかに宣言いたしましたが 、実際多くの人たちは16kHzくらいまでしか聴こえないらしいんです。

私なんて15kHzがやっとなくらいですし。

 

なーんて話してる間に結構長くなってしまいました。

キリも良いので今回はこのあたりで。

それではまた次回の置手紙でお会いしましょう・・・