ちょっとした音とwavデータの話
前回はなんの説明もなく音を鳴らしてみたので、まずは音についてを話していきます。
音ってなに?(恒例)
「物が動き、こすれ、ぶつかって出る空気の震え(=疎密波)が耳に届いて聞こえるもの。」
はい。ご存知の通り空気の振動のことでございます。
これを電子データとして記録したものがwavデータです。
例えば1Hzのsin波を1秒間に20回の間隔で縦軸の値を測定します。
上の図の場合、値を並べると[0.0, 0.3, 0.6, 0.8, 0.9, 1.0, 0.9, 0.8, ・・・]
この時の測定間隔を標本化周波数(もしくはサンプリングレート)、縦軸の値をわける段階数を量子化ビット数といいます。
私たちが聴く音源、例えばCDを例に挙げると標本化周波数が44.1kHz、量子化ビット数が16bitといった音質になっています。
つまり1秒間に44,100回記録、それを2^16=65535段階に分けているということですね。
一般的によく使われる周波数は44.1か48kHzですが、これには深いわけがあります。
人間の耳は約20kHzまでの音しか認識できないとされているため、その範囲を表現するには2倍の40kHzで十分なのです。
定めた人は「40だと上から文句言われそうだしちょっと大きめの48にすっか!」みたいなことを言っていたんじゃないかと思います。(違う)
サンプリング定理というものによると標本化周波数 / 2 Hzまでが元の波形を復元できるギリギリのラインらしいです。感覚的にわかる感じもしますね。
量子化ビット数のほうは単純に音質に影響してきます。段階が大きいほど滑らかな波形を再現しやすく、小さいほどデータの間に差ができてしまってノイズが混じります。
サンプルを置いとくので差を確かめてみてください。※VOICEROID注意
16bit
8bit
京町セイカさんにご協力いただきました。(ダイマ)
8bitのほうがちょっとホワイトノイズ(?)っぽいものが聞こえると思います。
えっ?違いが判らない? ・・・人間の耳なんてそんなもんです。
余談ですが音楽ファイルのmp3ってあるじゃないですか。
あれって純粋な波形のwavとは違って余分な16~20kHz分のデータを削り圧縮したものなんですよ。
というのも上のほうで「人間は20kHz!」と高らかに宣言いたしましたが 、実際多くの人たちは16kHzくらいまでしか聴こえないらしいんです。
私なんて15kHzがやっとなくらいですし。
なーんて話してる間に結構長くなってしまいました。
キリも良いので今回はこのあたりで。
それではまた次回の置手紙でお会いしましょう・・・