なぜ僕たちにハイレゾが必要なのか

http://qiita.com/keiya/items/c994c200e8b38b6c7935
に書かれていることは半分間違っていると思う。個人的な意見では48kHzより上のサンプリング周波数は要らないが量子化ビット数は20bitくらいあるべきだ。まあ24bitが都合いいのだろう。つまり24bit/48kHzがもっとメジャーになってほしい。24bit/192kHzは不要というのは同意できる。


もし録音したい対象が一つの楽器群だったり一人の声だったりするならそれは16bitの分解能で十分だろう。65536段階の位相が表現できるからだ。しかし僕らが聞いているのは大量の楽器が詰め込まれたオケに、9人の歌声が重なった楽曲群である。9人の声を同音量で重ねて音割れを許容しない場合、一人の音声データのピーク位相を3640くらいまでに抑える必要があり、12〜13bit相当の音質になる。で、それで十分なのか? という話である。


さらにオケが入るとさらにボーカルのダイナミックレンジは半分くらいに下げないといけなくなるかもしれない。そうするとミックスされた音声に含まれる一人の声の分解能は11bitくらいまで下がってしまう。そしてそれが問題ないのかというとちょっと問題あるような気がするかも、という感じ。


冒頭のリンクのサイトではバイクの絵で256色でも問題ないと言っているがそれはバイク単体の絵だからであって、風景にめちゃくちゃ明るい太陽や木々がありバイクが逆光で非常に暗く描かれており微妙な明暗が必要な絵だった場合に「バイクが真っ黒に塗りつぶされてしまっても全体の傾向は変わらないしいいよね」といっているような話である。9人が歌って素人には聞き分けられないから花陽の声は潰れてもいいよね、とかではダメなのである。



(とか書いているが自分ではハイレゾ音源は持ってないどころかSBCのBTイヤホンを使ってるような適当な人間なのであまり自信がない)