3.デジタルが音になるまで

前章で説明した通り、デジタルを扱う為にはどんなものも1,0の2進法データに変換しなければいけません。

しかし、画像にしろ音にしろいきなり色や音の周波数を1,0のデータに変換できる訳ではありません。

デジタルデータにするには必ず、サンプリング(標本化)→量子化(ビット化)→符号化(コーデック)という工程を踏みます。この工程をA/D変換、デジタル化したものをアナログに戻す逆の過程の事をD/A変換と呼びます。Analog(アナログ)→Digital(デジタル)だからA/D変換、Digital(デジタル) →Analog(アナログ)だからD/A変換です。

厳つい言葉が並んでいてうんざりしますが、これがデジタルで問題になる時の根源であったりするので重要です。この馴染みのない言葉や数字はさほど意味はありません。デジタル化するにはどのような工程が必要なのかを知る事が重要なのです。

3-1 サンプリング(標本化)するとは

デジタル変換を行う為にまず行うのが、サンプリング(標本化)です。

言葉だけだとイメージが掴みにくいですね。標本という言葉を聞くと昆虫や鉱石の標本を思い浮かべるかもしれません。昆虫と音や色ではサンプルの取り方は大きく違っていますが目的は同じです。標本(サンプル)とは全体から一部を取り出し、繰り返し観測出来るように並べる(データ化)する事です。

少し日本語が難解になってしまいました。

カブトムシを例にとると、ある昆虫博物館の館長が日本の山でカブトムシを採集して標本にしたいと考えました。裏山でカブトムシを捕まえる事が出来ました。それは日本に生息するカブトムシのごく一部です。そのカブトムシより大きな個体や小さな個体、少し変形したものもいるかもしれません。しかし、それを見ればカブトムシであると知ることが出来、昆虫博物館へ行って標本を見れば何度でも確認できます。それが標本化の目的とするところです。

サンプリングレート

更に詳しくカブトムシの事を知りたいと思ったなら一つの山のカブトムシ1匹じゃ不十分です。もっとよく知るには北海道から沖縄までのカブトムシのサンプルが必要です。これがサンプル数を増やすという事です。このサンプル数(捕獲したカブトムシの数)がデジタルでいうサンプリングレートにあたります。

カブトムシマニアだと、「地元の一つの山の一つの木からサンプリングしただけでは何もわからない」と思うでしょう。世界中、北から南の標本を並べられると確かに違いがあって素人からしても面白い発見です。しかし、「実は隣の山とも差もあるんだよ、足の長さが平均で0.01ミリ違っていて・・・」。と言われると普通の人はもうどうでもいいと思い始めるのではないでしょうか?

これが、どれだけサンプリングレートが必要か? という概念です。

カブトムシに足が6本あって頭胸腹に分かれている、という事を知るだけなら1匹の標本で十分です。日本のカブトムシについて知りたいなら地方ごとのサンプルが必要です。もし、日本のカブトムシの全てを完璧に知りたい、標本にしたいと思ったら日本中全てのカブトムシを採取しなければいけません。しかし、そうすると日本のカブトムシは全滅してしまい、カブトムシを知る意味が変わってしまいます。あくまでサンプルはサンプルなので全てを完全に知ることは出来ません

 

デジタル化においてサンプリングという工程は料理に例えるならば食材をまな板の上に用意する工程になります。この工程で用意したサンプルを次の量子化の工程で調理していきます。そして、符号化の工程で実際デジタルデータにしてデジタルオーディオとして視聴する形になるので、皿に盛り付ける作業に似ています。

3-1a 音のサンプリングレート

次の工程の説明に行く前に音のサンプリングレートについてお話をしましょう。デジタルサウンドのクオリティーを語る上でよく話題になるトピックです。

16bit,44.1kHzという言葉は音を扱う人ならプロアマ問わず聞いた事があるはずです。CDの規格で使われている数字です。この44.1kHzという数字がサンプリングレート(サンプリング周波数)にあたります。ちなみに16bitというのは次の工程で説明する量子化の精度を表します。16bit,44.1kHzというより44.1kHz,16bitと言ってくれた方が44.1kHzでサンプリングしたものを16bitの精度で量子化するというデジタル化の流れがイメージしやすいのですが、世界的にもこの順番でスタンダードになっています。

先述したカブトムシの例ではサンプルが1匹なのか100匹なのか、この数がサンプリングレートです。画像データでしたらdpiという値で解像度の精度を表現しています。 dot / inch という意味で1インチ(2.5cmくらい)をどれくらいの数のdotでサンプリングするかという意味です。画像の場合色の段階を量子化しています。

さて音の場合単純にサンプリングレートと呼んでいますが、これは1秒間に何回サンプリングするかという意味です。このHzという単位が1秒間に何回振動するのかを表しています。1秒間に1回のサンプリングならサンプリングレート1Hzとなります。

Kはキロと読みますが、最近ではネットスラングでも千円を1Kと使われたりするので昔よりは馴染みがあるのではないでしょうか。アナログエンジニアの間ではコンデンサや抵抗の単位でKやMはお馴染みでした。Kは× 1,000という意味です。ですので、44.1kというと44.1×1000=44100という事になります。44.1kHzは一秒間に44100回サンプリングするという事を表しています。この数字が大きくなるとサンプリングの回数が多くなるのでその分精度が上がってきます。

ちなみに音といっても具体的に何をサンプリングしているのでしょうか? それはその瞬間の音圧です。電圧と言ってもいいのですが、その電圧を記録(量子化、符号化)して再生する時にその電圧から音圧を再現します。これは実用的にはそこまで大事な話ではないのでが、後述する量子化ノイズのところで少し出てきますので頭の隅に置いておいてください。

3-2 量子化(bit化)する

サンプリングができたらこれを元に本格的に1,0のデジタルデータに変換していく準備になります。サンプリングした時点ではそこに音圧(音の大きさ)がある事はわかりますが、それがどの程度のものかはまだわかりません。カブトムシの例で言うとそこにカブトムシがあるのはわかるけれど、大きさやオスメスもわかっていない状態です。そこでサンプリングしたものを測定し数値化します。これが量子化と呼ばれる工程です。ここで初めて数値として表されます。

もちろん数値化する対象は音圧(電圧)ですのでいきなり1か0の二択では表現できません。かといって1.345689655333…voltのように無限に細かく数値化することもできません。どの程度の精度にするかは人間が決めなければいけない部分です。そして、コンピューターの一番深いところ(C言語、Pythonなどのプログラム領域より深いところ)は1か0の二種類しか数字を持っていません。だから3という数字が出てきても1,0で表していかなければならないのです。そこで2進数を使ってどれくらいの精度で量子化しているかを表現する為に使うのがbitという単位です。

少しなぞなぞめいてきたので、ここでbitの説明を少し挟みますがこの辺はそんなもんか、と聞き流しても大丈夫です。完全に理解していなくてもそんなに困りません。理解するには2進法とか10進法とかの基礎的な数学の素養も必要になってきます。とはいえ、さらっと一読くらいはして欲しいですねw

bitとは

bitというのはコンピュータで使われている1,0、即ち2進数の桁数を表す単位のことです。1bitだと1桁表現できます。2bitだと2桁です。2進数だと1桁で0,1の二つの数字しか使えないので、例えば3なら11と表します。4なら100になり、使える数字が少ない分10進数より桁数は増えていきます。表現できる数字が、1bitだと1,0の2段階(数字2個)、2bitだと1,0が2桁あるので2の2乗4段階(数字4個)・・・という風に増えていきます。ですから16bitだと2の16乗=65536段階の精度ということです。この精度のことをbit深度とか言いますが、細かい数字と共に暗記しておく必用は全くありません。こんな数字僕も覚えていませんし、今もググって書いています。僕が自分で2の乗数を計算するより確実です。

だいたいのデジタル音響機器は16bitもしくは24bitで作られています。16bitだとだいたいダイナミクスレンジ(音の大きさの幅)を6万五千段階で表現しています。24bitだと16777216段階。

だから16bit,44.1kHz の規格を16bit,6万5千段階、24bit,48kHzを16777216段階、48kHzと言っても良いのですが、なんかよくわからないですよね。dBの時と同じように桁数が大きいと感覚的にわかりにくくもなってくるのでこのようにbitという単位が使われるのです。開発サイドのエンジニアも16777216段階と言われるより24bitと言われれば演算を24桁すると理解する方がすっきりし作業が明確になります。

bit数が増えれば精度が上がる、くらいのざっくりした認識でもいいですが、一歩進んで一桁増えると乗数が増えるので16bitと24bitでは結構違いがある、くらいの認識で良いかと思います。数字よりイメージをつかむ事を心がけてください。

 

ここまでの話をまとめるとより多く集めたサンプル(サンプリングレートを上げる)のものをより細かく調べる(bit数を増やす)のが一番正確にデータ化する事ができるとわかります。100匹のカブトムシを並べるだけより、1000匹のカブトムシの大きさ、色、足の長さまで細かく調べた方がカブトムシをより深く理解できるという事です。

 

読んでくれてありがとう。

僕はこう思う。

Taiyo Haze


デジタル編 序  はじめに

デジタル編① 基本事項のおさらい

デジタル編② アナログとデジタル

デジタル編③ デジタルが音になるまで

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA