音

科目学習書●メディアテクノロジー論

音

△
＜ | ＞

http://www.infonet.co.jp/apt/March/syllabus/MedTech/sound.html

　この単元では、音を取り扱うための考え方について学習する。初めに、音の聞こえ方をベースにした枠組み(オーディオ)を学習し、続いて、音楽やスピーチを音の意味を通じて取り扱うための枠組みについても学習する。

音

　音は、音源(sound source。楽器、口、スピーカなど)の振動(vibration)が、媒体(media。空気など)を伝わって聴覚器(audio sensor。耳、マイクなど)に感覚を起こさせる現象だ。つまり、音の実体は、音源の周りに広がっている、圧力(押したり引いたりする作用)のとても速くて細かい振動だ(▽図)。

・
圧力の振動
実際の音の振動はずっと速くて細かい

　いろいろなものから音が出たり、伝わったり、耳がそれを聞いたりするしくみを学習しよう。(資料[音]+[耳])。

　振動(ここでは押したり引いたりする圧力の変化)の変化が同じなら、それを音として聞いた時の感覚も同じになる(逆は成り立たないけど)。つまり、振動の形によって音は完全に定められてしまう。
　したがって、音を調べるには、その音を成り立たせている振動を時刻に沿って測ってグラフにしたものが役立つ。このグラフを音のグラフ(▽図)という。

・
音のグラフ

　音と振動との関係と、グラフを使ってそれを読み書きする手法を理解しておこう(資料[音])。

　音には大きさと高さがあって、それは時刻の推移につれて変化していく。音の大きさや高さの違いは、音を成り立たせている振動の振幅(vibration width)や振動数(frequency)の違いと深い関係がある。

・

・
小さい音(左)/大きい音

・

・
低い音(左)/高い音

　映画や放送で使う音を加工したり修正したりするのに使われている[SoundEdit]というシステムを使って、振動の形の違いに対応して音の大きさや高さが違っているのを見比べよう。

・
SoundEdit

　あまり低い音や高い音は、人の耳の聴覚では音として感じることができない。人が聞き取れる音の振動数は、20Hz～20kHzぐらいの範囲に限られている(▽図)。この意味では、この範囲の高さの音だけが人にとっての音だといっていい。

・
([00]より)

もっと深く学習するための資料
・

中村健太郎
図解雑学
音のしくみ
(ナツメ社、99-10-05)

量子化標本化

　音は時刻の関数としての圧力(時刻の推移につれて変化する圧力)と見なすことができる。しかし、関数はそのまま記録/通信することができない。
　幸いなことに、聞くだけが目的なら、完全に全部の時刻について測ることができなくてもいいし、圧力の値にしてもそう正確に測れなくてもいい。1/4万秒ぐらいの間隔で、数万段階の圧力の違いが区別できるぐらいに測れていれば、わたしたちの耳で聞き分けられる範囲では十分な品質で記録/通信できる。
　そこで実際には、一定の間隔の時刻ごとに圧力を測って、さらにそれをほどほどの精度に丸めて順に並べた数列として記録/通信することが行なわれている。これらの処理をそれぞれ標本化および量子化という。
　オーディオCD(正確にはCD-DA)の場合だと、標本化の度数は44.1kHz(=1秒に対して4万4100回)、量子化の精度は2¹⁶(=約6万4000)段階と決められている。

△
標本化

△
量子化

　量子化+標本化はどのように行なわれるのか、なぜ避けられないのか、それなのになぜ困らないか学習しよう(資料[量子化]、[標本化])。

　量子化+標本化はもとの音に対する近似なので、これらを経由して記録/通信した情報からは、もとの情報の一部が欠けてしまっている。

　わざと低い精度で量子化/標本化した音を聞いて、精度が品質にどう影響しているか確かめなさい。

オーディオの記録/通信

　音を記録/通信するためには、その音の圧力の変化を時刻に沿って測って、それらを順に記録/通信していけばいい。このような考え方に基づいて取り扱われている音をオーディオ(=audio)という。
　オーディオを記録/通信するためのコーデック(複雑な情報をビット列などの構造体に還元したりそこからもとの情報を復元したりする方式)にはいろいろな種類があり、用途によって使い分けられている。

名称		用途
AM	アナログ(変調式) フォーマットと一体になっている	ラジオ放送
FM	アナログ(変調式) フォーマットと一体になっている	ラジオ放送
(線形)PCM	MPEG-1の一つ	オーディオCD VOB(DVDビデオ)
AC-3	MPEG-1の一つドルビーデジタルともよばれる	VOB(DVDビデオ)
MPEG-1 オーディオ2	MPEG-1の一つ	ビデオCD
MP3	MPEG-1の一つ	VOB(DVDビデオ) コンピュータ
AAC	MPEG-2の一つ	コンピュータ
3GPP		携帯電話
3GPP2	MPEG-4の一つ	携帯電話

　これらのうちAM/FMでは、時刻に対する圧力の変化をそのまま表現する。ただし、ビット列の代わりに信号波というもっと細かい波によって情報を表現する。そのため、これらの方式だけは特に変復調(modulation/demodulation、モデム)という。
　AM/FMでは、それぞれどのようにして変化する値を変復調(今回は変調だけ)するか学習しよう(資料[AM]/[FM])。

　先生が配る作業シート(▽図)を使って、変化する値を時刻ごとに調べ、それをもとにして、変化する値を表現するいろんな方式の信号を作りなさい。そして、それらを見比べてみなさい。

　PCMも時刻に対する圧力の変化をそのまま表現するが、ビット列を使う。
　そのほかのコーデックは、負荷を減らすために、いくつかの成分に分解してから、それぞれごとに別々の精度で標本化+量子化を行なうようになっている。

　音を記録/通信するためのフォーマットにもいろんな種類があって、用途によって使い分けられている(▽図)。

名称		対応コーデック	用途
AIFF	のちにQuickTimeに統合	PCM	コンピュータ
QuickTime	メディア全般用	PCM MP3 AACなど多種	コンピュータウェブ
ウェーブ	のちにWM系に統合		コンピュータ
WMV9	メディア全般用		コンピュータウェブ
RealVideo	メディア全般用		コンピュータウェブ
MP3	コーデックと同名	MP3	コンピュータ

メディアの電子的表現に関する中心原理

　素朴に考えれば、音を通信したいのなら、強力なスピーカを送信したい方向に向けて、最大の音量で流してやればいいだろう。記録にしても、声色をまねられるように人を訓練して覚えさせればいい。もちろん、こんな手段では、記録/通信できない要素がたくさんできてしまうだろうけど。
　AM/FM/PCMなどの表現の形式は、音を表現するための形式にしてはあまり自然ではないように見えるだろう。それでもこのような形式が必要になるのは、電子的な情報の表現には制約があるからだ。
　一言で言ってしまうと、

電子的なしかけでは、波形(AM/FM/PCMで作られるような電磁気の変動)かビット列(あとの単元の[文字と文字列]で学ぶ)として表現された形式でなければ、記録したり転送したりすることができない。

　この科目ではこの事実をメディアの電子的表現に関する中心原理と呼ぶことにする。この中心原理は証明できるようなものではないが、経験から(少なくとも技術の現状の範囲では)どうやら正しいと思われている。音を波形として表現するための形式として、AM/FM/PCMが必要になるのもこの中心原理の現れの一つだ。

オーディオイフェクト
(オプション)

　[SoundEdit](前にも出てきた)などのシステムを使うと、オーディオとして記録されていることを活かして、音にいろんなイフェクトをかけて加工することができる。特にリバース、リバーブ、柔らかくする/硬くするなどの効果はかなりおもしろい。これらの効果を実際に聞いてみよう。また、加工によって音の形がどう変化して見えるか調べてみよう(資料[オーディオイフェクト])。

・
SoundEdit

音色
(オプション)

　きみたちは水面の波の形はよく知っているはずだ。水面の波は正弦波とよばれる簡単な形をしている。この形についてはいろんな性質が分かっている。ところが、ふつうの音のグラフは、波の形はしているが、数学に出てくる正弦波(▽図左)なんかとは全く違ったとても複雑な形(同右)をしている。この形の違いが音の音色の違いを生み出している。音の形は単純には整理できないほど多様なので、音の大きさや高さとは違って、波の形がどうなっていたらどんな音色になるかを簡単に説明することはできない。

　音に限らず、波の形は、外側のおおまかな形(▽図下左)と内側の細かい形(同右)とに分けて考えることができる。波の外側の形は音の強さや優しさに関係があり、内側の形は音の硬さに関係がある。

　外側の形は、ピアノのキーを押さえ込む/放すなどの音源に対する操作に対応して拡がったり狭まったりしている。この変化は、音源の種類や演奏のしかたによって違う。

　波の内側の形として最も単純なのは正弦波だ。正弦波から作られる音は頼りないぐらい柔らかく聞こえる。そして、波の内側の形が複雑になるにつれて、音は硬くくっきりと聞こえるようになる。そして、全く規則性がないホワイトノイズ(white noise)とよばれる形になると、ただの雑音としか聞こえなくなる。
　実は、基本振動成分と呼ばれるいろんな幅の正弦波をうまく取り合せて混ぜていくと、どんな複雑な波の形でも(つまりどんな音色でも)作り出せることが知られている。逆に言えば、どんな音色も正弦波の混ぜ合わせとして表現できることになる。
　実は、基本振動成分の混ぜ合わせ方とエンベロープとによって、音色は、かなりうまく表現することができる。

　[SinWaves]を使うと、いろんな幅の正弦波を自由に混ぜ合わせてグラフの形を見たり音にして聞いたりすることができる。これを使って、いろんな内側の形をもった波のグラフが作れるのを確かめ、それらのグラフに対応する音色を聞き比べてみよう。また、外側の形を決定するいろんな属性の意味を、実際の音を聞いてみることによって理解しよう。

・
SinWaves

音楽

　わたしたちは生活を通じていろんな音を聞いているが、音楽を聞いている時(や人が話すのを聞いている時)と、雨や風の音を聞いている時では、情報の受け入れ方がかなり違っている。
　まず、音楽(正しくは音楽の演奏)を表現するのにこれまでずっと用いられ続けてきた楽譜のしくみを調べながら、音楽はどこがどう特別な音なのか考えてみよう(資料 [特別な音としての音楽])。

MIDIメッセージ

　多くの音楽は、いくつもの楽器を繋ぎ合わせた楽器のネットワークを使って演奏されている。このネットワークは、MIDI(＜Musical Instrument Digital Interface=楽器デジタルインタフェース。資料[MIDI])という共通の規格にしたがって組み立てられる。
　MIDIでは、ケーブルの機能や性能のほか、ケーブルを通じてやりとりする演奏の情報を表現する形式も決められている。この形式をMIDIメッセージ(またはただMIDI)という。
　MIDIメッセージは、楽器に対する作用を記述する。たとえば、ピアノのキーを下げる/上げるといった単位がMIDIメッセージでは表現の要素になっている。したがって、音楽がどんな音として聞こえるかは間接的に表現される。
　MIDI機器のマニュアルに必ず載っているインプリメンテーション表を見ながら、MIDIメッセージでは音楽がどう表現できるのか理解しよう
　また、ソフトウェア[StudyNote]を使い、MIDIメッセージのうちのノートオン/オフというタイプのメッセージを実際に組み立てて、それを使ってMIDI楽器を動かしてみよう。
　MIDIメッセージはコンピュータを使って音楽を作曲したり演奏したりするために、作曲した音楽を演奏の手順としてファイルに記録しておくのにも使われている。あとで演奏できるようにするには、MIDIメッセージに追加する情報やメッセージの並べ方を決めておく必要がある。ふつうはSMFという形式が使われている(資料[SMF])。

・
StudyNote

音源
(オプション)

　演奏のための楽器のネットワークには、メッセージにしたがって演奏の音を実際に発生する音源と呼ばれる装置が欠かせない。最近では、実際の楽器から録音した音を素材にして、豊かな演奏を再生できる音源が使われている。
　いろいろな音源がどんなしくみで楽器の音を再現しているのか学習しよう(資料[音源])。
　[ツァラトゥストラはかく語りき](シュトラウス。というより先日亡くなったキューブリックの[2001年宇宙の旅]のテーマと言った方が有名かも)の演奏をMIDIメッセージとして記録したものを、[QuickTime]音源を使って再生して聞いてみよう。
　MIDIメッセージは楽器の演奏のしかたを表現するだけだから、同じメッセージによる演奏でも、実際に聞こえる音は使う楽器の違いによって変化してしまう。このことは一方では、使う音源の性能がよくても悪くても、必ず演奏を再生させることができるという長所として見ることもできる。

　[ワルキューレの騎行](ワグナー)の演奏をMIDIメッセージとして記録したものと、オーディオとして記録したものを、それぞれ逆転して聞き比べてみよう。

スピーチ

　演劇のせりふのように、喋ることによって表現される情報のことをスピーチという。文章とその話し方とを一まとめにしたものと考えてもいい(資料[スピーチ])。
　ただの文章とスピーチとでは、表現するべき内容や形式がどう違ってくるのか実際に見て確かめてみよう。まず謡曲[隅田川]の詞譜で、話し方の説明がどのように表現されているか見てみよう。続いて、コンピュータで使われているスピーチの表現の書式の一つであるSpeechManagerによる記述を見てみよう。

官能的情報意味的情報

　音楽やスピーチは、ただのオーディオとしてPCMなどで表現することもできるし、それぞれMIDIメッセージやSpeechManager形式で表現することもできる。この二つは、表現の形式が違うだけではなく、実は内容も異なっている。オーディオとして表現されている音を官能的情報といい、MIDIメッセージやSpeechManager形式で表現されている音を意味的情報という(▽図)。
　官能的情報と意味的情報との関係について学習しなさい(資料[官能的情報意味的情報])。

官能的	レンダリング＜	意味的

	＞認識

聞きたいこと確かめておきたいこと

○
大きい音がした時に机がかたかた鳴るのは?
・
MIDIとMP3の違いって?
・
音がした瞬間って周りのものが吸い寄せられてるの?
・
かたつむり管じゃなくてうずまき管って習ったんですが...
・
かたつむり管ってキーが並んだピアノ?

学習の成果を自己評価してみよう

＞もっと深く学習するための問題＜

引用させていただいた文献
●
[00] こだわり設定でエンコードして音楽CDの曲を高品位のまま圧縮、MacPeople、Vol.10、No.14 (04-12)、p.176-177

△
＜ | ＞
・
オーディオ音楽