こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

解決済みの質問

デジタル音声サンプリング

NHKBSの「アナザーストーリー」でデジタル音声録音再生について解説ありましたが添付画像の理解で正しいでしょうか?

例:PCM サンプリング周波数44.10kHz  16bit
・44.10kHzとは1秒に44100回(縦の目盛数)データ採取する。
・16bitとは音の高低を16段階(横の目盛数)で表す。

投稿日時 - 2018-08-24 15:40:46

QNo.9530444

困ってます

質問者が選んだベストアンサー

iBook-2001です。
「しつこくて。。。」いえいえ、大丈夫ですよぉ。

マイクの振動板が前後に動く時、それぞれの方向性で「プラス側/マイナス側」の発電が行なわれ、という段階で、興味が在ればきっと出てくる「プラスとマイナス、ドッチ?」という疑問だろうとは、考えていました(^o^)

実はこの部分、私もよくわからないのです。
一応、結線が逆なら、得られる信号のプラスマイナスが逆になり、この常態を「逆位相」と言います。
おそらく、一定の決まり等で揃えられているかな?という程度は想定しますし、同じメーカーのマイクなら、揃っている。と想像している程度です。

ドラムセットにマイクをセットする場合、単純にステレオペアマイクなら、そのペアの位相が揃っていれば良いだけですが、多数本を用いた場合、それぞれの距離差や向きの違い、まぁいろいろな状況もあるので、単純な反転だけの位相差だけでは無く、周波数によって位相差が変わって来る部分なども在りますから、、、、(音は1秒におおよそ340m進む。と言われます。100Hzなら半波長の1.7mの距離差で反転位相となりますが、1,000Hzなら17cmで、10,000Hzなら1.7cmのマイク距離差で反転位相になりますからね。さたに、同じ太鼓に対して、ドッチ側からマイクを向けるか?という事でも逆に成っちゃいますし。。)

*マイクの位相規準も在るはずですから、このあたりは諸先輩の「正しい回答」をいただけたら。。と期待します。
(回答No.4の、John_Papa様などに教えて頂くのが良いと思います。)


さて、スピーカーの場合は、赤井印の「プラス側」にプラス側の電流を送ると、振動板が前に動く。というのが一般的です。とは言っても歴史が長い有名老舗メーカーでは、これが逆の動作に揃えてあった。という事例もあります。
さらにシングルユニットのフルレンジ以外では、低域/高域、など、それぞれ複数の専用ユニットで構成された製品の方が、一般的でもあります。この場合、それぞれのユニットに「不要な帯域の音を制限する、(クロスオーバー)ネットワーク回路」を通した信号で振り分けるのですが、周波数的に遮断するだけでは無く、周波数に応じて位相変化も伴う回路の為、組み合わせにより低域側と中域や高域側が逆相接続のケースも多々ありますよ。(測定したり、試作時の試聴等からの判断でしょう、机上の計算だけでは決めかねる部分ですけれど。)

私個人は、こういう「スピーカーの細かい事」なども好き。
大元が「スピーカー工作ファン」ですらかね♪

投稿日時 - 2018-08-28 18:56:54

お礼

ありがとうございます。

投稿日時 - 2018-08-29 06:12:03

このQ&Aは役に立ちましたか?

0人が「このQ&Aが役に立った」と投票しています

回答(8)

ANo.8

No.4です。
間違った理解をして欲しくないので、補足しておきます。

『プラス側 :振動版が前に動いた時の電圧』
『マイナス側:振動版が後ろ動いた時の電圧』
これは、振動板がスピーカーなら多くの場合正解です。
多くの場合正解という訳は、規約が無い為に製品によってそうでない場合もあるからです。
また、音を電圧に変換するマイクの場合は、今では振動板が引っ込む時に電圧がプラスになっている事が多いです。
数本のマイクをミックスする時に逆位相になったマイクがあると良い合成音になりません。ミキサーが普及し始めた40年以上昔を思い出せば、マイク入力に位相反転スイッチが装備されている必要がしばしば有りました。今では反転スイッチは多機能高級ミキサーでなければ付いていません。
また、マイクやスピーカーのメーカーで自主的に振動板の動作方向を合わせてくれていても、アンプの入力出力の間でプラスマイナスがひっくり返った製品が、こちらは今でも意外と多く有ります。一つのアンプでスピーカー出力とヘッドホン出力で位相が違っていたりとかも有りますね、ほとんどの人が聞いて気が付かないのでOKなのでしょう。
こんな状況なので断定的に言う事はできないとご理解ください。

自主的に合わせてくれている多数派のマイクやスピーカーの場合、気圧が高い方がプラスで、低い方がマイナスです。
音の実体は気圧の変化です。
スピーカーの振動板が前に出れば空気を押して気圧が高くなり、引っ込めば気圧が低くなります。
気圧が高いとマイクの振動板は押されて引っ込み、気圧が低いとマイクの振動板は吸い出されます。
実際は僅かな変化なのですが、表現すれば大げさになってしまいますね。

圧力を電圧に変換したものと、音の粗密波(縦波=進行方向に対する揺れ)のイメージ図を付けておきます。
前回答(No.4)で書いた蛇足を、こんなに早く解説する事になろうとは思いませんでした。音に図のような縦線がある訳ではありません、空気の密度(圧力)が変わっているというイメージを表現する為に便宜上縦線を使用しています。
スピーカー振動板の動きで空気の圧力が増減し、圧力の増減でマイクの振動板が動くのをイメージしていただく手助けになりますでしょうか?

ところで、この縦線を見てるとDSD等のPDM変調(Pulse-density modulation 下記URLのWiki参照)そっくりです。
現在のデジタル音声の主流は、
 マイク→アナログ電圧→[PDM→PCM]→PCMデジタルファイル
 PCMデジタルファイル→[PCM→PDM]→アナログ電圧→スピーカー
と、かなり変換の手間がかかってます。
いつの日か
 マイク→[PDM]→DSDファイル→[PDM]→スピーカー
と、マイクからアナログ変換無しに直接DSDファイルが作れる時代が来ると良いですね。(PDMを直接スピーカーで鳴らす事は現在でも可能です)

PCMについての質問であり、初心者にPDM変調(DSDとか1ビットDACなど)は、説明を敬遠されてるようなのですが、我々が音として認識する粗密波とよく似ており、現在のデジタルオーディオ機材ではむしろ標準的な(チップの中でPCMとPDMの変換がなされている)ので、ご紹介させていただきました。

参考URL:https://ja.wikipedia.org/wiki/パルス密度変調

投稿日時 - 2018-08-28 19:43:55

お礼

ありがとうございます。

投稿日時 - 2018-08-29 06:12:17

ANo.6

またまたiBook-2001 です。

『マイナス電圧があるのはなぜですか?』
はい、音声信号は「交流信号」だからなのですよぉ。

まずは、音の基本ですが、マイクで電気信号にし、スピーカーで音に戻します。
これは、発電機とモーター という関係と同じで、根本的な原理はそれぞれ同じ、しかしそれぞれに効率よくなるように作っている。という物です。

ダイナミック型マイクと、ダイナミック型スピーカー(普通のスピオーカー、イヤホンやヘッドホンも基本的には同じ原理)の場合、振動板が一定の範囲で動くようにして、マイクは空気振動(音)により振動板が前後に動いて発電(音声信号の大元)を発生します。スピーカーは駆動出来る大きな電力に増幅した「音声遺伝力」で振動板を動かしています。

それぞれ、振動板が前後に動く事で利用するのですが、振動板が前後に動く時、プラス側/マイナス側の交互に変化した「交流信号」として用いるのです。

なお、電気回路内では、例えば100Vを規準にして50Vから150Vの信号を扱い、最終出力時に直流カットとして、あたかも-50Vから+50Vの信号という利用方法も在ります。(数百Vの電源が必要な真空管アンプなどは、ほぼこういう範囲になり、直流カットと高電圧低電流から、低電圧大電流という変換に、大きく重く、コストも大きい「出力トランス」を用います。真空管アンプなんて、ホントに良い部品を組み合わせて行く、物量とコストをかけないと、本当の良さが発揮出来ない、まさにローテクの1つですが、それよりもマイクやスピーカーの基本原理の方が古くて、さらにローテクと言う事も出来るでしょうかねぇ。笑)

デジタルの場合、単なる「デジタルデータ」でしか無いのですが、「音声信号」を扱う為に、プラス側とマイナス側を現す符号(記号)として、本来の16Bitの理論表現値より、1つ少なく成っているだけの事ですよ。

デジタル技術その物と、その技術をオーディオに応用した時の部分での話です。
なお、映像関係では明るさによる表現なので、信号として「プラス/マイナス」が同居する「交流信号」で在る必要性はありません。でも、電波などの「伝送系」には又違う話と成りますけれどね。(電波関係は、音として聞こえる音声範囲とは違う、また違った技術の世界ですし、アナログ音声と、デジタル音声も実はそれぞれ違う技術の組み合わせなので、一気にすべてを理解するのは、なかなか難しいのです。)

と言う事で、あれこれ、とても細かい事を理解する前に、全体的に大まかな理解としての「概念図」を用いているのでしたよ。

私も、デジタルオーディオ、PCMという分野に興味を持って調べ始めたのが、たしか中学の頃でしたでしょうか?最初はホントにチンプンカンプンの部分がほとんどでしたが、徐々に理解しながら、「あれからウン十年」という事で、まぁまぁソレなりにイロイロ知識(理解)も多く成った。というダケです。

でも、尊敬する先輩回答者様には追いつけていませんけれど、、、(苦笑)

投稿日時 - 2018-08-27 19:00:32

補足

しつこくてすみません
>それぞれ、振動板が前後に動く事で利用するのですが、振動板が前後に動>く時、プラス側/マイナス側の交互に変化した「交流信号」として用いる>のです。
プラス側 :振動版が前に動いた時の電圧
マイナス側:振動版が後ろ動いた時の電圧
でしょうか?

投稿日時 - 2018-08-28 08:35:16

ANo.5

再び iBook-2001 です♪

コメントをいただき、ありがとう御座います。

さて、追加のQ1は、あくまでも「概念図」で、正確な表現ではありません。しかし、元のアナログ波形に対しての、アナログ信号に戻した時の常態に近い概念図なので、ビット数でもdBでもなく、電圧値と理解されるのが良いと思います。

それぞれの先端を折れ線グラフの様に繋いで行くと、元の信号に近い。というダケの事です。
現実的には必要帯域以上のハイカット(ローパス)フィルタを通して、かなり滑らかに繋がった信号が得られるのですよ。

そして、Q2の方は、御質問者様のご理解では、ちょっと残念。
L側44.10回/秒
R側44.10回/秒
単位はkHzでしたので、それぞれ44.1×1000~44,100回/秒でした。

先に書きました、ローパス(ハイカット)フィルタによって、理論上は「サンプリング周波数の1/2まで再現出来る」とされているので、人の可聴上限と言われる20kHz(20,000Hz)を得るには40kHz(40,000Hz)以上のサンプリングが必要。と成るのです。

しかし、、フィルターというのは、包丁で胡瓜を真っ直ぐ切ったように、「この周波数までは正常で、その周波数以外は全く無い。」という事はほぼ無理なので、サンプリング周波数は、やや余裕度を持たせている。と理解しておきましょう。
(この余裕度を非常に大きくした、88kHzや96kHzとかのハイレゾ(ハイサンプリング)も、現代の技術ではかなり利用されるように成っています。余裕度が大きい事は良い事ですが、決して「人間に聞こえない、超音波まで記録再生させる」という目的では無い事を、理解しておいて下さいネ♪)

本当に、きちんとした「技術論」としては、先輩のJohn_Papa様[ファン登録中] がご指摘されている通りなのですが、もしかしますと「今の御質問者様」には理解出来にくいかな?とも思います。(私も、始めてPCMって何?という入門初期には、おそらく全く理解出来なかっただろうと思いますから、、苦笑)
 まぁ、ゆくゆくは、こういう部分も在った、と言う事で、今はその程度で良いと思いますけれどね。

音に関した話で、ちょっと厄介なのが「音が大きい」「音が小さい」と言うと、普通は音量の大小と考えますが、同じように「音が高い、低くして」とか、「音が低いから、高くして」という使い方もある。
しかし、「音の高低」と言うと、多くは「音程が高い/低い」というケースが多い(実際の僅かな音程差から、大太鼓の「低音」とシンバルの「高音」など)という状況ですから、、

投稿日時 - 2018-08-26 18:54:42

補足

ありがとうございます。
>ビット数でもdBでもなく、電圧値と理解されるのが良いと思います。
マイナス電圧があるのはなぜですか?

投稿日時 - 2018-08-27 10:03:31

ANo.4

こんにちは。

肝心なポイントを回答させてくださいね。

『・16bitとは音の高低を16段階(横の目盛数)で表す。』
16段階→65535段階の説明は既回答にありますね。
「高低」というのは紛らわしい言葉です。音程の高い低いではなくて、採集時の電圧値です。明確にしておく必要がありますね。「高低」ではなく「強弱」ではどうでしょう。

また、グラフの都合で換えられる「縦横」も紛らわしい表現です。
図のグラフでは、横に時間軸をとり、縦に電圧値がとられていますので、ご質問にある(縦の目盛数)(横の目盛数)は逆になります。

なお本題とは関係ないので蛇足ですが、波の伝わり方に縦波と横波が有ります、縦波は進行方向に対する揺れで、横波は進行方向に直角な揺れです。縦波は時間軸方向に揺れる訳ですが、グラフ化される時に時間軸が縦方向に描かれる事は少ないです。音波について専門的に研究される場合には、縦横の難しさも深く探求してください。

投稿日時 - 2018-08-26 09:29:16

ANo.3

>Q2:ステレオ2chの場合サンプリングは
>L側44.10回/秒
>R側44.10回/秒
>でしょうか?
2chの場合、LとRでサンプリングレートが異なることはありません。

投稿日時 - 2018-08-25 10:58:33

お礼

ありがとうございます。

投稿日時 - 2018-08-25 14:51:01

ANo.2

はじめまして♪

i-q様がおっしゃる通りです。
ビット数というのは、デジタル世界で多用される2進数の組み合わせ。という事で、16Bitは0と1だけで現す時に16桁を利用している。という事です。

例えば、2Bitの場合、組み合わせは[00][01][10][11]の4種の値が、3Bitでは[000][001][010][011][100][101][110][111]と8種類の値が表現出来ます。

単純計算しますと「2の16乗=65535段階」ではなく、「2の16乗=65536段階」になるのですが、御質問者様が添付された図にもあるとおり、音声信号はプラス側の時とマイナス側の時の信号があるので、その違いを現すため、1つ足りないのですよ。

この解説はCDで採用されたPCM方式です。

CDで採用された、この規格ですが、理論上、サンプリング周波数は記録再現出来る最高周波数の2倍が必要と言う事で、人間の可聴上限が20kHzと言われるため、40kHzは必要。開発当時の技術背景から、多用される水晶発振(クオーツ)からの分周で扱いやすく、各種フィルタなどの関係から、少し余裕を持たせたため、44.1kHzが採用されました。

Bit数は、ソレ以前のアナログレコードやテープレコーダー等から考えた場合、最低8Bit、より高度な音を得るには12Bitは必要と考えられていて、実験的には当時のビデオデッキ等で12Bitの物が作られたり、ごく一部に14Bitの物が登場したりしたので、将来性を見据えて,16Bitを採用したのでは、とも言われています。

まぁ。最近は「本当に本質的な音の違いを実感出来る人が、どれほど居るの?」という部分もありますが、より細かく記録再生しようという「ハイレゾ」が、チョットしたブームでもありますね。

なお、PCM方式とは違う、他のデジタル化方式も在って、黎明期にはいろいろ試されました。現在のオーディオ分野では主流はPCM方式、もう1つ生き残っていると言えば、SA-CDで作用したDSD方式くらいでしょう。

あ、そうそう。デジタルの画像関係では、「カラー信号が16Bitの場合は2の16乗=65536段階(64k)の発色、色表現が出来る」と表現されますょ。

ビットで考えるデジタルの世界では、10進数の千倍を現すk(キロ)が、1024で換算されますからね。

ちなみに、44,1kHz×16Bit×2(左右音源のステレオ)という計算から、1秒間に扱われるデータ量は、1411.2kビットで、キロ ビット パー セカンドという、kbpsの単位で表す事が出来ます。(mp3とかの320kbpsより、どんだけデータが多いかがご理解頂けると思いますよ。)

投稿日時 - 2018-08-24 18:55:04

補足

詳細な説明ありがとうございます。
追加Qです。
Q1;添付画像のデジタルのグラフで縦軸(16bit)はプラス(中心より上段)とマイナス(中心より下段)ありますが単位は音量dbですか?

Q2:ステレオ2chの場合サンプリングは
L側44.10回/秒
R側44.10回/秒
でしょうか?

投稿日時 - 2018-08-25 08:22:55

ANo.1

i-q

16段階ではなくて、2の16乗=65535段階です。
(-32768~+32768)

投稿日時 - 2018-08-24 16:50:19

お礼

ありがとうございます。すごい幅ですね。

投稿日時 - 2018-08-24 17:45:25

あなたにオススメの質問