Pages

Thursday, January 14, 2021

深刻なオンラインの「録画・録音しにくい問題」。解決策は“ダブルイヤフォン”!? - AV Watch

cicilopo.blogspot.com
ベストなオンライン録画・録音を模索したら「ダブルイヤフォン」に行き着いた

みんな一体どうやって録画・録音しているのだろう、とずっと疑問に思っているのだ。ミーティングやら取材やらが軒並みオンライン化したことで、現地と自宅を往復する手間を省けるようになったのはうれしいけれど、リアルでできた方が手軽に済むことも少なくない。録画・録音はその1つだ。みんな、一体どうやってるの?

オンライン会議ツールの録画機能や、OS標準のスクリーンキャプチャー機能があるのはもちろん知っている。でも、後述するように、それらは確実な録画・録音手段にはなりえない。筆者としては、それよりも安定して、間違いなく記録を残せる手段が欲しいのだ。

たとえばリアル取材でICレコーダーを2台使うみたいな、それでも不安だから同時にビデオカメラも回すみたいな、そのレベルの慎重さでオンラインでも記録したい。オンラインだろうとリアルだろうと、(特に取材時の録音は)失敗したらアウト。取材後に録音できていないことに気付いたときのあの絶望と、脇下を流れる汗の感覚は二度と味わいたくない(経験者)。

なので、確実に録画・録音しつつ、それでいてPCとにらめっこするオンラインのスタイルで快適かつ正確に音声を聞き取れる環境を構築したい。さて、どんな機器構成が考えられるだろう。完璧に録画・録音できるオンライン会議・取材のスタイルを模索してみた……ら、最終的に「ダブルイヤフォン」のスタイルになってしまった。どうしてこうなった!?

オンライン会議ツールの録画機能は期待できない

そもそもなぜ録画・録音したいのかというと、たとえば取材では、録音した音声を後で聞き直して文字起こしする場合があるから。その場で全員の発言を一語一句間違えることなく正確にタイプできれば録音の必要はないのだが、そんなスキルを持っていない筆者には不可能だ。オンラインでは時々相手がデスクトップを画面共有することもあり、その映像を後で参考にするときもある。なので、映像と音声は絶対に残しておきたい。

そこで一番手軽できれいに録画・録音する方法として挙げられるのが、「オンライン会議ツールの録画機能」や「OS標準のスクリーンキャプチャー機能」だろう。しかし、そもそもオンラインでの録画・録音の手段を本気で模索しようと思ったきっかけが、これらの機能に問題があったからなのだ。

たとえばオンライン会議ツールの録画機能は、多くの場合、ホスト(その会議をセッティングする人)にしか録画の権限がない。筆者自身が主催することはほとんどないのでホストにお任せしてしまうしかなく、ホストが録画を忘れてしまえばその時点で終了である。恐ろしい。

オンライン会議ツールで録画しているとこのような「レコーディング」などのマークが出たりする。これが点灯していなければアウトである

Watchのような媒体系の編集部の方も同席することが多いインタビューだと、ホストはだいたい編集部の人なので、忘れていそうならその場で録画をお願いしやすいのだが、自分がその声かけを忘れてしまわないとも限らない。録画されていても、ホストの人の設定によっては録画解像度が低すぎて使えないものになる可能性もある。

一般のオンラインイベントとなると、もはや公式の録画映像は期待できない。主催者が録画していない場合もあるし、こちらから録画をお願いすることもできないし、よしんば録画していてもその映像をもらえるとは限らない。いろいろな手間や不都合の元を絶とうと考えると、なんとかして自分の手元で録画・録音するしかないのだ。

OS標準のスクリーンキャプチャー機能は信頼できない

そうすると、必然的にOS標準のキャプチャー機能が1つ目の手段として挙がるのだが、意外と落とし穴も多い。たとえばWindows 10には「ゲームバー」によるキャプチャー機能が用意されている。キャプチャーしたいウィンドウをアクティブにした状態で「Windows+G」キーを押し、キャプチャーボタンをクリックするか、もしくはそのショートカットとなる「Windows+Alt+R」キーを押せば録画が始まる、というものだ。

Windows 10の「ゲームバー」の設定画面

しかしながら、場合によっては一番重要な音声が入らず、映像だけのデータになってしまうことがある。これは、おそらくゲームバー上で選択されているキャプチャー対象の音声出力と、オンライン会議ツール上で選択している音声出力が一致していないことが原因と思われる。

ただ、直前まで同じ音声出力を選択していたのに、録画を始めた瞬間に別の音声出力に切り替わってしまったりもするようで、いまいち信用ならない。Bluetoothヘッドセットを使用したときの接続の兼ね合いで問題が起こっているようなところもあるが、いずれにしても不安定である。録画中、レベルメーターなどで音声が取り込まれているのかを視覚的に確認できないのも不安で仕方がない。

「ゲームバー」での録画中はこのような表示が出ることもあるし、出ないこともある。音声のレベルメーターなんてものはもちろんない

さらに言うと、ゲームバーによるアクティブウィンドウの録画(キャプチャー)は、そのウィンドウのサイズが変更された瞬間に勝手に停止してしまう問題もある。うっかりリサイズしたり、最小化したりするだけでストップするのだ。

Zoomでは相手が画面共有した瞬間に自動で全画面表示になったりするので、そこで停止する(常に全画面表示しておくか、あらかじめ全画面にならないように設定しておけば問題ないが)。録画が停止したことに気付かなければおしまいだし、気付いたとしても画面の共有・解除のたびに何度もキャプチャーをリスタートする手間が煩わしい。

ウィンドウのサイズがちょっとでも変わったりすると録画が停止する

そういうわけで、オンライン会議ツールの録画機能も、OS標準のゲームバーによるキャプチャーも、「絶対に失敗せずに録画・録音したい」という要求には応えられない手段なのである。ちなみにmacOSのスクリーンキャプチャー機能の場合、デスクトップ全体を録画することもできるが、こちらも音声が記録されないことがあり、信頼性の程度はゲームバーとさほど変わらない。

macOSのスクリーンキャプチャー機能。これも音声が入らないことがあるうえに、出力ファイルがWindowsで読み込めない場合があって、あまり頼れない

アナログな「再撮」は確実性は高いが、聞き取りや文字起こしに向かない

デジタルとアナログの融合というのも、まあまあ有効な手段ではある。たとえば、一応スクリーンキャプチャーの機能を使って録画しつつ、万一音声が録れていなかったときのために、ICレコーダーをスピーカーの前に置いておく、というスタイルだ。

スピーカーの前にICレコーダーを置いてアナログ的に録音する方法もあるが……

ただしこの場合(スクリーンキャプチャーに失敗してICレコーダーの音声を使わざるを得ないとき)、その後の文字起こしの作業で問題になる。スピーカーから出力されたものを改めてICレコーダーのマイクで録音しているわけで、生声やデジタルのまま録音するより確実に「音質」は悪化する。

筆者自身のキータイプ音や家族の声など、周囲の雑音も拾いやすい。録音を聞き直すときの邪魔になるし、最近よく使っている自動文字起こしのサービスでも、ノイズが入ると少なからず認識率は下がってしまう。

オンライン会議・取材をしている最中の「聞き取りやすさ」という意味でも、スピーカーは適しているとは言えない。相手の言葉が周囲のノイズに紛れて聞き取れないのはよくあること。イヤフォンやヘッドフォンのように、可能な限り耳の近くで、周囲の音を遮断する形で聞ける体勢で臨みたいのだ。

なので、できればマイクとヘッドフォンが一体になったヘッドセットを使いたい。(相手からの)見た目や取り回しを考えるとワイヤレスイヤフォン一択になるのだが、しかしここにも問題がある。ワイヤレスにした瞬間、ICレコーダーなどでアナログ的に録音する手段が失われてしまうのだ。

リアルタイムの聞き取りやすさと取り回しの良さも追求するなら、ワイヤレスヘッドセットは必須だけれど……

もし有線ヘッドセットなら、音声入出力を分岐させるだけなのでそこまで難しくはなさそう。なのだけれど、Bluetoothのようなワイヤレス方式のヘッドセットだと分岐するのは簡単ではない。ワイヤレスだと会議・取材の最中は快適かもしれないが、ICレコーダーで録音できないのでは意味がないぞと。

で、結局スクリーンキャプチャーに頼ることになるわけで、後で録音できていないことに気付いたときのあの絶望と、脇下を流れる汗の感覚は……。

確実に録画・録音できる方法を考えてみる

こうしたいろいろな問題から、オンライン会議・取材において「確実に録画・録音する」のが意外と難しいことがわかっていただけただろうか。そのうえで聞き取りやすい環境も整える、というのはかなりハードルが高いのだ。だから、みんなどうやってるの? と思っているのである。マジで教えてほしい。

と、どこかの誰かに懇願したところで解決しないので、自分でどうにかできないかいろいろな方法を考えてみた。実現にあたっては、少なくとも下記の条件をクリアしなければならない。順番に解決していってみよう。

  1. 音声付きのスクリーンキャプチャーをより確実に行なう
  2. ICレコーダーでバックアップしつつBluetoothヘッドセットも使う
2. ICレコーダーでバックアップしつつBluetoothヘッドセットも使う

OBS Studioでしっかり録画・録音されていれば、本来は外部のICレコーダーを使ってまで録音する必要はない。が、何が起こるかわからないのがコンピューターソフトウェアである。やはりバックアップは必要だ。オンライン会議・取材中にOBS Studioがフリーズするとか、強制終了するとか、設定ミスで音声が入っていないとか、動画ファイルの保存に失敗するとか、いろいろな可能性が考えられる。

事前のテストでは問題なかったのに、よりにもよって本番でそういうことが発生しがちだったりするから油断できない。ちょっと古いが、マーフィーの法則ってやつである。できればソフトウェアだけに頼らず、バックアップとしてハードウェア(ICレコーダー)での録音手段も用意しておきたいのだ。

ただし、Bluetoothヘッドセットを使うという前提条件も考えると、PCの音声出力から有線でICレコーダーにつなげばいい、というような単純な話にはできない。ICレコーダーには物理的にLINE IN(マイク IN)に接続して音声入力させながら、同時にBluetoothヘッドセットで会話できるようにする、という工夫が必要だ。

ICレコーダーにはLINE IN(マイク IN)に直接入力して録音したい

ここで出番となるのが、「VoiceMeeter Banana」という仮想の音声デバイスを作ることができるアプリケーションだ。本誌の他の記事でもすでに紹介されているが、これを使えば、1つまたは複数の音声ソースを、PCの内部で複数のデバイスに分配できるようになる。

Windowsユーザにオススメの万能仮想ミキサー「VoiceMeeter Banana」が凄い

仮想音声デバイスを作れる「VoiceMeeter Banana」。これ自体にも録音機能があるので、さらにもう1つバックアップを用意できる

たとえば今回の場合、オンライン会議ツールでやりとりしている音声を、BluetoothヘッドセットとICレコーダー(PCのオーディオ出力端子)に同時出力することが可能だ。さきほど設定したOBS Studioでも録画・録音できているので、通常はそちらだけで間に合うはずだが、ICレコーダーでも録音できるようにしておけば万全のバックアップ体制が整うだろう。

オンラインならではのメリットを追求したい!

これで、ある程度安心度の高いスクリーンキャプチャーと音声記録のバックアップが可能になり、同時にBluetoothヘッドセットを遠慮なく使える目処も立ったので、条件はクリアできたと言える。が、せっかくならもっとこだわって、品質向上と仕事の効率化を図ってみたい。オンラインだからこそできることが、きっともっとあるはずだ。

というわけで、さらなる改善ポイントとなるのは下記の3つである。

  1. オンライン会議・取材中のノイズを可能な限り低減する
  2. リアルタイムで自動文字起こしできるようにする
  3. Bluetoothヘッドセットで、より高音質で聞けるようにする
1. 音声以外のノイズを可能な限り低減する

自分のマイクをオンにした状態でキーボードをタイプしたりすると、それがノイズとなって他の人に聞こえてしまう。こういったノイズを防ぐノイズリダクションの機能はぜひとも取り入れたいところだ。

オンライン会議中にはキータイプすることも多い。相手にとっては耳障りなので、このノイズを低減したい

筆者がそのために使用しているのは、「NVIDIA Broadcast」。最近ではオンライン会議ツール自体に同等の機能が組み込まれているものも出てきたが、そうではないツールもまだ多い。ツールによってノイズ低減の程度や精度に差があったりもするので、仮想マイク・スピーカーデバイスとしてどのツールでも共通で使えるNVIDIA Broadcastのメリットは大きい。ネックとなりそうなのは、NVIDIA GeForce RTX 20シリーズ以降のGPUにのみ対応、という点だろうか。

ノイズリダクションやバーチャル背景などの機能が使える「NVIDIA Broadcast」

使い方は、まず最初にNVIDIA Broadcastの設定画面を開き、使用するマイクデバイス(Bluetoothヘッドセット)を「マイクソース」から選んで「ノイズ除去」を有効にする。次にオンライン会議ツールやOBS Studioなどでマイクデバイスに「NVIDIA Broadcast」を指定すればOKだ。

NVIDIA Broadcastの「マイク」の設定で、使いたいヘッドセットを指定
OBS Studioなどのツール側はマイクデバイスを「NVIDIA Broadcast」に変える

さらにVoiceMeeter Bananaでも、「HARDWARE INPUT 1」に「NVIDIA Broadcast」を指定しておき、その出力先となるICレコーダーなどにもノイズ低減の効果が適用された(自分の)音声が記録されるようにしておこう。

VoiceMeeter Bananaの「HARDWARE INPUT 1」にも「NVIDIA Broadcast」を指定

ちなみにNVIDIA Broadcastではスピーカーデバイスから出力される音(相手の音声)についてもノイズ低減の効果を適用できる。が、その効果の適用度合いによっては反対に聞き取りにくくなってしまう場合もあるので、何度か試しながら慎重に設定したい(筆者は使っていない)。

2. リアルタイムで自動文字起こしできるようにする

最近は音声の自動文字起こしサービスである「Rimo」も活用している。通常のルーチンだと、スクリーンキャプチャーした映像から抜き出した音声データか、ICレコーダーで録音した音声のデータをRimoにアップロードして解析させる、という手順になる。

AIによる音声の自動文字起こしが可能なクラウドサービス「Rimo」

Rimoでは、1時間程度の内容でも数分~数十分ほどの短時間で高精度にテキスト化してくれる。とはいえ、アップロードの手間がかかるし、その前に動画から音声を抜き出したり、音声データの余計な内容をカットする作業もわりと面倒だ(Rimoは最近動画ごとアップロードできるようになったが、無駄に回線に負荷をかけないためにも、軽い音声データのアップロードで済ませたい)。

その手間を省くには、Rimoのリアルタイム録音機能を使えばいい。通常は、スマートフォンでWebブラウザーからRimoにログインし、マイクアイコンをタップして録音を始める、という形になるだろう。どちらかというとリアルの会議・取材などを想定した機能だからだ。

スマートフォンからサイトにアクセスし、マイクアイコンをタップすれば録音開始。その後、すぐに音声解析の処理に移ることができる

しかしながらVoiceMeeter Bananaがあれば、PC上のオンライン会議・取材でもRimoのリアルタイム録音機能が利用できる。オンライン会議ツールの音声や自分のマイクの音声を1つの仮想出力デバイスに出力するようにしたうえで、その仮想出力デバイスをRimo上でマイクデバイスとして認識されるようにすればいい。

通常、Webブラウザー(ここではChrome)上で認識するマイクデバイスは、OSでデフォルト設定されているものが使われる。VoiceMeeter Bananaの仮想出力デバイスがデフォルトになっていなかったり、何らかの問題でWebブラウザー上で別のデバイスが認識されている場合は、Webブラウザーの設定画面で仮想出力デバイスを選択しておこう。

Chromeの場合は、設定画面の「プライバシーとセキュリティ」内の「サイトの設定」にある「マイク」をクリック
マイクにVoiceMeeter Bananaの仮想出力デバイスを指定する
VoiceMeeter Banana上では、マイク入力とスピーカー出力が仮想出力デバイス「B1」にも出力されるよう設定しておく

これで、オンライン会議・取材中にリアルタイムでRimo上でも録音され、もう1つのバックアップとして音声データを残せるだけでなく、録音完了後にすぐに文字起こしの処理を実行できるようになる。安心感がさらに増すとともに、効率良く仕事できることにもつながるだろう。

無事、Rimoに音声入力できた
3. Bluetoothヘッドセットで、より高音質で聞けるようにする

そもそもの目的がオンライン会議・取材でのやりとりなので、ここまで使ってきたBluetoothヘッドセットは、ヘッドフォンとしてではなく、当然ながら音声入出力用のヘッドセットとして使ってきたことと思う。オンライン会議ツールなどで指定したのは「ヘッドセット」というデバイスだったはずだ。

たとえばWindowsでは、同じBluetoothヘッドセットでも、「ヘッドセット」と「ヘッドホン」の2つのデバイスを選べるようになっている。この違いは使用するプロファイルだ。ヘッドセットではHFP(Hands-Free Profile)と呼ばれるものが、ヘッドホンの場合はA2DP(Advanced Audio Distribution Profile)と呼ばれるものがそれぞれ使われる。

Windowsでは1つのBluetoothヘッドセットデバイスを接続すると、「ヘッドセット」と「ヘッドホン」の2つが現れる

ざっくり言うと前者は音声向け、後者はオーディオ向けということで、音質にも大きな差がある。仮にWindows上で再生デバイスに「ヘッドセット」を選んだ場合と、「ヘッドホン」を選んだ場合とでは、音楽を聞いたときの聞こえ方が全く異なるはずだ。「ヘッドセット」ではモノラルになり、音域も狭くなって、とても音楽鑑賞に耐えられない。

オンライン会議ツールでは通常はマイクとイヤフォンの両方を使うのでヘッドセットを選ぶことになるわけだけれど、その場合は決して高音質ではない音声でやりとりしていることになる。もちろん、ほとんどが会話音声なので音質的にはそれで十分と言えなくもないのだけれど。

でも、できるだけキレイな音で聞くことができれば、聞き取りやすさが多少なりともアップするはずである。とはいえ、多くのBluetoothヘッドセットは、ヘッドセットとして使っている間はヘッドフォンとしては使えない。どうすればいいのか。

答えは「Bluetoothヘッドセットを2台用意する」である。いや、もっと正確に言うと「Bluetoothヘッドセットとは別にマイクを1つ用意する」である。筆者がPCでまともに使える単独のマイクを持っていないので、手元にあったBluetoothヘッドセットを2台組み合わせただけだ。単独のマイクがあればそれに越したことはない。とりあえずここではBluetoothヘッドセット2台を使って話を進めよう。

Bluetoothヘッドセットを2台用意する! が、これだと大きな問題が

結局のところ、1台をマイク用として、もう1台をヘッドフォン用として使う、というだけの話である。といっても、フツーにヘッドセット2台を使うのは、だいたい無理だ。耳穴が足りない。耳穴が片方に2つずつある人間だったら可能だが、たぶんそんな人はいないだろう。片耳ずつ別のものを付けるという方法もあるが、それではステレオで音楽をすぐに聞きたいときに聞けない(会議・取材中にやることではないが……)。

なので、どちらか一方を耳穴を埋めない骨伝導方式のヘッドセット(イヤフォン)にし、もう一方を普通のワイヤレスヘッドセットにする。できれば後者は完全ワイヤレスの方がいいだろう。ケーブルが少ない方が煩わしくないのだ。

耳周りの圧迫感はやや強めになってくるところはあるものの、これで可能な限りの高音質で会話しつつ、そのまま何もしなくても動画・音楽鑑賞もできるのだ。まあ、普通のヘッドセット2個でも、一方はマイクとして使うだけなので近くに置いておくだけでもいいのだけれども……。マイクを口に近づけて、声を拾いやすくして相手にきちんと伝わるようにする、というのも重要なので……。

骨伝導方式のヘッドセットをマイク代わりに使い、もう1つの完全ワイヤレスイヤフォンをヘッドフォンとして使う
録画・録音体制を万全にしながら、快適なオンライン会議・取材が可能に
ツール類はこんな風にサブディスプレイにまとめておけばモニタリングも完璧である

Let's block ads! (Why?)


からの記事と詳細 ( 深刻なオンラインの「録画・録音しにくい問題」。解決策は“ダブルイヤフォン”!? - AV Watch )
https://ift.tt/39AV8uT
科学&テクノロジー

No comments:

Post a Comment