misc.log

日常茶飯事とお仕事と

Youtubeに公開するゲームプレイ動画に音声解説を入れられないか模索

とりあえずメモ書きです。

背景

最近のYoutube収益化停止祭りで、「大量生産」「再利用コンテンツ」などが対象になる中、私の「音声、字幕解説、顔出しなしのシンプルなゲームプレイ動画」がもしかしたら駄目かもしれない……という懸念を払拭するために、音声解説を入れてみようと考えました。

録音

録画録音ツールの設定

現在、私はプレイ動画の録画にOBS Studioを使っています。
obsproject.com

OBSのUI例

実況やVTuber的な活動をされている方も広く使っているツールで、多入力ソースに対応しており、調べてみたところ、音声入力も複数のソースからの入力をマルチトラックMP4で録画出来るとのこと。これまでPCのデスクトップで鳴る音を全て拾って、録画対象だけゲーム画面に絞る、というスタイルだったのを「ゲーム音声+マイク音声をそれぞれ別トラックにした状態で、1本のMP4動画にする」という設定が出来たので、まずはそれで行こうと思います。
マルチトラックにこだわったのは、正直「音声解説が不要なもの」、たとえば純粋に原神のストーリーをプレイしている様子やカットシーンなどを録画したい場面もあるでしょうし、なんなら音声の喋りに失敗して声だけ消したい場面などもあるだろう、ということからです。

マルチトラック録音の設定などについては一旦ここでの説明は割愛させてもらって、次に行きますね。

マルチトラック音声MP4の扱い

マルチトラック音声で録画したMP4ファイルを、以下の2パターンで編集出力する方法を調べておきたいところです。

  • マイク音声無しの純粋なプレイ動画
  • マイク音声を被せた解説や実況入りのプレイ動画

私が編集作業に使っているツールは下記の2本なんですが、それぞれでのマルチ音声トラックMP4の扱いをざっと書いておきます。

  • TMPGEnc Smart Renderer 6 …… 音声フィルター設定画面で音声トラックの選択は可能だが、出力もそのままマルチトラックで行われる(再生ツールで映画の副音声のように音声を切り替えると、マイク音声を被せた再生になる)。カット編集を加えても音声トラックの存在は残る。ただし、カットされた部分に音声があれば、その部分は当然カットされる。
  • TMPGEnc Video Mastering Works 7 …… 音声トラックの存在をツールは認識しているが、そのまま編集出力するとトラック1のみになる(出力されたMP4動画は1トラックになる)。クリップ情報→音声ストリームで別トラックに切り替えて出力すると、トラック2の音声で出力可能(出力されたMP4動画は1トラックになる)。
Smart Render 6でカット編集したものの音声トラック選択の様子

この感じであれば、

  • プレイ実況のようなものをマルチトラックで録音し、カットなしの実況動画としてVideo Mastering Work 7で実況音声を載せた動画を短時間で公開。
  • 従来からやっている画面遷移や移動シーンをカットした純粋なプレイ動画は、実況音声の無い方の動画で作成する。

という方法は可能ですね。動画データの管理が面倒くさいですが。

ちなみに、Video Mastering Works 7のトラック編集モードなら、ナレーションタイムラインレイヤーを加えて、ツール上で動画を再生しながら音声解説をあとから乗せることもできるので、各種ギミックのクリア動画のほうは、ややこしいもののみこの方式のあと乗せナレーションで音声を入れるのがよいかもしれません(実際の謎解きなどをやりながら、的確に音声で解説するのは結構難しいし、絶対失敗することもあるとおもうので)。

音声変換

家族にちょこっと話したところ「絶対オッサン声じゃ無い方がよい」とのアドバイスを頂きましたので(笑)、ボイスチェンジも含めて検討することに。ソフトウェア、ハードウェアともあるようです。ハードウェアは遅延が少なく直感的に「物理的に変換フィルター装置が挟まる」のが判りやすいところですが、価格が安くても2万円ぐらいから……。高いです。

一方、ソフトウェアは導入費用は無料からありますが、マイク音声→ソフト→録画録音という流れでどうしてもソフトウェア処理が入るため、音声遅延が気になります。いくつか候補を検討してみました。

恋声

公式ページはこちら。
koigoemoe.g2.xrea.com

無料で使えて手軽で、確かに男声→女声、女声→男声の変換が簡単にできます。変換はUI上で周波数などのフィルターをゲージで設定するタイプ。基本的な変換のプリセットはありますし、調整の自由度も高い。ただ、個人的には遅延が気になりました。ゲームをプレイしながら音声を入れた場合、アクションシーンなどだとおそらくズレた声になるので、最終段階で訪れ補正などが必要かもしれません。無料ってところは魅力的なんですけど。
それから、このツール自体は普通にアプリから音声出力が出るだけです。OBSの入力としてこれを使うには、仮想ケーブル的なソフトを入れるか、OBSのアプリケーション入力として恋声自体を指定する、などが必要です。

「恋声」の動作画面
MagicMic

jp.imyfone.com
iMyFone社の音声変換ツール。音声のバリエーションが豊富で、期間ごとか永年のサブスク登録をするとアニメやゲームのキャラクターボイスも利用可能……なんですが……。これ、絶対版権元の許諾を得ていないというか、そのキャラクターのイメージを学習して生成しているとしか思えないので。面白そうなのですが、いろんな意味でリスキーな気がします。ただ、ツールとしてはマイク出力扱いになるため、OBSのマイク入力選択に「マイク」として登場し、他のツール等は不要です。

Supertone Shift

www.supertone.ai

Supertone Shiftの画面

無料でも一部の音声が使えますが、本気で使うなら有料ですかね。月単位のサブスクか、音声単位で永年利用可能なもの(だいたい40ドル~80ドル/音声ぐらいの相場)というツール。こちらはOBSのマイク入力選択に「マイク」として登場するので特に他のツール等は不要。音声ごとにピッチやエフェクトの指定も可能で、ある程度はカスタマイズできます。
支払いが音声単位なのと、版権モノの音声のようなのが入ってないようなので、MagicMicより安心かもしれません。