ご担当者の紹介
株式会社ZTV
制作部 編成課
木村 直人 様
ZTV株式会社は、三重県津市に本社を置くケーブルテレビ局で、三重県・滋賀県・和歌山県・京都府内の対象エリアでサービスを提供しています。IoTセンサーなども含め、地域DXの担い手として行政と連携し、挑戦し続けています。
ZTVは4府県にまたがるサービスエリアに、ケーブルテレビとしてテレビ放送やインターネット回線などのサービスを提供しており、それぞれのエリアで地域に密着した番組づくりを行っています。
新たな取り組みとして、視聴者から提供された映像を活用し、地域の方々と一緒につくる番組の企画が立ち上がりました。地域に密着した映像をお届けできる良い企画なのですが、視聴者の方々が撮影する映像はスマートフォンで撮影がされることが多く、専用のマイクを使うわけでもないので、周囲の環境音や生活音が雑音として録音されている事が課題でした。編集ソフトのイコライザーなどを利用して、なるべく雑音を小さくしたり、細かなカットで違和感のないように編集したりすることはできますが、その作業にはかなりの時間を要し、編集をしても雑音を完全に取りきることはできない状態でした。
そこで着目したのが、ソニーの『A2 Production』です。映像制作のワークフローにおいてAI映像解析をするクラウドサービスであることは以前に説明を受けて知っていましたが、今回はその中の「音源分離」の機能に注目しました。視聴者から提供された映像を解析し、録音された音声を人の声、環境音などに分離できるので、分離された音声を編集に活用できるようになり、編集ソフトで細かく調整しなくても聞き取りやすい状態で放送することができるようになりました。時間をかけて調整する必要はなく、撮影した映像をクラウドにアップロードして解析を待てばよいので、待っている間には別の作業を進めることもでき、編集作業の効率も大きく改善し、夜遅くまで作業することも減りました。
視聴者が撮影した映像の雑音を除去する目的で使い始めた『A2 Production』ですが、その便利さとクオリティに現場の担当者からは驚きの声が多く、通常の番組制作でも活用したいという要望があがりました。ZTVが撮影している映像についても、同じく音源分離で雑音を除去しています。
屋外ロケでは、救急車や大型車の走行音、上空を通過するヘリコプターの音などにより、撮影を途中で中断しその音が聞こえなくなるまで待たなければならない場面がよくあります。ただ、出演者の方が良いお話をしてくださったタイミングや、イベント進行中などでは、撮影を止めたり、やり直しをお願いできないことも多く、そのような時に音源分離を活用することで、撮影はそのまま続行し、撮影後に人の声と不要な環境音を分離することによって、出演者の声をクリアに届けられます。
音声を新たに生成するのではなく、声と環境音を分離する仕組みのため、声質が不自然に変わることがなく、オリジナル音声を維持できる点も評価しています。
屋外ロケでは前述のように車両の走行音や、風切り音、室内ロケでは、冷蔵庫の稼働音など、これまで現場では周囲の音への配慮にとても気を使っていました。特にディレクターが一人で撮影を行う現場では、進行や出演者対応、撮影確認に加えて音まで気にする必要があり、大きな精神的負担になっていました。
『A2 Production』を導入してからは、「多少の雑音が入っても、あとから音源分離で対応できる」という安心感が生まれ、現場で過度に神経を使わずに撮影を進められるようになりました。その結果、撮影そのものに集中でき、より質の高い番組制作につながっています。
現在活用している機能は音源分離がメインですが、他の機能の活用も今後は検討していきたいと考えています。複数の定点カメラで撮影する現場があるのでLineSync機能(編集の際の映像同期機能)を使うことができるかもしれませんし、原稿がないインタビューで字幕制作が必要な場合には文字起こし機能が使えるかもしれません。また、活用中の音源分離の機能についても今後のアップデートを期待しています。人の声をAIで認識する精度が上がれば、話者ごとに音声トラックを分離できたり、周囲の話し声のみを雑音として分離できたり、さらなるアップデートも期待しています。
少ない人数で番組づくりをするために、『A2 Production』は制作現場の負担を軽減しつつ、番組のクオリティを保つための重要なツールになっています。今後もAIを積極的に活用し、より良い番組づくりに挑戦していきたいと考えています。