Filmora(フィモーラ)にはAIによる自動ノイズ除去機能が備わっています。
用意されているノイズ除去の種類は6種類です。ここでは、それぞれのノイズ除去が何をしているか?や特徴と注意点についてまとめています。
ノイズ除去の効果
初めに、ノイズ除去を適切に設定することでどのぐらい音質が改善するのかを紹介します。
以下のデフォルトの音源とノイズ除去した音源を効き比べてみてください。
・デフォルトの音源
背景にキンキンした高周波のノイズがたくさん入っています。
【BEST】通常のノイズ除去(20)+ ヒス除去(音量-100, デノイズレベル1)
背景の高周波ノイズをほぼ除去することができています。声も明瞭に聞き取ることができます。
【WORST】ノイズ除去のダメな例
ちなみに、ノイズ除去の設定を失敗すると以下のようになります。
ノイズはなくなりましたが、声もかなりの部分が損失しています。
6種類のノイズ除去
Filmora(フィモーラ)に搭載されているノイズ除去は次の6種類です。
プログラムによるノイズ除去の流れ
Filmora(フィモーラ)のプログラムによって行われているノイズ除去の主な流れは以下のようになっています。
風の音除去機能は、以下のような手順で機能します。
ノイズ検出
ビデオの音声トラックから風の音を検出します。これには、周波数スペクトル分析やノイズプロファイリングなどの技術が使用されます。
ノイズプロファイルの作成
ノイズ検出後、ノイズの特性を分析しノイズプロファイルを作成します。
これには、ノイズの周波数、振幅、持続時間などが含まれます。
ノイズの除去
ノイズプロファイルを使用して、風の音を含むビデオの音声トラックからノイズを除去します。これにより、ノイズが軽減され、よりクリアで聞き取りやすい音声が得られます。
音声の再生性向上
風の音除去後、音声トラック全体の品質を向上させるために、ノイズ除去後の音声のレベルやクオリティを調整するします。
これにより、ビデオの視聴体験が向上し、より良い品質の音声が提供されます。
これが、ソフトウェアの裏側で行われている一般的なノイズ除去の流れです。
AIスピーチエンハンスメント
スピーチエンハンスメントは、人の声の品質を向上させるためのツールです。声を聞き取りやすくするために、いろいろな調整を一括で行ってくれます。
主に以下の4つの機能があります。
ノイズ除去
スピーチエンハンスメント機能は、音声からノイズを自動的に除去するためのフィルター処理を行います。これにより、ビデオの音声トラックがよりクリアで聞き取りやすくなります。
音声をクリアにする
音声信号の品質を向上させるためのフィルターやイコライザー機能があります。これにより、音声がより鮮明で自然に聞こえるようになります。
音量調整
音声のボリュームを自動的に調整する機能があります。これにより、音声のレベルが一貫しており、ビデオ全体でバランスが取れた音声が得られます。
周波数補正
音声の周波数特性を補正するための機能があります。これにより、音声の高音域や低音域が強調され、より自然な音声が得られます。
実例
例えば、以下のような元の音声があるとします。(高音のやかましい器械音が聞こえます)
これにAIスピーチエンハンスメントを適用すると以下のようになります。
高音の機械音は消えたものの、声がこもってとても不自然になりました。今回のような音声ではAIスピーチエンハンスメントは使わない方がマシです。
風の音除去
風の音除去は、風の音を除去するためのツールです。
例えば、以下のような元の音声があるとします。(高音のやかましい器械音が聞こえます)
これを風の音除去すると以下のようになります。
あまり変わりませんね。
風の音除去は音声データを解析して風の音を特定し除去するもののため、今回のように風の音以外の高音にはあまり効果がありません。
ただし、元の音声を著しくおかしくするといったことはないので、ONにすることで声が著しく聞き取りにくくなることもないでしょう。
通常ノイズ除去
通常ノイズ除去は、不要な背景ノイズや環境音、機械音など幅広い種類の不要な音を除去します。
ノイズ除去の強さを0~100%の範囲で選ぶことができます。0%は除去なし、100%はノイズとして認識する音の範囲が最大になります。
例えば、以下のような元の音声があるとします。(高音のやかましい器械音が聞こえます)
20%の通常ノイズ除去を適用すると以下のようになります。
キーンという高いノイズが少し和らぎました。1箇所声の強さも下がっているところが気になります。
50%の通常ノイズ除去を適用すると以下のようになります。
かなり高いノイズが軽減されました。いい感じです。
100%の通常ノイズ除去を適用すると以下のようになります。
高いノイズはほぼなくなりました。ただ、声もところどころなくなってしまい不自然になっています。
リバーブ除去(反響音の除去)
リバーブ除去ではノイズと判定する範囲を0~100%で選ぶことができます。
0は除去無し、100%はリバーブを最大限除去します。
リバーブとは何か?
リバーブ(リバーバレーション)とは、音が壁や床などの表面で反射し、複数の反射音が聞こえることによって生じる残響や残響音のことを指します。
例えば、部屋の中で手を叩くと、その音が壁や床などの表面で反射し、複数の反射音が聞こえます。これにより、初めに発した音に続いて、複数の反射音が聞こえるようになります。この反射音がリバーブと呼です。
リバーブは悪ではない
リバーブは決して常に悪いノイズというわけではありません。
リバーブとは直接聞こえる反射音(初音)と、それに続く複数の反射音(残響)のことですが、これによって、聞こえる音に深みや立体感が加わり、録音された音が生々しさや空間感を持つ効果もあります。
このため、音楽や録音環境を改善し、より自然なサウンドを実現するためにスタジオ録音やライブ音楽の演出、映画やゲームのサウンドデザインなどで広く使用されています。
ミュージックホールなどはあえてリバーブを効きやすく設計しているところもあります。
実例
えば、以下のような元の音声があるとします。(高音のやかましい器械音が聞こえます)
20%のリバーブ除去を行うと次のようになります。
ほとんど変わりませんね。
50%のリバーブ除去を行うと次のようになります。
ノイズの反響しているような音がだいぶ軽減されました。
100%のリバーブ除去を行うと次のようになります。
更にノイズがなくなりました。ただし、少し声もこもってしまい不自然になってしまいました。
70%のリバーブ除去ぐらいが、きちんとノイズも除去できて、音声もクリアにきける限界ぐらいです。
ハムノイズ除去
ハムノイズ除去は電気機器などの低周波音を0 ~ -60dBの間で調整してノイズを除去することができます。
0dBは何もしません。-1~-10dBでは反響がかかったような音になり、-60dBまでいくと低音が除去されます。(声の低音も除去されます)
ハムノイズとは何か?
ハムノイズとは、電気機器や電源システムから発生する低周波のノイズの一種です。
通常、電力の供給や変換に関連して発生します。周波数は地域によって異なりますが、一般的には50Hzまたは60Hz周波数で発生します。
これは、交流電力の周波数に対応しています。50Hzは東日本(東北、関東、中部地方、一部の関西地域)、60Hzは西日本(中国、四国、九州、一部の関西地域)です。
このため、電気配線、電力供給システム、または近くにある電気機器からの影響によってオーディオやビデオシステムに混入することがあります。
音声や音楽の録音、ビデオ撮影など、高品質のオーディオやビデオコンテンツの作成において、ハムノイズは望ましくない要因と見なされます。
ハムとは何か?
ちなみに、ハムとは英語の「hum」からきていて、意味は「ブーン」という音です。
電気機器や電力供給システムから発生する低周波の電気的ノイズはブーンという音が発生するため、ハムノイズと呼ばれます。
(humは直接的に「電気的な低周波の騒音」の意味も持ちます)
dBとは何か?
ハムノイズ除去では0 ~ -60dBの範囲で除去する低周波音の範囲を指定することができます。
dBはデシベルで、一般的には音の大きさを表します。
- 10dB未満:ほとんど聞こえないくらい静かな音。例えば、葉がそよぐ音や、部屋の中で静かに話す声など。
- 30〜40dB:静かな環境での一般的な会話や、静かな郊外の環境の音。
- 60〜70dB:一般的な都市の屋外での交通や市街地での一般的な騒音レベル、一般的な家庭内の活動音(テレビの音、冷蔵庫の音、洗濯機の音など)。
- 80dB以上:高速道路や都市の交通騒音、レストラン内の会話や飲食店の雑踏、音楽ライブなど。
デシベルの尺度は対数スケールであり、10dBの差は実際には音の大きさが約2倍になることを意味します。つまり、60dBの音は、50dBの音よりも約2倍の大きさで聞こえます。
生活音のデシベルレベルは、日常的な環境や活動に関連して異なります。都市部では通常、より高いデシベルレベルが一般的であり、静かな郊外や田舎地域ではより低いデシベルレベルが一般的です。
ただし、デシベルは音の大きさ以外に、電気信号や無線の強さを計測する単位としても使われます。今回のハムノイズ除去の場合はこちらが該当します。
デシベルにマイナスがつくとどうなるか?
ハムノイズ除去で指定できるのは0 ~ -60dBです。
これは、0dBを基準点として、そこからノイズ除去の対象とする電気信号の強度を下げていくという意味です。
つまり、マイナスの値を持つdBは、基準レベルよりも低いレベルを示します。
具体的には、-60dBは、基準レベルから60dB下がったレベルを示します。基準レベルに対する相対的な強度が非常に低いことを示しています。
一般的に、-60dBのような低いレベルは、雑音のような微弱な信号や、信号がほとんどないことを示すことがあります。
音声処理やオーディオ技術では、-60dB以下の信号は通常、無視されたり、ノイズや不要な部分として取り除かれたりします。
実例
えば、以下のような元の音声があるとします。(高音のやかましい器械音が聞こえます)
0dBのハムノイズ除去をすると以下のようになります。
変化はありません。
-1dBのハムノイズ除去をすると以下のようになります。
少し反響したような音になり不自然になりました。
-10dBのハムノイズ除去をすると以下のようになります。
-1dBと同じく少し反響したような音になり不自然になりました。
-30dBのハムノイズ除去をすると以下のようになります。
ほぼオリジナルの音に近い状態になりました。
-60dBのハムノイズ除去をすると以下のようになります。
全体的に低音が除去され高音になりました。声も高音だけが強調されてしまい不自然です。
今回の音声の場合、高い器械音は入っていますが、低周波のブーンという音は入っていないのであまり効果はありませんでした。
ヒス除去
ヒス除去は音声から高周波の高いノイズを取り除くものです。
①ノイズ音量(-100 ~ 10)と②デノイズレベル(1 ~ 6)の2つを調整することができます。
ノイズの音量は数値が大きければ大きいほど(MAX:10)ごっそり高音を除去します。最少の-100であれば小さな高周波音を除去します。
デノイズレベルはどのぐらい強力にノイズ除去するかです。6が最大、1が最少となります。
つまり、【音量10, デノイズレベル6】が最大限ヒスノイズを行う状態です。この状態だと声の高音域も削られてかなり不自然になります。
【音量-100, デノイズレベル1】は最少のヒスノイズ除去です。高周波のノイズは少し除去されるかなといったぐらいで、オリジナル音源から大きく変わりません。
ヒス除去とは何か?
ヒス除去は、音声やオーディオ信号から高周波のヒス(シャーというような音)を取り除くことです。
ヒスは雑音や不要な信号の一種であり、一般的には高周波域(20 kHz以上)に存在します。
特に、アナログレコードの再生時や古い録音機器の使用時に発生しやすいです。
ヒス除去の方法にはいくつかのアプローチがあります。一般的な方法の一つは、フィルタリングを使用することです。高周波域に特化したフィルターを適用することで、ヒスの成分を削除することができます。また、ノイズリダクションやデノイズといった技術を用いて、ヒスを減少させることも可能です。
ヒス除去の目的は、オーディオ信号の品質を向上させ、クリアでクリーンなサウンドを実現することです。特に古い録音やアナログレコードの再生時には、ヒス除去が重要な役割を果たします。
ヒスの由来と意味
「ヒス」の語源は、古フランス語の「hisser(シス)」にさかのぼります。これは、蛇や猫などが威嚇や警告のために発する「シュー」という音を表す言葉です。この言葉は、その後、英語の “hiss” として採用されました。
音楽関連の場合、録音や再生時に生じる高周波域の連続的なノイズや静かな部分を指す言葉として「ヒス」が用いられます。
実例
例えば、以下のような元の音声があるとします。(高音のやかましい器械音が聞こえます)
パラメータが「音量」と「デノイズレベル」の2つがあるので、片方を固定した実例を紹介していきます。
音量を変化(デノイズレベル3で固定)
音量10、デノイズレベル3の場合は以下のようになります。
周りの高周波のノイズはほとんどなくなりました。しかし声の高周波も削られかなり不自然になりました。
音量-50、デノイズレベル3の場合は以下のようになります。
周りの高周波のノイズが低減しました。声も音量10dBに比べて聞き取りやすくなっています。ただし、なんとなく不自然な感じが残ります。
音量-100、デノイズレベル3の場合は以下のようになります。
周りの高周波ノイズがかなり弱い状態で、かつ、声もしかりと聞こえます。かなりいい感じです。
デノイズレベルを変化(音量-100で固定)
続いて、音量を-100で固定して、デノイズレベルを変化させます。
デノイズレベル1、音量-100の場合は以下のようになります。
オリジナル音源よりは少しはマシになっていますが、高周波ノイズはまだ残っています。
デノイズレベル3、音量-100の場合は以下のようになります。
周りの高周波ノイズがかなり弱い状態で、かつ、声もしかりと聞こえます。かなりいい感じです。
デノイズレベル6、音量-100の場合は以下のようになります。
周りの高周波ノイズは弱くなっていますが、声の高い部分も少し削られて不自然になっています。
音量を変化(デノイズレベル6で固定)
次はデノイズレベルを最大の6に固定して、音量を変化させます。
音量10、デノイズレベル6の場合は以下のようになります。
ノイズはほぼ完全になくなりましたが、声の高周波もだいぶなくなり、かなり不自然な状態です。
音量0、デノイズレベル6の場合は以下のようになります。
ノイズもほぼありませんが、声もこもった状態になり不自然です。
音量-50、デノイズレベル6の場合は以下のようになります。
若干の高周波ノイズは聞こえますがほとんどノイズがない状態で声が比較的明瞭になりました。ただし、不自然感は少し残ります。
音量-100、デノイズレベル6の場合は以下のようになります。
周りの高周波ノイズは弱くなっていますが、音量-50dBよりも聞き取りやすいですが、まだ声の高い部分も少し削られて不自然になっています。
ノイズ除去の複合
Filmora(フィモーラ)のノイズ除去は1つづつではなく、複数適用することもできます。もちろんすべてのフィルターを適用することもできます。
▼すべてのノイズ除去をONにした状態
例えば以下のような元の音声があるとします。(高音のやかましい器械音が聞こえます)
これに上記設定で全てのノイズ除去を行うと次のようになります。
声が削れかなり不自然な状態になりました。全く使い物になりません。
最適なノイズ除去の設定は?
今回の音源の場合に、最適なノイズ除去の設定は何か?ということで、以下の条件で掛け合わせてみました。
・デフォルトの音源
【BEST】通常のノイズ除去(20)+ ヒス除去(音量-100, デノイズレベル1)
他にも色々試してみました。結局、比較的シンプルで除去は弱めなのがよさそうです。
・通常のノイズ除去(10)+ ヒス除去(音量-100, デノイズレベル2)
・通常のノイズ除去(10)+ ヒス除去(音量-100, デノイズレベル3)
・通常のノイズ除去(10)+ ヒス除去(音量-100, デノイズレベル1)
・風の音除去 + ヒス除去(音量-100, デノイズレベル1)
・風の音除去 + 通常のノイズ除去(20)+ ヒス除去(音量-100, デノイズレベル1)
・通常のノイズ除去(50)+ ヒス除去(音量-100, デノイズレベル1)
・ヒス除去(音量-100, デノイズレベル2)
・通常のノイズ除去(20)+ ヒス除去(音量-100, デノイズレベル2)
・通常のノイズ除去(10)+ ハムノイズ除去(-30dB)+ヒス除去(音量-100, デノイズレベル1)
・通常のノイズ除去(20)+ ハムノイズ除去(-50dB)+ヒス除去(音量-100, デノイズレベル1)
コメント