ハンファ-ビジョン-ロゴ

ハンファビジョンSPS-A100M AI音響分類・音源方向検知

Hanwha-Vision-SPS-A100M-AI-音の分類と音の方向検知-製品

導入

音は、目に見えない脅威が存在する中で、見落とされがちですが、強力な監視ツールです。従来のビデオ監視システムは、発生状況を視覚的に捉えることに重点を置いていましたが、今日のセキュリティ環境は進化し、音の種類だけでなく、その発生源も正確に認識できるようになりました。公共の安全と資産保護の領域が拡大するにつれ、音声分析技術は、単なる支援にとどまらず、犯罪防止や迅速なインシデント対応にも貢献する可能性を秘めています。
このような状況において、ハンファビジョンのディープラーニングベースの音響分類技術は、事前に学習された叫び声やガラスが割れる音など、特定の音響イベントを正確に認識し、即座にアラートを発するインテリジェント機能を提供します。さらに、音響方向検出技術は音源の位置を特定し、「音の種類」だけでなく「音の発生源」に関する決定的な情報を提供します。これら2つの技術は相乗的に機能し、統合された状況認識能力を最大限に高め、次世代セキュリティシステムの新たなベンチマークを確立します。
このホワイト ペーパーでは、これらのテクノロジを詳しく説明し、さまざまな環境での最適な実装と使用のための実用的なガイダンスを提供します。

AIベースの音声分析技術

  1. 音の分類
    ハンファビジョンの音響分類技術は、畳み込みニューラルネットワーク(CNN)というコアディープラーニングモデルを基盤としています。この技術は、抽象的な音響情報をスペクトログラム1と呼ばれる視覚的な形式に変換することから始まります。
    スペクトログラムは音響の「指紋」のような役割を果たし、特定の音の固有のパターンを明確に示します。CNNは、人間の耳では判別が難しいことが多い、これらのスペクトログラム画像内の微妙な音響的特徴やパターンを自動的に学習・認識することに優れています。このプロセスにより、叫び声、ガラスの割れる音、車のクラクション、タイヤのスリップ音など、幅広い音響イベントを正確に識別・分類することが可能になります。
    音が検出され分類されると、システムは自動的に音声ストリームからデータを抽出します。音声データはすでに前処理されているため、amp分類された音はオーディオクリップとして生成される。 fileメタデータが完備されており、簡単にダウンロードして再利用できます。view.
    このテクノロジーは、一部の Hanwha Vision 製品で利用可能です。
  2. 音源方向検出
    ハンファビジョンの音源方向検出技術は、特定の音声イベントの方向を識別し、ユーザーに通知することで迅速な対応をサポートします。この技術は、到達時間差を測定することで方向を特定します。
    音声信号が複数の物理的に離れたマイクに到達したときに、その音声信号を遠隔的に検出します (TDoA)。
    TDoAアルゴリズムは、音が各マイクに到達するまでの時間の位相差を分析し、音源までの実際の距離を推定することで機能します。この情報を用いて音源の角度を計算します。図1に示すように、円形に配置されたマイク(MIC1、MIC2、MIC3、MIC4)を備えたマルチマイクシステムは、音源と各マイク間の距離差(d1、d2、d3、d4)を測定できます。これらの距離差に基づいて到達時間差を計算することが、TDoAアルゴリズムの中核です。

2.1. 音響分類 ハンファビジョンの音響分類技術は、コアとなるディープラーニングモデルである畳み込みニューラルネットワーク(CNN)を基盤としています。この技術は、抽象的な音響情報をスペクトログラム1と呼ばれる視覚的な形式に変換することから始まります。スペクトログラムは音響の「指紋」として機能し、特定の音の固有のパターンを明確に表示します。CNNは、人間の耳では識別が難しいことが多い、これらのスペクトログラム画像内の微妙な音響的特徴やパターンを自動的に学習・認識することに優れています。このプロセスにより、叫び声、ガラスの割れる音、車のクラクション、タイヤのスリップ音など、幅広い音響イベントを正確に識別・分類することが可能になります。音が検出され分類されると、システムは自動的にオーディオストリームからデータを抽出します。オーディオデータはすでに前処理されているため、amp分類された音はオーディオクリップとして生成される。 fileメタデータが完備されており、簡単にダウンロードして再利用できます。viewこの技術は、一部の Hanwha Vision 製品で利用できます。 2.2. 音源方向検出 Hanwha Vision の音源方向検出技術は、特定のオーディオ イベントの方向を識別してユーザーに通知することで、迅速な対応をサポートします。この技術では、物理的に離れた複数のマイクに音声信号が到達する際の到達時間差 (TDoA) を測定することで方向を決定します。TDoA アルゴリズムは、音が各マイクに到達するまでの時間の位相差を分析し、音源までの実際の距離を推定します。次に、この情報を使用して音源の角度を計算します。図 1 に示すように、円形に配置されたマイク (MIC1、MIC2、MIC3、MIC4) を備えたマルチマイク システムは、音源と各マイクの距離差 (d1、d2、d3、d4) を判断できます。これらの距離差に基づいて到達時間差を計算することが、TDoA アルゴリズムの中核です。図2は、2つのマイク(茶色と青の波形)への音信号到達時間差(τij)を視覚的に示しています。この到達時間差を正確に測定することで、システムは音源方向を正確に三角測量することができます。 Hanwha-Vision-SPS-A100M-AI-音の分類と音の方向検知 (3)

音の方向検出プロセスは、主に次の 4 つのステップに分かれています。

  1. 信号収集: 複数のマイクを介して音声信号を同時に収集します。
  2. 信号処理: 特殊なアルゴリズムを使用して収集された信号を分析します。
  3. 方向推定: 処理された信号に基づいて音の方向を推定します。
  4. 結果出力: 最終的に検出された方向を方位角として表示します。

このテクノロジーは、オーディオビーコン (SPS-A100M) や一部の Wisenet 9 SoC 搭載カメラなど、複数のマイクをサポートする Hanwha Vision 製品で利用できます。

Hanwha-Vision-SPS-A100M-AI-音の分類と音の方向検知 (4)

インストールと環境:最適なパフォーマンスのためのガイド

ハンファビジョンのAIオーディオソリューションの効果は、設置環境に大きく左右されます。以下の点を積極的に考慮することで、システムのポテンシャルを最大限に引き出し、安定したパフォーマンスを確保できます。

最適な設置場所の選択
信頼性の高いサウンド分類と方向検出のパフォーマンスを得るには、次の条件が推奨されます。
音の分類:本システムは、製品と音源との距離が2m以上ある場合に最も確実に動作します。この距離は音源の高さに基づいています。距離が近すぎる場合(2m以内)、拍手のような一見小さな音であっても過度に大きくなり、誤検知につながる可能性があります。屋内では天井に設置することで音響反射を最小限に抑え、広範囲にわたって均一な音検知が可能になるため、音の分類には理想的な方法です。

Hanwha-Vision-SPS-A100M-AI-音の分類と音の方向検知 (5)音源方向検出:正確な方向検出のためには、幅6.0m、長さ6.0m以上の空間を推奨します。これにより、音の反射や残響の影響を最小限に抑え、複数のマイク間の信号分析に十分な空間を確保できます。 Hanwha-Vision-SPS-A100M-AI-音の分類と音の方向検知 (6)

適切な距離と入射角の維持:イベント音源と製品間の距離と角度は、検知精度にとって非常に重要です。イベント音の入射角が大きすぎる(20°を超える)場合、または距離が短すぎる場合、検知精度が低下する可能性があります。以下の表は、製品の設置高さに基づいた推奨最小距離を示しています。

製品設置高さ 最小方向検出距離
2.3メートル ≥ 2.2m
2.5メートル ≥ 2.7m
2.7メートル ≥ 3.3m
2.9メートル ≥ 3.8m
3.1メートル ≥ 4.4m
3.3メートル ≥ 4.9m
3.5メートル ≥ 5.5m
3.8メートル ≥ 6.3m
4m ≥ 6.9m
5m ≥ 9.6m

クリアな音の経路の確保:音源と製品の間に壁、ガラス、厚いカーテンなどの物理的な障害物があると、信号が弱まったり歪んだりする可能性があります。最高のパフォーマンスを得るには、音の経路がクリアで直接的であることを確保してください。

効果的な音の検出と分類のための環境分析
正確な音の検出と分類を行うには、次の音響条件と周囲の環境要因を考慮してください。

サウンドタイプ dBしきい値 予測距離
叫ぶ >70デシベル 2m~20m
ガラスの割れる音、クラクション、タイヤのスリップ >80デシベル 2m~16m

例えばamp例えば、叫び声は音量が70dBを超えると、正確に分類され、方向を特定できます。イベント音の音量は、周囲の背景雑音よりも大幅に大きくなければなりません(推奨:少なくとも30dB以上)。正確な測定と分類を行うには、背景雑音が理想的には60dBを超えないようにする必要があります。これにより、イベント音と周囲の雑音を明確に区別できます。
周囲の騒音はパフォーマンスに影響を与える可能性があるため、事前に次の点を分析することをお勧めします。

  • 屋外環境:自然音(風、雨、雷)と人工音(交通音、衝撃音、車の振動)に注意してください。予測不可能な環境では、徹底的な分析を行うことで最適な設置場所を選定できます。
  • 屋内環境:部屋の材質(壁、天井、床)や広さによっては、音の反射や残響が顕著になる場合があります。風船が割れる音や重い箱が落ちる音など、対象事象に類似した音は、反響を引き起こし、誤報につながる可能性があります。設置にあたっては、屋内空間の音響特性を考慮する必要があります。

サウンド分類の dB しきい値の設定
サウンド分類機能を最適化するには、特定の環境に合わせて dB しきい値を設定できます。

  • 騒音の多い環境では、誤報を減らすためにしきい値を高く設定します。
  • イベントの発生が目立たない静かな環境では、重要なアラートを見逃さないようにしきい値を低く設定します。
  • 平均バックグラウンドノイズ dB を確認した後、その平均より少なくとも 55 dB 高いしきい値を設定することをお勧めします。

Hanwha-Vision-SPS-A100M-AI-音の分類と音の方向検知 (7)図6に示すように、dB閾値はスライダーまたは数値入力フィールドを使用して直感的に調整でき、リアルタイムの検出感度に直接影響を与えます。グラフは、音のdB値の時間経過(黒線)と設定された閾値(灰色線)の変化を視覚的に表しており、サウンドイベント(オレンジ色のピーク)が閾値を超えたタイミングを簡単に確認できます。

音源方向の校正とシステム構成
Hanwha Vision 製品は、サウンドの分類と方向検出の結果の両方を含むイベントをオーディオ クリップとして提供します。

Hanwha-Vision-SPS-A100M-AI-音の分類と音の方向検知 (1)図7に示すように、音の分類結果は、音の方向検出結果とともに、下部に直感的なアイコンで表示されます。「方向(N+301.8∘)」は、音源が北(N)から時計回りに301.8∘の位置にあることを意味します。
付随する「信頼度(0.74)」の値は、74%の信頼度を示しています。これは、音圧レベル(52dB)と併せて、ユーザーが状況を正確に評価し、迅速に対応するのに役立ちます。
システムの音の方向情報は、時間の経過や設置状況により、真の北からずれる場合があります。正確な方向情報は不可欠であるため、必要に応じて北の基準点を校正することが重要です。校正は、以下の3つの方法のいずれかで行うことができます。

  1. コンパスが示す通り、真北を向くように製品を設置してください。
  2. 製品メニューで、[システム] > [製品情報] > [取り付けモード] に移動し、コンパスの北からカメラの基準点までの時計回りに測定した角度を直接入力します。
  3. より便利で正確な初期設定を行うには、Wisenet インストール ツールに含まれているコンパス機能を使用します。

 複雑な音響環境のためのヒント

  • 複雑な音響環境:複数の音が同時に発生する環境では、AIモデルがそれらを単一の音として認識したり、誤認識したりすることがあります。これは自然な現象であり、システムが提供する情報を包括的に分析することで、正確な状況認識が可能になります。
    正確な警報のための環境分析:音響分類モデルは、金属の摩擦音、動物の鳴き声、楽器の音、その他の突発的で大きな音など、イベント音に類似しているものの分類カテゴリに含まれない音に対しても警報を生成する場合があります。このモデルの特性を理解することで、これらの例外的な音による警報を予測し、準備を整えることができ、不要な混乱を効果的に軽減できます。

結論

ハンファビジョンの AI オーディオ ソリューションは、視覚的な観察の限界を超えて、音をインテリジェントに分析する真に包括的な早期警告システムを実現します。
このホワイト ペーパーは、初期インストールから最高のパフォーマンスを実現するための微調整まで、特定の環境に合わせてテクノロジを実装および最適化するための実用的なガイドとして役立ちます。
セキュリティ上の課題が進化する中、Hanwha Vision は音声分析機能の向上に注力し、あらゆる状況でより安定した、効率的でプロアクティブなセキュリティ体験を実現します。

ハンファビジョン

  • 13488 ハンファビジョンR&Dセンター、
  • 京畿道城南市盆唐区板橋路319ギル6 www.ハンファビジョン.com
  • 著作権 ⓒ 2025 ハンファビジョン。無断複写・転載を禁じます。

ドキュメント / リソース

ハンファビジョンSPS-A100M AI音響分類・音源方向検知 [pdf] 取扱説明書
SPS-A100M AIサウンド分類と音源方向検知、SPS-A100M、AIサウンド分類と音源方向検知、分類と音源方向検知、音源方向検知、方向検知、検知

参考文献

コメントを残す

あなたのメールアドレスは公開されません。 必須項目はマークされています *