Analysis
優れたビデオ処理と AI 統合
ビデオ分析は、人工知能 (AI) の重要な応用分野です。 GPU コンピューティング機能の向上に伴い、さまざまな業界がビデオ AI を統合して、従来のタスクをよりインテリジェントにすることを支援しています。 以前は完了までに何か月もかかっていたタスク、または人間の視覚認識に頼っていたタスクは、モデル開発に十分なトレーニング データを提供することで、ミリ秒単位で完了できるようになりました。 コンセプトはシンプルであるにもかかわらず、多くの企業は AI ビデオ認識テクノロジーの導入を成功させるのに苦労しています。 主な理由の 1 つは、ビデオに関連する周辺知識の専門知識の欠如であり、その結果、認識パフォーマンスが最適化されず、プロジェクトが挫折する可能性があります。
さらに、システム インテグレーターは、AI ビデオ分析にクラウド アーキテクチャを使用するかオンプレミス アーキテクチャを使用するかを決定する必要があることがよくあります。 クラウドベースのアーキテクチャでは、キャプチャされたビデオは Google、Microsoft、Amazon などのクラウド サービスに直接アップロードされ、クラウド サーバーがビデオを分析して結果を返します。 クラウド サービスには、合理化されたハードウェア要件や幅広い AI モデルなどの利点があります。 ただし、画像のプライバシーと遅延に関する課題も伴い、特定のアプリケーションが制限される可能性があります。 特殊なビデオ アプリケーション、特に低遅延が必要なアプリケーションでは、エッジ コンピューティングの重要性がますます高まっています。 マシン ビジョン機能を有効にするには、キャプチャ カードまたはカメラをエッジ コンピューティング デバイスに追加することで実現でき、リアルタイム AI 分析が可能になります。 この傾向は、ハードウェア テクノロジの継続的な改善、特にエッジ コンピューティングの GPU コンピューティング能力の強化の影響を受けています。
YUAN はビデオ処理において 30 年以上の経験があり、さまざまな分野にわたって広範な業界知識を蓄積してきました。 この豊富な実践経験は、私たちに比類のない競争力をもたらします。 したがって、独自に AI を開発できない企業に対して、YUAN は NexVDO SDK を通じてさまざまなネイティブ ビデオ分析モデルと豊富な業界経験を提供することで支援し、クライアントがソフトウェア インテリジェンスとそれぞれの業界とのシームレスな統合を実現できるように支援します。 すでに AI 画像分析を専門にしているパートナーは、NexVDO SDK のキャプチャ、記録、ストリーミング モジュールのサポートからも恩恵を受けることができます。 認識分析は画質に依存することが多く、YUAN はフロントエンドのビデオ処理に優れ、効率的な解像度と色空間変換を実現し、クライアントが画質とキャプチャ速度を完全に制御できるようにします。 また、後処理では映像の記録と配信をYUANが行いますので、お客様の研究開発の負担も軽減されます。
YUAN の NexVDO SDK は、AI 分析をビデオ コンテンツ分析と生体認証認識、行動分析の 3 つの主要モジュールに分割しています。
ビデオコンテンツ分析
ビデオ コンテンツ分析は、画像内の特定のオブジェクトやイベントのコンテキストを理解することを目的としています。 認識プロセスには、画像の分割とオブジェクトの検出が含まれます。 たとえば、自動運転システムのコンテキストでは、画像セグメンテーションにより、道路や歩行者、車両、樹木、空など、画像内のさまざまなオブジェクトを区別します。また、オブジェクト検出では、小型車や大型バスのような特定の種類の車両がさらに識別されます。 他の方法よりも優れた単体の方法はないため、より迅速かつ正確な結果を得るには、問題に応じて選択してください。
NexVDO SDK では、識別されたオブジェクトを分類カウント、特徴照合、およびテキスト認識にさらに利用でき、開発者に使いやすい API を提供します。 分類カウントは、人や車両のカウント、ショッピング モールの交通量の多いゾーンの監視などの小売業などのさまざまな業界で応用されています。 特徴マッチングは、医療用超音波腫瘍の特定やセキュリティ監視ビデオの検索、クロスカメラ追跡、工場の欠陥検出、生産自動化に適用できます。 テキスト認識には、インテリジェントな駐車場のナンバープレート認識や医療情報のデジタル化などのアプリケーションが含まれます。
生体認証
NexVDO SDK は、さまざまな生体認証シナリオに適した豊富な顔情報を提供します。 NexVDO SDK の顔認識は、99.8 という非常に高い 1:N 認識率を達成し、NIST の FRVT コンペティションで常に上位にランクされています。 認識モデルはマルチアングル認識に対応しており、約120度回転した横顔も正確に識別します。 さらに、この SDK は 68 の 3D 顔特徴点の抽出をカバーしており、冷静、驚き、幸福、怒り、嫌悪、恐怖の 6 つの感情を含む詳細な表情認識を容易にします。 これは、美肌効果やフェイシャル アニメーションの特殊効果に適用できます。
小売業界では、インテリジェントなダッシュボードからビデオデータを収集し、顧客の年齢、性別、表情を正確に分析することで、企業が潜在的な顧客の好みを分析できるように支援します。これにより、より正確な広告コンテンツの配信と製品のコンバージョン率の向上につながります。 オンライン教育コースや遠隔教育プロバイダーの場合、表情分析を統合すると、教師が生徒の表情に基づいて教室でのパフォーマンスを分析し、学習効果を定量化するのに役立ちます。 NexVDO SDK は、顔認識の分野でユーザーフレンドリーな API インターフェイスを提供し、一般的な表情認識から正確な顔認識まで幅広いアプリケーションをカバーし、さまざまな業界のソフトウェア開発に簡単に統合できます。
行動分析
このモジュールは、連続画像の分析が必要なシナリオに適用されます。 NexVDO SDK は、頭からつま先まで 17 の重要なポイントを識別し、手を上げる、立つ、座る、横になる、渡るなどの現在の行動を認識できるようにします。 連続画像のタイムラインに沿って行動を解析すると、ひっくり返す、落ちる、徘徊する、物を投げるなど、さまざまな行動認識に拡張されます。
人間の骨格やタイムラインから学び、幅広い応用が可能です。 たとえば、野球の投手トレーニングでは、クライアントは 1080p240 の高速画像キャプチャ カードを使用して各フレームを分析し、NexVDO SDK が提供するスケルトン キー ポイントを使用して姿勢分析を実行し、定量化されたデータに基づいて優れたパフォーマンスを達成できるように指導します。 スマート退職者センターでは、高齢者の行動には細心の注意が必要であり、転倒の際にはゼロ接触識別分析を通じて介護者への即時通知を実現し、そのような事故が発生したときにビデオ記録を残すことができます。 さらに、YUAN は教育機関と協力していわゆるインテリジェントな教室アプリケーションを徐々に構築しています。 教室の資料とカメラ映像を組み合わせて、生徒の教室でのやり取りの画像を同時にキャプチャし、姿勢分析を通じて、教師が動き回っている場合でも生徒のさまざまな行動をリアルタイムで分析できます。
NexVDO SDK の適用を通じて、AI ビデオ分析がすでにさまざまな業界に革命的な変化をもたらしていることがはっきりとわかります。 YUAN の利点は、NVIDIA と Intel GPU の完全な統合にあります。 これらの技術パッケージは、ディープラーニングの推論と展開の効率を効果的に高め、開発者が開発サイクルを短縮するのに役立ちます。 画像のキャプチャからインテリジェントな分析まで、大幅な高速化を提供します。