発表:動画内をより正確に検索する
企業や高等教育では、検索できないビデオコンテンツはほとんど価値がありません。
ビジネスおよびアカデミックビデオコンテンツの大部分は長い形式です。タウンホールミーティングの長さは、多くの場合30〜60分です。記録された教室での講義は通常1時間実行されます。オンライントレーニングビデオは、15分から1時間以上の範囲です。 Ciscoによると、2014年には長編ビデオが全ビデオトラフィックの64%を占めており、この数字は今後も増えると予想されています。
長時間の動画の場合、従来の「You Tube スタイル」の検索では不十分です。動画に広範なタグが付けられていても、YouTubeスタイルの検索では、ユーザーは動画の スタート を見つけることしかできません。これでは、検索語が実際に登場する動画内の 特定のポイント を見つけることはできません。
ビデオのトークトラックやその他の提示された資料内のコンテンツを見つけることは、エンタープライズビデオ検索の課題です。これにより、従業員は電子メール、ドキュメント、またはWebページと同じように簡単にコンテンツを検索してすばやくアクセスできるため、15分、30分、または60分のビデオが価値のあるものになります。
2014年にパノプトは、従来の動画インデックスの欠点を解消するために、 スマートサーチ を発表しました。Smart Searchは、プレゼンターのトークトラックに含まれる単語(自動音声認識(ASR)と呼ばれるプロセス)と、ビデオに登場するすべての単語(光学式文字認識(OCR)と呼ばれるプロセス)を自動的にインデックス化します。OCRは、一般的に正式なプレゼンテーション資料や画面上のデモンストレーションを含む、ビジネスビデオやアカデミックビデオにとって特に重要です。
本日、SmartSearchの重要なアップデートを発表できることを嬉しく思います。今後数日で、Panoptoクラウドの顧客は、OCR検索結果の品質が大幅に向上することに気付くでしょう。
新しいアルゴリズムの精度を理解するために、2 つのテストを作成しました。1つ目は、Panopto の OCR が徐々に減少するフォントサイズのテキストをどれだけうまく処理するかを示しています。1920×1080の画面では、文字認識は8ポイントフォントまで正確でした。
2番目のテストは、コントラスト比が低下するときのPanoptoのOCRの精度を示しています。この場合、コントラスト比はテキストと背景の間の輝度を測定します。
文字が黒(RGB 0,0,0)で背景が白(RGB 255,255,255)の場合は、文字認識がうまくいくと考えられます。しかし、文字の色が薄くなると、コントラスト比が低下します。そのため、OCRは文字と背景を正確に識別することが難しくなります。
テストでは、デスクトップ Web ブラウザーのデフォルトサイズである 16 ポイントフォントを使用しました。コントラスト比21(白地に黒いテキスト)から始め、徐々にコントラスト比を1.7(白地にRGB 200、200、200)に下げた。コンテキストとして、コントラスト比 1.7 は W3C の Web コンテンツアクセシビリティガイドライン (WCAG 2.0) をはるかに下回っています。WCAG 2.0 では、テキストのプレゼンテーションのコントラスト比が 4. 5:1 以上であることを規定しています。
しかし、この低いコントラスト比でも、パノプトのOCRエンジンは100%のテキストを正確に認識することができました。