Kommunikation

Intelligentere Videosuche mit ASR und OCR

30. September 2020

Suchmaschinen haben heute eine Wissenschaft aus der Indizierung von Text gemacht. Moderne Spider finden und erfassen jedes noch so kleine geschriebene Wort - und liefern die Ergebnisse so effizient, dass einige Effizienz-Experten den Menschen empfehlen, ihre E-Mail-Ablagesysteme und Webbrowser-Favoritenleisten aufzugeben und sich einfach auf die Suche zu verlassen, um das zu finden, was sie brauchen.

Aber für die meisten Unternehmen ist diese Tiefe der Suchmöglichkeiten nur für Text reserviert. Insbesondere Video bleibt eine Blackbox - beschränkt auf manuell eingegebene Metadaten wie Titel und Tags.

Die Videosuche ist ein Problem, das gelöst werden muss.

Laut einer Studie von McKinsey und IDC verbringt der durchschnittliche Wissensarbeiter heute fast 20 % seiner Zeit - fast einen ganzen Tag pro Woche - nur mit der Suche nach den Informationen, die er benötigt, um seine Arbeit effektiv zu erledigen. Da Unternehmen immer mehr Informationen mit Hilfe von Videos austauschen, wird sich diese Zeitverschwendung ohne eine Videosuchlösung nur noch verschlimmern.

Aus diesem Grund erweitern heute immer mehr Videoplattformen ihre Videosuchfunktionen. Doch während sich das Feld der Lösungen erweitert, wird es für Unternehmen immer schwieriger, sich zurechtzufinden. Warum? Weil nicht alle Videosuchmaschinen gleich geschaffen sind.

Forrester Research lobte kürzlich Panopto als "die beste Unterstützung für die Videosuche". Es ist leicht zu erkennen, warum - niemand geht tiefer und breiter als Panopto, wenn es um die Videosuche geht, wie die folgende Grafik zeigt.

Wenn ein Video es wert ist, aufgenommen und gespeichert zu werden, ist es auch wert, gefunden zu werden. Sie möchten Videosuchfunktionen, die dieser Aufgabe gewachsen sind. Moderne Videoplattformen finden jetzt kreative Wege, um den Inhalt in Videos zu indizieren und neue Möglichkeiten zur Erfassung von Metadaten, Audioeingaben und visuellen Inhalten zu finden.

Wie viel könnten Sie sparen, wenn Sie
Ihre Videos leichter durchsuchbar machen?

Berechnen Sie Ihre Einsparungen

Welche Fähigkeiten sollte eine Video-Suchmaschine also haben?

Grundsätzlich gilt: Wenn ein Video-Suchwerkzeug Ihre Videos indizieren soll, sollte es in der Lage sein, alle auf dem Bildschirm gesprochenen und gezeigten Wörter zu finden und zurückzugeben.

Es gibt zwar eine Reihe von technischen Strategien, um an diese Informationen heranzukommen, aber sie lassen sich tendenziell in zwei Gruppen einteilen - automatisiert oder manuell.

Automatisierte Videoindizierung durch ASR und OCR

Die automatisierte Videoindizierung beruht auf einer oder mehreren intelligenten Videotechnologien zur Erfassung und Erkennung des Geschehens in Ihrem Video. Diese automatisierten Tools können oft sofort nach Abschluss der Aufnahme auf ein Video angewendet werden, um den Prozess der Indexierung des Inhalts zu beschleunigen.

Zu den gängigen Systemen für die automatische Videoindizierung gehören die automatische Spracherkennung (ASR), die optische Zeichenerkennung (OCR) und die Aufnahme von Folieninhalten. Diese drei Systeme tun sehr unterschiedliche Dinge, also lassen Sie uns jedes ein wenig genauer betrachten.

Automatische Spracherkennung (ASR) ist eine Technologie, mit der jedes Wort, das in einer Aufnahme gesprochen wird, identifiziert wird. Sobald die Wörter identifiziert sind, werden sie mit einem Zeitstempel versehen und zu einem Suchindex hinzugefügt. Die Benutzer können dann nach gesprochenen Wörtern suchen, den genauen Zeitpunkt im Video finden, an dem sie erwähnt wurden, und zu diesem Punkt im Video vorspulen. Da viele Zuschauer nach einem Moment suchen werden, der auf einer Idee oder einem Satz basiert, an den sie sich erinnern, ist ASR ein unglaublich hilfreicher Teil Ihrer Videosuchmaschine.
Optical Character Recognition (OCR) ist eine Technologie zur Erkennung von Text, der innerhalb von Videos auf dem Bildschirm angezeigt wird. In modernen Präsentationen wechselt ein Redner oft zwischen Folien, Live-Bildschirminhalten und sogar anderen Videos hin und her. Ohne OCR kann jeglicher Text, der als Teil dieser Präsentationen gezeigt wird, nicht indiziert werden, da Suchmaschinen wie Google keinen Text erkennen können, der als Bild gespeichert ist. Die OCR-Technologie ist jedoch in der Lage, diese Wörter zu identifizieren und zu entziffern, sodass Ihre Zuschauer nach buchstäblich jedem Wort suchen können, das irgendwo in einem Video auf dem Bildschirm erscheint.
Slide Content Ingestion bezieht sich auf die Technologie, die Ihre tatsächlichen PowerPoint- oder Keynote-Präsentationsfolien bei der Verwendung in Ihrem Video importiert und indiziert. Content Ingestion unterscheidet sich von OCR dadurch, dass es programmatisch die tatsächlichen Textzeichenfolgen aus Ihren Folien extrahiert, anstatt ein Bild der Folie zu machen und zu versuchen, Wörter zu identifizieren. Die Folieneinbindung extrahiert auch zusätzliche Informationen, die nicht auf dem Bildschirm angezeigt werden, wie z. B. Sprechernotizen, sodass Ihr Team immer präzise Momente im Video finden kann, die auf einem beliebigen Wort auf einer beliebigen Folie basieren.

Manuelle Video-Indizierung

Die manuelle Videoindizierung hingegen beruht auf menschlichen Eingriffen, die nach der Fertigstellung eines Videos erfolgen, um die Indizierung von Videoinhalten zu unterstützen.

Die Nützlichkeit manueller Indizierungsprozesse variiert je nach der Menge der Informationen, die sie hinzufügen können. Einige Prozesse sind recht umfassend, andere wiederum sehr viel eingeschränkter. Werfen wir einen Blick auf die beiden häufigsten manuellen Eingaben:

Handbuch Metadaten bezeichnet die Informationen, die einer Videodatei hinzugefügt werden, wie z. B. Titel, Autor und eine Beschreibung. Auch Zuschauernotizen und Kommentare können hier hinzugefügt werden. Diese sind ein grundlegender Bestandteil der Videosuche, aber für Geschäftsvideos - die oft 30-60 Minuten oder länger dauern und eine Reihe von Themen abdecken - bieten manuelle Metadaten fast nie genug Beschreibung, um allein nützlich zu sein.
Transkripte sind ein umfassenderer Ansatz, bei dem einfach ein tatsächliches Videotranskript an Ihre Videodateien zur Indizierung angehängt wird. Die Erstellung von Transkripten ist ein sich entwickelnder Bereich - während viele Dienste diese Dateien noch manuell erstellen, kann der Prozess auch automatisiert werden. Wie auch immer Sie es entwickeln, die Qualität Ihrer Eingaben ist entscheidend - vollständige Transkripte sind wertvoller als Teiltranskripte, und solche Transkripte, die auch Notizen über den auf dem Bildschirm gezeigten Inhalt enthalten, sind wertvoller als solche, die nur den Dialog rezitieren.

Was ist besser für die Videosuche: Automatische oder manuelle Indizierung?

Die Wahl hängt wirklich von Ihren Bedürfnissen ab. Automatische Indizierungssysteme, die sich auf Technologie stützen, bieten schnellere Ergebnisse und können oft auf jedes Video angewendet werden, aber die Genauigkeit ist bei ASR und OCR nicht 100 %. Manuelle, menschenbasierte Ansätze wie die Transkription bieten in der Regel eine bessere Genauigkeit, benötigen aber mehr Zeit und sind oft mit zusätzlichen Kosten verbunden.

Zum Glück müssen Sie sich mit Panopto nicht entscheiden.

Die Smart Search Videosuchtechnologie von Panopto ist die branchenweit umfassendste inside-video Suchmaschine. Mit Panopto können Sie Ihre Videobibliothek auf die gleiche Weise durchsuchen, wie Sie es im Internet oder in Ihrer E-Mail tun würden.

Nach jedem Stichwort, das in Ihren Videos gesprochen wird, mit ASR
Mit OCR und Slide Content Ingestion können Sie nach jedem Wort suchen, das auf dem Bildschirm oder an anderer Stelle in Ihrem Video erscheint,
Durch herkömmliche und erweiterte Metadaten, einschließlich Tags und Titel, Anmerkungen und Kommentare des Betrachters,
Und optional durch komplette manuelle Transkriptionen Ihrer Videoinhalte.

Probieren Sie unsere Video-Suchmaschine selbst aus!

Sind Sie bereit zu sehen, was Ihrer Videosuche bisher gefehlt hat? Kontaktieren Sie unser Team noch heute und testen Sie Panopto kostenlos.