- Kommunikation
Intelligentere Video-OCR

Die Suche nach intelligenteren Video-OCR-Verfahren begann vor vielen Jahren. Aber eigentlich begann alles mit Text.
Suchmaschinen haben die Indexierung von Texten heutzutage zu einer Wissenschaft gemacht. Moderne Webcrawler finden und speichern jedes einzelne geschriebene Wort – und liefern Ergebnisse so effizient, dass einige Effizienzexperten empfehlen, auf E-Mail-Ablagesysteme und Favoritenleisten im Webbrowser zu verzichten und sich stattdessen einfach auf die Suche zu verlassen, um das Gesuchte zu finden.
Doch für die meisten Organisationen ist diese umfassende Suchfunktion ausschließlich auf Texte beschränkt. Insbesondere Videos bleiben eine Blackbox und beschränken sich auf manuell eingegebene Metadaten wie Titel und Schlagwörter.
Video-OCR ist ein Problem, das gelöst werden muss.
Einer Studie von McKinsey und IDC zufolge verbringt der durchschnittliche Wissensarbeiter mittlerweile fast 20 % seiner Arbeitszeit – also fast einen ganzen Tag pro Woche – damit, nach Informationen zu suchen, die er für seine Arbeit benötigt. Da Unternehmen immer mehr Inhalte per Video teilen, wird sich diese Zeitverschwendung ohne eine entsprechende Videosuchlösung nur noch verschlimmern.
Deshalb erweitern heutzutage immer mehr Videoplattformen ihre Videosuchfunktionen. Doch mit der wachsenden Auswahl an Lösungen wird es für Unternehmen immer schwieriger, den Überblick zu behalten. Warum? Weil nicht alle Videosuchmaschinen gleich gut sind.
Forrester Research lobte kürzlich Panopto Sie bieten „die beste Unterstützung für die Videosuche“. Das ist leicht zu verstehen – niemand geht tiefer oder umfassender als sie. Panopto wenn es um die Videosuche geht.
Wenn ein Video es wert ist, aufgenommen und gespeichert zu werden, lohnt es sich auch, es wiederzufinden. Man benötigt daher eine Videosuchfunktion, die dieser Aufgabe gerecht wird. Moderne Videoplattformen entwickeln kreative Methoden, um die Inhalte von Videos zu indexieren und Metadaten, Audioeingaben und visuelle Inhalte zu erfassen.
Welche Funktionen sollte eine Videosuchmaschine also haben?
Grundsätzlich sollte ein Videosuchtool, wenn es Ihre Videos indexieren soll, in der Lage sein, alle gesprochenen und auf dem Bildschirm gezeigten Wörter zu finden und zurückzugeben.
Es gibt zwar eine Reihe technischer Strategien, um an diese Informationen zu gelangen, aber im Allgemeinen lassen sie sich in zwei Gruppen einteilen – automatisierte und manuelle.
Automatisierte Videoindizierung mittels ASR und OCR
Die automatisierte Videoindizierung nutzt eine oder mehrere intelligente Videotechnologien, um die Inhalte Ihres Videos zu erfassen und zu analysieren. Diese automatisierten Tools können oft unmittelbar nach Abschluss der Aufnahme auf ein Video angewendet werden, wodurch der Indexierungsprozess beschleunigt wird.
Gängige automatisierte Videoindexierungssysteme umfassen automatische Spracherkennung (ASR), optische Zeichenerkennung (OCR) und die Erfassung von Folieninhalten. Diese drei Systeme haben sehr unterschiedliche Funktionen, daher wollen wir sie uns genauer ansehen.
- Automatische Spracherkennung (ASR) ist eine Technologie, die jedes gesprochene Wort in einer Aufnahme identifiziert. Die erkannten Wörter werden mit einem Zeitstempel versehen und einem Suchindex hinzugefügt. Nutzer können dann nach gesprochenen Wörtern suchen, die genaue Stelle im Video finden, an der sie erwähnt wurden, und direkt dorthin vorspulen. Da viele Zuschauer nach einer bestimmten Stelle suchen, die auf einer Idee oder einem Satz basiert, an den sie sich erinnern, ist ASR ein äußerst hilfreicher Bestandteil Ihrer Videosuchmaschine.
- Optische Zeichenerkennung (OCR) ist eine Technologie zur Texterkennung in Videos. In modernen Präsentationen wechseln Sprecher häufig zwischen Folien, Live-Inhalten auf dem Bildschirm und anderen Videos. Ohne OCR kann der Text in diesen Präsentationen nicht indexiert werden, da Suchmaschinen wie Google als Bild gespeicherten Text nicht erkennen können. Die OCR-Technologie hingegen identifiziert und entschlüsselt diese Wörter und ermöglicht es Ihren Zuschauern, nach jedem beliebigen Wort zu suchen, das in einem Video erscheint.
- Die Folieninhaltserfassung bezeichnet die Technologie, die Ihre PowerPoint- oder Keynote-Präsentationsfolien importiert und indexiert, wenn diese in Ihrem Video verwendet werden. Im Gegensatz zur Texterkennung (OCR) extrahiert die Folieninhaltserfassung die Texte programmatisch aus Ihren Folien, anstatt ein Foto der Folie zu machen und Wörter zu erkennen. Zusätzlich werden auch nicht angezeigte Informationen wie Sprechernotizen erfasst, sodass Ihr Team anhand jedes Wortes auf einer Folie jederzeit die relevanten Stellen im Video finden kann.
Manuelle Videoindizierung
Die manuelle Videoindexierung hingegen beruht auf menschlichem Eingreifen, das nach Fertigstellung eines Videos erfolgt, um die Indexierung der Videoinhalte zu unterstützen.
Der Nutzen manueller Indexierungsprozesse hängt davon ab, wie viele Informationen sie zusätzlich liefern können. Manche Prozesse sind recht umfassend, andere deutlich eingeschränkter. Betrachten wir die beiden häufigsten manuellen Eingaben:
- Manuelle Metadaten bezeichnen Informationen, die einer Videodatei hinzugefügt werden, wie Titel, Autor und Beschreibung. Auch Anmerkungen und Kommentare von Zuschauern können hier hinterlegt werden. Sie sind ein grundlegender Bestandteil der Videosuche, doch bei Geschäftsvideos – die oft 30 bis 60 Minuten oder länger dauern und verschiedene Themen abdecken – bieten manuelle Metadaten allein fast nie genügend Informationen, um wirklich nützlich zu sein.
- Transkripte stellen einen umfassenderen Ansatz dar, bei dem den Videodateien einfach ein Transkript zur Indexierung hinzugefügt wird. Die Transkripterstellung ist ein sich stetig weiterentwickelndes Gebiet – viele Anbieter erstellen diese Dateien zwar noch manuell, der Prozess lässt sich aber automatisieren. Unabhängig von der gewählten Methode ist die Qualität der Eingabe entscheidend: Vollständige Transkripte sind wertvoller als unvollständige, und solche, die zusätzlich Anmerkungen zum Bildschirminhalt enthalten, sind wertvoller als solche, die lediglich den Dialog wiedergeben.
Was ist besser für die Videosuche: automatische oder manuelle Indizierung?
Die Wahl hängt ganz von Ihren Bedürfnissen ab. Automatische Indexierungssysteme, die auf Technologie basieren, liefern schnellere Ergebnisse und können oft auf jedes Video angewendet werden, allerdings ist die Genauigkeit bei ASR und OCR nicht hundertprozentig. Manuelle, menschliche Verfahren wie die Transkription bieten in der Regel eine höhere Genauigkeit, sind aber zeitaufwändiger und oft mit zusätzlichen Kosten verbunden.
Glücklicherweise müssen Sie sich nicht entscheiden mit Panopto Die
Panopto Die Smart Search -Videosuchtechnologie von [Name des Unternehmens] ist die branchenweit umfassendste Suchmaschine für Videos innerhalb von Videos. Panopto Sie können Ihre Videobibliothek auf die gleiche Weise durchsuchen wie das Internet oder Ihre E-Mails.
- Durch jedes beliebige Schlüsselwort, das in Ihren Videos gesprochen wird, mit ASR
- Durch jedes Wort, das jemals auf dem Bildschirm oder an anderer Stelle in Ihrem Video erscheint, mit OCR und Slide Content Ingestion,
- Durch traditionelle und fortgeschrittene Metadaten, einschließlich Tags und Titel, Anmerkungen und Kommentare der Betrachter,
- Und optional auch durch vollständige manuelle Transkriptionen Ihrer Videoinhalte.
Sie möchten mehr erfahren? Kontaktieren Sie unser Team, um eine Demo zu vereinbaren .



