Communications

Une recherche vidéo plus intelligente qui utilise l'ASR et l'OCR

30 septembre 2020

Aujourd'hui, les moteurs de recherche ont fait de l'indexation du texte une science. Les araignées modernes trouvent et enregistrent le moindre mot écrit - et renvoient les résultats avec une telle efficacité que certains experts en efficacité recommandent aux gens d'abandonner leurs systèmes de classement des courriels et les barres de favoris de leur navigateur web et de se fier simplement à la recherche pour trouver ce dont ils ont besoin.

Mais pour la plupart des entreprises, cette profondeur de la capacité de recherche est réservée au texte. La vidéo, en particulier, reste une boîte noire, limitée aux métadonnées saisies manuellement, comme les titres et les balises.

La recherche vidéo est un problème qui doit être résolu.

Selon une étude réalisée par McKinsey et IDC, le travailleur intellectuel moyen passe désormais près de 20 % de son temps - soit près d'une journée entière, chaque semaine - à rechercher les informations dont il a besoin pour faire son travail efficacement. Comme les entreprises partagent de plus en plus en utilisant la vidéo, ce temps perdu ne fera qu'empirer sans une solution de recherche vidéo en place.

C'est pourquoi aujourd'hui, de plus en plus de plates-formes vidéo étendent leurs capacités de recherche vidéo. Pourtant, à mesure que le champ des solutions s'étend, il devient de plus en plus difficile pour les organisations de s'y retrouver. Pourquoi ? Parce que tous les moteurs de recherche vidéo ne sont pas créés égaux.

Forrester Research a récemment salué Panopto comme ayant "le meilleur support pour la recherche vidéo". Il est facile de comprendre pourquoi - personne ne va plus loin que Panopto en matière de recherche vidéo, comme le montre le graphique suivant.

Si une vidéo mérite d'être enregistrée et stockée, elle mérite d'être trouvée. Vous voulez des capacités de recherche vidéo à la hauteur de cette tâche. Les plateformes vidéo modernes trouvent aujourd'hui des moyens créatifs d'indexer le contenu des vidéos, en trouvant de nouvelles façons de capturer les métadonnées, les entrées audio et le contenu visuel.

Combien pourriez-vous économiser en
rendre vos vidéos plus faciles à rechercher ?

Calculer vos économies

Quelles sont donc les capacités d'un moteur de recherche vidéo ?

Fondamentalement, si un outil de recherche vidéo doit indexer vos vidéos, il doit être capable de trouver et de renvoyer tous les mots prononcés et montrés à l'écran.

Il existe un certain nombre de stratégies techniques pour obtenir ces informations, mais elles se répartissent en deux groupes : les stratégies automatisées et les stratégies manuelles.

Indexation vidéo automatisée par ASR et OCR

L'indexation automatisée des vidéos s'appuie sur une ou plusieurs technologies de vidéo intelligente pour capturer et discerner ce qui se passe dans votre vidéo. Ces outils automatisés peuvent souvent être appliqués à une vidéo dès la fin de l'enregistrement, ce qui accélère le processus d'indexation du contenu.

Les systèmes d'indexation vidéo automatisés les plus courants comprennent la reconnaissance automatique de la parole (ASR), la reconnaissance optique de caractères (OCR) et l'ingestion de contenu de diapositives. Ces trois systèmes ont des fonctions très différentes, c'est pourquoi nous allons les examiner de plus près.

Reconnaissance automatique de la parole (ASR) est une technologie utilisée pour identifier chaque mot prononcé dans un enregistrement. Une fois identifiés, les mots sont horodatés et ajoutés à un index de recherche. Les utilisateurs peuvent alors rechercher les mots prononcés, trouver le moment précis de la vidéo où ils ont été mentionnés et faire une avance rapide jusqu'à ce point de la vidéo. Étant donné que de nombreux spectateurs recherchent un moment à partir d'une idée ou d'une phrase dont ils se souviennent, l'ASR est un élément extrêmement utile de votre moteur de recherche vidéo.
Reconnaissance optique de caractères (OCR) est une technologie utilisée pour reconnaître le texte affiché à l'écran dans les vidéos. Souvent, dans les présentations modernes, un orateur passe d'une diapositive à un contenu en direct à l'écran, voire à d'autres vidéos. Sans la technologie OCR, tout texte affiché dans le cadre de ces présentations ne peut pas être indexé, car les moteurs de recherche comme Google ne peuvent pas reconnaître un texte enregistré sous forme d'image. La technologie OCR, en revanche, est conçue pour identifier et déchiffrer ces mots, ce qui permet à vos spectateurs de rechercher littéralement n'importe quel mot apparaissant à l'écran, n'importe où dans une vidéo.
Ingestion du contenu des diapositives fait référence à la technologie qui importe et indexe les diapositives de votre présentation PowerPoint ou Keynote lorsqu'elles sont utilisées dans votre vidéo. L'ingestion de contenu diffère de l'OCR en ce qu'elle extrait par programme les chaînes de texte réelles de vos diapositives, plutôt que de prendre une photo de la diapositive et d'essayer d'identifier les mots. L'ingestion de diapositives extrait également des informations supplémentaires qui ne sont pas affichées à l'écran, comme les notes de l'orateur, de sorte que votre équipe peut toujours trouver des moments précis dans la vidéo en fonction de n'importe quel mot contenu sur n'importe quelle diapositive.

Indexation manuelle des vidéos

L'indexation manuelle des vidéos, quant à elle, repose sur une intervention humaine qui a lieu une fois la vidéo terminée afin de faciliter l'indexation du contenu vidéo.

L'utilité des processus d'indexation manuelle varie en fonction de la quantité d'informations qu'ils peuvent ajouter. Certains processus sont assez complets, d'autres, beaucoup plus limités. Examinons les deux entrées manuelles les plus courantes :

Manuel Métadonnées désigne les informations ajoutées sur un fichier vidéo telles que le titre, l'auteur et une description. Les notes et commentaires des spectateurs peuvent également être ajoutés ici. Ces informations constituent un élément fondamental de la recherche de vidéos, mais pour les vidéos d'entreprise - qui durent souvent de 30 à 60 minutes ou plus et couvrent un large éventail de sujets - les métadonnées manuelles ne fournissent presque jamais une description suffisante pour être utiles à elles seules.
Transcriptions est une approche plus complète, réalisée en ajoutant simplement une transcription vidéo réelle à vos fichiers vidéo pour l'indexation. La production de transcriptions est un domaine en pleine évolution - si de nombreux services produisent encore ces fichiers manuellement, le processus peut être automatisé. Quelle que soit la façon dont vous le développez, la qualité de vos données est essentielle - les transcriptions complètes auront plus de valeur que les transcriptions partielles, et les transcriptions qui incluent également des notes sur le contenu montré à l'écran auront plus de valeur que celles qui ne font que réciter le dialogue.

Qu'est-ce qui est le mieux pour la recherche vidéo : Indexation automatique ou manuelle ?

Le choix dépend vraiment de vos besoins. Les systèmes d'indexation automatique qui reposent sur la technologie offrent des résultats plus rapides et peuvent souvent être appliqués à chaque vidéo, mais la précision n'est pas de 100 % avec l'ASR et l'OCR. Les approches manuelles, basées sur l'humain, telles que la transcription, offrent généralement une meilleure précision, mais sont plus longues à produire et ont souvent un coût supplémentaire.

Heureusement, avec Panopto, vous n'avez pas à choisir.

La technologie de recherche vidéo Smart Search de Panopto est le moteur de recherche vidéo interne le plus complet du secteur. Avec Panopto, vous pouvez effectuer des recherches dans votre vidéothèque de la même manière que vous le feriez sur Internet ou dans votre courrier électronique.

Par tout mot clé prononcé dans vos vidéos, avec ASR
Par tout mot apparaissant à l'écran ou ailleurs dans votre vidéo, grâce à l'OCR et à l'ingestion de contenu de diapositives,
Par des métadonnées traditionnelles et avancées, y compris les étiquettes et les titres, les notes et les commentaires des spectateurs,
Et, en option, par des transcriptions manuelles complètes de votre contenu vidéo.

Essayez notre moteur de recherche vidéo par vous-même !

Prêt à voir ce qui manquait à votre recherche vidéo ? Contactez notre équipe dès aujourd'hui pour essayer Panopto gratuitement.