• Communications

OCR vidéo plus intelligent

La recherche d'une reconnaissance optique de caractères (OCR) vidéo plus performante a commencé il y a de nombreuses années. Mais tout a commencé avec le texte.

Les moteurs de recherche actuels ont fait de l'indexation des textes une science. Les robots d'indexation modernes trouvent et enregistrent chaque mot écrit, et fournissent des résultats si efficaces que certains experts recommandent d'abandonner les systèmes de classement des courriels et les barres de favoris des navigateurs web, et de se fier uniquement à la recherche pour trouver ce dont on a besoin.

Mais pour la plupart des organisations, cette capacité de recherche avancée se limite au texte. La vidéo, en particulier, reste une boîte noire, restreinte aux métadonnées saisies manuellement, comme les titres et les mots-clés.

La reconnaissance optique de caractères vidéo est un problème qui doit être résolu.

D'après une étude de McKinsey et IDC, les travailleurs du savoir consacrent en moyenne près de 20 % de leur temps – soit presque une journée entière par semaine – à la recherche d'informations nécessaires à leur travail. Avec la multiplication des contenus vidéo en entreprise, ce temps perdu ne fera que s'accroître en l'absence d'une solution de recherche vidéo.

C’est pourquoi, aujourd’hui, de plus en plus de plateformes vidéo développent leurs fonctionnalités de recherche vidéo. Cependant, face à cette multiplication des solutions, il devient de plus en plus difficile pour les entreprises de s’y retrouver. Pourquoi ? Parce que tous les moteurs de recherche vidéo ne se valent pas.

Forrester Research a récemment fait l'éloge de Panopto comme ayant « le meilleur support pour la recherche vidéo ». On comprend facilement pourquoi : personne ne va plus loin ni plus en profondeur que Panopto en matière de recherche vidéo.

Si une vidéo mérite d'être enregistrée et conservée, elle mérite aussi d'être retrouvée. Il vous faut donc des outils de recherche vidéo capables de relever ce défi. Les plateformes vidéo modernes développent des méthodes innovantes pour indexer le contenu des vidéos et capturer les métadonnées, les entrées audio et le contenu visuel.

Quelles sont donc les fonctionnalités qu'un moteur de recherche vidéo doit posséder ?

Fondamentalement, si un outil de recherche vidéo doit indexer vos vidéos, il doit être capable de trouver et de renvoyer tous les mots prononcés et affichés à l'écran.

Bien qu'il existe un certain nombre de stratégies techniques pour accéder à ces informations, elles se répartissent généralement en deux groupes : automatisées ou manuelles.

Indexation vidéo automatisée via la reconnaissance automatique de caractères (ASR) et la reconnaissance optique de caractères (OCR)

L'indexation vidéo automatisée repose sur une ou plusieurs technologies vidéo intelligentes pour capturer et analyser le contenu de votre vidéo. Ces outils automatisés peuvent souvent être appliqués à une vidéo dès la fin de l'enregistrement, accélérant ainsi le processus d'indexation.

Les systèmes d'indexation vidéo automatisés les plus courants comprennent la reconnaissance vocale automatique (ASR), la reconnaissance optique de caractères (OCR) et l'ingestion du contenu des diapositives. Ces trois systèmes ont des fonctions très différentes ; examinons-les donc plus en détail.

  • La reconnaissance vocale automatique (RVA) est une technologie permettant d'identifier chaque mot prononcé dans un enregistrement. Une fois identifiés, les mots sont horodatés et ajoutés à un index de recherche. Les utilisateurs peuvent ainsi rechercher des mots prononcés, trouver le moment précis de la vidéo où ils sont mentionnés et avancer rapidement jusqu'à ce passage. Étant donné que de nombreux spectateurs effectueront leur recherche en se basant sur une idée ou une expression dont ils se souviennent, la RVA est un atout précieux pour votre moteur de recherche vidéo.
  • La reconnaissance optique de caractères (OCR) est une technologie permettant de reconnaître le texte affiché à l'écran dans les vidéos. De nos jours, lors des présentations modernes, l'orateur alterne fréquemment entre diapositives, contenu en direct et même d'autres vidéos. Sans OCR, le texte affiché dans ces présentations ne peut être indexé, car les moteurs de recherche comme Google ne peuvent pas reconnaître le texte enregistré sous forme d'image. La technologie OCR, quant à elle, est conçue pour identifier et déchiffrer ces mots, permettant ainsi aux spectateurs de rechercher n'importe quel mot apparaissant à l'écran, n'importe où dans une vidéo.
  • L'ingestion de contenu de diapositives désigne la technologie qui importe et indexe vos diapositives PowerPoint ou Keynote lorsqu'elles sont utilisées dans votre vidéo. Contrairement à la reconnaissance optique de caractères (OCR), l'ingestion de contenu extrait automatiquement le texte de vos diapositives, au lieu de prendre une photo de la diapositive et d'essayer d'identifier les mots. L'ingestion de contenu extrait également les informations supplémentaires non affichées à l'écran, telles que les notes de l'orateur, permettant ainsi à votre équipe de retrouver facilement des passages précis de la vidéo à partir de n'importe quel mot contenu dans n'importe quelle diapositive.

Indexation vidéo manuelle

L'indexation vidéo manuelle, en revanche, repose sur une intervention humaine qui a lieu après la finalisation d'une vidéo afin de faciliter l'indexation de son contenu.

L'utilité des processus d'indexation manuelle varie selon la quantité d'informations qu'ils peuvent ajouter. Certains processus sont très complets, d'autres beaucoup plus limités. Examinons les deux types d'indexation manuelle les plus courants :

  • Les métadonnées manuelles désignent les informations ajoutées à un fichier vidéo, telles que le titre, l'auteur et une description. Les notes et commentaires des spectateurs peuvent également y être ajoutés. Elles constituent un élément fondamental de la recherche vidéo, mais pour les vidéos professionnelles — qui durent souvent entre 30 et 60 minutes, voire plus, et abordent divers sujets — les métadonnées manuelles sont rarement suffisamment descriptives pour être utiles à elles seules.
  • La transcription est une approche plus complète, consistant à ajouter une transcription vidéo à vos fichiers vidéo pour l'indexation. La production de transcriptions est un domaine en constante évolution : si de nombreux services produisent encore ces fichiers manuellement, le processus peut être automatisé. Quelle que soit la méthode choisie, la qualité de vos données d'entrée est essentielle : les transcriptions complètes sont plus précieuses que les transcriptions partielles, et celles qui incluent des notes sur le contenu affiché à l'écran sont plus utiles que celles qui se contentent de retranscrire les dialogues.

Quelle est la meilleure solution pour la recherche vidéo : l’indexation automatique ou manuelle ?

Le choix dépend vraiment de vos besoins. Les systèmes d'indexation automatique, qui s'appuient sur la technologie, offrent des résultats plus rapides et peuvent souvent être appliqués à toutes les vidéos, mais leur précision n'est pas de 100 % avec la reconnaissance automatique de la parole (ASR) et la reconnaissance optique de caractères (OCR). Les méthodes manuelles, réalisées par des humains, comme la transcription, offrent généralement une meilleure précision, mais sont plus longues à mettre en œuvre et souvent plus coûteuses.

Heureusement, vous n'avez pas à choisir avec Panopto .

Panopto La technologie de recherche vidéo Smart Search de [Nom de l'entreprise] est le moteur de recherche vidéo interne le plus complet du secteur. Panopto Vous pouvez effectuer une recherche dans votre vidéothèque de la même manière que vous le feriez sur Internet ou dans votre messagerie électronique.

  • Grâce à n'importe quel mot-clé prononcé dans vos vidéos, avec la reconnaissance vocale automatique (ASR),
  • Grâce à la reconnaissance optique de caractères (OCR) et à l'ingestion de contenu de diapositives, tout mot apparaissant à l'écran ou ailleurs dans votre vidéo,
  • Grâce aux métadonnées traditionnelles et avancées, notamment les balises et les titres, les notes et les commentaires des spectateurs,
  • Et, en option, par des transcriptions manuelles complètes de votre contenu vidéo.

Vous souhaitez en savoir plus ? Contactez notre équipe pour programmer une démonstration .