• Communications

OCR vidéo plus intelligente

La recherche d'un OCR vidéo plus intelligent a commencé il y a plusieurs années. Mais c'est avec le texte que tout a commencé.

Aujourd'hui, les moteurs de recherche ont fait de l'indexation des textes une science. Les robots modernes trouvent et enregistrent le moindre mot écrit - et renvoient les résultats si efficacement que certains experts en efficacité recommandent aux gens d'abandonner leurs systèmes de classement des courriels et les barres de favoris de leurs navigateurs web et de s'en remettre simplement à la recherche pour trouver ce dont ils ont besoin.

Mais pour la plupart des organisations, cette capacité de recherche approfondie est réservée au texte seul. La vidéo, en particulier, reste une boîte noire, limitée aux métadonnées saisies manuellement, comme les titres et les étiquettes.

L'OCR vidéo est un problème à résoudre

Selon une étude de McKinsey et IDC, le travailleur intellectuel moyen consacre aujourd'hui près de 20 % de son temps - soit près d'une journée entière, chaque semaine - à la recherche des informations dont il a besoin pour faire son travail efficacement. Les entreprises utilisant de plus en plus la vidéo pour leurs échanges, cette perte de temps ne fera qu'empirer si aucune solution de recherche vidéo n'est mise en place.

C'est pourquoi aujourd'hui, de plus en plus de plateformes vidéo développent leurs capacités de recherche vidéo. Pourtant, à mesure que le champ des solutions s'élargit, il devient de plus en plus difficile pour les organisations de s'y retrouver. Pourquoi ? Parce que tous les moteurs de recherche vidéo ne sont pas égaux.

Forrester Research a récemment salué Panopto offrir « le meilleur support pour la recherche vidéo ». Il est facile de comprendre pourquoi : personne ne va plus loin ni plus large que Panopto matière de recherche vidéo, comme le montre le graphique suivant.

Tableau des capacités des moteurs de recherche vidéo en 2015

Si une vidéo vaut la peine d'être enregistrée et stockée, elle vaut la peine d'être retrouvée. Vous avez besoin de capacités de recherche vidéo à la hauteur de cette tâche. Les plateformes vidéo modernes trouvent aujourd'hui des moyens créatifs d'indexer le contenu des vidéos, en trouvant de nouvelles façons de capturer les métadonnées, les entrées audio et le contenu visuel.

Calculez vos économies

Quelles doivent donc être les capacités d'un moteur de recherche vidéo ?

Fondamentalement, si un outil de recherche vidéo doit indexer vos vidéos, il doit être en mesure de trouver et de renvoyer tous les mots prononcés et montrés à l'écran.

S'il existe un certain nombre de stratégies techniques pour obtenir ces informations, elles se répartissent généralement en deux groupes : les stratégies automatisées et les stratégies manuelles.

Indexation automatisée des vidéos par ASR et OCR

L'indexation vidéo automatisée s'appuie sur une ou plusieurs technologies vidéo intelligentes pour capturer et discerner ce qui se passe dans votre vidéo. Ces outils automatisés peuvent souvent être appliqués à une vidéo au moment même où l'enregistrement est terminé, ce qui accélère le processus d'indexation du contenu.

Les systèmes courants d'indexation automatique des vidéos comprennent la reconnaissance automatique de la parole (ASR), la reconnaissance optique de caractères (OCR) et l'ingestion de contenu de diapositives. Ces trois systèmes ont des fonctions très différentes, c'est pourquoi nous allons examiner chacun d'entre eux de plus près.

  • La reconnaissance automatique de la parole (ASR) est une technologie utilisée pour identifier chaque mot prononcé dans un enregistrement. Une fois identifiés, les mots sont horodatés et ajoutés à un index de recherche. Les utilisateurs peuvent alors rechercher les mots prononcés, trouver le moment précis de la vidéo où ils ont été mentionnés et avancer rapidement jusqu'à ce point de la vidéo. Étant donné que de nombreux spectateurs recherchent un moment en fonction d'une idée ou d'une phrase dont ils se souviennent, la RAS est un élément extrêmement utile de votre moteur de recherche vidéo.
  • La reconnaissance optique de caractères (OCR) est une technologie utilisée pour reconnaître le texte affiché à l'écran dans les vidéos. Dans les présentations modernes, l'orateur passe souvent d'une diapositive à un contenu en direct à l'écran, voire à d'autres vidéos. Sans OCR, tout texte affiché dans le cadre de ces présentations ne peut être indexé, car les moteurs de recherche comme Google ne peuvent pas reconnaître un texte enregistré sous forme d'image. La technologie OCR, en revanche, est conçue pour identifier et déchiffrer ces mots, ce qui permet à vos spectateurs de rechercher littéralement n'importe quel mot apparaissant à l'écran, n'importe où dans une vidéo.
  • L'ingestion du contenu des diapositives fait référence à la technologie qui importe et indexe les diapositives de vos présentations PowerPoint ou Keynote lorsqu'elles sont utilisées dans votre vidéo. L'ingestion de contenu diffère de l'OCR en ce sens qu'elle extrait par programme les chaînes de texte réelles de vos diapositives, plutôt que de prendre une image de la diapositive et d'essayer d'identifier les mots. L'ingestion de diapositives permet également d'extraire des informations supplémentaires qui ne sont pas affichées à l'écran, telles que les notes de l'orateur, afin que votre équipe puisse toujours trouver des moments précis dans la vidéo en se basant sur n'importe quel mot contenu dans n'importe quelle diapositive.

Indexation manuelle des vidéos

L'indexation vidéo manuelle, quant à elle, repose sur une intervention humaine qui a lieu après la fin de la vidéo afin d'aider à l'indexation du contenu vidéo.

L'utilité des processus d'indexation manuelle varie en fonction de la quantité d'informations qu'ils peuvent ajouter. Certains processus sont très complets, d'autres beaucoup plus limités. Examinons les deux entrées manuelles les plus courantes :

  • Les métadonnées manuelles sont les informations ajoutées à un fichier vidéo, telles que le titre, l'auteur et une description. Des notes et commentaires du spectateur peuvent également être ajoutés. Elles constituent un élément fondamental de la recherche vidéo, mais pour les vidéos professionnelles, qui durent souvent de 30 à 60 minutes ou plus et couvrent un large éventail de sujets, les métadonnées manuelles ne fournissent presque jamais une description suffisante pour être utiles à elles seules.
  • Les transcriptions constituent une approche plus complète, qui consiste simplement à ajouter une transcription à vos fichiers vidéo pour l'indexation. La production de transcriptions est un domaine en pleine évolution - bien que de nombreux services produisent encore ces fichiers manuellement, le processus peut être automatisé. Quelle que soit la manière dont vous la développez, la qualité de vos données est essentielle : les transcriptions complètes auront plus de valeur que les transcriptions partielles, et les transcriptions qui comprennent également des notes sur le contenu affiché à l'écran auront plus de valeur que celles qui se contentent de réciter les dialogues.

Quelle est la meilleure solution pour la recherche de vidéos : l'indexation automatique ou manuelle ?

Le choix dépend vraiment de vos besoins. Les systèmes d'indexation automatique reposant sur la technologie offrent des résultats plus rapides et peuvent souvent être appliqués à chaque vidéo, mais la précision n'est pas de 100 % avec l'ASR et l'OCR. Les approches manuelles, basées sur l'homme, telles que la transcription, offrent généralement une meilleure précision, mais prennent plus de temps à produire et ont souvent un coût supplémentaire.

Heureusement, avec Panopto, vous n'avez pas à choisir.

La technologie de recherche vidéo Smart Search Panoptoestle moteur de recherche interne le plus complet du secteur. Avec Panopto, vous pouvez effectuer des recherches dans votre vidéothèque de la même manière que vous effectuez des recherches sur Internet ou dans vos e-mails.

  • Par n'importe quel mot clé prononcé dans vos vidéos, avec ASR
  • Par n'importe quel mot apparaissant à l'écran ou ailleurs dans votre vidéo, grâce à la reconnaissance optique de caractères et à l'ingestion de contenu de diapositives,
  • Par des métadonnées traditionnelles et avancées, y compris des tags et des titres, des notes et des commentaires de spectateurs,
  • Et en option, par des transcriptions manuelles complètes de votre contenu vidéo.

Essayez notre moteur de recherche vidéo !

Prêt à voir ce qui manque à votre recherche vidéo ? Contactez notre équipe dès aujourd'hui pour planifier une démonstration.