• Comunicazioni

OCR video più intelligente

La ricerca di un sistema OCR video più intelligente è iniziata molti anni fa. Ma in realtà tutto è cominciato con il testo.

Oggi i motori di ricerca hanno fatto dell'indicizzazione del testo una vera e propria scienza. I moderni spider trovano e registrano ogni singola parola scritta, restituendo risultati con un'efficienza tale che alcuni esperti di ottimizzazione consigliano di abbandonare i sistemi di archiviazione delle email e le barre dei preferiti del browser, affidandosi semplicemente alla ricerca per trovare ciò di cui si ha bisogno.

Ma per la maggior parte delle organizzazioni, questa capacità di ricerca approfondita è riservata esclusivamente al testo. I video, in particolare, rimangono una scatola nera, limitata a metadati inseriti manualmente come titoli e tag.

Il riconoscimento ottico dei caratteri (OCR) nei video è un problema che deve essere risolto.

Secondo uno studio di McKinsey e IDC, il lavoratore medio dedica ormai quasi il 20% del suo tempo, ovvero quasi un'intera giornata a settimana, alla ricerca delle informazioni necessarie per svolgere il proprio lavoro in modo efficace. Con la crescente diffusione della condivisione di contenuti tramite video, questo spreco di tempo non potrà che aumentare in assenza di una soluzione di ricerca video.

Ecco perché oggi sempre più piattaforme video stanno ampliando le proprie funzionalità di ricerca video. Tuttavia, con l'espansione del panorama delle soluzioni, per le organizzazioni diventa sempre più difficile orientarsi. Perché? Perché non tutti i motori di ricerca video sono uguali.

Forrester Research ha recentemente elogiato Panopto come colui che ha “il miglior supporto per la ricerca video”. È facile capire perché: nessuno va più in profondità o più in là di Panopto quando si tratta di ricerca video.

Se un video merita di essere registrato e archiviato, merita anche di essere trovato. È quindi fondamentale disporre di funzionalità di ricerca video all'altezza di questo compito. Le moderne piattaforme video stanno trovando soluzioni innovative per indicizzare i contenuti dei video, individuando nuovi modi per acquisire metadati, input audio e contenuti visivi.

Quali funzionalità dovrebbe quindi avere un motore di ricerca video?

Fondamentalmente, se uno strumento di ricerca video deve indicizzare i tuoi video, deve essere in grado di trovare e restituire tutte le parole pronunciate e visualizzate sullo schermo.

Sebbene esistano diverse strategie tecniche per ottenere queste informazioni, esse tendono a rientrare in due gruppi: automatizzate o manuali.

Indicizzazione video automatizzata tramite ASR e OCR

L'indicizzazione video automatizzata si basa su una o più tecnologie video intelligenti per acquisire e analizzare ciò che accade nel video. Questi strumenti automatizzati possono spesso essere applicati a un video non appena la registrazione è completata, velocizzando il processo di indicizzazione del contenuto.

I sistemi di indicizzazione video automatizzata più comuni includono il riconoscimento automatico del parlato (ASR), il riconoscimento ottico dei caratteri (OCR) e l'acquisizione di contenuti da diapositive. Questi tre sistemi svolgono funzioni molto diverse, quindi analizziamoli più nel dettaglio.

  • Il riconoscimento vocale automatico (ASR) è una tecnologia utilizzata per identificare ogni parola pronunciata in una registrazione. Una volta identificate, le parole vengono contrassegnate con un timestamp e aggiunte a un indice di ricerca. Gli utenti possono quindi cercare le parole pronunciate, trovare il momento preciso nel video in cui sono state menzionate e avanzare velocemente fino a quel punto. Poiché molti spettatori cercano un momento specifico basandosi su un'idea o una frase che ricordano, l'ASR è una componente incredibilmente utile del motore di ricerca video.
  • Il riconoscimento ottico dei caratteri (OCR) è una tecnologia utilizzata per riconoscere il testo visualizzato sullo schermo all'interno dei video. Spesso, nelle presentazioni moderne, un relatore passa da diapositive a contenuti in diretta sullo schermo e persino ad altri video. Senza l'OCR, qualsiasi testo visualizzato durante queste presentazioni non può essere indicizzato perché i motori di ricerca come Google non sono in grado di riconoscere il testo salvato come immagine. La tecnologia OCR, tuttavia, è progettata per identificare e decifrare queste parole, consentendo agli spettatori di cercare letteralmente qualsiasi parola che appare sullo schermo in qualsiasi punto di un video.
  • L'acquisizione del contenuto delle diapositive si riferisce alla tecnologia che importa e indicizza le diapositive delle presentazioni PowerPoint o Keynote quando vengono utilizzate nei video. L'acquisizione del contenuto si differenzia dall'OCR in quanto estrae programmaticamente le stringhe di testo dalle diapositive, anziché scattare una foto della diapositiva e tentare di identificare le parole. L'acquisizione del contenuto delle diapositive estrae anche informazioni aggiuntive non visualizzate sullo schermo, come le note del relatore, in modo che il team possa sempre trovare momenti precisi nel video in base a qualsiasi parola contenuta in qualsiasi diapositiva.

Indicizzazione manuale dei video

L'indicizzazione manuale dei video, d'altro canto, si basa sull'intervento umano che avviene dopo il completamento di un video, al fine di facilitarne l'indicizzazione.

L'utilità dei processi di indicizzazione manuale varia in base alla quantità di informazioni che possono aggiungere. Alcuni processi sono piuttosto completi, altri molto più limitati. Analizziamo i due tipi di input manuali più comuni:

  • I metadati manuali si riferiscono alle informazioni aggiunte a un file video, come titolo, autore e descrizione. Possono essere aggiunti anche note e commenti degli spettatori. Questi elementi sono fondamentali per la ricerca video, ma per i video aziendali, che spesso durano dai 30 ai 60 minuti o più e trattano una vasta gamma di argomenti, i metadati manuali raramente forniscono una descrizione sufficiente per essere utili da soli.
  • Le trascrizioni rappresentano un approccio più completo, che consiste semplicemente nell'aggiungere una vera e propria trascrizione video ai file video per l'indicizzazione. La produzione di trascrizioni è un settore in continua evoluzione: sebbene molti servizi producano ancora questi file manualmente, il processo può essere automatizzato. Indipendentemente dal metodo utilizzato, la qualità del materiale di partenza è fondamentale: le trascrizioni complete saranno più preziose di quelle parziali, e quelle che includono anche note sul contenuto mostrato sullo schermo saranno più utili di quelle che si limitano a riportare i dialoghi.

Per la ricerca video, è meglio l'indicizzazione automatica o manuale?

La scelta dipende dalle vostre esigenze. I sistemi di indicizzazione automatica basati sulla tecnologia offrono risultati più rapidi e spesso possono essere applicati a qualsiasi video, ma la precisione non è del 100% con ASR e OCR. Gli approcci manuali, basati sull'intervento umano, come la trascrizione, offrono in genere una maggiore precisione, ma richiedono più tempo e spesso comportano costi aggiuntivi.

Fortunatamente, non devi scegliere con Panopto .

Panopto La tecnologia di ricerca video Smart Search di è il motore di ricerca video interno più completo del settore. Panopto Puoi effettuare ricerche nella tua libreria video nello stesso modo in cui effettueresti una ricerca su Internet o tramite la tua posta elettronica.

  • Per qualsiasi parola chiave pronunciata nei tuoi video, con ASR
  • Per ogni parola che appare sullo schermo o in qualsiasi altro punto del video, con OCR e acquisizione del contenuto delle diapositive,
  • Tramite metadati tradizionali e avanzati, inclusi tag e titoli, note e commenti degli spettatori,
  • E, facoltativamente, tramite trascrizioni manuali complete dei vostri contenuti video.

Desideri saperne di più? Contatta il nostro team per programmare una demo .