커뮤니케이션

ASR 및 OCR을 활용한 더 진화된 비디오 검색

2012년 9월 18

오늘날 검색 엔진은 텍스트 색인화의 과학을 만들었습니다. 최신 스파이더는 마지막으로 작성된 모든 단어를 찾아서 기록하고 결과를 매우 효율적으로 반환하므로 일부 효율성 전문가는 사람들이 이메일 파일링 시스템과 웹 브라우저 즐겨 찾기 표시 줄을 포기하고 검색에 의존하여 필요한 것을 찾을 것을 권장합니다.

그러나 대부분의 조직에서 이러한 수준의 검색 기능은 텍스트에만 예약되어 있습니다. 특히 동영상은 제목 및 태그와 같이 수동으로 입력 한 메타 데이터로 제한되는 블랙 박스로 남아 있습니다.

비디오 검색은 해결해야 할 문제입니다.

McKinsey와 IDC 의 연구에 따르면, 평균적인 지식 근로자는 이제 거의 20 %의 시간 (매주 하루 종일 거의 하루)을 자신의 업무를 효과적으로 수행하는 데 필요한 정보를 찾는 데 사용합니다. 기업이 비디오를 사용하여 점점 더 많은 정보를 공유함에 따라 그 낭비되는 시간은 비디오 검색 솔루션 없이는 더욱 악화 될 것입니다.

이것이 오늘날 점점 더 많은 비디오 플랫폼이 비디오 검색 기능을 확장하고있는 이유입니다. 그러나 솔루션 분야가 확장됨에 따라 조직이 탐색하는 것이 점점 더 어려워지고 있습니다. 왜? 모든 비디오 검색 엔진 이 동일하게 만들어지는 것은 아니기 때문입니다.

Forrester Research는 최근 Panopto가 " 비디오 검색을위한 최고의 지원 "을 제공한다고 칭찬했습니다. 그 이유를 쉽게 알 수 있습니다. 다음 차트에서 볼 수 있듯이 비디오 검색과 관련하여 Panopto보다 더 깊거나 더 넓은 사람은 없습니다.

동영상을 녹화하고 저장할 가치가 있다면 찾아 볼 가치가 있습니다. 이러한 작업을 수행 할 수있는 비디오 검색 기능을 원합니다. 최신 비디오 플랫폼은 이제 비디오 내의 콘텐츠를 인덱싱하는 창의적인 방법을 찾고 메타 데이터, 오디오 입력 및 시각적 콘텐츠를 캡처하는 새로운 방법을 찾고 있습니다.

비디오를 통해 지식을 공유함으로써
동영상을 더 쉽게 검색 할 수 있습니까?

절감액을 계산

그렇다면 비디오 검색 엔진에는 어떤 기능이 있어야합니까?

기본적으로 비디오 검색 도구가 비디오를 색인화하는 경우 화면에 말하고 표시되는 모든 단어를 찾아 반환 할 수 있어야합니다.

이 정보를 얻을 수있는 기술 전략은 여러 가지가 있지만 자동 또는 수동의 두 그룹으로 분류되는 경향이 있습니다.

ASR 및 OCR을 통한 자동화 된 비디오 인덱싱

자동 비디오 인덱싱은 하나 이상의 지능형 비디오 기술 을 사용하여 비디오에서 일어나는 일을 캡처하고 식별합니다. 이러한 자동화 도구는 즉시 녹화가 완료되는 즉시 비디오에 적용 할 수있어 콘텐츠 색인 생성 프로세스를 가속화합니다.

일반적인 자동 비디오 인덱싱 시스템에는 자동 음성 인식 (ASR), 광학 문자 인식 (OCR) 및 슬라이드 콘텐츠 수집이 포함됩니다. 이 세 가지 시스템은 매우 다른 작업을 수행하므로 각각을 조금 더 자세히 살펴 보겠습니다.

ASR (자동 음성 인식 )은 녹음 된 각 단어를 식별하는 데 사용되는 기술입니다. 식별되면 단어에 타임 스탬프가 찍히고 검색 색인에 추가됩니다. 그런 다음 사용자는 음성 단어를 검색하고 동영상에서 언급 된 정확한 순간을 찾은 다음 동영상의 해당 지점으로 빨리 감을 수 있습니다. 많은 시청자가 기억하는 아이디어 나 문구를 바탕으로 순간을 검색 할 것이므로 ASR은 비디오 검색 엔진에서 매우 유용한 부분입니다.
광학 문자 인식 (OCR)은 비디오 내 화면에 표시되는 텍스트를 인식하는 데 사용되는 기술입니다. 오늘날의 최신 프레젠테이션에서 발표자는 슬라이드, 라이브 화면 콘텐츠 및 기타 비디오간에 전환하는 경우가 많습니다. OCR이 없으면 Google과 같은 검색 엔진이 이미지로 저장된 텍스트를 인식 할 수 없기 때문에 이러한 프레젠테이션의 일부로 표시된 텍스트를 색인화 할 수 없습니다. 그러나 OCR 기술은 이러한 단어를 식별하고 해독하도록 설계되어 시청자가 비디오의 어느 위치에서나 화면에 나타나는 모든 단어를 문자 그대로 검색 할 수 있습니다.
슬라이드 콘텐츠 수집 은 비디오에서 사용할 때 실제 PowerPoint 또는 Keynote 프레젠테이션 슬라이드를 가져와 색인화하는 기술을 의미합니다. 콘텐츠 수집은 슬라이드 사진을 찍고 단어를 식별하는 대신 슬라이드에서 실제 텍스트 문자열을 프로그래밍 방식으로 추출한다는 점에서 OCR과 다릅니다. 또한 슬라이드 수집은 발표자의 메모와 같이 화면에 표시되지 않는 추가 정보를 추출하므로 팀은 슬라이드에 포함 된 단어를 기반으로 항상 정확한 순간을 비디오에서 찾을 수 있습니다.

수동 비디오 인덱싱

반면 수동 비디오 인덱싱은 비디오 콘텐츠 인덱싱을 돕기 위해 비디오가 완료된 후 발생하는 사람의 개입에 의존합니다.

수동 인덱싱 프로세스의 유용성은 추가 할 수있는 정보의 양에 따라 다릅니다. 일부 프로세스는 매우 포괄적이고 다른 프로세스는 훨씬 더 제한적입니다. 가장 일반적인 두 가지 수동 입력을 살펴 보겠습니다.

수동 메타 데이터 는 제목, 작성자 및 설명과 같이 비디오 파일에 추가 된 정보를 의미합니다. 뷰어 메모 및 댓글도 여기에 추가 할 수 있습니다. 이들은 비디오 검색의 기본 부분이지만 30-60 분 이상 지속되고 다양한 주제를 다루는 비즈니스 비디오의 경우 수동 메타 데이터는 그 자체로 유용 할만큼 충분한 설명을 거의 제공하지 않습니다.
대본 은 인덱싱을 위해 실제 동영상 대본을 동영상 파일에 추가하기 만하면 더 포괄적 인 접근 방식입니다. 대본 제작은 진화하는 분야입니다. 많은 서비스에서 여전히 이러한 파일을 수동으로 생성하지만 프로세스를 자동화 할 수 있습니다. 그러나 당신이 그것을 개발하든, 당신의 입력의 질은 필수적입니다. 완전한 대본은 부분적인 대본보다 더 가치가있을 것이고, 화면에 보여지는 내용에 대한 메모를 포함하는 대본은 대화만을 암송하는 것보다 더 가치가있을 것입니다.

비디오 검색에 더 적합한 것은 무엇입니까 : 자동 또는 수동 인덱싱?

선택은 실제로 귀하의 필요에 달려 있습니다. 기술에 의존하는 자동 인덱싱 시스템은 더 빠른 결과를 제공하고 종종 모든 비디오에 적용 할 수 있지만 ASR 및 OCR에서 정확도가 100 %는 아닙니다. 전사와 같은 수동 인간 기반 접근 방식은 일반적으로 정확도가 향상되지만 제작 시간이 더 오래 걸리고 종종 추가 비용이 발생합니다.

다행히도 Panopto를 선택할 필요가 없습니다.

Panopto의 스마트 검색 비디오 검색 기술은 업계에서 가장 포괄적 인 내부 비디오 검색 엔진 입니다. Panopto를 사용하면 인터넷이나 이메일을 통해 검색하는 것과 동일한 방식으로 비디오 라이브러리를 검색 할 수 있습니다.

ASR을 사용하여 동영상에서 사용 된 모든 키워드
OCR 및 슬라이드 콘텐츠 수집을 사용하여 화면이나 동영상의 다른 곳에 나타나는 단어로
태그 및 제목, 뷰어 메모 및 댓글을 포함한 기존 및 고급 메타 데이터로
그리고 선택적으로 비디오 콘텐츠의 완전한 수동 필사를 통해.

비디오 검색 엔진을 직접 사용해보십시오!

비디오 검색에서 누락 된 내용을 볼 준비가 되셨습니까? Panopto를 무료로 사용해 보려면 지금 저희 팀에 문의하십시오 .