- 통신
더 스마트한 영상 OCR

더 스마트한 영상 OCR 기술에 대한 탐구는 수년 전부터 시작되었습니다. 하지만 그 모든 것은 사실 텍스트에서 비롯되었습니다.
오늘날 검색 엔진은 텍스트 색인화를 과학으로 발전시켰다. 현대의 스파이더는 모든 글자를 찾아 기록하며, 그 효율성이 워낙 뛰어나 일부 효율성 전문가들은 이메일 분류 체계나 웹 브라우저 즐겨찾기 바를 포기하고 필요한 정보를 검색에만 의존할 것을 권고하고 있다.
그러나 대부분의 조직에서는 그 정도의 심층 검색 기능이 텍스트에만 국한됩니다. 특히 동영상은 여전히 블랙박스로 남아 있으며, 제목이나 태그 같은 수동으로 입력된 메타데이터에만 의존하고 있습니다.
비디오 OCR은 해결해야 할 과제입니다.
맥킨지와 IDC의 연구에 따르면, 현재 지식 근로자들은 업무를 효과적으로 수행하는 데 필요한 정보를 찾는 데만 평균적으로 근무 시간의 약 20%—매주 거의 하루에 가까운 시간—를 소비하고 있습니다. 기업들이 비디오를 통해 점점 더 많은 정보를 공유함에 따라, 비디오 검색 솔루션이 마련되지 않으면 이러한 시간 낭비는 더욱 악화될 것입니다.

그래서 오늘날 점점 더 많은 동영상 플랫폼들이 동영상 검색 기능을 확장하고 있습니다. 그러나 솔루션 분야가 확대됨에 따라 조직들이 방향을 잡는 것은 점점 더 어려워지고 있습니다. 왜일까요? 모든 동영상 검색 엔진이 동등하게 만들어진 것은 아니기 때문입니다.
포레스터 리서치는 최근 Panopto "동영상 검색 분야에서 최고의 지원"을 Panopto . 그 이유는 명확합니다. 아래 차트에서 확인할 수 있듯이, 동영상 검색에 Panopto 깊이 있고 폭넓은 기능을 제공하는 솔루션은 없습니다.

동영상을 녹화하고 저장할 가치가 있다면, 찾아볼 가치도 있습니다. 그에 걸맞은 동영상 검색 기능이 필요합니다. 현대적인 동영상 플랫폼들은 이제 동영상 내 콘텐츠를 색인화하는 창의적인 방법을 모색하며, 메타데이터, 오디오 입력, 시각적 콘텐츠를 포착하는 새로운 방식을 찾아내고 있습니다.
동영상을 검색하기 쉽게 만들면
동영상을 더 쉽게 검색할 수 있게 만들면 얼마나 절약할 수 있을까요?
그렇다면 동영상 검색 엔진은 어떤 기능을 갖춰야 할까?
근본적으로, 동영상 검색 도구가 사용자의 동영상을 색인화하려면 화면에 표시되거나 말로 표현된 모든 단어를 찾아 반환할 수 있어야 합니다.
이 정보를 얻기 위한 여러 기술적 전략이 존재하지만, 이들은 대체로 자동화 방식과 수동 방식이라는 두 가지 범주로 나뉩니다.
ASR 및 OCR을 통한 자동화된 영상 인덱싱
자동화된 영상 인덱싱은 하나 이상의 지능형 영상 기술을 활용하여 영상에서 발생하는 상황을 포착하고 식별합니다. 이러한 자동화 도구는 종종 녹화가 완료되는 즉시 영상에 적용될 수 있어 콘텐츠 인덱싱 과정을 가속화합니다.
일반적인 자동화된 비디오 인덱싱 시스템에는 자동 음성 인식(ASR), 광학 문자 인식(OCR), 슬라이드 콘텐츠 수집이 포함됩니다. 이 세 시스템은 매우 다른 기능을 수행하므로 각각을 좀 더 자세히 살펴보겠습니다.
- 자동 음성 인식 (ASR)은 녹음된 음성에서 발화된 각 단어를 식별하는 기술입니다. 식별된 단어에는 시간 정보가 부여되어 검색 인덱스에 추가됩니다. 사용자는 발화된 단어를 검색하여 해당 단어가 언급된 영상의 정확한 순간을 찾아 해당 지점으로 빠르게 이동할 수 있습니다. 많은 시청자가 기억하는 아이디어나 문구를 바탕으로 특정 순간을 검색할 것이므로, ASR은 동영상 검색 엔진의 매우 유용한 구성 요소입니다.
- 광학 문자 인식 (OCR)은 동영상 화면에 표시된 텍스트를 인식하는 기술입니다. 현대적인 프레젠테이션에서는 발표자가 슬라이드, 실시간 화면 콘텐츠, 심지어 다른 동영상 사이를 전환하는 경우가 흔합니다. OCR이 없다면, 이러한 프레젠테이션의 일부로 표시되는 텍스트는 검색 엔진(예: Google)이 이미지로 저장된 텍스트를 인식할 수 없기 때문에 색인화될 수 없습니다. 그러나 OCR 기술은 이러한 단어들을 식별하고 해독하도록 설계되어 시청자가 동영상 어디에서든 화면에 나타나는 문자 그대로 모든 단어를 검색할 수 있게 합니다.
- 슬라이드 콘텐츠 인제스트는 동영상에 사용된 실제 PowerPoint 또는 Keynote 프레젠테이션 슬라이드를 가져와 색인화하는 기술을 의미합니다. 콘텐츠 인제스트는 OCR과 달리 슬라이드 사진을 찍어 단어를 식별하는 방식이 아닌, 프로그래밍 방식으로 슬라이드에서 실제 텍스트 문자열을 추출합니다. 또한 발표자 노트 등 화면에 표시되지 않는 추가 정보도 추출하므로, 팀원들은 슬라이드에 포함된 어떤 단어를 기준으로도 동영상 내 정확한 순간을 항상 찾을 수 있습니다.
수동 동영상 색인화
반면 수동 동영상 인덱싱은 동영상이 완성된 후 인덱싱을 지원하기 위해 이루어지는 사람의 개입에 의존합니다.
수동 인덱싱 프로세스의 유용성은 추가할 수 있는 정보의 양에 따라 달라집니다. 일부 프로세스는 상당히 포괄적인 반면, 다른 프로세스는 훨씬 더 제한적입니다. 가장 흔한 두 가지 수동 입력 방식을 살펴보겠습니다:
- 수동 메타데이터는 제목, 제작자, 설명 등 동영상 파일에 추가되는 정보를 의미합니다. 시청자 노트와 댓글도 여기에 포함될 수 있습니다. 이는 동영상 검색의 핵심 요소이지만, 30~60분 이상 지속되며 다양한 주제를 다루는 비즈니스 동영상에 있어서는 수동 메타데이터만으로는 유용한 설명을 제공하기에 거의 항상 부족합니다.
- 트랜스크립트는 보다 포괄적인 접근법으로, 인덱싱을 위해 실제 비디오 트랜스크립트를 비디오 파일에 단순히 첨부하는 방식으로 수행됩니다. 대본 제작은 진화하는 분야입니다. 많은 서비스가 여전히 수동으로 파일을 생성하지만, 이 과정은 자동화될 수 있습니다. 어떤 방식으로 개발하든 입력 자료의 품질이 핵심입니다. 부분적인 대본보다 완전한 대본이 더 가치 있으며, 화면에 표시된 내용에 대한 설명을 포함하는 대본은 단순히 대사를 나열한 것보다 더 유용합니다.
동영상 검색에는 자동 색인화와 수동 색인화 중 어느 것이 더 나은가?
선택은 실제로 여러분의 필요에 달려 있습니다. 기술에 의존하는 자동 인덱싱 시스템은 더 빠른 결과를 제공하며 모든 동영상에 적용될 수 있지만, ASR(자동 음성 인식)과 OCR(광학 문자 인식)의 정확도는 100%가 아닙니다. 대본 작성과 같은 수동적이고 인간 중심의 접근 방식은 일반적으로 향상된 정확도를 제공하지만, 제작에 더 오랜 시간이 걸리며 종종 추가 비용이 발생합니다.
다행히도, Panopto 사용하면 선택할 필요가 없습니다.
Panopto 스마트 검색 동영상 검색 기술은 업계에서 가장 포괄적인동영상 내부 검색 엔진입니다. Panopto 사용하면 인터넷이나 이메일을 검색하는 것과 동일한 방식으로 동영상 라이브러리를 검색할 수 있습니다.
- 동영상에서 말한 어떤 키워드든, ASR을 통해
- 화면에 표시되거나 동영상 내 어디에든 등장하는 모든 단어를 OCR 및 슬라이드 콘텐츠 인제스트 기능을 통해
- 태그와 제목을 포함한 전통적 및 고급 메타데이터, 시청자 노트 및 댓글을 통해
- 그리고 선택적으로 동영상 콘텐츠의 완전한 수동 전사본을 통해.
직접 저희 동영상 검색 엔진을 사용해 보세요!
지금까지 놓치고 있던 영상 검색의 진가를 확인해 보시겠습니까? 데모 일정을 잡으려면 지금 바로 저희 팀에 문의하세요.



