• 커뮤니케이션

공지: 동영상 내 검색 정확도 향상

기업 및 고등 교육 분야에서 검색이 불가능한 동영상 콘텐츠는 그 가치가 거의 없습니다.

대부분의 기업 및 학술용 동영상 콘텐츠는 장편 형식입니다. 타운홀 미팅은 대개 30분에서 60분 정도 소요됩니다. 녹화된 강의 영상은 보통 1시간 정도입니다. 온라인 교육 영상은 15분에서 1시간을 훌쩍 넘는 길이에 이르기까지 다양합니다. 시스코(Cisco)에 따르면, 2014년 전체 동영상 트래픽의 64%를 장편 동영상이 차지했으며, 이 수치는 앞으로도 계속 증가할 것으로 예상됩니다.

장편 동영상의 경우, 기존의 ‘유튜브식’ 검색 방식만으로는 부족합니다. 동영상에 태그를 아무리 많이 달아도, 유튜브식 검색은 사용자가 동영상의 시작 부분만 찾을 수 있게 해줄 뿐입니다. 검색어가 실제로 등장하는 동영상 내의 특정 지점을 찾는 데는 도움이 되지 않습니다.

기업용 동영상 검색의 핵심 과제는 동영상 내 나레이션 및 기타 제시된 자료에서 콘텐츠를 찾아내는 것입니다. 이는 직원들이 이메일, 문서 또는 웹 페이지에서와 마찬가지로 손쉽게 콘텐츠를 검색하고 빠르게 접근할 수 있게 해주기 때문에, 15분, 30분 또는 60분 분량의 동영상에 가치를 부여하는 요소입니다.

동영상 검색의 과제
2014년, Panopto 스마트 검색 기존 동영상 색인화의 한계를 보완하기 위해. 스마트 검색은 발표자의 음성 트랙에 포함된 단어(자동 음성 인식, ASR이라고 하는 과정)와 동영상에 나타나는 모든 단어(광학 문자 인식, OCR이라고 하는 과정)를 자동으로 색인화합니다. OCR은 일반적으로 공식적인 발표 자료나 화면 시연이 포함된 비즈니스 및 학술 동영상에서 특히 중요합니다.

Panopto 플레이어는 검색을 위해 음성 내용을 자동으로 색인화합니다광학 문자 인식(OCR) 기술을 통해 기업 프레젠테이션 자료와 화면 데모의 내용을 검색할 수 있습니다.

오늘, 스마트 검색(Smart Search)의 중요한 업데이트 소식을 전해 드리게 되어 기쁩니다. 앞으로 며칠 내로 Panopto 서비스를 이용하시는 고객님들께서는 OCR 검색 결과의 품질이 크게 개선된 것을 확인하실 수 있을 것입니다.

새로운 알고리즘의 정확도를 가늠해 볼 수 있도록 두 가지 테스트를 진행했습니다. 첫 번째 테스트는 PanoptoOCR이 점차 작아지는 글꼴 크기의 텍스트를 얼마나 잘 처리하는지 보여줍니다. 1920×1080 해상도의 화면에서 8포인트 글꼴까지(8포인트 포함) 정확한 문자 인식이 가능했습니다.

Panopto 검색 - OCR 40포인트 글꼴글꼴 크기 테스트는 글꼴 크기가 줄어들면서 OCR 정확도를 측정합니다. 테스트는 40포인트 글꼴로 시작되었으며, 정확도는 100%였습니다.

Panopto 검색 - OCR 8포인트 글꼴테스트는 8포인트 글꼴로 마무리되었습니다. 이처럼 작은 글꼴 크기에서도 OCR은 화면상의 텍스트를 100% 정확하게 인식했습니다.

두 번째 테스트는 명암비가 낮아질 때 PanoptoOCR 정확도가 어떻게 변하는지 보여줍니다. 이 경우 명암비는 텍스트와 배경 사이의 휘도를 측정하는 것입니다.

Panopto 검색 - OCR 21 대비율명암비 테스트는 텍스트와 배경 사이의 명암 차이가 줄어들면서 OCR 정확도를 측정합니다. 이 테스트는 흰색 배경에 검은색 텍스트로 시작되었습니다.

텍스트 색상이 검정색(RGB 0, 0, 0)이고 배경이 흰색(RGB 255, 255, 255)일 때는 텍스트 인식이 잘 될 것이라고 예상할 수 있습니다. 하지만 텍스트 색상이 밝아질수록 명암비가 낮아집니다. 이로 인해 OCR이 텍스트와 배경을 정확하게 구분하기가 더 어려워집니다.

이번 테스트에서는 데스크톱 웹 브라우저의 기본 글꼴 크기인 16포인트 글꼴을 사용했습니다. 대비 비율 21(흰색 배경에 검은색 텍스트)에서 시작하여, 대비 비율을 점차 1.7(흰색 배경에 RGB 200, 200, 200)까지 낮췄습니다. 참고로, 대비 비율 1.7은 텍스트 표시의 대비 비율이 4.5:1 이상이어야 한다고 명시한 W3C의 웹 콘텐츠 접근성 지침 (WCAG 2.0) 기준을 훨씬 밑도는 수치입니다.

하지만 대비비가 이처럼 낮은 상황에서도 PanoptoOCR 엔진은 텍스트를 100% 정확하게 인식해 냈습니다.

Panopto 검색 - OCR 1.7 명암비대비비가 극히 낮은 상황에서도 PanoptoOCR은 화면상의 텍스트를 100% 정확하게 인식했습니다.기업이나 대학에서 촬영하는 영상 자료가 늘어날수록, 영상 내 실제 콘텐츠를 색인화하는 동영상 검색 엔진의 필요성도 커집니다. 오늘 발표를 통해, 저희는 최고의 동영상 검색 엔진을 한층 더 개선했습니다. Panopto스마트 검색에 대한 자세한 정보를 확인하거나, 저희 솔루션이 어떻게 비디오 콘텐츠 관리 시스템 조직 내 의사소통 및 정보 공유 방식을 개선할 수 있으며, 무료 체험판 신청하기 오늘 저희 소프트웨어의