SEDN v2에서 비디오 콘텐츠에 오디오파일(wav,mp3,,) 추출하여 자막(text) 으로 자동생성하는 Speech to the Text 기능을 제공합니다. 아래는 콘텐츠 등록과정에서 STT 기능을 활성화하고 추출된 자막을 보정하고 사용자서비스를 최종적으로 제공하는 프로세스를 설명하고 있습니다.

image.png

  1. SEDN 관리자페이지 ‘저장소’메뉴에서 [콘텐츠 등록] 버튼 클릭하고 콘텐츠 타입을 선택합니다. STT는 현재 VOD형태의 서비스에서만 제공하고 있습니다.

image.png

  1. 등록할 비디오파일을 선택하고 콘텐츠제목, 설명, 저장할 폴더등을 입력한 후 AI 자막 추출 토글을 ON 해주세요. 이때 등록할 영상의 언어를 선택할수 있는데 미설정시 자동으로 설정됩니다.
  2. 여기까지하고 저장을 누르면 콘텐츠 업로드 및 등록작업이 완료됩니다. STT 작업은 서버사이드에서 Seamless 진행되며 시스템의 GPU 성능에 따라 시간이 생각보다 오래걸릴수도 있습니다. (RTX4090기준 20분영상의 STT 생성은 약 2분정도 소요됨)

해당 비디오파일의 상세정보를 들어가보면 자막추출작업이 진행중인것을 알수 있다. 실시간진행율 표시토록 개발중

해당 비디오파일의 상세정보를 들어가보면 자막추출작업이 진행중인것을 알수 있다. 실시간진행율 표시토록 개발중

image.png

  1. 저장을 누르고 나면 자동으로 자막추출작업이 진행되고 이미 등록된 콘텐츠라면 [콘텐츠 수정]에서 [자막] 탭을 클릭하여 수동으로 AI 자막 추출작업을 실행할 수 있습니다.

image.png