SEDN v2에서 비디오 콘텐츠에 오디오파일(wav,mp3,,) 추출하여 자막(text) 으로 자동생성하는 Speech to the Text 기능을 제공합니다. 아래는 콘텐츠 등록과정에서 STT 기능을 활성화하고 추출된 자막을 보정하고 사용자서비스를 최종적으로 제공하는 프로세스를 설명하고 있습니다.

- SEDN 관리자페이지 ‘저장소’메뉴에서 [콘텐츠 등록] 버튼 클릭하고 콘텐츠 타입을 선택합니다. STT는 현재 VOD형태의 서비스에서만 제공하고 있습니다.

- 등록할 비디오파일을 선택하고 콘텐츠제목, 설명, 저장할 폴더등을 입력한 후 AI 자막 추출 토글을 ON 해주세요. 이때 등록할 영상의 언어를 선택할수 있는데 미설정시 자동으로 설정됩니다.
- 여기까지하고 저장을 누르면 콘텐츠 업로드 및 등록작업이 완료됩니다. STT 작업은 서버사이드에서 Seamless 진행되며 시스템의 GPU 성능에 따라 시간이 생각보다 오래걸릴수도 있습니다. (RTX4090기준 20분영상의 STT 생성은 약 2분정도 소요됨)

해당 비디오파일의 상세정보를 들어가보면 자막추출작업이 진행중인것을 알수 있다. 실시간진행율 표시토록 개발중

- 저장을 누르고 나면 자동으로 자막추출작업이 진행되고 이미 등록된 콘텐츠라면 [콘텐츠 수정]에서 [자막] 탭을 클릭하여 수동으로 AI 자막 추출작업을 실행할 수 있습니다.
