수년간 유튜브 채널을 운영하면서 어떻게 하면 동영상의 퀄리티를 높이고 구독자분들께 전달하고자 하는 내용을 모두 전달할 수 있을지 끊임없이 고민했습니다. 그 결과 자막을 넣어서 조금이라도 편하게 영상을 시청할 수 있도록 해야겠다고 생각했습니다. 제 말이 워낙 빠르다 보니 무슨 말인지 잘 못 알아듣겠다는 분도 계셨고, 출퇴근길에 시청하시는 분들은 주변이 시끄러워서 자막 없이는 시청이 어렵다는 분들도 계셨기 때문입니다.
자막을 입력하는 데는 생각보다 많은 시간이 걸렸습니다. 동영상 속 음성을 텍스트로 받아 적어야 했고, 또 그 과정에서 오타가 발생하지 않았는지 체크/수정까지 해야 했으니까요. 그래서 처음에는 열정적으로 자막을 넣다가 어느 순간부터 자막을 포기하게 되었습니다. 시간도 오래 걸리는 데다 꼼꼼하지 못한 성격 때문에 계속 오타가 발생하니 지쳤어요.하지만 오늘 여러분께 소개해드릴 음성인식 프로그램 ‘다글로(Daglo)’를 이용하니 이러한 고민을 해결할 수 있었습니다.
다그로(Daglo)
다글로(Daglo)는 AI 음성인식 받아쓰기 서비스로 유튜브 영상, 비디오, 오디오 속 음성을 텍스트로 바꾸는 서비스입니다. 처음에는 ‘AI가 어떻게 내 음성을 바꿔주지?’라고는 생각했지만 직접 써본 뒤 생각이 완전히 바뀌었습니다. 음성 인식도, 정확도 수치가 매우 높아 사실상 수정할 일이 거의 없었기 때문입니다. 설치가 필요 없는 웹 서비스
또한 무거운 프로그램을 설치할 필요 없이 인터넷을 통해 접속하는 웹 서비스이므로 PC 사양과 상관없이 사용할 수 있습니다. 작업할 내용은 다중 보호 레이어 아래 안전하게 보관되기 때문에 보안 걱정도 없고, PC를 이동해도 로그인만 하던 작업을 계속할 수 있다는 점이 정말 편리했습니다.
또한 유료서비스가 부담스러운 분들을 위해 다글로(Daglo)는 충분히 음성인식 프로그램을 경험할 수 있도록 회원가입 시 3,000점의 포인트를 적립해 줍니다. 해당 포인트를 이용하여 다글로우의 음성 텍스트 변환의 정확도를 확인할 수 있으며, 텍스트 파일을 확인/수정하여 다운로드하는 과정까지 모두 체험할 수 있습니다.제가 직접 유튜브 영상 속 음성을 텍스트 변환해본 과정을 보여드리겠습니다.
회원가입 후 ‘시작’을 클릭하면 위 화면에 표시됩니다. ‘유튜브 링크’, ‘파일 업로드하기’ 두 가지 선택지가 있습니다. 유튜브에 업로드된 영상에서 텍스트 변환을 진행하느냐, 소유하고 있는 오디오 또는 동영상 파일의 음성을 텍스트로 변환하느냐의 차이입니다. 그 이후 진행 프로세스는 동일합니다.
YouTube 링크 또는 파일 업로드를 선택하면 “쓰기 전 확인사항”이 표시됩니다. 녹음 환경에서 소음은 제거됐는지, 마이크와의 거리는 가까운지, 말하는 사람의 발음이 정확한지, 말하는 도중에 다른 사람이 끼어들지는 않았는지. 아무리 기술이 발달해도 깨끗하지 않은 파일에서 텍스트를 추출하는 것은 어려운 일입니다. 그러므로 위의 체크리스트는 해당 서비스를 올바르게 이용하기 위한 기본적인 사항이라고 생각하시면 됩니다.나는 이미 업로드한 유튜브 영상에서 텍스트로 변환해 보기로 했어요. 받아쓰기 요청을 위해 유튜브 동영상 주소(URL)를 입력하고 ‘확인’ 버튼을 누르면 해당 URL의 썸네일과 제목을 확인할 수 있습니다. 다른 링크를 입력하는 일이 없도록 확인하는 과정입니다. 다음으로 언어와 분류를 설정해야 합니다. 언어는 영어, 일본어, 중국어, 스페인어, 독일어, 프랑스어 등 12개 언어 선택이 가능하며 분류에는 화상회의, 전화통화, 강연, 의회 및 법률강의 등 다양한 선택지가 있습니다. 저는 특별히 강의나 화상회의가 아니라 한국어로 이야기했기 때문에 ‘한국어/일반’을 선택했어요.그리고 꼭 ‘5분 미리보기’를 해달라는 안내가 있죠? 5분 미리보기를 할 경우에는 음성파일 앞부분의 5분만 받아쓰기를 하여 올바르게 받아쓰기할 수 있는지 확인할 수 있습니다. 추후 전체 받아쓰기를 하더라도 5분 미리보기에 지급한 포인트를 제외한 만큼 차감되므로 중복결제 걱정은 없습니다. 참고로 받아쓰기를 요청한 후에는 포인트를 되돌릴 수 없으므로 신중하게 진행해 주시기 바랍니다.음성 텍스트 변환을 시작하면 위와 같이 받아쓰기가 이루어집니다. 영상, 음성 파일 길이에 따라 진행 시간이 다르지만 11분 20초 영상을 변환하는 데 약 2분 정도 걸렸습니다. 정말 빠른 속도죠.위와 같이 프로그램을 설치할 필요 없이 사용하는 웹서비스이기 때문에 브라우저를 종료하더라도 안전한 서버를 통해 받아쓰기가 이루어집니다. 계속해서 화면을 켜고 기다리지 않아도 된다는 뜻입니다. 또한, 완료 후에는 메일로 알려드리니 수시로 확인할 필요도 없습니다. 다방면에서 고객 친화적이라는 생각이 들었어요.음성 받아쓰기가 완료된 파일은 상태란이 ‘보기’로 변경된 것을 확인할 수 있습니다.보기를 클릭하면 위와 같이 유튜브 동영상과 추출한 텍스트를 함께 볼 수 있습니다. 텍스트를 클릭하면 클릭한 위치에서 영상(음성)이 재생되며 편집 기능 도구를 이용하여 텍스트를 자유롭게 수정할 수 있습니다. 혹시 AI가 실수한 부분이 있다면 워드나 한글 문서를 고치도록 고쳐주세요. 정말 간단해요.그리고 편집을 진행하고 종료해야 하는 상황이 발생할 수도 있는데요. 편집 문서는 자동으로 저장되므로 안심하고 사용할 수 있습니다. Ctrl+S를 눌러 수동으로 저장을 진행할 수도 있습니다. 또한 소스가 필요한 경우 백업본을 언제든지 가져올 수 있습니다.수정이 완료되면 HWP, DOC, TXT, SMI, SRT, VTT, XML 파일로 다운로드 받으면 됩니다. 따로 다운로드 횟수 등의 제한은 없으니 원하시는 형식을 자유롭게 받아보시기 바랍니다.TXT, HWP 형식으로 다운받은 모습입니다. 수정한 텍스트를 흐름에 따라 그대로 가져온 것을 확인할 수 있습니다.XML 형식으로 다운로드 할 경우 프리미어 프로의 가져오기 기능을 통해 동영상에 자막을 붙이는 것도 용이합니다. 앞으로 유튜브 영상에 자막을 달 일이 있으면 음성 인식 프로그램인 다글로(Daglo)를 사용할 것입니다.참고로 Daglo는 비디오(mp4, avi 등) 외에도 오디오(wav, mp3, m4a 등)까지 모두 텍스트로 변환할 수 있기 때문에 그 활용도가 정말 높습니다. 요즘 유튜브 말고도 블로그 강의 자료를 음성으로 녹음하고 있어서 앞으로는 강의 자료를 텍스트로 배포하는 것도 쉬울 것 같네요.지금까지 설치하지 않고 웹으로 사용할 수 있는 ‘다글로(Daglo)’를 살펴보았습니다. 음성 인식의 정확도가 높고 지원하는 파일의 형식이 다양하여 만족도가 높았던 서비스입니다. 위와 같이 회원가입만 하면 3,000포인트를 무료로 제공하니 여러분들도 부담없이 사용해 보세요.감사합니다。참고로 Daglo는 비디오(mp4, avi 등) 외에도 오디오(wav, mp3, m4a 등)까지 모두 텍스트로 변환할 수 있기 때문에 그 활용도가 정말 높습니다. 요즘 유튜브 말고도 블로그 강의 자료를 음성으로 녹음하고 있어서 앞으로는 강의 자료를 텍스트로 배포하는 것도 쉬울 것 같네요.지금까지 설치하지 않고 웹으로 사용할 수 있는 ‘다글로(Daglo)’를 살펴보았습니다. 음성 인식의 정확도가 높고 지원하는 파일의 형식이 다양하여 만족도가 높았던 서비스입니다. 위와 같이 회원가입만 하면 3,000포인트를 무료로 제공하니 여러분들도 부담없이 사용해 보세요.감사합니다。