헐? XSAudio 이거 실화? 내 목소리 복제해서 돈 버는 썰 푼다 (feat. AI 음성 클로닝)
여러분 있잖아요, 맨날 영상 만들고 글 쓰고 하면서 느끼는 건데... 진짜 시간이 금이에요, 금! 특히 유튜브 쇼츠나 인스타 릴 같은 거 만들 때, 내 목소리로 직접 녹음하자니 버벅거리고, 배경 소리 들어가고, 컨디션 안 좋으면 목소리 이상하고 막... 진짜 짜증나는 순간이 한두 번이 아니었거든요? 아, 그리고 오디오북 같은 거 혼자 만들겠다고 깝쳤다가 발음 꼬여서 포기한 적도 있어요. ㅠㅠ
그러다 우연히 진짜 신기한 거 하나를 발견했지 뭐예요. 다들 AI 음성 합성 좋다 좋다 하는데, 사실 저는 좀 시큰둥했거든요? 뭔가 기계음 같고 부자연스럽고... 근데 이건 좀 다르더라구요? 진심 깜짝 놀랐어요.
목소리 복제? 걍 된대니까?
이름이 XSAudio래요. 뭐 거창하게 설명하자면 AI 기반의 텍스트-투-스피치(TTS)랑 음성 클로닝 플랫폼이라나? 솔직히 뭔 말인지 처음엔 어려웠어요. 근데 써보니까 대박임.
이게 뭘 하는 거냐면, 내 목소리를 딱 한 몇 초? 진짜 짧은 오디오 클립만 있으면 그걸 복제해주는 거예요. 응? 내 목소리를? 맞아요, 내 목소리요! 그래서 그걸로 내가 쓰고 싶은 글을 읽게 시킬 수 있는 거죠.
진짜 신기하더라구요.
처음에 제 목소리 샘플 올릴 때 '이게 될까...?' 반신반의했거든요. 근데 헐? 몇 초 지나니까 진짜 제 목소리랑 거의 비슷한 톤으로 말을 하는 거예요. 물론 완벽하게 똑같진 않아요. 약간 로봇 같은 느낌이 아주 없진 않은데, 그래도 와... 이 정도면 콘텐츠 만들 때 진짜 유용하겠다 싶었어요. 특히 감정선 막 엄청 필요한 그런 거 아니면 충분히 쓸 만해요.
그럼 뭘 할 수 있는데?
음... 일단 기본적으로 글자를 음성으로 바꿔주는 거 (TTS) 있죠? 이건 뭐 다른 데도 많으니까 패스. 근데 이게 좋은 게 팟캐스트나 오디오북 만들 때 진짜 좋대요. 제 목소리로 편하게 녹음해서 책 한 권 뚝딱?! 상상만 해도... 아 아닙니다. 아직 책 쓸 정도는 아니고요. ㅋ
제일 솔깃했던 건 이거예요.
- 릴, 쇼츠, 스토리텔링, 유튜브 비디오...
이거 만드는 사람들은 진짜 귀 쫑긋해야 함. 영상에 내 목소리 깔고 싶은데 녹음하기 귀찮다? 아니면 일관된 톤으로 계속 가고 싶다? XSAudio로 텍스트만 딱 넣어주면 복제된 내 목소리가 읽어줘요. 와... 이거 시간 엄청 절약되겠더라구요? 제가 처음에 영상 만들 때 맨날 목소리 때문에 다시 찍고 다시 찍고 했던 거 생각하면... 하... 눈물 좀 닦고요.
그리고 AI가 막 신기한 소리도 만들어준대요. 효과음 같은 건가? 아직 써보진 않았는데, 이것도 뭔가 콘텐츠 만들 때 유용할 것 같죠? 그리고 언어도 엄청 다양하게 지원한대요. 나중에 외국어 공부해서 막 외국어로 영상 만들고 싶을 때... (꿈만 큽니다.)
가격은 얼마? 돈 내야 해?
걱정 마세요. 일단 맛보기로 쓸 수 있는 무료 플랜이 있더라구요. 베이직 계정이라고 하는데, 크레딧 10,000개 주고 TTS 기능이랑 기본 음성 라이브러리는 쓸 수 있대요. 한 달에 100번 생성할 수 있고, 음질은 16kHz. 뭐 그냥 테스트하기엔 나쁘지 않은 것 같아요.
근데 음성 클로닝이나 좀 더 좋은 음질(48kHz!) 쓰고 싶으면 프로 계정으로 가야 해요. 이게 한 달에 €9.99유로래요. 음... 지금 환율로 치면 한 14,000원 정도 되려나? 50,000 크레딧 주고, 프리미엄 음성도 쓸 수 있고, 음성 클로닝 도구가 바로 여기 포함돼 있어요! 생성은 무제한이래요. 오디오 향상 기능도 준비 중이라니 기대됩니다.
솔직히 저처럼 이것저것 콘텐츠 만드는 사람들은 프로 계정이 훨씬 유용할 것 같아요. €9.99면 커피 몇 잔 값인데, 시간 아끼고 퀄리티 올리는 데 이 정도면 투자할 만 하지 않나... 개인적인 생각입니다만.
지원도 무료 사용자는 포럼이나 문서 보고 해결해야 하는데, 돈 내면 이메일 지원(베이직)이나 아예 24/7 우선 지원에 전담 계정 관리자까지 붙여준대요(프로). 뭐, 당연한 거겠죠?
써보니까 이렇더라
음질 차이는 확실히 느껴져요. 무료로 16kHz 듣다가 48kHz 들으니까 와... 뭔가 선명하고 더 자연스러운 느낌? 전문가들은 더 잘 알겠지만, 일반인이 듣기에도 차이 나더라구요. AI 기술로 음성 품질을 막 끌어올렸다는데, 진짜 그런 것 같아요. 톤이나 감정 표현도 막 엄청 자연스럽진 않아도, 기술이 계속 발전하면 이것도 엄청 좋아지겠죠?
다들 AI 음성 무섭다고 하잖아요.
근데 저는 약간 관점이 바뀌었어요. 이게 단순히 내 목소리를 똑같이 만드는 걸 넘어서, 콘텐츠 제작의 새로운 도구가 될 수 있구나 싶더라구요. 시간 없고, 장비 없고, 녹음 환경 안 좋은 사람들한테는 진짜 혁신적인 대안이 될 수 있을 것 같아요. 물론 악용될 소지도 있겠지만... 뭐든 양날의 검이니까요.
처음엔 단순히 '목소리 복제? 신기하네' 하고 시작했는데, 써보면서 '이거 진짜 물건인데?' 싶었어요. 아직 완전히 제 것처럼 자연스럽진 않지만, 이 정도 속도로 기술이 발전한다면 곧 진짜 사람 목소리랑 구분하기 어려워질지도 몰라요.
여러분도 혹시 유튜브나 릴, 쇼츠 같은 거 하시거나, 나만의 오디오 콘텐츠 만들어보고 싶다 하시면 XSAudio 한번 구경 가보세요. 무료로 좀 써보다가 괜찮으면 프로 계정으로 넘어가도 되고요. €9.99가 아깝지 않을 수도 있어요? 제 생각엔 그래요. :)
다음에는 이걸로 뭘 만들어봤는지 실제 사용 후기를 좀 더 자세하게 풀어볼까 봐요. 기대해도 좋습니다! (아마도?)
'AI가 궁금해?' 카테고리의 다른 글
앤스로픽, 클로드 오퍼스 4/소넷 4 전격 공개! AI 시장 지각변동 예고? (0) | 2025.05.23 |
---|---|
Xagio 소개: AI 기반 올인원 SEO & 워드프레스 관리 플랫폼 (4) | 2025.05.21 |
LLMDog 소개: 개발자가 LLM과 코드 쉽게 공유하는 마법 도구 (2) | 2025.05.20 |
수초 만에 광고 완성? Ezra AI로 정적 광고 고품질 생성하는 법 (0) | 2025.05.19 |
반복 업무는 이제 그만! Make 노코드 자동화로 업무 효율 200% 높이기 (1) | 2025.05.16 |