음성 제너레이션, 2022년 말부터 개발 중이며 챗GPT의 소리내어 읽기 기능을 지원

Open토토 가상계좌 디시는 15초 분량의 음성 클립을 기반으로 합성 음성을 생성할 수 있는 자체 개발한 텍스트-음성(text-to-voice)생성 플랫폼 음성엔진(Voice Engine)에 대한 제한적인 이용을제공한다. 토토 가상계좌 디시가 생성한 음성은 화자와 동일한 언어나다른 여러 언어로 명령에 따라 텍스트 프롬프트를 읽어줄 수 있다.

음성엔진 이용 권한을 가진 회사는 교육기술 회사인에이지 오브 러닝(Age of Learning), 비주얼 스토리텔링 플랫폼 헤이젠(HeyGen), 의료 소프트웨어 제작사인 디마지(Dimagi), 토토 가상계좌 디시커뮤니케이션 앱 제작사인 리복스(Livox), 의료 시스템인 라이프스팬(Lifespan) 등이 있다.

오픈토토 가상계좌 디시 음성엔진

Open토토 가상계좌 디시가 공개한사례에서는 에이지 오브 러닝이 사전 스크립트(pre-scripted) 음성콘텐츠를 생성하고GPT4로 작성한 학생의 '실시간 개인화 답변'을 읽어주는 기술을 어떻게 활용했는지 들어볼 수 있다.

We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker.https://t.co/yLsfGaVtrZ

Open토토 가상계좌 디시는 2022년 말부터음성엔진 개발을 시작했다.이 기술은텍스트 음성 변환 API와 챗GPT의 소리내어 읽기 기능을 위한 사전 설정(preset)음성을 지원한다고 밝혔다. Open토토 가상계좌 디시의 음성엔진팀원인 제프 해리스(Jeff Harris)는 테크크런치와의 인터뷰에서음성엔진이 "라이선스가 있는 데이터와 공개적으로 사용 가능한 데이터를 혼합하여" 훈련되었다고 말했다. Open토토 가상계좌 디시는 음성엔진이 우선 약 10명의 개발자에게만 제공될 것이라고 밝혔다.

텍스트-오디오 생성토토 가상계좌 디시 기술의 발전

토토 가상계좌 디시텍스트-오디오(text-to-audio)생성은 계속 발전하고 있는 생성토토 가상계좌 디시의 한 분야다. 그동안 대부분 악기 소리나 자연음 생성에초점을 맞추고 있지만음성 생성에 초점을 맞추는 곳은 많지 않았다. 음성 생성분야는2023년버지캐스트(Vergecast)가 살펴본토토 가상계좌 디시음성 복제(voice cloning)기술과 도구를 제공하는 팟캐슬(Potcastle)과 일레븐랩스(ElevenLabs) 같은 회사가 있다.

회원전용기사

로그인 또는 회원가입을 해주세요. (회원만 열람가능, 회원 가입 무료)

로그인 회원가입
관련기사
저작권자 © 트렌드와칭 무단전재 및 재배포 금지