'text-to-speech' 태그의 글 목록

Tacotron: Towards End-to-End Speech Synthesis 요약

📜 Y. Wang et al., "Tacotron: Towards End-to-End Speech Synthesis," in Interspeech, 2017 논문 3줄 요약 복잡한 구조의 현대 TTS 모델을 end-to-end 구조로 변화하였다. 쌍으로 학습하여 더 많은 데이터, 더 다양한 특징의 학습이 가능해졌다. 오디오 샘플 단위의 생성이 아닌, Mel-spectrogram 프레임 단위로 음성을 생성하여 더 빠른 학습과 추론이 가능하다. Abstract Text-to-Speech (TTS, 문자 음성 변환) 시스템은 일반적으로 텍스트 분석을 위한 frontend와 음향 모델(acoustic model), 오디오 합성 모듈(audio synthesis module)로 구성됩니다. 각 구성 요소를 구축에..

인공지능 논문 요약/Text-to-Speech 2023.07.03

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

기록지

text-to-speech 2

티스토리툴바