'인공지능 논문 요약' 카테고리의 글 목록

인공지능 논문 요약 4

Tacotron: Towards End-to-End Speech Synthesis 요약

📜 Y. Wang et al., "Tacotron: Towards End-to-End Speech Synthesis," in Interspeech, 2017 논문 3줄 요약 복잡한 구조의 현대 TTS 모델을 end-to-end 구조로 변화하였다. 쌍으로 학습하여 더 많은 데이터, 더 다양한 특징의 학습이 가능해졌다. 오디오 샘플 단위의 생성이 아닌, Mel-spectrogram 프레임 단위로 음성을 생성하여 더 빠른 학습과 추론이 가능하다. Abstract Text-to-Speech (TTS, 문자 음성 변환) 시스템은 일반적으로 텍스트 분석을 위한 frontend와 음향 모델(acoustic model), 오디오 합성 모듈(audio synthesis module)로 구성됩니다. 각 구성 요소를 구축에..

인공지능 논문 요약/Text-to-Speech 2023.07.03

WaveNet: A Generative Model for Raw Audio 정리

📜 A. Oord et al., "WaveNet: A Generative Model for Raw Audio," in arXiv, 2016. 논문 1줄 요약 WaveNet은 dilated causal convolution을 기반으로 audio waveform을 생성하는 딥러닝 모델입니다. Abstract 본 논문은 오디오 파형(audio waveform)을 생성하는 신경망인 "WaveNet"을 소개합니다. WaveNet은 모든 이전의 오디오 샘플로부터 조절된 각 오디오 샘플에 대한 분포를 예측하는 확률적이며 auto-regressive한 모델입니다. WaveNet은 각각의 발화자(speaker)에 유사하게 특징을 포착하고 이를 조절함으로써 다른 발화자의 목소리로 바꿀 수 있습니다. 1. Introduct..

인공지능 논문 요약/Text-to-Speech 2023.06.18

Very Deep Convolutional Networks for Large-Scale Image Recognition 요약

📜 K. Simonyan and A. Zisserman, "Very Deep Convolutional Networks for Large-Scale Image Recognition," in ICLR, 2014 논문 2줄 요약 고전적인 Convolution 아키텍처에서 벗어나지 않고 네트워크의 깊이를 증가함으로써 성능을 향상시켰다. 네트워크의 깊이를 증가시키기 위해 매우 작은 $ 3\times3 $ 크기의 Convolutional filter를 사용하였다. Abstract 본 연구는 대규모 이미지 인식 문제에서 convolution network (ConvNet)의 깊이가 정확도(accuracy)에 미치는 영향을 조사합니다. 본 연구의 주된 성과는 매우 작은 $ 3\times3 $ Conv. 필터(filte..

인공지능 논문 요약/Deep Network 2021.09.21

Going Deeper with Convolutions 요약

📜 C. Szegedy et al., "Going Deeper with Convolutions", in CVPR, 2014 논문 3줄 요약 모바일과 임베디드 상에서 잘 작동하기 위해 컴퓨팅 자원을 효율적으로 활용해야 한다는 요구가 높아졌다. 차원 축소를 통한 계산양 감소와 비선형성 추가 두 가지를 목적으로 인셉션 모듈을 도입했다. 인셉션 모듈을 통해 컴퓨팅 비용은 적게 상승하지만, 더 깊고 넓으면서 성능도 좋은 GoogLeNet을 구축했다. Abstract 본 논문에서는 ImageNet Large-Scale Visual Recognition Challenge (ILSVRC) 2014에서 분류와 탐지 문제에서 좋은 성과를 거둔 '인셉션(Inception)'이라는 이름의 deep convolution neu..

인공지능 논문 요약/Deep Network 2021.08.27

연구 기록

교차 엔트로피 오차, 옵티마이저, Auto-regressive, Tacotron, Ai, 손실 함수, 딥러닝, 머신러닝, 논문, 인공지능, 초깃값, 오차제곱합, VGGNet, text-to-speech, TTS,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

기록지

인공지능 논문 요약 4

티스토리툴바