인공지능 논문 요약 3

WaveNet: A Generative Model for Raw Audio 정리

📜 A. Oord et al., "WaveNet: A Generative Model for Raw Audio," in arXiv, 2016. 논문 1줄 요약 WaveNet은 dilated causal convolution을 기반으로 audio waveform을 생성하는 딥러닝 모델입니다. Abstract 본 논문은 오디오 파형(audio waveform)을 생성하는 신경망인 "WaveNet"을 소개합니다. WaveNet은 모든 이전의 오디오 샘플로부터 조절된 각 오디오 샘플에 대한 분포를 예측하는 확률적이며 auto-regressive한 모델입니다. WaveNet은 각각의 발화자(speaker)에 유사하게 특징을 포착하고 이를 조절함으로써 다른 발화자의 목소리로 바꿀 수 있습니다. 1. Introduct..

Very Deep Convolutional Networks for Large-Scale Image Recognition 요약

📜 K. Simonyan and A. Zisserman, "Very Deep Convolutional Networks for Large-Scale Image Recognition," in ICLR, 2014 논문 2줄 요약 고전적인 Convolution 아키텍처에서 벗어나지 않고 네트워크의 깊이를 증가함으로써 성능을 향상시켰다. 네트워크의 깊이를 증가시키기 위해 매우 작은 $ 3\times3 $ 크기의 Convolutional filter를 사용하였다. Abstract 본 연구는 대규모 이미지 인식 문제에서 convolution network (ConvNet)의 깊이가 정확도(accuracy)에 미치는 영향을 조사합니다. 본 연구의 주된 성과는 매우 작은 $ 3\times3 $ Conv. 필터(filte..

Going Deeper with Convolutions 요약

📜 C. Szegedy et al., "Going Deeper with Convolutions", in CVPR, 2014 논문 3줄 요약 모바일과 임베디드 상에서 잘 작동하기 위해 컴퓨팅 자원을 효율적으로 활용해야 한다는 요구가 높아졌다. 차원 축소를 통한 계산양 감소와 비선형성 추가 두 가지를 목적으로 인셉션 모듈을 도입했다. 인셉션 모듈을 통해 컴퓨팅 비용은 적게 상승하지만, 더 깊고 넓으면서 성능도 좋은 GoogLeNet을 구축했다. Abstract 본 논문에서는 ImageNet Large-Scale Visual Recognition Challenge (ILSVRC) 2014에서 분류와 탐지 문제에서 좋은 성과를 거둔 '인셉션(Inception)'이라는 이름의 deep convolution neu..