본문 바로가기

머신러닝/[논문으로 짚어보는 딥러닝의 맥]

(21)
주어진 사진을 원하는 화풍으로 만드는 Neural Style 학습목표 이번 강의에서는 Neural Style에 대해 알아보려 합니다. Neural Style은 사진을 특정한 화풍으로 바꿔주는 알고리즘입니다. 두 가지 논문을 차례로 보면서 Neural Style을 알아보도록 하겠습니다. 그리고 짧게 Neural Style을 구현하는 코드를 살펴보도록 하겠습니다. 핵심 키워드 Neural Style Texture Synthesis Image Inverting VGG Net 학습하기 안녕하십니까. 이번에는 Neural Style에 대해 알아볼텐데요. 한 때 유행했던 어떤 그림을 피카소 풍으로 또는 고흐 풍으로 바꾸던, 그런 알고리즘입니다. 구체적으로는, 'Texture Synthesis Using Convolutional Nerual Networks(2015)'와 'U..
RNN을 이용해 손글씨를 만드는 Handwriting generation 학습목표 기본적인 RNN에 대한 내용과 Sequence Generation 논문(Handwriting generation)에 대해 알아보도록 하겠습니다. Handwriting generation 논문은 굉장히 임팩트가 있는 논문입니다. 2014년에 나온 논문이지만 지금 시대에 이 논문이 나와도 AI분야에 큰 파장을 끼쳤을 것으로 생각되는, 굉장히 선구적인 연구라고 생각됩니다. 핵심 키워드 RNN(Recurrent Neural Network) Sequence Generation 학습하기 이번에는 기본적인 RNN에 대한 이야기와, Sequence Generation, 이하 SG에 대해 말해보겠습니다. 특히 SG에 대한 논문은 개인적으로 굉장히 멋진 논문이라고 생각됩니다. Attention, RNN 등의 내용..
Recurrent Neural Network(RNN): LSTM 학습목표 이번 강의에서는 Recurrent Neural Network(RNN), 그 안에서도 Long Short Term Memory(LSTM)에 대해서 다뤄보도록 하겠습니다. LSTM은 최근에 RNN에서 가장 일반적으로 사용되고 있는 구조입니다. RNN의 기본 구조를 보고 어떤 원리의 개념인지 확인하고, LSTM이 장기의존성(Long Term Dependency)에 어떻게 특화되어 있는지 알아봅시다. 핵심 키워드 RNN(Recurrent Neural Network) LSTM(Long Short Term Memory) 학습하기 이번엔 RNN, 그 중에서도 LSTM에 대해서 알아보도록 하겠습니다. LSTM은 현재 RNN 중 거의 기준점으로 사용되고 있죠. Recurrent Neural Network. 여기..
딥러닝을 이용한 강화학습 학습목표 이번 시간에는 Deep Reinforcement Learning(강화학습)에 대해 배워보도록 하겠습니다. 지금 가장 뜨겁게 관심을 받는 분야이며, 세계에서 가장 집중적으로 연구 중이며 상업화중인 딥러닝 분야입니다. 강화학습은 두 가지 큰 물줄기로 나뉘는데 그중 하나인 DQN에 대해서 알아보겠습니다. 핵심키워드 Deep Reinforcement Learning DQN(Deep Q Network) MDP(Markov Decision Precess) Q-Learning 학습하기 우선, 2013년도에 발표된 "Playing Atari with Deep Reinforcement Learning" 을 먼저 보도록 합시다. 당시에는 아직 구글에 속하지 않았던, Deep mind에서 발표한 논문입니다. 들리는..
이미지를 설명하는 문장을 만들어내는 Image Captioning 학습목표 이번 강의에서는 Image Captioning에 대해 살펴보도록 하겠습니다. Image Captionaing은 어떤 이미지를 설명하는 문장을 만들어 내는 것을 말합니다. 어떤 이미지를 잘 설명해주는 문장을 만들 수 있기 때문에 굉장히 중요하게 다뤄질 수 있습니다. 예컨데 앞을 못 보는 사람들에게 이 기술이 도입된다면 자신 앞의 화면을 설명해주어 도움을 주기 때문에 인류의 삶에 큰 변화를 가져다줄 수 있습니다. 핵심 키워드 Image Captioning Show and Tell Show, Attend and Tell DenseCap 학습하기 이번에는 Image Captioning에 대해 알아볼겁니다. Image Captioning이란 어떤 이미지가 들어왔을 때, 이것을 설명하는 문장을 만들어 내는..
이미지와 질문이 주어졌을 때 답을 맞추는 Visual QnA 학습목표 이번 강의에서 살펴볼 Visual QnA는 이미지와 질문이 함께 있는 문제입니다. 이 문제를 해결하는 대표적인 두 가지 방법인 DPPnet(Dynamic Parameter Prediction)과 MCB(Multimodal Compact Bilinear) Pooling for VQA를 알아보도록 하겠습니다. 핵심 키워드 Visual QnA (VQA) DPPnet Multimodal Compact Bilinear Pooling for VQA 학습하기 VQA 이건 말 그대로, 이미지가 주어졌을 때, 이미지에 대한 질문을 찾는 뭐 그런 문제입니다. 대표적인 MSCOCO의 VQA데이터셋에는 25만장의 이미지, 76만개의 질문이 있었습니다. 뭐 이건 무슨 동물이냐 하는 간단한 문제부터, 사람은 할 수 있는..
Image Detection 방법론: AttentionNet, SSD, YOLO, YOLOv2 학습목표 앞 강의에 이어 이번 강의에서도 Detection 방법론들을 알아보도록 하겠습니다. 이번 강의에서는 앞서 배운 R-CNN 계열의 방법들과는 다르고 새로운 방법들로, YOLO, SSD, YOLOv2는 굉장히 중요한 방법론이며 AttentionNet 역시 실용적으로 색다른 곳에 사용될 수 있기 때문에 관심과 흥미를 가지고 집중하여 학습하시길 바랍니다. 핵심 키워드 AttentionNet SSD (Single Shot MultiBox Detector) YOLO (You Only Look Once) 학습하기 이번에는 Detection 방법론, 그러니까 이미지 안에서 어떤 Object의 Bounding box를 찾는 개념을 공부할 텐데, 앞에서 봤던 R-CNN 시리즈와는 다르게, 새로운 내용들이 많습니다..
Image Detection 방법론: RCNN, SPPnet, FastRCNN, FasterRCNN 학습목표 바로 앞 강의에서 Localization과 함께 언급됐던 Image Detection 방법론들을 알아보도록 하겠습니다. Detection 방법론은 두 파트로 나누어 이번 시간에는 R-CNN 계열의 논문들을 보며 강의를 진행하도록 할 예정입니다. 이번 강의에서는 R-CNN, SPPnet, Fast R-CNN, Faster R-CNN 이렇게 4가지 방법들을 배워보도록 하겠습니다. 핵심 키워드 Detection R-CNN SPPnet Fast R-CNN Faster R-CNN 학습하기 이번에는 Image detection 에 관해 이야기해보겠습니다. 두 파트로 나누어서 설명할 건데요. 이번에는 R-CNN 계열의 논문들을 먼저 보겠습니다. R-CNN, SPPnet, Fast R-CNN 등이요. 그 다음..