본문 바로가기

머신러닝

(118)
이미지를 설명하는 문장을 만들어내는 Image Captioning 학습목표 이번 강의에서는 Image Captioning에 대해 살펴보도록 하겠습니다. Image Captionaing은 어떤 이미지를 설명하는 문장을 만들어 내는 것을 말합니다. 어떤 이미지를 잘 설명해주는 문장을 만들 수 있기 때문에 굉장히 중요하게 다뤄질 수 있습니다. 예컨데 앞을 못 보는 사람들에게 이 기술이 도입된다면 자신 앞의 화면을 설명해주어 도움을 주기 때문에 인류의 삶에 큰 변화를 가져다줄 수 있습니다. 핵심 키워드 Image Captioning Show and Tell Show, Attend and Tell DenseCap 학습하기 이번에는 Image Captioning에 대해 알아볼겁니다. Image Captioning이란 어떤 이미지가 들어왔을 때, 이것을 설명하는 문장을 만들어 내는..
이미지와 질문이 주어졌을 때 답을 맞추는 Visual QnA 학습목표 이번 강의에서 살펴볼 Visual QnA는 이미지와 질문이 함께 있는 문제입니다. 이 문제를 해결하는 대표적인 두 가지 방법인 DPPnet(Dynamic Parameter Prediction)과 MCB(Multimodal Compact Bilinear) Pooling for VQA를 알아보도록 하겠습니다. 핵심 키워드 Visual QnA (VQA) DPPnet Multimodal Compact Bilinear Pooling for VQA 학습하기 VQA 이건 말 그대로, 이미지가 주어졌을 때, 이미지에 대한 질문을 찾는 뭐 그런 문제입니다. 대표적인 MSCOCO의 VQA데이터셋에는 25만장의 이미지, 76만개의 질문이 있었습니다. 뭐 이건 무슨 동물이냐 하는 간단한 문제부터, 사람은 할 수 있는..
Image Detection 방법론: AttentionNet, SSD, YOLO, YOLOv2 학습목표 앞 강의에 이어 이번 강의에서도 Detection 방법론들을 알아보도록 하겠습니다. 이번 강의에서는 앞서 배운 R-CNN 계열의 방법들과는 다르고 새로운 방법들로, YOLO, SSD, YOLOv2는 굉장히 중요한 방법론이며 AttentionNet 역시 실용적으로 색다른 곳에 사용될 수 있기 때문에 관심과 흥미를 가지고 집중하여 학습하시길 바랍니다. 핵심 키워드 AttentionNet SSD (Single Shot MultiBox Detector) YOLO (You Only Look Once) 학습하기 이번에는 Detection 방법론, 그러니까 이미지 안에서 어떤 Object의 Bounding box를 찾는 개념을 공부할 텐데, 앞에서 봤던 R-CNN 시리즈와는 다르게, 새로운 내용들이 많습니다..
Image Detection 방법론: RCNN, SPPnet, FastRCNN, FasterRCNN 학습목표 바로 앞 강의에서 Localization과 함께 언급됐던 Image Detection 방법론들을 알아보도록 하겠습니다. Detection 방법론은 두 파트로 나누어 이번 시간에는 R-CNN 계열의 논문들을 보며 강의를 진행하도록 할 예정입니다. 이번 강의에서는 R-CNN, SPPnet, Fast R-CNN, Faster R-CNN 이렇게 4가지 방법들을 배워보도록 하겠습니다. 핵심 키워드 Detection R-CNN SPPnet Fast R-CNN Faster R-CNN 학습하기 이번에는 Image detection 에 관해 이야기해보겠습니다. 두 파트로 나누어서 설명할 건데요. 이번에는 R-CNN 계열의 논문들을 먼저 보겠습니다. R-CNN, SPPnet, Fast R-CNN 등이요. 그 다음..
교차 검증(Cross Validation) 하나의 머신 러닝 모델을 구성하는 것은 사실 굉장히 간단합니다. 데이터를 분리하고, 모델을 구성하고, 훈련하고, 평가한다. 특히 멋진 라이브러리를 활용하면 10줄 남짓한 코드로 이 모든 과정을 해결하는 것이 가능하지요. 물론 모델을 개선하기 위해 세부적으로 들어가면 데이터를 분리하기전 Feature engineering도 선행되어야하고, 데이터를 어떻게 분리하는 것이 가장 좋은 효과를 낼지, 모델을 구성하는 Hyper Parameter는 어떻게 조절해야할지 등 많은 것이 과제로 남습니다만, 베이스는 같습니다. 이번에는 그 중에서 마지막 단계. 평가하는 과정에서 사용되는 교차 검증 기법에 대해 설명하겠습니다. 가장 단순한 모델 평가 어떤 훈련 데이터로 학습된 모델을 평가하려면, 당연히 평가용 데이터가 있어..
Weakly Supervised Localization 학습목표 이번 강의에서는 Weakly Supervised Localization과 Class Activation Map에 대해 알아보도록 하겠습니다. 어떤 물체를 인식하여 분류해내는 것을 넘어서서 이미지 내의 어디에 분류해낸 물체가 있는지 알아보는 방법을 위의 2가지 방법론을 통해 알아보겠습니다. 핵심 키워드 Weakly Supervised Localization Class Activation Map(CAM) Detection / Localization 학습하기 Weakly Supervised Localization 이름에서 알 수 있듯, Weakly supervised 방법론을 통해 Localization 문제를 푸는 것입니다. 이미지를 분류할 때, 이 이미지가 뭐다 라고 분류하는 것도 중요하지만, 그..
Residual Network가 왜 잘되는지 해석해보기 학습목표 Residual Network(ResNet)가 왜 잘 작동되는 구조인지, 과연 Depp한 Network가 좋은지를 다루고 있는 두 가지 논문을 알아보겠습니다. 두 논문을 통해 Residual Network를 더 자세히 분석해보고 Network에서 Depth가 가지는 의미를 알아보겠습니다. 핵심 키워드 Residual Network (ResNet) Deeper Network Degradation Esemble Model 학습하기 이번에는, Res net이 왜 좋은지, 그리고 Deeper network가 정말 좋은지 이 2가지에 대해 알아보도록 하겠습니다. Res net을 정말 대단하죠. 152개의 Layer를 활용해 5개의 이미지 대회를 휩쓸었습니다. Res net이 나오기까지 한 질문이 있었죠...
비유동적 데이터(Stationary data) 우리가 시계열 데이터를 받아들면 대개 RNN 계열의 모델들을 구성합니다. 좋은 예시로 주식 데이터가 그러하고, 주식을 예측하면 떼돈을 벌 수 있지 않을까 하는 생각으로 많은 시도가 있었습니다. 물론 결과는 실패였습니다. 그 이유가 바로 Stationary라는 특성때문입니다. 생각해보면 당연한데도, 대개 시계열 데이터만 보면 RNN으로 가려는 습관이 아직도 남아 있는 것 같습니다. Stationary? 어떤 데이터가 Stationary 하다-라는 것은, 과거에 존재하는 패턴이 미래에도 존재한다-라는 것입니다. 그러니까, 어떤 원소의 화학적 반응을 시계열 데이터화시킨다면, 학습이 유의미합니다. 화학반응은 시간이 지남에 따라 변화하는 개념이 아니니까요. 그런데 주식은 조금 다릅니다. 주식의 흐름에서 패턴을 찾..