[AI/DL] Transformers (트랜스포머) 완벽 가이드 (정의, 특징 및 장단점, 모델 학습 과정)
·
ML & DL
1. 들어가며안녕하세요! 딥러닝 완전 정복 시리즈, 그 네 번째 시간입니다.지난 3편에서는 순서를 기억하는 RNN에 대해 배웠습니다. 하지만 RNN은 문장을 처음부터 끝까지 순서대로 읽어야 해서 속도가 느리고, 문장이 길어지면 앞의 내용을 까먹는(장기 의존성) 문제가 있었습니다."순서대로 읽지 말고, 문장 전체를 한 번에 보면서 중요한 단어끼리 연결하면 안 될까?"이 혁명적인 아이디어로 2017년 구글이 발표한 논문이 바로 **"Attention Is All You Need"**입니다. 그리고 여기서 탄생한 모델이 **트랜스포머(Transformer)**입니다.오늘날의 ChatGPT, BERT, 그리고 수많은 AI 모델의 어머니가 된 트랜스포머의 모든 것을 파헤쳐 봅시다!2. 트랜스포머(Transform..
[AI/DL] RNN (순환 신경망) 완벽 가이드 (정의, 특징 및 장단점, 모델 학습 과정)
·
ML & DL
1. 들어가며안녕하세요! 딥러닝 완전 정복 시리즈, 그 세 번째 시간입니다.1편 ANN과 2편 CNN은 **"현재의 입력"**만 보고 판단하는 모델이었습니다.하지만 우리가 사는 세상의 데이터는 대부분 **"순서(Sequence)"**와 **"맥락(Context)"**을 가지고 있습니다."배가 고파서 밥을 [ ]" $\rightarrow$ 빈칸을 채우려면 앞의 내용을 기억해야 합니다.주가 예측 $\rightarrow$ 어제의 가격이 오늘의 가격에 영향을 줍니다.이렇게 이전의 정보를 기억하고, 현재의 판단에 활용하는 신경망이 바로 **RNN (Recurrent Neural Network)**입니다. 자연어 처리(NLP)와 시계열 분석의 근간이 되는 RNN의 모든 것을 파헤쳐 봅시다!2. RNN (Recurr..
[AI/DL] CNN (합성곱 신경망) 완벽 가이드 (정의, 특징 및 장단점, 모델 학습 과정)
·
ML & DL
1. 들어가며안녕하세요! 딥러닝 완전 정복 시리즈, 그 두 번째 시간입니다.지난 1편에서는 뇌를 모방한 인공신경망(ANN)에 대해 배웠습니다. 하지만 ANN은 이미지 같은 2차원 데이터를 1차원으로 펴서(Flatten) 처리하기 때문에, 픽셀 간의 공간적 정보(위치, 패턴)를 잃어버린다는 치명적인 단점이 있었습니다."눈, 코, 입의 위치가 바뀌어도 얼굴을 알아볼 수는 없을까?"이 질문에서 시작된 것이 바로 합성곱 신경망 (CNN, Convolutional Neural Network)입니다. 자율주행, 얼굴 인식, 의료 영상 분석 등 현대 AI 기술의 핵심인 CNN의 모든 것을 파헤쳐 봅시다!2. CNN (Convolutional Neural Network)이란? 2.1 정의 및 배경CNN은 **이미지의 ..
[AI/DL] ANN (인공신경망) 완벽 가이드 (정의, 특징 및 장단점, 모델 학습 과정)
·
ML & DL
1. 들어가며안녕하세요! 인공지능과 딥러닝의 세계에 오신 것을 환영합니다. 이번 시리즈에서는 현대 AI 기술의 핵심인 **딥러닝(Deep Learning)**의 주요 모델들을 5편에 걸쳐 하나씩 완벽하게 파헤쳐 볼 예정입니다.그 첫 번째 주인공은 바로 **ANN (Artificial Neural Network)**입니다. 우리가 흔히 말하는 '딥러닝'은 사실 ANN의 은닉층(Hidden Layer)을 깊게 쌓은 것을 의미합니다. 즉, ANN을 이해하지 못하면 CNN, Transformers 같은 최신 기술을 이해하는 것은 불가능합니다.인간의 뇌 구조에서 영감을 받아 탄생한 ANN의 원리부터, 파이썬을 활용한 실전 모델링까지 A to Z를 정리해 드립니다.2. ANN (Artificial Neural Ne..
[AI/ML] CatBoost 완벽 가이드 (정의, 특징 및 장단점, 모델 학습 과정)
·
ML & DL
1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 그 마지막 열 번째 시간입니다.지난 8편과 9편에서 부스팅의 양대 산맥인 XGBoost와 LightGBM을 다뤘습니다. 두 모델 모두 훌륭하지만, 공통적인 골칫거리가 하나 있었죠. 바로 **"범주형 데이터(Categorical Feature)를 숫자로 바꿔줘야 한다"**는 것입니다.(예: "서울", "부산" $\rightarrow$ 0, 1)이 귀찮은 작업을 알아서 해주고, 심지어 성능까지 더 좋은 모델이 있다면 어떨까요?Yandex가 개발한 부스팅의 신흥 강자, **CatBoost (Categorical Boosting)**를 소개합니다."전처리 귀찮아!"를 외치던 데이터 과학자들에게 한 줄기 빛과 같은 CatBoost의 매력을 낱낱이 파헤..
[AI/ML] LightGBM 완벽 가이드 (정의, 특징 및 장단점, 모델 학습 과정)
·
ML & DL
1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 아홉 번째 시간입니다.지난 8편에서는 캐글의 제왕 XGBoost에 대해 알아봤습니다. 성능은 최고지만, 데이터가 수천만 건이 넘어가면 학습 시간이 너무 오래 걸린다는 단점이 있었죠."성능은 그대로 유지하면서, 더 빨리 학습할 수는 없을까?"이 질문에 마이크로소프트(Microsoft)가 내놓은 답이 바로 **LightGBM (Light Gradient Boosting Machine)**입니다.이름처럼 가볍지만 성능은 결코 가볍지 않은, 빅데이터 시대의 필수 알고리즘 LightGBM을 파헤쳐 봅시다!2. LightGBM이란? 2.1 정의LightGBM은 Gradient Boosting 프레임워크를 기반으로 하되, **속도(Speed)**와 **메..
[AI/ML] XGBoost (eXtreme Gradient Boosting) 완벽 가이드 (정의, 특징 및 장단점, 모델 학습 과정)
·
ML & DL
1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 여덟 번째 시간입니다.지난 7편에서는 오답(잔차)을 줄여나가는 강력한 알고리즘 **Gradient Boosting (GBM)**을 배웠습니다. 하지만 GBM은 학습 속도가 느리고, 과적합에 취약하다는 치명적인 단점이 있었죠."성능은 좋은데 너무 느려요..."이 불만을 해결하기 위해 등장한 구세주가 바로 **XGBoost (eXtreme Gradient Boosting)**입니다.이름부터 'Extreme(극한)'이 붙은 이 모델은 시스템 최적화와 알고리즘 개선을 통해 속도를 비약적으로 높였고, 수많은 머신러닝 대회를 휩쓸며 "갓(God)부스트"라는 찬사를 받았습니다. 도대체 무엇이 그렇게 특별한지, 지금부터 파헤쳐 봅시다!2. XGBoost란?..
[AI/ML] Gradient Boosting(GBM) 완벽 가이드 (정의, 특징 및 장단점, 모델 학습 과정)
·
ML & DL
1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 일곱 번째 시간입니다.지난 6편에서는 여러 나무의 의견을 모으는 든든한 숲, **랜덤 포레스트(Random Forest)**를 배웠습니다. 랜덤 포레스트는 안정적이고 강력하지만, "조금 더 성능을 높일 수는 없을까?"라는 욕심은 끝이 없죠.그래서 등장한 것이 바로 **Gradient Boosting (GBM)**입니다.랜덤 포레스트가 "동시에" 여러 나무를 심는다면, GBM은 "순서대로" 나무를 심습니다. 첫 번째 나무가 틀린 문제를 두 번째 나무가 고치고, 두 번째가 틀린 걸 세 번째가 고치는 식이죠.머신러닝 대회를 휩쓰는 XGBoost, LightGBM의 뿌리가 되는 Gradient Boosting의 원리를 파헤쳐 봅시다!2. Gradie..
[AI/ML] 랜덤 포레스트(Random Forest) 완벽 가이드 (정의, 특징 및 장단점, 모델 학습 과정)
·
ML & DL
1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 여섯 번째 시간입니다.지난 5편에서는 스무고개 하듯 정답을 찾아가는 의사결정 나무(Decision Tree)를 배웠습니다. 직관적이지만, 학습 데이터에 너무 민감하게 반응해서 조금만 데이터가 달라져도 결과가 휘청거리는(과적합) 단점이 있었죠."한 명의 천재보다 열 명의 범재가 낫다"는 말이 있죠?랜덤 포레스트(Random Forest)는 이 격언을 머신러닝에 그대로 적용한 모델입니다. 수십, 수백 그루의 나무를 심어 숲(Forest)을 만들고, 그들의 의견을 종합해 결론을 내립니다.머신러닝 입문자가 가장 먼저 "와, 성능 좋다!"라고 느끼게 되는 마법 같은 알고리즘, 랜덤 포레스트의 세계로 떠나봅시다!2. 랜덤 포레스트(Random Fores..
[AI/ML] 의사결정 나무 (Decision Tree) 완벽 가이드 (정의, 특징 및 장단점, 모델 학습 과정)
·
ML & DL
1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 다섯 번째 시간입니다.지난 4편에서는 수학적으로 완벽한 경계를 찾는 SVM에 대해 다뤘습니다. 오늘은 머신러닝 모델 중 가장 '사람의 생각'과 닮아있는 알고리즘, 의사결정 나무(Decision Tree)를 소개합니다."날개가 있나요? (네/아니오)" $\rightarrow$ "날 수 있나요? (네/아니오)"마치 스무고개 놀이를 하듯 질문을 던지며 정답을 찾아가는 이 모델은, 결과가 왜 그렇게 나왔는지 설명해야 하는 화이트박스(White-box) 모델의 대표주자입니다.랜덤 포레스트나 XGBoost 같은 강력한 최신 모델들의 '뿌리'가 되는 의사결정 나무의 모든 것을 파헤쳐 보겠습니다!2. 의사결정 나무(Decision Tree)란? 2.1 정의..