'dl' 태그의 글 목록

1. 들어가며머신러닝이나 딥러닝 모델을 학습시킬 때, 단순히 데이터를 넣고 돌리기만 하면 최상의 결과가 나올까요? 아닙니다. 같은 모델이라도 "설정"을 어떻게 하느냐에 따라 정확도가 80%에 머물 수도, 95%를 넘길 수도 있습니다.마치 라디오의 주파수를 미세하게 조절하여 깨끗한 소리를 잡는 것처럼, AI 모델에도 최적의 설정값을 찾아주는 과정이 필수적입니다. 이 과정을 하이퍼파라미터 튜닝(Hyperparameter Tuning)이라고 합니다.이번 포스팅에서는 모델 성능 최적화의 핵심인 하이퍼파라미터의 정의와 튜닝 기법(Grid, Random, Bayesian), 그리고 최신 트렌드인 Optuna를 활용한 실전 코드까지 A to Z를 파헤쳐 보겠습니다.2. 하이퍼파라미터 튜닝이란? 2.1 정의하이퍼파라미..

1. 들어가며인공지능(AI) 모델을 개발하고 운영하다 보면 우리는 끊임없이 '선택'의 문제에 직면합니다.학습 데이터가 너무 많거나 불균형할 때 "어떤 데이터를 학습시킬 것인가?"를 선택해야 하고, ChatGPT 같은 생성형 AI가 답변을 할 때 "다음에 올 단어로 무엇을 선택할 것인가?"를 결정해야 합니다.이 모든 과정의 중심에 있는 기술이 바로 샘플링(Sampling)입니다.단순히 데이터를 뽑는 것을 넘어, 모델의 성능을 최적화하고 AI의 창의성을 조절하는 핵심 기술인 샘플링에 대해 데이터 전처리(Data)와 모델 생성(Generation) 두 가지 관점에서 완벽하게 파헤쳐 보겠습니다.2. AI 분야에서의 Sampling이란? 2.1 정의AI에서의 샘플링은 전체 집합(모집단 또는 확률 분포)에서 특정한..

1. 들어가며인공지능(AI)은 스스로 똑똑해지지 않습니다. 마치 어린아이에게 "이건 사과야", "이건 바나나야"라고 하나하나 가르쳐주어야 하듯, AI에게도 데이터의 의미를 알려주는 과정이 필요합니다."이 사진 속 물체는 '고양이'이고, 위치는 여기야."이렇게 원천 데이터(Raw Data)에 AI가 이해할 수 있는 정답(Tag/Label)을 달아주는 작업을 데이터 라벨링(Data Labeling)이라고 합니다. AI 프로젝트 전체 시간의 80%가 데이터 준비에 쓰인다는 말이 있을 정도로, 라벨링은 모델의 성능을 결정짓는 가장 핵심적인 단계입니다.이번 포스팅에서는 데이터 라벨링의 종류와 기법, 그리고 파이썬과 딥러닝 모델을 활용해 자동 라벨링(Auto-Labeling)을 수행하는 실전 코드까지 A to Z를..

1. 들어가며안녕하세요! 딥러닝 완전 정복 시리즈, 그 네 번째 시간입니다.지난 3편에서는 순서를 기억하는 RNN에 대해 배웠습니다. 하지만 RNN은 문장을 처음부터 끝까지 순서대로 읽어야 해서 속도가 느리고, 문장이 길어지면 앞의 내용을 까먹는(장기 의존성) 문제가 있었습니다."순서대로 읽지 말고, 문장 전체를 한 번에 보면서 중요한 단어끼리 연결하면 안 될까?"이 혁명적인 아이디어로 2017년 구글이 발표한 논문이 바로 **"Attention Is All You Need"**입니다. 그리고 여기서 탄생한 모델이 **트랜스포머(Transformer)**입니다.오늘날의 ChatGPT, BERT, 그리고 수많은 AI 모델의 어머니가 된 트랜스포머의 모든 것을 파헤쳐 봅시다!2. 트랜스포머(Transform..

1. 들어가며안녕하세요! 딥러닝 완전 정복 시리즈, 그 세 번째 시간입니다.1편 ANN과 2편 CNN은 **"현재의 입력"**만 보고 판단하는 모델이었습니다.하지만 우리가 사는 세상의 데이터는 대부분 **"순서(Sequence)"**와 **"맥락(Context)"**을 가지고 있습니다."배가 고파서 밥을 [ ]" $\rightarrow$ 빈칸을 채우려면 앞의 내용을 기억해야 합니다.주가 예측 $\rightarrow$ 어제의 가격이 오늘의 가격에 영향을 줍니다.이렇게 이전의 정보를 기억하고, 현재의 판단에 활용하는 신경망이 바로 **RNN (Recurrent Neural Network)**입니다. 자연어 처리(NLP)와 시계열 분석의 근간이 되는 RNN의 모든 것을 파헤쳐 봅시다!2. RNN (Recurr..

1. 들어가며안녕하세요! 딥러닝 완전 정복 시리즈, 그 두 번째 시간입니다.지난 1편에서는 뇌를 모방한 인공신경망(ANN)에 대해 배웠습니다. 하지만 ANN은 이미지 같은 2차원 데이터를 1차원으로 펴서(Flatten) 처리하기 때문에, 픽셀 간의 공간적 정보(위치, 패턴)를 잃어버린다는 치명적인 단점이 있었습니다."눈, 코, 입의 위치가 바뀌어도 얼굴을 알아볼 수는 없을까?"이 질문에서 시작된 것이 바로 합성곱 신경망 (CNN, Convolutional Neural Network)입니다. 자율주행, 얼굴 인식, 의료 영상 분석 등 현대 AI 기술의 핵심인 CNN의 모든 것을 파헤쳐 봅시다!2. CNN (Convolutional Neural Network)이란? 2.1 정의 및 배경CNN은 **이미지의 ..

1. 들어가며안녕하세요! 인공지능과 딥러닝의 세계에 오신 것을 환영합니다. 이번 시리즈에서는 현대 AI 기술의 핵심인 **딥러닝(Deep Learning)**의 주요 모델들을 5편에 걸쳐 하나씩 완벽하게 파헤쳐 볼 예정입니다.그 첫 번째 주인공은 바로 **ANN (Artificial Neural Network)**입니다. 우리가 흔히 말하는 '딥러닝'은 사실 ANN의 은닉층(Hidden Layer)을 깊게 쌓은 것을 의미합니다. 즉, ANN을 이해하지 못하면 CNN, Transformers 같은 최신 기술을 이해하는 것은 불가능합니다.인간의 뇌 구조에서 영감을 받아 탄생한 ANN의 원리부터, 파이썬을 활용한 실전 모델링까지 A to Z를 정리해 드립니다.2. ANN (Artificial Neural Ne..

1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 그 마지막 열 번째 시간입니다.지난 8편과 9편에서 부스팅의 양대 산맥인 XGBoost와 LightGBM을 다뤘습니다. 두 모델 모두 훌륭하지만, 공통적인 골칫거리가 하나 있었죠. 바로 **"범주형 데이터(Categorical Feature)를 숫자로 바꿔줘야 한다"**는 것입니다.(예: "서울", "부산" $\rightarrow$ 0, 1)이 귀찮은 작업을 알아서 해주고, 심지어 성능까지 더 좋은 모델이 있다면 어떨까요?Yandex가 개발한 부스팅의 신흥 강자, **CatBoost (Categorical Boosting)**를 소개합니다."전처리 귀찮아!"를 외치던 데이터 과학자들에게 한 줄기 빛과 같은 CatBoost의 매력을 낱낱이 파헤..

1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 아홉 번째 시간입니다.지난 8편에서는 캐글의 제왕 XGBoost에 대해 알아봤습니다. 성능은 최고지만, 데이터가 수천만 건이 넘어가면 학습 시간이 너무 오래 걸린다는 단점이 있었죠."성능은 그대로 유지하면서, 더 빨리 학습할 수는 없을까?"이 질문에 마이크로소프트(Microsoft)가 내놓은 답이 바로 **LightGBM (Light Gradient Boosting Machine)**입니다.이름처럼 가볍지만 성능은 결코 가볍지 않은, 빅데이터 시대의 필수 알고리즘 LightGBM을 파헤쳐 봅시다!2. LightGBM이란? 2.1 정의LightGBM은 Gradient Boosting 프레임워크를 기반으로 하되, **속도(Speed)**와 **메..

1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 여덟 번째 시간입니다.지난 7편에서는 오답(잔차)을 줄여나가는 강력한 알고리즘 **Gradient Boosting (GBM)**을 배웠습니다. 하지만 GBM은 학습 속도가 느리고, 과적합에 취약하다는 치명적인 단점이 있었죠."성능은 좋은데 너무 느려요..."이 불만을 해결하기 위해 등장한 구세주가 바로 **XGBoost (eXtreme Gradient Boosting)**입니다.이름부터 'Extreme(극한)'이 붙은 이 모델은 시스템 최적화와 알고리즘 개선을 통해 속도를 비약적으로 높였고, 수많은 머신러닝 대회를 휩쓸며 "갓(God)부스트"라는 찬사를 받았습니다. 도대체 무엇이 그렇게 특별한지, 지금부터 파헤쳐 봅시다!2. XGBoost란?..

티스토리툴바