[AI/ML] 비지도 학습(Unsupervised Learning) 파헤쳐 보기 (군집화, 차원 축소, 연관 규칙, 이상 탐지 등)
·
ML & DL
1. 들어가며안녕하세요!지금까지 배운 지도 학습(Supervised Learning)은 선생님이 옆에서 "이건 고양이야", "이건 강아지야"라고 정답을 알려주는 방식이었습니다. 하지만 현실 세계의 데이터는 대부분 정답(Label)이 없습니다.쇼핑몰 방문 로그 (구매할지 안 할지 모름)공장 센서 데이터 (언제 고장 날지 모름)수만 장의 문서 파일 (무슨 내용인지 분류 안 됨)비지도 학습(Unsupervised Learning)은 이렇게 라벨이 없는 데이터 속에서 AI가 스스로 패턴, 구조, 관계를 찾아내는 기술입니다. 데이터 분석의 꽃이자, 현대 AI(생성형 AI)의 기반이 되는 비지도 학습을 완벽하게 파헤쳐 보겠습니다.2. 비지도 학습이란?비지도 학습은 레이블(정답)이 없는 데이터를 입력받아 데이터 자체..
[AI/ML] 지도 학습(Supervised Learning) 파헤쳐 보기(정의 및 알고리즘 모델 종류)
·
ML & DL
1. 들어가며안녕하세요! 지난 시간까지 데이터 전처리라는 긴 터널을 지났습니다. 이제 드디어 **"모델을 학습시킨다"**는 진짜 머신러닝의 세계로 들어갑니다.그중에서도 가장 널리 쓰이고 강력한 지도 학습(Supervised Learning)을 완벽하게 마스터해 보겠습니다.이번 편에서는 지도 학습의 정의부터 시작해, 회귀와 분류의 차이, 그리고 현업에서 쓰이는 거의 모든 지도 학습 알고리즘(선형/로지스틱 회귀, 의사결정 트리, SVM, KNN, 나이브 베이즈, 랜덤 포레스트, 부스팅 계열 등)을 상세하게 파헤칩니다.2. 지도 학습(Supervised Learning)이란?지도 학습은 레이블(Label)이 지정된 데이터 세트, 즉 **'실측 정보(Ground Truth)'**를 사용하여 AI 모델을 학습시키..
[AI/ML] Feature Engineering이란? (정의 및 기법 정리)
·
ML & DL
1. 들어가며지난 1편에서는 데이터 전처리의 기초를 다졌습니다. 하지만 실제 현업 데이터는 수백 개의 불필요한 변수가 섞여 있거나, 특정 클래스(예: 불량품)가 극도로 적은 불균형 상태인 경우가 대부분입니다.이번 2편에서는 머신러닝 모델의 성능을 결정짓는 핵심 기술인 특징 엔지니어링(Feature Engineering)의 고급 기법들을 심층 분석합니다. 단순한 코드 나열이 아니라, "이 기법을 왜 써야 하며, 무엇을 조심해야 하는지"에 집중했습니다.2. 특징 엔지니어링(Feature Engineering)이란?특징 엔지니어링은 원시 데이터(Raw Data)를 머신러닝 모델이 학습하기 좋은 형태의 **특징(Feature)**으로 변환, 생성, 선택하는 모든 과정을 말합니다."데이터 과학 프로젝트 시간의 8..
[AI/ML] 머신러닝(Machine Learning)이란 무엇일까? (통계적 기초와 데이터 엔지니어링의 정석)
·
ML & DL
1. 들어가며많은 분들이 머신러닝을 공부할 때 모델(알고리즘)부터 들여다보지만, 사실 현업에서 가장 중요한 것은 "데이터를 바라보는 관점"과 "데이터를 다루는 기술"입니다. 모델은 도구일 뿐, 그 도구에 들어가는 재료(데이터)가 상했다면 결과는 뻔하기 때문입니다.1편에서는 머신러닝의 정의와 이를 지탱하는 수학적 기초(통계, 선형대수), 그리고 모델 성능을 좌우하는 데이터 엔지니어링(특징 추출, 불균형 처리, 유출 방지)의 모든 것을 아주 상세하게 다룹니다.2. 머신러닝(Machine Learning)이란 무엇인가?머신러닝(기계 학습)은 인공지능(AI)의 하위 집합으로, 데이터의 패턴을 "학습"하여 새로운 데이터에 대해 정확한 "추론"을 할 수 있게 만드는 알고리즘 기술입니다.사람이 일일이 규칙을 입력하는..