'MachineLearning' 태그의 글 목록 (2 Page)

1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 그 네 번째 시간입니다.1편 로지스틱 회귀, 2편 KNN, 3편 나이브 베이즈를 거쳐, 오늘은 머신러닝 분류 알고리즘의 '수학적 결정체'라 불리는 SVM (Support Vector Machine, 서포트 벡터 머신)을 다룹니다.데이터를 나누는 수많은 선 중에서 "어떤 선이 가장 좋은 선일까?"라는 질문에, 수학적으로 가장 완벽한 답을 제시하는 알고리즘이죠. 딥러닝이 등장하기 전까지 머신러닝의 제왕으로 군림했던 SVM의 매력을 파헤쳐 봅시다!2. SVM (Support Vector Machine)이란? 2.1 정의SVM은 데이터를 분류하기 위해 **가장 최적의 경계선(결정 경계, Decision Boundary)**을 정의하는 지도 학습(Su..

1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 그 세 번째 시간입니다.1편에서는 확률로 분류하는 로지스틱 회귀를, 2편에서는 거리로 분류하는 KNN을 배웠습니다.오늘 다룰 **나이브 베이즈 (Naive Bayes)**는 또 다른 매력을 가진 친구입니다. 바로 **"조건부 확률"**이라는 통계학의 강력한 무기를 사용하는 알고리즘이죠.이름에 'Naive(순진한)'라는 단어가 붙어있다고 얕보면 안 됩니다. 이 친구는 스팸 메일 필터링의 시초이자, 텍스트 분류 분야에서 여전히 강력한 성능을 자랑하는 '숨은 고수'니까요. 그럼 나이브 베이즈의 세계로 떠나볼까요?2. 나이브 베이즈(Naive Bayes)란? 2.1 정의나이브 베이즈는 **베이즈 정리(Bayes' Theorem)**를 기반으로, 데이..

1. 들어가며안녕하세요!지금까지 배운 머신러닝은 이미 주어진 데이터를 학습하는 '정적인 학습'이었습니다. 하지만 AI가 현실 세계에서 로봇처럼 움직이거나, 게임을 플레이하려면 어떻게 해야 할까요? 데이터셋을 미리 만들어두는 건 불가능에 가깝습니다.이때 필요한 것이 강화 학습(Reinforcement Learning, RL)입니다. AI가 스스로 환경과 상호작용하며 "당근(보상)과 채찍(벌)"을 통해 최적의 행동을 배우는 과정이죠. 알파고부터 ChatGPT의 RLHF까지, 현대 AI의 정점을 찍고 있는 강화 학습의 세계로 떠나봅시다.2. 강화 학습(Reinforcement Learning)이란?강화 학습은 에이전트(Agent)가 환경(Environment)과 상호작용하며, 보상(Reward)을 최대화하는 ..

1. 들어가며안녕하세요!지금까지 배운 지도 학습(Supervised Learning)은 선생님이 옆에서 "이건 고양이야", "이건 강아지야"라고 정답을 알려주는 방식이었습니다. 하지만 현실 세계의 데이터는 대부분 정답(Label)이 없습니다.쇼핑몰 방문 로그 (구매할지 안 할지 모름)공장 센서 데이터 (언제 고장 날지 모름)수만 장의 문서 파일 (무슨 내용인지 분류 안 됨)비지도 학습(Unsupervised Learning)은 이렇게 라벨이 없는 데이터 속에서 AI가 스스로 패턴, 구조, 관계를 찾아내는 기술입니다. 데이터 분석의 꽃이자, 현대 AI(생성형 AI)의 기반이 되는 비지도 학습을 완벽하게 파헤쳐 보겠습니다.2. 비지도 학습이란?비지도 학습은 레이블(정답)이 없는 데이터를 입력받아 데이터 자체..

1. 들어가며안녕하세요! 지난 시간까지 데이터 전처리라는 긴 터널을 지났습니다. 이제 드디어 **"모델을 학습시킨다"**는 진짜 머신러닝의 세계로 들어갑니다.그중에서도 가장 널리 쓰이고 강력한 지도 학습(Supervised Learning)을 완벽하게 마스터해 보겠습니다.이번 편에서는 지도 학습의 정의부터 시작해, 회귀와 분류의 차이, 그리고 현업에서 쓰이는 거의 모든 지도 학습 알고리즘(선형/로지스틱 회귀, 의사결정 트리, SVM, KNN, 나이브 베이즈, 랜덤 포레스트, 부스팅 계열 등)을 상세하게 파헤칩니다.2. 지도 학습(Supervised Learning)이란?지도 학습은 레이블(Label)이 지정된 데이터 세트, 즉 **'실측 정보(Ground Truth)'**를 사용하여 AI 모델을 학습시키..

1. 들어가며지난 1편에서는 데이터 전처리의 기초를 다졌습니다. 하지만 실제 현업 데이터는 수백 개의 불필요한 변수가 섞여 있거나, 특정 클래스(예: 불량품)가 극도로 적은 불균형 상태인 경우가 대부분입니다.이번 2편에서는 머신러닝 모델의 성능을 결정짓는 핵심 기술인 특징 엔지니어링(Feature Engineering)의 고급 기법들을 심층 분석합니다. 단순한 코드 나열이 아니라, "이 기법을 왜 써야 하며, 무엇을 조심해야 하는지"에 집중했습니다.2. 특징 엔지니어링(Feature Engineering)이란?특징 엔지니어링은 원시 데이터(Raw Data)를 머신러닝 모델이 학습하기 좋은 형태의 **특징(Feature)**으로 변환, 생성, 선택하는 모든 과정을 말합니다."데이터 과학 프로젝트 시간의 8..

1. 들어가며많은 분들이 머신러닝을 공부할 때 모델(알고리즘)부터 들여다보지만, 사실 현업에서 가장 중요한 것은 "데이터를 바라보는 관점"과 "데이터를 다루는 기술"입니다. 모델은 도구일 뿐, 그 도구에 들어가는 재료(데이터)가 상했다면 결과는 뻔하기 때문입니다.1편에서는 머신러닝의 정의와 이를 지탱하는 수학적 기초(통계, 선형대수), 그리고 모델 성능을 좌우하는 데이터 엔지니어링(특징 추출, 불균형 처리, 유출 방지)의 모든 것을 아주 상세하게 다룹니다.2. 머신러닝(Machine Learning)이란 무엇인가?머신러닝(기계 학습)은 인공지능(AI)의 하위 집합으로, 데이터의 패턴을 "학습"하여 새로운 데이터에 대해 정확한 "추론"을 할 수 있게 만드는 알고리즘 기술입니다.사람이 일일이 규칙을 입력하는..

티스토리툴바