[AI/ML&DL] YOLO (You Only Look Once) 완벽 가이드 (정의, 구성요소, 특징 및 장단점, 활용 분야, 실습)
·
ML & DL
1. 들어가며자율주행 자동차가 도로 위를 달릴 때, 사람, 신호등, 다른 차량을 어떻게 눈 깜짝할 새에 인식할까요? 혹은 공장 컨베이어 벨트에서 불량품을 어떻게 실시간으로 골라낼까요? 이 모든 마법 같은 일의 중심에는 YOLO(You Only Look Once)라는 객체 탐지(Object Detection) 알고리즘이 있습니다."한 번만 보면 된다(You Only Look Once)"는 당찬 이름처럼, YOLO는 이미지를 여러 번 쪼개서 분석하던 기존의 방식을 깨부수고, 사진을 한 번 '쓱' 보는 것만으로 물체의 위치와 종류를 동시에 파악하는 혁신적인 모델입니다.이번 포스팅에서는 실시간 객체 탐지의 사실상 표준(De facto standard)이 된 YOLO의 개념과 작동 원리, 역사부터 파이썬을 활용한..
[AI/ML&DL] 하이퍼파라미터(Hyperparameter) 종류에 대해 자세히 알아보자! (정의, 비교, 주요 하이퍼파라미터 종류, 실습)
·
ML & DL
1. 들어가며머신러닝 프로젝트를 진행하다 보면, 똑같은 알고리즘(예: Random Forest, CNN)을 사용했는데도 누군가는 95%의 정확도를 내고, 누군가는 70%에 머무는 경우를 보게 됩니다. 데이터 전처리의 차이일 수도 있지만, 대부분의 경우 범인은 "설정(Configuration)"에 있습니다.모델이 스스로 학습하는 것이 아니라, 사람이 학습 전에 미리 정해줘야 하는 변수, 바로 하이퍼파라미터(Hyperparameter)입니다.이번 포스팅에서는 "학습률(Learning Rate)이 뭐길래 중요할까?", "배치 사이즈(Batch Size)는 어떻게 잡아야 할까?" 등 AI 엔지니어라면 반드시 알아야 할 하이퍼파라미터의 모든 종류와 역할을 총정리해 보겠습니다.2. 하이퍼파라미터란? 2.1 정의하이..
[AI/ML] KNN (K-Nearest Neighbors) 완벽 가이드 (정의, 특징 및 장단점, 모델 학습 과정)
·
ML & DL
1. 들어가며안녕하세요! 머신러닝 알고리즘 완전 정복 시리즈, 그 두 번째 시간입니다.지난 시간엔 로지스틱 회귀를 통해 확률 기반의 분류를 배웠습니다. 오늘은 머신러닝 모델 중 가장 직관적이고 이해하기 쉬운 알고리즘, KNN (K-Nearest Neighbors, K-최근접 이웃)에 대해 알아보겠습니다."끼리끼리 논다(유유상종)"는 말 들어보셨죠? KNN은 바로 이 원리를 그대로 수학적으로 구현한 모델입니다. 복잡한 수식 없이도 강력한 성능을 발휘하는 KNN의 세계로 떠나봅시다!2. KNN (K-Nearest Neighbors)이란? 2.2 정의KNN은 "새로운 데이터가 들어왔을 때, 기존 데이터 중 가장 가까운 K개의 이웃을 찾아, 그 이웃들이 가장 많이 속한 범주(Class)로 분류하거나 평균값을 예..
[AI/DL] 딥러닝(Deep Learning)이란 무엇일까? (정의, 원리, 모델 종류, ML&DL 차이점)
·
ML & DL
1. 들어가며안녕하세요!지금까지 배운 머신러닝(Random Forest, SVM 등)도 훌륭하지만, 비정형 데이터(이미지, 음성, 자연어)를 처리하는 데에는 한계가 있었습니다. "고양이 사진"을 엑셀 파일처럼 행과 열로 예쁘게 정리할 수는 없으니까요.딥러닝(Deep Learning)은 인간의 뇌 신경망(Neural Network)을 모방하여, 데이터의 복잡한 패턴을 스스로 학습(Representation Learning)하는 기술입니다. ChatGPT, 알파고, 자율주행차의 핵심 엔진이기도 하죠.이번 편에서는 딥러닝의 작동 원리인 인공 신경망(ANN)부터 최신 트랜스포머(Transformer)까지, 그리고 왜 딥러닝이 머신러닝의 판도를 뒤집었는지 상세하게 파헤쳐 보겠습니다. 2. 딥러닝(Deep Lear..
[AI/ML] 준지도 학습 (Semi-Supervised Learning) 파헤쳐 보기 (정의, 알고리즘, 장단점, 활용 분야)
·
ML & DL
1. 들어가며안녕하세요!지금까지 우리는 정답을 알려주는 지도 학습과, 정답 없이 패턴을 찾는 비지도 학습을 배웠습니다. 그런데 현업에서 데이터를 다루다 보면 아주 난감한 상황에 부닥칩니다.상황: 의료 영상(MRI) 분석 모델을 만들어야 함.문제: MRI 이미지는 수만 장(Unlabeled)이 있는데, 의사 선생님이 직접 병변을 표시해 준 정답 데이터(Labeled)는 비용 문제로 100장밖에 없음.고민: 100장으로 지도 학습을 하자니 성능이 안 나오고, 수만 장을 비지도 학습으로 돌리자니 병변을 정확히 분류할 수가 없음.이때 등장하는 구세주가 바로 준지도 학습(Semi-supervised Learning)입니다. "소량의 라벨 데이터 + 대량의 비라벨 데이터"를 섞어서 성능을 폭발적으로 끌어올리는 기술..