[AI/LLM] Sampling(샘플링) 완벽 가이드 (데이터 불균형 해결부터 LLM 생성 원리까지)
·
AI Study/[LLM]
1. 들어가며인공지능(AI) 모델을 개발하고 운영하다 보면 우리는 끊임없이 '선택'의 문제에 직면합니다.학습 데이터가 너무 많거나 불균형할 때 "어떤 데이터를 학습시킬 것인가?"를 선택해야 하고, ChatGPT 같은 생성형 AI가 답변을 할 때 "다음에 올 단어로 무엇을 선택할 것인가?"를 결정해야 합니다.이 모든 과정의 중심에 있는 기술이 바로 샘플링(Sampling)입니다.단순히 데이터를 뽑는 것을 넘어, 모델의 성능을 최적화하고 AI의 창의성을 조절하는 핵심 기술인 샘플링에 대해 데이터 전처리(Data)와 모델 생성(Generation) 두 가지 관점에서 완벽하게 파헤쳐 보겠습니다.2. AI 분야에서의 Sampling이란? 2.1 정의AI에서의 샘플링은 전체 집합(모집단 또는 확률 분포)에서 특정한..