[AI/LLM] Inference와 Reasoning (추론) 완벽 가이드 (개요 및 정의, 특징, 장단점, 주요 활용 분야, 실습)
·
AI Study/[LLM]
1. 들어가며최근 인공지능(AI) 뉴스를 보면 "추론 속도가 빨라졌다"는 기사와 "추론 능력이 뛰어난 모델이 나왔다"는 기사가 동시에 쏟아집니다. 그런데 여기서 말하는 두 '추론'은 전혀 다른 개념이라는 사실을 알고 계셨나요?한국어로는 둘 다 '추론'으로 번역되지만, AI 엔지니어링 관점에서 이 둘은 명확히 구분됩니다.Inference: 학습된 AI가 정답을 '실행/출력'하는 과정 (System 1)Reasoning: AI가 문제를 풀기 위해 '논리적으로 생각'하는 과정 (System 2)최근 OpenAI의 o1 모델이나 DeepSeek-R1처럼 '스스로 생각하는 AI'가 등장하면서 이 두 개념의 구분은 AI 서비스 기획과 개발에 있어 핵심 기준이 되었습니다. 본 포스팅에서는 Inference와 Reas..
[AI/SLM] SLM (소형 언어 모델)이란 무엇인가? (정의, 핵심 기술, 장단점, 대표 모델, 실습)
·
AI Study/[LLM]
1. 들어가며2023년이 GPT-4와 같은 초거대 언어 모델(LLM)의 해였다면, 2024년과 2025년은 SLM(Small Language Model, 소형 언어 모델)의 해라고 해도 과언이 아닙니다.LLM은 놀라운 성능을 보여주지만, 천문학적인 운영 비용, 느린 응답 속도, 그리고 클라우드에 데이터를 보내야 하는 보안 문제라는 명확한 한계가 존재합니다. 이에 대한 해답으로 등장한 것이 바로 SLM입니다."내 노트북, 내 스마트폰에서 인터넷 없이 돌아가는 고성능 AI."이번 포스팅에서는 빅테크 기업들이 사활을 걸고 있는 SLM의 정의와 핵심 기술(경량화), 그리고 파이썬을 이용해 내 컴퓨터에서 직접 SLM을 구동하는 방법까지 A to Z를 정리해 보겠습니다.2. SLM(Small Language Mod..