[AI/SLM] SLM (소형 언어 모델)이란 무엇인가? (정의, 핵심 기술, 장단점, 대표 모델, 실습)
·
AI Study/[LLM]
1. 들어가며2023년이 GPT-4와 같은 초거대 언어 모델(LLM)의 해였다면, 2024년과 2025년은 SLM(Small Language Model, 소형 언어 모델)의 해라고 해도 과언이 아닙니다.LLM은 놀라운 성능을 보여주지만, 천문학적인 운영 비용, 느린 응답 속도, 그리고 클라우드에 데이터를 보내야 하는 보안 문제라는 명확한 한계가 존재합니다. 이에 대한 해답으로 등장한 것이 바로 SLM입니다."내 노트북, 내 스마트폰에서 인터넷 없이 돌아가는 고성능 AI."이번 포스팅에서는 빅테크 기업들이 사활을 걸고 있는 SLM의 정의와 핵심 기술(경량화), 그리고 파이썬을 이용해 내 컴퓨터에서 직접 SLM을 구동하는 방법까지 A to Z를 정리해 보겠습니다.2. SLM(Small Language Mod..
[AI/LLM] Sampling(샘플링) 완벽 가이드 (데이터 불균형 해결부터 LLM 생성 원리까지)
·
AI Study/[LLM]
1. 들어가며인공지능(AI) 모델을 개발하고 운영하다 보면 우리는 끊임없이 '선택'의 문제에 직면합니다.학습 데이터가 너무 많거나 불균형할 때 "어떤 데이터를 학습시킬 것인가?"를 선택해야 하고, ChatGPT 같은 생성형 AI가 답변을 할 때 "다음에 올 단어로 무엇을 선택할 것인가?"를 결정해야 합니다.이 모든 과정의 중심에 있는 기술이 바로 샘플링(Sampling)입니다.단순히 데이터를 뽑는 것을 넘어, 모델의 성능을 최적화하고 AI의 창의성을 조절하는 핵심 기술인 샘플링에 대해 데이터 전처리(Data)와 모델 생성(Generation) 두 가지 관점에서 완벽하게 파헤쳐 보겠습니다.2. AI 분야에서의 Sampling이란? 2.1 정의AI에서의 샘플링은 전체 집합(모집단 또는 확률 분포)에서 특정한..
[IT_Tips] Nested(중첩) 구조 완벽 가이드 (코드 로직부터 데이터베이스 모델링까지)
·
Tech Archive/[IT_Tips]
1. 들어가며개발을 하다 보면 "상자 안에 상자, 그 안에 또 상자"가 들어있는 구조를 자주 접하게 됩니다.if문 안에 또 if문이 있는 로직JSON 객체 안에 배열이 있고, 그 안에 다시 객체가 있는 데이터게시판의 대댓글이나 조직도 같은 계층형 구조이를 통칭하여 Nested(중첩) 구조라고 부릅니다. 이 구조는 복잡한 현실 세계를 표현하기 위해 필수적이지만, 잘못 사용하면 성능 저하나 유지보수의 지옥(Hell)을 맛보게 됩니다.이번 포스팅에서는 프로그래밍 로직, NoSQL(Elasticsearch), RDBMS(SQL), 테스트 코드 등 4가지 관점에서 Nested의 정의와 올바른 사용법, 그리고 구축 코드를 총정리해 보겠습니다.2. 프로그래밍 로직에서의 Nested (Control Flow) 2.1 ..
[AI/Python] 뮤텍스(Mutex) vs 세마포어(Semaphore) 완벽 정리 (정의, 특징 및 장단점, 실습)
·
AI Study/[Python]
1. 들어가며멀티 프로세스나 멀티 스레드 환경에서 개발을 하다 보면 필연적으로 '동시성 문제(Concurrency Issue)'에 직면하게 됩니다. 여러 스레드가 동시에 하나의 데이터(공유 자원)에 접근하여 수정하려고 할 때, 데이터가 꼬이거나 예상치 못한 결과(Race Condition)가 발생하는 현상이죠.이때 등장하는 해결사가 바로 뮤텍스(Mutex)와 세마포어(Semaphore)입니다. 이 둘은 비슷해 보이지만 명확한 차이가 있습니다.뮤텍스: "화장실이 하나뿐인 가게의 열쇠" (열쇠를 가진 사람만 들어감)세마포어: "빈자리가 표시되는 주차장 전광판" (빈자리가 남은 만큼 들어감)이번 포스팅에서는 공유 자원의 안전한 관리를 위한 이 두 가지 동기화 기법의 정의, 차이점, 그리고 파이썬(Python)..
[AI/LLM] KV Cache(Key-Value Cache)에 대해 자세히 알아보자! (정의, 원리, 장단점, 실습)
·
AI Study/[LLM]
1. 들어가며ChatGPT나 Claude 같은 생성형 AI를 사용할 때, 문장이 길어질수록 답변 속도가 미세하게 느려지거나 GPU 메모리가 급격히 차오르는 현상을 경험해 보셨을 겁니다.LLM은 기본적으로 자기회귀(Auto-regressive) 모델입니다. 즉, "나는 학교에"라는 문장이 주어지면 "간다"를 예측하고, 다시 "나는 학교에 간다"를 입력으로 넣어 "."을 예측합니다.문제는 이 과정에서 이미 계산했던 "나는 학교에" 부분의 연산을 매번 처음부터 다시 반복한다는 것입니다. 문장이 길어질수록 이 중복 연산은 기하급수적으로 늘어나, 치명적인 비효율을 초래합니다.이 문제를 해결하기 위해 등장한 기술이 바로 KV Cache(Key-Value Cache)입니다. "계산(Compute)을 아끼기 위해 메모..
[AI/ML&DL] 데이터 라벨링(Data Labeling)이란 무엇인가? (정의, 구성요소, 장단점, 실습)
·
ML & DL
1. 들어가며인공지능(AI)은 스스로 똑똑해지지 않습니다. 마치 어린아이에게 "이건 사과야", "이건 바나나야"라고 하나하나 가르쳐주어야 하듯, AI에게도 데이터의 의미를 알려주는 과정이 필요합니다."이 사진 속 물체는 '고양이'이고, 위치는 여기야."이렇게 원천 데이터(Raw Data)에 AI가 이해할 수 있는 정답(Tag/Label)을 달아주는 작업을 데이터 라벨링(Data Labeling)이라고 합니다. AI 프로젝트 전체 시간의 80%가 데이터 준비에 쓰인다는 말이 있을 정도로, 라벨링은 모델의 성능을 결정짓는 가장 핵심적인 단계입니다.이번 포스팅에서는 데이터 라벨링의 종류와 기법, 그리고 파이썬과 딥러닝 모델을 활용해 자동 라벨링(Auto-Labeling)을 수행하는 실전 코드까지 A to Z를..
[IT_Tips] GPU, CPU, TPU, NPU 완벽 비교 (AI 개발을 위한 하드웨어 총정리)
·
Tech Archive/[IT_Tips]
1. 들어가며딥러닝 모델을 학습시키려는데 "GPU가 없어서 학습이 너무 느려요", "코랩(Colab)에서 TPU를 쓰라는데 그게 뭐죠?", "스마트폰에는 NPU가 들어간다는데 GPU랑 다른 건가요?" 같은 질문을 한 번쯤 해보셨을 겁니다.과거에는 CPU 하나로 모든 것을 처리했지만, AI 시대가 도래하면서 행렬 연산(Matrix Multiplication)에 특화된 다양한 가속기(Accelerator)들이 등장했습니다. 이들은 서로 다른 아키텍처와 목적을 가지고 있으며, 상황에 따라 적절한 하드웨어를 선택하는 것이 비용과 시간을 절약하는 지름길입니다.이번 포스팅에서는 AI 반도체의 4대장인 CPU, GPU, TPU, NPU의 개념과 차이점, 그리고 실전 활용법까지 A to Z를 파헤쳐 보겠습니다.2. C..
[AI/CV] 이미지 와핑(Image Warping)에 대해 자세히 알아보자! (정의, 구성요소, 장단점, 실습)
·
ML & DL
1. 들어가며우리가 스마트폰으로 문서를 찍을 때, 정면에서 완벽하게 찍기란 어렵습니다. 비스듬하게 찍힌 문서를 'CamScanner' 같은 앱이 반듯하게 펴주는 것을 보신 적 있으시죠? 혹은 자율주행 자동차가 카메라로 찍은 도로 영상을 하늘에서 본 것처럼(Top View) 변환하는 기술은 어떻게 가능할까요?이 모든 마법의 뒤에는 이미지 와핑(Image Warping) 기술이 있습니다. 단순히 색상을 바꾸는 필터링과 달리, 픽셀의 위치를 재배치하여 이미지의 형태를 변형하는 이 기술은 AI 모델의 성능을 높이는 핵심 전처리 과정이기도 합니다.이번 포스팅에서는 이미지 와핑의 정의와 핵심 원리(Forward vs Backward), 그리고 파이썬 OpenCV를 이용해 직접 구현하는 방법까지 상세히 알아보겠습니다..
[FE/BE] 포트포워딩(Port Forwarding)에 대해 자세히 알아보자! (정의, 구성요소, 장단점, 실습)
·
Tech Archive/[FE & BE]
1. 들어가며우리는 보통 인터넷 공유기를 통해 PC, 스마트폰, 태블릿 등 여러 기기를 연결합니다. 내부에서는 서로 파일을 주고받고 잘 통신하지만, 정작 카페나 다른 장소에서 집에 있는 내 컴퓨터에 접속하려고 하면 접속이 불가능합니다.이유는 간단합니다. 외부 인터넷 세상은 공유기(공인 IP)까지만 알고 있고, 공유기 뒤에 숨어 있는 내 컴퓨터(사설 IP)가 누구인지, 어떤 문(Port)으로 들어가야 하는지 모르기 때문입니다.이때 필요한 것이 바로 포트포워딩(Port Forwarding)입니다. 공유기에게 "이 번호로 들어오는 손님은 저 방으로 안내해 줘"라고 이정표를 세워주는 작업이죠. 이번 포스팅에서는 네트워크 엔지니어링의 기초이자 필수인 포트포워딩의 모든 것을 파헤쳐 보겠습니다.2. 포트포워딩이란? ..
[AI/LMM] 멀티모달(Multi-Modal) AI란 무엇인가? (정의, 구성요소, 장단점, 활용 분야, 실습)
·
AI Study/[LLM]
1. 들어가며불과 몇 년 전까지만 해도 AI는 '텍스트'라는 단일 데이터만 처리하는 유니모달(Unimodal) 모델이 주류였습니다. 챗봇은 글자만 읽을 수 있었고, 이미지 인식 모델은 그림만 볼 수 있었죠.하지만 인간은 세상을 그렇게 인식하지 않습니다. 우리는 친구의 목소리 톤(청각)을 듣고, 표정(시각)을 보며, 말하는 내용(언어)을 종합해 상대방의 감정을 이해합니다. AI도 이처럼 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 동시에 이해하고 처리할 수 있다면 어떨까요?이것이 바로 멀티모달(Multi-Modal) AI의 시작입니다. GPT-4o나 Gemini 같은 최신 AI가 이미지를 보고 시를 짓거나, 영상을 보고 요약해 주는 마법 같은 일들이 가능한 이유입니다. 이번 포스팅에서는 차..