[AI/NLP] 최신 임베딩 모델과 원리 (BERT, OpenAI, MTEB, 거리 계산)
·
AI Study/[LLM]
1. 들어가며: "배(Ship)와 배(Pear)를 구분하라"1편의 Word2Vec은 단어를 벡터로 바꾸는 혁명을 일으켰지만, 한계가 명확했습니다."나는 배를 탔다"와 "나는 배를 먹었다"에서, Word2Vec은 두 '배'를 똑같은 벡터 [0.1, 0.5]로 변환합니다. 문맥을 전혀 고려하지 못하기 때문이죠.하지만 검색(RAG)이나 챗봇에서 이런 일이 벌어지면 큰일 납니다. "맛있는 과일"을 검색했는데 "조선소 건조 선박" 문서가 튀어나올 테니까요.이 문제를 해결하기 위해 등장한 것이 바로 Transformer 기반의 **문맥적 임베딩(Contextualized Embedding)**입니다.2. 문맥을 이해하는 혁명: BERT와 SBERT2.1 BERT (Bidirectional Encoder Repres..
[AI/NLP] 임베딩(Embedding)이란? (정의, 발전 과정, 최신 트랜드)
·
AI Study/[LLM]
1. 들어가며: RAG를 하려면 '임베딩'부터 알아야 한다요즘 AI 업계의 가장 뜨거운 감자는 단연 RAG (검색 증강 생성)입니다. LLM에게 우리 회사의 데이터를 참고해서 답변하게 만드는 기술이죠.그런데 RAG를 공부하다 보면 첫 단계부터 막힙니다."데이터를 벡터화(Vectorization)해서 임베딩(Embedding) 하세요."도대체 임베딩이 뭘까요? 왜 텍스트를 숫자로 바꿔야 할까요?임베딩은 AI가 인간의 언어를 이해하고, 검색하고, 추천하는 모든 기술의 뿌리이자 핵심 엔진입니다. 이 개념을 확실히 잡지 못하면, 아무리 비싼 LLM을 써도 엉뚱한 문서를 찾아오는 '멍청한 검색'만 하게 됩니다.오늘부터 3편에 걸쳐, 이 '임베딩'의 모든 것을 완벽하게 파헤쳐 보겠습니다. 1편은 그 시작점인 임베딩..
[AI/LLM] Langfuse 설치 및 사용 가이드 (Docker 기반)
·
AI Study/[LLM]
1. 들어가며기존 소프트웨어 개발에는 Datadog, Sentry 같은 모니터링 도구가 필수입니다. 그런데 LLM 애플리케이션은 어떤가요?"RAG 체인 중 검색이 느린 건지, LLM 생성이 느린 건지 모르겠음.""지난달보다 토큰 비용이 2배 늘었는데, 어떤 프롬프트 때문인지 모름.""프롬프트 수정을 엑셀이나 노션 등으로 공유하고 있음."이런 '블랙박스' 상태를 해결해 주는 것이 바로 LLM Observability(관측 가능성) 플랫폼입니다. 오늘은 그중에서도 오픈소스이자 Self-Hosting이 강력한 Langfuse에 대해 알아봅니다.Langfuse 공식 링크: https://github.com/langfuse/langfuse GitHub - langfuse/langfuse: 🪢 Open sourc..
[FE/BE] API 운영 가이드 (보안, 성능, 테스트)
·
Tech Archive/[FE & BE]
1. 들어가며2편에서 만든 MovieFlix API는 기능적으로 완벽합니다. 영화를 조회하고, 만들고, 수정하고, 삭제할 수 있죠.하지만 이대로 인터넷에 배포하면 5분 만에 망합니다.보안: 누구나 DELETE /movies/1을 호출해서 영화를 다 지워버릴 수 있습니다. 😱성능: 영화가 100만 개가 되면 GET /movies 요청 한 번에 서버가 멈춥니다.신뢰성: 코드를 수정했는데 기존 기능이 잘 되는지 매번 손으로 확인할 순 없죠.3편에서는 이 API를 '현업 수준'으로 끌어올리는 필수 요소들을 다룹니다. 2. 보안 (Security)API 보안의 핵심은 "너 누구야?(인증)"와 "너 이거 할 수 있어?(인가)"입니다. 2-1. 인증(Authentication)과 JWTREST API는 '무상태(..
[FE/BE] API 개발 가이드: FastAPI로 실전 REST API 만들기 (Pydantic, CRUD)
·
Tech Archive/[FE & BE]
1. 들어가며지난 1편에서 우리는 'MovieFlix(영화 스트리밍)' 서비스의 API를 설계했습니다.URI: /movies행위: GET, POST, PUT, DELETE규칙: 명사형 URI, 적절한 상태 코드이제 이 설계도를 들고 공사장에 왔습니다. 오늘 사용할 도구는 Python FastAPI입니다."왜 Django나 Flask가 아니고 FastAPI인가요?"라고 묻는다면, API 개발에 있어서만큼은 FastAPI가 압도적으로 편리하고 빠르기 때문입니다. 2. 왜 FastAPI인가?짧고 굵게 3가지만 기억하세요.빠르다 (High Performance): NodeJS나 Go에 비견될 만큼 빠릅니다. (Starlette + Pydantic 기반)쉽다 (Easy): 파이썬의 타입 힌트(Type Hint)를..
[FE/BE] API란 무엇일까? (API 정의, 종류, 설계, 개발 가이드)
·
Tech Archive/[FE & BE]
1. 들어가며프론트엔드(FE)와 백엔드(BE)가 협업할 때 가장 많이 하는 말이 있습니다."API 나왔나요?", "API 명세서 좀 주세요."API를 단순히 "DB에서 데이터 꺼내서 화면에 뿌려주는 기능" 정도로 생각하면, 나중에 유지보수 지옥이 펼쳐집니다."잘 짠 API"는 개발자 간의 명확한 약속(Contract)이자, 시스템의 얼굴입니다.API가 엉망이면 FE 개발자는 "이거 에러가 왜 나요?"라고 하루 종일 되묻고, BE 개발자는 "아, 그거 스펙 바꿨는데..."라며 땀을 흘리게 되죠.이번에는 API의 정석, 특히 현업 표준인 RESTful API를 어떻게 설계해야 '잘 짰다'는 소리를 듣는지 완벽하게 정리해 드립니다.2. API의 정의: (메뉴판과 점원)API (Application Progra..
[AI/LLM] 프롬프트 엔지니어링 (Prompt Engineering) 실전 설계 꿀팁 #4 (Generation Code, Function Calling, Agent)
·
AI Study/[LLM]
1. 들어가며1편(기초), 2편(기본 팁), 3편(CoT), 4편(RAG/ReAct)을 거치며 우리는 AI를 똑똑하게 '튜닝'하고 '추론'하게 만들며 '외부 도구'를 쓰는 '개념'까지 익혔습니다.5편은 이 모든 것을 조합하는 '실전 응용'입니다. AI는 이제 단순한 대화 상대가 아닙니다. 우리의 개발 프로세스에 깊숙이 들어와 데이터를 '뚝딱' 생성하고(Data Generation), 코드를 '뚝딱' 짜주는(Generating Code) 강력한 '일꾼'이 될 수 있습니다.이번 편에서는 AI를 현업의 '생산성 도구'로 활용하는 구체적인 방법과, AI 에이전트의 핵심인 'Function Calling'을 마스터합니다.2. AI를 '데이터 공장'으로 쓰기 (Data Generation)현업에서 개발 테스트를 할..
[AI/LLM] 프롬프트 엔지니어링 (Prompt Engineering) 실전 설계 꿀팁 #3 (RAG, ReAct, ToT, PAL, Reflextion)
·
AI Study/[LLM]
1. 들어가며이전 3편에서는 CoT(생각의 사슬), 자기 일관성(Self-Consistency) 등 AI의 '내부 추론' 능력을 극대화하는 기법을 마스터했습니다.하지만 AI가 2023년 9월까지의 지식만 가지고 있다면 어떨까요? AI가 '오늘의 날씨'를 모르거나, '우리 회사 내부 문서'를 참조할 수 없다면 현업에서 사용하기엔 치명적입니다.4편에서는 드디어 이 '닫힌 상자(Closed-book)' 같던 AI를 '외부 세계'와 연결합니다. AI에게 **'실시간 정보'(RAG)**를 검색할 '눈'을, **'외부 도구'(ReAct)**를 사용할 '손발'을 달아주는 'AI 에이전트' 기법들을 마스터할 차례입니다.이제 프롬프트 엔지니어링의 '현업 끝판왕' 기법으로 들어갑니다.2. RAG (Retrieval Aug..
[AI/LLM] 프롬프트 엔지니어링 (Prompt Engineering) 실전 설계 꿀팁 #2 (Few Shot, CoT, Self-Consistency)
·
AI Study/[LLM]
1. 들어가며이전까지는 '좋은 프롬프트'를 설계하는 4가지 팁(구체성, 페르소나 등)과 요약, 분류, Q&A 같은 현업 기본기를 다뤘습니다. 하지만 2편에서 사용한 '제로샷(Zero-shot)' 방식은 AI가 이미 아는 지식으로만 답하는 '단답형' 작업에 그칩니다.AI에게 '복잡한 추론'이 필요한 작업을 시키면 어떨까요? (예: 수학 문제, 논리 퍼즐, 다단계 비즈니스 결정)이번 3편에서는 드디어 프롬프트 엔지니어링의 '꽃'이라 불리는 고급 추론 기법들을 마스터합니다. AI가 사람처럼 '생각하는 과정'을 거치게 만드는 강력한 기법인 **'생각의 사슬(CoT)'**과 그 응용 기법들을 집중적으로 알아봅니다.2. 퓨샷 프롬프팅 (Few-Shot Prompting)첫 번째 핵심 기법은 '퓨샷(Few-shot)..
[AI/LLM] 프롬프트 엔지니어링 (Prompt Engineering) 실전 설계 꿀팁
·
AI Study/[LLM]
1. 들어가며이전 편에서는 프롬프트 엔지니어링의 개념, 역사, 그리고 AI의 '성격'을 제어하는 Temperature, Top_p, Frequency Penalty 같은 핵심 파라미터들을 알아봤습니다. 이론적으로 AI의 답변을 어떻게 '튜닝'할 수 있는지 감을 잡으셨을 겁니다.이제 이론은 충분합니다. LLM을 '진짜' 일 시키기 위해 프롬프트를 작성하는 '실전' 기술을 마스터할 차례입니다.이번 편에서는 좋은 프롬프트를 설계하는 4가지 '국룰'과, 현업에서 가장 많이 쓰이는 요약, 추출, 분류 등의 기본 예시를 마스터합니다. 2. 효과적인 프롬프트 설계를 위한 4가지 "국룰"AI가 엉뚱한 답을 내놓는다면, 90%는 AI가 아닌 '우리의 지시'가 모호하기 때문입니다. 명확한 지시를 위한 4가지 핵심 팁을 소..