본문 바로가기

What do you want?81

딥시크(DeepSeek)가 난리인 이유 설 연휴부터 지금까지 (25년 2월) AI 업계에서 회식자리나 티타임에서 스몰토크의 주제 중 하나는 딥시크입니다.딥시크가 발표한 DeepSeek-V2 모델 때문에 트럼프도 빅테크 기업들의 수장들도, OpenAI CEO 샘 알트먼도 모두들 당황한 기색이 역력했는데요. 대부분 인터뷰를 통해 딥시크를 칭찬하면서도 자신들의 LLM 모델을 뛰어넘을 수 없다는 식으로 말하곤 했습니다.그렇다면 무슨 이유 때문에 난리가 난걸까요? 제가 생각하는 가장 큰 이유는 성능이 뛰어난 "오픈소스"이기 때문입니다. 기존 OpenAI의 챗GPT, Google의 Gemini, Anthropic의 Claude와 같은 빅테크의 AI 모델은 대부분 Closed-source였습니다. 하지만 딥시크의 모델은 오픈소스로 공개했습니다. 챗 GPT.. 2025. 2. 13.
2025년 AI 엔지니어가 꼭 읽어야 할 정보, 프롬프팅편 인공지능(AI) 발전에 따라 프롬프팅(Prompting) 기술은 대규모 언어 모델(LLM)의 성능을 최적화하는 핵심 요소가 되었습니다. 프롬프팅은 AI 모델의 잠재력을 끌어내고 효과적인 결과를 얻기 위한 필수 도구이며, AI 엔지니어라면 반드시 익혀야 할 분야입니다. 이 글에서는 2025년 현재 AI 엔지니어들이 주목해야 할 프롬프팅 기술과 연구 동향을 살펴보겠습니다. 프롬프팅의 핵심 개념 프롬프팅은 LLM으로부터 원하는 결과를 얻기 위해 입력 형식을 최적화하는 기술입니다. 이 개념은 GPT-3 논문에서 문맥 내 학습(ICL, In-Context Learning)과 함께 처음 소개되었고, 이후 사고 연쇄(Chain of Thought, CoT)와 프롬프트 튜닝(Prompt Tuning) 등의 기술로 발전.. 2025. 1. 24.
2025년 AI 엔지니어가 꼭 읽어야 할 정보, 벤치마크와 평가편 다양한 벤치마크 및 평가 방법론이 개발되어 대규모 언어 모델(LLM)의 발전을 효과적으로 평가할 수 있게 되었습니다. AI 엔지니어들은 LLM의 성능을 정확히 측정하고 비교하기 위해 이러한 최신 벤치마크와 평가 지표들을 반드시 이해해야 합니다. 이 글에서는 2025년 현재 AI 업계에서 필수적으로 활용되는 벤치마크와 평가 방법을 살펴보겠습니다.1. 주요 벤치마크 소개1.1 MMLU (Massive Multitask Language Understanding)MMLU 논문주요 지식 평가 벤치마크로, 다음과 같은 고급 버전이 있습니다:MMLU ProGPQA DiamondBIG-Bench HardLLM의 일반적 지식 및 이해도를 측정하는 데 널리 사용됩니다.1.2 MuSR (Multi-Scale Represen.. 2025. 1. 22.
2025년 AI 엔지니어가 꼭 읽어야할 정보, 최신 LLM편 AI 엔지니어를 꿈꾸거나 현업에서 일하시는 분들은 분기마다 급속도로 발전하는 LLM의 진화 속도를 따라가기가 쉽지 않습니다. 인공지능(AI)은 지속적으로 발전하고 있으며, 특히 대규모 언어 모델(LLM, Large Language Model)은 놀라운 수준의 발전을 이루었습니다. 2025년 AI 엔지니어들이 최신 LLM 기술을 효과적으로 활용하기 위해서는 현재의 연구 동향과 주요 모델들을 깊이 이해해야 합니다. 이 글에서는 2025년 기준으로 주목해야 할 최신 LLM 정보들을 정리했습니다. * LLM 모델 이름에 논문이나 관련 블로그글에 링크를 걸어놓았습니다.1. 주요 최신 LLM 모델 소개OpenAI, Anthropic, Meta, Google 등 주요 기업들이 인프라를 확장하며 LLM 모델을 지속적으.. 2025. 1. 22.
RAG 검색 방법 비교(희소 검색, 밀집검색-Sparse Retriever vs Dense Retriever) RAG(Retrieval-Augmented Generation) 시스템에서는 사용자의 질의(Query)에 대한 관련 문서를 검색하는 데 주로 두 가지 방식이 사용됩니다. Sparse Retrieval(희소 검색)과 Dense Retrieval(밀집 검색)이 그것입니다. 이 두 검색 방식은 텍스트를 벡터로 표현하고 유사도를 계산하는 방식에서 차이를 보입니다. RAG의 핵심은 검색기입니다. 사용자의 질문에 대해 정확한 정보 제공을 하기위해서는 검색기가 사용자 질문과 가장 관련성 높은 정보를 검색해 LLM이 정확하고 유용한 답변을 생성할 수 있도록 해야합니다. 검색이 효과적으로 이루어지지 않으면, 결과적으로 제공되는 답변의 품질이 떨어질 수 있습니다. 또한 검색 시간도 중요합니다. 효율적인 검색 알고리즘은 데.. 2025. 1. 21.
랭체인(Langchain) 소개 및 특징 (RAG필수 프레임워크) 랭체인(Langchain)은 대규모 언어 모델(LLM)로 구동되는 애플리케이션을 개발하기 위한 프레임워크입니다.RAG에 관심이 있거나 개발하시는 분들이라면 랭체인을 한 번쯤은 들어보셨을 것입니다. GPT와 같은 LLM을 이용해 애플리케이션을 만들려 할 때 부수적으로 개발해야 할 모듈이 많습니다.예를 들어, 문서를 통한 QA 시스템을 만들 때는 기존 FAQ나 정해진 매뉴얼을 불러오는 로더(Loader)부터 데이터베이스화, 프롬프트 작성 등 간단한 시스템에도 서비스를 위한 모듈을 모두 개발해야 합니다. 랭체인(Langchain)은 LLM을 사용하기 위한 다양한 모듈을 통합해 제공하는 프레임워크입니다.  랭체인(Langchain)의 주요 특징과 기능프롬프트 관리 (Prompt Management)프롬프트를 체.. 2025. 1. 20.