본문 바로가기

Data Science/LLM & GenAI16

AI 엔지니어가 꼭 읽어야 할 정보: 이미지/비디오 디퓨전편 인공지능(AI) 기반의 이미지 및 비디오 디퓨전 기술은 콘텐츠 생성 및 편집에서 점점 더 중요한 역할을 하고 있습니다. AI 엔지니어들은 최신 디퓨전 모델, 벤치마크, 그리고 실무 적용 전략을 숙지하여 빠르게 발전하는 이 분야를 선도할 수 있어야 합니다. 본 글에서는 2025년 기준으로 이미지 및 비디오 디퓨전 기술의 최신 동향을 소개합니다.1. 주요 이미지/비디오 디퓨전 모델 및 연구 동향1.1 Stable Diffusion 및 Latent DiffusionLatent Diffusion 논문: Stable Diffusion의 핵심 논문으로, 텍스트 기반 이미지 생성을 위한 기본적인 원리 설명.관련 연구:SD2SDXLSD3최근 연구: BFL Flux 프로젝트.1.2 DALL-E 시리즈OpenAI의 이미지.. 2025. 2. 22.
AI 엔지니어가 꼭 읽어야 할 정보, 음성(Voice)편 인공지능(AI) 음성 기술은 빠르게 발전하고 있으며, 음성 인식(ASR) 및 텍스트 음성 변환(TTS) 분야에서 혁신적인 연구들이 지속적으로 발표되고 있습니다. AI 엔지니어들은 최신 음성 모델, 벤치마크 및 실무 적용 방안을 이해하고, 이를 활용한 최적의 솔루션을 제공할 수 있어야 합니다. 본 글에서는 2025년 기준으로 AI 음성 기술의 최신 동향과 실무 적용 전략을 소개합니다.1. 주요 음성 모델 및 연구 동향1.1 Whisper: 최고 수준의 음성 인식 모델Whisper 논문: OpenAI의 성공적인 ASR(자동 음성 인식) 모델.최신 버전: Whisper v2, Whisper v3, distil-whisper, v3 Turbo1.2 AudioPaLM: Google의 음성 연구AudioPaLM 논.. 2025. 2. 22.
RAG 검색 방법 비교(희소 검색, 밀집검색-Sparse Retriever vs Dense Retriever) RAG(Retrieval-Augmented Generation) 시스템에서는 사용자의 질의(Query)에 대한 관련 문서를 검색하는 데 주로 두 가지 방식이 사용됩니다. Sparse Retrieval(희소 검색)과 Dense Retrieval(밀집 검색)이 그것입니다. 이 두 검색 방식은 텍스트를 벡터로 표현하고 유사도를 계산하는 방식에서 차이를 보입니다. RAG의 핵심은 검색기입니다. 사용자의 질문에 대해 정확한 정보 제공을 하기위해서는 검색기가 사용자 질문과 가장 관련성 높은 정보를 검색해 LLM이 정확하고 유용한 답변을 생성할 수 있도록 해야합니다. 검색이 효과적으로 이루어지지 않으면, 결과적으로 제공되는 답변의 품질이 떨어질 수 있습니다. 또한 검색 시간도 중요합니다. 효율적인 검색 알고리즘은 데.. 2025. 1. 21.
랭체인(Langchain) 소개 및 특징 (RAG필수 프레임워크) 랭체인(Langchain)은 대규모 언어 모델(LLM)로 구동되는 애플리케이션을 개발하기 위한 프레임워크입니다.RAG에 관심이 있거나 개발하시는 분들이라면 랭체인을 한 번쯤은 들어보셨을 것입니다. GPT와 같은 LLM을 이용해 애플리케이션을 만들려 할 때 부수적으로 개발해야 할 모듈이 많습니다.예를 들어, 문서를 통한 QA 시스템을 만들 때는 기존 FAQ나 정해진 매뉴얼을 불러오는 로더(Loader)부터 데이터베이스화, 프롬프트 작성 등 간단한 시스템에도 서비스를 위한 모듈을 모두 개발해야 합니다. 랭체인(Langchain)은 LLM을 사용하기 위한 다양한 모듈을 통합해 제공하는 프레임워크입니다.  랭체인(Langchain)의 주요 특징과 기능프롬프트 관리 (Prompt Management)프롬프트를 체.. 2025. 1. 20.
RAG란? (RAG 개념과 활용) RAG(Retrieval-Augmented Generation)는 LLM이 외부 지식 베이스나 문서 저장소에서 질문과 관련된 정보를 검색하고, 이를 프롬프트에 포함시켜 더 정확하고 신뢰성 있는 답변을 생성하는 기술입니다. 이 기술은 LLM의 학습 데이터에 포함되지 않은 최신 정보나 도메인 특화 지식을 활용할 수 있게 해주며, 할루시네이션(Hallucination) 현상을 줄이는 데 도움을 줍니다.RAG의 개념과 특징1. RAG 개념이 생기게된 이유ChatGPT-3 모델이 큰 관심을 받으면서 사용자들이 다양한 결과물을 공유하던 시기가 있었습니다. 그중 "세종대왕 맥북프로 던짐 사건"[1]은 한동안 인터넷에서 화제가 된 밈이었죠. (세종대왕 맥북 던짐 사건 나무위키)이 사건을 계기로 GPT와 같은 AI의 할.. 2025. 1. 17.
어텐션(Attention) 이해하기 어텐션의 사전적 의미는 '주의'입니다. 텍스트 처리 관점에서는 입력된 텍스트에서 단어들 간의 관련성을 '주의 깊게' 파악한다는 의미로 이해할 수 있습니다. 어텐션이 발표되기 전까지는 RNN 기반 전이학습(Transfer Learning)이 가진 대규모 데이터셋 학습의 한계를 해결하기 위한 연구가 여러 대학에서 진행되고 있었습니다. 2017년 구글브레인에서 발표한 Attention is All you need는 이 문제를 단순히 개선하는 데 그치지 않고 완전히 해결할 수 있는 획기적인 연구논문이었습니다. 2025년 현재, 트랜스포머 아키텍처가 세상에 등장한 지 10년이 다 되어가는 시점에서 LLM이라는 형태로 우리 삶에 녹아들고 있는 것을 보면, 당시 느꼈던 혁신적인 변화의 예감이 틀리지 않았음을 알 수 .. 2025. 1. 16.