본문 바로가기

Data Science35

가장 인기 있는 5가지 Agentic AI 디자인 패턴(feat. 개념부터 활용까지) Agentic AI란?Agentic AI는 자기 평가(Self-Evaluation), 계획(Planning), 협업(Collaboration)을 통해 LLM(Large Language Model)이 자신의 출력을 개선하는 방식입니다. 즉, 단순히 입력을 받아 출력을 생성하는 것이 아니라, 스스로 평가하고 학습하며 문제를 해결하는 인공지능을 의미합니다.이 글에서는 가장 인기 있는 5가지 Agentic AI 디자인 패턴을 소개하고, 각각의 개념과 활용 사례를 살펴보겠습니다.1. Reflection 패턴 (반영 패턴)🧐 개념Reflection 패턴은 AI가 자신의 출력을 검토하고 오류를 찾아 수정하는 방식을 의미합니다. 즉, **자기 평가(Self-Evaluation)**를 통해 점진적으로 더 나은 답변을 .. 2025. 2. 24.

Document AI 구축 방법 (feat. 오픈소스를 활용한 예제) Document AI 구축 방법Document AI는 문서를 자동으로 인식하고 처리하는 인공지능 기술로, OCR(광학 문자 인식), 자연어 처리(NLP), 머신러닝 등을 활용하여 문서 데이터를 자동화할 수 있습니다. 이번 글에서는 Document AI를 구축하는 방법과 예제 코드를 소개하겠습니다. 1. Document AI 구축 방법 Document AI를 구축하기 위해서는 다음과 같은 단계가 필요합니다. 📌 1) 데이터 준비 및 수집 Document AI가 처리할 문서를 준비합니다. • 스캔된 PDF, 이미지(JPG, PNG), 텍스트 파일 등 • 라벨링된 문서 데이터 (OCR 학습을 위한 데이터셋) 예제 데이터:✅ 영수증, 계약서, 신분증, 보험 청구서 등📌 2) OCR(광학 문자 인식) 적용 O.. 2025. 2. 24.

Document AI란? (문서 자동화 혁신 기술) Document AI란?Document AI(Document Artificial Intelligence)는 인공지능(AI) 기술을 활용하여 문서를 자동으로 분석하고, 이해하며, 처리하는 시스템을 의미합니다. 이는 OCR(광학 문자 인식), NLP(자연어 처리), 머신러닝 등의 기술을 결합하여 문서에서 중요한 정보를 추출하고 정리하는 자동화된 솔루션입니다. Document AI는 비정형 데이터(텍스트, 이미지, 스캔된 문서 등)에서 유용한 정보를 찾아내는 역할을 하며, 다양한 산업에서 효율성을 높이는 데 사용됩니다. 1. Document AI의 주요 기능🔍 1) OCR (Optical Character Recognition, 광학 문자 인식) 문서를 스캔하여 이미지 속 텍스트를 디지털 데이터로 변환손글씨.. 2025. 2. 24.

트랜스포머 모델에서 인코더(Encoder)와 디코더(Decoder) 쉽게 이해하기 트랜스포머란? 트랜스포머(Transformer)는 자연어 처리(NLP)에서 가장 강력한 모델 중 하나입니다. 이 모델은 언어 번역, 텍스트 생성, 질문 응답 시스템 등에서 널리 사용됩니다. 트랜스포머의 핵심 요소는 **인코더(Encoder)와 디코더(Decoder)**입니다.👉 그렇다면 인코더와 디코더가 정확히 무엇일까요?인코더(Encoder)란?인코더는 입력된 문장을 분석하고 이해하는 역할을 합니다.쉽게 비유하기 인코더는 마치 책을 읽고 중요한 내용을 정리하는 사람과 같습니다.예를 들어, "나는 밥을 먹었다"라는 문장이 있다면, 인코더는 이 문장에서 "누가?", "무엇을?" 같은 중요한 정보를 뽑아냅니다.인코더의 작동 방식 1.문장의 단어들을 숫자로 변환 (컴퓨터는 숫자만 이해할 수 있습니다!)2.각.. 2025. 2. 23.

Transformer 모델의 핵심! 어텐션(Attention) 쉽게 이해하기 어텐션이란? 🤔어텐션(Attention)은 중요한 부분에 집중하는 기술입니다. 문장 내에서 각 단어 간의 관계를 분석하여 가장 의미 있는 정보를 강조하는 역할을 합니다. 예를 들어,"나는 어제 친구와 영화를 봤다."이 문장에서 "영화"라는 단어를 올바르게 이해하려면 "봤다"와의 관계가 중요합니다. 어텐션은 이런 관련성을 계산해 자연어 처리 모델이 핵심 정보를 더욱 잘 이해하도록 돕는 기술입니다.Transformer에서 어텐션의 작동 원리 🛠️Transformer 모델의 어텐션 메커니즘은 Query(Q), Key(K), Value(V) 세 가지 요소를 중심으로 작동합니다.Query (Q): 찾고 싶은 정보 (ex. "영화"와 관련된 단어 찾기)Key (K): 각 단어의 특징 정보 (ex. 문장 내 모든.. 2025. 2. 22.

LLM 학습을 위한 필수 데이터셋과 준비 과정 LLM(Large Language Model) 학습을 위한 데이터셋 준비는 모델의 성능과 품질을 결정짓는 중요한 과정입니다. 아래는 LLM 학습에 필수적인 데이터셋 유형, 준비 과정, 품질 관리 방법 등을 체계적으로정리한 내용입니다. 데이터셋의 중요성LLM은 대규모 데이터를 기반으로 언어의 패턴과 구조를 학습합니다. 데이터셋의 양과 질은 모델이 얼마나 효과적으로 언어를 이해하고 생성할 수 있는지를 결정하며, 지속적인 모델 개선에도 필수적입니다[1][4].필수 데이터셋 유형LLM 학습에 필요한 데이터셋은 다음과 같이 분류됩니다.텍스트 코퍼스: 위키피디아, 뉴스 기사, 소설 등 방대한 일반 텍스트 데이터[1][5].대화 데이터: 채팅 로그, Q&A 쌍, 상담 기록 등 대화형 언어 데이터를 포함[5].전문 분.. 2025. 2. 22.

이전 1 2 3 4 5 6 다음

티스토리툴바