여기에서는 Llama3 8b 를 기본 모델로 하여 한글 프리트레이닝된 모델을 ollama를 이용해서 로컬 PC에서 실행 및 테스트 해보려 한다. 특정 도메인에서는 온-프레미스에 오픈소스 LLM을 실행하고 RAG 등을 이용해서 비용효율적인 시스템을 구성하기를 원할 것이다. 이런 목적으로 사용 할 수 있을지 검토하는게 목적이다....
RAG(Retrieval Augmented Generation) 은 생성 기반 모델과 검색 기반 모델의 장점을 결합하여 고품질의 응답을 생성하는 기술이다. RAG의 주요 목표는 전문 도메인 정보를 기반으로 기존의 LLM이 응답하기 힘든 고품질의 텍스트 응답을 생성하는 것이다....
LangChain은 자연어 처리(NLP)와 관련된 애플리케이션을 개발하기 위한 파이썬 기반의 프레임워크다. 특히 GPT-3, GPT-4등의 언어 모델을 활용하여 자연어 기반으로 다양한 작업을 수행 할 수 있다. 이 문서에서는 LangChain의 특징과 사용 사례를 소개한다....
27 POSTS HERE
Prompt engineering
프롬프트 엔지니어링(Prompt engineering)이란 자연어 처리 모델과 상호 작용 할 때 원하는 결과를 얻기 위해 질문이나 명령을 구성하는 기술이다. LLM 품질의 최전선에 있는 프롬프트 엔지니어링에 대해서 살펴보자....
Ollama - Llama 3 한글 모델 테스트
여기에서는 Llama3 8b 를 기본 모델로 하여 한글 프리트레이닝된 모델을 ollama를 이용해서 로컬 PC에서 실행 및 테스트 해보려 한다. 특정 도메인에서는 온-프레미스에 오픈소스 LLM을 실행하고 RAG 등을 이용해서 비용효율적인 시스템을 구성하기를 원할 것이다. 이런 목적으로 사용 할 수 있을지 검토하는게 목적이다....
Llama3와 cromadb를 이용한 RAG 개념 검증
RAG(Retrieval Augmented Generation) 은 생성 기반 모델과 검색 기반 모델의 장점을 결합하여 고품질의 응답을 생성하는 기술이다. RAG의 주요 목표는 전문 도메인 정보를 기반으로 기존의 LLM이 응답하기 힘든 고품질의 텍스트 응답을 생성하는 것이다....
Joinc와 함께하는 LLM - LangChain & OpenAI 기반 RAG 구성
LangChain과 OpenAI API를 사용해서 RAG 시스템을 구현해 볼 것이다. 이 문서의 내용을 따라하기 위해서는 OpenAI API를 가지고 있어야 하며, Python을 사용할 줄 알아야 한다....
Joinc와 함께하는 LLM - LangChain을 이용한 RAG
LangChain은 자연어 처리(NLP)와 관련된 애플리케이션을 개발하기 위한 파이썬 기반의 프레임워크다. 특히 GPT-3, GPT-4등의 언어 모델을 활용하여 자연어 기반으로 다양한 작업을 수행 할 수 있다. 이 문서에서는 LangChain의 특징과 사용 사례를 소개한다....
Joinc와 함께하는 LLM - vector embedding 기본
벡터 임베딩(vector embedding)는 NLP, 추천 및 검색 알고리즘의 핵심 개념으로 최근 기계학습, LLM 에 널리 채택되고 있습니다. LLM의 이해와 활용을 위해서 벡터 임베딩에 대한 기본적인 내용을 살펴보려 합니다....
Joinc와 함께하는 LLM - 개인 PC에 LLM 환경 구축하기
대규모 언어 모델(LLM)을 하기 위해서는 많은 비용이 들어간다. 이는 LLM 학습의 장애물이 되기도 하는데, ollama를 이용하면 개인 PC에서 간단하게 LLM 모델을 돌려볼 수 있다. ollama를 이용해서 메타의 최신 언어모델인 LLama3를 실행해보자....