본문 바로가기

LLM

(2)
Azure OpenAI - GPT-4o Playground 사용하기 지난 5월 13일 OpenAI에서 오디오, 비전, 텍스트를 실시간으로 추론할 수 있는 새로운 플래그쉽 모델인 GPT-4o('o' 혹은 'omni')를 공개했습니다.  GPT-4o의 주요 특징은 다음과 같습니다. 다양한 입력 및 출력 형식 GPT-4o는 텍스트, 오디오, 이미지, 비디오의 조합을 입력으로 받아들일 수 있으며, 텍스트, 오디오, 이미지 출력을 생성할 수 있습니다. 오디오 입력에 대한 응답 속도는 최저 232 밀리초, 평균 320 밀리초로, 인간의 대화 응답 시간과 유사합니다. 성능 및 비용 효율성 GPT-4o는 텍스트 처리 성능에서 GPT-4 Turbo와 동등한 수준을 유지하면서도, 비영어 텍스트 처리 성능이 크게 향상되었습니다. 또한, API 사용 시 속도가 두 배 빠르고 비용이 50% 저..
Retrieval-Augmented Generation(RAG) - Part 1 Today Keys : rag, retrieval, augmented, generation, llm, vector, chunk, prompt, langchain, hallucination, mydata 이번 포스팅에서는 사용자의 질문에 대해서 LLM에서 추가 학습 없이 내부 데이터를 이용하여 답변을 생성하여, LLM의 환각(Hallucination)을 줄이는 데 유용한 RAG(Retrieval-Augmented Generation) 아키텍처에 대한 첫 번 째 포스팅입니다. 이번 포스팅에서는 Azure OpenAI와 Cognitive Search를 이용해서 간단한 RAG 아키텍처를 만들어 봅니다. 각 섹션에 사용된 코드는 해당 섹션 하단에 링크에서 확인 가능합니다. 첫 번째 포스팅에서는 기본적인 환경을 구..