KT 클라우드
2026-06-05 · 30일 전
[Tech Series] kt cloud AI 검색 증강 생성(RAG) #5 : 검색 고도화(Retrieval Optimization)와 리랭킹(Re-ranking) 기술
[ kt cloud 마케팅커뮤니케이션팀 김지웅 님 ] 요약 이 글에서는 RAG 시스템의 검색 고도화와 리랭킹을 활용한 실무형 검색 파이프라인 설계를 다룹니다. 정확한 근거 문서 확보가 답변 품질과 운영 안정성을 좌우한다는 점을 정리합니다. #RAG #검색고도화 #하이브리드검색 #리랭킹 #AdaptiveRetrieval 들어가며 안녕하세요! kt cloud 테크 마케터 김지웅입니다. ♂️ 지난 1~4편의 연재를 통해 문서를 벡터로 변환하고 빠르
AI/MLRAGSearch
우아한 형제들
2026-05-22 · 약 1개월 전
우아한공방의 새로운 동료, 시스템 맥락을 가진 챗봇서비스 개발기(feat. RAG)
AI로 생성한 이미지 들어가며 디자인시스템플랫폼팀은 코어(Core, 토큰/아이콘 과 같은 디자인 리소스, 베이스 컴포넌트 등 공통 기반을 정의하는 계층), 클레이(Clay, 코어 토큰을 기반으로 Base 컴포넌트에 테마를 적용해 사용 가능한 컴포넌트 라이브러리를 제공하는 계층), 몰드(Mold, Clay/Base컴포넌트를 기반으로 각 도메인/비즈니스 요구사항에 맞는 패턴을 라이브러리화한 계층)와 같은 계층 구조를 기반으로, 모든 플랫폼에서 일관
AI AgentDesign SystemFrontendMobileRAG
AI에게 도메인을 가르치다 두 번 갈아엎은 이야기 — LLM Wiki + RAG 혼합기
도메인 지식을 LLM에게 먹이는 방법 — Inverted Index, 본문 임베딩, 요약 임베딩+FTS 세 가지 시도와 두 번의 갈아엎기
AI/MLLLMRAG
Aurora PostgreSQL에서 한국어 하이브리드 검색 구현하기: pg_bigm + pgvector로 만드는 한국어 특화 RAG
한국어는 교착어 특성상 영어 기반 벡터 검색만으로는 정확한 결과를 얻기 어렵습니다. 이 블로그에서는 Amazon Aurora PostgreSQL에서 pg_bigm(바이그램 키워드 검색)과 pgvector(벡터 시맨틱 검색)를 RRF(Reciprocal Rank Fusion)로 결합한 하이브리드 검색을 구현하여, 한국어 RAG 애플리케이션의 검색 품질을 개선하는 방법을 소개합니다. 왜 한국어에는 하이브리드 검색이 필요한가? RAG(Retrieva
BackendData EngineeringPostgreSQLRAGSearch
ODW #5: 벡터 DB와 에이전트 스킬로 RAG 시스템 만들기
안녕하세요! 모바일 개발자 경험 팀의 @giginet입니다. 평소에는 LINE iOS 앱을 중심으로 빌드 시스템과 개발 환경을 정비하고, 개발자 경험을 향상하기 위한 업무를 하고 ...
AI AgentBackendMobileRAGiOS
GraphRAG Toolkit으로 지식 그래프 인덱싱하기
기존의 RAG(Retrieval-Augmented Generation) 방식은 주로 ‘벡터 유사성 검색’에 의존합니다. 하지만 이 방식은 단순히 질문과 언어적으로 유사한 정보만 찾기 때문에, 데이터 간의 복잡한 구조적 관계나 숨겨진 맥락을 놓칠 수 있다는 한계가 있습니다. 지식 그래프(Knowledge Graph)는 이러한 한계를 보완합니다. 데이터를 개체(Entity)와 관계(Relation) 중심으로 연결하여, 질문과 직접적인 단어 유사성이
AI/MLData AnalysisGraphQLRAGSearch
Google for Developers
2026-05-01 · 2개월 전
Gemini Embedding 2 등 5월 첫째 주 Google for Developers 위클리 업데이트를 지금 확인하세요!
개발자 여러분, 안녕하세요!5월 첫째 주 블로그에 발표된 Google의 주요 개발자 제품별 최신 소식을 살펴보세요.[주요 개발자 블로그 업데이트]AI & Machine LearningGemini Embedding 2로 개발하기: 에이전틱 멀티모달 RAG와 확장 사례 (Building with Gemini Embedding 2: Agentic multimodal RAG and beyond) Google DeepMind와 과학기술정보통신부, 국가
AI/MLDevOpsMLOpsRAGTools
LLM의 환각을 잠재울 지식의 지도, ‘온톨로지(Ontology)’
최근 대형 언어 모델(LLM)을 실제 서비스에 도입하려는 기업들의 가장 큰 고민은 ‘환각(Hallucination)’ 현상입니다. 이를 해결하기 위해 외부 데이터를 참조하는 RAG(검색 증강 생성) 기술이 표준처럼 자리 잡았습니다. 하지만 단순한 문서 검색만으로는 복잡한 추론이나 정확한 관계 파악에 한계가 있습니다. 이러한 RAG의 한계를 돌파하고, AI에게 인간 수준의 논리적이고 구조화된 지식을 제공하기 위해 다시금 주목받고 있는 개념이 바로
AI/MLLLMRAG
Amazon Aurora PostgreSQL에서 pgvector 0.8.0을 통한 벡터 검색 성능 및 관련성 향상
이 글은 AWS Database Blog에 게시된 Supercharging vector search performance and relevance with pgvector 0.8.0 on Amazon Aurora PostgreSQL by Shayon Sanyal을 한국어 번역 및 편집하였습니다. 효율적인 벡터 유사성 검색은 시맨틱 검색, 추천 시스템, 그리고 검색 증강 생성(RAG) 구현에 있어 핵심 구성 요소가 되었습니다. Amazon Aur
AWSDatabasePostgreSQLRAGSearch
RAG 기반 AI 서비스의 신뢰성을 확보하는 방법: 자동화 평가 체계 및 운영 최적화
RAG 신뢰성 위기와 LLMOps의 필연성 RAG(Retrieval-Augmented Generation)는 기업용 AI 시스템에서 사실상 표준 구조로 자리 잡은 듯 보입니다. 외부 지식을 활용해 최신 정보를 반영할 수 있다는 점은 분명한 강점입니다. 그러나 동시에 새로운 과제도 함께 드러나고 있습니다. 검색 시스템의 불완전성과 LLM의 확률적 생성 방식이 결합되면서 결과의 품질을 일관되게 통제하기가 쉽지 않을 수 있기 때문입니다. 특히 금융이
AI/MLLLMMLOpsPerformanceRAG
Neptune GraphRAG Toolkit을 활용하여 정교한 비정형 데이터 검색하기
본 게시글은 AWS Database Blog에 게시된 ‘Introducing the GraphRAG Toolkit by Ian Robinson and Abdellah Ghassel’을 한국어 번역 및 편집하였습니다. Amazon Neptune이 그래프 기반 검색 증강 생성(RAG, Retrieval-Augmented Generation) 워크플로를 누구나 더 쉽게 구축할 수 있도록, Neptune 기반의 오픈 소스 Python 라이브러리 Gra
AWSData EngineeringPythonRAGSearch
금융 보안 퀴즈, AI에게 풀게 해봤습니다: 2025 금융 AI Challenge 우수상 후기
카카오뱅크의 LostCow 팀이 금융보안원에서 주관한 ‘2025 금융 AI Challenge’에서 우수상을 수상했습니다. 이번 글에서는 모델 선정 → 데이터 전처리 → 도메인 학습 → RAG → 양자화 및 추론 최적화까지, 4주라는 짧은 시간 동안 수많은 제약 조건 속에서 어떻게 우수상까지 거머쥘 수 있었는지에 대한 모델 개발 일련의 과정을 다룹니다.
AI/MLData AnalysisPythonRAGSecurity
우아한 형제들
2026-03-10 · 4개월 전
RAG, 들어는 봤는데… 내 서비스엔 어떻게 쓰지?
개요 RAG(Retrieval-Augmented Generation, 검색 증강 생성)은 LLM이 학습하지 못한 정보를 외부에서 검색하여 활용할 수 있게 하는 기술입니다. 이 글에서는 RAG이 왜 필요한지부터, 교육 운영 시스템에 실제로 적용하며 겪은 시행착오(MCP 활용 → RAG 서버 직접 구현)와 그 과정에서 정리한 6단계 구현 가이드(필요성 평가 → 요구사항 분석 → 프레임워크 결정 → 색인 → 생성 → 평가)를 다룹니다. […] The
AI/MLBackendData EngineeringPythonRAG
삼성 기술 블로그
2026-02-12 · 5개월 전
Agentic Search 시스템 구축기: 사내 검색 환경을 재정의하기 위해 우리가 선택한 것들
삼성전자 사내 지식 검색을 위해 다양한 RAG 실험 끝에 Agentic Search구조를 선택하게 된 이유와 이를 구현하기 위해 설계 시 고려한 점에 대한 경험을 공유합니다. Agent Flow, Tool 설계, Runtime환경까지 실제 구축 과정에서 중요했던 설계 포인트를 정리해보았습니다.
AI/MLBackendData EngineeringRAGSearch
삼성 기술 블로그
2026-02-10 · 5개월 전
RAG의 진화: 검색을 넘어, 나를 이해하는 ‘Personal Context’의 시대로
RAG 기술이 단순 검색을 넘어서 사용자의 파편화된 개인 데이터와 실시간 컨텍스트를 통합하는 Personal Context RAG로 진화하고 있음을 설명합니다. 또한 이를 실현하기 위해 온디바이스 중심의 하이브리드 아키텍처, 개인화된 지식 그래프, 개인정보 보호 기술이 필수적으로 요구된다는 점을 알아봅니다.
AI/MLArchitectureData EngineeringRAGSecurity
이 서비스만 고치면 되겠지? AI가 놓치는 숨은 의존성을 추적하는 법
그래프 RAG 기반 채널 지식 시스템 구축기
AI/MLData EngineeringRAG
"알아서 정확하게 응답줬으면.." RAG부터 에이전트까지 사내 AI 챗봇 구축기 2부
안녕하세요! 백엔드 엔지니어 장예훈입니다. 작년 9월 포스타입에 새로 합류한 뒤 벌써 5개월이 흘렀네요. 팀블로그를 통해 인사드리는 건 이번이 처음인 것 같습니다. 저번 편에서는 코어 파트 안선님께서 RAG의 개념과 검색 전략, CI/CD 연동 방법에 대해 설명해 주셨습니다. 이번 편에서는 실제 RAG 기반 슬랙 봇 구축 과정과 의사결정, 그리고 에이전트 마이그레이션 경험을 공유해 드리려고 합니다. 최초 구현 - RAG를 통한 단순 질의-응답
AI AgentBackendCI/CDDevOpsRAG
"스펙 문서에 없는데요?" 최신 스펙 갱신을 위한 사내 AI 챗봇 도입기 1부
안녕하세요. 포스타입 백엔드 엔지니어 김안선입니다. 최근 포스타입 기술그룹에서는 사내 구성원들을 위한 챗봇을 구축했습니다. 단순히 FAQ를 나열하는 수준을 넘어 백엔드 시스템의 복잡한 동작 원리를 이해하고 설명할 수 있는 어시스턴트를 목표로 했는데요. 이를 가능하게 한 RAG(Retrieval-Augmented Generation) 구축기를 공유하고자 합니다. 포스타입의 비즈니스 로직은 마치 정교한 시계 장치와도 같습니다. 결제, 크리에이터 수
AI AgentBackendData EngineeringDevOpsRAG