야놀자의 Strands SDK와 Bedrock AgentCore를 활용한 AIOps Agent 구축 사례
현대 기업의 인프라 운영 환경은 점점 더 복잡해지고 있습니다. 클라우드 네이티브 아키텍처의 확산과 마이크로서비스 기반 애플리케이션의 증가로 인해 운영팀은 수많은 반복적인 작업과 장애 대응에 시달리고 있습니다. 야놀자는 이러한 운영 과제를 해결하기 위해 Amazon Bedrock AgentCore를 활용한 AIOps Agent 구축 프로젝트를 진행했습니다. 이 글에서는 야놀자가 6개 팀, 14명의 엔지니어와 함께 6주간 AWS와 협력하여 어떻게
ArchitectureDevOpsInfra
전체 읽기 →Config의 Amazon EKS Spot 기반 대규모 RFM 데이터 파이프라인 구축
소개 Config는 General-Purpose Robot Foundation Model을 실현하기 위한 데이터 인프라와 기술을 구축하는 기업입니다. 다양한 실제 환경에서 로봇이 양손 조작 작업을 안정적으로 수행할 수 있도록, 대규모 학습 데이터의 수집부터 전처리, 모델 학습, 실환경 검증까지 이어지는 end-to-end 파이프라인을 운영하고 있습니다. 현재까지 약 10만 시간 규모의 액션 데이터를 구축했으며, 월 약 2만 시간의 데이터를 지속
AI/MLBackendDevOpsInfra
전체 읽기 →AWS에서 데이터 거버넌스 구현하기: 자동화, 태깅 및 라이프사이클 전략 – 1부
이 글은 AWS Database Blog에 게시된 Implementing data governance on AWS: Automation, tagging, and lifecycle strategy – Part 1 by Omar Ahmed, Paige Broderick, Changil Jeong, and Omar Mahmoud을 한국어 번역 및 편집하였습니다. 생성형 AI와 머신러닝 워크로드는 방대한 양의 데이터를 만들어냅니다. 조직은 이러한 데이
AI/MLDatabaseInfra
전체 읽기 →여기어때 이벤트 기반 통합 알림 플랫폼 구축기 Part 1. Why?
BackendInfraTools
전체 읽기 →삼성 기술 블로그
2026-04-02 · 3개월 전
AI-Native RAN: 기지국 최적화의 패러다임을 바꾸는 Network Foundation Model
현대 이동통신 네트워크는 초고속, 초저지연을 지향하는 6G를 향해 급격히 진화하고 있습니다. 그러나 네트워크 고도화는 필연적으로 운영 복잡도의 폭발적 증가를 야기합니다. 삼성리서치는 이러한 난제를 해결하기 위해 AI를 RAN(Radio Access Network)의 핵심부로 이식한 ‘AI for RAN’ 기술을 선보였습니다. 단순한 자동화를 넘어 전문가의 통찰과 데이터를 결합한 삼성의 지능형 최적화 솔루션을 소개합니다.
AI/MLBackendInfra
전체 읽기 →분산 트레이닝 관점에서의 AWS 인터커넥트 기술 소개 – AWS는 왜 인터커넥트 기술로 EFA를 사용하는가?
2025년 하반기부터 AWS에서 GPU 기반 분산 트레이닝 환경을 구축하는 고객이 급증하고 있습니다. 그럼에도 불구하고 많은 고객분들이 기존에 온프레미스 환경에서 사용되는 대표적인 인터커넥트 기술인 인피니밴드(Infiniband)와 AWS의 인터커넥트 기술의 차이점에 대해 명확히 이해하지 못하는 상황을 지켜보면서 이 블로그를 작성하게 되었습니다. 이번 블로그 시리즈에서는 AWS 클라우드 환경에서 분산 트레이닝 환경을 구축하고 운영하는데 필수적인
AI/MLBackendInfra
전체 읽기 →NVIDIA와 함께 AWS에서 자율주행 3.0을 위한 End-to-End Physical AI 데이터 파이프라인 구축하기
본 블로그는 Olivier Sutter, Geoff Van Natter, Mikhail Yurasov, Amrith Prabhu, Steven DeVries, Wonsik Han이 작성한 Building an End-to-End Physical AI Data Pipeline for Autonomous Vehicle 3.0 on AWS with NVIDIA를 번역, 편집하였으며, 이해를 돕기 위해 Note를 추가했습니다. 도입 자율주행(AV) 개
AI/MLBackendInfra
전체 읽기 →클라우드 환경에서의 비디오 인텔리전스 구현: TwelveLabs로 시작하는 AI 영상 분석 1부 – VoD환경에서의 비디오 분석 파이프라인 구축하기
소개 미디어, 광고, 교육 산업에서 비디오 콘텐츠는 폭발적으로 증가하고 있습니다. Cisco의 예측에 따르면 2022년 기준으로만 전체 인터넷 트래픽의 82%가 비디오가 될 것이라고 전망하였습니다.[1] 하지만 이 방대한 영상 자산에서 원하는 장면을 찾고, 콘텐츠를 분류하고, 인사이트를 추출하는 것은 여전히 어려운 과제입니다. 기존의 비디오 검색은 수동으로 입력한 메타데이터나 파일명에 의존했습니다. “2024년 마케팅 캠페인 영상”이라는 제목만
AI/MLBackendInfra
전체 읽기 →클라우드 환경에서의 비디오 인텔리전스 구현: TwelveLabs로 시작하는 AI 영상 분석 2부 – 준실시간 환경에서 AWS 미디어 서비스를 활용한 분석 파이프라인 구축하기
소개 지난 1부에서는 ‘클라우드 환경에서의 비디오 인텔리전스 구현: TwelveLabs로 시작하는 AI 영상 분석 1부 – VoD환경에서의 비디오 분석 파이프라인 구축하기’라는 주제를 다루었습니다. 2부에서는 영상의 분석과 의사결정이 빠르게 요구되는 환경에서 준실시간으로 비디오 분석 파이프라인을 구축하는 방안에 대해 다루겠습니다. 영상 데이터는 초 단위로 쌓이지만, 그 안에서 의미 있는 이벤트를 찾아내는 일은 여전히 쉽지 않습니다. 기존의 감시
AI/MLBackendInfra
전체 읽기 →클라우드 환경에서의 비디오 인텔리전스 구현 : TwelveLabs로 시작하는 AI 영상 분석 5부 – 비디오 임베딩을 위한 Vector DB 비교
배경 이 블로그 시리즈에서는 TwelveLabs의 비디오 인텔리전스 기술을 AWS 클라우드 환경에서 활용하는 방법을 단계별로 살펴봤습니다. 1편과 2편에서는 VoD 및 준실시간 환경에서의 비디오 분석 파이프라인을 구축했고, 3편에서는 Strands Agent를 활용한 Agentic video engine을 구현했습니다. 그리고 4편에서는 Amazon Bedrock에서 제공하는 TwelveLabs Marengo 3.0의 멀티모달 임베딩 전략과 검
AI/MLBackendDatabaseInfra
전체 읽기 →클라우드 환경에서의 비디오 인텔리전스 구현: TwelveLabs로 시작하는 AI 영상 분석 4부 – TwelveLabs Marengo 3.0 임베딩 및 검색 전략과 구현 가이드
배경 비디오는 단순한 단일 데이터 스트림이 아닙니다. 시간 축을 따라 visual(화면 시각 정보), audio(소리 이벤트), speech/transcription(대화 내용)이 동시에 공존하는 복합 매체입니다. 따라서 비디오 검색 쿼리는 “완전히 시각적”이거나 “완전히 전사(transcription)”인 경우가 드뭅니다. 예를 들어, “Q3 세일즈 장표를 발표하는 여성의 모습”이라는 쿼리는 시각 정보, 대화 내용, 그리고 오디오 정보를 모두
AI/MLBackendInfraTools
전체 읽기 →클라우드 환경에서의 비디오 인텔리전스 구현: TwelveLabs로 시작하는 AI 영상 분석 3부 – Strands Agent를 활용한 Agentic video engine구현
소개 지난 1부에서는 VoD 환경에서의 비디오 분석 파이프라인 구축을, 2부에서는 AWS 미디어 서비스를 활용한 준실시간 분석 파이프라인을 다루었습니다. 이번 3부에서는 한 단계 더 나아가, AI 에이전트가 스스로 판단하고 도구를 선택하여 영상을 분석하는 에이전틱(Agentic) 비디오 엔진을 구축하는 방법을 소개합니다. 기존 1부와 2부의 파이프라인은 미리 정해진 순서대로 영상을 임베딩하고 검색하는 고정된 워크플로 방식이었습니다. 하지만 실제
AI/MLBackendInfraTools
전체 읽기 →엠넷플러스 실시간 글로벌 투표 시스템 아키텍처 개선 사례
소개 엠넷플러스(Mnet Plus)는 CJ ENM이 운영하는 글로벌 K-POP 콘텐츠 플랫폼으로, 론칭 3년 만에 글로벌 누적 가입자 수 4,500만 명, 최대 월간 활성 이용자 수(MAU) 2,000만 명을 돌파하며 빠르게 성장하고 있습니다. MAMA AWARDS, KCON, 보이즈 2 플래닛 등 다양한 Mnet 콘텐츠는 물론, 숨바꼭질, 온더맵 등 엠넷플러스 오리지널 콘텐츠까지 아우르며 글로벌 팬들에게 라이브 스트리밍과 VOD 서비스를 제공
ArchitectureBackendInfra
전체 읽기 →Agent 로 최적화 하는 EKS 운영: AWS DevOps Agent + K8s Operator로 MTTR 줄이기
Amazon Elastic Kubernetes Service(Amazon EKS) 환경에서 워크로드를 운영하다 보면, Pod의 OOMKilled 종료나 IP 고갈로 인한 생성 실패 등 다양한 장애 상황에 직면하게 됩니다. 이러한 장애가 발생하면 엔지니어는 Pod 로그 수집부터 Kubernetes Events 추적, 노드 시스템 로그 확인까지 반복적이고 시간 소모적인 트러블슈팅 과정을 거쳐야 합니다. 특히 야간이나 주말에는 대응 시간이 길어지고,
BackendDevOpsInfra
전체 읽기 →지능형 Physical AI 구축: Strands Agents, Bedrock AgentCore, Claude 4.6, NVIDIA GR00T, Hugging Face LeRobot으로 엣지에서 클라우드까지
이 글은 AWS Open Source Blog의 “Building intelligent physical AI: From edge to cloud with Strands Agents, Bedrock AgentCore, Claude 4.5, NVIDIA GR00T, and Hugging Face LeRobot by Arron Bailiss” 게시글을 번역한 글 입니다. 에이전틱 AI 시스템은 디지털 세계를 넘어 물리적 세계로 빠르게 확장되고 있으며
AI/MLArchitectureInfra
전체 읽기 →SRE 팀의 반복 작업을 10분의 1로 줄인 SRE 봇 개발기
들어가며: 늘어나는 서비스, 새로운 인프라, 끝없는 문의여러분의 팀은 하루에 몇 번이나 같은 질문에 답하고, 같은 작업을 반복하고 계신가요?LINE Home DevOps 팀은 최근...
DevOpsInfraTools
전체 읽기 →신뢰성 향상을 위한 SLI/SLO 활용 1편 - SLI/SLO 프레임워크 및 서비스 상태 확인 도구 LINE Status 개발기
시작하며안녕하세요. SRE(Site Reliability Engineer)로 일하고 있는 어다희입니다. 저희 팀은 Media Platform SRE를 비롯해 글로벌 트래픽 관리 업...
DevOpsInfraSecurity
전체 읽기 →올영매장은 MSA 환경에서 흩어진 도메인 데이터를 어떻게 연동했을까?
안녕하세요. 올리브영 온라인몰의 O2O(Online to Offline) 서비스를 담당하고 있는 너굴입니다. 👋 올리브영은 온라인과 오프라인의 경계를 허물고, 고객에게 유기적이고 심리스한 O2O…
ArchitectureBackendInfra
전체 읽기 →AWS에서 NVIDIA Cosmos 월드 파운데이션 모델 실행하기
본 게시글은 “Running NVIDIA Cosmos world foundation models on AWS by Abhishek Srivastav, Brett Hamilton, Diego Garzon, Jathavan Sriram, and Shaun Kirby“를 번역한 글입니다. 자율주행 차량, 로봇공학, 스마트 팩토리를 위한 Physical AI 시스템을 개발하고 있다면, 충분한 양의 고품질 학습 데이터를 확보하는 것이 핵심 과제일 것입니
AI/MLBackendInfra
전체 읽기 →중앙 집중식 및 분산형 비밀 관리 방식 알아보기
이 글은 AWS Security 블로그에게시된 글 (Exploring common centralized and decentralized approaches to secrets management)을 한국어로 번역 및 편집하였습니다. Amazon Web Services (AWS)의 비밀 관리 전략에 관한 흔한 질문 중 하나는 조직이 비밀을 중앙 집중화해야 하는지입니다. 이 질문은 비밀을 중앙에 저장해야 하는지에 초점을 맞추는 경우가 많지만, 비밀
DevOpsInfraSecurity
전체 읽기 →