롯데온
2026-06-04 · 28일 전
한국 기업 기술 블로그의 Infra 관련 글 323개
롯데온
2026-06-04 · 28일 전
AWS
2026-06-04 · 29일 전
AWS Unified Operations를 통한 대규모 핵심 워크로드의 복원력 확보 – 고가용성, 빠른 마이그레이션, 신속한 인시던트 해결을 위한 AWS 최고 등급 지원 Shift-Left 패러다임: 사후 대응에서 사전 예방으로 주요 핵심 워크로드를 운영하는 조직들은 복원력을 약화시키고, 클라우드 도입을 늦추는 세 가지 중요한 구조적 문제점에 직면해 있습니다. 첫 번째 약점은 역량 부족(Skills gaps)입니다. 클라우드 네이티브 아키텍처
AWS
2026-06-04 · 29일 전
AWS Unified Operations를 통한 대규모 핵심 워크로드의 복원력 확보 – 고가용성, 빠른 마이그레이션, 신속한 인시던트 해결을 위한 AWS 최고 등급 지원 Shift-Left 패러다임: 사후 대응에서 사전 예방으로 주요 핵심 워크로드를 운영하는 조직들은 복원력을 약화시키고, 클라우드 도입을 늦추는 세 가지 중요한 구조적 문제점에 직면해 있습니다. 첫 번째 약점은 역량 부족(Skills gaps)입니다. 클라우드 네이티브 아키텍처
AWS
2026-06-02 · 약 1개월 전
1. HYBE 인프라운영팀 소개 하이브(HYBE)는 글로벌 엔터테인먼트 기업으로, 사내 시스템부터 B2C 서비스까지 다양한 워크로드를 AWS 위에서 운영하고 있습니다. 인프라운영팀은 다중 AWS 계정과 EKS 클러스터에 걸쳐 다수의 서비스를 효율적인 인력 구성으로 운영합니다. 모니터링은 Datadog, 소스 코드는 GitLab, 이슈 관리는 Jira를 사용하고 있습니다. 2. 개요 새벽 3시, Slack 알림과 함께 온콜 담당자의 전화가 울립니
AWS
2026-05-28 · 약 1개월 전
대규모 분산 훈련에서 GPU 간 통신 성능은 전체 훈련 효율을 좌우하는 핵심 요소입니다. 수백 대의 GPU가 그래디언트(gradient, 모델이 실수를 고치는 방향 지시서)를 주고받아야 하는 환경에서, 데이터가 GPU 메모리에서 네트워크를 거쳐 원격 노드의 GPU 메모리에 도달하기까지의 경로를 얼마나 효율적으로 설계하느냐가 곧 성능의 차이로 이어집니다. 이번 블로그는 이 시리즈의 마지막 편으로, AWS 인스턴스에서 활용되는 GPU 간 고속 […
AWS
2026-05-27 · 약 1개월 전
이 글은 AWS Database Blog의 “Building agentic AI for Amazon RDS for SQL Server with Strands and AgentCore” by Sudhir Amin 게시글을 번역한 글입니다. Amazon Relational Database Service (Amazon RDS) for SQL Server 인스턴스를 관리한다면, 수년에 걸쳐 진단 스크립트들을 축적했을 것입니다. 이 스크립트들은 bloc
AWS
2026-05-26 · 약 1개월 전
최근 많은 기업들이 자체 LLM을 구축하거나, 오픈소스 sLLM(Small Large Language Model)을 활용하여 설치형 LLM서비스를 구성하려는 수요가 크게 증가하고 있습니다. 그런데 실제로 배포하려는 모델을 살펴보면, Llama 3 70B, Qwen 72B, EXAONE 3.5 32B 등 모델을 GPU에 로드할 때 필요한 메모리가 40GB에서 최대 150GB에 달하는 경우가 많아, GPU 메모리가 80GB인 H100/H200이 탑
농심클라우드
2026-05-26 · 약 1개월 전
Amazon OpenSearch는 키워드와 벡터 검색을 넘어, AI 에이전트가 문맥을 이해하고 탐색하는 에이전틱 검색 플랫폼으로 진화하고 있습니다. 이번 글에서는 주요 신기능과 차세대 검색 구조를 살펴봅니다. The post [AWS Summit Seoul 2026] 나야, 차세대 OpenSearch: 에이전틱 AI를 곁들인 appeared first on NDS Cloud Tech Blog.
AWS
2026-05-22 · 약 1개월 전
이 글은 현대오토에버의 GenAI Sandbox 활용 생산성 향상 해커톤 시리즈의 세번째 글이며, 현대오토에버의 오명우, 정세종님과 함께 작성하였습니다. 첫 번째 글에서는 현대오토에버와 AWS가 GenAI Sandbox를 활용해 어떻게 생산성 향상 해커톤을 기획하고 운영했는지, 그리고 14개 팀 150여 명이 참여한 이 행사의 전반적인 성과를 소개 했습니다. 두 번째 글에서는 Amazon Bedrock과 LangGraph를 활용해 어떻게 다중
삼성 기술 블로그
2026-05-21 · 약 1개월 전
이 글은 모든 비트를 완벽하게 지키는 것보다 사람이 자연스럽게 듣고 이해할 수 있도록 하는 것에 집중하는 오디오 전송 방식을 다룹니다. 이를 위해 AI를 활용하여 압축과 전송을 하나로 설계한 JSCM 기반 오디오 전송 방식을 소개하고, 시뮬레이션과 하드웨어 실험을 통해 입증된 성능 우위를 공유합니다. 검증 결과, 제안 방식은 기존 대비 열악한 무선 환경에서도 대등한 음질을 유지했으며, 이는 향후 6G 시스템이 사용자의 경험과 인지를 더 잘 반영
AWS
2026-05-19 · 약 1개월 전
본 글은 씨미(ci-me) 라이브 스트리밍 플랫폼이 4K 저지연 라이브 시청 경험을 제공하기 위해 Amazon IVS의 매니지드 환경과 자체 구축 영역을 어떻게 결합했는지에 대한 사례입니다. 또한 1만 명 동시 시청자를 가정한 부하 테스트 과정에서 마주친 기술적 의사결정과 시행착오가 함께 공유됩니다. 1. 배경 씨미(CIME)는 버추얼 스트리머와 게임 스트리머를 위한 라이브 스티리밍 플랫폼입니다. 4K 초고화질, 초저지연 방송 환경, […]
AWS
2026-05-18 · 약 2개월 전
뉴빌리티는 일상 속 로봇 기술을 지향하며, 로봇 하드웨어·소프트웨어·운영 시스템을 통합 제공하는 Physical AI 기반 RX 솔루션 기업입니다. 배달과 순찰 등 실제 서비스 환경에서 로봇 서비스를 운영해 왔으며, 로봇 도입부터 운영까지 전 과정을 하나의 시스템으로 연결해 상용화하고 있습니다. 2017년 설립 이후 다양한 로봇 서비스 실증을 운영해 온 뉴빌리티는 2024년 요기요와 함께 로봇 배달 서비스를 상용화했고, 순찰 […]
AWS
2026-05-15 · 약 2개월 전
이 글은 AWS Artificial Intelligence Blog에 게시된 Introducing Claude Platform on AWS: Anthropic’s native platform, through your AWS account 를 한국어로 번역 및 편집하였습니다. 오늘(미국 현지 시간 5월 11일에 공식 GA) 우리는 Claude Platform on AWS의 일반 가용성을 발표하게 되어 기쁩니다. Claude Platform on
당근마켓
2026-05-14 · 약 2개월 전
AWS
2026-05-13 · 약 2개월 전
게임의 인기가 빠르게 확산될 때 처음부터 성공을 위한 준비가 되어 있는 것이 중요합니다. 이 블로그 글은 Amazon GameLift Servers에서 멀티플레이어 게임을 출시할 때 고려해야 할 중요한 영역들을 다룹니다. 게임 출시 2-3개월 전에 필요한 활동들에 중점을 둘 것입니다. 이는 게임의 완전한 공개 출시일 수도 있지만, 오픈 베타, 얼리 액세스 또는 실제 플레이어가 있는 기타 이벤트들을 의미할 수도 […]
AWS
2026-05-13 · 약 2개월 전
멀티플레이어 게임을 개발하고 있다면, 전 세계적으로 게임 서버 플릿을 효율적으로 호스팅하고 확장하며 모니터링하는 방법을 찾고 계실 것입니다. 또한 최고의 플레이어 경험을 위해 플레이어와 가까운 최적의 위치의 게임 서버 플릿에 게임 세션을 효율적으로 배치하는 방법에 대해서도 고민하고 있을 것입니다. 게임 세션을 위해 필요한 인프라를 처음부터 구축하는 것은 부담스러울 수 있습니다. Amazon GameLift Servers는 글로벌 게임 서버 호스
AWS
2026-05-13 · 약 2개월 전
딜라이트룸은 글로벌 누적 다운로드 1억 건을 돌파한 수면·기상 솔루션 Alarmy와 B2B 광고 수익화 플랫폼 DARO를 운영하고 있습니다. 최근에는 앱 인수를 통해 사업 영역을 확장하고 있습니다. 2025년 매출 460억 원, 영업이익 200억 원을 기록한 딜라이트룸은 매출 대부분이 해외에서 발생하는 글로벌 중심 기업입니다. Figure 1: 딜라이트룸 소개 앱 인수를 통한 사업 확장은 곧 인프라의 확장을 의미합니다. 새로운 […]
AWS
2026-05-12 · 약 2개월 전
지난 블로그에서는 ENI(Elastic Network Interface)의 구조와 역할, 그리고 p5.48xlarge와 p6-b300 인스턴스에서 EFA(Elastic Fabric Adapter)를 실제로 어떻게 구성하는지 살펴보았습니다. 이번 블로그에서는 이렇게 구성된 EFA 네트워크 위에서 실제 GPU 간 통신이 어떻게 이루어지는지, 그 핵심에 있는 NCCL(NVIDIA Collective Communications Library) 통신에
AWS
2026-05-11 · 약 2개월 전
서론 많은 기업이 LLM 기반 에이전틱 워크플로우를 실제 업무에 투입하고 있습니다. 그러나 프로덕션 규모로 확대하면 단일 거대 LLM에 모든 호출을 의존하는 방식의 한계가 드러납니다. 에이전트 내부에서 발생하는 도구 분류·요약·포맷팅 등 매 단계마다 동일한 토큰 과금이 누적되고, 거대 모델의 긴 응답 지연(TTFT)은 실시간 대화에 부적합합니다. 요금 계산이나 약관 검증처럼 정확성이 요구되는 업무에서 환각(hallucination)은 비즈니스
AWS
2026-05-07 · 약 2개월 전
들어가며 “우리 서비스에 어떤 EC2 인스턴스 타입을 써야 할까?” 클라우드 인프라를 운영하는 엔지니어라면 누구나 한 번쯤 마주치는 질문입니다. Amazon EC2는 700개가 넘는 인스턴스 타입을 제공하며, 각각 CPU 아키텍처와 세대, 메모리/네트워크 구성이 다릅니다. 스펙 시트에 적힌 vCPU 수와 메모리 용량만으로는 실제 워크로드에서의 성능을 예측하기 어렵습니다. 같은 8 vCPU라도 아키텍처(x86 vs ARM), 세대(5세대 vs 8
페이지 2 / 17 (총 323개)