devBlog

Backend 글 모음

한국 기업 기술 블로그의 Backend 관련 글 848개

AWS

2026-05-26 · 약 1개월 전

Amazon EC2 G5/G6 인스턴스에서 GPU Tensor Parallelism으로 비용 효과적으로 LLM 서빙하기

최근 많은 기업들이 자체 LLM을 구축하거나, 오픈소스 sLLM(Small Large Language Model)을 활용하여 설치형 LLM서비스를 구성하려는 수요가 크게 증가하고 있습니다. 그런데 실제로 배포하려는 모델을 살펴보면, Llama 3 70B, Qwen 72B, EXAONE 3.5 32B 등 모델을 GPU에 로드할 때 필요한 메모리가 40GB에서 최대 150GB에 달하는 경우가 많아, GPU 메모리가 80GB인 H100/H200이 탑

AI/MLBackendInfra

Amazon EC2 G5/G6 인스턴스에서 GPU Tensor Parallelism으로 비용 효과적으로 LLM 서빙하기

VLM을 쓰지 않은 이유: Geometric Prior로 25배 빠른 의류 디테일컷 자동화

[AWS Summit Seoul 2026] 나야, 차세대 OpenSearch: 에이전틱 AI를 곁들인

ODW #7: 세 가지 방법으로 토큰 소비량 40% 절감! ADK를 이용한 컨텍스트 엔지니어링

현대오토에버의 Amazon Bedrock으로 구축한 빅데이터 클러스터 장애 대응 자동화 에이전트 구축기

현대오토에버의 Amazon Bedrock으로 구축한 다중 AI 에이전트: 장애 대응 시간 5분으로 단축하기

메시징 서버의 스트레스 테스트 노하우와 AI 가 덜어 준 부분

개발자 없이 5분 만에 버그를 고친 QA, 우리가 설계한 것과 설계하지 않은 것

6G를 위한 AI/ML 물리계층 – JSCM 기반 오디오 전송

씨미가 4K · 4초 저지연 라이브를 만든 방법 — Amazon IVS와 자체 구축의 하이브리드 설계

MSA도, 모놀리스도 아닌 제3의 선택 — Spring Modulith

Sentry를 바로 도입하지 않고 200줄 에러 트래커를 만든 이유

CJ올리브영의 AI 협업 개발 프로세스 구축, AI-DLC 실전 도입 사례

쿠키런: 킹덤의 전투 데이터, JSON Schema로 검증하고 자동완성하기

GloZ의 Amazon OpenSearch Service를 기반으로 한 자연어 이력서 검색 시스템 구축 사례 — Part 1: 데이터 파이프라인과 인덱싱

뉴빌리티의 Amazon Kinesis Video Streams 기반 원격 관제 확장 사례

AI 스페셜리스트와 자동사냥 — 하네스로 제어하는 AI 파이프라인

GS SHOP의 영상 기반 AI 상품 추천 플랫폼 구축기

AWS의 Claude Platform 소개: AWS 계정을 통한 Anthropic의 네이티브 Claude Platform 시작하기

Agentic AI 기반 플랫폼 – Part3 : AgentCore Policy, Evaluation, Observability로 기업 운영 체계 구축하기

Amazon EC2 G5/G6 인스턴스에서 GPU Tensor Parallelism으로 비용 효과적으로 LLM 서빙하기

VLM을 쓰지 않은 이유: Geometric Prior로 25배 빠른 의류 디테일컷 자동화

[AWS Summit Seoul 2026] 나야, 차세대 OpenSearch: 에이전틱 AI를 곁들인

ODW #7: 세 가지 방법으로 토큰 소비량 40% 절감! ADK를 이용한 컨텍스트 엔지니어링

현대오토에버의 Amazon Bedrock으로 구축한 빅데이터 클러스터 장애 대응 자동화 에이전트 구축기

현대오토에버의 Amazon Bedrock으로 구축한 다중 AI 에이전트: 장애 대응 시간 5분으로 단축하기

메시징 서버의 스트레스 테스트 노하우와 AI 가 덜어 준 부분

개발자 없이 5분 만에 버그를 고친 QA, 우리가 설계한 것과 설계하지 않은 것

6G를 위한 AI/ML 물리계층 – JSCM 기반 오디오 전송

씨미가 4K · 4초 저지연 라이브를 만든 방법 — Amazon IVS와 자체 구축의 하이브리드 설계

MSA도, 모놀리스도 아닌 제3의 선택 — Spring Modulith

Sentry를 바로 도입하지 않고 200줄 에러 트래커를 만든 이유

CJ올리브영의 AI 협업 개발 프로세스 구축, AI-DLC 실전 도입 사례

쿠키런: 킹덤의 전투 데이터, JSON Schema로 검증하고 자동완성하기

GloZ의 Amazon OpenSearch Service를 기반으로 한 자연어 이력서 검색 시스템 구축 사례 — Part 1: 데이터 파이프라인과 인덱싱

뉴빌리티의 Amazon Kinesis Video Streams 기반 원격 관제 확장 사례

AI 스페셜리스트와 자동사냥 — 하네스로 제어하는 AI 파이프라인

GS SHOP의 영상 기반 AI 상품 추천 플랫폼 구축기

AWS의 Claude Platform 소개: AWS 계정을 통한 Anthropic의 네이티브 Claude Platform 시작하기

Agentic AI 기반 플랫폼 – Part3 : AgentCore Policy, Evaluation, Observability로 기업 운영 체계 구축하기