스캐터랩
2023-08-16 · 거의 3년 전
새로운 루다를 지탱하는 모델 서빙 아키텍처 — 3편: 안정적인 LLM 서비스를 위한 서빙 최적화 기법
LLM 서빙을 위한 다양한 최적화 기법과 그 효과를 검증하기 위한 부하 테스트 방법론
총 50개 글 · 원본 블로그 방문 →
AI 챗봇을 만드는 스캐터랩 핑퐁팀의 기술 블로그
스캐터랩
2023-08-16 · 거의 3년 전
LLM 서빙을 위한 다양한 최적화 기법과 그 효과를 검증하기 위한 부하 테스트 방법론
스캐터랩
2023-07-21 · 거의 3년 전
루다, 다온에게 지연 답변 기능을 구현한 과정을 설명합니다.
스캐터랩
2023-07-10 · 거의 3년 전
Luda Gen 1.5 모델을 학습할 때 데이터셋에서 중복을 제거한 방법에 대해 이야기합니다.
스캐터랩
2023-05-24 · 약 3년 전
생성 모델 Luda Gen 1을 어떻게 챗봇 모델로 학습했는지를 구체적으로 다룹니다.
스캐터랩
2023-05-24 · 약 3년 전
Private Session으로 진행된 Round Table Talks with OpenAI in Seoul 주요 내용을 공유합니다.
스캐터랩
2023-03-20 · 3년 이상 전
Spot을 이용한 서버 비용 절감기
스캐터랩
2023-02-20 · 3년 이상 전
A/B 테스트까지 가능한 안정적인 모델 서빙 인프라 구조 설계 방법
스캐터랩
2023-02-14 · 3년 이상 전
핑퐁팀과 함께하는 EMNLP 2022 Review
스캐터랩
2023-02-01 · 3년 이상 전
'성동구소재회사근무중인20대남성개발자4명'팀의 대상 비법
스캐터랩
2023-01-27 · 3년 이상 전
'모델 추론 구조 자체'를 A/B 테스트하는 방법
스캐터랩
2022-12-21 · 3년 이상 전
Spring Boot 서버 모니터링하기. 근데 이제 Prometheus를 곁들인
스캐터랩
2022-12-14 · 3년 이상 전
생성 모델 Luda Gen 1을 출시하기까지의 과정을 소개합니다
스캐터랩
2022-11-28 · 3년 이상 전
Apache Beam Native API, RunInference로 대규모 데이터 모델 추론하기
스캐터랩
2022-11-16 · 3년 이상 전
쿠버네티스 환경에서 Custom Metric으로 오토스케일링 하는 과정을 설명합니다
스캐터랩
2022-11-09 · 3년 이상 전
포토챗 베타 서비스를 출시하기까지의 연구 과정을 소개합니다.
스캐터랩
2022-10-12 · 3년 이상 전
CodePush와 adhoc으로 React Native 앱 '너티'의 배포 트랙 관리하기
스캐터랩
2022-09-13 · 거의 4년 전
팀에서 필요한 학습 파이프라인 구축하기
스캐터랩
2022-08-24 · 거의 4년 전
루다와 함께 사용하는 메신저 'Nutty' 자동으로 배포하기
페이지 2 / 3 (총 50개)