언어 모델의 Fine-Tuning 성능 올리기
안녕하세요, 데이블 AI 팀의 machine learning engineer 김명섭입니다. 이번 포스팅에서는 language model (LM)의 fine tuning의 성능을 더욱 향상시키는 다양한 방법론에 대해 알아보고자 합니다. LM의 fine-tuning 성능을 더욱 향상시키는 다양한 방법을 소개해 드리는 데에 중점을 맞춘 포스팅으로 각 방법론의 매우 상세한 내용보다는 어떠한 방법론이 존재하는지에 초점을 맞추어 작성되었습니다. 추가적으로
AI/MLMLOpsPerformanceTools
Bid Shading이란?
1. 서론 안녕하세요, AI팀 안준형입니다. 오늘은 저희 팀에서 최근에 많은 시간과 노력을 들인 입찰 쉐이딩(Bid Shading)에 대해서 소개하려합니다. 2. 입찰 쉐이딩(Bid shading)이란? 온라인 광고에서 직접 판매되지 않는 재고는 주로 실시간 입찰(RTB)에서 프로그램적으로 경매됩니다. 2018년 이전까지 RTB에서는 2등 가격 경매(Second-price Auction, SPA)가 주로 사용되었으며, 여기서 낙찰자는 두 번째로
AI/MLBackendPerformanceTools
딥러닝 추천 모델에 인과추론 접목시켜 전환율 예측 성능을 향상시키자!
1. 서론 안녕하세요. AI팀 안준형입니다. 이번 포스팅에서는 추천시스템에서 인과추론을 어떻게 적용하는지 알아보겠습니다. 현재 대부분의 머신러닝 기반의 추천시스템은 입, 출력 간의 상관관계 (correlation)을 모델링합니다. 하지만, 현실 세계는 상관관계가 아닌 인과관계로 구성되어 있으며 상관관계가 인과관계를 반드시 암시하지 않습니다. 예시) 어떤 유저는 휴대폰을 구매한 다음 배터리 충전기를 구매하는 경우, 전자는 후자의 원인이 되지만 그
AI/MLNLPRecommendation
Biome: 차세대 JS Linter와 Formatter
안녕하세요. 데이블 Service Front-end Team(SF Team)의 장희영입니다. 이 글에서는 JavaScript에서 Code Formatter와 Linter 역할을 동시에 수행하는 Biome이라는 도구를 소개해보려고 합니다. 들어가기 전에… 혹시 Prettier라는 Code Formatter를 들어본 적이 있으신가요? 아마 자바스크립트를 사용하는 개발자라면 모를 수가 없을 것으로 생각합니다. Prettier는 지배적인 위치를 차지하
FrontendJavaScriptTools
리액트 19 신규 기능 및 개선 사항
안녕하세요. 데이블 Service Front-end Team(SF Team)의 이진호입니다. 리액트는 리액트만의 편리함과 확장성으로 프론트엔드 개발의 기본으로 자리 잡았습니다. 리액트 18은 배포된 지 벌써 2년이 지났고 이제 리액트 19가 저희를 기다리고 있습니다. 이에 맞춰 리액트 19에서 새롭게 선보이는 기능들과 개선 사항에 대해 요약해 보려 합니다. 새로운 기능 이번 리액트 19의 신규 기능은 크게 두 가지로 나눌 수 있습니다. 유저 액
FrontendPerformanceReact
SHAP
안녕하세요. 오태호입니다. 이 글에서는 SHAP(SHapley Additive exPlanations)에 대해 설명해 보려고 합니다. SHAP은 SHAP Python Package의 공식 문서(https://shap.readthedocs.io)를 살펴봐도 사용법이 간단한 듯 하면서도 어느 정도 동작 원리를 이해하지 못하면 사용하기가 쉽지가 않습니다. 그래서 이 글에서는 SHAP에 대해 복잡하고 깊은 내용은 생략하고 SHAP을 이해하고 활용하는데
AI/MLPythonTools
머신러닝으로 만드는 개인화 추천 시스템
안녕하세요, 데이블 AI팀의 machine learning engineer 김명섭입니다. 이번 포스팅에서는 기초적인 개인화 추천 시스템 설계에 대해 알아보고자 합니다. 본 포스팅에서는 프로그래머틱 애드 (programatic ad), real-time bidding 및 DSP 등에 관한 내용들은 다루지 않습니다. 만약 해당 내용들이 궁금하시다면, 아래의 포스팅을 참고해 주세요! 데이나의 참 쉬운 애드테크 (Link) 추가적으로 본 포스팅은 전반
AI/MLBackendData AnalysisPythonRecommendation
Bayes Theorem
안녕하세요. 오태호입니다. Bayes Theorem은 Statistics를 공부하다 보면 기초적인 내용중에 하나로 언급되는 내용입니다만, 많은 책의 설명이 너무 추상적이거나 너무 복잡하거나 너무 간단하게 되어 있어서 이해가 쉽지 않은 경우가 많이 있습니다. 그래서 배우기는 분명히 배웠지만 실제로 문제 해결에 적용하기 위해서는 어떻게 적용해야 되는지 잘 모르는 사람도 많이 있습니다. 이 글에서는 Bayes Theorem을 조금 자세히 설명해서 B
AI/MLData EngineeringTools
자, 이제부터 이 글을 보는 순간 Git이 쉬워집니다? - 원리로 알아보는 Git의 기초
안녕하세요. 데이블 Service Front-end Team(SF Team)에 한재원이라고 합니다. “여러분은 혹시 Git 때문에 고통받고 계시지 않으신가요?” 저는 올해 2월에 데이블에 합류하게 되었는데요. 거기에 수식어 하나를 덧붙이자면, 2월에 ‘개발자 첫 커리어’를 데이블로 시작했습니다. 즉 아직은 귀여운(?) 병아리 개발자인 셈입니다. 갑자기 웬 고해성사냐, 라고 생각하실 수도 있겠지만 잠깐 기다려보세요. 할 말이 있습니다. 그것은 바
CareerFrontendTools
더 나은 객체지향 개발을 위한 아이디어: 관심사의 분리부터 제어의 역전까지
안녕하세요, 데이블의 백엔드 엔지니어 송영훈입니다. 오늘은 조금 원론적일지 모르지만 모든 개발자에게 있어 중요한 이야기를 해볼까 합니다. 왜 우리가 쉽고 효율적인 프로그램을 작성해야 하는지를 중심으로, 현대 풀스택 웹 프레임워크들이 강조하는 의존성 주입과 제어의 역전이란 어떤 의미를 가지는지까지 한번 알아보는 시간을 가져보도록 하겠습니다. 좋은 코드란 무엇인가 We love clean code just as much as you do. Simp
ArchitectureBackendMSAPerformanceTools