GS리테일 DX 블로그

Digital Transformation으로 고객 생활 가치의 이노베이션을 꿈꾸는 IT 사람들의 이야기

Data&AI 4

실시간 추천을 위한 kubeflow 환경 구축

안녕하세요. 검색추천팀에서 ML 엔지니어로 일하고 있는 해리입니다. 저는 추천엔지니어로 일한지 약 6개월 정도 되었고, 그 기간동안 실시간 추천을 어떻게 준비했는지 또 준비과정 중 어떤 이슈가 있었는지 공유드리고자 합니다. 기존의 추천 저희는 앞서 수년간 이른바 '배치성 추천'을 서비스 해왔습니다. 배치성 추천이라 함은, 고객마다 고객이 가진 고유의 PCID를 기반으로 미리 어떤 제품을 추천할지 Airflow batch job을 통해 RDB 테이블에 저장해둔 데이터를 조회한 결과를 추천하는 방식입니다. 한마디로, "이 고객은 이 상품을 좋아할거야" 라는 결과를 미리 DB에 저장해두면, 정적으로 그 정해진 결과를 추천 합니다. 이러한 추천의 경우 실시간 고객의 반응을 추천에 담기 어렵다는 단점이 있었습니다..

Data&AI 2022.01.04

Language Model을 활용한 상품평 감성분석

코로나19 이후 비대면 소비 문화가 우리 삶 속으로 깊게 자리매김하고 있는 요즘, 소비자들은 오늘도 온라인 공간에 상품평을 통해 상품에 대한 자신의 생각과 감정을 표현합니다. GS Retail에서는 감성분석을 중심으로 한 마케팅 분야의 연구도 활발하게 이루어지고 있는데, 이는 기업에서 소비자로 일방적으로 제공되던 One-way marketing 방식을 탈피해 잠재된 소비자 구매 동향을 파악하고 시장 트렌드를 캐치하는 데 활용할 수 있기 때문입니다. 기존 감성분석 분야에서 전통적으로 활용되던 확률적 방법론을 기반으로 한 사전 기반 모델의 핵심 아이디어는 '긍정적인 상품평 집합에서 자주 쓰인 단어는 긍정 범주에 속할 가능성이 높다.'라는 것입니다. 그러나 이 모델은 초기 모델 구축 시 사람의 노동력에 기대어..

Data&AI 2021.12.29

End-2-End AI Product 개발하기

최근 나온 Attention을 응용한 모델이나, ResNet, Yolo derivatives, VITON 등 다양한 vision 계열 SOTA, 그리고 GPT로 유명한 generative 모델 들은 이미 사람들이 하는 노동 집약적인 “단순 반복적인” 영역을 사람보다 훨씬 더 정확한 수준으로 해 낼 수 있습니다. 기업이 AI에 많은 투자를 하는 이유가, AI가 사람들이 하고 있는 많은 일을 “잘” 대체할 수 있기 때문일 것입니다. AI는 더 효과적인(?) 리소스로 더 정확한 결과를 지속 반복적으로 만들어 낼 수 있을 것입니다. 이러한 생산성 향상이 자명하기 때문에 앞으 로더 많은 투자가 일어날 것으로 기대합니다. “효과적인 (?) 리소스 : 여담이지만 알파고가 16만개의 기보를 몬테카를로 서치 + 강화학습..

Data&AI 2021.11.26

Cross-Platform Product Matching 알고리즘 개발

안녕하세요. 데이터사이언스팀에서 데이터 분석 업무를 하고 있는 셀린이라고 합니다~ 플랫폼 간 상품 매칭 알고리즘을 개발하는 연구 목적의 프로젝트를 4개월 동안 진행하였습니다. 해당 게시글을 통해 배경, 목표, 진행 과정, 결과, 향후 계획 그리고 저의 소감에 대해 공유드리고자 합니다. 배경 이 알고리즘 개발하면 뭐가 좋은데? 무슨 의도로 해당 과제를 제안하게 되었는지? 상품 매칭 알고리즘은 다양한 판매 도메인에서 활용될 수 있습니다. (E-Commerce 등) 아래 배경을 이해하시는 것을 돕기 위해 예시는 홈쇼핑 상품으로 하였습니다. 1. '수작업'매칭의 '자동화'로 인한 업무 효율 증대를 기대 홈쇼핑 채널을 넘겨보시다가 '어? 이 상품이 여기서도 파네?!', '그때 이 상품 봤던 것 같은데 여긴 구성이..

Data&AI 2021.11.18