▶ 이런 표시로 질문에서 제가 느낀 중요한 점이나 면접관 반응을 표시했어요
(제(면접관)가 통계 관련 전공자가 아니라서 잘 모르는데) 특허가 있으신데 설명 부탁드립니다.
이전 회사는 FDS(fraud detection)을 금융사 위주로 수행을 했었는데, 막상 머신러닝을 적용 후에 탐지된 내역을 보면서 고객사에서 ‘왜 탐지된건가요?’라는 질문을 받았었습니다. 딥러닝이 블랙박스 모형인지라 대답하기가 어려웠어서 이에 대응하기 위해 설명가능한 인공지능인 XAI 연구를 시작하였습니다.
XAI는 그 당시 초기 시작점이었고 이미지 위주로 연구되었어서 저도 그렇게 연구를 했고, 예를 들어, 개구리 사진이 있을 때 모형이 이것을 개구리다라고 인식을 하는 이유를 찾기 위해서 히트맵 형식으로 개구리라고 판단한 부분을 빨갛게 표시해주는 그런 알고리즘입니다.
저는 알고리즘 중 LRP를 사용하였고 추후에 최소자승법을 사용하여 파라미터를 조정해주는 방식을 데이터 사이언스의 유명한 이미지인 손글씨 인식 데이터에 테스트하여 향상된 결과를 보였습니다.
OOOO 프로젝트에 대한 로직이 어떤지 설명 부탁드립니다.
OOOO에서 수행하였던 앱 내 결제 프로젝트는, 앱 스토어 내에서 게임 어플리케이션을 다운로드하여 게임 내에서 결제한 캐시나 아이템을 사용하고 환불하는 전문사기꾼들이 있습니다. 저는 이러한 사기꾼들을 데이터 분석과 머신러닝으로 예측하는 프로젝트에 투입되었고, 초기의 컨셉으로는 로지스틱 리그레션으로 신용평가모형과 비슷하게 유저의 위험도를 예측하는 모델으로 모델링 했습니다만, 추후에는 XGB 같은 방법론도 사용하여 0~1 사이의 값으로 사용자에 대하여 점수를 매기고 1에 가까울 수록 위험한 유저라고 예측하는 프로젝트였습니다.
결과로는, 제가 목표로 했던 Precision 80%를 넘게 예측할 수 있었으나 머신러닝 모형을 적용하진 않았습니다. 데이터의 패턴이 너무 빠르게 바뀐다는 점 및 제가 데이터 분석을 하다가 찾아낸 고래 유저와 환불 유저의 특성이 너무나 비슷해서 구분하기 어렵다보니 제가 만약 precision 90%로 10명 중 9명의 사기 유저를 예측하더라도 1명을 실제 확인해보니 고래 유저여서 매출에 타격이 갔다는 점 때문에 지속적인 데이터 분석이 더 필요하다고 생각했고 이를 제가 유일한 엔지니어로서 주장하다보니 받아들여졌습니다. 따라서 데이터 분석으로 차년도 유지 보수 계약을 할 수 있도록 하였습니다. ▶ 마지막 말에 대하여 유지 보수 계약을 제 개인이 받았냐고 물어봐서 그게 아니라 회사 차원에서의 프로젝트 계약이었다고 설명했습니다.
경험하신 내용 및 머신러닝을 어떻게 사용할 수 있을까요?
자소서에 써있고 두드러진 부분이라 특허와 OOOO 프로젝트를 먼저 물어보신 것 같은데, 제가 생각하기에 지금 커머스 산업과 가장 적절한 프로젝트는 제가 석사졸업논문으로 작성하였던 추천시스템인 것 같습니다.
졸업논문으로 아마존의 비디오 리뷰 데이터를 기반으로 사용자의 선호가 움직이는 것을 포착하고자 하였습니다. 예를 들어, 제가 로맨스 영화를 좋아한다고 하여 로맨스만 보는 것이 아니고 호러 무비도 볼 수 있듯이 사람들의 선호도가 이동하는 것을 주목하였습니다.