ML 프로젝트에서 YAML 파일을 설정 파일로 사용하기
들어가며 ML 프로젝트를 하다보면 모델에 필요한 많은 하이퍼파라미터를 포함해서 설정값을 관리하는 것이 매우 중요해집니다. 많은 실험을 통해 최적의 성능을 갖는 하이퍼파라미터 집합을 찾았는데 이를 제대로 관리하지 못하게 되면 까먹게 된다면 지금까지 들였던 시간을 다시 들여야하니까요. 그런데 재현성이 그 무엇보다 중요한 ML 프로젝트에서도 생각보다 이런...
들어가며 ML 프로젝트를 하다보면 모델에 필요한 많은 하이퍼파라미터를 포함해서 설정값을 관리하는 것이 매우 중요해집니다. 많은 실험을 통해 최적의 성능을 갖는 하이퍼파라미터 집합을 찾았는데 이를 제대로 관리하지 못하게 되면 까먹게 된다면 지금까지 들였던 시간을 다시 들여야하니까요. 그런데 재현성이 그 무엇보다 중요한 ML 프로젝트에서도 생각보다 이런...
대부분 0으로 이루어진 행렬을 굳이 다 쓸 필요는 없는데 말이죠. Introduction 행렬(Matrix)은 ML 전반에서 매우 많이 쓰입니다. 행렬을 분류하는 방법은 여러 가지지만 가장 흔하게 쓰이는 방법은 행렬의 값들에 얼마나 0이 많은가에 따라 구분하는 방법입니다. 행렬에 0이 매우 많은 경우를 희소하다 (sparse)고 하며 반대로 대...
들어가며 Pandas의 Group-by operation은 apply나 transform 메서드를 이용하여 데이터 그룹에 대한 처리를 편하게 할 수 있게 해줍니다. Pandas를 이용해서 데이터를 처리하다보면 어떻게든 한 번은 사용하게 되는 operation이죠. 하지만 매번 단순한 데이터 전처리를 하게 되지는 않습니다. 원하는 형태로 데이터를 만...
Rendle, Steffen, et al. “BPR: Bayesian personalized ranking from implicit feedback.” arXiv preprint arXiv:1205.2618 (2012). Introduction 많은 추천 시스템 관련 교과서에서는 explicit rating을 이용하여 내용을 설명합니다. 하지만...
Learning to Rank? :bulb: Learning to Rank (LTR)는 검색 결과의 순서를 정하는 것과 같은 랭킹 문제 (ranking problem)를 해결하기 위해 지도 학습(supervised learning)을 적용하는 머신러닝 방법론 전통적인 지도 학습 방법인 회귀(regression)나 분류(classificati...