본문 바로가기

논문리뷰/추천시스템4

[논문리뷰] Factorization Machines Abstract Factorization Machines은 SVM과 마찬가지로 feature vector의 실제값으로 예측을 하지만, 인수분해된 파라미터 값을 사용하여 모든 변수와 상호작용을 한다. 따라서 엄청 큰 sparse한 데이터 셋은 SVM으로 예측을 실패할 수 있지만 FM으로는 가능하다. FM 모델은 선형시간(시간복잡도)내에서 계산되어 최적화를 할 수 있다. 특히 비선형 SVM에서 dual form으로 변형한 계산이 필요 없다. 반면에 matrix factorization, 병렬 요인 분석 또는 SVD++, PITF, FPMC와 같이 특수화된 모델도 있다. 그러나 이러한 모델은 특수한 데이터에만 적용할 수 있으며 각 태스크별로 알고리즘 최적화를 진행해야 한다. 그러나 FM은 feature vec.. 2021. 8. 30.
[추천시스템] 모델기반 협업필터링 모델기반 협업 필터링은? 머신러닝을 가장 잘 활용한 추천알고리즘의 일종임 주어진 데이터를 활용하여 모델이 데이터의 패턴을 학습함 데이터 크기 또는 특징(feature)을 동적으로 활용 가능함 데이터(유저)의 잠재적 특성(선호하는 취향)을 파악하는 모델임(Latent Factor Model) 모델기반 협업 필터링의 장점 1. 추천모델의 크기를 줄일 수 있음(데이터를 Matrix로 만들어서 가능) 2. 데이터 전처리와 학습과정으로 준비된 모델로 예측 가능함 3. 추천모델의 과적합 방지가 가능함 모델기반 협업 필터링 종류 1. Association Rule Mining 2. Matrix Factorization (SVD, ALS) 3. Probabilistic Models 4. SVM, Regression m.. 2021. 5. 9.
[추천시스템] 협업 필터링(Collaborating Filtering) 개요, 아이템 VS 유저 협업 필터링 선택하기 정의 : 많은 사람들의 의견을 협동하여 더 나은 추천을 위해 필터링한다. 1. 개인보다는 단체 또는 그룹의 선택과 취향에 의존한다. 2. 여러 사람의 의견을 종합적으로 반영하여 다수의 의견으로 더 나은 선택을 한다. 종류 : 이웃기반 협업 필터링 장점: 1. 구현이 간단하다 2. Model-based CF에 비해 계산량이 적다. 3. 새로운 user, item이 추가되도 안정적으로 추천할 수 있다. 이웃기반 협업 필터링 단점: 1. Cold-Start 문제가 있다. (충분한 데이터가 없으면 추천할 수 없다) 2. 데이터가 많아질수록 계산량이 많아진다. 3. Long-Tail 문제가 발생한다. (대부분의 사용자가 관심 갖는 소수 아이템으로 추천이 쏠린다) User-based 협업 필터링 활용 1. 취향이 .. 2021. 5. 2.
[추천시스템] 콘텐츠 기반 추천 시스템 정의 정의: 콘텐츠, 즉! 아이템을 기반으로 추천한다. 1. 사용자가 과거에 경험했던 아이템 중, 비슷한 아이템을 현재 시점에서 추천한다. 2. 아이템의 항목 자체를 분석하여 추천한다. 방법: 콘텐츠 프로파일링하여 유저가 선호했던 콘텐츠와 유사한 콘텐츠의 추천 리스트를 생성한다. 콘텐츠 프로파일링 1. 아이템에 속성, 피쳐, 항목을 정량화한다. (예: 영화의 장르, 감독 등을 원핫인코딩 혹은 벡터화 한다.) 2. TF-IDF로 설명 등을 포함하는 문서에서 키워드를 추출한다. (예: 영화 줄거리에서 키워드를 추출한다.) 3. 콘텐츠 간에 유사도 분석을 한다. ( 코사인 유사도, 자카드 유사도 등을 활용한다.) 사용자 프로파일링 1. 사용자가 아이템에 가지고 있는 특정 가중치를 활용한다. (예: 사용자가 특정 아.. 2021. 5. 2.
반응형