아직 읽는 중.


Memory based


[PDF]Instance Selection Techniques for Memory-Based ... - DBS

www.dbs.informatik.uni-muenchen.de/.../sdm02.pdf
이 페이지 번역하기
K Yu 저술 - ‎69회 인용 - ‎관련 학술자료
Instance Selection Techniques for. Memory-Based Collaborative. Filtering. *. Kai Yu. 1, 2. , Xiaowei Xu. 1. , Jianhua Tao. 3. , Martin Ester. 2 and Hans-Peter

는 online training set이 너무 적다. 정말 크고, 팍팍 변화하는 환경에서는 어울리지 않는다.

논문을 읽어봤더니, memory-based, model-based 설명이 잘 돼 있었다.

users를 다 쓰기엔 너무 많으니까 일부 users만 추려서 collaborative filtering하려는 거네. users selection는 algorithms이 논문의 핵심.


[PDF]Item-based Collaborative Filtering Recommendation ...

glaros.dtc.umn.edu/gkhome/.../www10_sarwar.pdf
이 페이지 번역하기
B Sarwar 저술 - ‎5161회 인용 - ‎관련 학술자료
Item-based Collaborative Filtering Recommendation. Algorithms. Badrul Sarwar, George Karypis, Joseph Konstan, and John Riedl. GroupLens Research ...

도 읽어봤다.

users similarity를 쓰기에는 users가 너무 많고, dynamic하니까 비교적 static한 items의 similarity를 이용하는 논문. popular items만 이용하면 data도 줄일 수 있다.


Model based


users를 clustering한다.

여러 interests를 가진 user를 modeling하기 위해 LSI, Bayesian clustering, PLSI, Markov decision process, LDA 등을 쓴다.


systems 구성을 깔끔한 그림과 자세한 설명으로 소개해줘서 좋네.


따로 공부


Minhashing


11분부터 강의 시작.



jaccard similarity를 정확하게 계산하는 게 아니라 random permutation 중 첫 번째 1이 어디 있냐를 비교하는 방식으로 estimation

hash 중 min을 찾는 방법으로 대신한다.


LSH



설명 중 umm이 많다.


Minhash에 LSH를 쓴다.






https://www.coursera.org/course/mmds


  Week 7 Materials
(expanded, click to collapse)
Completed LSH Families (21:13)  slides for LSH Families (21:13)  Subtitles (text) for LSH Families (21:13)  Subtitles (srt) for LSH Families (21:13) Video (MP4) for LSH Families (21:13)
Completed More About LSH Families (12:57)

...

안에도 설명이 있는데, 화질, 음질이 더 깔끔하다.

하지만, 너무 어렵다 ...




LSI




stanford ng 옛날 강의

text에서 PCA하는 셈. 거의 비슷하다. 그게 끝? LSI설명은 거의 없네.

subspace에 projection하는 것?

PCA, SVD 관계도 조금 알 수 있다. SVD를 이용해서 Xt * X의 eigenvectors (columns of U)를 알아내서 PCA를 계산하는 방법이 있다.













by 언제나19 2016. 4. 1. 21:04