http://videolectures.net/ecmlpkdd09_eckard_plsitfkb/

앞부분에 PLSI 공부 조금.  들어도 못 알아듣겠다.

 

http://videolectures.net/slsfs05_hofmann_lsvm/

author: Thomas Hofmann, Google, Inc. 
published: Feb. 25, 2007,   recorded: February 2005,   views: 4072

LSI 설명 조금. SVDlatent factor를 찾는 것.

PLSI

Documentcontext에서 각 단어가 들어 있을 확률을 구할 때,

Latent factors의 확률을 연관된 단어의 확률 계산에 이용

Collaborative filtering

 


http://videolectures.net/mlss09uk_blei_tm/

Topic Models

author: David Blei, Computer Science Department, Princeton University 
published: Nov. 2, 2009,   recorded: September 2009,   views: 33740

 

LDA

 

Dirichlet parameter à> Per-document topic proportions à> Per-word topic assignment à> Observed word
<
ß Topics <ß Topic hyperparameter

 

Dirichlet distribution

P(theta|alpha) = gamma ( Sum alpha ) / Power gamma ( alpha_i ) * Power theta^(alpha-1)

 

Theta ~ Dir(1, 1, 1) = uniform distribution

 

이게 도움이 많이 되네. 설명도 쉽고, 내용도 알차고. 내용은 쉽지만은 않다.

우선 part 1만 봤다.

 

 

Mixture model에서 각 documentwords 1 topic에서 왔다.

Dirichlet에서 alpha가 작으면, uniform하지 않고, mixture model

 

Part 1을 잘 이해 못했더니, Part 2는 더 어렵네. 기본 지식이 부족해서 못 알아듣겠다.

 

뒷부분 실제 실용 예를 듣고 싶었는데, 그냥 막 넘어가네. 아웅.



by 언제나19 2016. 4. 18. 14:13


아직 읽는 중.


Memory based


[PDF]Instance Selection Techniques for Memory-Based ... - DBS

www.dbs.informatik.uni-muenchen.de/.../sdm02.pdf
이 페이지 번역하기
K Yu 저술 - ‎69회 인용 - ‎관련 학술자료
Instance Selection Techniques for. Memory-Based Collaborative. Filtering. *. Kai Yu. 1, 2. , Xiaowei Xu. 1. , Jianhua Tao. 3. , Martin Ester. 2 and Hans-Peter

는 online training set이 너무 적다. 정말 크고, 팍팍 변화하는 환경에서는 어울리지 않는다.

논문을 읽어봤더니, memory-based, model-based 설명이 잘 돼 있었다.

users를 다 쓰기엔 너무 많으니까 일부 users만 추려서 collaborative filtering하려는 거네. users selection는 algorithms이 논문의 핵심.


[PDF]Item-based Collaborative Filtering Recommendation ...

glaros.dtc.umn.edu/gkhome/.../www10_sarwar.pdf
이 페이지 번역하기
B Sarwar 저술 - ‎5161회 인용 - ‎관련 학술자료
Item-based Collaborative Filtering Recommendation. Algorithms. Badrul Sarwar, George Karypis, Joseph Konstan, and John Riedl. GroupLens Research ...

도 읽어봤다.

users similarity를 쓰기에는 users가 너무 많고, dynamic하니까 비교적 static한 items의 similarity를 이용하는 논문. popular items만 이용하면 data도 줄일 수 있다.


Model based


users를 clustering한다.

여러 interests를 가진 user를 modeling하기 위해 LSI, Bayesian clustering, PLSI, Markov decision process, LDA 등을 쓴다.


systems 구성을 깔끔한 그림과 자세한 설명으로 소개해줘서 좋네.


따로 공부


Minhashing


11분부터 강의 시작.



jaccard similarity를 정확하게 계산하는 게 아니라 random permutation 중 첫 번째 1이 어디 있냐를 비교하는 방식으로 estimation

hash 중 min을 찾는 방법으로 대신한다.


LSH



설명 중 umm이 많다.


Minhash에 LSH를 쓴다.






https://www.coursera.org/course/mmds


  Week 7 Materials
(expanded, click to collapse)
Completed LSH Families (21:13)  slides for LSH Families (21:13)  Subtitles (text) for LSH Families (21:13)  Subtitles (srt) for LSH Families (21:13) Video (MP4) for LSH Families (21:13)
Completed More About LSH Families (12:57)

...

안에도 설명이 있는데, 화질, 음질이 더 깔끔하다.

하지만, 너무 어렵다 ...




LSI




stanford ng 옛날 강의

text에서 PCA하는 셈. 거의 비슷하다. 그게 끝? LSI설명은 거의 없네.

subspace에 projection하는 것?

PCA, SVD 관계도 조금 알 수 있다. SVD를 이용해서 Xt * X의 eigenvectors (columns of U)를 알아내서 PCA를 계산하는 방법이 있다.













by 언제나19 2016. 4. 1. 21:04




https://www.coursera.org/learn/wharton-accounting

Coursera
Introduction to Financial Accounting - University of Pennsylvania | Coursera
Introduction to Financial Accounting from University of Pennsylvania. Master the technical skills needed to analyze financial statements and disclosures for use in financial analysis, and learn how accounting standards and managerial incentives affect the financial reporting process. By the end of this course, you’ll be able to read the three most common financial statements: the income statement, balance sheet, and statement of cash flows. Then you can apply these skills to a real-world business


http://www.ouj.ac.jp/kamoku/detail/1128272/
個々の新しい会計基準を知ることよりも、大きく変容する現代の会計をトータルに理解することがより大切である。変容の今日的なあり方はいかなるものか、その変容は何処からくるか、会計の基本的な考え方は大きく変わったのか、変容する現実社会のなかで会計がどのように機能しているか、本講義をとおして変容する現代の会計のトータルな理解と将来の予見に役立つことを目標とする。





by 언제나19 2016. 1. 11. 02:13
by 언제나19 2015. 12. 28. 12:11





Webinar | Cassandra and the Graph Insights into the DataStax Graph Strategy

https://www.youtube.com/watch?v=tVY8cK7NbVE


그냥 overview. 특별히 감동적인 얘기는 없다.


Graph Meetup Caleb Jones Tinkerpop and Titan

https://www.youtube.com/watch?v=kg2x6K3IbhY

graph로 다 표현하곤 한다. 이미 오래 전에 예견된 일.


Cassandra Summit 2012, 2013


Cassandra Summit 2014: TitanDB - Scaling Relationship Data and Analysis with Cassandra

https://www.youtube.com/watch?v=p9AtfU90y8A


Titan event framework

Transaction modifications logged


recommendation

oracle --> titan 10x faster 60% cheaper


Knowledge graph. music graph. senzari



Marko Rodriguez: Distributed Graph Analytics with Faunus

https://www.youtube.com/watch?v=ALhjzlNuZdA




https://www.youtube.com/watch?v=s2ZaamxHRF0

는 음질, 화질이 안 좋다.


https://github.com/tinkerpop/gremlin/wiki/Using-Gremlin-through-Groovy





by 언제나19 2015. 12. 25. 14:12
| 1 2 3 4 5 6 ··· 61 |