Mining Massive Datasets


선생님 3명

1명 원어민

1명 조금 유럽 발음

1명 조금 인도 발음

유럽 발음 선생님 내용이 제일 관심이 있고, 집중이 잘 된다.

machine learning 기술도 많이 배운다.

수학은 좀 덜 나온다. 증명 같은 것은 없다. 이해만 하고 넘어간다.


진도



Link Analysis and PageRank (9:39)


page rank 드디어 배웠다. 계산을 이제 할 수 있겠다!



Minhashing (25:18)



hash function으로 빠르게 계산하는 거 잘 모르겠네.



Week 03


Good cluster

max within-cluster connections

min inter-cluster connections

conductance score = cut score / degrees

optimal cut is NP-hard

Laplacian matrix를 만들어서 eigenvalue decomposition을 하면, 신기하게도 k cluster로 나뉜다.


bipartite subgraphs K_s,t

week02에서 frequent itemset enumeration 대충 봤는데, 여기서 다시 쓰이네.


big data page rank 계산법 등 page rank에 대한 advanced topics에 대해서도 다시 보기.





by 언제나19 2015. 5. 24. 03:22
| 1 |