月度归档:2017年09月

理解PCA

引言
之前写过一篇关于PCA的文章,写完之后就以为自己已经完全理解这个东西了。直到最近data mining课上又讲到这个内容,和同学交流时才发现有些细节根本没有理解到位。上一篇文章主要介绍如何一步一步计算出一个PCA算法,而今天则侧重于从数学的角度讲讲为什么。

基本概念
再深入介绍之前,先理解几个基本的数学概念:
方差(Variance):
一个变量的方差可以看做是每个元素与变量均值的差的平方和的均值,即:$${\displaystyle \Sigma =\mathrm {cov} (X_{i},X_{i}) = \mathrm {E} {\begin{bmatrix}(X_{i}-\mu _{i})^{2}\end{bmatrix}} = \mathrm {E} {\begin{bmatrix}(X_{i}-\mu _{i})(X_{i}-\mu _{i})\end{bmatrix}}}
$$
其中,\(E\)表示的是均值函数,\(\mu_{j}\)表示的是样本的均值。方差用来度量单个变量样本数据的离散(偏离均值)的程度。

协方差(Covariance):
变量\(X_{i}\[……]

继续阅读

港科の初体验

我想我应该是一个适应能力极强的人,不知不觉到香港已经十几天了,从工作状态切换到学生身份,再从上海到香港,接受这些转变并没有我想象的那么难,没有什么特别值得说道的不适。可能是香港和上海真的太像了吧,但其实我并没有那么喜欢香港,不仅仅是香港的物价比上海贵了30%-50%,还有那温热潮湿令人每天要洗好几次澡的天气。这里我真的要吐槽下每天穿梭于学校和山下的小巴,简直破败不堪,跟老家小县城的小巴差不多。有些公交站牌连站点信息都没有,上下站都要招手,不然不停。而且司机上下山开的极快,过弯都不踩刹车,让我有种时刻都有可能要翻下山的不安全感。哈哈。此外,还有最重要一点是,香港底层群众在服务时会不自觉地透露出一股怨气,反正我在公共场合咨询一些香港人问题或者在一些小餐厅吃饭,从来没看被笑脸相迎过(哎,可能我长得太严肃了?)。所以啊,底层人民的服务态度并不好啊,给人一种冷冰冰的感觉。当然了,这一切只是我下了两次山之后的体验,有点吹毛求疵了,香港整体而言还是很不错的,在这里你确实能感受到中西方文化交融的影子,这在全世界都非常独特。
HK_STREET
吐槽完香港,再来说说学校吧。就这几天的感受而言,港科的一切都是那么的让我欢喜[……]

继续阅读