Machine Learning | 永远的热河路

本文覆盖Coursera Machine Learning Week 3的内容。

二元分类问题（Binary Classification Problem）
所谓的二元分类问题，指的是他的预测输出结果只有两个值 y = {0,1}，比如“预测某封邮件是否为垃圾邮件”就是一个二元分类问题。之所以称之为二元分类是相对于多分类问题（Multi Classfication Problem）而言的，比如识别10个数字就是一个多分类问题（一共有10个类别，分别是0-9）。而二元分类问题的求解是解决多分类问题的基础，具体方法下文会介绍。
现在如果要你使用一个函数来模拟分类问题，你最先想到的肯定是一个分段函数（或者叫阶跃函数：unit-step function），简单的如下：

这个函数是非常契合我们对这个问题的直觉的，模型非常简单，大于某个值输出1，否则输出0。看上去很理想，但是这个模型却存在很多问题，比如它不够光滑，不连续，在数学上不容易被处理。那么有没有替代的模型呢？

逻辑回归（Logistic Regression）
为了达到和分段函数一样的效果，并且是连续，光滑的，我[……]

继续阅读

引言
最近在学习Machine Learning，为什么要学呢？一来呢是觉得AI是未来的一大发展趋势几乎是板上钉钉的事了，他的应用范围实在是太过广泛，不仅仅是在被媒体宣传的火热的AlphaGo，自动驾驶，高级机器人等，还有很多很多你看不到的领域正在逐步应用人工智能技术，比如广告系统，推荐系统，金融领域的量化交易，大数据分析等等。而ml恰恰是AI里面一个非常重要的部分。其次是因为对这门学科分支很感兴趣，想知道这背后到底有什么奥秘，机器究竟是如何学习的？它到底能智能到何种水平？
其实在13年的时候看过Andrew Ng在standford上的一门公开课CS229 Machine Learning，一开始看还可以，可是到后面黑板上书写的各种数学公式推导很模糊，感觉很吃力，而且没什么人监督，学着学着就荒废了。今年卷土重来，查了查入门资料，有人推荐Coursera上的Andrew Ng的课程，一开始我以为这门课就是我以前在网易公开课上看的那门课程，觉得体验不怎么好。但后面真正看了之后才发现两门课很不一样，Coursera的课堂互动模式实在太赞了，秒杀各种公开课视频。不仅PPT上的公式写的很清[……]

继续阅读

永远的热河路

A man can be destroyed but Not Defeated.

标签归档：Machine Learning

Machine Learning-逻辑回归（Logistic Regression）

Machine Learning-线性回归（Linear Regression）