开始在B站跟着学习吴恩达老师的《机器学习》课程。

机器学习定义

通过学习经验E(experience),在解决任务T(task)时达到更好的效果,其效果由P(performance measure)来衡量。例如,在系统学习自动帮助用户归类垃圾邮件的过程中,观察学习用户是如何归类邮件过程是E,归类收到的邮件是任务T,正确归类的比例是度量P。

有监督学习

有监督学习:通过学习正确的数据(训练集),预测其他情况下的输出结果

细分为回归问题分类问题

回归问题是连续型的预测,例如对于不同面积大小,年份的房屋价格的预测

分类问题是离散型的预测,例如对于肿瘤的大小,患者的年龄情况,预测肿瘤是良性还是恶性

回归问题中,$m$是训练数据的条数,$h$是目标函数,$J(\theta_0,\theta_1)$是代价函数,目的是找到使得代价函数值最小的对应回归曲线的参数值。可以通过梯度下降策略来找到对应的参数,即$\theta_0$和$\theta_1$
$$
\theta_1:=\theta_1-\alpha\cfrac{\partial J(\theta_1,\theta_2)}{\partial \theta_1}
\tag{1}
$$

无监督学习

无监督学习:主要是具有不同特征数据的聚类,没有标准,相似的自动聚集成一类。例如,通过用户的不同属性(年龄、性别、订阅频道等)的相似度,将某产品的用户自动聚集成集中类型,但是具体是是什么样的类型,没有人知道,这需要数据分析者根据聚类情况进行总结。

文章目录