机器学习中入门级必学的算法有哪些?

K-近邻算法

什么是k-近邻算法?

机器学习中入门级必学的算法有哪些?

就是根据你的邻居推断出你的类别

概念:

K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法, 总体来说KNN算法是相对比较容易理解的算法

定义

如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。

来源:KNN算法最早是由Cover和Hart提出的一种分类算法

距离公式

两个样本的距离可以通过如下公式计算,又叫欧式距离 ,关于距离公式会在后面进行讨论

线性回归

应用场景为:房价预测、销售额度预测、贷款额度预测

机器学习中入门级必学的算法有哪些?

什么是线性回归?

(1)定义与公式

线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。

特点:只有一个自变量的情况称为单变量回归,多于一个自变量情况的叫做多元回归。

机器学习中入门级必学的算法有哪些?

线性回归用矩阵表示举例:

那么怎么理解呢?我们来看几个例子

期末成绩:0.7×考试成绩+0.3×平时成绩

房子价格 = 0.02×中心区域的距离 + 0.04×城市一氧化氮浓度 + (-0.12×自住房平均房价) + 0.254×城镇犯罪率

上面两个例子,我们看到特征值与目标值之间建立了一个关系,这个关系可以理解为线性模型。

逻辑回归

逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归。由于算法的简单和高效,在实际中应用非常广泛。

应用场景:广告点击率、是否为垃圾邮件、是否患病、金融诈骗,虚假账号。

这里就可以发现一个特点了,就是两个类别之间都属于判断,逻辑回归就是解决二分类问题的利器。

要想掌握逻辑回归,必须掌握两点:

逻辑回归中,其输入值是什么

如何判断逻辑回归的输出

输入:

机器学习中入门级必学的算法有哪些?

激活函数:sigmoid函数

机器学习中入门级必学的算法有哪些?

判断标准

回归的结果输入到sigmoid函数当中

输出结果:[0, 1]区间中的一个概率值,默认为0.5为阈值
机器学习中入门级必学的算法有哪些?

逻辑回归最终的分类是通过属于某个类别的概率值来判断是否属于某个类别,并且这个类别默认标记为1(正例),另外的一个类别会标记为0(反例)。(方便损失计算)

输出结果解释(重要):假设有两个类别A,B,并且假设我们的概率值为属于A(1)这个类别的概率值。现在有一个样本的输入到逻辑回归输出结果0.55,那么这个概率值超过0.5,意味着我们训练或者预测的结果就是A(1)类别。那么反之,如果得出结果为0.3那么,训练或者预测结果就为B(0)类别。

关于逻辑回归的阈值是可以进行改变的,比如上面举例中,如果你把阈值设置为0.6,那么输出的结果0.55,就属于B类。

决策树算法

决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-else结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法

决策树:是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节点组成的树。

怎么理解这句话?通过一个对话例子

机器学习中入门级必学的算法有哪些?

上面案例是女生通过定性的主观意识,把年龄放到最上面,那么如果需要对这一过程进行量化,该如何处理呢?

此时需要用到信息论中的知识:信息熵,信息增益。

集成算法
机器学习中入门级必学的算法有哪些?

集成学习通过建立几个模型来解决单一预测问题。它的工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成组合预测,因此优于任何一个单分类的做出预测。

聚类算法
机器学习中入门级必学的算法有哪些?

实际应用:

用户画像,广告推荐,Data Segmentation,搜索引擎的流量推荐,恶意流量识别

基于位置信息的商业推送,新闻聚类,筛选排序

图像分割,降维,识别;离群点检测;信用卡异常消费;发掘相同功能的基因片段

聚类算法:

一种典型的无监督学习算法,主要用于将相似的样本自动归到一个类别中。

在聚类算法中根据样本之间的相似性,将样本划分到不同的类别中,对于不同的相似度计算方法,会得到不同的聚类结果,常用的相似度计算方法有欧式距离法。

免责声明:文章内容来自互联网,本站仅作为分享,不对其真实性负责,如有侵权等情况,请与本站联系删除。
转载请注明出处:机器学习中入门级必学的算法有哪些? https://www.dachanpin.com/a/cyfx/10670.html

(0)
上一篇 2023-05-12 02:06:14
下一篇 2023-05-12 02:07:51

相关推荐

  • 创业板指冲高回落跌0.30% 短期恐慌性抛盘并不大

      沪指早盘即显弱势,低开后震荡走低,随后小幅企稳略有回升,午后券商、视听器材等板块持续下挫,沪指反弹无力转而向下,尾盘跌幅收窄;深成指表现较弱,尾盘跌幅扩大;创业板维持红绿震荡态势,尾盘收绿。   截至收盘,沪指报3370.17点,跌11.62点,跌幅0.34%,成交1879亿元;深成指报11189.55点,跌93.20点,跌幅0.83%,成交2419亿元…

    创业分享 2023-05-21
    11700
  • 营业执照都不会办怎么创业?这时候有个师兄带着就好了

      李丽称公司现在有3万多家客户,今年每个月新增的客户就达到千家,预计今年年底新增客户能达到2万多。而在中国,仅去年一年就有1400万家初创企业成立,这里面市场空间巨大。不过令这些初创业企业头疼的就是公司注册这些问题,因为他们在这方面没有经验,也不懂,更没有精力人力去做。现在的黑中介又太多,价格不透明,初创企业的信息更得不到安全保障。李丽希望公司宝能通过提供…

    创业分享 2023-05-23
    6200
  • 发放各类创业补贴1274万元!宝安今年新增13家市级创业孵化基地

    澎湃号 > 宝安发布 发放各类创业补贴1274万元!宝安今年新增13家市级创业孵化基地 2019-12-30 16:21 来源:澎湃新闻·澎湃号·政务 字号 宝安发布 关注 在深圳市建设具有全球影响力 创新创业创意之都的 时代浪潮中 无数创业者在这片热土上 燃烧激情,追逐梦想 宝安区从政策、载体、服务等 三大方面精准发力 助力创业孵化基地发展 最大限度…

    创业分享 2023-05-12
    8600
  • 还有惯性下探,创业板1800点是强支撑

    周五大盘震荡下跌,上证指数、深成指、创业板指数分别收跌0.35%、0.89%、1.64%,两市有27只个股涨停,10只跌停。锂电池、短视频概念表现突出,利空个股和短期涨幅大的个股出现较大跌幅。 又见周五下跌,4月份以来,周五和节假日前的最后交易日4月4日、4月13日、4月20日、4月27日、5月4日、5月11日大盘都下跌,主要是因为老美频繁搞动作、国际局势较…

    创业分享 2023-05-18
    6400
  • 创业路上茶飘香

      春节期间,在享有“中国各地樱花园之最”称号的福建省漳平市永福樱花园中,42个品种10万多株樱花迎春绽放,其中“墨茶红樱”更是吸引了100多万名各地游客。早年,大批台农来到漳平市永福镇种植高山茶,开拓大陆茶叶市场,同时为了改善茶园的生态,在园内套种了樱花。现如今,樱花园所在地永福镇已成为台商个体在大陆投资最密集的乡镇,同时也是大陆面积最大的高山乌龙茶生产基…

    创业分享 2023-05-13
    6900

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信