当前位置:首页 > 芯闻号 > 充电吧
[导读]机器学习中的“算法”是什么? 机器学习中的“算法”是在数据上运行以创建机器学习“模型”的过程。 机器学习算法执行“模式识别”。算法从数据中“学习”,或者对数据集进行“拟合”。 机器学习算法有很多。比如

机器学习中的“算法”是什么?

机器学习中的“算法”是在数据上运行以创建机器学习“模型”的过程。

机器学习算法执行“模式识别”。算法从数据中“学习”,或者对数据集进行“拟合”。

机器学习算法有很多。比如,我们有分类的算法,如 K- 近邻算法;回归的算法,如线性回归;聚类的算法,如 K- 均值算法。

下面是机器学习算法的例子:

线性回归 逻辑回归 决策树 人工神经网络 K- 最近邻 K- 均值

你可以把机器学习算法想象成计算机科学中的任何其他算法。

例如,你可能熟悉的一些其他类型的算法包括用于数据排序的冒泡排序和用于搜索的最佳优先排序。

因此,机器学习算法具有许多特性:

机器学习计算法可以用数学和伪代码来描述。 可以对机器学习算法的效率进行分析和描述。 机器学习算法可以用任何一种现代编程语言来实现。

例如,你可能会在研究论文和教科书中看到用伪代码或 线性代数 描述的机器学习算法。你可以看到一个特定的机器学习算法与另一个特性算法相比的计算效率。

学术界可以设计出全息你的机器学习算法,而机器学习实践者可以在他们的项目中使用标准的机器学习算法。这就像计算机科学的其他领域一样,学者可以设计出全新的排序算法,程序员可以在应用程序中使用标准的排序算法。

你还可能会看到多个机器学习算法实现,并在一个具有标准 API 的库中提供。一个流行的例子是 scikit-learn 库,它在 Python 中提供了许多分类、回归和聚类机器学习算法的实现。

机器学习中的“模型”是什么?

机器学习中的“模型”是运行在数据上的机器学习算法的输出。

模型表示机器学习算法所学到的内容。

模型是在训练数据上运行机器学习算法后保存的“东西”,它表示用于进行预测所需的规则、数字和任何其他特定于算法的数据结构。

我举一些例子,可能会让人更清楚地明白这一点:

线性回归算法的结果是一个由具有特定值的稀疏向量组成的模型。 决策树算法的结果是一个由具有特定值的 if-then 语句树组成的模型。 神经网络 / 反向传播 / 梯度下降算法一起产生一个由具有特定值的向量或权重矩阵和特定值的图结构组成的模型。

机器学模型对于初学者来说更具挑战性,因为它与计算机科学中的其他算法没有明确的类比。

例如,排序算法的排序列表输出并不是真正的模型。

最好的类比是将机器学习模型想象成一个“程序”。

机器学习模型“程序”由数据和利用数据进行预测的过程组成。

例如,考虑线性回归算法和由此产生的模型。该模型由系数(数据)向量组成,这些系数(数据)与作为输入的一行新数据相乘并求和,以便进行预测(预测过程)。

我们将数据保存为机器学习模型,以备后用。

我们经常使用机器学习库提供的机器学习模型的预测过程。有时候,我们可以自己实现预测过程作为我们应用程序的一部分。考虑到大多数预测过程都非常简单,这通常都是直截了当的。

算法与模型框架

现在我们已经熟悉了机器学习的“算法”和机器学习的“模型”。

具体来说,就是对数据运行算法来创建模型。

机器学习 =>机器学习模型

我们还了解到,模型由数据和如何使用数据对新数据进行预测的过程组成。如果你愿意的话,你也可以将这一过程视为一种预测算法。

机器学习模型 == 模型数据 + 预测算法

这种区分对于理解广泛的算法非常有帮助。

例如,大多数算法的所有工作都在“算法”中,而“预测算法”的工作很少。

通常情况下,算法是某种优化程序,即在训练数据集上使模型(数据 + 预测算法)的误差最小化。线性回归算法就是一个很好的例子。它执行一个优化过程(或用线性代数进行分析求解),找到一组权重,使训练数据集上的误差之和平方最小化。

线性回归

算法:在训练数据集上找到误差最小的系数集。 模型:
模型数据:整个训练数据集。 预测算法:找出 K 个最相似的行,取其目标变量的平均值。

有些算法很琐碎,甚至什么都不做,所有的工作都在模型或预测算法中。

K- 最近邻算法除了保存整个训练数据集外没有其他的算法。因此,弄醒数据就是整个训练数据集,所有的工作都在预测算法中,即,一行新数据如何与保存的训练数据集交互以作出预测。

K- 最近邻

算法:保存训练数据。 模型:
模型数据:整个训练数据集。 预测过程:找出 K 个最相似的行,取其目标变量的平均值。

你可以把这个分解作为一个框架来理解任何机器学习算法。

机器学习是自动编程

我们真的只是想要一个机器学习的“模型”,而“算法”就是我们获得模型的路径。

机器学习技术用于解决其他方法无法有效或高效解决的问题。

例如,如果我们需要将电子邮件分类为垃圾邮件或非垃圾邮件,我们需要一个软件程序来完成此任务。

我们可以坐下来,手动查看大量的电子邮件,然后写 if 语句来完成合格任务。人们已经试过这个方法。事实证明,这种方法是缓慢的、脆弱的,而且效果也不是很好。

相反,我们可以使用机器学习技术来解决这个问题。具体来说,像 朴素贝叶斯(Naive Bayes)这样的算法就可以从大量的历史邮件样本数据集中学习如何将邮件分类为垃圾邮件和非垃圾邮件。

我们不想要“朴素的贝叶斯”,我们想要朴素贝叶斯给出的模型,就是我们可以用来对邮件进行分类的模型(概率向量和使用概率概率的预测算法)。我们想要的是模型,而不是用来创建模型的算法。

从这个意义上来说,机器学习模型是一个由机器学习算法自动编写、或创建、或学习的程序,用来解决我们的问题。

作为开发人员,我们对人工智能意义上的机器学习算法的“学习”不太感兴趣。我们并不关心模拟学习过程。有些人可能会关心,这很有趣,但这不是我们使用机器学习算法的原因。

相反,我们更看重的是机器学习算法提供的自动编程能力更感兴趣。我们希望能够有效地创建一个有效的模型,并将其融入到我们的软件项目中。

机器学习算法执行自动编程,而机器学习模型是为我们创建的程序。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭