当前位置:首页 > 智能硬件 > 人工智能AI
[导读] 不管你是机器学习的初学者,还是中级程序员,你都可能此问题感到困惑。如何建立备忘单?从本文中你能学到什么? 在机器学习中,没有任何一种方案可以解决所有问题。由于算法种类繁多,很难找出正确的

不管你是机器学习的初学者,还是中级程序员,你都可能此问题感到困惑。如何建立备忘单?从本文中你能学到什么?

在机器学习中,没有任何一种方案可以解决所有问题。由于算法种类繁多,很难找出正确的算法来解决问题。

不过无需担心,在本文中,我们将介绍如何使用备忘单简化机器学习方法,你可以使用该备忘单选择适合解决问题的正确算法。

以下为备忘单-你需要了解机器学习的技巧。

备忘单使用指南

选择算法时需要考虑的因素

有几个因素会影响你的选择。有一些问题较为特殊,需要专门的方法解决。例如,推荐系统可用于解决此类问题。虽然某些类型的问题是开放的,但它们需要反复试验、排除错误。监督学习、分类和回归是解决开放类问题的方案。

你想对数据执行什么操作—分类、回归还是聚类?

大小:在选择算法时,数据集的大小(无论大小)很重要。

质量:你的数据集中有多少变化,数据集是否平衡。

数据性质:我们是否标记了数据?模型的输入和输出如何表示?

时间可用性:你需要花费多少时间来构建和训练模型。某些模型可以更快地构建,但准确性会逊色一些。

速度或准确性:对于可用于生产的模型,你可能对准确性有较高的要求,但有时计算速度更快的快速工作模型就可以满足你的需求。

若想使用备忘单,你只需查看图表上的选择标签,然后移向回答问题的箭头。例如:

如果你想减少维度数量并且不需要主题建模,请使用PCA。

如果要预测某个变量的数值,且需要较高的准确性,则应尝试使用“随机森林”、“神经网络”或“梯度提升”树。

如果你没有标记数据并想执行聚类,则可以使用k-近邻聚类算法。

选择正确的算法

值得一提的是,即使是经验丰富的数据科学家也无法在不尝试其他算法的情况下分辨出哪种算法效果最好。条条大路通罗马,该备忘单可能不是解决问题的唯一方法。该备忘单仅希望为你提供基于已知因素可以使用哪些算法的指导。

机器学习算法的类型

1. 监督学习

监督学习算法即对操作的直接监督。我们使用数据来教导或训练机器,这意味着数据被标记了正确的答案。使用一种算法来分析训练数据并获得输入与输出映射的功能。然后,可以根据训练数据进行概括,使用该函数来预测未知输入的输出。监督学习基本上用于以下两种类型的问题。

分类:在分类问题中,你需要找到输入数据的类别。例如,将图像分类为“狗”或“猫”。

回归:在回归问题中,输出为实数值。请尝试根据输入来预测变量的值。

2. 半监督学习

监督学习需要使用已标记的数据,如果其他人没有从事类似项目,则要查找或生成这些数据可能会很困难。在半监督方法中,我们将某些标记数据与未标记数据一起使用。

如你所见,数据没有完全标记,这就是将其称为半监督学习的原因。通过将标记数据与未标记数据结合使用,可以提高模型的准确性。

3. 无监督学习

无监督学习应用于未标记的数据。机器必须在没有任何监督的情况下找出数据中的模式、异同之处,执行聚类并减少维数。

集群:根据一些标准和相似性,数据被分组为一个或多个集群。例如,根据客户的购买行为对其进行分组。

降维:某些数据的特征或维度可能并不用于模型训练。使用某些算法,我们可以避免考虑维度和不相关的特征。此过程称为降维。

4. 强化学习

强化学习能够根据环境的反馈来优化代理。当机器做出正确的决定并对其错误的决定进行惩罚时,代理商会对其给予奖励。这项学习不需要我们事先收集数据再清理数据。该系统可自我维持,尝试在现实世界中自我完善。基于强化学习的计算机程序AlphaGO击败了世界上最厉害的围棋选手。

尾注

机器学习问题可以通过多种方式解决,你可以根据多种因素选择算法,例如准确性、客观性、数据大小和数据性质。你也可以参考备忘单,并快速开始构建模型。一旦解决了问题并获得了结果,就可以进一步探索不同的算法,以找出最适合该特定问题的最佳算法。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭