最佳日常交易
最佳日常交易

关于Androidbob体育提现bob哪个彩靠谱权威的链接可能会使我们赢得佣金。学到更多。

什么是机器学习,如何工作?

这些天到处都是机器学习,但是它如何工作?
经过
2022年1月4日

来自诸如个人助理Google助手和Alexa涉及YouTube和Amazon的内容建议,很难想到过去几年机器学习并未从根本上得到改进的服务或技术。

简而言之,机器学习是人工智能的一部分,它使计算机可以从自己的体验中学习 - 就像我们在学习或掌握新技能时所做的那样。当正确实施时,技术可以比任何人类都更好地执行某些复杂的任务,并且通常在几秒钟内完成。

鉴于当今社会中普遍存在的机器学习已经变得多么普遍,您可能会想知道它是如何工作的以及它的局限性。为此,这是该技术的简单入门。如果您没有计算机科学的背景,请不要担心 - 本文只是对引擎盖下发生的事情的高级概述。

什么是机器学习?

使用Google镜头来识别OnePlus 7 Pro相机上看到的一堆香蕉。

即使许多人将机器学习术语(ML)和人工智能(AI)混为一谈,但两者之间实际上也有所区别。要了解为什么,值得一开始就开始人工智能的开始。

根据当今的标准,AI的早期申请(大约50年前)非常基本。例如,与计算机控制的对手对抗的国际象棋游戏曾经被认为是革命性的。很容易理解为什么 - 毕竟,基于一组规则解决问题的能力毕竟可以作为基本的“智能”。但是,如今,我们认为这种系统极为基本,因为它缺乏经验,这是人类智能的关键组成部分。这是机器学习的来源。

机器学习使计算机可以从大量现有数据中学习或训练自己。

机器学习为人工智能增加了一个全新的维度 - 它使计算机能够从大量现有数据中学习或训练自己。在这种情况下,“学习”是指建立关系并从给定的一组数据中提取新模式。这很像人类智能的运作方式。当我们遇到不熟悉的事物时,我们会使用感官来研究其功能,并可以在下一次使用我们的记忆来识别它。

机器学习如何工作?

Google IO 2021 ML数据集类型简介
谷歌

从广义上讲,机器学习问题可以分为两个不同的阶段:培训和推理。在第一阶段,计算机算法分析了大量样本或培训数据以提取相关功能和模式。每种算法通常针对某种类型的数据进行优化。数据可以是任何东西 - 数字,图像,文本甚至语音。

同时,培训过程的成功与三个因素有关:算法本身,所提供的数据量以及数据集的质量。正如您对尖端技术所期望的那样,研究人员时不时地提出了提高准确性并降低错误的新算法或技术。另一方面,增加您提供的算法的数据量也可以帮助涵盖更多的边缘案例。

机器学习计划涉及两个不同的阶段:培训和推理。

机器学习算法的输出通常称为模型。您可以将ML模型等同于词典或参考手册,因为它用于未来的预测。换句话说,我们使用训练有素的模型来推断我们程序从未见过的新数据的结果。

培训过程通常涉及分析数千甚至数百万个样本。正如您所期望的那样,这是一个相当硬件的过程,需要提前完成。一旦训练过程完成并且已经分析了所有相关功能,但是,某些结果模型可能足够小,可以适合智能手机等常见设备。

例如,请考虑一个解释手写文本的机器学习应用程序。作为培训过程的一部分,开发人员首先用样品图像为ML算法供应ML算法。最终为他们提供了一个可以包装和部署在Android应用程序中的ML模型。bob体育提现当用户安装应用程序并用自己的新图像馈送时,他们的设备可以引用该模型来推断新结果。在现实世界中,您当然看不到任何内容 - 该应用程序只会将手写单词转换为数字文本。

培训机器学习模型是一项可能需要几个小时甚至几天的硬件密集型任务。

尽管早期的机器学习应用程序依靠云进行培训和推理,但最新的技术进步也使本地,设备的推论也能够进行。当然,这在很大程度上取决于所使用的算法和硬件 - 正如我们将在后面的部分中讨论的。

目前,这是各种机器学习培训技术以及它们如何彼此之间的分析。

监督,无监督和加强学习

培训和推理演示文稿在Google IO上滑动

简而言之,用于训练算法的数据可能属于两个类别之一:标记和未标记。正如您从标题中猜到的那样,监督的学习涉及一个标记的数据集,这有助于培训算法知道它的需求。

以唯一目的的模型是识别狗和猫的图像。如果您用两只动物的标记图像喂养算法,则只是监督学习的一种情况。但是,如果您期望该算法独自找出不同的功能(也就是说,没有标签表明图像包含狗或猫),则它将成为无监督的学习。

在您可能不知道要寻找的模式的情况下,无监督的学习特别有用。此外,新数据不断地回到系统中进行培训,而无需人工提供任何手动输入。

说像亚马逊这样的电子商务网站想创建有针对性的营销活动。他们通常已经对客户了解很多,包括年龄,购买历史,浏览习惯,位置等等。无监督的学习算法将能够本身之间在这些变量之间形成关系。它可能会帮助营销人员意识到,来自特定地区的客户倾向于购买某些类型的服装,或者年轻的购物者更有可能花在娱乐物品上。无论如何,这是一个完全不可接受的数字处理过程。

无监督的学习擅长在数据集中找到模式和关系,这些模式和关系可能会忽略。

总而言之,无监督的学习是一种有用的技术,在场景中并不像已知结果的方案那样简单。

最后,我们有了加强学习,在具有多种实现明确目标的方法中,它在应用程序中特别有效。这是一种反复试验的系统 - 积极的行动得到了奖励,而负面行动则被丢弃。这意味着模型可以根据自己的经验随着时间的流逝而发展。

国际象棋游戏是加强学习的理想应用,因为算法可以从错误中学习。实际上,Google的DeepMind子公司构建了一个ML计划,该计划使用强化学习在棋盘游戏中变得更好。在2016年至2017年之间,它继续打败在竞争环境中,多个世界冠军 - 至少可以说是一项了不起的成就。

那神经网络呢?什么是深度学习?

DNA测序在Google IO上进行深度学习幻灯片

神经网络是受人脑行为启发的机器学习的特定亚型。动物体内的生物神经元负责感觉处理。他们从我们周围的环境中获取信息,并在长距离内传输电信号到大脑。我们的身体有数十亿个这样的神经元,它们都相互交流,帮助我们看到,感觉,听到,以及介于两者之间的一切。

人工神经网络模仿动物体内生物神经元的行为。

在这种情况下,神经网络中的人造神经元也相互交谈。他们将复杂的问题分解为较小的块或“层”。每一层都是由神经元(也称为节点)组成的,该神经元完成了特定的任务,并将其结果与下一层中的节点传达。例如,在接受识别对象的神经网络中,您将有一个层的神经元检测边缘,另一个查看颜色变化等等。

层相互链接,因此“激活”特定的神经元链可为您提供一定的可预测输出。由于这种多层方法,神经网络在解决复杂问题方面表现出色。例如,考虑自动驾驶或自动驾驶车辆。他们使用无数的传感器和相机来检测道路,标牌,行人和障碍。所有这些变量彼此之间具有一定的复杂关系,使其成为多层神经网络的完美应用。

深度学习是一个经常用来描述具有许多层次的神经网络的术语。“深处”一词只是指层深度。

我们在哪里看到机器学习在我们的日常生活中?

索尼Xperia 1 III Google Assistant
罗伯特·特里格斯(Robert bob体育提现bob哪个彩靠谱Triggs / Android)

机器学习几乎影响了我们数字生活的各个方面。例如,像Instagram这样的社交媒体平台经常根据与您互动的帖子显示针对您的广告。如果您喜欢包含食物的图像,则可能会收到与用餐套件或附近餐馆有关的广告。同样,根据您的手表历史记录和持续时间,YouTube和Netflix等流媒体服务可以推断您可能感兴趣的新类型和主题。

即使在诸如智能手机之类的个人设备上,诸如面部识别之类的功能也很大程度上依赖于机器学习。拿Google照片例如,应用程序。它不仅可以从您的照片中检测到面孔,而且还使用机器学习来识别每个人的独特面部特征。您上传的图片有助于改善系统,从而使其在将来做出更准确的预测。该应用程序还通常会提示您验证某个匹配是否准确 - 表明该系统在该特定预测中的置信水平较低。

也可以看看设备机器学习如何改变了我们使用手机的方式

确实,机器学习是在最短的时间内实现合理的准确性。当然,这并不总是成功的。

2016年,微软公布了一个名为Tay的最先进的聊天机器人。作为其类似人类的对话能力的展示,该公司允许Tay通过Twitter帐户与公众互动。但是,这个项目是离线在机器人开始以贬义的言论和其他不当对话回应后的短短24小时内。

上面的示例突出了一个重要的观点 - 只有在培训数据相当高质量并且与您的最终目标保持一致的情况下,机器学习才真正有用。泰(Tay)接受了现场Twitter提交的培训,这意味着它很容易被恶意演员操纵或训练。

机器学习不是一种千篇一律的安排。它需要仔细的计划,多样化和清洁的数据集以及偶尔的监督。

撇开机器学习的危险,该技术还可以在传统方法无法保持步伐的情况下有助于。

渲染图形复杂的视频游戏代表一个这样的应用程序。几十年来,我们一直依靠年度绩效提高来完成这项任务。但是,处理能力具有开始高原最近 - 即使其他技术(例如展示决议和刷新率)继续前进。

NVIDIA的深度学习超级采样(例如DLSS)正在帮助弥合这一差距。DLSS的工作方式相当简单 - GPU首先以较低的分辨率呈现图像,然后使用训练有素的ML模型来对其进行调整。至少可以说,结果令人印象深刻 - 比传统的非ML升级技术要好得多。同样,超分辨率进行尺度用于改善智能手机摄影图像质量。机器学习不仅仅是基本预测。

硬件如何影响机器学习性能?

与GPU一起采矿
Edgar Cervantes / bob体育提现bob哪个彩靠谱Android Authority

上述许多机器学习应用程序,包括面部识别和基于ML的图像升级,曾经在消费级硬件上无法完成。换句话说,您必须连接到位于数据中心中的功能强大的服务器,以完成大多数与ML相关的任务。

即使在今天,培训ML模型也是非常硬件的密集型,并且几乎需要用于大型项目的专用硬件。但是,由于培训涉及少数算法反复运行,因此制造商经常设计定制的芯片以提高性能和效率。这些称为特定应用程序的集成电路或ASIC。大型ML项目通常使用ASIC或GPU进行培训,而不是通用CPU。与传统的CPU相比,这些提供更高的性能和更低的功耗。

机器学习加速器有助于提高推理效率,从而可以将ML应用程序部署到越来越多的设备上。

但是,事情已经开始改变,至少在事情的推理方面。设备机器学习开始在智能手机和笔记本电脑等设备上变得越来越普遍。这要归功于将专用的硬件级ML加速器包括在现代处理器和SOC中。

阅读更多为什么智能手机芯片突然在内,包括AI处理器?

与普通处理器相比,机器学习加速器非常有效。例如,这就是为什么我们之前谈到的DLSS升级技术仅在较新的地方可用NVIDIA图形卡带有必要的ML加速器硬件。在智能手机中,我们看到了特定的低功率加速器,设计用于语音检测以及ML加工功率与更传统的图像处理器的紧密集成在一起的增长趋势,以提供更好的摄影。

展望未来,我们很可能会根据每个新硬件生​​成的机器学习加速功能来看到功能细分和排他性。实际上,我们已经在目睹智能手机行业发生的事情。

边缘的机器学习:智能手机和消费设备

像素6显示现场字幕
Ryan Haines / bob体育提现bob哪个彩靠谱Android权威

ML加速器已内置在智能手机SOC中已有一段时间了。但是,由于用例的兴起,它们已成为后期的关键焦点计算摄影和语音识别。

2021年,Google宣布了其第一个半定期SOC,昵称为Tensor像素6。Tensor的主要区别者之一是其自定义TPU或Tensor处理单元。Google声称,其芯片提供了更快的ML推理与竞争相比,尤其是在自然语言处理等领域。反过来,这允许Google在Pixel 6上使用Tensor来用于一套新功能,包括实时语言翻译,启用HDR的视频录制以及更快的语音到文本功能。来自Mediatek,高通和三星的智能手机处理器也有自己的专用ML硬件。

也可以看看什么是Google Tensor?

这并不是说今天基于云的推断仍未使用,实际上恰恰相反。尽管机上的机器学习变得越来越普遍,但它仍然远非理想。当我们考虑语音识别和图像分类等复杂问题时,尤其如此。像亚马逊这样的语音助手AlexaGoogle Assistant仅与今天一样好,因为他们依靠强大的云基础架构 - 用于推理和模型重新训练。

设备机器的学习启用了许多未来派智能手机功能,包括计算摄影,实时翻译和现场字幕。

但是,与大多数新技术一样,新的解决方案和技术一直在范围内。在2017年,Google的hdrnet算法彻底改变了智能手机成像,而Mobilenet降低了ML型号的大小,并使设备推理可行。最近,该公司强调了如何使用隐私保护技术称为联合学习用用户生成的数据训练机器学习模型。

同时,苹果还将硬件ML加速器集成到如今的所有消费者芯片中。这苹果M1例如,最新MacBook中包含的SOC家族具有足够的机器学习咕unt声,可以在设备本身上执行培训任务。


因此,您现在可以加快机器学习的基础知识!如果您想自己开始使用该技术,请考虑查看我们的指南将机器学习添加到Android应用bob体育提现