深入解析人工智能、机器学习与深度学习的关系及实现

aixo 2024-06-08 12:13:47
大模型 2024-06-08 12:13:47

1、人工智能、机器学习、深度学习的关系

深度学习_深度学习算法_深度学习框架

2、机器学习

机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。

2.1、机器学习的实现

机器学习的实现可以分成两步:训练和预测,类似于归纳和演绎:

归纳:从具体案例中抽象一般规律,机器学习中的“训练”亦是如此。从一定数量的样本(已知(模型输入X和模型输出Y)中,学习输出Y与输入X的关系(可以想象成是某种表达式)

演绎: 从一般规律推导出具体案例的结果,机器学习中的“预测”亦是如此。基于训练得到的y与x之间的关系,如出现新的输入x,计算出输出y。通常情况下,如果通过模型计算的输出和真实场景的输出一致,则说明模型是有效的。

2.2、机器学习的实施方法

假设模型H,它是一个关于参数w和输入x的函数,用H(w,x) 表示。模型的优化目

标是H(w,x)的输出与真实输出Y尽量一致,两者的相差程度即是模型效果的评价函数(相差越小越好)那么,确定参数的过程就是在已知的样本上,不断减小该评价函数(H的计算结果和Y的差距)的过程。直到模型学习到一个参数w,使得评价函数的值最小。

衡量模型预测值和真实值差距的评价函数也被称为损失函数(损失Loss)

最小化损失是模型的优化目标,实现损失最小化的方法称为优化算法,也称为寻解算法

模型假设、评价函数(损失/优化目标)和优化算法是构成模型的三个关键要素。

2.3、模型结构

深度学习算法_深度学习_深度学习框架

·模型假设:世界上的可能关系千千万,漫无目标的试探Y~X之间的关系显然是十分低效的。因此假设空间先圈定了一个模型能够表达的关系可能,如蓝色圆圈所示。机器还会进一步在假设圈定的圆圈内寻找最优的Y~X关系,即确定参数w。

·评价函数:寻找最优之前,我们需要先定义什么是最优,即评价一个Y~X关系的好坏的指标。通常衡量该关系是否能很好的拟合现有观测样本,将拟合的误差最小作为优化目标。

·优化算法:设置了评价指标后,就可以在假设圈定的范围内,将使得评价指标最优(损失函数最小/最拟合已有观测样本)的Y~X关系找出来,这个寻找最优解的方法即为优化算法。最笨的优化算法即按照参数的可能,穷举每一个可能取值来计算损失函数,保留使得损失函数最小的参数作为最终结果。

未知目标函数f,以训练样本D=(x1,y1),…,(xn,yn)为依据。从假设集合H中,通过学习算法A找到一个函数g。如果g能够最大程度的拟合训练样本D,那么可以认为函数g就接近于目标函数f

3、深度学习

相比传统的机器学习算法,其实两者在理论结构上是一致的,即:模型假设、评价函数和优化算法,其根本差别在于假设的复杂度.

深度学习_深度学习算法_深度学习框架

对于美女这种高级的语义概念,从像素到高级语义概念中间要经历的信息变换的复杂性是难以想象的。这种变换已经无法用数学公式表达,因此研究者们借鉴了人脑神经元的结构,设计出神经网络的模型

3.1、神经网络的基本概念

人工神经网络包括多个神经网络层,如:卷积层、全连接层等,每一层又包括很多神经元,超过三层的非线性神经网络都可以被称为深度神经网络。通俗的讲,深度学习的模型可以视为是输入到输出的映射函数,如图像到高级语义(美女)的映射,足够深的神经网络理论上可以拟合任何复杂的函数。因此神经网络非常适合学习样本数据的内在规律和表示层次,对文字、图像和语音任务有很好的适用性。

深度学习框架_深度学习算法_深度学习

·神经元: 神经网络中每个节点称为神经元,由两部分组成:

o加权和:将所有输入加权求和。

o非线性变换(激活函数):加权和的结果经过一个非线性函数变换,让神经元计算具备非线性的能力。

·多层连接: 大量这样的节点按照不同的层次排布,形成多层的结构连接起来,即称为神经网络。

·前向计算: 从输入计算输出的过程,顺序从网络前至后。

·计算图: 以图形化的方式展现神经网络的计算逻辑又称为计算图,也可以将神经网络的计算图以公式的方式表达:

深度学习框架_深度学习_深度学习算法

其实机器学习就是拟合一个“大公式”,而深度学习则包含多个这样的公式