培训方法解析 人工智能产品经理培训( 二 )
分类(classification):给定一个样本特征,我们要预测其对应的标记值,如果属性值是离散的,那么这就是一个分类问题 。回归(classification):给定一个样本特征,我们要预测其对应的标记值,如果属性值是连续的,那么这就是一个回归问题 。聚类(clustering):给定一组样本特征,我们没有对应的标记值,而是想发掘这组样本在空间的分布,比如分析哪些样本离得近,哪些样本离得远,那么这就是一个聚类问题 。降维(dimensionality reduction):给定一组样本特征,如果需要用维数低的子空间来表示原来高维的特征空间,那么这就是降维问题 。作为一个产品经理,笔者建议要对机器学习的学习模式有深入的了解,要知道各种学习模式主要是用来做什么的 。只有了解这些内容,才能和工程师形成有效的沟通 。
1. 有监督学习 监督学习就是用标注的历史数据进行训练,得到一个模型,然后输入新的数据,根据模型得到一个解 。
如图所示,监督学习算法使用标记数据集生成模型,然后使用带有新数据的模型来验证模型的准确性,或者使用实时数据将模型应用到生产环境中 。
监督学习需要大量的数据作为训练数据,而如果有数据在手,如何划分训练数据和测试数据是一个很头疼的问题 。如果训练数据太少,模型可能不准确,而如果训练数据太多,验证数据可能会受到太多噪声的影响 。
一般建议训练数据和测试数据的比例为6:4到8:2 。
1)监督学习过程:
用一个例子来说明监督学习的过程 。我们想做的功能是用户上传一张照片,系统识别照片是不是自己 。你上传的照片可能是全身,半身,或者只有一只眼睛的特写 。
第一步,数据生成和分类:首先,收集足够多的关于“你”的照片,包括全身、胸围、正面和侧面 。只要一个组中有你的图像,这个组就叫做训练集,用于训练 。
另外,再准备一套照片 。这些照片只有一部分有你的形象,另一部分是别人的照片 。这部分叫做验证集,用来检查训练好的算法模型是否能识别你 。将验证集作为输入,得到一些输出 。有你的照片输出为1,没有你的输出为0 。
第二步,训练:通过神经网络进行训练时,训练集中的每一幅图像都会作为神经网络的输入,通过神经网络中每一层的神经元计算进行特征提取 。当计算完所有神经元后,会得到最右边的输出,不管是1还是0 。
第三步,验证:此时,第一组的数据已经全部用完 。接下来,我们将使用第二组数据来验证训练好的模型的准确性 。在这个过程中,涉及到超参数优化、激活函数的选择等 。
第四步,打包应用:一旦数据验证指标达到预期的设定指标,就对模型进行训练 。该模型可以封装为一个接口并集成到软件中 。软件通过界面与用户交互 。当用户上传照片时,软件会自动调用接口完成计算,并将结果返回给软件程序接口 。
2)一些经典的监督学习算法:
作为人工智能产品经理,不一定要会设计算法,不一定要具体实现算法,但一定要知道算法的内容、特点和能达到的目标 。下一节将介绍两种监督学习算法,即SVM和朴素贝叶斯分类器,产品经理可以有选择地阅读 。
SVM(支持向量机):
SVM是一个非常流行的监督学习模型,可用于分类或回归 。SVM可以有效解决小样本、非线性和高纬度模式识别问题 。因此,SVM被广泛使用 。我们先假设一个2D 空的房间里有不同的人物,如图:
C1和C2是空中的两个类别,C1是一个圆柱体,C2是一个立方体,而中间的可以用一条斜率为w的斜线来区分,斜线就是分类函数,可以将两个样本完全分开 。如果一个线性函数能够完全分离样本,那么数据一般称为线性可分,否则称为非线性可分 。
分类函数是一维的点空,二维的直线空,三维的平面空 。当然还有维数更高或者无穷维的分类函数,所以分类函数也有一个统称叫超平面 。
聪明人自然会发现,上图中的对角线其实是可以左右移动的,如下图所示:
SVM的目的是寻找一个超平面,该超平面可以将样本分成分类区间最大的两类,这是SVM的基本理论模型 。
当然,如果世界上所有的物体都是均匀有规律的分布,很容易计算出结果,但现实世界中并非如此,往往是如图所示的情况 。圆柱体和正方形不规则地散布在这个平面上 。
这种图用一个简单的函数来分类几乎是不可能的 。
于是科学家提出了另一个概念“核函数” 。意味着可以将样本从原来的空空间映射到更高维度的空空间,最后通过高纬空空间中的映射划分完成线性划分 。
推荐阅读
- 时长解析及注销流程图 头条号注销后多久可以重新注册
- 图示最实用的解封方法 闲鱼号被永久封了怎么办
- 超详解析产品预售设置步骤 拼多多预售是什么意思怎么设置的
- 31元红包免费领 饿了么红包免费领取的方法
- 超详解析其办理流程 网络视听许可证怎么办理
- 分享微博推广7大攻略 微博推广方法及策略
- 超详解析各种营销策略 拼多多营销策略分析
- 分享地推营销6大技巧 地推营销的方法有哪些
- 主要内容和7种方法 项目分析的步骤及注意事项
- 苹果屏幕录制开启方法 苹果的录制屏幕在哪里
