开头森哥说:假期前后在准备成像技术的总结,目前已完成两部分,争取在摸索出一些编辑和运营技巧后,完善成一个系列和大家见面;当然也有可能会通过一些更加贴合摄影实用的角度出一些更加浅显的内容。最终如何呈现还需要慢慢摸索。

传统机器学习是指在深度学习盛行之前开发的机器学习和人工智能技术。这些传统方法通常依赖于手工设计的特征提取和模型结构。而深度学习是一种机器学习技术,它通过深层神经网络从原始数据中学习特征表示,大大减少了手工特征工程的需求。

一、人工智能模型层面对比

传统机器学习的对比非机器学习和深度学习优势和劣势有哪些呢?

1、从可解释性、处理复杂数据、训练效率方面来说,列举传统机器学习方法(线性回归、决策树、支持向量机)和深度学习的优势和劣势对比如下,主要影响因素是数据集和任务特点。

典型差异 传统机器学习 深度学习
可解释性 具有较好的可解释性,直观易于理解,能够清晰地展示特征对预测的影响。 深度神经网络中的隐藏层表示难以解释,使得模型的决策过程不够透明。
针对复杂数据 在处理小到中等规模的数据集时表现出色,特别是在特征与目标之间存在线性或简单非线性关系时。 能够自动学习更复杂的特征表示,所以数据集非常庞大、复杂且特征之间存在高度抽象的关系时,深度学习方法更适用。
训练效率 在处理小规模数据集时,不需要大量计算资源,训练时间较短。 一般参数较多,需要更长的训练时间。

2、更详细的,通过对比传统机器学习、深度学习和传统规则系统的优缺点对比列表如下:

特征 传统机器学习 基于规则的系统 深度学习
数据需求 需要精心设计和提取特征 不依赖于特征工程,直接使用原始数据 部分情况下需要特征工程,但可以从原始数据中学到更高层次的特征
算法复杂性 通常使用相对简单的算法,如线性回归、决策树 无算法,直接根据规则进行决策 使用深度神经网络,参数量较大,模型更复杂
自动化程度 需要手动选择和调整模型参数 完全基于规则,无需参数调整 自动学习特征表示和模型参数,但需要调整神经网络架构和超参数
适用场景 适用于小规模数据,特征明显且可解释性要求高的场景 适用于基于规则的问题,数据量较小的场景 适用于大规模数据,复杂模式和高度抽象特征的场景
泛化能力 对于特定任务的泛化能力较好 通常泛化能力较差,对新数据的适应能力受限 在大规模数据上训练时具有较强泛化能力,但对于小数据集可能容易过拟合
训练时长 训练速度较快 无需训练,基于规则直接执行 训练速度较慢,特别是在深层网络和大规模数据集上
可解释性 模型通常具有较好的可解释性 具有较好的可解释性,因为决策基于预定义的规则 较难解释,深度神经网络的决策过程较为复杂
参数规模 模型参数较少 无参数,基于规则 模型参数较多,尤其是深层网络

二、传统机器学习分类

传统机器学习的方法主要包括监督学习、无监督学习、半监督学习等。

1、监督学习:在监督学习中,系统会被给定一组已知输入和输出的样本数据,系统需要学习到一种函数,使得该函数能够根据给定的输入预测出正确的输出。

​ 这种机器学习方法通常用于分类和回归问题。例如,电子邮件过滤系统就是一个分类问题的例子,其中训练数据包括已标记的垃圾邮件和非垃圾邮件,模型将学习区分垃圾邮件和非垃圾邮件。回归问题的一个例子可能是房价预测,模型将根据房屋的各种属性(如面积、卧室数等)来预测房价。

2、无监督学习:在无监督学习中,系统只有输入数据,没有输出数据。系统需要学习到一种函数,使得该函数能够将输入数据自动分类。

​ 这种机器学习方法通常用于聚类和降维问题。例如,K-means聚类是一种无监督学习算法,它可以将数据集划分为K个不同的群组。另一个例子是主成分分析(PCA),这是一种降维技术,可以将高维数据集转化为低维数据集,同时保留最重要的特征。

3、半监督学习:半监督学习是一种混合监督学习和无监督学习的方法。在半监督学习中,系统会被给定一部分已知输入和输出的样本数据和一部分未知的输入数据,系统需要利用已知的样本数据来学习到一种函数,使得该函数能够根据未知的输入数据预测出正确的输出。

​ 这种机器学习方法结合了监督学习和无监督学习的特点。例如,你可能会遇到一种情况,你有大量的未标记数据和少量的标记数据。这种情况下,你可以使用半监督学习算法,如标签传播或贝叶斯网络,来利用未标记数据来提高模型的性能。

三、传统的目标检测方法

​ 因为之前作为类似的图像处理,以火焰目标检测为例,针对图像的特征进行特征提取研究,针对火焰图构建火焰颜色模型、背景差法、帧差法,以及对火焰的动态特征、颜色纹理特征建立模型,传统方法的优化方向是提取特征以及特征融合,但是传统方法依然解决不了火焰的形状和大小方向随机变化等问题。

​ 分析目标的特征,火焰明亮且颜色特征明显,通过颜色特征研究是有效的一种检测火灾的办法,模型常用的色彩空间有RGB、HSI、YUV三种。RGB模型的颜色是由三基色通过分量混叠得到,构建出立方体模型,火焰的颜色一般是红色或者黄色,在RGB模型中就是红色和绿色的分量比较大,所以火焰检测就取决于对红色分量的亮度和饱和度分析。其他比如HSI模型可以把亮度信息从色彩信息中分离出来,从而避免光照等因素的影响;YUV模型通过灰度值Y对亮度的分离,避免了光照的影响。

​ 为了弥补色彩空间模型识别率的不足,解决夕阳灯光等相近颜色对检测的影响,对火焰的运动特征进行研究,常用的有背景差法和帧差法。

​ 背景差法是通过坐标点建立背景模型,通过对坐标点像素点与模型中该坐标点进行匹配,成功则认为该坐标点是背景坐标,否则认为是火焰目标的坐标。帧差法是设定阈值K,背景图像的像素值在K值以内变化,超过了K的像素值,则认为是火焰运动使得目标区域的像素值变化引起的。

四、传统机器学习的经典模型

  1. 逻辑回归(Logistic Regression): 逻辑回归是一种用于解决二分类问题的线性模型。它通过将输入特征与权重相乘,并将结果通过一个sigmoid函数映射到0和1之间的概率来进行分类。
  2. 决策树(Decision Trees): 决策树是一种基于树形结构的分类和回归模型。它通过将输入数据逐步划分为不同的决策节点,并根据特征进行分类。
  3. 支持向量机(Support Vector Machines,SVM): SVM是一种二分类模型,通过寻找一个最优的超平面,将不同类别的样本尽可能分开。
  4. k-近邻算法(k-Nearest Neighbors,k-NN): k-NN是一种基于实例的学习算法,它通过测量输入样本与训练集中的样本之间的距离来进行分类。

这些经典模型,有兴趣可以单独来讲,这里就不再赘述。

微信公众号:森哥谈成像技术!

森哥说:以前我们学习人工智能的路线都推荐从传统的机器学习来学习,就会有这样的经历,陷入了模型的困局里孜孜不倦,学了一段时间之后发现学到最后的才发现微调模型和之前的关系不大。所以我也认为当前一些大佬的推崇的方法,从实用主义出发,先了解和工作相关的,上手之后再一步步补充知识库,比如在传统机器学习里挑选两个模型进行研究,在以前更传统的方法中就某个领域了解其方法。

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐