水资源是关乎民生大事,水质的坏坏直接关系到人们的身体健康,同时工业方面,水质的好坏直接关系到工业产品质量,甚至出现不好的水质可能会引起工业锅炉爆炸等事故的发生。水质检测是水产品质量管理工作中常见且重要的工作。随着人工智能技术的发展,通过机器学习算法,通过现有的水色图像信息,对水质进行评价,可以提高水产品质量管理部门人员的工作效率。在此背景下选择基于决策树对城市空气质量的预测课题进行研究很有必要。

本文通过拍摄水样得到不同质量的水样图片,基于颜色矩提取图像特征作为本次水质评价的数据样本,建立水质评价模型。(1)通过颜色矩阵提取拍摄的不同质量的水样图片特征数据,作为数据样本。(2)通过python语言中的CART算法实现基于决策树的水质评价模型,并对该模型进行评估;(3)通过朴素贝叶斯中的GaussianNB算法构建水质评价模型并对其评估;(4)通过SVM算法构建水质评价模型并对其评估;(5)水质评价模型对比,基于决策数、朴素贝叶斯、SVM的水质评价模型准确率以此为70%、87%,95%,所以最终选择基于SVM算法的水平评价模型作为做优模型。

研究背景

近年来,我国水质污染越来越严重,其主要污染的来源河道污染、城市排污两个方面。其危害主要体现在三点:(1)水质污染对环境的危害巨大[1],不但对造成了许多生物逐渐灭绝和减少,而且对相关的环境资源价值大幅度的降低,尤其对生态环境的平衡破坏力很大。(2)水质污染对生产方面的影响也非常大[2],如农作物使用水质不达标的水进行灌溉,会造成农作物减产甚至死亡,工业上如果使用不达标的水,轻则造成工业生产的产品不合格,重则造成重大工业事故,危害人们的生命。(3)污染的水质对人体的健康危害很大[3],轻则可能造成身体不适,重则会产生病变,引发癌症等奇怪的病变。由此可见水质的污染影响之大,以此水质检测工作的重要性不言而喻,基于背景下,本文基于拍摄的池塘水样图像为样本,采用机器学习模型算法实现水色图像的水质评价工作很有必要,所以本文选择该课题作为研究课题。

研究意义

目的:通过对拍摄的池塘水样图像,结合图像切割和特征提取技术,使用决策树算法、SVM算法、朴素贝叶斯算法,对图样的水质进行预测,以辅助生产人员对水质判断。

意义:大多数情况下,渔业生产者通过经验或者肉眼去判断水质,这会使得观察结果存在主观性,从而会影响生产;因此我们利用决策树、支持向量机、高斯朴素贝叶斯这三个机器学习方法为计算机监控技术在水产行业上的应用提供技术支撑,以专家经验为基础来对水塘水质优劣进行分类,从而更加准确快速判断水质情况,进行合理养殖提高渔业产出。

研究基本思路和方法

通过采集鱼塘水样图像,并对水样图形通过图像分割技术提取水样图像颜色的特征矩阵,然后对数据进行选择性的抽取形成所需初步数据,接着对初步数据进行预处理,包括图像切割和颜色矩阵特征提取。利用已经完成数据预处理的数据进行建模,划分测试集和训练集。利用划分好的训练集分类建模,对于分类模型(决策树算法、支持向量机、高斯朴素贝叶斯这三个模型)进行水质评价。

朴素贝叶斯算法介绍

朴素贝叶斯算法概述

朴素贝叶斯算法是遵守贝叶斯定理且和特征条件独立假设的分类算法[25],它的名字中的朴素是指特征条件独立,的名字中的贝叶斯则是指它是基于贝叶斯定理[18]。本算法则是监督学习模型算法,它使用起来十分简单,而且有贝叶斯定理的数据知识作为其坚强的后盾支持,它比较适合大量样本的模型预测。它不适合一些有关联情况的特征条件的样本预测。

朴素贝叶斯的算法原理介绍

朴素贝叶斯的算法是遵守贝叶斯定理,先对贝叶斯定理的相关概念进行介绍。

(1)条件概率[19],一般是指一个事件A在其他一个事件B已经发生的情况下该事件A的发生概率,通常使用P(A|B)表示当B事件发生是A事件发生的概率。

(2)联合概率,一般是指一个事件A与其他一个事件B一起发生的概率,通常使用P(AB)表示事件A和事件B发生的联合概率。其中事件A和事件B的联合概率公式如下:

当事件A和事件B他们之间是相互独立的情况下,则其中事件A和事件B的联合概率公式如下:

贝叶斯定理,通常一个事件A在其他一个事件B已经发生的情况下该事件A的发生概率与一个事件B在其他一个事件A已经发生的情况下该事件B的发生概率是不一样的,但是他们之间确有关系,这种关系被称之为贝叶斯定理。其公式如下。

朴素贝叶斯方法根据上文的概念可知,它是遵守贝叶斯定理且和特征条件独立假设的分类算法,因此将设定好的训练集,需要根据特征条件独立假设的的规则进行学习输入/输出的联合概率分布,对于输入的数据,通过贝叶斯定理进行求解后验概率对应的最大值y。因此朴素贝叶斯的算法原理实质上是通过设定的输入x,利用学习好的模型进行求解后验概率分布,将求解得到的后验概率中最大的类当作x的类进行输出。得到的朴素贝叶斯分类模型的公式[30]如下所示。

本次的研究工作,主要完成基于鱼塘水样图像数据的拍摄获取,并通过图像切割和特征提取技术获得鱼塘水样图像的特征数据,得到R通道一阶矩,G通道一阶矩,B通道一阶矩,R通道二阶矩, G通道二阶矩,B通道二阶矩,R通道三阶矩, G通道三阶矩,B通道三阶矩数值,作为水质评价模型的样本数据,最后通过数据集分割得到训练集和测试集数据。将得到的数据作为样本,分别选择SVM算法、决策树算法、朴素贝叶斯算法来分别构建水质评价模型,通过对比最终得到基于SVM的水质评价模型为最优模型,最后完成论文撰写。

在研究基于机器学习模型实现水色图像的水质评价课题中,解决的问题关键点如下:

(1)解决如何从鱼塘水样图像数据中提取水样图像的特征,通过查阅资料,发现可以将图片进行分割为图像分割成三通道,然后针对每个通道提取阶矩作为图象的的特征数据。因为对图象分割方面的知识掌握较少,经过导师的点播,最终实现了该功能。

 (2)模型的探索方面的实现,因为本人只对SVM算法较为熟悉,对决策树算法、朴素贝叶斯算法掌握的较为模糊,为了能够完成本课题,本人通过B站的资料查阅,对其中的具体实现进行了学习,最终完成了这些模型的实现功能。

 (3)对于朴素贝叶斯算法的评估方面的问题,由于对该算法的模型选择不合理,导致在进行评估的时候函数经常报错,通过查阅各种资料都没有办法解决该问题,最终请教同学,在他的帮助下,终于解决该问题。

 (4)基于SVM的水质评价模型测试集数据混淆矩阵热力图的绘制,改图的使用也是首次编码,因此为了能够展示该图,通过查阅相关网页资料,最终找到通过将数据存入DataFrame中,然后通过sns库中的heatmap()来绘制改入。

经过努力,完成本基于机器学习模型实现水色图像的水质评价课题,本人从中学到不少知识,尤其对多分类的问题有了新的认识,在日后的工作中对我又很大的帮助。

本文基于机器学习模型实现水色图像的水质评价课题,只是从水色图片角度进行分析,来完成水质评价,而没有从其它角度如PH值等具体影响因素角度分析,这种评价模式可能得到的评价结果比较模糊,因此本文后期可以在这方面进行一步研究。

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐