基于决策树雪花牛肉大理石花纹分级模型

发布时间:2022-12-09 22:53:23   来源:文档文库   
字号:
※基础研究 良晶科学 2015.V36No. 7 65 基于决策树雪花牛肉大理石花纹分级模型 琨 ,丁冬 ,彭增起。,沈明霞 木,林盛业 ,曹辉 (1.南京农业大学工学院,江苏南京 210031;2.江苏省现代设施农业技术与装备工程实验室,江苏南京 210031; 3.南京农业大学食品科技学院,江苏南京 210095;4.陕西秦宝牧业股份有限公司,陕西宝鸡 721000) 要:为建立雪花牛肉大理石花纹等级评价方法,根据不同等级雪花牛肉大理石花纹图像特征及人工评级的标 准,确定了影响大理石花纹的等级主要因素。本研究提出影响大理石花纹等级的几何参数特征、几何分布参数特征 和统计参数特征。其中几何参数特征主要反映大理石花纹面积、周长等;几何分布特征主要反映大理石花纹图像中 脂肪颗粒沉积的密度,根据脂肪颗粒沉积情况可分为大颗粒脂肪、中颗粒脂肪、小颗粒脂肪等;统计参数特征主要 反映大理石花纹丰富程度以及大理石花纹分布均匀性。利用相关性分析提取影响雪花牛肉大理石花纹等级的特征参 数。建立基于C4.5和CART算法的决策树模型,结果表明:对于C4.5算法建立的决策树分级模型,三级和五级大理 石花纹分级预测精度分别为91.80%、92.31%,而该模型针对四级样本建立的模型无效,其结果多数误判为三级; 对于CART算法建立的决策树模型同样存在这样的问题,即三级和五级大理石花纹分级预测精度高,而对四级样本 分级无效。 关键词:雪花牛肉;大理石花纹;分级模型:决策树 Classication of Snowfake Beef Marbling Grades Based on Decision Tree LIANG Kun 一,DING Dong‘PENG Zengqi ,SHEN Mingxia 一,LIN Shengye ,CAO Hui 1.Colege ofEngineerng,Nanjng Agrculural Universy,Nanjng 210031,China; 2.Jiangsu Province Engineerng Laboraory or Modem Faciy Agrculure Technology and Equipment,Nang 210031,China; 3.Colge of Food Science and Technology,Nang Agrculural Universy,Nang 210095,China; 4.Limied Libiy Company of Qin Bao Anima Husbadry n Shaaxi Province,Baoj 721000,China Abstract:In order to establish a method to evaluate snowfakes beef marbling grades,the main factors affectng grading marbling were identifed by comparing the image features with artifcial rating criteria of different snowfakes beef marbling grades.This study presented the geometric feature parameters,geometric distribution feature paameters and statstica feature paameters afecting marbling grade.The geometric featre paameters mainly refected the mabling ea,permeter ad so on.The geometric distributon feature paeters mainly refected te different depositon densities of lage,medum ad small fat particles in the mabling image.Te statistca feature paameters mainly refected the mabling abundance and marbling distribution uniformity.Correlation analysis between the features parameters extracted and snowfake beef mabling grades was conducted.Decision tree models were established based on C4.5 ad CART algorm, d the results showed at he predction accuracy ofthree—level ad ve—level grades were 91.80%ad 92.31%,respctvely, however.t mode1  e evel saple model was nvad d e miudgment esul were mosy hree—eve1.The sallle problem existed in the predicton accuracy of models based on CART algorhm. Key words:snowfe beef;mabling;classifcaton model;decision tee 中图分类号:TS251.3 文献标志码:A 文章编号:1002—6630(2015)17—0065—06 doi:10.7506/spkx1002—6630-201517013 雪花牛肉作为我国高档牛肉,富含高浓度亚油酸以 富脂肪,这种分布形成了类似大理石花纹图案 。脂 及钙磷铁等矿物质,牛的背最长肌中沉积了雪花状的丰 肪分布量不同,其大理石花纹等级亦不相同,脂肪分布 收稿日期:2015—02—03 基金项目:国家现代农业(肉牛)产业技术体系建设专项(CARS.38);中央高校基本科研业务费专项资金项目(KJQN201557); 农业科技成果转化资金项目(SQ2011ECC100043);南京农业大学科研启动基金项目(RCQD13—15) 作者简介:梁琨(1983一),女,讲师,博士,主要从事农产品检测技术研究。E—mal:lkbb2006@126.com }通信作者:沈明霞(1964一),女,教授,博士,主要从事检测技术自动化装置研究。E—ma:mngxia@njau.edu.cn 
6 201 ̄VL36No17 食品科学  材料与方法 1. 数据采集 ※基础研究 越多,等级越高口 】,因此大理石花纹可以作为评定雪花 牛肉品质主要指标。近年来随着人们生活水平的不断提 高,对雪花牛肉的需求量也不断增大,而雪花牛肉等级 不同其经济价值差别亦较大【 。目前雪花牛肉分级主要采 用人工分级,存在主观性强、易产生视觉疲劳等缺点 , 因此研究雪花牛肉大理石花纹等级识别方法对规范雪花 本研究实验数据采集于2012tz5月一2013年7月期 间在陕西秦宝牧业进行,所选用雪花牛肉样本来自陕西 本地秦川牛与日本和牛、澳大利亚安格斯牛三元杂交肉 牛,样本屠宰后在冷库车间排酸72 h后分割二分体。雪花 牛肉眼肌横切面图像的获取采用南京农业大学自主研发 的基于机器视觉雪花牛肉采集系统,实验时采集牛胴体 二分体第6至7根肋骨眼肌横切面图像,为保证图像样本 牛肉市场、提高生产效率有重要意义。 机器视觉技术被广泛应用于牛肉自动分级检测领 域。Shirania等 提取了牛肉大理石花纹图像中肌内脂 肪面积比、脂肪颗粒总数、大脂肪颗粒数、小脂肪颗粒 数以及脂肪分布系数,作为图像特征分析结构表明牛肉 大理石花纹等级与肌内脂肪面积比、大脂肪颗粒数和脂 肪分布系数之间显著相关。Jeyamkondan等 将牛胴体眼 肌肌内脂肪的面积、周长以及脂肪颗粒数作为判定牛肉 大理石花纹等级的特征参量,并且通过多元回归分析得 到数学模型与由专业牛肉质量评定师判定的结果是等价 的。孟祥艳I 提取牛肉大理石花纹图像的几何、粒度及形 状参数来表征花纹几何、形状及分布特点,利用主成分 分析法对影响大理石花纹等级的参数进行线性组合,建 立大理石花纹的等级预测模型。周彤等”伽为评价大理石 花纹的丰富程度,提取大理石花纹面积比值、大脂肪颗 粒个数和密度、中等脂肪颗粒个数和密度、小脂肪颗粒 个数和密度、总脂肪颗粒个数和密度、脂肪分布均匀度 l0个指标为特征参数对牛肉大理石花纹进行评。陈坤杰 等 利用牛肉大理石花纹的面积比率、总脂肪颗粒数、 大小脂肪颗粒数以及每个牛肉大理石花纹样本图像的计 盒维数和信息维数这些参数为基础,分别建立了牛肉大 理石花纹等级判定的多元线性模型和多元多项式模型。 针对我国雪花牛肉大理石花纹的分级研究,研究学 者取得了一定成果。刘超超n 、李小林 等研制的基于嵌 入式机器视觉技术雪花牛肉等级分级系统, 研究了屠宰 车间生产环境中的胴体雪花牛肉图像采集系统,并利用 图像处理方法进行了预处理、提取了大理石花纹图像的 花纹面积、周长等特征。马鹏鹏【 研究了基于凹点检测 方法的雪花牛肉大理石花纹图像分割。刘璎瑛等n 提出 用粗糙度和细密度来定量描述脂肪的分布特征,并研究 了两个指标能够随雪花牛肉大理石花纹脂肪含量的变化 情况。但是针对雪花牛肉大理石花纹分级模型的研究相 对较少。 本实验在前人研究基础上,提出了影响雪花牛肉大 理石花纹等级的几何参数、几何分布参数和统计参数特 征,分析每个特征大理石花纹等级之间的相关性,从而 选择建模有效的特征变量。研究利用决策树方法建立雪 花牛肉大理石花纹分级模型,分别建立基于C4.5算法和 CART算法模型,比较两种算法的预测精度,从而建立分 级效果较好的决策树模型。 的有效性和一致性,实验保持眼肌表面切割平整,无明 显刀痕、碎肉沫、水分等干扰,尽量保证不要有外界光 线进入采集密闭装置,并使整个眼肌区域完整的处于采 集图像中心位置。实验共采集有效样本222幅,其中一级 至五级图像样本数量分别为l5、75、88、25、19;样本 总量成正态分布,这与企业实际雪花牛肉生产数量相吻 合。每一幅图像人工等级根据日本雪花牛肉评级标准图 版进行5个等级评定,最终结果为两个或两个以上评级员 所评等级。利用图像处理算法,将采集样本图像经过灰 度化、滤波、图像增强、眼肌区域提取,大理石花纹提 取等预处理 】 1.2 图像特征提取与选择 1.2. 特征提取 通过比较不同等级雪花牛肉大理石花纹图像特征 及人工评级的标准,确定影响大理石花纹的等级主要因 素。本研究提出影响大理石花纹等级的几何参数特征、 几何分布参数特征和统计参数特征。其中几何参数特征 主要反映大理石花纹面积、周长等 】;几何分布特征主要 反映大理石花纹图像中脂肪颗粒沉积的密度,根据脂肪 颗粒沉积情况可分为大颗粒脂肪、中颗粒脂肪、小颗粒 脂肪等 ;统计参数特征主要反映大理石花纹丰富程 度以及大理石花纹分布均匀性n 。表1为提取的雪花牛 肉大理石花纹图像18个特征。 表1 雪花牛肉大理石花纹图像特征变薰 Table 1 mage features of snowfake beef marblng 雪花牛肉大理石花纹图像的几何参数特征是根据 眼肌区域的大理石花纹的几何特征进行描述。眼肌总像 
※基础研究 良晶科学 2015。V36No.17 67 素定义为图像二值化算法处理后眼肌区域内包括所有像 素总和;眼肌面积为单位像素所对应实际样本的面积 (cm )与眼肌区域总像素乘积;大理石花纹含量为眼肌 区域代表脂肪颗粒所有黑色联通区域像素总和与眼肌区 域总像素比;大理石花纹周长定义眼肌面积内所有代表 脂肪颗粒所有黑色联通区域周长总和;轮廓面积比定义 为大理石花纹周长比眼肌面积;轮廓周长比定义为大理 石花纹周长比眼肌周长。 根据采用硬件相机的放大倍数下所拍摄的眼肌图片 与人眼观测下的眼肌花纹辨析度,确定本研究中颗粒脂 肪定义。其中,小颗粒脂肪数量为孤立的连通区域像素 个数在20 ̄50个像素之间的连通区域个数;中颗粒脂肪 数量为孤立的连通区域像素个数在50 ̄450个像素之间的 连通区域个数:大颗粒脂肪数量为孤立的连通区域的像 素个数在450个像素以上的连通区域个数。小颗粒数量密 度为小颗粒的总像素/1 ̄肌总像素,小颗粒分布密度为小 颗粒的总个数I ̄I ̄肌区域面积(cm2);中颗粒与大颗粒 数量密度和分布密度定义与之类似。 统计参数特征定义根据脂肪面积差异均匀性和脂 肪数量及位置分布均匀性。粗糙度主要指大理石花纹中 各个脂肪面积之间的差异性,大理花纹脂肪颗粒面积分 布越不均匀,其粗糙度越大。细密度主要表示大理石花 纹中脂肪数量的分布,大理石花纹面积相同的样本中, 脂肪颗粒数量越多,其大理石花纹细密度越大。大理 石花纹粗糙度及细密度测量参照文献中方法计算[ ,公 (1)为粗糙度(c)计算公式,公式(2)为细密度 ,)计算公式,脂肪颗粒相对标准差表示脂肪分布均匀度, 也IC  ̄肪颗粒分布变异系数( ),计算方法如公式(3) 所示。 ( 一   f=1 — 广 (1) C= ×————:= n×M F=爱 (2) 1 丽  ( 一 (3) —■ 广 式中:n为大理石花纹中提取的脂肪数量;[  M ,…,^ 为各个脂肪的面积; 为脂肪平均面积;Sr为 有效切面的面积。 1.2.2 特征选择 为了保证利用高效的特征变量建立模型,本实验研 究提取的雪花牛肉图像特征变量与人工评定等级之间的 相关性分析,根据相关系数选择针对有效模型的特征变 量,相关系数(,)计算如公式(4)所示。 量(xi— )( -y) 1 (4) 式中: 为样本总数;x 为特征变量中第i个样本; 为特征变量样本平均值;Y 为等级变量第f个样本; 为 等级样本平均值。 1. 决策树模型建立 在建立决策树模型时,根据分裂准则的不同,可 采用基于信息论(information theory)和最t ̄GINI指示 (1owes GINI index)两种方法 。本实验分别采用基于 信息论方法构建C4.5算法和基于最小GINI指示方法构建 CART算法建立雪花牛肉大理石花纹分级模型,比较两种 算法的训练集样本和验证集样本的分级准确率,选择较 好的决策树模型。为保证模型的准确性而不出现过拟合 的现象,选择10折交叉验证(10.old cross valdaton)估 算训练集建立模型的准确率。 1_3. 基于C4.5算法决策树模型 C4.5算法计算信息增益比来确定每个节点的分类属 性,每个节点军训则具有最高信息增益比的属性作为前 节点的分裂属性。这种属性选择方法使之后生成决策树 对训练样本进行分类时所需信息最小。C4.5算法流程如 下¨9。 :1)创建节点Ⅳ;2)如果训练样本琊属于同一 类C,则Ⅳ为叶节点,标记为类C;3)如果训练样本的属 性数为空,即没有属性进行分裂,则沩叶节点,标记该 节点为 中出现最多的类;4)如果不满足2)、3),则 计算训练样本略属性信息增益率:假设琨一个训练样 本,样本总量n属于m各类别,其中第f个类在 中出现的 比例为 ,则丁的信息熵 ( ))计算公式如下。 1( )=∑-pflognof (5) 若属性 将戒0分为v个子集{ , , },其中 包 含样本数n 则划分后熵(E( ))计算公式如下。 ( )=∑ tl 1( ) (6) 分裂后的信息增益(Gain(T,A))计算公式如下。 Gan(T,A)=,( )一E( ) (7) 训练样本 关于属性 的各取值的熵计算公式如下。 o( _季, 季)×—l ( 式中: 为训练样本 中 属性第f各取值对应的子 集,属性 划分v个子集。则信息增益比计算公式如下。 GR(丁 = (9) 5)选择各属性中具有最高信息增益率的属性作为分 裂属性,将训练样本分割;该属性的各个取值对应生成 心的子节点;6)对每个从节点Ⅳ长出的新子节点进行判 

本文来源:https://www.2haoxitong.net/k/doc/ff1002f43e1ec5da50e2524de518964bcf84d2ed.html

《基于决策树雪花牛肉大理石花纹分级模型.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式