在某些生产过程中 ,输入参数与输出参数之间的关系是复杂的非线性关系 ,使人们往往在诸多输入参数对输出值的影响方面了解甚少 ,建立整个过程的数学模型十分困难。运用人工神经网络 ,将这一过程看作一个黑箱 ,只要收集一定数量的输入、输出样本 ,神经网络经过学习和训练 ,确定连接权和阈值 ,即可实现输入到输出的正确映射。并可利用建立的模型 ,预测输入对输出的影响。正是由于上述特点 ,人工神经网络在材料热处理学科的应用越来越受到重视<1~ 5 > 。本文利用人工神经网络技术 ,对建立结构钢端淬曲线预测系统的模型进行研究。图 1 神经网络结构Fig .1 Topologystructureofneuralnetwork1 数学模型采用三层B—P神经网络结构来完成函数的映射 ,如图 1所示。输入层的输入矢量为x∈R9,x =(x1,x2 ,… ,x9) T,分别代表钢的 8个合金元素含量和奥氏体加热温度 ;隐层有n0 个神经元 ,x’∈Rn0 ,x’ =(x’1,x’2 ,… ,x’n0 ) T,第三层为输出神经元 ,y∈R10 ,y =(y1,y2 ,… ,y10 ) T,分别代表至水冷端不同距离处的硬度值 ,输入层与隐层之间的权为ωij(i=1 ,2 ,…n ;j=1 ,2 ,… ,n0 ) ,阈值为θj(j=1 ,2 ,… ,n0 )。隐层与输出层之间的权为ω′jl(j=1 ,2 ,… ,n0 ;l=1 ,2 ,… 1 0 ) ,阈值为θ′l(l=1 ,2 ,… ,1 0 )。神经网络的输入与输出关系满足x′j =f ni=1ωijxi-θj) (1 )yl = n0j=1ωjlx′j -θ′l) (2 )上式中响应函数 f(u)为sigmoid函数 ,神经网络的目标函数为 :Et =12 10l=1 p1k=1(tkl- ykl) 2 (3 )这里 p1为学习样本数 ,输出单元数为 1 0。通过调整网络中各神经元之间的连接权ωij、ω′jl和阈值θj、θ′l,使网络输入和输 出的关系能正确反映钢的化学成分与端淬硬度之间的关系。网络的隐层采用自适应优化算法进行结构优化,神经网络的训练采用有导师监督的学习算法。训练采用的算法为Levenberg Marquard优化方法 ,该方法的权值调整率为 :Δw =(JTJ+μI) -1JTe (4 )式中J为误差对权值微分的Jacobian矩阵 ,e为误差向量 ,μ为一标量 ,I为单位矩阵。Levenberg Marquard优化算法的优点在于训练时间及训练步数比梯度法少许多 ,但对计算机内存需求较大。共收集了 2 96组数据 (端淬曲线及对应的化学成分 ) <6~ 9> ,从中随机抽出 2 1对作为预测检验用数据 ,余下 2 75组数据作为训练用数据对。训练用数据对的化学成分分布情况如表 1所示。表 1 训练用数据的各合金元素含量范围Table 1 Thelimitsofalloyelementsinthetrainingsets (w ,% )合金元素CSiMnMoCrNiVB含 量 0 1~ 0 6 5 0~ 2 0 90 2 3~ 1 880~ 1 96 0~ 2 10~ 3 5 30~ 0 2 70~ 0 0 0 2 5 模型的输入为上述 8个元素的含量加上奥氏体化温度共 9个变量。输出取 1 0个单元 ,其值分别代表距端淬表面距离 0~ 42mm范围内的硬度值 ,记为J0 ,J3…J42。对某些低碳低合金钢 ,由于硬度值下降较快 ,在远离端淬表面处因硬度值较低而往往不予标出 ,解决的方法是根据曲线的自然延伸定出各点的硬度值。2 结果及讨论2 1 训练步数对预测精度的影响随着人工神经网络训练步数的增加 ,训练误差逐步减小 ,普遍的规律是开始训练误差下降很快 ,随后越来越慢。但对预测精度 ,即将未参与训练的数据送入已建立的模型 ,比较其输出值 y与期望输出值t的差别 ,结果并非象训练误差那样逐步减小 ,而且是有一个过度训练的问题。所指的预测误差为 :Ep =11 0N 10l=1 Nk=1(tkl - ykl) 2 (5 )取不同的训练步数 ,其训练误差与预测误差如图 2所示。图中的训练误差Et 随训练步数的增加呈下降趋势 ,而预测误差Ep 则随着训练步数的增加有一个先降后升的过程 ,称之为过度训练。计算结果表明 :神经网络中隐层单元数越多 ,训练步数的增加时更易出现过度训练现象 ,如图 2中神经网络的隐单元数取 2 0 ,就很容易产生过度训练的现象。产生过度训练的原因是随着训练步数的增加 ,神经网络不但记住了训练数据的一般特征 ,而且记住了训练数据的某些细微特征 ,包括数据的误差 ,此时网络的预测性能变差。2 2 训练数据数量对预测精度的影响在数学模型确定之后 ,本文分别选择了数量不同的两组训练用数据 ,一组为 1 74对 ,另一组为 2 95对 ,预测用数据量为 2 1对 ,神经网络的隐单元数取 1 0。分别将上述两组数据送入神经网络进行训练 ,在训练过程中不断输入预测用数据 ,观察神经网络的预测精度。当输出呈现过度训练的趋势时即停止训练 ,取出训练过程中预测误差的最小值 ,如图 3所示。结果表明 :在神经网络的拓扑结构、数学模型相同的条件下 ,训练用数据越多 ,越有利于提高预测精度。此外还应对训练数据中各合金元素出现的频率以及数值分布的均匀性加以分析。如果某合金元素的数值在训练数据中出现的频率比较低 ,而且该元素对钢的淬透性影响又比较大 ,则在预测含该元素钢种的端淬曲线时 ,往往有较大的误差。本文训练用的数据中含有十几组含硼元素的数据 ,由于含硼钢的数据过少 (只有十几个钢种 ) ,神经网络能获得的信息就很少 ,而钢中存在的微量硼对淬透性的影响又十分巨大 ,这两个因素导致了误差偏大。预测结果如图 4所示。可见要提高预测精度 ,必须增加含硼钢的训练数据。图 3 训练数据组数量对预测精度的影响Fig .3 Influenceofthenumberoftrainingsetsonpredictionprecision图 4 含硼钢训练数据过少造成的预测误差Fig .4 Predictionerrorscausedbylackingenoughtrainingsetsofboronsteels2 3 预测结果显示从 2 1个预测钢种中选取 3个钢种 ,编号No .1~No .3钢种的碳含量分布于预测区域的两端及中间位置 ,碳及其他元素含量如表 2所示。图 5为预测结果与实测结果对比。结果表明 :在整个预测范围内 ,No .1和No .2在离端淬距离 6~ 1 2mm范围内的硬度误差约为 5~ 6HRC ,略大于平均误差 ,而这一部位对判断钢的淬透性有着决定性的作用。误差偏大的原因主要是在离端淬距离 6~ 1 2mm范围内端淬曲线的硬度值梯度度比较大 ,实测数据的离散度相对较大 ,如果神经网络在这一段范围内取值点过少 ,往往会造成较大误差。解决的方法可以从两方面考虑 :一方面增加这距离范围内的取值点密度 ,另一方面增加训练用数据 ,以增加神经网络获取的信息量。表 2 预测钢种的成分及参数Table 2 Chemicalcompositionandparameterofpredictionsteels编号奥氏体化温度 /℃
化学成分 (质量分数 ,% )CSiMnMoCrNiVBNo .1930 0 170 15 0 5 70 2 40 45 1 87 0 0No .2 870 0 6 40 2 0 0 6 80 0 0 0 0No .3844 0 430 15 0 740 0 92 0 0 16 0图 5 预测与实测的端淬曲线对比Fig .5 Comparisonbetweenmeasuringandpredictingcurves4 结论1 )利用三层B—P人工神经网络建立起的端淬曲线预测模型 ,在训练数据充分的条件下 ,根据钢的化学成分在一定误差范围内能预测钢的端淬硬度曲线。2 )增加端淬距离 6~ 1 2mm范围内的取值点密度以及训练用数据有利于减小预测误差。3 )神经网络的训练步数对模型的预测精度有影响 ,训练步数的增加 ,网络的训练误差随之减小。但网络的预测精度存在一个极小值 ,如果训练步数超过极小值对应的步数 ,则称为过度训练。4)在建立预测模型时 ,若输入变量中含有对淬透性影响较大的元素 (如硼 ) ,则此类训练数据不能过少 ,否则会影响对应钢种的预测精度基于人工神经网络的结构钢端淬曲线预测系统模型的研究@吴良$东华大学机械工程学院!上海200051
@钟文锋$东华大学机械工程学院!上海200051人工神经网络(ANN);;
数学模型;;端淬曲线;;预测利用人工神经网络技术建立了结构钢端淬曲线预测系统的数学模型 ,该模型覆盖了较大范围的钢种 ,系统除了能对已训练过的钢种的端淬曲线准确描述外 ,还能在一定精度范围内对新钢种的端淬曲线进行预测。本文还研究了训练步数、训练数据量对模型预测精度的影响1 WangJ ,VanderWolkPJ,DorrepaalC ,VanderZwaagS .Effectsofcarbonandcoolingrateoncontinuousco olingtransformationspredictedbyartificialnetwork.ISIJInterational,1999,39( 10 ) :10 38.
2 BhadeshiaHKDH .Neuralnetworksinmaterialsscie