近红外光谱方法预测生物柴油主要成分

[2013/3/7]

  采用近红外光谱快速测定法对生物柴油的成分(脂肪酸甲酯、单甘酯、二甘酯、三甘酯和甘油)进行了研究。采用气相色谱方法获得其成分的基础数据,通过偏最小二乘方法与近红外光谱数据进行回归运算,分别建立以文冠果油生物柴油为例的单原料油校正模型及多种原料油生物柴油的混合校正模型,并以花椒油生物柴油为例考察了校正模型的适用性。结果表明:通过偏最小二乘方法可以建立适合多种原料油生物柴油的通用校正模型。对于新型生物柴油,向校正集中添加10个以上样本,扩充校正模型后,便可较为准确地测定这类新生物柴油样本的成分含量。此方法分析速度快、成本低、操作便捷、重复性好,适合于生物柴油生产过程的中间控制分析。

  【关键词】近红外光谱;生物柴油;化学计量学;甲酯

  1引言

  动植物油脂主要是各种脂肪酸甘油三酯的混合物,在与甲醇的反应过程中会生成脂肪酸单甘酯、二甘酯等中间产物和副产物甘油,影响生物柴油的产率及品质。因此,在生产过程中,需要及时准确地测定脂肪酸甲酯、单甘酯、二甘酯、三甘酯和甘油的含量,以便精确控制反应过程及产品质量。目前,对这些组分的测定均采用气相色谱方法[3,4],分析前需对样品进行衍生化(如硅烷化)处理,定性和定量过程较为复杂,操作难度大,分析时间长,不适用于生物柴油生产过程的中间控制分析。

  近红外光谱法(NIR)不需要对样品进行预处理,操作简单,分析快速,非常适合油品的定量和定性分析[5],石油化工业中得到了较为广泛的应用[6~10]。已有将NIR光谱用于测定生物柴油中甲酯、甲醇和甘油等成分的报道[11~14],均得到了满意结果。但这些研究所用样本的原料相对单一,建模样本较少,所测定的成分也不完全,且大都是实验室合成的样品,不具有实际的工业应用价值。

  本研究从我国多个中试和工业装置中收集了200余个生物柴油样本,涉及6种原料油及多种加工工艺,其中包括来源复杂的地沟油和酸化油,样本的覆盖范围广,所得的结果更具参考性,建立的校正模型具有实际应用价值。

  2实验部分

  2.1生物柴油样品和仪器

  收集了224个生物柴油样品,从反应器取样后取其甲酯相,并蒸馏除去(120℃)其中的甲醇及少量的水,置于20mL密封小瓶中保存。其原料油来源分别为花椒油(47个)、苦山杏油(16个)、文冠果油(44个)、地沟油(40个)和酸化油(石炼厂43个、中粮集团34个)。

  气相色谱仪,程序升温冷柱头柱上进样系统,HT1不锈钢毛细柱。光谱仪。

  2.2基础数据测定

  采用气相色谱方法[4]测定生物柴油成分的基础数据,色谱条件:分别采用油酸甲酯、单油酸甘油酯、1,3二油酸甘油酯、三油酸甘油酯作为定性和定量标准。采用双内标法进行定量分析,以正十五烷为内标测定甲酯含量,以三癸酸甘油酯为内标测定甘油、单甘酯、二甘酯和三甘酯的含量。

  以空白样品池为参比,采集生物柴油样品的NIR谱图,光谱范围4000~10000cm-1,分辨率8cm-1,扫描次数128。

  2.3数据分析

  采用石油化工科学研究院编制的“化学计量学软件3.0版”在PC计算机上处理光谱数据。用KS方法将生物柴油样品分为校正集和验证集,其中校正集用于建立分析模型,验证集用于检测模型的准确性。采用马氏距离、光谱残差和最邻近距离3个指标判断模型对未知样本的适用性。

  校正集的光谱经一阶微分处理后分别与气相色谱测定的成分数据(甘油、甲酯、单甘酯、二甘酯以及三甘酯的质量分数)通过偏最小二乘方法(PLS1)进行回归运算,建立校正模型,PLS所用的最佳主因子数由留一法交互验证所得的预测残差平方和(PRESS值)确定。为考察校正模型的适用性和准确性。本研究对不同种类的生物柴油样品分别进行建模与验证研究,包括:以文冠果油生物柴油为例的单原料油的校正模型与验证;多种原料油的通用校正模型的建立与验证;以花椒油生物柴油为例,研究了NIR光谱校正模型的适用性。

  3结果与讨论

  3.1基础数据获取

  采用2.2节的方法测定生物柴油成分的基础数据。典型的生物柴油样品色谱图见图1;224个生物柴油的成分分布见表1。可见样本的覆盖范围较宽,具有较强的代表性。与标准方法[15]相比,此方法的准确性和重复性较好。表1样品集性质统计(略)

  3.2近红外光谱解析

  图2是所收集的6类原料油生物柴油的NIR光谱图。由图2可见,光谱中主要包含CH倍频和合频的吸收信息,如8609和8316cm-1处的吸收是甲基CH的二级倍频峰,7216和7108cm-1处的吸收是亚甲基CH的第一组合频峰,5828和5766cm-1处的吸收分别是甲基和亚甲基CH的一级倍频峰,6005cm-1处为甲酯中的CH吸收峰。

  尽管6类原料油生物柴油的NIR光谱非常相近,但其成分上却存在一定差异。例如,花椒油生物柴油主要是亚麻酸、亚油酸和油酸甲酯;苦山杏油生物柴油主要是油酸和亚油酸甲酯;酸化油和地沟油生物柴油则主要是多种脂肪酸甲酯的混合,具体视原料油种类而定。这种差异可以在其NIR光谱的主成分分析(PCA)得分图上表现出来。图3为6类52个有代表性生物柴油样品的前3个主成分得分分布图。从图3可见,不同原料生产的生物柴油有聚类分布的倾向。由于酸化油原料来源复杂,所以其分布较宽。其余4种生物柴油的分布则相对集中。但从整体来看,尽管不同种类生物柴油的NIR光谱之间存在差异,但这些差异并非十分显著,说明脂肪酸基团对光谱会产生一定的影响,但NIR光谱主要反映的是甲酯基团的信息。因此,有可能建立适合多种原料油生物柴油的通用校正模型。

  3.3校正模型的建立

  3.3.1文冠果油单原料油模型与验证

  将44个文冠果油生物柴油样品分为校正集(36个样品)和验证集(8个样品),考察了不同光谱区间对模型参数的影响,以及单种原料油所建模型的预测准确性。

  生物柴油在4000~10000cm-1范围的光谱包含了OH键的一级倍频、CH键的一级倍频、二级倍频及其合频信息。从图2可以看出,CH一级倍频区(6000~6550cm-1)和部分CH第一合频区(4550~4000cm-1)的吸光度值超过了1.5AU,这些区间的光谱吸收强度可能与成分浓度之间存在较强的非线性关系。另外,10000~9000cm-1区间的光谱存在较大的噪声,且没有显著的特征吸收。若这些光谱区间参与模型建立,将会使校正模型预测能力下降。表2给出了利用全谱和去除这些光谱区间(即选取4550~5500cm-1和6550~9000cm-1区间)所建模型及其预测的对比结果。可以看出,选用4550~5500cm-1和6550~9000cm-1光谱区间建立模型的预测能力明显优于全谱的结果。表2文冠果油生物柴油不同光谱区间的校正和预测结果比较(略)注(Note):R2为校正集交互验证得到的相关系数(Correlationcoefficient);SECV为校正集交互验证得到的预测标准偏差(Standarderrorofcrossvalidation);SEP为验证集预测标准偏差(Standarderrorofprediction)。

  从单种原料油的建模和预测结果可以看出,对测定生物柴油中的甘油、甲酯、单甘酯、二甘酯和三甘酯的含量,NIR光谱方法可以给出比较准确的结果。

  3.3.2多种原料油模型与验证

  若能建立适合所有原料油来源的生物柴油全局校正模型(Globalmodels),则对该方法的推广和使用都将带来很大的便利。将6种原料油来源的224个生物柴油样品分为校正集(167个样品)和验证集(57个样品),以考察建立全局模型的可行性。表3多种原料油生物柴油的校正和预测结果(略)

  采用与文冠果油生物柴油建模相同的条件建立了多种原料油生物柴油的校正模型。表3给出了模型建立过程的交互验证结果和验证集的预测结果;图4中A,B和C分别为甲酯、单甘酯和二甘酯的NIR光谱交互验证预测值与色谱方法的相关图。与单原料的文冠果油结果相比,由于成分变得相对复杂,光谱之间的干扰更为显著,建立模型所用的主因子数明显增加,同时校正和预测结果都有不同程度的降低。尽管如此,仍得到了满意的结果,完全满足工业生产对过程分析误差的要求。

  上述结果表明,建立多种原料油来源的生物柴油全局校正模型是完全可行的,但随着模型中原料油种类的增多,成分的复杂性将引起光谱与浓度间的非线性变动关系,PLS方法所建模型的预测准确性将下降。为得到准确性更高的预测结果,需要分别建立单种原料油的PLS校正模型,或采用更为复杂的算法,如局部权重回归、神经网络或支持向量机等建立非线性校正模型。

  3.3.3模型适用性的研究

  以花椒油生物柴油为例,研究了多种原料油生物柴油的NIR校正模型对新原料油生物柴油的适用性。若校正集中不含待测类型的样本,其预测结果将会存在一定的系统误差,且模型的适应性判据也会给出提示。为考察向校正集添加少量样本对扩充模型适应性的效果,从47个花椒油生物柴油中任意选取10个样品,用于模型的扩充,剩余37个作为验证集样本。

  将花椒油生物柴油样本从多种原料油校正集中剔除,建立剩余5种原料油生物柴油的校正模型。然后,再将任意选取的10个花椒油生物柴油样本添加到校正集中,建立含有10个花椒油生物柴油的多原料油生物柴油的校正模型。用以上建立的两类模型分别对37个验证集样本进行预测分析(表4)。由表4可见,未含花椒油生物柴油的模型仍具有较好的预测趋势,但存在一定的系统误差,预测准确性也有明显下降。当模型中添加了10个花椒油生物柴油样本后,消除了系统误差,且预测准确性有了显著改善,与3.3.2节建立的模型基本相当。

  上述结果说明,对于模型中未含的新类型原料油生物柴油样本,只需向多种原料油校正集中添加10个以上样本便可较为准确地测定新类型生物柴油的成分。表4不同校正模型对37个花椒油生物柴油的预测结果(略)

  3.4近红外分析方法的重复性

  由于光谱测量的稳定性,NIR分析方法具有良好的重复性。随机选取一个样本重复扫描7次的NIR光谱,并分别调用建立的多种原料油的生物柴油模型,其质量分数的相对标准偏差分别为:甘油0.74%,甲酯0.26%,单甘酯2.86%,二甘酯0.70%,三甘酯1.41%。说明采用NIR分析方法测定混合油生物柴油的成分具有较高的精密度。

  3.5小结

  通过以上研究,可以得到以下结论:(1)通过偏最小二乘方法可以建立适合多种原料油生物柴油的通用近红外校正模型,其结果完全满足过程控制分析的要求。但若想得到更准确的预测结果,需要建立单种原料油的PLS校正模型,或者采用更为复杂的校正算法;(2)对于新型生物柴油,只需向校正集添加少量样本,扩充模型覆盖范围后,便可较为准确地对该类样本进行预测分析。这样,基于本研究建立的这些基础校正模型,针对新类型原料油或加工工艺,只需添加少量样本,便可直接应用于生物柴油的实际工业生产中;(3)近红外光谱方法有望较好解决生物柴油传统分析方法的诸多弊端,可以快速准确地测定生物柴油的主要成分含量,适合于生物柴油生产过程的中间控制分析。