利用 AOTF 近红外光谱仪检测中药中微生物的方法

利用 AOTF 近红外光谱仪检测中药中微生物的方法

 

摘   要    本文采用 AOTF 近红外光谱技术以漫反射方式对新癀片中的微生物即细菌和霉菌进 行光谱扫描,分别建立了偏最小二乘法(PLS1)回归模型和主成分分析模型。通过偏最小二 乘法(PLS1),建立了菌体数量的回归模型,并探讨了菌体数量梯度对模型预测结果的影响, 最终确定了以多模型分步快速菌检法的预测方法。通过主成分分析模型,结果显示 AOTF 技 术建立的数学模型不仅能够分辨出样品中的菌体数量是否合格,还能够对菌体是否具有活性 进行定性。实验结果表明,AOTF-NIR Luminar 5030 光谱仪利用使用光谱数据和校准模型, 能够快速准确地对新癀片中的菌体进行定量分析和定性分析。

主题词   声光可调滤光器;近红外光谱;微生物;偏最小二乘法(PLS1)

在中药制药行业,对细菌等微生物的的检测按照国家药典的规定是必须进行的一项检测 项目,常规的检测方法是利用培养基培养计数的方式来进行检测[1],该方法操作复杂、费时 费力,至少需要 48 小时才能得到最终的检测结果,不能够保持一个流畅的生产过程。如何 寻找一种快速的检测方式,能够迅速得到检验结果,对中药制药行业的生产具有重大的意义。 近几年在中国兴起的近红外检测技术,作为一门独立的分析检测技术具有不需要样品的预处 理,检测速度快(秒级速度),不消耗试剂、绿色环保分析等特点,符合菌检快速检测的要 求,但是,能否利用近红外技术对细菌等微生物进行检测,检测结果的准确度如何?以往从 未见此方面的论文或报道。鉴于此,我们利用美国 Brimrose 公司的 Luminar 5030 型便携式 AOTF 技术近红外光谱仪对厦门中药厂有限公司提供的 20 个样品进行光谱采集,建立模型并 预测,以考察 AOTF-NIR 技术能否在菌检项目中成功应用声光可调滤光器(Acousto-optic tunable filter,简称 AOTF)是基于各向异性的双折射晶体的声光衍射原理,利用超声波 与特定的晶体作用而产生分光的光电器件[2,3,4]。与传统的基于机械调谐分光元件的光谱仪器 相比,以 AOTF 作为分光元件的光谱仪具有明显的优越性:它结构简单,光学系统无移动性 部件,体积小,集光能力强,最吸引人之处在于它的扫描速度快、信噪比高[5]。

1. 实验部分

1.1  仪器条件和样品处理

仪器:美国 BRIMROSE 公司产的 Luminar 5030 型便携式 AOTF 技术近红外光谱仪,主要 部件包括:光学部分、控制部分、电源适配器、笔记本电脑。仪器波长范围为 1100nm 到 2300nm, 2nm 的波长增量,扫描次数为 300,采用 InGaAs 检测器。挪威 CAMO 公司 The Unscrambler 分析软件。

样品:新癀片不规则颗粒状样品 20 个,编号为 1-20,其中 1 号和 2 号样品中的微生物 已经杀死,为死菌体;3-20 号样品中的微生物为活菌体。并提供每个样品细菌数和霉菌数 的数据,单位为:个/克。见表 1 所示。

表 1: 样品的编号及微生物个数值

新癀片批号12345678910
细菌数(个/g)101010101010500101010
霉菌数(个/g)5010105014001630170100101050
新癀片批号11121314151617181920
细菌数(个/g)3001000500500100017001030050010
霉菌数(个/g)30101003550600250450020050100

 

1.2 实验方法: 

本次实验扫描新癀片样品数量 20 个,样品状态为不规则的颗粒状。使用美国 Brimrose 公司 Luminar 5030 型近红外光谱仪采集样品的光谱数据。将样品放置于样品盒的槽中,用 盒盖将样品刮平,连同盒盖一起放置于支架上,光谱仪的探头卡在样品盒盖的圆孔中,垂直 卡紧,采用漫反射的测样方式采集光谱。每一张光谱都是 300 次扫描的平均结果。波长范围 从 1100nm 到 2300nm,波长增量为 2nm。每个样品均连续扫描 5 张光谱,共得到 100 张光谱。 将 100 个光谱数据经过一阶微分处理(9 点平滑),导入 The Unscrambler 分析软件,然后 利用 PCA 对光谱数据进行计算创建定性校正模型;将细菌数和霉菌数的数据与样品一一对 应,采用 PLS1 方式进行计算建立定量校正模型。

1.3 光谱及预处理

 新癀片样品的原始吸收光谱(见图 5),从图中可以看出,所有光谱排列整齐有序,没 有异常的样品光谱。新癀片样品的一阶微分光谱(见图 6),同样整齐有序,有比较明显的 吸收峰,光谱排列更加紧密,光谱与光谱之间的相似性较强,采集到的光谱信息量大。

2.建立 PLS1 定量分析模型

2.1 模型的建立

表 1 为所提供样品的编号及每个样品所对应的细菌数和霉菌数的数据。在 The Unscrambler 软件中,将每个样品的光谱数据与细菌和霉菌个数的数据一一对应,如图 3 所 示。

采用偏最小二乘法(PLS1),完全交互验证(Full Cross Validation)的方式建立细 菌和霉菌的回归定量分析模型。

2.2 结果分析

从图 4 图 5 的细菌和霉菌的回归模型看:两者都有很好的相关性,相关系数分别为 0.9791 和 0.9895。因此,我们可以初步判断利用近红外光谱可以得到微生物有效的信息。 因为建立模型所用的样品数量比较少,无法进行未知样品的验证,因此,我们用所建 立的模型对所有扫描的光谱进行一个内部的验证,所得到的结果与外部验证相似,可以说明

相同的问题。表 2 是调用模型对细菌和霉菌的一个验证结果:

表 2.模型对细菌和霉菌的预测结果

样品编号细菌预测值细菌实际值霉菌预测值霉菌实际值
11231051050
12-42103350
13105106650
14171020550
15441037350
21-12110-19210
228105910
233210-1310
243410-8510
25-18710-8210
31381010861050
322141011171050
33131012551050
34-39109931050
35521011521050

 

41411016661400
42-1261015931400
43-611014071400
44-2561014091400
45-91014091400
51591014831630
52321016451630
53451014291630
54-271016521630
55-171013781630
61131084170
62-2910366170
631610388170
641410182170
6526310570170
71759500218100
72487500-709100
73704500-50100
7454850057100
75761500-311100
812111011410
样品编号细菌预测值细菌实际值霉菌预测值霉菌实际值
823810-9710
83801037710
84-441039410
8518107810
9131064810
92-91010810
931291064610
94-2161047910
952810-5610
101-91052750
102801034050
10311010250
104510-3250
1059107050
1112353007730
1122573005230
113240300-13630
1142993005930

 

 

11528630012930
121986100029210
1221147100032410
1237121000-4710
12497510008610
1251032100023910
131450500527100
1322455009100
133414500250100
134459500171100
13553050074100
14150250025253550
142502500  
27763550
143518500  
21253550
144    
45450026263550
145500500  
24273550
1519601000  
721600
152    
7181000690600
15310361000  
690600
15410011000  
586600
样品编号细菌预测值细菌实际值霉菌预测值霉菌实际值
15510021000615600
16116741700-334250
16217291700-163250
16316751700-284250
16417201700-226250
16515181700-381250
171851042314500
172-91043864500
173-61044244500
174341044994500
175-361044964500
181284300211200
1822833007200
183292300201200
184280300170200
185183300-147200
191471500-15750
192653500-35550
193499500-7050

 

194496500-46150
1955215007050
2017910886100
20229810984100
20322110873100
2046310714100
20523710662100

从表 2 可以看出:细菌数量大于 300 个的样品和霉菌数量大于 600 个的样品的模型预 测结果都接近于实际值,比较准确。但是对数量比较少的样品预测的结果差别非常大。这是 因为两个模型的数据梯度非常大,数据从几个到几千,在这么宽的数据范围内,由于样品量 有限,没有很好的梯度间隔,而且,微生物个数少的样品其信号反应也相对较弱,因此,很 难预测其准确的个数。

2.3 模型的改进

针对细菌而言,如果我们的最终结果只是要求将细菌的个数控制一个数量之下,

比如少于 7000 个为合格,那么以上模型虽然对细菌少的样品预测不够准确,但能够达到控

制的要求。对于霉菌来说,国家标准要求是少于 100 个为合格,那么我们换一个思路,用霉

菌数量少于等于 100 个的样品建立霉菌的模型,看能够达到什么样的预测效果。在扫描的 100 个光谱中,霉菌数量 100 个以下的样品的光谱个数共为 55 个。利用这 55 个光谱数据和 对应的霉菌个数值,建立 100 个以下霉菌的模型,见图 6。

从图 6 可以看出,霉菌小范围模型有更好的相关性,相关系数达到了 0.9913,利用这个

模型对建模用的 55 个光谱进行预测,得到表 3 的结果。

 

 

 

 

表 3.霉菌 100 以下小范围模型预测结果与实际值的比较

 

样品

编号

预测值实际值绝对

偏差

样品

编号

预测值实际值绝对

偏差

11505001045350-3
12465041055150-1
135450-41113230-2
144850211227303
155150-11133130-1
211210-21143630-6
221110-111530300
2391011219101
24101001221110-1
2571031231110-1
719810021241110-1
7210010001257103
73101100-11311001000
74971003132101100-1
751001000133961004
811110-1134981002
821410-4135971003
样品

编号

预测值实际值绝对

偏差

样品

编号

预测值实际值绝对

偏差

8391011915150-1
8461041925350-3
851210-219350500
9181021945350-3
9281021955150-1
9310100201991001
9481022021001000
957103203105100-5
1015350-3204981002
10248502205971003
1035450-4    

从表 3 可以看出:霉菌的 100 以下小范围模型对 100 个以下的样品预测的结果准确度非 常高,只有正负几个的绝对偏差。小范围模型预测霉菌数量少的样品比较准确,那么预测霉 菌数量大于 100 个的样品的结果会怎么样?表 4 是霉菌数量大于 100 的样品的预测结果。

表 4.小范围模型预测霉菌数量大于 100 的样品的结果

样品编号预测值实际值样品编号预测值实际值
311031050141903550
321121050142973550
3310510501431023550
341031050144903550
351071050145943550
41149140015189600
42151140015293600
43158140015390600
44149140015494600
45142140015593600
5192163016189250
5285163016289250
5391163016391250
5484163016484250
5590163016590250
61211701711064500
6215170172914500
63121701731084500
64171701741034500
样品编号预测值实际值样品编号预测值实际值
65131701751014500

从表 4 可以看出:霉菌数量小于 100 的样品所建立的小范围测试模型预测霉菌数量大 于 100 的样品的结果与实际值相差很大,这是正常的,因为所测试的样品范围不在建模范围 之内,预测的结果肯定是不准确的。我们可以尝试用霉菌的数量小于 600 个的所有样品再建 立一个模型。在扫描的 100 个光谱中,霉菌数量小于 600 个的样品的光谱个数共为 75 个。 利用这 75 个光谱数据和对应的霉菌个数值,建立 600 个以下霉菌的模型,见图 7。

从图 7 可以看出,霉菌 600 个以下的模型也有很好的相关性,相关系数为 0.9823,利用

这个模型对建模用的 75 个光谱进行预测,得到表 5 的结果。

表 5.霉菌 600 个以下的模型预测霉菌数量小于 600 个的样品的结果

 

样品编号预测值实际值样品编号预测值实际值
1169501143230
1250501155630
134450121-210
1430501224810
155250123-7610
2118101241810
22-9210125-310
233010131111100
2471013238100
25-9610133123100
6117917013473100
样品编号预测值实际值样品编号预测值实际值
62189170135112100
63173170151607600
64147170152589600
65165170153597600
71190100154606600
72101100155589600
7397100161231250
7497100162246250
75147100163226250
8112410164272250
821710165247250
833110181217200
842810182131200
85-710183180200
913110184201200
921610185190200
9313101914350
94-4101924650
95-23101933650
10150501943850
10210150195-150
1037050201183100
1046950202204100

 

 

1052650203100100 
111153020495100
1125830205108100
1131030   

从表 5 可以看出:霉菌 600 个以下的模型对霉菌数量为 170、200、250、600 个的四个 样品预测的结果准确度很高;对霉菌数量 100 个以下的样品预测准确度降低,但每个样品的 平均值仍然能够接近于实际值。

 

2.4 综合解决方案

综合以上的分析,在如此大的数据梯度范围内,我们没有办法只用一个模型就能够测 量准确所有的样品。但是,分析本次实验我们可以发现建立三个模型就可以准确预测每一个 样品的霉菌数量(细菌与此类似,不再作详细分析),这三个模型是:所有样品参与建立的 宽数据范围的综合模型,我们不妨称其为 model-all;霉菌数量小于 600 个样品建立的模型 称为 model-1000;霉菌数量小于 100 个样品建立的小范围模型称为 model-100。

分析表 2,霉菌个数在 1000 个以上的样品预测的非常准确,个数在 1000 个以下的样品 预测值没有超过 1000 的,因此,通过 model-all 的预测,可以有效地将霉菌个数在 1000 个 以上的样品进行准确检测。

分析表 5,利用 model-1000 模型,可以准确预测霉菌数量 100 个以上的样品。霉菌数 量 100 个以下的样品预测不够准确。

分析表 3,利用 model-100 模型,对霉菌数量在 100 个以下的样品预测的准确度非常高。

根据以上分析总结,完全可以利用 AOTF-NIR 技术,实现快速菌检的工作。步骤如下: 扫描未知样品的光谱,首先用 model-all 模型进行预测,预测值大于 1000,那么,该样品 的霉菌数量即为该数值;如果样品的预测值小于 1000,用 model-1000 模型再对该样品的光 谱进行预测,如果预测值在 200-1000 范围之内,那么我们可以肯定该样品的预测值为该样

品的真实值,如果预测值在 100-200 范围内,那么我们需要对该样品重复扫描 5 次,用 model-1000 模型预测 5 次光谱的平均值,即为该样品的真实值;如果用 model-1000 模型预 测该样品光谱的预测值小于 100,那么,再调用 model-100 模型对该样品进行准确的预测, 得到的结果就是该样品的实际值。

3.分析菌体数量是否合格

3.1 定性模型的建立

多模型分步快速菌检法非常适合 AOTF-NIR 技术在实验室快速对药品中的微生物进行检 测,但是,该方法相对复杂,不能够适应在线的快速微生物检测,下面我们来探讨一下用定 性分析的方法,能否解决在线菌检的工作。

还是以霉菌为例。定性分析和定量分析是两个不同的概念,定量分析可以检测到一个 样品中含有的霉菌的具体个数;定性分析是判断是与否的问题,假设规定药品中含有霉菌的 个数超过 100 个为不合格,少于 100 个为合格品,那么定性分析就是判断所检测的药品是否 合格的问题。

在已有的 20 个样品中,11 个样品的霉菌个数不超过 100,9 个样品的霉菌个数在 100 个以上。利用主成分分析(PCA)对 11 个样品的一阶微分光谱数据进行聚类,作为合格样品 集;对 9 个样品的一阶微分光谱数据进行聚类,作为不合格样品集。因为每个样品我们扫描 了 5 张光谱,我们可以将每个样品的第一张光谱分出来,作为验证用,其余的 4 个光谱参与 建立定性分析的模型。这样,合格样品集有 11 张验证光谱,不合格样品集有 9 张验证光谱。 44 张合格品光谱建立的定性模型为 yes,36 个不合格品样品建立的定性模型为 no,见图 8 和图 9。


Related posts