利用 AOTF 近红外光谱仪 检测中药中微生物的方法

摘要 本文采用 AOTF 近红外光谱技术以漫反射方式对新癀片中的微生物即细菌和霉菌进行光谱扫描，分别建立了偏最小二乘法（PLS1）回归模型和主成分分析模型。通过偏最小二乘法（PLS1），建立了菌体数量的回归模型，并探讨了菌体数量梯度对模型预测结果的影响，最终确定了以多模型分步快速菌检法的预测方法。通过主成分分析模型，结果显示 AOTF 技术建立的数学模型不仅能够分辨出样品中的菌体数量是否合格，还能够对菌体是否具有活性进行定性。实验结果表明，AOTF-NIR Luminar 5030 光谱仪利用使用光谱数据和校准模型，能够快速准确地对新癀片中的菌体进行定量分析和定性分析。

主题词声光可调滤光器；近红外光谱；微生物；偏最小二乘法（PLS1）

在中药制药行业，对细菌等微生物的的检测按照国家药典的规定是必须进行的一项检测项目，常规的检测方法是利用培养基培养计数的方式来进行检测[1]，该方法操作复杂、费时费力，至少需要 48 小时才能得到最终的检测结果，不能够保持一个流畅的生产过程。如何寻找一种快速的检测方式，能够迅速得到检验结果，对中药制药行业的生产具有重大的意义。近几年在中国兴起的近红外检测技术，作为一门独立的分析检测技术具有不需要样品的预处理，检测速度快（秒级速度），不消耗试剂、绿色环保分析等特点，符合菌检快速检测的要求，但是，能否利用近红外技术对细菌等微生物进行检测，检测结果的准确度如何？以往从未见此方面的论文或报道。鉴于此，我们利用美国 Brimrose 公司的 Luminar 5030 型便携式 AOTF 技术近红外光谱仪对厦门中药厂有限公司提供的 20 个样品进行光谱采集，建立模型并预测，以考察 AOTF-NIR 技术能否在菌检项目中成功应用。声光可调滤光器（Acousto-optic tunable filter，简称 AOTF）是基于各向异性的双折射晶体的声光衍射原理，利用超声波与特定的晶体作用而产生分光的光电器件[2,3,4]。与传统的基于机械调谐分光元件的光谱仪器相比，以 AOTF 作为分光元件的光谱仪具有明显的优越性：它结构简单，光学系统无移动性部件，体积小，集光能力强，最吸引人之处在于它的扫描速度快、信噪比高[5]。

1. 实验部分

1.1 仪器条件和样品处理

仪器：美国 BRIMROSE 公司产的 Luminar 5030 型便携式 AOTF 技术近红外光谱仪，主要部件包括：光学部分、控制部分、电源适配器、笔记本电脑。仪器波长范围为 1100nm 到 2300nm， 2nm 的波长增量，扫描次数为 300，采用 InGaAs 检测器。挪威 CAMO 公司 The Unscrambler 分析软件。

样品：新癀片不规则颗粒状样品 20 个，编号为 1-20，其中 1 号和 2 号样品中的微生物已经杀死，为死菌体；3-20 号样品中的微生物为活菌体。并提供每个样品细菌数和霉菌数的数据，单位为：个/克。见表 1 所示。

表 1: 样品的编号及微生物个数值

新癀片批号	1	2	3	4	5	6	7	8	9	10
细菌数（个/g）	10	10	10	10	10	10	500	10	10	10
霉菌数（个/g）	50	10	1050	1400	1630	170	100	10	10	50
新癀片批号	11	12	13	14	15	16	17	18	19	20
细菌数（个/g）	300	1000	500	500	1000	1700	10	300	500	10
霉菌数（个/g）	30	10	100	3550	600	250	4500	200	50	100

1.2 实验方法：

本次实验扫描新癀片样品数量 20 个，样品状态为不规则的颗粒状。使用美国 Brimrose 公司 Luminar 5030 型近红外光谱仪采集样品的光谱数据。将样品放置于样品盒的槽中，用盒盖将样品刮平，连同盒盖一起放置于支架上，光谱仪的探头卡在样品盒盖的圆孔中，垂直卡紧，采用漫反射的测样方式采集光谱。每一张光谱都是 300 次扫描的平均结果。波长范围从 1100nm 到 2300nm，波长增量为 2nm。每个样品均连续扫描 5 张光谱，共得到 100 张光谱。将 100 个光谱数据经过一阶微分处理（9 点平滑），导入 The Unscrambler 分析软件，然后利用 PCA 对光谱数据进行计算创建定性校正模型；将细菌数和霉菌数的数据与样品一一对应，采用 PLS1 方式进行计算建立定量校正模型。

1.3 光谱及预处理

新癀片样品的原始吸收光谱（见图 5），从图中可以看出，所有光谱排列整齐有序，没有异常的样品光谱。新癀片样品的一阶微分光谱（见图 6），同样整齐有序，有比较明显的吸收峰，光谱排列更加紧密，光谱与光谱之间的相似性较强，采集到的光谱信息量大。

2．建立 PLS1 定量分析模型

2.1 模型的建立

表 1 为所提供样品的编号及每个样品所对应的细菌数和霉菌数的数据。在 The Unscrambler 软件中，将每个样品的光谱数据与细菌和霉菌个数的数据一一对应，如图 3 所示。

采用偏最小二乘法（PLS1），完全交互验证（Full Cross Validation）的方式建立细菌和霉菌的回归定量分析模型。

2.2 结果分析

从图 4 图 5 的细菌和霉菌的回归模型看：两者都有很好的相关性，相关系数分别为 0.9791 和 0.9895。因此，我们可以初步判断利用近红外光谱可以得到微生物有效的信息。因为建立模型所用的样品数量比较少，无法进行未知样品的验证，因此，我们用所建立的模型对所有扫描的光谱进行一个内部的验证，所得到的结果与外部验证相似，可以说明

相同的问题。表 2 是调用模型对细菌和霉菌的一个验证结果：

表 2.模型对细菌和霉菌的预测结果

样品编号	细菌预测值	细菌实际值	霉菌预测值	霉菌实际值
11	23	10	510	50
12	-42	10	33	50
13	105	10	66	50
14	17	10	205	50
15	44	10	373	50
21	-121	10	-192	10
22	8	10	59	10
23	32	10	-13	10
24	34	10	-85	10
25	-187	10	-82	10
31	38	10	1086	1050
32	214	10	1117	1050
33	13	10	1255	1050
34	-39	10	993	1050
35	52	10	1152	1050

41	41	10	1666	1400
42	-126	10	1593	1400
43	-61	10	1407	1400
44	-256	10	1409	1400
45	-9	10	1409	1400
51	59	10	1483	1630
52	32	10	1645	1630
53	45	10	1429	1630
54	-27	10	1652	1630
55	-17	10	1378	1630
61	13	10	84	170
62	-29	10	366	170
63	16	10	388	170
64	14	10	182	170
65	263	10	570	170
71	759	500	218	100
72	487	500	-709	100
73	704	500	-50	100
74	548	500	57	100
75	761	500	-311	100
81	211	10	114	10
样品编号	细菌预测值	细菌实际值	霉菌预测值	霉菌实际值
82	38	10	-97	10
83	80	10	377	10
84	-44	10	394	10
85	18	10	78	10
91	3	10	648	10
92	-9	10	108	10
93	129	10	646	10
94	-216	10	479	10
95	28	10	-56	10
101	-9	10	527	50
102	80	10	340	50
103	1	10	102	50
104	5	10	-32	50
105	9	10	70	50
111	235	300	77	30
112	257	300	52	30
113	240	300	-136	30
114	299	300	59	30

115	286	300	129	30
121	986	1000	292	10
122	1147	1000	324	10
123	712	1000	-47	10
124	975	1000	86	10
125	1032	1000	239	10
131	450	500	527	100
132	245	500	9	100
133	414	500	250	100
134	459	500	171	100
135	530	500	74	100
141	502	500	2525	3550
142	502	500
142	502	500	2776	3550
143	518	500
143	518	500	2125	3550
144
144	454	500	2626	3550
145	500	500
145	500	500	2427	3550
151	960	1000
151	960	1000	721	600
152
152	718	1000	690	600
153	1036	1000
153	1036	1000	690	600
154	1001	1000
154	1001	1000	586	600
样品编号	细菌预测值	细菌实际值	霉菌预测值	霉菌实际值
155	1002	1000	615	600
161	1674	1700	-334	250
162	1729	1700	-163	250
163	1675	1700	-284	250
164	1720	1700	-226	250
165	1518	1700	-381	250
171	85	10	4231	4500
172	-9	10	4386	4500
173	-6	10	4424	4500
174	34	10	4499	4500
175	-36	10	4496	4500
181	284	300	211	200
182	283	300	7	200
183	292	300	201	200
184	280	300	170	200
185	183	300	-147	200
191	471	500	-157	50
192	653	500	-355	50
193	499	500	-70	50

194	496	500	-461	50
195	521	500	70	50
201	79	10	886	100
202	298	10	984	100
203	221	10	873	100
204	63	10	714	100
205	237	10	662	100

从表 2 可以看出：细菌数量大于 300 个的样品和霉菌数量大于 600 个的样品的模型预测结果都接近于实际值，比较准确。但是对数量比较少的样品预测的结果差别非常大。这是因为两个模型的数据梯度非常大，数据从几个到几千，在这么宽的数据范围内，由于样品量有限，没有很好的梯度间隔，而且，微生物个数少的样品其信号反应也相对较弱，因此，很难预测其准确的个数。

2.3 模型的改进

针对细菌而言，如果我们的最终结果只是要求将细菌的个数控制一个数量之下，

比如少于 7000 个为合格，那么以上模型虽然对细菌少的样品预测不够准确，但能够达到控

制的要求。对于霉菌来说，国家标准要求是少于 100 个为合格，那么我们换一个思路，用霉

菌数量少于等于 100 个的样品建立霉菌的模型，看能够达到什么样的预测效果。在扫描的 100 个光谱中，霉菌数量 100 个以下的样品的光谱个数共为 55 个。利用这 55 个光谱数据和对应的霉菌个数值，建立 100 个以下霉菌的模型，见图 6。

从图 6 可以看出，霉菌小范围模型有更好的相关性，相关系数达到了 0.9913,利用这个

模型对建模用的 55 个光谱进行预测，得到表 3 的结果。

表 3.霉菌 100 以下小范围模型预测结果与实际值的比较

样品编号	预测值	实际值	绝对偏差	样品编号	预测值	实际值	绝对偏差
11	50	50	0	104	53	50	-3
12	46	50	4	105	51	50	-1
13	54	50	-4	111	32	30	-2
14	48	50	2	112	27	30	3
15	51	50	-1	113	31	30	-1
21	12	10	-2	114	36	30	-6
22	11	10	-1	115	30	30	0
23	9	10	1	121	9	10	1
24	10	10	0	122	11	10	-1
25	7	10	3	123	11	10	-1
71	98	100	2	124	11	10	-1
72	100	100	0	125	7	10	3
73	101	100	-1	131	100	100	0
74	97	100	3	132	101	100	-1
75	100	100	0	133	96	100	4
81	11	10	-1	134	98	100	2
82	14	10	-4	135	97	100	3
样品编号	预测值	实际值	绝对偏差	样品编号	预测值	实际值	绝对偏差
83	9	10	1	191	51	50	-1
84	6	10	4	192	53	50	-3
85	12	10	-2	193	50	50	0
91	8	10	2	194	53	50	-3
92	8	10	2	195	51	50	-1
93	10	10	0	201	99	100	1
94	8	10	2	202	100	100	0
95	7	10	3	203	105	100	-5
101	53	50	-3	204	98	100	2
102	48	50	2	205	97	100	3
103	54	50	-4

从表 3 可以看出：霉菌的 100 以下小范围模型对 100 个以下的样品预测的结果准确度非常高，只有正负几个的绝对偏差。小范围模型预测霉菌数量少的样品比较准确，那么预测霉菌数量大于 100 个的样品的结果会怎么样？表 4 是霉菌数量大于 100 的样品的预测结果。

表 4.小范围模型预测霉菌数量大于 100 的样品的结果

样品编号	预测值	实际值	样品编号	预测值	实际值
31	103	1050	141	90	3550
32	112	1050	142	97	3550
33	105	1050	143	102	3550
34	103	1050	144	90	3550
35	107	1050	145	94	3550
41	149	1400	151	89	600
42	151	1400	152	93	600
43	158	1400	153	90	600
44	149	1400	154	94	600
45	142	1400	155	93	600
51	92	1630	161	89	250
52	85	1630	162	89	250
53	91	1630	163	91	250
54	84	1630	164	84	250
55	90	1630	165	90	250
61	21	170	171	106	4500
62	15	170	172	91	4500
63	12	170	173	108	4500
64	17	170	174	103	4500
样品编号	预测值	实际值	样品编号	预测值	实际值
65	13	170	175	101	4500

从表 4 可以看出：霉菌数量小于 100 的样品所建立的小范围测试模型预测霉菌数量大于 100 的样品的结果与实际值相差很大，这是正常的，因为所测试的样品范围不在建模范围之内，预测的结果肯定是不准确的。我们可以尝试用霉菌的数量小于 600 个的所有样品再建立一个模型。在扫描的 100 个光谱中，霉菌数量小于 600 个的样品的光谱个数共为 75 个。利用这 75 个光谱数据和对应的霉菌个数值，建立 600 个以下霉菌的模型，见图 7。

从图 7 可以看出，霉菌 600 个以下的模型也有很好的相关性，相关系数为 0.9823,利用

这个模型对建模用的 75 个光谱进行预测，得到表 5 的结果。

表 5.霉菌 600 个以下的模型预测霉菌数量小于 600 个的样品的结果

样品编号	预测值	实际值	样品编号	预测值	实际值
11	69	50	114	32	30
12	50	50	115	56	30
13	44	50	121	-2	10
14	30	50	122	48	10
15	52	50	123	-76	10
21	18	10	124	18	10
22	-92	10	125	-3	10
23	30	10	131	111	100
24	7	10	132	38	100
25	-96	10	133	123	100
61	179	170	134	73	100
样品编号	预测值	实际值	样品编号	预测值	实际值
62	189	170	135	112	100
63	173	170	151	607	600
64	147	170	152	589	600
65	165	170	153	597	600
71	190	100	154	606	600
72	101	100	155	589	600
73	97	100	161	231	250
74	97	100	162	246	250
75	147	100	163	226	250
81	124	10	164	272	250
82	17	10	165	247	250
83	31	10	181	217	200
84	28	10	182	131	200
85	-7	10	183	180	200
91	31	10	184	201	200
92	16	10	185	190	200
93	13	10	191	43	50
94	-4	10	192	46	50
95	-23	10	193	36	50
101	50	50	194	38	50
102	101	50	195	-1	50
103	70	50	201	183	100
104	69	50	202	204	100

105	26	50	203	100	100
111	15	30	204	95	100
112	58	30	205	108	100
113	10	30

从表 5 可以看出：霉菌 600 个以下的模型对霉菌数量为 170、200、250、600 个的四个样品预测的结果准确度很高；对霉菌数量 100 个以下的样品预测准确度降低，但每个样品的平均值仍然能够接近于实际值。

2.4 综合解决方案

综合以上的分析，在如此大的数据梯度范围内，我们没有办法只用一个模型就能够测量准确所有的样品。但是，分析本次实验我们可以发现建立三个模型就可以准确预测每一个样品的霉菌数量（细菌与此类似，不再作详细分析），这三个模型是：所有样品参与建立的宽数据范围的综合模型，我们不妨称其为 model-all；霉菌数量小于 600 个样品建立的模型称为 model-1000；霉菌数量小于 100 个样品建立的小范围模型称为 model-100。

分析表 2，霉菌个数在 1000 个以上的样品预测的非常准确，个数在 1000 个以下的样品预测值没有超过 1000 的，因此，通过 model-all 的预测，可以有效地将霉菌个数在 1000 个以上的样品进行准确检测。

分析表 5，利用 model-1000 模型，可以准确预测霉菌数量 100 个以上的样品。霉菌数量 100 个以下的样品预测不够准确。

分析表 3，利用 model-100 模型，对霉菌数量在 100 个以下的样品预测的准确度非常高。

根据以上分析总结，完全可以利用 AOTF-NIR 技术，实现快速菌检的工作。步骤如下：扫描未知样品的光谱，首先用 model-all 模型进行预测，预测值大于 1000，那么，该样品的霉菌数量即为该数值；如果样品的预测值小于 1000，用 model-1000 模型再对该样品的光谱进行预测，如果预测值在 200-1000 范围之内，那么我们可以肯定该样品的预测值为该样

品的真实值，如果预测值在 100-200 范围内，那么我们需要对该样品重复扫描 5 次，用 model-1000 模型预测 5 次光谱的平均值，即为该样品的真实值；如果用 model-1000 模型预测该样品光谱的预测值小于 100，那么，再调用 model-100 模型对该样品进行准确的预测，得到的结果就是该样品的实际值。

3．分析菌体数量是否合格

3.1 定性模型的建立

多模型分步快速菌检法非常适合 AOTF-NIR 技术在实验室快速对药品中的微生物进行检测，但是，该方法相对复杂，不能够适应在线的快速微生物检测，下面我们来探讨一下用定性分析的方法，能否解决在线菌检的工作。

还是以霉菌为例。定性分析和定量分析是两个不同的概念，定量分析可以检测到一个样品中含有的霉菌的具体个数；定性分析是判断是与否的问题，假设规定药品中含有霉菌的个数超过 100 个为不合格，少于 100 个为合格品，那么定性分析就是判断所检测的药品是否合格的问题。

在已有的 20 个样品中，11 个样品的霉菌个数不超过 100，9 个样品的霉菌个数在 100 个以上。利用主成分分析（PCA）对 11 个样品的一阶微分光谱数据进行聚类，作为合格样品集；对 9 个样品的一阶微分光谱数据进行聚类，作为不合格样品集。因为每个样品我们扫描了 5 张光谱，我们可以将每个样品的第一张光谱分出来，作为验证用，其余的 4 个光谱参与建立定性分析的模型。这样，合格样品集有 11 张验证光谱，不合格样品集有 9 张验证光谱。 44 张合格品光谱建立的定性模型为 yes，36 个不合格品样品建立的定性模型为 no，见图 8 和图 9。

利用 AOTF 近红外光谱仪检测中药中微生物的方法

利用 AOTF 近红外光谱仪 检测中药中微生物的方法

主题词声光可调滤光器；近红外光谱；微生物；偏最小二乘法（PLS1）

1. 实验部分

1.1 仪器条件和样品处理

1.2 实验方法：

1.3 光谱及预处理

2．建立 PLS1 定量分析模型

2.2 结果分析

2.3 模型的改进

2.4 综合解决方案

3．分析菌体数量是否合格

Luminar 4080 流化床在线水分/混料均匀度检测仪

氨纶预聚体NCO(异氰酸酯基团)含量的在线检测方法

美国Brimrose AOTF近红外光谱仪 LUMINAR 3060多路复用器 Brimrose Luminar 3060 AOTF-NIR多路复用分光光度计

利用 AOTF 近红外光谱仪检测中药中微生物的方法

主题词 声光可调滤光器；近红外光谱；微生物；偏最小二乘法（PLS1）

1. 实验部分

1.1 仪器条件和样品处理

1.2 实验方法：

1.3 光谱及预处理

2．建立 PLS1 定量分析模型

2.2 结果分析

2.3 模型的改进

2.4 综合解决方案

3．分析菌体数量是否合格

Related posts

主题词声光可调滤光器；近红外光谱；微生物；偏最小二乘法（PLS1）