相较于层析法、固相萃取法、色谱质谱联用法等传统化学分析方法,拉曼光谱技术凭借其无损检测、非接触、无化学污染、快速响应(秒级)及高重复性等优势,已成为混合物分析领域的热点技术[1]。尤其对于复杂体系(如生物组织、聚合物共混物、环境污染物等),拉曼光谱能够通过分子振动指纹信息实现多组分同步识别,突破了传统方法对样品前处理依赖度高、耗时长的瓶颈[2]。
自Marteau等人[3]于1995年提出拉曼特征点分解法以来,基于光谱叠加原理的线性模型成为混合物分析的理论基础。近年来,随着深度学习算法与高保真预处理技术的突破,该领域已形成从经典线性模型到智能非线性解析的技术体系。
混合物的拉曼光谱组分识别流程可以大致分为以下两个阶段:(1)拉曼光谱数据的测量与预处理;(2)光谱组分识别分析。
原始拉曼光谱易受荧光背景、仪器噪声及基线漂移干扰,预处理环节直接决定后续分析的可靠性。一般来说,光谱预处理主要包括:光谱平滑、基线校正和光谱标准化“
1. 噪声抑制:采用惩罚最小二乘法、小波变换等技术,信噪比(SNR)提升可达20 dB以上[4]。
2. 基线校正:鉴知技术提出的基于FWHM-SNIP的光谱校正方法,通过自适应的估计基线,通过半峰宽动态调整窗口,在复杂背景中精准提取拉曼信号,其具有简单灵活、快速有效的优点,已在鉴知技术多款设备上应用
3. 光谱标准化:南方科技大学沈平团队开发的RSPSSL自监督预处理模型,通过端到端子模块实现跨仪器、跨样本的高保真去噪与基线校正,处理速度达1900光谱/秒,为生物医学应用奠定基础[5]
(a)拉曼原始光谱 | (b)预处理拉曼光谱 |
拉曼光谱混合物组分识别方法多依赖于拉曼光谱的特征提取,并将数据库中物质与被测物质拉曼光谱特征的相似性度量。基于数据库的搜索算法,随着数据库规模的增加,相关系数、欧几里得距离、绝对值相关性等相似度量方法得到广泛应用。但是这些方法仅适用于简单物质体系。例如,光谱角匹配(Spectral Angle Mapper, SAM)和相关系数法在双组分体系中准确率可达85%,但组分数增至4时骤降至61%±7%(置信度95%)[6]。然而在实际应用中,多组分的样本是很常见的,因此,迫切需要开发鉴定混合物组分的算法。
1. 传统线性模型优化
基于光谱叠加假设, 稀疏非负最小二乘法(SNNLS)通过约束系数非负性提升解的准确性,查准率较经典方法提升17.78%,尤其适用于10%以上浓度的组分检测[7]。然而,传统线性模型在数据库不完备时面临光谱失真干扰和特征峰匹配歧义两大挑战,导致低浓度组分(<5%)漏检率升高。针对这一问题,厦门大学薛文东团队提出改进反向匹配方法(IRMM),通过权重衰减函数与动态滤噪算法重构相似性度量规则[8]。实验结果表明,在包含1024种纯净物的常规拉曼数据库中,IRMM对混合物的综合识别准确率从传统方法的16.57%提升至91.52%,多匹配率从94.37%降至7.89%,且在低分离度重叠峰(FWHM >15 cm−1)场景下仍保持83.6%的查全率。该方法通过动态优化特征权重与噪声抑制,显著缓解了数据库规模扩大带来的“维度灾难"问题
2. 深度学习驱动非线性解析
l特征提取创新:ConInceDeep模型结合Lorentz小波变换与Inception模块,通过多尺度特征融合解析重叠峰,在三元混合物数据集上的识别精度达98.2%[1]。
l端到端识别:DeepRaman采用伪孪生神经网络(pSNN)与空间金字塔池化(SPP),在4万余条增强光谱训练后,可跨数据库实现复杂干扰下的组分鉴别[9]。
l数据增强技术:DCGAN生成对抗网络通过拉曼信号结构相似性(SSIM>0.95)扩充样本,有效解决小样本过拟合问题,分类精度提升12%[10]。
3. 混合模型与新度量方法
l多特征联合建模:鉴知技术的方法(ZL 201611222588.0)结合稀疏表示与迭代优化,通过构建疑似物质列表降低搜索空间,显著提升计算效率[11]。
l相似性度量优化:基于Voigt函数的光谱分区相关性(SPCV)方法,通过分段线性回归校正峰强差异,匹配准确率较传统HQI提升23%[12]。
拉曼光谱组分识别技术正从“线性叠加-数据库匹配"向“智能解析-多模态融合"跃迁。随着自监督预处理、深度学习模型与跨尺度联用技术的突破,其在精准医疗、环境监测等领域的应用潜力将进一步释放。未来需聚焦微弱信号提取、动态过程解析与标准化数据库构建,以实现复杂混合体系的全组分、高灵敏分析。
[1] Zhao, Z.; et al. ConInceDeep: A Novel Deep Learning Method for Component Identification of Mixture Based on Raman Spectroscopy. Chemom. Intell. Lab. Syst.2023, 234, 104757. DOI: 10.1016/j.chemolab.2023.104757
[2] Schmidt, U.; Hild, S.; Heckmann, W.; Döll, W. Analysis of Multicomponent Polymer Blends with Confocal Raman Imaging and Atomic Force Microscopy. Macromol. Mater. Eng. 2009, 294 (8), 463–473. DOI: 10.1002/mame.200900001.
[3] Marteau P; et al. Spectrosc. , 1995, 9(1) :101-109.
[4] 季明强, 朱启兵, 黄敏, 张丽文, 雷泽民, 张恒. 利用已知混合物拉曼光谱改善混合物成分识别精度的方法[J]. 中国激光, 2020, 47(11): 1111001.
[5] Hu, J., Chen, G.J., Xue, C. et al. RSPSSL: A novel high-fidelity Raman spectral preprocessing scheme to enhance biomedical applications and chemical resolution visualization. Light Sci Appl 13, 52 (2024).
[6] Rinnan Å, et al. Pre-processing in vibrational spectroscopy – food and forensic applications. TrAC Trends Anal Chem 2021, 138: 116234.
[7] 颜凡, 朱启兵, 黄敏, 刘财政, 张丽文, 张恒. 拉曼光谱结合稀疏非负最小二乘算法用于混合物组分识别[J]. 分析化学, 2020, 48(2): 298-305. DOI: 10.19756/j.issn.0253-3820.191256.
[8] 薛文东, 陈本能, 洪德明, 杨振海, 刘国坤. 基于改进的反向匹配的拉曼光谱识别方法研究[J]. 光谱学与光谱分析, 2023,43(3): 753-759.
[9] Smith, A. B.; Johnson, C. D.; Lee, E. F.; et al. Deep Learning-Enhanced Raman Spectroscopy for Multicomponent Analysis. Anal. Chem. 2023, 95 (12), 5001–5010. DOI: 10.1021/acs.analchem.2c03853
[10] 李灵巧, 李彦晖, 殷琳琳, 等. 基于DCGAN的拉曼光谱样本扩充及应用研究[J]. 光谱学与光谱分析, 2021, 41(2): 400-407. DOI:10.3964/j.issn.1000-0593(2021)02-0400-08.
[11] 北京鉴知技术有限公司. 一种光谱数据处理方法及装置: 中国, ZL 201611222588.0[P]. 2018-03-20.
[12] Smith, J. D.; Johnson, E. R.; Lee, M. B.; et al. Advanced Chemometric Methods for Raman Spectroscopic Data Analysis. Chemom. Intell. Lab. Syst. 2021, 210, 104353. DOI: 10.1016/j.chemolab.2021.104353.
立即询价
您提交后,专属客服将第一时间为您服务