4. 讨论 目前中药指纹图谱的计算机解析方法有模糊信息分析法、人工神经网络法及灰色关联度聚类法等[2]。 本文所述的相似度计算软件均采用了模糊数学方法,相似度计算方法为夹角余弦法,即把每个色谱指纹图谱都可以看作一组对应保留时间下的峰高(或峰面积)的数值,可将这组数值看作多维空间中的向量,使两个指纹图谱间相似性的问题转化为多维空间的两个向量的相似性问题,利用cos?值来定量表征指纹图谱间的相似性。如果cos?越接近1则说明两个向量越相似[3]。 以下是使用两个相似度计算软件和使用改进后软件的体会
使用程翼宇软件的体会 1.采用峰面积进行相似性比较,接近原技术要求的含量测定的计算概念; 2.当图谱的signal文件较大时,使用该系统处理就无法进行,如气相色谱文件无法进行数据的处理与分析; 3.保留时间匹配有时欠准确; 4.系统只能处理98个峰,超过98个峰自动设定为0.00,不利于整体相似度比较; 5.谱峰自动匹配时,峰未积分时则以0.00对应,对设定标准模板影响较大。 6.无法导出共有模式数据。 7.一次最多只能导入处理10个数据文件。 8.必须先匹配才能计算相似度
使用梁逸曾软件的体会 1.基于matlab本身已具备的强大计算功能、图形功能、文件操作功能,精确度高,可靠性好。 2.载入的数据可以是由色谱工作站直接得到的*.csv文件,*.txt文件,也可以是许多图谱导入后保存成的*.mat,*.txt文件; 3.对数据个数、大小基本没有限制,而且数据太大时可以压缩,不影响图形,数据不符合要求或导入错误时可以单独去除; 4.可进行主成分分析,建立类模型(二类或多类),还可对图谱进行预测; 5.可做谱峰识别、自动和手动谱峰匹配,以变异系数法计算各峰权重,加权计算相似度; 6.但以全谱或峰面积计算相关系数和相合系数,两者差别较大,不知何故。 7.不能进行样本与共有模式间的相似度计算 改进后软件的新功能 笔者认为软件首先应计算准确,其次应运行稳定,且图形功能应比较全面,兼有预测、投影等其他功能,因梁逸曾软件基于matlab这个开放性软件环境(源代码开放),算法清晰,故以梁逸曾软件为原型,继承了梁逸曾软件许多优点,在此基础上改进了其不足之处。 1.增添了数据缩放功能,更易进行相似度计算。 2.给每个样品的色谱图标上了序号,在样本数多时,样本更易辨认。 3.改进后的软件可以用右键在谱图上标记峰的横、纵坐标,使峰的横纵坐标值能直观的显示。 4.全谱相似度计算功能增加了将共有模式保存成独立数据(.csv文件)供以后调用比较、显示均值图、显示中位数图功能,并增加了样本与共有模式数据间相似度计算的功能。此功能对控制不同批次原料药、中成药的稳定性有重要的现实意义。 5.由于是解释执行,matlab过于庞大,效率较低,速度较慢,但可以接受。正在进行将其编译成脱离matlab环境的独立程序,可大大增加执行效率。
致谢:感谢浙江大学程翼宇教授、范骁辉博士提供指纹图谱相似度计算软件。 感谢中南大学梁逸曾教授提供指纹图谱相似度计算。
参考文献 1.梁逸曾,谢培山 指纹图谱的化学模式识别分析-若干实质性问题的探讨(三)【J】,世界科学技术,2002,4(5):47~51 2.苏薇薇,吴忠,全健 中药指纹图谱的构建及计算机解析【J】,中药材,2001,24(4):295~298 3.王龙星,肖红斌,梁鑫淼,毕开顺 一种评价中药色谱指纹谱相似性的新方法:向量夹角法【J】,药学学报,2002,37(9):713~717
作者简介: 陈斌(1977- ),男,南京中医药大学2000级在读硕士研究生,主要从事新药开发与指纹图谱研究。
联系人:蔡宝昌 电话:025-6798281 传真:025-6798282 通信地址:南京中医药大学91#信箱(210029)
Comparison of several kinds of similarity calculation software of Fingerprinting Chromatogrphy of traditional Chinese medicine Bin CHEN1,Yiming DENG, Yang PAN1,2, Tianshan WANG1,2, Baochang CAI*1 (1. Nanjing University of Traditional Chinese Medicine , JiangSu Provincial Center for Chinese Medicine Quality Control Nanjing 210029, China,2.Jiangsu zhongkang New Drug & Fingerprinting Chromatography Development Inc. Nanjing 210029, China)
[Abtract]:According to Experimental data of the author while studying in fingerprint of traditional Chinese medicine,different functions between two kinds of similarity calculation softwares of Fingerprinting Chromatogrphy of traditional Chinese medicine which the pharmacopoeia committee recommends and new software after the improvement of one kind of software above which software engineer of our company made are compared. Summarize some merits and defect of similarity calculation software of Fingerprinting Chromatogrphy of traditional Chinese medicine, and has improved in time. Using this kind similarity calculation software on the basis of matlab after improving software can deal with in enormous quantities fingerprint experimental data conveniently and swiftly, and carry on accurate calculation of similarity. [Key words]:Similarity calculation software, Fingerprinting Chromatogrphy;
|