在现今全球普遍采用的两阶段农药原药等同性评估中,当第一阶段化学评估不能通过时,即与参考来源相比,新来源原药中出现了新杂质或现有杂质含量增加,则需要进入第二阶段的毒理学评估,以确保新来源与参考来源原药具有等同的毒性。

包括中国在内的部分国家,第二阶段毒理学评估仅采用的是毒性试验。但由于主要依赖于Ames试验和急性毒性试验,对于低含量的杂质,该评估方法并不能全面有效评估新来源中杂质的毒性效应,特别是无毒性阈值的遗传毒性,以及存在低剂量效应的内分泌干扰作用。

1 (Q)SAR[(Quantitative Structure-Activity Relationships)]

欧盟、澳大利亚、巴西等国家和地区,在第二阶段毒理学评估中引入(Q)SAR预测,首要目的是确定新来源杂质是否具有各种或关键类型的健康或生态毒性。如果所有杂质(Q)SAR预测结果都理想,结合必要的毒理学试验(如体外遗传毒性实验和急性毒性实验等),或者采用危害分类和风险评估方法,即能够较为充分证明新来源与参考来源原药毒性等同,则不需要再要求提供其他毒理学实验资料。

在等同性评估中引入(Q)SAR预测,既能较为充分地确保毒理学评估的全面性,也能避免高昂的毒理学实验并缩短登记周期。

然而目前各国对(Q)SAR预测报告的要求并不完全相同,且对(Q)SAR预测结果的评估和使用过程中存在不少难点与注意事项,本文将结合我们在全球范围内(Q)SAR应用中所积累的丰富经验,为大家答疑解惑。

2 各国、各地区的要求

2.1 欧盟

欧盟不同成员国(Q)SAR报告的要求是不同的,但具体(Q)SAR模型的要求可以划分为Rule-based模型和Statistic-based模型两类,在评估报告中需要从毒理学角度对(Q)SAR预测结果进行解释与说明,并对杂质进行相应的危害分类或风险评估。也可以参考部分的原药试验数据(如急性5项,Ames试验等)来补充说明,以判断杂质是否为相关杂质。同时应特别关注遗传毒性、内分泌干扰效应等。

其中,荷兰等国一般只需要提供针对所有健康和生态毒性节点的Rule-based模型的结构警报分析,若结果不明确,才需要提供基于Statistic-based模型的预测结果。

比利时等国需要同时提供Rule-based模型和Statistic-based模型的(Q)SAR预测报告,关键的Statistic-based模型预测节点为致畸、致癌和致突变效应。

2.2 巴西

一般至少需要使用3个不同的(Q)SAR软件(Three expert systems),(Q)SAR软件的预测必须涵盖必要的模型节点,如致畸、致癌和致突变效应等,必要时也需要增加其他节点,如内分泌干扰效应等,如果可能的话最好能将(Q)SAR软件中所有的节点都进行预测。此外,也需要从毒理学角度对(Q)SAR预测结果进行解释与说明。

2.3 澳大利亚

澳大利亚要求同时提供Rule-based模型和Statistic-based模型这两类的预测结果,但与欧盟不同的,重点会关注遗传毒性与致癌性的评估,也需要从毒理学角度对(Q)SAR预测结果进行解释与说明。当两类预测结果都理想的情况下就可以豁免能表征杂质毒性的Ames试验等毒理学实验资料。

2.4 俄罗斯

需要采用(Q)SAR模型对必要的毒理节点进行预测,重点关注遗传毒性,特别是能反映致突变性的相关数据节点,但未具体要求(Q)SAR模型的类型。若(Q)SAR预测结果不理想,官方可能会要求直接针对杂质开展相应的Ames试验。

2.5 墨西哥

(Q)SAR预测节点只要求提供对经口急性毒性(LD50)的预测,其他的节点如致畸、致癌、致突变等是墨西哥官方所不要求或适当条件下被认为是不必要的,但不排除需要提供的可能性。

采用的预测模型的数量应根据结果来确定,比如在一个模型中预测结果不理想,则应再提供一个或多个模型进行表征,直到能有充分的(Q)SAR证据说明问题。建议企业至少提供2个模型的预测结果,但具体是否达到要求还需要根据毒理学原理来综合评估。最后得到的LD50的预测结果,还需要依据FAO的方法进行计算,来判断同参考来源相比毒性是否是等同的。

(Q)SAR模型报告预测报告建议以QPRF [(Q)SAR Prediction Reporting Format]的形式给出,并在报告中对预测结果进行充分解读。墨西哥官方当前并未严格要求(Q)SAR预测报告出具单位应有相关资质,重点在于审核报告本身是否具有专业性,否则则会被视为无效报告。

3 难点解析

Rule-based模型与Statistic-based模型的差异。规则模型(Rule-based models)是基于专家经验建立结构与效应之间的关系,主要表现为对结构警报(structural alert)的识别;统计模型(statistic-based models)是基于统计模型建立结构与效应之间的关系,常见的统计模型有线性、KNN、随机森林、支持向量机(SVM)、神经网络模型等。

3.1 定性模型与定量模型的差异

定性模型描述分子结构和效应之间的定性关系,如当描述致突变性时,结果描述为阴性或阳性;定量模型描述分子结构和效应之间的定量关系,可以预测出具体的毒性大小,如对鱼的急性毒性LC50值为1mg/L。

3.2 (Q)SAR预测报告的格式要求

在当前全球农药原药等同性评估中,对(Q)SAR模型报告并没有像REACH法规那样,强制要求对(Q)SAR预测提交QMRF [(Q)SARModel Reporting Format]和QPRF形式的报告,但该形式的(Q)SAR预测报告由于是依据OECD (Q)SAR的“五准则”要求制作的,所以适用性强,能满足几乎全部国家和地区对(Q)SAR报告的要求。

对于基于结构警报的规则模型预测结果,也可以采用其他形式的报告格式,但必须充分验证模型结果,并给出具体的毒理学评估依据。

3.3 商业(Q)SAR软件与免费(Q)SAR软件的区别

两者模型本身的差异主要体现在模型算法的差异与模型训练集的差异,商业(Q)SAR软件与免费(Q)SAR软件在模型算法上的差异相对较少,目前普遍的模型构建方法是优化或改进传统的统计模型算法,并引入不同的结果判定策略,以提高模型的预测能力。

两者最大的差异在于模型训练集的数量大小,由于数据来源版权问题,如对Ames实验结果的预测,免费(Q)SAR软件数据集规模大多在数千条左右,而绝大多数商业(Q)SAR软件由于数据来源多样,规模远大于免费(Q)SAR软件,因此不仅能够提高模型的预测能力,而且因为有更大的概率在训练集中找到相似结构的化合物,商业软件对预测结果的解释能力也更强。

但在两者的使用过程中,商业软件需要额外支付模型的使用费与数据的版权费。

3.4 在农药原药等同性评估中各国评审机构为何重点关注遗传毒性

如果仔细分析不同国家在农药原药等同性评估中要求的差异,就会发现杂质的遗传毒性几乎都是各国评估的重点,主要原因在于遗传毒性(Genotoxic)物质被认为是无毒性阈值的,不严格地讲可以认为只要存在遗传毒性化合物的暴露,对人体就有可能引起直接的DNA损伤,进而大大增加了癌症诱发概率。正应如此,即使不同来源原药中杂质的含量极低,对其遗传毒性效应也应充分评估。

除此之外,巴西还要求对杂质的内分泌干扰效应进行有效评估,因为内分泌干扰物普遍能够在极低浓度下造成有害损伤。目前伴随着2018年欧盟内分泌干扰评估指南正式发布与实施,未来各国针对杂质的内分泌干扰效应评估要求也存在进一步加强的可能。

3.5 如何应用(Q)SAR预测结果来确定新来源与参考来源原药毒性的等同

首先必须保证对(Q)SAR预测结果的有效性和可靠性的准确评估,这可以参考“OECD (Q)SAR五准则”来进行判定。如果确定预测结果有效可靠,可以参考不同国家的评估指南,结合毒理学原理,采用类似GHS的危害分类方法,或者采用基于毒理学关注阈值(TTC)等的风险评估方法,来最终去评价新来源与参考来源原药是否具有等同的毒性。如果基于这类方法仍不能判定等同,官方则会进一步要求开展相应的试验,需要注意的是由于毒理学试验也存在检测限问题,为保证对原药中低含量杂质进行有效的毒理学评估,一般会要求提高检测过程中杂质的含量或直接对杂质展开相应的检测。