期临床试验中不良事件的因果关系评价

收稿日期:-08-16

摘要

Ⅰ期临床试验是试验药物初步的临床药理学及人体安全性评价试验,用于观察人体对于试验药物的耐受程度并获得人体内药代动力学数据。由于临床安全数据的缺乏,给试验中不良事件(AE)因果关系的判断带来极大困难。AE因果关系评价暂无统一原则,目前应用较为广泛的是Hill准则。用于评估试验药物与AE之间因果关系的方法主要分为3类,即专家判断法、标准化算法和概率化法。我国AE因果关系评价方法基本与世界卫生组织乌普萨拉监测中心评价方法一致,属于专家判断法。但是,这些评价方法比较适用于上市后药物的评价,不适用于Ⅰ期临床试验。随着我国加入人用药品注册技术要求国际协调会议,Ⅰ期临床试验逐渐增多。我国应基于研究药物的代谢学和药效学特点(包括临床前研究)及受试者的临床表现,参考国际常用的Hill准则,出台相应评价指南并建立AE数据库,在保障受试者安全的前提下,做好Ⅰ期临床试验,为国内外的试验药物研究提供更有价值、更准确的信息。

关键词

临床试验;Ⅰ期;药物评价;因果关系

Ⅰ期临床试验是试验药物初步的临床药理学及人体安全性评价试验,旨在观察人体对于试验药的耐受程度和获得人体内药代动力学数据[1]。完善的Ⅰ期临床试验有助于初步了解试验药物的人体安全性,早期识别与试验药物相关的不良事件(adverseevent,AE),从而更好地预防和控制相关安全问题,为药物安全合理使用提供依据。

人用药品注册技术要求国际协调会议(InternationalConferenceonHarmonisation,ICH)制定的临床试验质量管理规范(GuidelineforGoodClinicalPractice,GCP)[2]中将AE定义为:患者或临床试验受试者在药品使用过程中发生的任何不利的医疗事件,该事件并非一定与该药的使用有因果关系。因此,一个AE可能是任何不利的和非期望的信息(例如异常的实验室检查结果)、症状或疾病,无论是否被认定与试验药品有关,都需要暂时与该药相关联。在一个新药或药品新用法批准前的临床试验中,特别是当治疗剂量没有被确定时,ICH-GCP将ADR定义为:所有对人体有害的和非期望的药物反应,无论任何剂量,都应该认为是ADR。而对于上市后的药品,ICH-GCP则将ADR定义为:正常剂量的药物使用于人体后发生的有害和非预期的反应。AE包括ADR,而ADR仅是AE中的一种。

试验药物与AE之间因果关系的评价是Ⅰ期临床试验安全性考察中最关键和最困难的问题,已经成为药物警戒研究中的重要内容,其结果将直接影响到下一阶段临床试验能否继续进行。年1月在法国进行的新型可逆性脂肪酸酰胺水解酶抑制剂BIA10-临床试验中,接受最高累积剂量组的6名受试者中,5名出现急性、快速进行性神经系统综合征致永久性脑损伤,1名死亡[3-5]。这一惨案的发生进一步凸显了临床试验中及时、准确进行试验药物与AE因果关系判断的重要性。对于试验药物与AE的因果关系,至今尚无统一的评价标准,而且常用的AE关联性判断标准不完全适合Ⅰ期临床试验[6-7]。目前我国正逐步由制药大国向制药强国转变,新药临床试验不断增多,AE因果关系评价对于安全开展Ⅰ期临床试验有重要意义。为此,我们收集国内外文献,就目前常用的AE因果关系评价原则和方法以及Ⅰ期临床试验中AE因果关系评价中的常见问题进行了简要综述。

一、AE因果评价的原则

AE因果关系评价暂无统一原则,目前应用较为广泛的是Hill准则[8-10]。Hill准则是英国AustinBradfordHill爵士于年在一个关于环境和疾病的开创性报告中描述的用于因果关系评价的准则,包括关联的时序性、一致性、强度、特异性、生物梯度、实验支持、合理性、连贯性、类比等9项细则[8]。WHO国际药物监测合作中心的多位专家[10-13]先后发文论述了Hill准则在药物与AE因果关系评价中的重要性及其应用。

强度(strength)

01

强度指疾病与暴露因素之间关联程度的大小,是由适当的统计学计算得出的关联性大小来定义的。在Ⅰ期临床试验中即为AE与试验药物关联程度的大小。常用RR或OR来描述。关联强度越大,存在因果关系的可能性也越大。但Hill也指出,“虽然强度越大,就越可能具有因果关系,但低关联强度也并不意味着没有因果关系”[14]。

一致性(consistency)

02

一致性是指不同地区、不同人群、不同时间暴露在同一因素下可观察到同样的事件发生。例如,同一受试者再次暴露于同一种试验药物后所发生的AE与初次暴露于该药后所发生的AE一致;不同受试者暴露因素类似,AE的类型、发生情况也相似[10,15]。在Ⅰ期临床试验中,无论时间、地点和环境如何变化,观察到试验药物与AE之间的关联都是一致的[14-15]。

特异性(specificity)

03

特异性是指在一种暴露因素下,如果在某一特定地点或一个特定人群发生的疾病没有其他可能的解释,则可能具有因果关系。特异性是衡量特定情况下事件重现性的标准,即在特定人群或特定地点观察到的AE没有其他原因可解释时,因果关系的可能性会更强。

时序性(temporality)

04

时序性是指因与果的时间关系,先有因后有果。如果AE与试验药物有关,则必然发生在给予试验药物之后,这在因果判断中是首要条件,且给予试验药物与AE之间的时间间隔,应符合药物动力学和疾病病理学知识,否则不能假设因果关系[10]。在因果关系评价中,WHO、法国、瑞典、中国等药品管理机构均将药物与AE之间的时间序列关系作为首要的判断条件[7]。

生物梯度(biologicalgradient)

05

生物梯度即剂量-反应关系(dose-responserelationship),是指试验药物的剂量、使用时间与AE发生之间存在的一种阶梯曲线。试验药物与AE之间的剂量-反应关系呈正相关,即暴露剂量越大,暴露时间越长,AE发生的概率也越大。存在剂量-反应关系,则是因果关系的有力证据。例如许多研究均证明,吸烟的数量和年数与吸烟相关疾病(肺癌和心血管疾病)的发生直接相关[8]。但也必须注意有可能产生的临床耐受性[11]。

合理性(plausibility)

06

合理性是指能从生物学发病机制上建立因果关系的合理性。在药理作用机制已知的情况下,因果关系的判断结果可靠性较高,例如NSAID与胃肠道出血的相关性;但在药理作用机制不明的情况下,则可能无法准确做出判断,例如普拉洛尔与眼黏膜综合征之间的相关性[16]。此外,合理性的判断也取决于当前的医学知识水平,不能用已有的生物医学知识解释的因果假设不一定没有成立的可能性,也可能在未来被科学进步所证实[17]。因此,合理性的判断可能是一个很复杂的过程。

连贯性(coherence)

07

连贯性是指事件与暴露因素之间的关联应该与现有的理论和知识相适应。例如实验室检测等其他数据(血药浓度水平、肾功能、肝功能等检测结果)均可为因果关系的判断提供不同程度的支持[11]。Hill认为,关联的解释不应与疾病的自然病史和生物学的一般事实严重冲突。合理性旨在探索和识别机制作用以支持因果推断,而连贯性则确保这种推断的可信性并使之与当前知识水平保持一致[15]。

实验支持(experimentalsupport)

08

Hill指出,完善的试验设计可能为因果关系提供有力证据。无论是基于实验室的、临床的还是流行病学的研究,能够在受控条件下复制、消除或防止药物相关AE的发生,则在实验设置的范围内支持因果关系[8]。例如用实验方法证实去除可疑病因后某疾病发生率下降或消灭,则表明该因果关联存在终止效应,可作为因果关联强度高的证据。

类比(analogy)

09

类比是指两种类似的因素可引起的相似结果。这对于判断类似药物因果关系的证据可能具有参考意义,但并不是因果关系评价的有力证据。例如,目前多数已上市他汀类药物的严重不良反应有横纹肌溶解症,如果另一新的他汀类药物临床试验过程中出现此症状,则增大了关联性的可能。同理,据报道有5%~20%服用血管紧张素转换酶抑制剂(如卡托普利)的患者出现咳嗽症状,而咳嗽与血管紧张素Ⅱ受体拮抗剂(如氯沙坦)之间的关联没有药理学的合理性解释,关联性较差[8]。

在因果关系的评价中,并不一定要求全部满足以上9条标准。其中关联的时序性是必须满足的,关联的强度、一致性、生物梯度关系及实验支持也有非常重要的意义,其他标准则可作为参考。满足的条件越多,则因果关系成立的可能性越大。每个标准在整体评估中均具有一定的权重,其重要性可能以不同的方式变化。判断过程中研究人员需要考虑变量,并与其他因素(如数据质量)相结合[10]。

二、常用的AE因果关系评价方法

目前用于评估试验药物与AE之间因果关系的方法有20余种[18],大致可分为3类,即专家判断法、标准化算法和概率化法。

专家判断法(expertjudgment)

01

专家判断法又称全面评估法(globalintrospection),是基于目前该领域专家的知识和经验进行评估而得出关于因果关系的结论。最具代表性的是WHO国际药物监测合作中心[又称乌普萨拉监测中心(UppsalaMonitoringCenter,UMC)]提出的因果关系判断方法被称为WHO-UMC评定法。由于专家判断法是基于专家的临床经验和知识水平,不排除主观性,且缺乏统一标准,因此很可能导致高变异性和低重现性[19-20]。但当评估是基于专家之间已达成的共识时,则可能避免此类弊端。

标准化算法(algorithms)

02

标准化算法是结构化与标准化的评价方法,这种方法对一些特定问题赋予一定分值,用总分值的大小来判断因果关系的可能性。国际上比较常用的2种方法是Karch与Lasagna评定法[21]和Naranjo评定法[22]。标准化算法的优点是使用方便,评价的可靠性和重现性较好[23]。然而,该方法缺乏灵活性,只考虑到评价条目中的有限信息,而且有限的AE评价条目中仍有部分信息缺失,例如对使用新的试验药物后出现的AE也需要使用既往的AE评价条目评分,造成逻辑上的低分,难以证实新的试验药物与AE的关联性[23-24]。

概率化法(probabilisticapproaches)

03

概率化法是运用概率论语言进行可疑AE因果关系评价。该法考虑到所有可利用的流行病学背景以及病例信息,目标是计算药物引起特定AE的后验比(posteriorodds),即支持药物是AE原因的后验比。概率化法的特点是即使缺乏相关信息和论证,因为遵循概率论的基本规则,也不会对因果关系估计造成影响,而且可以提供因果关系的精确概率估计[25]。尽管有这些优点,但由于该方法计算复杂并需要较多时间和专业知识,目前临床应用受一定限制。贝叶斯法为较常用的概率化法。贝叶斯分层模型能够共享类似药物和数据库的AE信息,而不是将其中的每一个与其他药物隔离开来。该模型有以下优点:可根据群体行为加强或更改信号来改善信号辨别力;可用于稀疏数据库的分析;可通过为新药生成更具体的先验来改善信号的早期检测[26]。

我国常用的AE因果关系评价方法

04

目前,我国AE因果关系评价方法基本与WHO-UMC评定法一致。年由国家食品药品监督管理局药品安全监管司和国家药品不良反应监测中心发布的《药品不良反应报告和监测工作手册》[27]中规定,ADR/AE分析方法主要遵循以下5条原则:(1)用药与ADR/AE的出现有无合理的时间关系;(2)ADR/AE是否符合该药已知的不良反应类型;(3)停药或减量后,ADR/AE是否消失或减轻;(4)再次使用可疑药品是否再次出现同样反应事件;(5)ADR/AE是否可用并用药的作用、患者病情的进展、其他治疗的影响来解释。依据这5条原则,将关联性评价分为肯定有关、很可能有关、可能有关、可能无关、待评价、无法评价6级。上述方法又称“六分法”。根据临床试验方案和目的不同,国内常用的其他因果关系评判方法还包括:(1)七分法:肯定、很可能、可能、可疑、不相关、待评价、无法评价/判断[28];(2)五分法:肯定相关、很可能相关、可能相关、可能无关、不相关,该方法是年我国国家药品不良反应监测中心参照WHO-UMC评定法制定的因果判断方法[29];(3)二分法(新药研究的申办方后台数据统计时AE因果关系分类方法):相关、不相关[28]。

上述各种AE因果关系评价方法各具优点和缺点,同时相互间缺乏一致性。Kyonen等[30]的横断面研究结果显示,3名研究人员、1名医师及2名药物化学专家分别用Karch与Lasagna评定法和WHO-UMC医院儿科年1月1日至年12月31日期间发生的AE进行因果关系评价,结果显示两种方法判定结果的一致性较差,为32.3%(kappa=0.)。钟莹[31]的研究显示,国内的五分法与WHO-UMC评定法、Karch与Lasagna评定法、Naranjo评定法、贝叶斯法的一致性分别为92.6%(kappa=0.85)、85.2%(kappa=0.74)、62.9%(kappa=0.34)、51.8%(kappa=0.01)。AE因果关系判断标准的差异和判断的主观性可能是大多数方法缺乏可重复性的主要原因[32]。

三、Ⅰ期临床试验中AE因果关系判断的常见问题

无合适的评价方法

01

目前常用的AE因果关系评价方法比较适合药物上市后评价,而不适用于Ⅰ期临床试验。Ⅰ期临床试验多数为试验药物第一次进入人体的试验,所能参考的数据来自临床前的动物毒性研究。由于存在不同种属间的差异,动物毒性研究结果的参考价值有限。同时,Ⅰ期临床试验多为单次用药,不能用减量、停药、多次使用等方法去观察。例如,上述国内主要遵循5条原则中的第(2)、(3)、(4)条均不适合临床试验,特别是Ⅰ期临床试验。目前国内外均没有建立针对Ⅰ期临床试验的AE因果评价标准。

AE混淆因素较多

02

药物相关AE存在个体差异,造成这些差异的因素包括外在和内在因素。外在因素包括气候、文化、药物依从性程度、研究方法或临床试验终点,而内在因素包括受试者性别、体重、身高以及药物代谢相关基因的多态性等[32-33]。受试者可因心理状态而出现“假阳性”或“假阴性”的症状和体征。例如,部分受试者,特别是职业受试者,为了能继续参与试验常会故意隐瞒病情而弱化其不适;相反,部分第一次参与临床试验的受试者往往由于过于担心和恐惧试验药物对身体的伤害而影响血压、脉搏等生命体征的测量结果。Hermann等[34]的研究结果显示,14%(63/)的健康受试者承认没有及时报告AE,20%(89/)的健康受试者表示,就已发生的AE而言,他们首先向其他健康受试者而不是研究者寻求建议。

体液和排泄物等检验结果也易受到诸多因素的影响,如受试者的年龄、种族、性别、饮食、运动、生活环境、作息等,同时又受到样本采集、样本运输条件、贮存方法、样本预处理的影响[35]。例如血样采集,目前在临床试验过程中为了便于操作并减少受试者静脉穿刺次数,一般采用留置针进行采血并用盐水封管,在留置针不通的情况下会用生理盐水冲管,待通畅后回抽并弃去生理盐水和部分静脉血再进行采血。在此过程中,若生理盐水回抽不充分,会造成血液稀释,进而影响血液检验结果的准确性。

研究者认知程度不同

03

研究者的专业知识背景不同,即便同为某一领域的专家,面对同一受试者同一AE的相关临床资料,对AE因果关系的判断也不尽相同[7]。例如在医院进行的一种抗肿瘤药物Ⅰ期临床试验中,42名受试者中有8名用药后出现咽干、咽痛等症状,无打喷嚏症状,其中部分受试者出现流涕症状,但均无明显的受凉、劳累等诱因。由于不能排除病毒感染等诱因,研究者对该AE与试验药物之间的因果关系判断结果存在分歧。

四、Ⅰ期临床试验中AE因果评价的对策

出台相应评价指南并建立数据库

01

鉴于Ⅰ期临床试验缺少临床安全信息的特点,建议国内药监部门组织相关研究人员进行讨论并出台针对Ⅰ期临床试验中AE因果判断的评价标准,便于研究者准确上报试验药物相关AE。建议药监部门建立Ⅰ期临床试验AE数据库,该数据库可以与上市后的药物不良反应共用一个数据库,二者可以互通,便于全面掌握药品的所有安全信息。

加强受试者管理

02

为避免临床试验中出现“假阳性”或“假阴性”的AE,筛选期间应尽可能地详尽告知受试者试验药物本身的药理毒理作用、前期试验结果、将要进行的试验内容、用药方案、预期的不良反应和试验过程中安全方面的注意事项等,叮嘱受试者一旦有任何不适要及时告知研究者,并非所有发生AE的受试者都需退出试验。在受试者管理方面,要求受试者适度运动、按时作息,除高脂高热等特殊饮食要求外,一般要求统一清淡饮食,按需饮水(服药前后1h除外),病房要求空气流通、温度适宜、环境安静等。

研究者的对策

03

我国《药物临床试验质量管理规范》[36]第二十一条指出,研究者应了解并熟悉试验药物的性质、作用、疗效及临床前研究中安全性资料,同时也应掌握临床试验进行期间发现的所有与该药有关的新信息。每个临床试验启动前,研究者应充分了解试验药物的预期不良反应,试验过程中一旦发生相关AE,应及时判断因果关系。如果在发生严重AE(seriousAE,SAE)后不能及时判断因果关系,应在第1例SAE发生后尽快进行相关检查,待查明因果关系后,再让其他受试者进行相应药物暴露,从而避免类似法国BIA10-临床试验惨案的发生。在试验过程中,应注意监测同一剂量组中个体间实验室指标的变化规律,当组内个体均出现一致性变化时,则与试验药物有关的可能性较大[7]。在剂量递增试验中,药物相关AE的严重程度与试验药物多具有一定的量效关系,在低剂量组中所出现的AE在高剂量组中应同样出现,并且多数情况下程度更为严重[7]。我们认为,尽管目前不同试验方案设计的因果关系判断方法不同,但所有参与该项试验的研究者对于受试者的症状、体征及实验室检查结果等的判断标准应统一。若有可能,可均由同一位研究者统一判断。

五、结语

考虑到Ⅰ期临床试验存在试验药物临床安全信息较少的特点,我国研究者在Ⅰ期临床试验AE因果关系判断的过程中,应基于研究药物的代谢学和药效学特点(包括临床前研究)及受试者的临床表现,参考国际常用的Hill准则[9-10]和我国的《药品不良反应报告和监测工作手册》[27]中规定的原则和方法进行综合判断,在保障受试者安全的前提下,做好Ⅰ期临床试验,为国内外的试验药物研究提供更有价值、准确的信息。

参考文献

预览时标签不可点收录于话题#个上一篇下一篇



转载请注明地址:http://www.webgametool.com/jbzl/8436.html
  • 上一篇文章:
  • 下一篇文章: 没有了
  • 热点文章

    • 没有热点文章

    推荐文章

    • 没有推荐文章