Circulation:更高影响因子期刊上发表的那些非劣效性试验
近些年来刊出格的非劣效性测试越来越多,然而,这些科学研究的分析方法能量密度如何,我们还知之甚少。近日,《Circulation》杂志刊出格了一项科学研究,以心血管疾病科技领域为例,对较高直接影响因子学报上刊出格的非劣效性测试的特征、分析方法能量密度等透过了探讨。科学研究明确了1990-2016年刊出格在JAMA、Lancet和NEJM上的非劣效性测试。两位单独评审员提取了资料。关注的资料世界观以外非劣效性界值,哪些科学研究的结果超过了非劣效性,哪些测试普遍存在确实会直接影响非劣效性推断结果的主要或次要各种因素。主要的分析方法上都各种因素以外:无法同时展览品ITT统计分析(意向性统计分析)和PP统计分析(符合科学研究解决方案统计分析)的结果,α>0.05,上新化疗手段没与最佳化疗解决方案透过较为,无法证明非劣效性界值的更进一步,缓冲区排除总人数或失访率≥10%。次要各种因素以外次优盲法,是否配对隐匿等。科学研究结果科学研究医护人员在PubMed上透过检索系统,合计检索系统到2,544篇社论,其中都110篇(以外111项测试)符合入围标准(表格1)。表格1 入围的非劣效测试的基本科学研究特征科学研究刊出格的期中从1992年到2016年。这些测试,样本量中都位数为3,006(IQR:1,021-6,068)。可鉴定到非劣效性的准确度(power)中都位数为86%(IQR:80%-90%)。可进入主要起始站统计分析的病患者中都位数为2,707(IQR:1,021-5,966)。9项科学研究(8.1%)天内终止(4项科学研究由于安全性缺陷,3项由于入组更慢,1项科学研究推断出无益处,1项科学研究由于持续性破损)。非劣效性界值60项(54.0%)测试的非劣效性界值是基于ARD(绝对较高风险关联,absolute risk difference)最终的,50项(45.0%)测试基于相比之下关联(29项基于HR,14项基于RR,7项测试基于OR)。1项测试的界值基于相比之下关联但无法作进一步细分,1项测试无法调查报告非劣效性界值。各项测试的非劣效性界值关联很大(ARD在0.4%~25%,HR在1.05~2.85,RR在1.1~1.8,OR在1.1~2.0)。在刊出格过科学研究上新设计/科学研究解决方案之外分析方法社论的测试,科学研究医护人员推断出有7篇测试的科学研究上新设计/解决方案与就此刊出格的篇社论二者之间普遍存在关联或有的资讯缺少。有的在就此刊出格的社论中都更改了非劣效性界值,有的则缺少如何选择非劣效性界值之外的一小或全部细节。主要起始站的结果111项测试,有2项测试,无法评估置信区间。在109项符合标准的测试,86项(78.9%)的测试标示出有具备非劣效性(其中都20项测试的结果也标示出有出有优效性);23项(21.1%)测试没超过非劣效性(16项科学研究的结果不明确,7项科学研究标示出有打压新政策的结局更差)(三幅1)。 三幅1 确立科学研究的主要起始站的结果在95项(85.6%)测试,主要起始站统计分析是基于ITT统计分析或校正ITT统计分析,11项(9.9%)测试应用做PP统计分析,5项(4.5%)应用做其他或没定义的统计分析类型。绝大多数(90%)测试在摘录中都适当地调查报告了科学研究结果,即亦非劣效,优效或劣效性,科学研究如果无法超过,则指出有没超过非劣效性。但是,还有一些测试,要么是摘录说明有的的资讯和科学研究结果二者之间普遍存在关联,要么是摘录提供者的的资讯不足。分析方法和调查报告的上都表格2和三幅2标示出有了普遍存在主要和次要上都各种因素的测试的比例。70项测试(63.1%)通过对另一个缓冲区成年人的二次统计分析(例如,如果首次统计分析是ITT统计分析,则再做一次PP统计分析)来展览品主要科学研究起始站,其中都66项测试的结果一致,而4项测试的两次统计分析结果不一致。 表格2. 确立的科学研究中都是否普遍存在确实导致偏倚的各种因素三幅2 普遍存在主要和次要上都各种因素的测试栖息于情况68项测试(61.3%)提供者了如何明确非劣效性界值,而43项测试(38.7%)无法。110项(99.0%)测试的单侧α≤0.05,其中都44项测试的单侧α≤0.025。随即统计分析(post-hoc ysis)推断出,与PET测试相比,口服测试的α水平更更较高(Wilcoxon秩和鉴定P = 0.02)。在27项科学研究中都(24.3%),有> 10%的参与者天内退出有,以外随访失访,天内暂时中止打压或其他原因(表格2)。 总体而言,基于所有主要的偏倚各种因素,27项测试(24.3%)被认为具备更较高偏倚较高风险。97项(87.3%)测试的标题或摘录中都调查报告了非劣效性上新设计。67项(60.4%)测试,除了就此的科学研究篇社论,还同步刊出格了科学研究上新设计或科学研究解决方案的分析方法社论。在这67项测试,8项(11.9%)测试的非劣效性界值在就此杂志社篇社论与解决方案二者之间普遍存在关联或在其中都一篇社论中都没披露。大多数测试(n = 60,54%)是封闭标签测试,12项测试(10.8%)为单盲,39项(35.1%)为双盲。100项测试透过了配对隐匿(90%)。91项测试(82%)对主要起始站透过了盲法推断。总之,基于所有的次要偏倚各种因素,25项测试(22.5%)具备更较高偏倚较高风险(三幅2)。根据所有主要和次要各种因素,有7项测试(6.3%)具备更较高偏倚较高风险。随即统计分析没标示出有出有三种学报的社论在主要各种因素(Kruskal-Wallis鉴定P = 0.28)或次要各种因素(Kruskal-Wallis鉴定P = 0.11)上的关联。然而,对非劣效性测试的科学研究上新设计或科学研究解决方案的可获得性透过评估,在三种学报中都,NEJM刊出格的测试,有74.2%刊出格过之外的分析方法社论或有在线的科学研究解决方案,JAMA为53.3%,Lancet为33.3%(Fisher准确鉴定P = 0.001)。时间发展趋势近些年来,这些学报上刊出格的心血管疾病非劣效性测试稍稍增加(P<0.001 for trend,三幅3)。一项随即统计分析标示出有,在111项确立的测试,刊出格时间在2010年后的有52项(46.8%)。2010年之后发布新闻的测试,普遍存在分析方法或科学调查报告书上都的较高风险稍稍降更较高(2010年之前 vs 2010年之后,主要偏倚各种因素和次要各种因素的P = 0.03和0.002)。探讨心血管疾病科技领域中都的非劣效性测试越来越多地刊出格在较高直接权威的学报上,这些测试非劣效性测试主要用做对上新打压新政策的鉴定。并且大多数是大型多中都心科学研究。鉴于许多非劣效性测试已成为批准上新疗法的基础,很有应该对他们透过科学研究。尽管大多数测试声称上新化疗手段相比对照组的非劣效性,但很多科学研究普遍存在具备偏倚较高风险的分析方法或科学调查报告书上都,确实会削弱其论断的可信度。有应该提较高对这些上都各种因素的认识,更好遵守FDA和CONSORT指南关于非劣效性测试上新设计、出台和调查报告的建议。原始注解:Behnood Bikdeli, et al. Non-Inferiority Designed Cardiovascular Trials in Highest-Impact Journals: Main Findings, Methodological Quality and Time Trends. Circulation. Jun 2019.