公司新闻行业动态

杏彩平台客户端:总结临床研究常见统计方法与统计问题

2024-05-19 12:33:37来源：杏彩体育官网app 作者：杏彩体育平台登录

新闻摘要:　　在随机分组实验中，亚组分析会破坏随机化的作用，结果解释需谨慎。在临床试验中，若总体效应无统计学意义时，发现某亚组有统计学意义，只能为下一步研究提供假设依据，不能作为批准药物在该亚组人群中使用的依据

　　在随机分组实验中，亚组分析会破坏随机化的作用，结果解释需谨慎。在临床试验中，若总体效应无统计学意义时，发现某亚组有统计学意义，只能为下一步研究提供假设依据，不能作为批准药物在该亚组人群中使用的依据。

　　开展临床研究时，一般不会直接选择目标人群的总体进行研究，而是先根据合适的样本量计算公式计算出足够的样本量，再采用合适的随机抽样方法进行抽样调查，最后应用统计学原理和方法进行从样本到总体的假设检验和统计推断。生物统计学则贯穿于临床研究的整个阶段：试验设计（样本量确定和随机分组）、数据管理、统计分析计划制定、试验数据处理和统计分析报告。统计分析报告不仅用于科学论文的撰写，而且还是取得新药或器械等注册申请的法规材料。只有进行科学合理的统计分析，才能根据临床研究得出正确可靠的结论。

　　为规范我国临床研究的统计，2005年国家食品药品监督管理总局颁布了《化学药物和生物制品临床试验的生物统计学技术指导原则》[1]，对生物统计学在临床试验的各个阶段提出初步要求；2016年颁发了《药物临床试验的生物统计学指导原则》[2]，进一步细化和加强生物统计的内容和职责。由此可见，生物统计学在临床研究中起着不可或缺的核心作用和地位。本刊今年1~10期已对临床研究相关的方针政策、理论知识和实践工具等进行了介绍[3-12]，本文主要总结临床研究中常用的统计学方法，并对探讨临床研究中常见的统计问题。

　　描述统计一般在统计分析报告中首先进行汇报，且不可缺少。逐一对临床研究和样本人群的特征对应的单变量进行概括描述，但不对总体特征进行推断。在随机对照试验等涉及多组试验中可作为基线特征可比性的参考。正确使用描述统计的前提是必须了解临床研究中数据类型。

　　对于定性变量（包括二分类变量、顺序变量和名义变量），一般采用频数和百分比描述，其中等级资料可采用中位数和四分位间距进行描述[13]。对于定量资料，先进行正态性检验，如果变量近似正态分布一般采用均数和标准差，偏态分布需采用中位数和四分位间距[14]。

　　均值和标准差对离群值的比较敏感[15]，在临床试验的统计汇报中，对主要结局指标通常会采用多种形式进行综合描述：均值、标准差、中位数、最小值和最大值或范围、变异系数。对于包含时间的生存资料，对于小样本或大样本未分组的生存资料常采用Kaplan-Meier法，而对例数较多的分组资料采用寿命表法，对生存时间进行中位数及上下四分位间距的统计描述，同时绘制生存曲线直观反映生存情况。

　　单组设计的定性资料常用于样本率的参数与总体的已知率之间差异性检验。例如对于有些无法设计对照组的临床试验，采用单组设计的目标值法进行统计分析，常见于医疗器械临床试验[16]。资料整理构成一维列表，基于数据的二项分布原理和总体进行比较，大样本（n＞30）时按近似正态分布基于Z分布进行计算，小样本（n＜30）时采用ClopperPearson精确法或Blyth-Still的二项式比例计算。在优效、等效和非劣的实验设计中，单个样本的二项比例的可信区间的计算直接关系到结果，需要正确选择方法[17]。成组设计的定性资料中若响应变量是二分类，则构成常见的四格表。在横断面研究中根据不同的条件选择卡方检验或Fisher精确检验，评价组间构成比的差异。

　　在病例-对照研究和队列研究的四格表可用于计算OR和RR及其可信区间，同时采用Mantel-Haenszel卡方对OR和RR进行统计检验。在临床试验中，常用于安全性指标（不良事件是否发生）发生率的组间评价，样本例数较少时，直接指定Fisher精确检验。

　　若响应变量是多值有序变量，可采用Wilcoxo秩和检验（两组）和Kruskal-Wallis检验（两组以上）。若行和列的属性构成配对结构时，可用McNemar检验或Kappa检验对一致性分布进行定性和定量的检验。若分组变量为有序多分类，而响应变量为二分类时，除了可用卡方检验外，还可使用Cochran-Armitage趋势检验来检验率和有序多分类变量之间是否存在线一元定量资料的差异性检验

　　单组设计的定量资料和单组设计的定性资料的应用范围类似，但样本估计的参数是均值或中位数，根据正态性检验的结果选择统计方法。符合正态分布时，采用单样本t检验

　　符号秩检验，中位数的可信区间基于非参数方法计算[18]。对于成组设计的定量资料，若两组定量资料是配对关系，则计算差值后采用单组设计的统计方法。若组间的资料独立，则需根据各组的正态分布检验和方差齐性检验选择独立样本的t检验和Wilcoxon秩和检验（两组）

　　方差分析和Kruskal-Wallis检验（两组以上）。对于两组以上的检验，如果差异有统计学意义，可能需要根据研究设计选择合适的方法进行事后的两两比较分析。呈现结果时，需要呈现差异值（均值或中位数）及其95%可信区间。t检验和方差分析可根据t分布或正态分布进行可信区间的估计。而非参数检验不基于概率分布，差值中位数的可信区间估计需采用Hodges-Lehmann估计或bootstrap

　　相关分析常用于衡量两个变量之间的线性关系的强度和方向。如果满足正态分布条件，可采用Pearson相关分析

　　Spearman非参数相关分析。对于数据中出现的离群值，Spearman相关分析的结果更稳健。相关分析的结果描述的是两个变量的相关关系，没有时间顺序，不能用于因果推断。值得注意的是，对于两个连续变量的一致性评价，不能采用相关分析，而应采用Bland-Altman分析法

　　[19]。回归分析在生物统计中占有非常重要的作用，可用于探究一个因变量与一个或多个自变量的关系，通过拟合的回归系数直观的定量解释因变量随着自变量变化的变化，从而评价自变量对因变量的独立作用。在临床研究中回归分析主要用于影响因素的研究和预测模型的建立，在前瞻性研究设计中甚至可用于自变量和因变量之间因果关系推断。

　　根据自变量与因变量之间的关系可分为线性回归和曲线回归，根据连接函数的不同，可将线性回归进一步分为一般线性回归和广义线性回归。在临床研究中常用的回归分析是多重线性回归（连续型变量）、Logistic回归（二值变量、多值有序变量和多值名义变量，二项分布）、Poisson回归（计数型变量，Poisson分布）、负二项回归（计数型变量，负二项分布）和COX模型回归（生存资料）

　　，在实际应用中根据不同的结局指标类型选择合适的回归模型。此外，一些基础统计方法和回归分析之间可相互转化，例如卡方分析和t检验仅能定性评价组间差异，回归分析对自变量的统计检验和回归系数拟合能定性定量的评价组间差异，回归分析能提供更多的信息，所以在复杂的模型中推荐使用回归分析。在临床研究中对主要连续指标会在实验开始前测量，称为基线值；在研究干预效果时，基线作为特殊的协变量必须要纳入考虑，协方差分析是回归分析和方差分析的结合，扣除基线值对因变量的影响之后，再研究分组的修正均值的差别，该方法在多重线性回归中实现。

　　双重差分方法使用越来越广泛[20]，其思想是实验组前后的变化值减去对照组前后变化值得到真正的干预效应。在回归分析的操作中，将前后差值作为因变量，基线值作为协变量，分组变量作为分析因素，同时纳入两者的交互作用，得到各组的前后差值和组间的双重差值，同时能对组间的差值进行差异性统计检验，定性定量的评价干预效果。1.2.4生存资料的分析

　　临床研究的观测结果需要做长期随访才能确定，所以评价影响因素或干预效果时，不仅需要分析感兴趣的重点事件是否发生，还要考虑到达终点时经历的时间长短。生存分析是将终点事件是否发生和所经历的时间结合起来的统计分析方法。生存曲线的组间比较常采用的是Log-rank检验（对远期差异敏感）和Wilcoxon检验（对近期差异敏感）

　　若确定生存资料服从某特定分布（Weibull分布、指数分布、对数正态分布或Gamma分布等），需使用相应的参数模型拟合，能得到更准确的结果。若生存资料的准备分布无法获得时，可采用COX等比例风险模型

　　，其不依赖特定分布的特点，在随访研究中得到非常广泛的应用。COX模型的使用需要满足风险等比例的前提假设，对分类协变量可检验生存曲线是否交叉，对连续协变量需拟合偏残差与生存时间的关系。若不满足前提假设，需采用含时依协变量的COX模型，此外某些协变量在随访过程会发生改变，也需要采用该模型进行分析[21]。一般的生存资料假定受试者在随访时间内最多经历一次随访事件，然而受试者可能经过多次相同或类似的结局事件（复发），针对该类生存资料需要采用

　　Anderson-Gill强度模型，该模型假定每次事件类型相同且相互独立[22]。1.2.5重复测量数据

　　在纵向资料中可能会对结局指标进行多次测量，构成重复测量的数据，该实验设计在临床研究中应用广泛。由于数据的非独立性，不满足一般回归的前提假设，常用的统计方法有重复测量的方差分析、混合效应模型和广义估计模型

　　混合效应模型和广义估计模型采用纵向数据格式，能有效利用样本的信息，根据不同的协方差矩阵结构保证分析结果更加准确保守，同时能对时变因素进行多重比较[23,24]。所以针对重复测量数据应主要采用混合效应模型和广义估计模型。混合效应模型考虑随机效应，是对个体水平值的估计，而广义估计模型主要考虑固定效应，是对总体平均水平值的估计，在分析时根据需求选择。

　　临床研究不会选择总体目标人群而是选择合适的具有代表性的样本进行研究。根据假设检验原理，样本过小，无法检验出真实存在的差别，得到的结论缺乏充分的依据，样本过大，会造力、物力和时间的不必要浪费，甚至会因为投入不足而导致研究质量下降，此外临床研究的对象大部分是人，而在研究过程中可能会对研究对象造成不同程度的损伤，所以正确估计样本量是临床研究中的非常重要的前提工作。样本量的大小与很多因素有关，如试验设计类型、检验水准、把握度、期望的效应值和标准差等。选择合适的参数并借用正确的计算公式，进行样本量的估计。

　　在非随机对照实验中，由于没有事先对研究对象进行随机分配，某些已知或未在的重要混杂因素在组间分布可能不均匀，使得对比组间缺乏可比性，从而无法真实评价分组因素的真实作用。传统控制混杂可使用回归分析进行调整，但当混杂因素过多时不太适用，近几年匹配在大样本的观测性研究中得到广泛应用。常用的匹配方法有个体匹配、多元匹配和倾向得分

　　多元匹配是根据协变量之间的马氏距离按照最近原则进行匹配。倾向得分是根据已知协变量计算研究对象进入研究组的概率，最常用的模型是Logistic模型和判别分析。倾向得分可直接作为协变量进行模型的调整校正，或根据倾向得分分层后进行分层分析。倾向性得分匹配根据倾向性得分进行匹配，是最常用的方法，一般指定卡钳值进行最近匹配。

　　。在临床研究，特别是临床试验中使用越来越多[25]。临床研究的设计和分析常基于一定的假设，如果假设不满足可能会带来一定影响，敏感性分析通过改变研究假设、统计分析方法和模型等方法来检验研究结论是否一致，常见场景有缺失值、离群值、研究方案违背、研究结局的不同定义、基线不均衡等。主要分析结果和敏感性分析的一致性能巩固研究结论，使研究发现更可信。临床试验中，需在方案中提前定义，结论不一致时需讨论并合理解释。

　　期中分析是指在临床试验中按照方案在研究结束前对有效性和安全性进行评价，常用于尽早确认药物的有效性、样本量的重新估算和检测试验的安全性。若以有效性评价为目的时，多次期中分析（假设检验）会增加假阳性率，所以需要调整检验水。

杏彩平台客户端

【责任编辑：】(Top) 返回页面顶端

上一篇：临床医学国际化人才培养模式探索下一篇：临床研究基础知识你想知道的都在这里