【柯·学堂】缺失值及LLOQ数据处理方法
- 分类:学术干货
- 作者:
- 来源:
- 发布时间:2021-10-17
- 访问量:0
▎缺失值的概念
在数据采集与整理过程中由于各种原因没有获得的数值、属性或内容。根据未获取的原因,可以分为两类:实际存在而没有被观测记录到的值、实际就不存在的值。
▎缺失值产生原因
❏ 某些研究属性对被研究者而言是不存在的;
❏ 有些信息在被研究者看来是需要保密的;
❏ 获取信息的成本较高;
❏ 填写者或者数据收集者的粗心,导致有些属性值被遗漏;
❏ 研究选项的要求较高,即要求被调查者迅速做出判断或决策;
▎缺失机制
❏ 完全随机缺失(MCAR):指的是数据的缺失是完全随机的,数据的缺失与缺失变量自身无关,也与其他任何变量无关;
❏ 随机缺失(MAR):指的是数据的缺失不是完全随机的,即该类数据的缺失与缺失变量自身无关,而与其他变量有关;
❏ 完全非随机缺失(MNAR):指的是数据的缺失与缺失变量自身有关;
▎缺失值对临床试验结果的影响
❏ 把握度和变异度;
❏ 偏倚:治疗组间的可比性、研究样本对目标疾病人群的代表性;
▎缺失值的处理
❏ 直接删除法
优点:简单易操作;
缺点:导致有效样本量减少,将会降低检验效能(把握度);除非缺失数据符合完全随机缺失机制,否则将不可避免的产生偏倚;
❏ LOCF法
优点:简单易操作;
缺点:未考虑受试者的状态会随时间而变化,将会产生一定的偏倚;
❏ 均值插补法
优点:简单易操作;
缺点:扭曲了缺失数据样本的分布,减小个体间差异;插补后的缺失变量进行组间比较时,往往会导致组间差异减小;
❏ 回归插补法
优点:考虑到了其他变量对缺失值的影响,克服了导致样本分布扭曲的缺陷;
缺点:容易人为地增强因变量与自变量的线性关系;只对缺失数据进行了一次插补,忽略了插补数据的不确定性;
❏ 多重插补法
优点:产生多个插补值,可以获得插补数据的不确定性;通过模拟缺失数据的分布,可较好的保持变量间的相关性;可以给出衡量统计结果不确定性的大量信息;
缺点:操作相对其他插补方法较复杂;
▎敏感性分析
为了评价填补缺失值后,对研究结果的影响,需要进行敏感性分析以评价主分析结果的稳健性。
如果分析结果与主要分析结果一致,那么可以保证所丢失的信息以及处理缺失数据的方法对整体研究结果不产生重要影响;相反,对于具有统计学意义的主要统计分析结果,如果敏感性分析与主分析结果不一致,则应讨论它们对试验结论的影响。
▎LLOQ的数据处理方法相关概念
❏ 定量下限(Lower Limit of quantitation,LLOQ)
是标准曲线上的最低浓度点,表示测定样品中符合准确度和精密度要求的最低药物浓度。
❏ 精密度
指在确定的分析条件下,相同介质中相同浓度样品的一 系列测量值的分散程度。通常用RSD来考察精密度。
❏ 准确度
准确度是指在确定的分析条件下,测得的生物样品浓度与真实浓度的接近程度。
▎LLOQ的数据处理方法
在进行药代动力学分析时,在达到Cmax以前取样的样品应以零值计 算,在达到Cmax以后取样的样品应以无法定量(Not detectable,ND)计 算,以减小零值对AUC计算的影响。
低于LLOQ的血药浓度数据在各个分析过程的处理:
各理论采血时点血药浓度数据统计描述:以“0”计;
绘制平均血药浓度-时间曲线:以“0”计;
绘制个体血药浓度-时间曲线:Tmax以前以“0”计,之后以“ND”计;
计算药动学参数:Tmax以前以“0”计,之后以“ND”计;
注:转载文章请注明出自“砝码柯数据科技”
扫二维码用手机看


版权所有 长沙砝码柯数据科技有限责任公司
湘ICP备18023436号-1
技术支持:中企动力 长沙
版权所有 长沙砝码柯数据科技有限责任公司
湘ICP备18023436号-1
技术支持:中企动力 长沙