By - admin

R学习笔记07 — 净重新分类指数(NRI)的计算原理与方法_解说国自然的专栏文章_微信文章

题记:礼物冠词本人议论毛重行分类指数(Net ReclassificationIndex, NRI的计算规律与方式,迎将专家批判雅正。。

1. 上下文知

毛重行分类指数(NRI)下面所说的事基准与序所述DCA剖析有同工异曲之处(R探究笔记 05 — Decision 半面方针决策半面绘制,下面所说的事基准一号用于评价评价实验中新的评价基准较旧评价基准把探究瞄准停止右手分类在总额上的转变。因本人可以评价评价检验预测的正确。,它也可以用来判别预测模特儿的正确。,从颁发的临床探究著作中,NRI被更在海外地用于较比两种预测模特儿的精确的。。两种预测模特儿的准确和辨别度都是DESC。,普通计算C与应有的数量相符量(R探究笔记) 02 — Logistic回归做成某事C与应有的数量相符量计算方式,或许ROC半面下的面积是AUC。,C与应有的数量相符量或AUC有必然的局限。:

1. C与应有的数量相符量/AUC不敷敏捷。,当本人想在原始模特儿中引入新的基准时,,模特儿的预测能耐欢迎放吗?,此刻,新增基准偶尔难以提高C-STA。,增量有时不尖锐地。; 

2. C-MISTA/AUC的专业意味并非易事使具体化。,很难将其转变为针对性的临床解说。。NRI克制了这两个缺陷。。

2. 计算规律

本人率先以两个分类评价基准为例停止阐明。,此后将其申请表格于P的预测能耐的定量较比。,前者通常是手工计算的。,后者必要与应有的数量相符软件。。简略来讲,旧评价基准会把探究瞄准分类为病号和非病号,新的评价基准将病号重行分类为病号和非P。这是较比新的。、探究纠结破旧评价基准的分类转变,你会被发现的人少数探究瞄准。,这在旧评价基准中是不对的。,但它在新评价基准中被右手分类。;也有少数探究课题。,原来是右手分类在旧评价基准中。,但在新的评价基准中,它被不对分类。,到这程度,探究瞄准的分类是新的。、旧评价基准会有转变。,本人申请表格这种重行分类。,来计算毛重行分类指数NRI[1,2]。课文读了采。,适用于下面的计算做事方法来扶助化食。。

率先,停飞评价C将受试者分为两组。,此后,分开在这两组,停飞新的、旧评价基准的预测与分类算是,一套成两对双胞胎之一的四次表式。,如表1所示。表2。下面。。

表1。 病笃的重行分类

发病率群体N1

新基准

旧基准

雄性的

否定

雄性的

a1

b1

否定

c1

d1

表2. 健康组重行分类表

b2

健康组(N2

新基准

旧基准

雄性的

否定

雄性的

a2

否定

c2

d2

本人次要关怀被重行分类的探究瞄准,从表中可以看出,在发病率群体总额为N1),新评价基准右手分类,旧评价基准分类右手。,新的基准分类是不对的,而旧的基准是分类的。,到这程度,新模特儿优于旧模特儿。,右手分类改善的系数为(C1-B1) N1。同样地,非病号组(总人数为N2),新评价基准右手分类,旧评价基准分类右手。,新的基准分类是不对的,而旧的基准是分类的。,新评价基准与右手分类的比率 N2。鞋楦,并有组和非病号组的算是,将新模特儿与旧模特儿停止了较比。,毛重行分类指数NRI= (c1-b1)/ N1+(b2-c2) / N2,普通称为相对NRI。

无论NRI>0,这是正片的改善。,算是暗示,新基准放了预测能耐。;无论NRI<0,则为负提高,新基准预测能耐下降;无论NRI=0,则以为新模特儿不注意提高。本人可以经过计算Z与应有的数量相符量,来判别NRI与0相比无论具有与应有的数量相符学尖锐地性,与应有的数量相符量Z近似服从正态分布,表现如下图1.,停飞Z值可计算P值。

图的Z与应有的数量相符量的计算表现

很是两个类别的评价基准的人家提议。,另一方面,预测模特儿类有时更复杂。,但基本初步是平等地的。。停飞两个分类基准率直的,偶尔也过于SIM。,探究人员可能性更关怀最近呕吐的风险。,预测模特儿可以给予呕吐或起点事变的概率。。像,探究瞄准停飞预测分为低。、中、高风险三组,有针对性的干涉可以更有针对性。。几乎这种算是,风险概率是三个分类或更多的分类。,ROC剖析是不恰当的。,因ROC剖析的算是通常是两个分类变量。,将ROC剖析的申请表格先决条件的伸出到三分类,ROC半面可以演出天体的观察。,虚构十分烦恼。,更加绘制也不克不及率直的较比两种预测模特儿的AUC。,更难以解说其重要性。,NRI可以晴天地处理这些成绩。。NRI是什么处理这些成绩的?

颁发于与应有的数量相符 这是MED拍摄的判例,它关涉NRI的分类。,探究人员运用著名的弗雷明汉。 专心探究是根底。,在文学名著模特儿中在内HDL HDL-C指数。,最近10年冠状动脉心脏病预测能耐的放。探究人员率先较比了新的。、旧模特儿的ROC半面,算是暗示:、旧塑造的AUC是,在内HDL-C后,新的预测模特儿AUC附带说明。,辨别无与应有的数量相符学尖锐地性(P=),暗示新模特儿不注意尖锐地提高。,如图2所示。。随后,探究者更多的根究了冠状动脉心脏病的机会概率。,根据 <6%, 6-20%, >20% 分为低、中、最高级三组,原始教科书做成某事表如图3所示。,并计算了NRI,Z=,P<,具有与应有的数量相符学尖锐地性,提示在在内了新的生物标志物后,新模特儿的预测能耐有所提高,右手分类的系数放了。

图2。 新、旧模特儿ROC半面的较比

/script>

图3。 重行分类的使成形在原文件被截取。

很初步均已达到。,下面是什么经过R软件计算NRI。。本人必要在在这里隔开叙事诗。,1. 无论本人简略地计算人家新的两个分类的评价能耐,请参阅下面的表现。,在互联网网络上也有具有超自然力的事物汇编的R讨论计算;2. 由于Logistic回归的两种预测模特儿的NRI计算;3. 由于Cox回归的两种预测模特儿的NRI计算〔3〕。产生着的R中NRI的计算方式全部可参阅下表3。,本人专注于计算NRI[4-6]由于NICRIES包。,提议该包装盒用于NRI计算。。

表3。 NRI的封装可以用R计算。

3. 判例演示

(1) 两种分类算是

示例记载出生于遗风包做成某事Mayo诊所记载。,记载了418位病号的临床基准与主要的苦味性硬变(PBC)的相干。前312位病号出生于RCT探究。,另一边病号出生于队列探究。。本人用前312例病号的记载来预测2000地利间点上无论产生亡故。在这里必要解说的是原始记载是人家遗风记载。,本人重行限界两个分类的算是。,亡故或 遗物,不理工夫精神错乱。先堆积记载。,如图4所示。。此表做成某事终极变量是陈述。,0 = 使死亡(截尾),1 = 接收肝移居,2 = 亡故。亡故与否的探究目的是两个范围变量。,因而本人必要做变量代替的。。再看一下工夫栏。,有些是不敷的2000天。,这些战利品在不到2000天内就亡故了。,或许它被截了。。本人必要截2000天内截的记载。。记载中变量的另一边使具有特性意味可以排序。:? 人民银行意见。

图4。 记载体系

R讨论加密和算是的解说

##here consider pbc dataset in survival package as an example

library(nricens)

dat= 中国人民银行〔1:312〕,]

dat$sex= ifelse(dat$sex==”f”, 1, 0)

截少于2000天的使死亡记载。

dat= dat[ dat$time > 2000 | (dat$time < 2000 & dat$status == 2), ]

##“[ 指令过滤先决条件的,| 表达或,为了调和。因而先决条件的句执意dat做成某事time一列大于2000的保存,或不足2000,但同时也保存亡故陈述。。鞋楦人家“,”别忘了,其在先决条件的句的后面表现对列停止选择,然后,选择行。,这行是在在这里滤色镜的。。

##predciting the event of 亡故 before 2000 days

event= ifelse(dat$time < 2000 & dat$status == 2, 1, 0)

限界工夫算是事变<2000,且status为2(亡故)时,记为1,否则为0。

##standard prediction model: age, bilirubin, and albumin

= 矩阵(参加(DAT), select = C(年纪), bili, 清蛋白)

DAT记载集的参加是用变量建造物的。:age,bili, albumin,并将其设为矩阵体系。

##new prediction model: age, bilirubin, albumin, and protime

= 矩阵(参加(DAT), select = C(年纪), bili, albumin, 前置词工夫)

DAT记载集的参加是用变量建造物的。:age,bili, albumin, protime,并将其设为矩阵体系。

##glm fit (组织工作) 模特儿)

mstd= GLM(事变) ~ ., 二项的(logit), (事变), ), x=TRUE)

mnew= GLM(事变) ~ ., 二项的(logit), (事变), ), x=TRUE)

两种组织工作回归模特儿的设备,mstd 和mnew,后者比前者更具可变的。。X=Trand是最近NICSES使成群计算局必要的。,指令输入记载无论使具体化所运用的记载表。。

##predicted risk

= mstd$fitted.values

p.new= mnew$fitted.values

##分开计算两个模特儿的预测风险

达到了前述的Logistic回归模特儿。。

##Calculation of risk category NRI using (””, ””).

nribin(= mstd, mdl.new = mnew, cut = c(0.2, 0.4),

       niter = 1000, updown = 类别

##Calculation of risk difference NRI using (事变), ””, ””).

nribin(事变)= event, = , = , cut = c(0.2, 0.4),

       niter = 1000, updown = 类别

##Calculation of risk difference NRI using (事变), ””, ””).

nribin(事变)= event, = , p.new = p.new, cut = c(0.2, 0.4),

       niter = 1000, updown = 类别

##Calculation of risk difference NRI using (””, ””).

/script>

nribin(= mstd, mdl.new = mnew, cut = , niter = 0,

       updown = 辨别

##Calculation of risk difference NRI using (事变), ””, ””).

nribin(事变)= event, = , = , cut = ,

       niter = 1000, updown = 辨别

##Calculation of risk difference NRI using (事变), ””, ””).

nribin(事变)= event, = , p.new = p.new, cut = ,

       niter = 1000, updown = 辨别

新旧两种模特儿的准确较比。缺口是判别风险程度的关键指定。,如今本人先前写了2页。,也执意说,0~20%是低风险。,颜料溶解液风险20%~40%,40%~100%是高风险。停飞实际情况决定风险隔开的边线值。,相当于将陆续风险概率隔开为次序的风险。。UpDead是一种限界范本风险的方式。,范围是分类使丧失。,即低、中、高风险;寂静可供选择的事物辨别。,为陆续值。选择辨别时,割集1个值。,比方,即以为当预测的风险在新旧模特儿中相异2%时,这被以为是一种重行分类。。NITER是迭代次数。,也执意说,重采样的次数。,计算NRI的基准误差必要经过重采样来计算。,无论设置为0,则破旧的不注意计算NRI的基准误差。,迭代次数设置为1000次。,无论它太大,它必要上级的的计算拍子。,计算可能性必要很长工夫。,自然,设置越大,准确越高。。反省卓越alpha普通设置为。

次要算是如图5所示。图6。下面。:

图5。 在极度的终场演奏中中、雄性的终场演奏、负面算是的重行分类表(判例应该是穿插的),把持对某人找岔子终场演奏并不注意产生。

图6。 Re山姆后的NRI点观察、基准误差和可靠区间。新型重行分类的系数高于旧打字。,就是说,人家新的预测VAR模特儿的预测准确。,新塑造比旧塑造差。。

(2) 遗风材料

判例记载与前述的记载俱。。遗风记载与分类算是经过的NRI辨别是,到这程度,本人率先开发人家新的和旧的Cox回归模特儿。,计算NRI。在这两个模特儿中。

R讨论加密和算是的解说

##here consider pbc dataset in survival package as an example

/script>

library(nricens)

dat= 中国人民银行〔1:312〕,]

dat$sex= ifelse(dat$sex==”f”, 1, 0)

##predciting the event of 亡故

time= dat$time

event= ifelse(dat$status==2, 1, 0)

##standard prediction model: age, bilirubin, and albumin

= 矩阵(参加(DAT), select = C(年纪), bili, 清蛋白)

##new prediction model: age, bilirubin, albumin, and protime

= 矩阵(参加(DAT), select = C(年纪), bili, albumin, 前置词工夫)

##coxph fit排列Cox遗风应变量模特儿

mstd= coxph(Surv(time,event) ~ ., (time,event,), x=TRUE)

mnew= coxph(Surv(time,event) ~ ., (time,event,), x=TRUE)

##predicted risk at t0=2000,2000地利间点的亡故风险

= get.risk.coxph(mstd, t0=2000)

p.new= get.risk.coxph(mnew, t0=2000)

##很新、旧Cox回归模特儿排列达到,并计算了2000天的新、旧模特儿计算的亡故风险

##Calculation of risk category NRI

##by the KM estimator using (””, ””).

nricens(= mstd, mdl.new = mnew, t0 = 2000, cut = c(0.2, 0.4),

        niter = 1000, updown = 类别

##by the KM estimator using (”time”, ”event”, ””, ””).

nricens(time= time, event = event, = , = ,

        t0 = 2000, cut = c(0.2, 0.4), niter = 1000,updown = 类别

##by the KM estimator using (”time”,”event”,””,””).

nricens(time= time, event = event, = , p.new = p.new,

/script>

        t0 = 2000, cut = c(0.2, 0.4), niter = 1000,updown = 类别

##Calculation of risk difference NRI by the KM estimator

nricens(= mstd, mdl.new = mnew, t0 = 2000, updown = 迪夫,

        cut = , niter = 1000, updown =类别

##Calculation of risk difference NRI by the IPW estimator

nricens(= mstd, mdl.new = mnew, t0 = 2000, updown = 迪夫,

        cut = , point.method = IPW, niter= 1000, updown = 类别

参量解说与分类算是。

次要计算算是如下图7。与图8.所示:

图7。 在极度的终场演奏中中、雄性的终场演奏、负面算是的重行分类表(判例应该是穿插的),把持对某人找岔子终场演奏并不注意产生。

图8. NRI点观察的计算算是及重抽样后观察的可靠的区间。新型重行分类的系数高于旧打字。,就是说,附带说明预测变量的新模特儿更精确的。。

本章对NRI的计算停止了阐明。。鄙人一章中,本人将引见另人家键IDI(集成)。 Discrimination Improvement,综合学校判别改善指数的计算方式。

4. 适用于著作

[1] Alba A C, Agoritsas T, Walsh M, et al.Discrimination and Calibration of Clinical Prediction Models: Users” Guides tothe Medical Literature [J]. Jama, 2017, 318(14): 1377-84.

[2] Pencina M J, D”Agostino R B, Sr., D”AgostinoR B, Jr., et al. Evaluating the added predictive ability of a new marker: fromarea under the ROC curve to reclassification and beyond [J]. Statistics inmedicine, 2008, 27(2): 157-72; discussion 207-12.

/script>

[3] 

[4] Pencina MJ, D”Agostino RB, Steyerberg EW. Extensions of net reclassificationimprovement calculations to measure usefulness of new biomarkers. Statistics inMedicine 2011.

[5] Uno H, Tian L, Cai T, Kohane IS, Wei LJ。 A unified inferenceprocedure for a class of measures to assess improvement in risk predictionsystems with survival data, Statistics in Medicine 2012.

[6] Hsu CH, Taylor JMG。 A robust weighted Kaplan-Meier approach fordata with dependent censoring using linear combinations of prognosticcovariates, Statistics in Medicine 2010.

发表评论

Your email address will not be published.
*
*