高国福 吴令英 赵方辉 戎寿德 李凌 潘秦镜 章文华 乔友林
摘要 目的 确定五种宫颈癌筛查技术的临界值,比较各筛查技术的筛查价值,为制定宫颈癌及其癌前病变筛查方案提供依据。方法 绘制ROC曲线,对各筛查技术的ROC曲线下面积进行两两比较。结果 ThinPrep Pap、VIA、阴道镜检查筛查宫颈癌的临界值都是"≧低度病变"。ROC曲线下面积:阴道镜检查法为0.832,VIA为0.751,ThinPrep Pap法为0.941,HPV自己取样检测为0.845,HPV直接取样检测为0.912。 结论 ThinPrep Pap法和HPV直接取样检测法筛查价值最高,阴道镜检查法和HPV自己取样检测法次之,VIA法筛查价值最低。
关键词 宫颈癌 筛查试验 ROC曲线
Receiver Operating Characteristic Curves for Valuing Multiple Screening Techniques for Cervical CancerABSTRACT Objectives To determine cut-off points of screening techniques for early cervical cancer and pre-cancerous lesion, compare their value, and provide evidence for designing further screening plan. Method 1997 women aged 35-45 were screened in a cervical cancer and pre-cancerous lesion patients' screening trial in xiangyuan county, shanxi province. Each woman had six independent examinations including: ThinPrep Pap smear examination, colposcopic examination , 5% acetic acid stain and visual inspection assessment, Human papillomavirus(HPV) direct test, HPV self-test and fluorescence spectroscopy. Fluorescence spectroscopy test was not analyzed in this article. To each screening technique, Receiver Operating Characteristic (ROC) curve was built and areas under ROC curves between techniques were compared. Results The cut-point of colposcopic examination system was low grade lesion or higher, the same as that of 5% acetic acid stain and visual inspection assessment and of ThinPrep Pap smear examination. Areas under ROC curves of colposcopic examination, 5% acetic acid stain and visual inspection assessment, ThinPrep Pap smear examination, HPV self-test and HPV direct-test were 0.832,0.751,0.941,0.845,0.912 respectively. Conclusion ThinPrep Pap smear examination and HPV direct-test have the same highest value for cervical cancer and pre-cancerous lesion screening, colposcopic examination has the same higher screening value as HPV self-test , and all techniques are better than that of 5% acetic acid stain and visual inspection assessment.KEYWORD cervical cancer screening test ROC curve
目前,常用于比较诊断性试验优劣的综合统计指标主要有约登指数、比数积、可用度、Kappa系数、信息量、平均信息量等[1],这些指标都与试验结果的归类有关。试验结果能否正确归类将会影响到这些综合指标的真实性和可信性,进而影响到不同诊断性技术间的比较。然而,大多数诊断性试验指标为生理性连续指标和有序的等级指标。对于这种指标,需要设定一个或多个区分正常与异常的临界值(cut off point)[2],以便进行诊断性试验效果的评价。绘制受试者工作特征曲线(Receiver Operating Characteristic Curve, ROC曲线)确定诊断性试验临界值是较为理想的方法[3]。本文对在同一人群中同时进行的五种筛查技术筛查宫颈癌及其癌前病变的试验结果,绘制ROC曲线来确定使各筛查技术灵敏度和特异度均较高的临界值,并对各筛查技术的ROC曲线下面积进行比较[4,5],以评价此五种技术的筛查价值。材料与方法材料来源: 资料取自1999年6月至7月间在子宫颈癌高发地区--山西省襄垣县对35~45岁妇女进行的宫颈癌及其癌前病变的筛查结果。筛查试验中各筛查技术独立操作,以病理组织学结果为金标准。筛查技术包括:薄层液基细胞学涂片法(ThinPrep Pap)、阴道镜检查、5%醋酸染色后直接肉眼观察(Visual Inspection Assessment,VIA)、人类乳头状瘤病毒自己取样检测法(HPV Self-test)、HPV直接取样检测法(HPV Direct-test)。阴道镜检查筛查结果按宫颈病变程度从高到低分为4级(对应表1中数字1-4):Cancer、HSIL、LSIL、Normal。5%醋酸染色后直接肉眼观察的筛查结果分为4级(对应表1中数字1-4):Cancer、HSIL、LSIL、Normal。细胞学诊断采用TBS(the Bethesda system)分级系统,从高到低分为5级(对应表1中数字1-5):SCC、HSIL、LSIL、ASCUS/AGUS 、WNL。HPV自己取样检测法和HPV直接取样检测法的筛查结果(对应表1中数字1-2)均记录为阳性和阴性。统计方法:ROC曲线下面积的计算原理 假设正常组有 个观察值,记为 (j=1,2,… , );异常组有 个观察值,记为 (i=1,2, …, )。如果观察值小为异常,根据Wilcoxon Mann-Whitney统计量,ROC曲线下面积(AZ )就是异常组每个观察值小于正常组每个观察值的概率,用公式表示为: 结果基本信息 共有1 997位妇女符合条件,成为筛查对象。共有65例指标有缺失。其中病例组86例,2例有缺失,占2.3%;正常组1911例,63例有缺失,占3.3%。ROC曲线 ROC曲线是用构图法揭示灵敏度和特异度的相互关系(如附图),它通过将连续变量设定出多个不同的临界值,从而计算出一系列灵敏度和特异度,再以灵敏度为纵坐标、(1-特异度)为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。附图中对角线下的面积为随机诊断产生的曲线下面积。在ROC曲线上,最靠近坐标图左上方的点为灵敏度和特异度均较高的临界值,其坐标对应的灵敏度和特异度如表1。从表1可以看到,阴道镜法筛查宫颈癌取等级3(≧LSIL)为临界值时灵敏度和特异度较高;同样,5%醋酸染色后直接肉眼观察、薄层液基细胞学涂片法分别取等级3(≧LSIL)为临界值时灵敏度和特异度较高。 ROC曲线下面积的比较 计算出ROC曲线下面积的目的并不是为了与随机诊断产生的 =0.5相比,而主要目的是为了比较两个或两个以上筛查技术,筛选出最佳筛查方法(如表2、3)。薄层液基细胞学涂片法与HPV直接检测法筛查价值最高,HPV自检法和阴道镜检测法次之,5%醋酸染色后直接肉眼观察筛查价值相对较低。讨论本研究是在可行性研究基础上,同一人群中,以病理组织学诊断为金标准,采用盲法进行的六种宫颈癌筛查技术的筛查效果评价[6-8],由于荧光分光镜法由设备生产厂家直接检测,美国克里夫兰医学中心负责计算它的灵敏度和特异度,且它的特异度极低(9%),因此在分析时不考虑荧光分光镜法。对于不同的宫颈癌筛查方法,灵敏度和特异度均较高的方法筛查价值较高;对于同一种筛查方法,获得的连续性或等级资料在不同的临界值下,灵敏度和特异度不同,需要根据筛查目的选择临界值。如果筛查技术是用于高危人群的初筛,对筛查技术灵敏度的要求要高于特异度;如果筛查技术被用于复筛,特异度的优先级要排在灵敏度之前。但是,单纯突出筛查试验的灵敏度或特异度都将极大地增加诊断医师的工作量,因此应选择灵敏度和特异度都相对较高的临界值,绘制ROC曲线是确定筛查试验临界值的较好的方法。同时,比较ROC曲线下面积可用于区分筛查技术的优劣。从ROC曲线可以看到,阴道镜法、5%醋酸染色后直接肉眼观察、薄层液基细胞学涂片法筛查宫颈癌分别取"≧LSIL"为临界值时筛查假阳性率和假阴性率之和最低,对应的各筛查技术的灵敏度和特异度分别为(0.807,0.764)、(0.711,0.742)、(0.867,0.934)。绘制ROC曲线确定筛查技术临界值是一种直观的、方便的方法。 最近10年,HPV感染与宫颈癌的关系得到广泛承认,其归因危险度达90%以上,人类已经明确认识到HPV感染是宫颈癌的首要病因。HPV直接检测法与薄层液基细胞学涂片法用于宫颈癌筛查的筛查价值近似(表3), ROC曲线下面积(表2)分别为0.912和0.941,是筛查价值最高的两种技术。HPV直接检测法与薄层液基细胞学涂片法都需要先期投入资金购置设备,对于卫生资源充裕的宫颈癌高发区,这两种技术是最理想的宫颈癌筛查技术。HPV自己取样检测法的筛查价值要显著低于HPV直接检测法(P〈0.01〉,但HPV自己取样检测法取样方便,可在短时间内获得大量样本,且极大地减轻了医务工作者的工作负担。同时,HPV自己取样检测法筛查准确性较高,ROC曲线下面积可达到0.845。另外,本次试验使用的采样工具为棉签,刷取的宫颈脱落细胞量较少,可能影响了检测结果,改进取样工具后可能提高HPV自己取样检测的灵敏度和特异度。本方法适用于在农村地区进行短期大规模的宫颈癌筛查。阴道镜检查应用于宫颈癌筛查的筛查价值与HPV自己取样检测法无显著差异,且阴道镜检测广泛应用于临床检查,医务人员的操作技术熟练,可根据卫生资源分布情况选择使用。5%醋酸染色后直接肉眼观察法应用于宫颈癌筛查的筛查价值相对较低,但这种方法仍能正确诊断70%以上的受检者,且具有简便、设备要求低、成本低廉的优点,因此在卫生资源贫乏地区是一种有效的宫颈癌筛查方法。综观筛查试验的分析过程可以看到,绘制ROC曲线是评价筛查试验直观而有效的方法,应在诊断性试验评价中推广应用。
绘制ROC曲线可以用统计软件SPSS 10.0版本[9]来完成。
参考文献1 杨玲,乔友林, 李楠,等.子宫颈癌多个筛查试验的综合评价及聚类分析.肿瘤防治研究,2001,28(4):253-255.2 李强主编.循证医学-临床证据的产生、评价与利用,第一版.北京:科学出版社,2001. 16-20.3 Andrew A. Renshaw, Barbara R. Dean, Edmund S.Cibas. Receiver Operating Characteristic Curves for Analysis of the Results of Cervicovaginal Smears. Arch Pathol Lab Med.1997,121:968-975.4 宇传华,徐勇勇.非参数法估计ROC曲线下面积.中国卫生统计.1999,16(4):5 James A. Hanley, Barbara J. McNeil. A Method of Comparing the Areas under Receiver Operating Characteristic Curves Derived from the Same Cases. Radiology. 1983,148(3):839-843.6 J. BELINSON, Y.QIAO, R.PRETORIUS,et al. Prevalence of cervical cancer and feasibility of screening in rural China: a pilot study for the Shanxi Province Cervical Cancer Screening Study. Int J Gynecol Cancer,
1999,9:411-417.7 赵方辉,李楠,马俊飞,等.山西省襄垣县妇女人乳头状瘤病毒感染与宫颈癌关系的研究.中华流行病学杂志,2001,22(5):375-378.8 乔友林,章文华,李凌,等.子宫颈癌筛查方法的横断面比较研究. 中国医学科学院学报,2002,24(1):50-53.9 苏金明等编著. 统计软件 SPSS for Windows 实用指南.北京:电子工业出版社,2000. 510-511.
