[附] 资料的综合分析
前面几章介绍了常用的统计方法。在实验工作中,必须根据研究目的与资料性质,并结合专业知识,恰当地运用统计方法,才能做出正确的、符合实际的结论。例如:某院为探明胃液及胃组织的瘤胚抗原(Carcino embryonic Antigen CEA)在胃癌诊断、癌前病变筛选及随访方面的意义,胃液、胃组织CEA含量的相互关系,以及CEA与胃组织病理学改变的关系,测定了各种胃病患者的胃液、胃组织及血清中CEA含量,并用同样方法测定了部分正常人胃液CEA含量作为对照。表1、表2是测量结果的一部分。下面我们简要介绍统计处理的一般程序及统计方法的选择。
表1 三组不同人员胃液癌胚抗原(CEA)测定结果
组别 |
胃液CEA含量(ng/ml) |
定性结果 |
||||||
阳性 |
阴性 |
|||||||
正常 人组 |
20.4 |
30.2 |
210.4 |
365.0 |
56.8 |
37.8 |
2 |
30 |
265.3 |
175.0 |
169.8 |
256.4 |
254.0 |
262.3 |
|||
170.5 |
360.0 |
78.4 |
86.4 |
128.0 |
24.1 |
|||
28.5 |
108.5 |
472.5 |
158.6 |
238.7 |
253.6 |
|||
57.0 |
189.6 |
59.3 |
259.3 |
380.2 |
210.5 |
|||
64.6 |
87.3 |
|||||||
萎缩性胃炎组 |
281.0 |
377.1 |
230.0 |
537.9 |
248.7 |
571.4 |
21 |
14 |
766.2 |
495.o |
87.3 |
389.8 |
423.9 |
577.3 |
|||
66.8 |
521.3 |
327.8 |
421.4 |
149.7 |
47.5 |
|||
425.7 |
270.8 |
378.5 |
228.0 |
538.4 |
245.6 |
|||
584.1 |
648.8 |
485.6 |
110.8 |
398.7 |
452.6 |
|||
587.7 |
86.8 |
532.1 |
311.6 |
442.2 |
||||
胃 癌 组 |
480.0 |
488.9 |
350.7 |
652.8 |
1400.0 |
850.0 |
24 |
4 |
725.6 |
590.0 |
765.0 |
1200.0 |
231.2 |
485.3 |
|||
600.0 |
1380.0 |
438.5 |
652.4 |
432.8 |
296.1 |
|||
608.8 |
688.5 |
630.5 |
750.0 |
815.0 |
664.0 |
|||
348.6 |
550.0 |
640.0 |
464.8 |
表2 10例胃癌患者胃液CEA含量与胃组织肿瘤CEA含量的关系
病例号 |
胃液CEA含量 |
胃组织肿瘤CEA含量 |
(ng/ml) |
(cm2·ng/mg) |
|
1 |
432.8 |
6.6 |
2 |
488.9 |
8.2 |
3 |
600.0 |
15.7 |
4 |
608.4 |
14.8 |
5 |
640.2 |
16.2 |
6 |
750.0 |
15.8 |
7 |
815.0 |
18.2 |
8 |
1200.0 |
20.0 |
9 |
1380.0 |
20.0 |
10 |
1400.0 |
20.0 |
一、了解研究目的、资料搜集情况、数据意义、整理分析要解决什么问题
无论动物实验、临床观察或现场调查,应当目的明确,周密设计,精心操作,认真记录,务必使获得的原始资料完整、准确、真实、可靠。如果是替别人整理分析资料,在接受任务时,也首先必须把这些问题搞清楚,才能做出正确的、符合要求的分析。若发现某些资料不全或有可疑数值,应及时查明原因,加以改进,必要时补做实验或重新调查。本例研究目的已如上述。所观察的病人诊断都是明确的,标本采集,数据测定都是在实验室进行,仪器性能稳定,操作者技术熟练,资料是可靠的。统计分析的主要目的在于比较正常人、良性胃病患者、胃癌病人的胃液CEA含量有无显著差别,从而考虑该项指标能否作为胃癌早期诊断的一个辅助指标和随访的一个手段。此外,对胃液与胃组织肿瘤CEA含量作相关分析,找出它们间有无直线关系。
二、区分资料类型
这就是要分清所得到的资料哪部分是计量资料,哪部分是计数资料,尔后分别采用不同的统计分析方法来处理。本例表1左半部分是胃液中CEA含量,属计量资料;右半部分是以95%正常值范围单侧上限值370(ng/ml)为界限,凡≥370(ng/ml)者为阳性,<370(ng/ml)者为阴性,然后清点每组阳性、阴性例数,这是计数资料。表2是对确诊的10例胃癌患者,既测定了胃液中CEA含量,又测定并计算出胃组织肿瘤CEA含量(根据前人经验用肿瘤面积与胃粘膜中CEA含量相乘,cm2·ng/ml)。显然,这是两个变量的问题。为方便叙述。我们按资料类型依次分析。
三、计量资料的处理
先要了解样本含量与频数分布情况。因为大样本或小样本、正态分布或偏态分布,统计方法的选择与统计指标的计算都有所不同。本例三组例数都在30左右,各组观察值分布比较均匀、对称,必要时可作正态性检验,故可按小样本、正态分布处理。
(一)计算平均数与标准差,以说明各观察值的集中趋势与变异情形。若观察值呈偏态分布,则应计算中位数;若系对数正态分布或等比资料,则计算几何均数。本例见表3第(3)第(4)栏。
(二)作为正常对照,用估计正常值范围的方法计算正常人组单侧上限95%正常值。宜用正态分布法;172.47+1.645×119.50=369.05,故以370(ng/ml)作为单侧上限值。但由于例数较少,稳定性受到影响,因而还不能作为正常值范围来推广应用。
(三)计算标准误,以说明样本均数的散布情形,描述抽样误差的大小。必要时,用平均数与标准误结合,计算可信区间,以估计总体均数所在范围。见表3第(5)、第(6)栏。
表3 各组平均数、标准差、标准误及95%可信区间
组别 |
N |
X |
S |
Sχ |
95%可信区间 |
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
正常人组 |
32 |
172.47 |
119.50 |
21.12 |
129.38<μ<215.55 |
萎缩性胃炎组 |
35 |
378.52 |
182.33 |
30.82 |
315.89<μ<441.15 |
胃癌组 |
28 |
649.25 |
285.66 |
53.98 |
538.48<μ<760.02 |
(四)均数之间的比较:自身对照或配对设计资料(即成对计量资料)用个别比较t检验,两组均数比较用团体比较t检验,三组以上均数比较用方差分析。在方差分析前应作方差齐性检验,若方差不齐,则应用秩和检验,或经变量代换后再作方差分析。本例三组资料经代入式(8.5)与式(8.6)求得校正χ2值为21.04,χ2>χ20.01,2,P<0.01,三组方差在α=0.01的水准上相差显著,故不宜用方差分析。所以我们用秩和检验,经代入式(10.8)得H=50.321,H>χ20.01,2,P<0.01,在α=0.01的水准上相差显著。再用式(10.7)作两组之间的比较,结果正常人组与萎缩性胃炎组之间u=4.475,萎缩性胃炎组与胃癌组之间u=4.150,正常人组与胃癌组之间u=6.253,均在α=0.01的水准上相差显著,正常人组最低,萎缩性胃炎次之,胃癌组最高。
四、计数资料的处理
(一)计算有关的相对数,常用的是率与百分比。如本例,可求出三组的阳性率,见表4。
表4 三组胃液CEA阳性率(%)
组 别 |
检查例数 |
阳性例数 |
阴性例数 |
阳性率(%) |
正常人组 |
32 |
2 |
30 |
6.25 |
萎缩性胃炎组 |
35 |
21 |
14 |
60.00 |
胃 癌 组 |
28 |
24 |
4 |
85.71 |
合 计 |
95 |
47 |
48 |
49.47 |
(二)必要时,也可以计算率的标准误,以描述率的抽样误差大小;然后根据样本大小,分别用计算法或查表法求得率的可信区间,以估计总体率所在范围。
(三)几个率之间的比较,常用χ2检验。仅有两组的用四格表计算(当样本较大时也可用u检验),三组以上的用2×K表计算。本例共有三组,每组分为阳性、阴性两种类型,所以应用2×K表专用公式求χ2值。结果χ2=40.18,χ2>χ20.01,2,P<0.01,说明三组阳性率在α=0.01的水准上相差显著。再用四格表进行检验,结果正常人组与萎缩性胃炎组之间得χ2=19.10,χ2>χ20.01,1,P<0.01;正常人组与胃癌组之间得χ2=25.53,χ2>χ20.01,1,P<0.01。以上均在α=0.01的水准上相差显著,而萎缩性胃炎组与胃癌组之间得χ2=3.86,χ2>χ20.05,1,P<0.05,相差显著。我们在前面对三组胃液CEA含量用秩和检验作两两比较,结果都是在α=0.01的水准上相差显著,这说明计量资料获得信息多些。
五、两个变量间直线关系的分析
如果两变量的关系是相互的,分不清自变量与应变量,没有理由用一个变量去推算另一个变量,就只计算相关系数,不建立回归方程。如果两变量间存在直线关系,且需要从一个变量推算另一个变量时,可再建立回归方程,必要时还可以编制用一个变量估计另一个变量的对照表,本例10名胃癌患者胃液CEA含量与胃组织肿瘤CEA含量属于两个变量的关系问题,先计算相关系数,得r=0.818,r>r0.01,8,P<0.01,在α=0.01的水准上相关显著。这说明肿瘤越大,胃组织病变越严重,胃液中CEA含量就越高,所以,若需要根据胃液中CEA含量推算病变严重程度,亦可计算回归方程。
根据以上统计分析,本例可得出如下结论:①胃癌病人的胃液CEA明显升高,提示可作为胃癌诊断的一个辅助指标,在早期胃癌诊断中可能有一定作用;其含量高低与肿瘤大小及胃组织CEA含量有关。②胃癌良性病变,胃液CEA含量也增高,提示该项指标可作为胃癌前疾病筛选和随访的一个手段。③良性病变与恶性病变胃液CEA含量重叠较多,所以应用该项指标作良性与恶性病变的鉴别诊断,尚待深入研究。
(尹全焕 编)