QQ交流群

320329799

305165954

184129865

101257833

140135403

146136058

108169116

139123161

112171963

188090122

252067292

164051498

249096029

255092824

173105739

156074222

216087067

115336695

136190542

258120027

199245497

192172040

426904267

434117579

136592784

421906953

421906846

425905646

微信

医汇心血管学术 > 医学统计学基本概念与的统计设计

医学统计学基本概念与的统计设计

发表于 2014-10-09 15:08:38
在临床医学科学研究中, 无论是疾病防治的效果研究还是各项试验的研究结果,都受到许多因素的影响。一项科学的研究工作,应该有合理的设计,如果事先没有经过周密的考虑,在设计上存在较大的问题,研究所获的资料就不可能通过统计分析得出比较可靠的科学结论。  为了能以较少的人力物力获得明确可靠的结论,在进行研究之前,应针对研究目的经过深思熟虑后制定出包括最后如何统计分析在内的整个研究工作计划。由于临床医学研究通常是根据研究目的通过抽样来研究某个或多个实验因素的作用,因此,研究设计必须应用统计学原理对实验因素作合理的、有效的安排,并最大限度地减少实验误差,使达到高效、快速和经济的目的。故研究设计的主要内容是统计设计,其他则根据不同的专业有所不同。第一讲、医学统计学基本概念1、必然事件与随机事件 在一定条件下必然发生的事件称为必然事件;在医学上有很多问题同时有多种可能结果,但事先又无法确切知道哪种结果正确,这种问题我们称为不确定问题。这种一个问题有多种可能结果的现象,我们称为不确定现象。统计学上把那些可以发生也可以不发生、可以这样发生也可以那样发生的事件称为随机事件。不确定现象在自然界相当普遍,我们可以将其简单分为结果有限的情况和结果无限的情况当考虑某人的性别、职业、疾病治疗效果等情况时,只可能有有限的几种结果,但事先又无法确定,类似这种情况,都属于结果有限的不确定现象。当考察某人的血压、肌苷、尿素氮等情况时,可能的结果是无限的,但事先也无法确定,类似情况都属于结果无限的不确定现象2、随机变量为了描述和处理随机事件的方便,通常用变化大小和方向都不确定的随机变量来表示随机事件,用随机变量的取值来代表不确定问题的结果。对于结果有限的不确定问题,采用离散型随机变量进行描述,而结果无限的不确定问题,则采用连续型随机变量与其对应。如将性别看作随机变量,则男、女分别是性别这一变量的值,也可以分别用1、2代表男、女。职业、治疗效果等也是类似情况。由于结果有限,变量只有离散的几个值,故称其为离散型随机变量;又如将血压、肌苷、尿素氮看作随机变量,由于结果无限,变量可以有无限值,而且是连续的,因而称为连续型随机变量。3、同质与混杂同质,即有相同本质或属于同一类。同质与总体有密切联系,本质相同的个体才可认为属于同一总体。同质是对总体做出推断的基础,同质的事物才可以相互比较,将不同质的个体放在一起得到的结果是没有意义的。在实际问题中,绝对的同质是不容易实现的,因而我们在处理实际问题时常采用一种变通的标准,即在一些重要方面有共同性质或特征,就认为是同质。一般是指除了要研究的因素以外的的其它重要影响因素处于相同或基本相同水平。当然,这时的其它影响因素只能是根据目前掌握的知识认为能够或可能影响研究指标的因素。如:研究影响儿童生长发育的外界因素---如饮食、生活规律、环境等---时,必须考虑性别的影响,不能将男孩与女孩的饮食习惯进行比较来反映饮食对发育的影响,因为已知性别对发育有重要影响。当其它因素的作用与研究者关心的因素的作用混在一起,使得后者无法被正确识别时,称为发生了混杂,这些“其它因素”称为混杂因素。如:在研究吸烟与肺癌的关系时,因为年龄与吸烟有联系,吸烟者与不吸烟者的年龄结构不相同,而且年龄是肺癌的危险因素,因此如果不注意年龄,则年龄因素会造成混杂,歪曲吸烟对肺癌的影响。混杂可能使重要因素的作用被掩盖,这种情况称为负混杂,也可能使不产生作用的因素显现出“作用”或使本来较弱的作用被加强,这种情况称为正混杂。无论负混杂还是正混杂,都不利于对问题本质的认识,必须设法加以控制和消除。统计设计和的统计分析是保证同质、减少混杂的两种重要手段。4、总体与样本  总体是指根据研究目的确定的加以具体条件规定的同质事物中所有观察单位的全体。如研究两种护理措施对高血压患者心理护理的效果比较,总体就是全部高血压患者;当然事实上我们是得不到,理论上应当用随机化的方法抽取其中一部分病例进行研究,统计上称为抽样研究,所得到的一部分称为样本;但临床工作中随机抽样有时也有一定困难,通常只能以来诊病例当作样本,只要这一部分病例同质性好,就可以把它当作随机样本进行研究,它代表的总体应当是与它条件一致的全部病例。总体可以是有限总体,但更多的是无限总体,研究样本的目的是了解总体、推论总体规律,不是为了样本本身。要保证样本的可靠性,必须要求当总体确定后,使样本中的每一观察单位确属预先确定的同质总体。另外,还要保证样本具有代表性,能够充分地反映总体的真实情况,必须要求抽样要遵守随机化的原则,并有足够的样本含量。5、抽样误差 在抽样过程中,即使从同一总体中随机抽取含量相等的若干样本,算得的样本指标往往不一定相等,就象从护校学生中抽取几组女学生测量脉率,结果各组均数之间不同,虽然她们同是健康的青年人(来自同一总体),但是各学生的脉率不尽相同,这种因抽样产生的样本与样本、样本与总体相应统计指标之间差异,统计学上称为抽样误差。由于观察单位间存在个体差异,样本又未包含总体的全部信息,因而抽样误差是无法避免的。抽样误差的大小主要取决于观察单位间变异程度的大小和样本含量的多少。变异程度越小,样本含量越多,抽样误差越小;反之,变异程度越大,样本含量越少,抽样误差越大。6、概率   概率是估计某随机事件发生可能性大小的一种定量指标,常用符号P表示,在日常生活中人们经常遇到概率现象,比如说:“这个病人的诊断十有八九是冠心病”,从概率论角度来分析,就可认为这个病人的诊断80%-90%可能性是冠心病,即患冠心病的概率是80%-90%。  概率可用小数或百分数表示,如P=0.05, 或写作5%。概率的取值范围在0-1之间。若某一事件必然不发生,则该事件发生的概率为0;某一事件必然发生,则该事件发生的概率为1。当P→0,表示某一事件发生的可能性极小小几乎不可能。当P→1,表示某事件发生的可能性极大,几乎必然要发生。  概率论是数理统计的基础,统计分析的许多结论,都是建立在概率大小的基础之上的。7、假设检验 又称显著性检验。从抽样误差的概念中可以理解,如果观察两种药物治疗某病的疗效若有差别,可能有两种原因造成,一是纯由抽样误差所致(即两样本来自同一总体),二是除抽样误差外,确实两种药物的效果有所不同(即两样本来自疗效不同的两个总体),如何判断差别系由何种原因引起的呢?可用假设检验来鉴别。假设检验就是:首先对总体的特征作出某中假设,在此假设的前提下,对样本数据进行统计分析,如计算χ2值、t值等,再利用概率分布原理(如χ2分布、t分布等),对原假设应该被拒绝还是接受作出推断。若差异由抽样误差引起的可能性很大,则概率P值大,统计上称这种差异为“无统计学意义”。意思是这两种药物来自疗效相同的同一总体, 只因抽样误差使表面上有些差别, 实质其疗效是差不多的; 若差异超过了抽样误差所容许的范围, 则概率P值很小,统计上称为“差异有统计学意义”,这时才能认为这两种药物来自疗效不同的两个总体,其差别不能仅由抽样误差解释。只有此种情况才可推断两种药物的疗效有优劣之分。  来源:中国临床试验论坛(下同)
评论
热门会议推荐
申领学分

Copyright © 2014 版权所有    京ICP备12049153号-2  京ICP证140305  京公网安备11010502024544    联系E-mail:admin@zgheart.com

友情链接 医汇心脏健康网 阜外医院 掌上医讯 心内科 中国医师协会 宁夏健康网 健康时报网 互动吧 疾病大全

安全联盟站长平台 加速乐