生物统计中的α 和 β

参数估计（parameter estimate）和假设检验(hypothesis testing)是统计推断的两个组成部分，它们都是利用样本对总体进行某种推断，然而推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法，总体参数μ在估计前是未知的。而在假设检验中，则是先对μ的值提出一个假设，然后利用样本信息去检验这个假设是否成立。
原假设H0常常是我们想要推翻且明确的，例如相等或没有差别，而与之互斥的备择假设H1模糊的（是我们想要证明的），例如不相等或有差别。对于原假设提出的命题，我们需要做出判断，“原假设正确”或“原假设错误”。由于判断可能正确，也可能不正确，因而我们会犯两种错误。一类是原假设为真却被我们拒绝了，犯这种错误的概率用α表示，α也称第I类错误（或显著性水平）或弃真错误，指拒绝了实际上成立的 H0；另一种错误是原假设为伪我们却没有拒绝，犯这种错误的概率用β 表示，β 又称第 II 类错误或取伪错误，指不拒绝实际上不成立的 H0。把握度 power= 1－β，指拒绝实际上不成立的 H0 的概率。
仅仅为了理解上的方便，我们可以把“不拒绝”或”没有拒绝“当成是“接受“。强制记忆“αβ弃真取伪”。

以临床试验统计显示结果来决定我们是”取“或”弃“这种行为，药品之间的有无差别已经是客观上的现实存在，我们无法大规模地一个一个统计，只能由样本去推断总体。例如中国13亿人的平均身高是一个确定的值，但我们无法一一去测量，只能通过有代表性的样本去估计。
临床试验会犯两种错误中，一种错误是两种药本来没差别（即H0为真），可试验结果显示优于对照药，对应于药品审批机构关心的α，他们希望没差别就是没差别，不要出现这种做试验做出来的差别，因而要限定这种错误发生的概率，一般情况下，α 被限定为 0.05。这是他们的职责所在！
另一种错误是两种药本来有差别（例如优于对照药，即H0为伪），可试验结果显示两种药没区别，对应于药厂关心的β，明明试验药优于对照药，试验结果却显示两种药没有区别，他们也要降低这种错误发生的概率，也就是降低 β ，提高把握度Power ，Power的含义为：两种药品没差别的这种原假设是错误的，根据试验结果我们拒绝了它，说明新药品有效，即对应于新药成功的概率。一般情况下，β 应小于 0.2，甚至 0.1，对应的把握度为 80％或 90％。当然药厂降低 β，也就是提高把握度，会提高你试验成功的概率，但这也同时意味着同等条件下样本量的增加，样本量的增加就意味着项目预算的增加，要招募更多的受试者进入试验。
要使αβ同时变小，可以增大样本量，但样本量不可能没有限制，否则就会使抽样调查失去意义。
当然犯这两种错误的概率越小越好，但对于一定的样本量，不能同时做到犯这两类错误的概率都很小。如果减小α，就会增大犯β错误的机会；若减小β错误，也会增大犯α错误的机会。这如同要增大估计的可靠性，就会使得区间变宽而精度降低，反之亦反。
进行假设检验利用的是小概率原理，小概率原理是指发生概率很小的随机事情在一次试验中是几乎不可能发生的。根据这一原理我们可以作出是否拒绝原假设的决定。著名英国统计学家费希尔把小概率的标准定为0.05。至今，我们把0.05或者比0.05更小的概率看成是小概率。
如果原假设成立，那么在一次试验中统计量落在拒绝域的概率只有0.05，这个概率是很小的。如果这个情况真的出现（例如z统计量小于-1.96），我们就有理由认为原假设不成立，从而拒绝原假设。
P值是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。根据获得的事后概率P与事先规定的概率α进行比较，看其是否为小概率事件而得出结论。如果P值很小，说明这种情况发生的概率很小，而如果出现了，根据小概率原理，我们就有理由拒绝原假设，P值越小，我们拒绝原假设的理由就越充分。
如果某个试验做出了显性结果，统计角度看，这也只是概率问题，无非是大是小；我们有理由相信，如果把同样的试验重新再做，结果可能不一样！

文章来源：法迈医讯

本网站刊载的所有内容，包括文字、图片、音频、视频、软件等，如非标注为“原创”，则相关版权归原作者所有，如原作者不愿意在本网站刊登相关内容，请及时通知本站，我们将第一时间予以删除。

上一篇：一名德国生产总监总结的中国工厂的151种浪费！

下一篇：客户价值学

曜分享

分享精彩资讯

生物统计中的α 和 β

热门资讯