QQ登录

只需一步,快速开始

只需一步,快速开始

GMP论坛

搜索
查看: 289|回复: 0
收起左侧

[回顾分析] 何为95%置信区间?

[复制链接]
  • TA的每日心情
    慵懒
    昨天 16:22
  • 906

    主题

    23

    回帖

    1万

    积分

    传播制药技术,促进医药合规, 确保药品安全!

    Rank: 9Rank: 9Rank: 9

    QQ达人论坛元老优秀版主突出贡献论坛达人

    发表于 2023-5-30 17:22:49 | 显示全部楼层 |阅读模式 来自 中国广东深圳
    1.jpg
    置信区间的概念是由原籍波兰的美国统计学家耶日·奈曼提出的。

    简单理解,比如从北京到张家界旅游5天,你恐怕不能准确说出要花多少钱,但你可以给出一个范围,比如10000—13000,你会觉得比较可信。如果给的范围太大,比如10000—30000,虽然可信度更高一些,但这么大的范围参考意义不大;如果给的范围很小,如10000—10500,虽然准确性提高了,但可信度就似乎不会很高。而找到一个合适的估值范围,这是置信区间要解决的问题。


    说到置信区间我们就要说到点估计和区间估计。


    那么什么是点估计?什么是区间估计呢?


    之前看到过这样一个例子,简直可以很完美的解释这个问题~


    以前很流行一种刮刮卡:


    游戏规则是(假设只有一个大奖):


    · 大奖事先就固定好了,一定印在某一张刮刮卡上


    · 买了刮刮卡之后,刮开就知道自己是否中奖


    那么我们起码有两种策略来刮奖:


    · 点估计:买一张,这就相当于你猜测这一张会中奖(直接用样本统计量来估计总体参数值)


    · 区间估计:买一盒,这就相当于你猜测这一盒里面会有某一张中奖(根据样本统计量,按一定的概率大小确定包含总体参数值)


    很显然区间估计的命中率会更高(当然费用会更高,因为风险降低了)。


    实际上:


    点估计量是用于估计总体参数的样本统计量。但我们不可能期望点估计量能给出总体参数的精确值,所以经常在点估计上加减估计误差来计算区间估计。


    即区间估计的一般形式为:点估计±边际误差。


    有一个零部件的长度θ未知,我们通过点估计推测θ为9 cm,这还不足够。如果我们能知道θ有95%的概率在(8.7cm,9.2cm),那么就理想多了。


    那么由此我们就引出了其他两个关键词:


    置信区间和置信水平


    其中(8.7cm,9.2cm)我们就可以理解成置信区间,那么95%就是置信水平。




    2.jpg 由样本统计量所构造的总体参数的估计区间为置信区间。由于统计学家在某种程度上确定这个区间会包含真正的总体参数,所以取名置信区间。在统计中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的被测量参数的测量值的可信程度,即前面所要求的"一定概率"。这个概率被称为置信水平。


    简单理解,我们抽取100个样本,当你不断改变样本的时候,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真正值,5%没包含,这个95%称为置信水平,即1-α。


    下面给大家总结一下常用置信水平




    3.jpg 那么怎么建立置信区间?


    置信区间的建立就与中心极限定理和抽样分布有关,在给定置信度的条件下,置信区间的宽度决定于抽样分布,会随着样本量的增大而减小,在样本量给定时,置信区间的宽度随着置信系数的增大而增大。


    例如:想了解全国成年男性平均身高,可用抽样的方法,用样本信息估计总体信息。从全国男性中抽取一个样本,这个样本平均值及对总体平均值的一个点估计,当有多个样本,即有多个点估计,但不知道哪个样本对总体的估计最正确,所以用区间估计来解决这个问题。假设全国成年男性平均身高在165-175cm之间,这个区间叫置信区间,及[165,175],这个区间的可信程度是有置信水平来表现,置信水平指置信区间包含总体平均值的概率多大,如置信水平为95%。




    4.jpg 当然在不同情况下求不同类型的区间估计时,所用的分布也不同,这里我们做简单了解,


    1.个总体样本参数时:




    5.jpg 2.两个总体样本参数时:




    6.jpg 我们以一个总体均值的区间估计为例来理解一下:


    【 例 】一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。


    7.jpg

    8.jpg



    9.jpg 该食品平均重量的置信区间为101.44g~109.28g


    下面让我们通过一道练习题巩再固一下:


    从一批产品中随机抽取100盒进行质量检验,检验结果有72盒合格,试在95%的把握程度之下对该批产品的合格率进行区间估计,并指出样本的抽样平均误差和极限误差。


    及格率的区间估计:


    根据题目可知:n=100 p=72% 1-α=0.95


    因为p±Zα/2·{p(1-p)/n}(总体比率置信区间)


    α=0.05 查表得Zα/2=1.96


    得p±Zα/2·{p(1-p)/n}


    =0.72±1.96×{0.72(1-0.72)/100}


    =0.72±1.96×(0.448/10)


    =0.72±0.088


    即区间为【0.632,0.808】




    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条

    Copyright © 2001-2013 Comsenz Inc.Powered by Discuz!X3.4
    网站地图手机触屏版小黑屋GMP论坛 QQ
    快速回复 返回顶部 返回列表