参数估计的基本概念
一致性,对比总样本和小样本的时候用。
点估计
用样本统计量θ的某个取值直接作为总体参数θ的估计值。
·比如用样本均值X直接作为总体均值u的估计值;再比如,要估计一批产品的合
格率,抽样结果合格率为96%,将96%直接作为此批产品合格率的估计值。
② 一个点估计的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计无法
给出估计的可靠性的度量。
区间估计
基本概念
a.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到。根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。
·比如,产品合格率在75%~85%之间,置信水平是95%
b,置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,其中最小的值称为置信下限,最大值称为置信上限。统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。
C·置信水平:如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称置信度或置信系数。
由100个样本构造的总体参数的100个置信区间中,有95%的区间包括总体参数的真值,有5%没包括,则95%这个值称为置信水平。
d.置信区间的理解
置信区间是一个随机区间,它会因为样本的不同而不同,而不是所有的区间都包含总体参数的真值。
在实际问题中,进行估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平(比如95%)下的置信区间。由于该样本所构造的区间是一个特定的区间,而不再是随机区间,所以无法知道这个样本所产生的区间是否包含总体参数的值我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也有可能是少数几个不包含参数真值的区间中的一个。
假设检验
假设问题的提出
什么是假设:
1)对总体参数的的数值所作的一种陈述
·总体参数包括总体均值、比例、方差等分析之前必需陈述,
2)事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立3)有参数假设检验和非参数假设检验
4)采用逻辑上的反证法,依据统计上的小概率原理
两类错误
概念:在假设检验中,出现错误的类型有两种第一类错误: 弃真错误(原假设为真时拒绝原假设)概率为α第二类错误: 取伪错误 (原假设为伪时接受原假设)概率为β
两类错误的理解
一般来说,哪一类错误所带来的后果越严重,危害越大,在假设检验中就应当把哪一类错误作为首要的控制目标。但是在假设检验中,大家都在执行这样一个原则,即首先控制犯a错误原则。这样做主要有两点,一方面,大家都遵循这样一个原则,讨论问题就比较方便;第二个最主要的原因在于,从实用的观点来看,原假设是什么常常是明确的,而备选假设是什么常常是模糊的,显然对于一个清楚的假设和一个含义模糊的假设,我们更愿意接受前者。
当然这要从更多的维度和不同的情况来看
假设检验的基本流程
,