抽样有三种应用:t分布、卡方分布和f分布。它们的作用可以简单概括为四个字:“由小变大”,即通过少量的样本容量来估计总容量的分布。这里我们开始介绍卡方分布。卡方分
抽样有三种应用:t分布、卡方分布和f分布。它们的作用可以简单概括为四个字:“由小变大”,即通过少量的样本容量来估计总容量的分布。这里我们开始介绍卡方分布。
卡方分布的定义
如果n个独立的随机变量ξ,ξ,…,ξn都服从标准正态分布,那么这n个服从标准正态分布的随机变量的平方和构成一个新的随机变量,其分布规律称为卡方分布。
卡方分布的概率密度函数
卡方分布和T分布一样,也是一个分布族,它的形状也是由参数自由度V决定的,其中v = n-1 (n为样本大小),每个整数自由度对应一个分布。卡方分布有以下特点:
1.当V等于1或2时,卡方分布是一条先高后低的曲线。
2.当v大于2时,卡方分布形状发生变化,曲线呈钟形,有偏斜度;
3.当V较大时,曲线接近正态分布;
卡方分布的概率密度函数
卡方分布的概率密度函数的计算取决于样本统计χ2(读作“卡方”)。卡方的公式如下:
卡方计算公式
卡方概率密度函数的计算公式如下:
卡方概率密度函数
卡方分布的用途
卡方分布主要用于检查实际结果与预期结果之间何时存在显著差异。它有两个主要用途:
用于测试拟合优度。即检查给定的一组数据与指定分布的符合程度;
检验两个变量的独立性。卡方分布可以用来检验变量之间是否存在某种相关性。
示例:以下是老虎机的期望概率分布,其中X代表每场游戏的收益:
我们收集了1000场比赛的数据,记录了每个结果的观察频率和期望频率。所谓观察频率,就是每个收益结果出现的次数。而期望频率是样本量乘以收益发生的概率:
我们如何知道实际结果是真实的还是被操纵的?换句话说,如何测量观察频率与预期频率的差异?这取决于显著性水平α。
卡方分布的检验是单尾检验,以右尾作为拒绝域。通过检查检验统计量(即卡方)是否位于右尾的拒绝域中,我们可以根据期望分布确定获得结果的可能性。使用显著性水平α进行测试,您可以写出:
显著水平
拒绝域图如下:
临界区域、拒绝区域
要求解卡方分布的拒绝域,可以使用卡方概率表
卡方概率表
如果显著性水平为5%,则可以判断老虎机被操纵。按照这个标准计算:
1.确定要检验的假设;
假设:每场比赛的收益不符合概率分布。
2.计算期望的频率和自由度;
期望频率已记录,每局可能出现五种结果,即自由度v=4。
3.为决策确定拒绝域;
自由度为4。5%的显著性水平。
根据卡方概率表,可以得出拒绝域为卡方>:范围为9.49
(卡方概率表,横轴代表显著性水平,纵轴代表自由度,交叉值为临界值)
4.计算检验统计量卡方;
根据卡方公式,检验统计量为38.272。
5.检查检验统计是否在拒绝域内;
测试统计在拒绝域内(38.272 >: 9.49)
6.决定
所以假设是错误的,老虎机收益的结果符合概率分布。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。
作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/299680.html