manbetx万博手机版也可以由概率 自由度查t值 值 自由度查概率 也可以由概率

当前位置:万博手机版官网 > manbetx万博手机版 > manbetx万博手机版也可以由概率 自由度查t值 值 自由度查概率 也可以由概率
作者: 万博手机版官网|来源: http://www.kxjdm.com|栏目:manbetx万博手机版

文章关键词:万博手机版官网,统计学正态分布

  统计学正态分布及t分布_医学_高等教育_教育专区。生物统计学 正态分布 T分布 1 正态分布 2 样本有几个特别重要的数字特征, 样本有几个特别重要的数字特征,这些数字是描述样本频 率分布特征的, 率分布特征的,称之为样本特征数 而在

  生物统计学 正态分布 T分布 1 正态分布 2 样本有几个特别重要的数字特征, 样本有几个特别重要的数字特征,这些数字是描述样本频 率分布特征的, 率分布特征的,称之为样本特征数 而在生物统计学中, 而在生物统计学中,样本特征数使用频繁的有以下几个 1.算术平均数,简称平均数( )。 3 ? 2.样本方差:样本中各数据与样本平均数的 差的平方和的平均数。 ? 3.样本标准差:样本方差的算术平方根做。 4 样本方差和样本标准差都是衡量一个样本 波动大小的量,样本方差或样本标准差越 大,样本数据的波动就越大。 方差和标准差是测算离散趋势最重要、最 常用的指标。 5 ? 正态分布的概念 ? 如果把数值变量资料编制频数表后绘制频数分布图(又称直方 图,它用矩形面积表示数值变量资料的频数分布,每条直条的 宽表示组距,直条的面积表示频数(或频率)大小,直条与直 条之间不留空隙。),若频数分布呈现中间为最多,左右两侧 基本对称,越靠近中间频数越多,离中间越远,频数越少,形 成一个中间频数多,两侧频数逐渐减少且基本对称的分布,那 我们一般认为该数值 ? 变量服从或近似服从 ? 数学上的正态分布。 6 ? 当n→∞,直方条面积 频率 →各自的概率 频率)→ → ,直方条面积(频率 ? 然后组距→0时,直方条的宽度→0,直 然后组距→ 直方条的宽度→ 方条→垂直线, 方条→垂直线,各个直方条顶点间的连线 构成一条光滑的曲线, 概率密度曲线, 构成一条光滑的曲线,即:概率密度曲线, 而曲线下(直方条 的总面积始终为1 直方条)的总面积始终为 而曲线下 直方条 的总面积始终为1,在区 的概率= 间[a,b]的概率=对应曲线段下的面积 直方 的概率 对应曲线段下的面积(直方 条面积) 条面积 。 7 正态分布的概念 8 ? 正态曲线的定义: 正态曲线 f (x) = e 2 πσ ( x??)2 ? 2σ2 x∈(?∞ +∞ , ) 的图象称为正态曲线 称f( x)的图象称为正态曲线 的图象称为 式中:л= 3.1416 e= 2.71828 x----表示变量 ?---表示理论平均数 表示总体标准差 δ2—表示总体方差 这个公式表示x变量区间内发生的概率 δ--- 9 如果变量X 如果变量X的概率密度函数服从上述函数, 则称该变量服从正态分布。记做 X ~ N ( ? , σ 2 ) 10 在σ不变的情况下 函数曲线形状不变,若?变大时,曲线位置向右移; 若变小时,曲线位置向左移,故称?为位置参数。 11 在?不变的情况下 函数曲线位置不变,若σ变大时,曲线形状变的越来越 “胖”和“矮”; 若σ变小时,曲线形状变的越来越“瘦”和“高”,故 称σ为形态参数或变异度参数。 σ1 σ2 σ3 12 正态曲线 x -3 -2 -1 0 1 σ=2 2 3 4x y y ?=1 -3 -2 -1 0 1 2 x 轴的上方, 轴不相交. (1)曲线在 轴的上方,与x轴不相交 )曲线在x轴的上方 轴不相交 它关于直线x=?对称 对称. (2)曲线是单峰的 它关于直线 )曲线是单峰的,它关于直线)曲线在x=?处达到峰值 最高点) )曲线在 处达到峰值(最高点 处达到峰值 最高点 轴之间的面积为1 (4)曲线与 轴之间的面积为 )曲线与x轴之间的面积为 曲线上升;当 曲线下降.并且当曲线)当 x?时,曲线上升 当x?时,曲线下降 并且当曲线向左、右两边无限延伸时 ) 时 曲线上升 时 曲线下降 并且当曲线向左、右两边无限延伸时, 轴为渐近线,向它无限靠近 以x轴为渐近线 向它无限靠近 轴为渐近线)当?一定时,曲线的形状由 确定 . 一定时, 当 一定时 曲线的形状由σ确定 σ越大,曲线越“矮胖”,表示总体的分布越分散; 越大,曲线越“矮胖” 表示总体的分布越分散; 越大 σ越小,曲线越“瘦高”,表示总体的分布越集中 越小, 越小 曲线越“瘦高” 表示总体的分布越集中. 13 而整个正态分布则应该是各区间密度函数的累计积分. 一种连续的分布不可能求某项(某点)的概率,而只能求某个 区间的概率. 任意两点x1,x2且(x1≤x2),X在 (x1, x2)范围内取值的概率P, 即正态分布曲线)下面积 P= ∫ x2 x1 ? 1 e 2π σ ( x ? ? )2 2σ 2 dx 14 标准正态分布 正态分布由? 正态分布由?和σ所决定,不同的?、σ值就决定了不同的正态分布 所决定,不同的? 密度函数,因此在实际计算中很不方便的。需将一般的N(?, 密度函数,因此在实际计算中很不方便的。manbetx万博手机版需将一般的N(?,σ2 ) 转换为?=0, =1的正态分布 我们称?=0, 的正态分布。 =1的正态分 转换为?=0, σ2 =1的正态分布。我们称?=0, σ2 =1的正态分 布为标准正态分布(standard 布为标准正态分布(standard normal distribution) 就是由正态分布密度函数 1 f ( x) = e σ 2π ( x?? )2 ? 2σ 2 得到标准正态分布密度函数: 1 f ( x) = e 2π x2 ? 2 15 由于正态分布的概率密度函数比较复杂, 由于正态分布的概率密度函数比较复杂,积分的 计算也比较麻烦,最好的解决办法: 计算也比较麻烦,最好的解决办法:将正态分布 转化为标准正态分布, 转化为标准正态分布,然后根据标准正态分布表 直接查出概率值。 直接查出概率值。 对于服从任意正态分布N ?,σ2)的随机变量,manbetx万博手机版 对于服从任意正态分布N(?,σ2)的随机变量, 欲求其在某个区间的取值概率, 欲求其在某个区间的取值概率,需先将它标准化 为标准正态分布N 0,1)的随机变量, 为标准正态分布N(0,1)的随机变量,然后查 表即可。 表即可。 16 正态分布转化为标准正态分布 可以将x作一变换, 可以将x作一变换,令 u= x?? σ u称为标准正态变量或标准正态离差,服从标准正态分布 的随机变量 这个变换称为标准化或u变换 由于 是随机变量,因此u 这个变换称为标准化或 变换,由于 是随机变量,因此 变换 由于x是随机变量 也是随机变量,所得到的随机变量U也服从正态分布 也服从正态分布, 也是随机变量,所得到的随机变量 也服从正态分布, 因此, 因此,由任意正态分布随机变量标准化得到的随机变量 的标准正态分布常称为u分布 分布。 的标准正态分布常称为 分布。 17 变换后的正态分布密度函数为:f (u ) = 变换后的正态分布密度函数为: 1 2π e u2 ? 2 标准正态分布均具有?=0,σ2=1的特性 , 标准正态分布均具有 的特性 如果随机变量u服从标准正态分布,可记为: ~ ( , ) 如果随机变量 服从标准正态分布,可记为:u~N(0,1) 服从标准正态分布 18 标准正态函数 1 ?2 f (x) = e x∈(?∞,+∞) 2π y x2 ?=0 σ=1 -3 -2 -1 0 1 2 3 x 19 事实上,上面的计算已经制成了表格, 事实上,上面的计算已经制成了表格,只要知 道了平均数和标准差即可查出相应的区间概 率. 20 特殊区间的概率: 特殊区间的概率 若X~N ( ? , σ ),则对于任何实数 概率 则对于任何实数a0,概率 则对于任何实数 2 P(? ? a ξ ≤? + a) = 为如图中的阴影部分的面积, 而言, 为如图中的阴影部分的面积,对于固定的 ? 和 σ 而言,该面 的减少而变大。 越小, 积随着 σ 的减少而变大。这说明 σ 越小 落在区间 ( ? ? a, ? + a ] 的概率越大, 周围概率越大。 的概率越大,即X集中在 ? 周围概率越大。 集中在 ∫ ?? σ (x)dx ? , ?a ?+a x=? 特别地有 ? -a ? + a P ( ? ? σ X ≤ ? + σ ) = 0.6826, P ( ? ? 2σ X ≤ ? + 2σ ) = 0.9544, P ( ? ? 3σ X ≤ ? + 3σ ) = 0.9974. 21 我们从上图看到, 我们从上图看到,正态总体在 (? ? 2σ , ? + 2σ ) 以外取值的概率只有4.6%, %,在 以外取值的概率只有 %,在(? ? 3σ , ? + 3σ )以外 取值的概率只有0.3 取值的概率只有 %。 当 a = 3σ 时正态总体的取值几乎总取值于区间 之内, 其他区间取值几乎不可能. ( ? ? 3σ , ? + 3σ ) 之内, 其他区间取值几乎不可能.在实 运用中 考虑这 区间, 际运用中就只考虑这个区间,称为 3σ 原则. 由于这些概率值很小(一般不超过 ),通常称这些情况发生为小概率事件。 通常称这些情况发生为小概率事件 由于这些概率值很小(一般不超过5 % ),通常称这些情况发生为小概率事件。 22 T分布 几个重要概念 从一个正态总体中抽取的样本统计量的分布样本平 和样本方差S2是描述样本特征的两个最重 均数 x 和样本方差S2是描述样本特征的两个最重 要的统计量 如果原总体的平均数为?,标准差为 , 如果原总体的平均数为 ,标准差为σ,那么样本平均数 抽样总体: 抽样总体: 平均数为: 平均数为: ?x 标准差为: 标准差为: σx 为样本平均数抽样总体的标准误差简称为标准误, 为样本平均数抽样总体的标准误差简称为标准误,标 准误表示平均数抽样误差的大小, 准误表示平均数抽样误差的大小,反映样本平均数与 新总体平均数之间的离散程度。 新总体平均数之间的离散程度。 23 经计算得出两个重要结论 抽样的样本平均数的平均数等于总体平均数,即 抽样的样本平均数的平均数等于总体平均数 即 ?x = ? 抽样的抽样平均数的标准差等于总体标准差除以 样本单位数的平方根。 样本单位数的平方根。即 σx =σ n 24 4. t-分布(不要求) 分布( 分布 不要求) 设有服从正态分布的随机变量x,正态分布的标准化公式为: 设有服从正态分布的随机变量 ,正态分布的标准化公式为: u= x?? σ 对于总体方差σ 已知的总体,根据公式可以知道样本平均数 样本平均数在某一区间内 对于总体方差σ2已知的总体,根据公式可以知道样本平均数在某一区间内 出现的概率,公式为: 出现的概率,公式为: u= x ?? σx ? ?uασx ≤ x ? +uασx 附: x σ 服从标准正态分布 =σ n 25 假如σ2未知,而且样本容量又比较小(n≤30)时: 假如 未知,而且样本容量又比较小( ) 标准化公式可变换为: 标准化公式可变换为: x ?? Sx =t 它不再服从标准正态分布 服从具有n-1自由度t-分布 服从具有n-1自由度t-分布 自由度 T分布类似于正态分布,也是一种对称分布,它只有一个参数,就是自由 度 所谓自由度是指独立观测值的个数,应为计算标准差时所使用的n个观测值, 受到平均数x的约束,这就等于有一个观测值不能独立取值,因此自由度为 df=n-1 26 T分布的密度函数为: 分布的密度函数为: 分布的密度函数为 Γ[(n +1 )/2] x2 )?(n+1)/2 , ?∞ x ∞ f (x) = (1+ n nπ Γ(n/ 2) T分布的计算已列成表格 应用时可根据需要由 分布的计算已列成表格,应用时可根据需要由 分布的计算已列成表格 t值,自由度查概率 也可以由概率 自由度查 值. 自由度查概率;也可以由概率 自由度查t值 值 自由度查概率 也可以由概率,自由度查 27 t 分布的双侧分位点 假定 X ~ t (n) , 给定: 给定:0 < α < 1 , 满足: 如果一个数 c 满足: P { X > c } = α ,α/2 – tα/2(n) o tn (x) α/2 x tα/2(n) 是自由度n 则称这个数 c 是自由度 的 t 分布的双侧 α 分位点 (数) ,记成 tα / 2 (n) 。 数 对称分布的双侧 α 分位点就是上侧 α/2 分位点 28 标准正态分布 N (0,1 ) (0, 的双侧 α 分位点 记为 : uα / 2 ? (x) α/2 α/2 – uα/2 o x uα/2 如:双侧 0.05 分位点 u0.025 = 1.96 29 t-分布的特点 分布为对称分布, 对称; (1)t分布为对称分布,关于 = 0对称;只有一个峰,峰值 ) 分布为对称分布 关于t 对称 只有一个峰, 分布曲线顶部略低, 在t = 0处;与标准正态分布曲线相比,t分布曲线顶部略低, 处 与标准正态分布曲线相比, 分布曲线顶部略低 两尾部稍高而平 分布曲线)t分布曲线受自由度 的影响,自由度越小,离散程度越大 ) 分布曲线受自由度 的影响,自由度越小, 分布的极限是正态分布。 越大 分布越趋近标准正 越大, (3) t分布的极限是正态分布。df越大,t分布越趋近标准正 ) 分布的极限是正态分布 态分布 分布与标准正态分布的区别很小; 当n 30时,t分布与标准正态分布的区别很小;n 100时,t 时 分布与标准正态分布的区别很小 时 分布基本与标准正态分布相同; 分布基本与标准正态分布相同;n→∞时,t 分布与标准正态 时 分布完全一致 30

网友评论

我的2016年度评论盘点
还没有评论,快来抢沙发吧!