4.0 引例:国产大飞机C919复合材料可靠性评估
对应领域: 高端装备制造
抽样挑战:
- T800级碳纤维批次质量波动(进口替代关键材料)
- 材料强度参数分布未知,抽样成本高
统计方法:
- 利用中心极限定理确定最小抽样量(置信度99%)
- AI预测批次质量异常的概率模型
- 贝叶斯方法动态调整批次合格率估计
政策支持: 享受首台套装备保险补偿政策、国家新材料首批次应用保险
复合材料可靠性评估
C919复合材料检测系统
AI检测准确率:98.7% | 识别速度:25件/分钟
4.1 大数定律与中心极限定理
4.1.1 伯努利大数定律
核心思想: 当试验次数足够多时,事件发生的频率趋近于该事件发生的概率
limn→∞ P{|(m/n) - p| < ε} = 1
m: 事件发生次数 | n: 总试验次数 | p: 事件概率
应用:
- 质量控制中的次品率估计
- 保险行业的风险评估
4.1.2 辛钦大数定律
核心思想: 样本均值依概率收敛于总体均值
limn→∞ P{|X̄n - μ| < ε} = 1
X̄n: 样本均值 | μ: 总体均值
应用:
- 社会调查中的平均收入估计
- 产品寿命测试
4.1.3 林德伯格—列维定理
中心极限定理: 无论总体分布如何,大样本的样本均值近似正态分布
X̄ ~ N(μ, σ²/n) 当 n → ∞
4.1.4 棣莫佛-拉普拉斯定理
二项分布的正态近似: 当n足够大时,二项分布近似正态分布
B(n, p) ≈ N(np, np(1-p))
4.1.5 定理间的联系与统计思想
核心统计思想:
- 大数定律揭示样本均值稳定性
- 中心极限定理提供推断的理论基础
- 通过抽样窥视总体特征
中心极限定理可视化
4.2 常用统计量的抽样分布
4.2.1 单个样本统计量的抽样分布
单个样本统计量的抽样分布
样本均值、样本方差、样本比例等
关键分布:
- 样本均值的分布:正态分布(总体正态)或近似正态(大样本)
- 样本方差的分布:χ²分布
4.2.2 两个样本统计量的抽样分布
两个样本统计量的抽样分布
均值差、方差比、比例差等
关键分布:
- 两样本均值差的分布:t分布(方差未知)或正态分布(方差已知)
- 两样本方差比的分布:F分布
4.2.3 四种概率分布的关系
核心概念: 正态分布、t分布、χ²分布、F分布构成了统计推断的基础
四大抽样分布关系图
正态分布 → t分布、χ²分布 → F分布
关系描述:
- t分布:标准正态分布除以(χ²/v)^{1/2}
- F分布:两个独立χ²分布除以各自自由度的比值
4.3 参数的点估计方法与评价
4.3.1 点估计方法
矩估计法:
- 基于样本矩估计总体矩
- 简单易行,但可能不唯一
极大似然估计法:
- 寻找使样本出现概率最大的参数值
- 具有优良的渐近性质
4.3.2 估计量的评价标准
无偏性:
- 估计量的期望等于参数真值
- 例:样本均值是总体均值的无偏估计
有效性:
- 方差越小越有效
- 例:正态分布中样本均值比样本中位数有效
一致性:
- 样本量增大时估计量依概率收敛于参数真值
点估计模拟器
调整参数后点击"执行估计"查看结果
4.4 基于AI的区间估计
4.4.1 置信区间
置信区间示意图
包括点估计值和区间范围
置信水平: 95%置信区间意味着重复抽样中95%的区间包含总体参数
4.4.2 单总体参数的区间估计
均值估计(大样本):
x̄ ± Zα/2 · (σ/√n)
均值估计(小样本,正态):
x̄ ± tα/2 · (s/√n)
4.4.3 双总体参数的区间估计
均值差估计(独立样本):
(x̄₁ - x̄₂) ± tα/2 · √(s₁²/n₁ + s₂²/n₂)
比例差估计(大样本):
(p̂₁ - p̂₂) ± Zα/2 · √[p̂(1-p̂)(1/n₁ + 1/n₂)]
AI辅助样本量计算
基于中心极限定理计算满足精度要求的最小样本量:
调整参数后点击"计算样本量"
4.5 基于AI的假设检验
4.5.1 基本概念
待检验的假设,通常表示"无效果"、"无差异"或"无关系"
研究者希望证实的假设,表示"有效果"、"有差异"或"有关系"
拒绝原假设时犯第一类错误的最大概率,通常取0.05
4.5.2 假设检验的步骤
- 建立原假设和备择假设
- 确定检验统计量及其分布
- 确定显著水平和拒绝域
- 计算检验统计量的观测值
- 作出统计决策并解释
4.5.3 单总体参数检验及AI案例应用
案例:C919碳纤维强度检验
原假设:碳纤维平均强度≥4500MPa
备择假设:平均强度<4500MPa
AI质检系统示意图
采用计算机视觉和机器学习模型实时检测材料缺陷
AI优化:
- 动态调整检验阈值,平衡误检和漏检风险
- 基于历史数据优化抽样方案
4.5.4 双总体参数检验及AI案例应用
案例:新旧生产工艺对比
原假设:新工艺次品率与旧工艺相同
备择假设:新工艺次品率更低
智能生产过程监控
基于物联网传感器的实时数据双样本检验
AI优化:
- 使用贝叶斯方法整合历史数据
- 基于强化学习优化检验策略
4.6 本章小结
统计推断知识体系
抽样分布 → 点估计 → 区间估计 → 假设检验
- 理论基石:大数定律与中心极限定理是统计推断的数学基础
- 参数估计:点估计方法获得参数估计值,区间估计量化估计精度
- 假设检验:提供系统性方法验证研究假设,做出统计决策
- AI融合创新:机器学习优化抽样方案、动态调整检验策略、处理复杂数据结构
- 工业应用:C919复合材料可靠性评估验证了统计质量控制的实用价值
统计推断全流程演示
点击按钮演示假设检验全过程