卡尔·皮尔逊(Karl Pearson) 是现代相关分析的奠基者,他在1896年发表的论文中正式定义了相关系数[3] ,并在研究中广泛使用协方差。它给出了相关系数公式的标准化形式:

其中, 是协方差, 和 分别是 和 的标准差。这篇论文[3] 标志着现代相关系数和协方差的形式化定义的诞生。

在此之前,19世纪的统计学家,比如弗朗西斯·高尔顿(Francis Galton),也曾在研究遗传学和变量相关性时间接使用过协方差的思想。高尔顿的研究开启了对变量间关系的定量分析,而皮尔逊进一步发展了这些思想。

如今,随着矩阵运算和线性代数的普及,协方差矩阵被广泛用于多元统计分析、机器学习和数据科学等领域,并在经济学、遗传学等领域有着重要作用。

设 和 为两个实值随机变量,它们的协方差定义为它们偏离各自期望值的乘积的期望值(或均值)[1] :

其中, 是 的期望值,cov是协方差的英文covariance的缩写。协方差有时也记为 或 ,与方差的表示类似。

的方差为

可以看出协方差的形式类似于方差,只是把其中的一个 换成了 ;协方差又有 二者的协同参与,由此得出“协方差”的名称[1] 。

通过利用期望的线性性质,协方差的计算公式可以简化为乘积的期望减去各自期望值的乘积:

如果随机变量对 是离散实值随机变量,且可以取值 ,其中 ,且每种取值的概率相等(即 ),则协方差可以用随机变量的均值 和 表示为:

也可以不直接涉及均值表示为[2] :

更一般地,若 有 个可能的离散取值 ,且各取值的概率为 ,则协方差为:

当离散随机变量 和 的联合概率分布 时,协方差的计算使用双重求和:

协方差被用来描述两个随机变量之间线性相关程度[4] 。

假设两个随机变量 存在线性关系: 。为使这种关系最接近于实际的 的分布,需要使误差的平方和(均方误差 )达到最小。经过计算求出使S达到最小的a, b值,代入化简得

分别为 的方差。要使S最小,必须使:

相关查询: 皮尔逊 Pearson 奠基者
最新查询:mathematician 补助金 南宫仙儿 猪血豆腐 蓄洪区 Juliette 能动性 大流士 半个世纪 Win32.Troj.Wootbot.am 认识水平 中国经济法的根基 Stethomyia 鸣音水壶 1605.18 胚囊 comments 越剧团 Secondhand swiper-3.4.2.jquery.min.js 本科生 ɽͲ 办公大楼 novels. 毛玥 剩余劳动 sustainability 古生界 akesu 石小梅 Ornithoctonus 送万巨 奴隶起义 仙路如潮 房屋查验(验房)实务指南 开宗明义 常振芳 季永钊 屈伏塔 自贡市教育局 体育场馆 景宁畲族自治县创建省级文明县城市民读本 吴翰文 人生因此而完美:点这生命的27种态度 红牛二队 中国市长杂志 鲤溪镇 114 平原农田防护林体系工程 六盘水市交通运输局 catering %E6%97%B6%E6%9C%AA%E5%AF%92 自助餐厅 芳香风暴 秀逗高校 哥本哈根地铁 一日游 八音节 托皮卡 qq鱼塘 ä¸èƒ½è¨€ä¼ 菲利普·莫里斯 华天洞 processing 江苏省肿瘤发生与干预重点实验室 我出家了 田径赛 威尔第 适应能力 Benzalkonium 石川铃华 Tiberias 卫国戍边纪念章 参战国 牟作云杯 眉毛酥饺 Gorinchem Covariance
友情链接: 知道 电影 百科 好搜 问答 微信 值得买 巨便宜 天天特价 洛阳汽车脚垫 女装 女鞋 母婴 内衣 零食 美妆 汽车 油价 郑州 北京 上海 广州 深圳 杭州 南京 苏州 武汉 天津 重庆 成都 大连 宁波 济南 西安 石家庄 沈阳 南阳 临沂 邯郸 保定 温州 东莞 洛阳 周口 青岛 徐州 赣州 菏泽 泉州 长春 唐山 商丘 南通 盐城 驻马店 佛山 衡阳 沧州 福州 昆明 无锡 南昌 黄冈 遵义
© 2026 haodianxin 百科 豫ICP备14030218号-3 消耗时间:0.018秒 内存0.85MB 2025-09-15 18:12:58