还剩20页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
REPORTING2023WORK SUMMARY多元正态分布•多元正态分布的概述目录•二元正态分布的特性•高维正态分布的特性CATALOGUE•多元正态分布在统计推断中的应用•多元正态分布在机器学习中的应用PART01多元正态分布的概述多元正态分布的定义多元正态分布是多元随机变量它描述了多个连续随机变量的多元正态分布的均值向量和协的概率分布,其概率密度函数联合概率分布,其中每个随机方差矩阵决定了其分布特性是多元高斯函数变量都是正态分布多元正态分布的性质线性性质多元正态分布具有线性性质,即随机变量的线性组合仍服从正态分布独立性如果多元正态分布中的随机变量是独立的,则它们的联合分布也是正态分布椭球性质多元正态分布的密度函数关于均值向量对称,并且协方差矩阵决定了分布的形状,表现为椭球状多元正态分布的应用场景统计分析机器学习多元正态分布在统计分析中广泛应用,如回在机器学习中,多元正态分布用于高斯过程归分析、主成分分析、因子分析等回归、核方法等信号处理金融领域在信号处理领域,多元正态分布用于信号建在金融领域,多元正态分布用于资产定价、模和噪声分析风险评估和投资组合优化等PART02二元正态分布的特性二元正态分布的期望值和方差总结词二元正态分布的期望值是两个维度的平均值,方差是两个维度各自方差和两个维度间协方差的函数详细描述对于二元正态分布,每个维度的期望值是其分布的均值向量而方差则由每个维度的方差和两个维度间的协方差组成这些值决定了分布的形状和离散程度二元正态分布的边缘分布总结词在二元正态分布中,如果固定其中一个变量,则另一个变量遵循一元正态分布详细描述二元正态分布可以分解为两个一元正态分布的乘积当固定其中一个变量时,另一个变量将遵循一元正态分布这意味着每个维度在独立时都满足正态分布二元正态分布的独立性总结词详细描述在二元正态分布中,如果两个维度相互在二元正态分布中,如果两个维度相互独独立,则它们的协方差矩阵为单位矩阵立,则它们之间的协方差为0,这意味着VS协方差矩阵为单位矩阵这种情况下,两个维度之间没有相关性,每个维度都独立于另一个维度PART03高维正态分布的特性高维正态分布的期望值和协方差矩阵总结词高维正态分布的期望值是所有维度的平均值,协方差矩阵描述了不同维度之间的方差和协方差详细描述在高维正态分布中,每个维度的期望值是该维度的平均值,所有维度的期望值之和为零协方差矩阵是一个对称矩阵,对角线上的元素表示不同维度自身的方差,而非对角线上的元素表示不同维度之间的协方差高维正态分布的球面分布总结词高维正态分布的样本点在特征空间中呈球形分布详细描述在高维正态分布中,由于各维度之间的协方差相等,样本点在特征空间中呈现出一个球形分布随着维度的增加,球形半径逐渐增大,但形状保持不变高维正态分布的多元相关性总结词详细描述高维正态分布的各维度之间存在相关性,且在高维正态分布中,由于协方差矩阵的存在,相关性随维度增加而减小各维度之间存在相关性然而,随着维度的增加,各维度之间的相关性逐渐减小,趋向于独立这是由于高维空间中的随机噪声和复杂性使得各维度之间的关联性减弱PART04多元正态分布在统计推断中的应用多元正态分布在回归分析中的应用多元线性回归稳健回归在多元线性回归分析中,响应变量与多个预当存在异常值或离群点时,多元正态分布假测变量之间的关系可以用多元正态分布来描设下的回归分析可能不稳定稳健回归方法,述,通过估计回归系数和误差方差来预测未如最小绝对收缩和选择算子(LASSO)回知数据归,可以利用多元正态分布的特性来处理异常值并提高预测精度多元正态分布在主成分分析中的应用数据降维主成分分析(PCA)是一种常用的数据降维方法通过将数据投影到由多元正态分布生成的主成分上,可以减少数据的维度并保留主要特征特征提取PCA可以帮助识别数据中的潜在结构,提取关键特征,并去除噪声和冗余信息这些特征可以用作分类、聚类或其他机器学习任务的输入多元正态分布在因子分析中的应用因子分析因子分析是一种探索性数据分析方法,用于识别潜在的因子结构这些因子通常假定为正交且服从多元正态分布通过估计因子载荷和因子方差,可以解释变量之间的相关性并简化数据结构潜在类别分析在潜在类别分析中,假定潜在类别变量服从多元正态分布通过估计类别概率和潜在类别概率,可以识别数据的潜在分组并解释观察到的分类结果PART05多元正态分布在机器学习中的应用多元正态分布在聚类分析中的应用聚类分析是机器学习中常用的无监督学习方法,用于将数据集划分为若干个相似的子集多元正态分布可以作为聚类模型的概率模型,用于描述各个聚类中心附近的分布情况在聚类分析中,多元正态分布可以用于确定聚类中心和数据点之间的相似性度量,以及计算聚类结果的可信度多元正态分布在分类算法中的应用分类算法是机器学习中常用的有监督学习方法,用于根据已知标签的数据来预测新数据的标签多元正态分布可以作为分类模型的概率模型,用于描述不同类别之间的分布差异在分类算法中,多元正态分布可以用于确定各类别的概率密度函数,以及计算分类结果的可信度多元正态分布在生成对抗网络中的应用生成对抗网络(GAN)是一种深度学习模型,由生成器和判别器两个网络组成,通过相互竞争来生成新的数据样本多元正态分布可以作为GAN中生成器的分布模型,用于生成模拟数据在GAN中,多元正态分布可以用于控制生成数据的分布特性,以及提高生成数据的多样性和真实性。