还剩7页未读,继续阅读
文本内容:
大数据机器学习实战”高级工程师实战培训班的通知地点北京时间月月
一、课程学习目标每一个算法模块按照“原理讲解f分析数据一自己动手实现一特征与调参”的顺序数据清洗和特征提取,提升学习深度、降低学习坡度o“增加网络爬虫的原理和编写,从获取数据开始,重视将实践问题转换成实际模型的能力,分享工作中的实际案例或者案例广告销量分析、环境数据异常检测和分析、数字图象手写体识别、乘客存活率预测、用户电影推荐、真实新闻组数据主题分析、中文分词、股票数据特征分析等强化矩阵运算、概率论、数理统计的知识运用,掌握机器学习根本阐述机器学习原理,提供配套源码和数据以直观解释,增强感性理解对照不同的特征选择带来的预测效果差异重视项目实践,重视落地思量不同算法之间的区别和联系,提高在实际工作中选择算法的能力涉及和讲解的部份库有、、、、、
二、课程目标本课程特点是从数学层面推导最经典的机器学习算法,以及每种算法的示例和代码实现、如何做算法的参数调试、以实际应用案例分析各种算法的选择等
三、培训对象大数据分析应用开辟工程师、大数据分析项目的规划咨询管理人员、大数据分析项目的项目高管人员、大数据分析与挖掘处理算法应用工程师、大数据分析集群运维工程师、大数据分析项目的售前和售后技术支持服务人员
四、详细培训内容介绍课程模块课程主题主要内容及案例和演示机器学习的普通方法和横向比较数学是实用的以为例机器学习的角度看数学复习数学分析直观解释常数机器学习的数学基础导数梯度模块-数学分析随机梯度下降展式的落地应用系数凸函数不等式概率论基础古典概型贝叶斯公式先验分布后验分布共轨分布机器学习的常见概率分布数学基础概模块二泊松分布和指数分布的物理意义率论与贝叶斯先验协方差矩阵和相关系数独立和不相关大数定律和中心极限定理的实践意义深刻理解最大似然估计和最大后验估计过拟合的数学原理与解决方案线性代数在数学科学中的地位机器学习的模块三数学基础矩马尔科夫模型矩阵乘法的直观表达阵和线性代数状态转移矩阵矩阵和向量组特征向量的思量和实践计算分解对称阵、正交阵、正定阵数据白化及其应用向量对向量求导标量对向量求导标量对矩阵求导工作机制解释器:基础列表元组字典类文件展式的代码实现基础的介绍和典型使用模块四多元高斯分布及其数学库泊松分布、幕律分布典型图象处理胡蝶效应分形与可视化的介绍和典型使用损失函数的绘制多种数学曲线基础多项式拟合模块五机器学快速傅里叶变换习库奇妙值分解算子与卷积网络卷积与指数挪移平均线股票数据分析基础模块六实际生产问题中算法和特征的关系数据清股票数据的特征提取和应用一致性检验洗和特征选缺失数据的处理环境数据异常检测和分析含糊数据查询和数据校正方法、算法、应用朴素贝叶斯用于莺尾花数据朴素贝叶斯用于篇新闻文本的分类线性回归回归广义线性回归正则化模块七回归与梯度下降算法与特征选择与过拟合函数的直观解释回归的概念源头回归模块八归最大嫡模型散度损失函数回归的实现与调参机器学习库介绍线性回归代码实现和调参回归代码实现和调参模块九回归实践回归回归广告投入与销售额回归分析莺尾花数据集的分类交叉验证数据可视化埔、联合端、条件燧、散度、互信息最大似然估计与最大嫡模型、、详解决策树的正则化预剪枝和后男枝决策树和随模块十机森林随机森林不平衡数据集的处理利用随机森林做特征选择使用随机森林计算样本相似度数据异常值检测随机森林与特征选择决策树应用于回归多标记的决策树回归模块十一随机森林实践决策树和随机森林的可视化葡萄酒数据集的决策树随机森林分类波士顿房价预测提升为什么有效梯度提升决策树模块十二提升算法详解算法加法模型与指数损失用于蘑菇数据分类与随机森林的比较库介绍展式与学习算法简介模块十三提升实践泰坦尼克乘客存活率估计线性可分支持向量机软间隔的改进损失函数的理解模块十四核函数的原理和选择算法支持向量回归代码库介绍原始数据和特征提取葡萄酒数据分类模块十五实践数字图象的手写体识别用于时间序列曲线预测、回归、随机森林三者的横向比较各种相似度度量及其相互关系相似度和准确率、召回率模块十六聚类
(一)相关系数与余弦相似度与及变种算法算法及其应用密度聚类模块十七聚类
(二)谱聚类聚类评价算法及其应用算法原理和实现向量量化及图象近似并查集的实践应用密度聚类的代码实现谱聚类用于图片分割模块十八聚类实践模块十九算法最大似然估计不等式朴素理解算法精确推导~~算法的深入理解混合高斯分布主题模型多元高斯分布的实现分类结果的数据可视化与聚类的比较模块二十算法实践过程三维及等高线等图件的绘制主题模型与算法贝叶斯学派的模型认识分布与二项分布共胡先验分布主题模型分布平滑采样详解网络爬虫的原理和代码实现住手词和高频词动手自己实现开源包的使用和过程分析模块二十二实践算法与的比较算法与实践概率计算问题隐马尔科夫模块二十三前向后向算法模型的参数学习算法详解算法详解隐马尔科夫模型的应用优劣比较动手自己实现用于中文分词多个语言分词开源包的使用和过程分析文件数据格式、住手词和标点符号对分词的影响前向后向算法计算概率溢出的解决方案发现新词和分词效果分析高斯混合模型模块二十四实践用于股票数据特征提取模块二十五课堂提问与互动讨论
五、师资介绍张老师阿里大数据高级专家,国内资深的、技术专家、虚拟化专家,对、、、、、、和等生态系统中的技术进行了多年的深入的研究,更主要的是这些技术在大量的实际项目中得到广泛的应用,因此在开辟和运维方面积累了丰富的项目实施经验近年主要典型的项目有某电信集团网络优化、中国挪移某省挪移公司请账单系统和某省挪移详单实时查询系统、中国银联大数据数据票据详单平台、某大型银行大数据记录系统、某大型通信运营商全国用户上网记录、某省交通部门违章系统、某区域医疗大数据应用项目、互联网公共数据大云和构建游戏云平台项目等
六、颁发证书参加相关培训并通过考试的学员,可以获得工业和信息化部颁发的《大数据工程师证书》该证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据注请学员带一寸彩照张(背面注明姓名)、身份证复印件一张
七、培训费用及须知元人(含教材、培训费、考证费以及学习用具等费用)食宿统一安排,费用自理
八、报名回执大数据实战培训班”报名回执表单位名称详细地址联系人电话传真邮箱姓名性别部门职务电话手机邮箱、户名I我会单位签字或者盖章注此表复印有效。