还剩1页未读,继续阅读
文本内容:
第三章大数据财务决策常用方法
一、什么是聚类分析财务业务中主要用聚类分析做什么?聚类分析是关于分组或划分数据的方法,目的是发现隐藏在数据中的潜在结构聚类分析作为从数据中获取知识的重要途径,是数据挖掘和机器学习的一个重要研究领域在财务领域,基于大数据的聚类分析是根据财务大数据的内在性质将数据分成一些聚合类,每一聚合类中的元素尽可能具有相同的特性,不同聚合类之间的特性差别尽可能大的一种分类方式
二、简述基于决策树的数据分类、基于支持向量机的数据分类和基于逻辑回归的分类方法的差异决策树算法是一种常用的数据挖掘算法,它是从机器学习领域中逐渐发展起来的一种分类函数逼近方法基于决策树的分类模型已经广为人们采用支持向量机()是一种有监督的机器学习算法,是用于分类的一种经典算法它使用一种称为核技巧的技术来转换数据,然后根据这些转换在可能的输出之Support VectorMachine,SVM间找到一个最佳边界在大数据分析中,回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系在大数据条件下,数据是大规模并且存在病态的,常用回归方法通常表现得不尽人意
三、简述基于大数据的回归分析的实施步骤求解大数据正则化逻辑回归分析的步骤
①随机梯度下降法求解范数正则化的逻辑回归问题的实施步骤,如算法所示L算法1随机梯度下降法求解范数正则化的逻辑回归问题1
①输入步长序列{4}向
②初始化%owR,RwRP
③对f=1,2,3,…
④抽样
⑤计算%=%兽f1+e+
⑥片HO—-从go
⑦对j=l,2,3,…,p
⑧区八广片「结束
②向前向后分裂法求解范数正则化的逻辑回归问题的实施步骤,如算法所示42算法2向前向后分裂法求解范数正则化的逻辑回归问题
①输入步长序列{从}4
②初始化)=A.OWR、0I=AWRP
③对31,2,3,…
④抽样=(乙,切)
⑤计算g0=且Mg-必+e,+c
⑥A+LO―A,o-^tSo1一七%一£%
⑦+
1.01,0
⑧对J=l,2,3,…,p
⑨kj-SS「内XggcM)⑩鼠)一£%-备+”结束.求解大数据的正则化逻辑回归问题的和步骤求解人范数正则化逻辑回归问题的实施步骤,如算法所示2RCSUM RPSUM©RCSUM算法3RCSUM forG regularizedlogistic regression3
①initialization
②左一0choose w°e RP”
③While notconverged do©Choose is{1,2,3,,,•,«}uniformlyk
⑤Or choose i forma randompermutation of{1,2,3,…k「应、—
⑥y;“—Gy—+--7=^T2V21+eiN
⑦好一7Ex城/Y/1
⑧J—8S(科㈤
⑨J―/+(._垮)/⑩If k|p then⑪限-M+技「六篇)77/-i l+e%x J©else⑬端⑭end if⑮4一1©end while求解勺范数正则化逻辑回归问题的实施步骤,如算法所示算法4RPSUM forLogistic Regressionwith储regularization
②RPSUM4
①Initialization
③Set风=0,2=Op,where0represent ap dimensionvector whoseelements areall0p©While notconverged do
⑤In parallelon qprocessors©Choose j=1,2,•••,/uniformly atrandom
⑦41—z;,where z;are definedas abovebut use风,ft1where Appropriate咛@For thosecoordinates jsthat arcnot chose,4—
⑨U+l⑩end while
四、在财务领域,关联规则分析主要有哪些应用?.客户画像分析.产品销售预测
1.风险预测23
五、财务中利用离群点分析能够做什么?.内部审计中的大数据孤立点分析1在金融内部审计里,使用大数据孤立点分析能对异常信用贷款与正常信用贷款之间的规律展开分析,揭示金融企业信用贷款风险分类的相关规律;进行撒网式搜索,全方位对比综合发现审计的可疑点,可以减少审计的检查风险,提高审计工作的质量.在可疑金融交易识别的应用2一个典型的洗钱交易过程包括入账、分账、融合个阶段入账是指将非法钱财存入金融机构;分账是通过一系列多层次复杂的转账交易,使这笔钱财脱离其来源;融合是指将非法钱3财与合法所得融为一体其中分账过程是数据分析的主要对象,通过对多个交易,及账户进行汇总比较分析可以发现有价值的线索。