文本内容:
一、多选题常用的数据变换手段有
1.A BCD产生衍生变量A.标准化变换B.连续型离散化变换C.改善变量分布的变换D.数据清洗常用在以下方面
2.ABC D数据不一致情况A.统一维度编码B.异常值处理C.缺失值处理D.异常值判断及处理常用手段有
3.ABCDE简单统计分析A.原则B.3sigma箱型图分析C.聚类分析D.局部异常因子检测异常值E.LOF识别缺失值常用函数有
4.AC函数A.is.na函数B.is.NA函数C.complete.cases函数
二、上机题D.complete.case导入贷款数据到中,对数据集按照变量进行等比例分析,分成
1.accepts.csv Raccepts badjnd两份75%25%#导入数据accepts-read.csvaccepts.csv#对按照变量进行等比例分析,分成两份accepts badjnd75%25%libra rycaretprop.tabletableaccepts$bad_indindex-createDataPartitionaccepts$bad_ind,times=l,p=
0.75Jist=Ftrain-accepts[index,]test-accepts[-index,]prop.tabletabletrain$badjndprop.tabletabletest$bad ind对缺失值模式进行探索,利用表格和可视化的方式进行展示对缺失值模式进行查看
2.librarymicemd.patternacceptslibraryVIMaggraccepts prop=F,numbers=T。