R 缺失值多重插补法时,在mice()函数运行后,出现系数计算上是奇异错误,怎么破,求大神指导,谢谢! ”

缺失值的处理方法_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
&&¥1.00
&&¥3.00
&&¥2.00
&&¥3.00
&&¥2.00
&&¥2.00
喜欢此文档的还喜欢
缺失值的处理方法
阅读已结束,如果下载本文需要使用
想免费下载本文?
把文档贴到Blog、BBS或个人站等:
普通尺寸(450*500pix)
较大尺寸(630*500pix)
你可能喜欢《SPSS统计分析与应用》教学讲义_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
文档贡献者
评价文档:
&&¥1.00
喜欢此文档的还喜欢
《SPSS统计分析与应用》教学讲义
把文档贴到Blog、BBS或个人站等:
普通尺寸(450*500pix)
较大尺寸(630*500pix)
大小:1.51MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢SPSS 17.0 缺失值中文版使用指南。内容包括:缺失值简介,缺失值分析,多重..
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
SPSS 17 缺失值中文版使用指南
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口后使用快捷导航没有帐号?
数据挖掘:R语言实战
查看: 9752|
评论: |来自:
摘要: 内容简介: 数据挖掘技术是当下大数据时代最关键的技术,其应用领域及前景不可估量。R 是一款极其优秀的统计分析和数据挖掘软件,本书侧重使用R 进行数据挖掘,重点讲述了R 的数据挖掘流程、算法包的使用及相关工具的 ...
5.2.1& 缺失值处理缺失值是数据中经常出现的问题,也是任何数据集中都可能出现的问题,无回答、录入错误等调查中常会出现的现象都会导致缺失数据。缺失值通常会用一些特殊符号进行标记,比如年1月1日,或者是“*”、“?”、“#”、“$”等符号。缺失数据会影响分析工作的进行,进而影响统计工作的效率,还会导致分析的偏差。数据使用者、分析者往往缺乏缺失值处理方面的知识,仅仅对数据进行简单删除或插补会影响数据规模和数据结构,进而影响分析结果。在数据预处理中,首先要做的通常是判断是否存在缺失值。在R语言中缺失值通常以NA表示,可以使用函数is.na判断缺失值。
sum(is.na(nhanes2))&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&& #计算nhanes2中缺失值的数量
complete.cases
& sum(complete.cases(nhanes2))&&&&&&&&&&&&&&&&&&&&& #计算nhanes2中完整样本的数量
[1] 13两个函数结果分别表示“数据中共有27个缺失值”以及“数据框中共有13条完整观测值”,即有12条观测值中存在缺失值。在存在缺失数据的情况下,需要进一步对数据缺失状况进行观测,判断缺失数据是否随机。我们可以利用mice包中的md.pattern函数完成这一任务。&md.pattern(nhanes2)& #观测nhanes2中缺失值的情况&age&hyp&bmi&chl 13&1&1&1&1&0&1&1&1&0&1&1&3&1&1&1&0&1&1&1&0&0&1&2&7&1&0&0&0&3&& 0&8&9&10&27其中1表示没有缺失数据,0表示存在缺失数据。第一行第一列的13表示有13个样本是完整的,即不存在缺失数据。第一列最后一个7表示有7个样本少了hyp、bmi、chl三个变量,最后一行表示各个变量缺失的样本数合计。对于缺失数据最简单粗暴的方式,即是直接删除含有缺失值的样本,这样做有时也是最为简单有效的方法,但前提是缺失数据的比例较少,且缺失数据是随机出现的,这样删除缺失数据后对分析结果影响不大。
Multivariate Imputation
mice(data, m = 5,...)
dataNAmmm=5
chlagehypbminhanes&2mice()
& imp=mice(nhanes2,m=4)& &&&&&&&&&&&&&&&&&&&&&&& #
生成4组完整的数据库并赋给imp
& fit=with(imp,lm(chl~age+hyp+bmi))
&&&&&&&&&&& # 生成线性回归模型
& pooled=pool(fit)&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
# 对建立的4个模型进行汇总
& summary(pooled) &&&&&&&&&&&&&&&&&&&&&&&&& # 展示pooled的内容
impimppool
&&&&&&&&&&&&&&&&&&&&&&Est&&&&& se&&&&&&&&&& t&&&&&&&&&&&&&&&&&& df&&&&&& Pr(&|t|)&&& lo 95
(Intercept)&&&&&&&&& -2.810786 70.559221 & -0.&&&&&&&& 5.806503 0.& -176.8672775
age2&&&&&& & 43.791589
26.500764& &&&&&&&&&& 1.&&&&&&&&& 5.128217 &&& 0.&
-23.8216782
age3&&&&&& & 78.743815
30.233726& &&&&&&&&&& 2.
&&&&&&&&& 5.283178 &&& 0.
hyp2&&&&& && -13.339990&&&&&&&&& 27.687074
& -0. &&&&&&&& 4.627705 &&& 0.& -86.2690193
bmi&&&&&&& & 6.327635&
-0.3481417
hi 95 nmis&&&& fmi&&&
(Intercept)&&&&&&&&&& 171.24571&& NA&&&& 0.5830684&&&&&&&&&&&& 0.4605586
age2&&&&&&&
111.40486& NA&&& 0.6259366&& 0.5038576
age3&&&&&&&
155.22569& NA&&& 0.6157695 && 0.4934649
hyp2&&&&&& & 59.58904&& NA&&& 0.6604248&& 0.5397450
bmi&&&&&&&&&
13.00341 && 9&&&& 0.6391340 && 0.5174711
nmisfmifraction of missing information
sub=which(is.na(nhanes2[,4])==TRUE)&&&& && # 返回nhanes2数据集中第4列为NA的行
& dataTR=nhanes2[-sub,]&&&&&&&&&&& &&&&&&&&&&& #
将第4列不为NA的数存入数据集dataTR中
& dataTE=nhanes2[sub,]&&&&&&&&&&&&&& &&&&&&&&& #
将第4列为NA的数存入数据集dataTE中
& dataTE[,4]=sample(dataTR[,4],length(dataTE[,4]),replace=T)#
在非缺失值中简单抽样
& dataTE&&&&age&& bmi &&& hyp &&& chl
1&&20-39&& NA &&&& &NA&&&&&&&& 206
4&&60-99&&
NA &&&& &NA& && 204
10&40-59&&
NA &&&& &NA&&&&&&&& 206
NA &&&& &NA&&&&&&&& 113
NA &&&& &NA& && 229
20-39 & 29.6 && no&&&&& 199
NA &&&& &NA& && 218
60-99 & 25.5 && yes &&& 187
NA &&&& &NA& && 199
60-99 & 24.9&& & no &&&& 238
& sub=which(is.na(nhanes2[,4])==TRUE)&&&&& && #
返回nhanes2数据集中第4列为NA的行
& dataTR=nhanes2[-sub,]&&&&&&&&&&&&&&
&&&&& # 将第四列不为NA的数存入数据集dataTR中
& dataTE=nhanes2[sub,]&&&&&&&&&&&&&&&
&&&&&& # 将第四列为NA的数存入数据集dataTE中
& dataTE[,4]=mean(dataTR[,4])& &&&&&&&&&& #
用非缺失值的均值代替缺失值
& dataTE&&&&&age&&&& bmi&&&& hyp&&&&&&&& chl
1&& 20-39 && NA&&&&&NA&&&&&&&& 191.4
4&&&60-99&&&
NA&&&&& &NA&&&&&&&& 191.4
NA&&&&&&NA&&&&&&&& 191.4
NA&&&&&&NA&&&&&&&& 191.4
NA&&&&& &NA&&&&&&&& 191.4
20-39 & 29.6&&&&&no&&&&& 191.4
NA &&&& &NA&&&&&&&& 191.4
60-99 & 25.5 && yes&&&& 191.4
NA &&&& &NA&&&&&&&& 191.4
60-99 & 24.9&& & no &&&& 191.4
刚表态过的朋友 () 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
缺失数据的多重插补及其改进
下载积分:1998
内容提示:
文档格式:PDF|
浏览次数:1|
上传日期: 21:55:06|
文档星级:
该用户还上传了这些文档
缺失数据的多重插补及其改进.PDF
官方公共微信}

我要回帖

更多关于 插补程序 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信