Tag: na

删除dplyrpipe道中的NA

我试图用dplyrpipe道从子集中删除NA。 我的答案是错过了一个步骤。 我试图学习如何使用dplyr编写函数: > outcome.df%>% + group_by(Hospital,State)%>% + arrange(desc(HeartAttackDeath,na.rm=TRUE))%>% + head() Source: local data frame [6 x 5] Groups: Hospital, State 医院国家心脏病攻击 1 ABBEVILLE地区医疗中心SC NA 2 ABBEVILLE GENERAL HOSPITAL LA NA 3 ABBOTT西北医院MN 12.3 4德国ABILENE区域医疗中心17.2 5 ABINGTON MEMORIAL HOSPITAL PA 14.3 6亚伯拉罕林肯纪念医院IL NA variables未显示:HeartFailureDeath(dbl),PneumoniaDeath (DBL)

子集Rdataframe导致神秘的NA行

我一直在遇到我认为是一个错误。 这不是什么大问题,但是我很好奇,如果有人看到这个。 不幸的是,我的数据是保密的,所以我不得不做一个例子,这不会是非常有帮助的。 在对数据进行子集化时,偶尔会得到不在我原始数据框中的神秘NA行。 连rownames都是NA。 例如: example <- data.frame("var1"=c("A", "B", "A"), "var2"=c("X", "Y", "Z")) example var1 var2 1 AX 2 BY 3 AZ 然后我运行: example[example$var1=="A",] var1 var2 1 AX 3 AZ NA<NA> <NA> 当然,上面的例子实际上并没有给你这个神秘的NA行, 我在这里添加它来说明我的数据有问题。 也许这与我正在使用Google的read.xlsx包导入我的原始数据集,然后在子集化之前执行wide到long 的整形有关 。 谢谢

如何删除只包含NAs的列?

我有一个data.frame包含一些具有所有NA值的列,我怎么能从data.frame中删除它们。 我可以使用该function吗? na.omit(…) 指定一些额外的参数?

一个函数来检测NaN,NA,Inf,-Inf等?

R中是否有一个函数确定一个值是NA , NaN , Inf , -Inf还是不是一个-Inf数字?

用数据框中的NAreplace字符值

我有一个数据框包含(在随机的地方)一个字符值(比如说"foo" ),我想用NA代替。 在整个数据框架中,最好的方法是什么?

在数据框的选定列中包含NA(缺失)值的行的子集

我们有一个CSV文件的数据框。 dataframeDF具有包含观测值的列和包含已经进行测量的date的列( VaR2 )。 如果未loggingdate,则CSV文件包含缺失数据的值NA 。 Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 我们希望使用subset命令定义一个新的dataframenew_DF ,使得它只包含来自列( VaR2 )的具有NA'值的行。 在给出的例子中,只有第2行将被包含在新的DF 。 命令 new_DF<-subset(DF,DF$Var2=="NA") 不起作用,结果数据框没有行条目。 如果在原始的CSV文件中NA值与NULL交换,则相同的命令会产生所需的结果: new_DF<-subset(DF,DF$Var2=="NULL") 。 如何获得这个方法的工作,如果string的价值NA提供原始CSV文件?

省略包含NA的特定列的行

我想知道如何在数据框架中省略NA值,但只在我感兴趣的一些列中。 例如, DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22)) 但是我只想省略y是NA的数据,所以结果应该是 xyz 1 1 0 NA 2 2 10 33 na.omit似乎删除所有包含任何NA行。 有人能帮我解决这个简单的问题吗? 但是如果现在我改变这个问题: DF <- data.frame(x = c(1, 2, 3,NA), y = c(1,0, 10, NA), z=c(43,NA, 33, NA)) 如果我只想省略x=na或z=na ,我可以在哪里放置| 在function?

如何用R中的子集中的均值代替NA(用plyr?进行估计)

我有一个从蝾螈胆量来的各种节肢动物的长度和宽度的数据框。 因为有些胆量有成千上万的猎物,我只测量了每种猎物types的一个子集。 我现在想用每个不可测量的个体来replace那个猎物的平均长度和宽度。 我想保持数据框,只是添加估算列(length2,width2)。 主要原因是每一行也有蝾螈收集date和地点的数据栏。 我可以用随机select的测量个体来填写NA,但是为了论证,我们假设我只想用平均值replace每个NA。 例如,假设我有一个像这样的数据框: id taxa length width 101 collembola 2.1 0.9 102 mite 0.9 0.7 103 mite 1.1 0.8 104 collembola NA NA 105 collembola 1.5 0.5 106 mite NA NA 事实上,我有更多的专栏和大约25种不同的分类群,总共有大约3万个猎物。 似乎plyr包可能是理想的,但我只是不知道如何做到这一点。 我不是很R或编程精明,但我试图学习。 不是说我知道自己在做什么,但是如果有帮助,我会尝试创build一个小数据集。 exampleDF <- data.frame(id = seq(1:100), taxa = c(rep("collembola", 50), rep("mite", 25), rep("ant", 25)), length = c(rnorm(40, […]

在paste()中抑制NAs

关于赏金 Ben Bolker的paste2解决scheme产生一个""当粘贴的string包含NA在同一个位置。 喜欢这个, > paste2(c("a","b", "c", NA), c("A","B", NA, NA)) [1] "a, A" "b, B" "c" "" 第四个元素是一个""而不是一个NA像这样, [1] "a, A" "b, B" "c" NA 我为所有能解决这个问题的人提供这个小小的奖励。 原来的问题 我已阅读帮助页面?paste ,但我不明白如何让R忽略NA s。 我做了以下, foo <- LETTERS[1:4] foo[4] <- NA foo [1] "A" "B" "C" NA paste(1:4, foo, sep = ", ") 并得到 [1] "1, A" "2, […]

如何从包含n * NA的数据框中删除行

我有一些大数据集,大约有10列,〜200000行。 并不是所有的列都包含每行的值,但是至less有一列必须包含该行所存在的值,我想设置一个阈值,以允许一行中允许有多less个NA 。 我的数据框看起来像这样: ID qrstuvwxyz A 1 5 NA 3 8 9 NA 8 6 4 B 5 NA 4 6 1 9 7 4 9 3 C NA 9 4 NA 4 8 4 NA 5 NA D 2 2 6 8 4 NA 3 7 1 32 我希望能够删除包含多个包含NA的单元格的行以获得 ID qrstuvwxyz A 1 […]