Tag: r

如何在R中绘制两个直方图?

我使用R和我有两个数据框架:胡萝卜和黄瓜。 每个数据框都有一个数字列,列出所有测量的胡萝卜(总数:10万个胡萝卜)和黄瓜(总数:5万个黄瓜)的长度。 我想绘制两个直方图 – 胡萝卜长度和黄瓜长度 – 在同一个阴谋。 他们重叠,所以我想我也需要一些透明度。 我也需要使用相对频率而不是绝对数,因为每个组中的实例数是不同的。 这样的事情会很好,但我不明白如何从我的两个表创build它:

如何debugging“对比度只能应用于2级以上的因素”的错误?

以下是我正在使用的所有variables: str(ad.train) $ Date : Factor w/ 427 levels "2012-03-24","2012-03-29",..: 4 7 12 14 19 21 24 29 31 34 … $ Team : Factor w/ 18 levels "Adelaide","Brisbane Lions",..: 1 1 1 1 1 1 1 1 1 1 … $ Season : int 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 […]

strptime,as.POSIXct和as.Date返回意外的NA

当我尝试使用以下格式parsing时间戳时:“Thu Nov 8 15:41:45 2012”,只返回NA 。 我使用Mac OS X R 2.15.2和Rstudio 0.97.237。 我的操作系统的语言是荷兰语:我想这与它有关。 当我尝试strptime , NA被返回: var <- "Thu Nov 8 15:41:45 2012" strptime(var, "%a %b %d %H:%M:%S %Y") # [1] NA as.POSIXct工作: as.POSIXct(var, "%a %b %d %H:%M:%S %Y") # [1] NA 我也尝试了上面的string作为date,但没有%H:%M:%S组件: as.Date("Thu Nov 8 2012", "%a %b %d %Y") # [1] NA 任何想法我可能做错了什么?

增加(或减less)R进程可用的内存

我想增加(或减less)R的可用内存量。实现这个的方法是什么?

在不改变值的顺序的情况下重新排列因子的水平

我有一些数字variables和一些分类factorvariables的数据框架。 这些因素的级别顺序不是我想要的。 numbers <- 1:4 letters <- factor(c("a", "b", "c", "d")) df <- data.frame(numbers, letters) df # numbers letters # 1 1 a # 2 2 b # 3 3 c # 4 4 d 如果我改变关卡的顺序,那么这些关键字就不再有相应的数字了(我的数据从这个意义上说是无稽之谈)。 levels(df$letters) <- c("d", "c", "b", "a") df # numbers letters # 1 1 d # 2 2 c # […]

在FUN中访问lapply索引名称

有没有办法在我的lapply()函数中获取列表索引名称? n = names(mylist) lapply(mylist, function(list.elem) { cat("What is the name of this list element?\n" }) 我之前问过是否可以保留lapply() 返回的列表中的索引名称,但我仍然不知道是否有一种简单的方法来获取自定义函数中的每个元素名称。 我想避免在名称本身上调用lapply,我宁愿在函数参数中获取名称。

为什么data.table通过引用更新名称(DT),即使我分配给另一个variables?

我已经将data.table的名称存储为一个vector : library(data.table) set.seed(42) DT <- data.table(x = runif(100), y = runif(100)) names1 <- names(DT) 据我所知,这是一个普通的香草字符vector: str(names1) # chr [1:2] "x" "y" class(names1) # [1] "character" dput(names1) # c("x", "y") 但是,这不是普通的字符向量。 这是一个魔法字符vector! 当我添加一个新的列到我的data.table ,这个向量得到更新! DT[ , z := runif(100)] names1 # [1] "x" "y" "z" 我知道这与如何处理:=通过赋值更新有关,但是对于我来说,这仍然看起来很神奇,因为我期望<-将data.table的名称复制一份 。 我可以通过在c()包装名称来解决这个问题: library(data.table) set.seed(42) DT <- data.table(x = runif(100), […]

用空df(cbind.fill?)绑定df

我想我正在寻找一个类似于rbind.fill (哈德利的plyr包)的cbind 。 我看了,但没有cbind.fill 。 我想要做的是以下几点: #set these just for this example one_option <- TRUE diff_option <- TRUE return_df <- data.frame() if (one_option) { #do a bunch of calculations, produce a data.frame, for simplicity the following small_df small_df <- data.frame(a=1, b=2) return_df <- cbind(return_df,small_df) } if (diff_option) { #do a bunch of calculations, produce a […]

如何添加纹理来填充ggplot2中的颜色?

我目前使用scale_brewer进行填充,这些颜色看起来非常漂亮(在屏幕上和通过彩色打印机),但是在使用黑白打印机时会相当均匀地以灰色打印。 我search了在线ggplot2文档,但没有看到任何添加纹理来填充颜色。 有没有官方的ggplot2方式来做到这一点,或有没有人有他们使用的黑客? 纹理我的意思是像斜杠,反斜杠,圆点图案等,这些将在黑白打印时区分填充颜色。

如何在R data.frame中添加按组的唯一值计数

我希望通过对第二个variables进行分组来统计唯一值的数量,然后将计数添加到现有data.frame中作为新列。 例如,如果现有的数据框如下所示: color type 1 black chair 2 black chair 3 black sofa 4 green sofa 5 green sofa 6 red sofa 7 red plate 8 blue sofa 9 blue plate 10 blue chair 我想为每种color添加数据中存在的唯一types的数量: color type unique_types 1 black chair 2 2 black chair 2 3 black sofa 2 4 green sofa 1 5 […]