Tag: r

如何通过公式中的string使用引用variables?

在下面的最简单的例子中,我试图在回归公式中使用stringvars的值。 但是,我只能将这个string的variables名称(“v2 + v3 + v4”)传递给公式,而不是这个string的真正含义(例如“v2”是dat $ v2)。 我知道有更好的方法来运行回归(例如, lm(v1 ~ v2 + v3 + v4, data=dat) )。 我的情况更复杂,我想弄清楚如何在公式中使用string。 有什么想法吗? 更新下面的代码 # minimal example # create data frame v1 <- rnorm(10) v2 <- sample(c(0,1), 10, replace=TRUE) v3 <- rnorm(10) v4 <- rnorm(10) dat <- cbind(v1, v2, v3, v4) dat <- as.data.frame(dat) # create objects of […]

向量乘以matrix的行?

我正在优化一个函数,我想摆脱缓慢的循环。 我正在寻找一种更快的方法来将matrix的每一行乘以一个向量。 有任何想法吗? 编辑: 我不是在寻找一个“古典”的乘法。 例如。 我有matrix,有23列25行和长度为23的向量。结果我想要matrix25x23,每行乘以向量。

在ggplot2中绘制线条和群体审美

这个问题是从前面的问题及其答案开始的。 首先一些玩具数据: df = read.table(text = "School Year Value A 1998 5 B 1999 10 C 2000 15 A 2000 7 B 2001 15 C 2002 20", sep = "", header = TRUE) 最初的问题是如何为每所学校绘制价值年线。 答案或多或less对应于下面的p1和p2。 但也要考虑p3。 library(ggplot2) (p1 <- ggplot(data = df, aes(x = Year, y = Value, colour = School)) + geom_line() + geom_point()) […]

安装SparkR

我有最新版本的R – 3.2.1。 现在我想在R上安装SparkR。执行完后: > install.packages("SparkR") 我回来了: Installing package into '/home/user/R/x86_64-pc-linux-gnu-library/3.2' (as 'lib' is unspecified) Warning in install.packages : package 'SparkR' is not available (for R version 3.2.1) 我也在我的机器上安装了Spark Spark 1.4.0 我怎么能解决这个问题(实际上我使用RStudio或只是从terminal)

问题使用rbind将多个.csv文件加载到R中的单个数据框中

我写了下面的函数来合并300个.csv文件。我的目录名是“specdata”。 我已经完成了以下的执行步骤, 步骤1: > x <- function(directory) { dir <- directory data_dir <- paste(getwd(),dir,sep = "/") files <- list.files(data_dir,pattern = '\\.csv') tables <- lapply(paste(data_dir,files,sep = "/"), read.csv, header = TRUE) pollutantmean <- do.call(rbind , tables) } 第2步: >x("specdata") 第3步: >head(pollutantmean) 头部错误(污染物含量):物体'污染物含量'未find 我做了什么错误呢? 你可以请任何人解释? 提前致谢。

在ggplot中使用预定义的调色板

有谁知道如何在ggplot中使用预定义的调色板? 我有一个颜色vector我想用: rhg_cols <- c("#771C19", "#AA3929", "#E25033", "#F27314", "#F8A31B", "#E2C59F", "#B6C5CC", "#8E9CA3", "#556670", "#000000") 但是当我试图通过它没有发生 ggplot(mydata, aes(factor(phone_partner_products)), color = rhg_cols) + geom_bar()

如何在R中反转string

我试图教自己R和在做一些样本问题,我遇到需要扭转一个string。 这是我迄今为止所尝试的,但粘贴操作似乎没有任何影响。 必须有一些我不明白的名单? (我也不明白为什么我需要[[1]]在strsplit之后。) > test <- strsplit("greg", NULL)[[1]] > test [1] "g" "r" "e" "g" > test_rev <- rev(test) > test_rev [1] "g" "e" "r" "g" > paste(test_rev) [1] "g" "e" "r" "g"

如何让执行暂停,睡觉,等待R秒X秒?

如何暂停R脚本达到指定的秒数或毫秒数? 在很多语言中,都有一个sleep函数,但?sleep引用一个数据集。 而?pause和?wait不存在。 预期的目的是用于自定时animation。 所需的解决scheme工作,而不要求用户input。

插入缺失date/时间的行

我是R新手,但已经转向它来解决我正在尝试处理的大型数据集的问题。 目前我有4列的数据(Y值)设置对分钟间隔时间戳(月/日/年小时:分钟)(X值)如下: timestamp tr tt sr st 1 9/1/01 0:00 1.018269e+02 -312.8622 -1959.393 4959.828 2 9/1/01 0:01 1.023567e+02 -313.0002 -1957.755 4958.935 3 9/1/01 0:02 1.018857e+02 -313.9406 -1956.799 4959.938 4 9/1/01 0:03 1.025463e+02 -310.9261 -1957.347 4961.095 5 9/1/01 0:04 1.010228e+02 -311.5469 -1957.786 4959.078 我遇到的问题是缺less一些时间戳值 – 例如,9/1/01 0:13和9/1/01 0:27之间可能有差距,并通过数据集这种差距是不规则的。 我需要将这些系列中的几个放到同一个数据库中,并且因为每个系列的缺失值不同,所以date目前不在每一行上alignment。 我想为这些缺less的时间戳生成行,并填充空白值(没有数据,不是零)的Y列,以便我有一个连续的时间序列。 我真的不太确定从哪里开始(在我学习之前,并没有真正使用过R),但是任何帮助都是值得赞赏的。 我迄今为止安装了chron和动物园,因为它似乎可能是有用的。 谢谢!

如何安装R包github版本库的开发版本

我如何直接从github存储库安装正在开发的软件包,并且一旦安装后,如何在开发和CRAN版本之间切换? 我有兴趣从git安装的特定软件包是ggplot2。