Tag: r

R阅读压缩数据文件而不解压缩

我有一个非常大的zip文件,我正试图读取到R而不解压缩它像这样: temp <- tempfile("Sales", fileext=c("zip")) data <- read.table(unz(temp, "Sales.dat"), nrows=10, header=T, quote="\"", sep=",") Error in open.connection(file, "rt") : cannot open the connection In addition: Warning message: In open.connection(file, "rt") : cannot open zip file 'C:\Users\xxx\AppData\Local\Temp\RtmpyAM9jH\Sales13041760345azip'

用于R中大数据表的write.csv

我有一个data.table不是很大(2 GB),但由于某种原因write.csv需要很长时间才能写出来(我从来没有真正完成等待),似乎使用大量的RAM来做它。 我试图将data.table转换为data.table ,尽pipe这不应该做任何事情,因为data.table扩展data.frame 。 有没有人遇到过这个? 更重要的是,如果你用Ctrl – C来停止它,R似乎没有给回内存。

R mtcars数据集,“vs”variables的含义?

R中的“mtcars”数据集中的“vs”variables是什么意思? 帮助文件说这意味着“V / S”,但这不是启发。 命令: data(mtcars) head(mtcars) ?mtcars

R:R有没有像iPython的笔记本?

正如问题中提到的那样,iPython的R-CRAN的笔记本?

在Roxygen中logging时:如何在@details中创build分项列表?

例如,在@details部分中,将分项列表添加到roxygen2的适当语法是什么? 我可以创build一个乳胶列表环境吗? 看来,换行符简单地被忽略,即 #' @details text describing parameter inputs in more detail #' #' parameter 1: stuff #' #' parameter 2: stuff 谢谢!

R编译器是否存在?

我想知道部署R的最佳方式。Matlab有“matlab编译器”(MCR)。 对于将R编译为C或C ++的R,过去曾经有类似的讨论。 有没有人有任何使用由John Garvin在Rice开发的R到C编译器(RCC)的经验? 我研究过它,它似乎是编译R代码到可执行代码的唯一项目。 而据我所知,它还没有被使用。 [编辑1:] :要清楚,我知道有R和R(rJava,rcpp,Rpy等)的C和C ++(以及Java,Python等)接口。 我想知道具体的方式来编译和部署R代码,而无需事先安装R。 John Mellor-Crummey告诉我,他们还在RCC上工作,希望能在4个月左右(最早)提供。 如果我find其他东西,我会进一步更新。

获取函数名称作为string

假设我有一堆函数,每个函数都有类似MyFunction.1等。我想把这些函数传递给另一个函数,这个函数打印出一个小的报表。 理想情况下,我希望能够标记使用哪个函数生成结果的报告部分。 那么有没有什么好的方法来获取预定义函数的名称作为一个string?

在R中控制ggplot2中点的顺序?

假设我在R中的ggplot2中绘制了密集的散点图,其中每个点可以用不同的颜色标记: df <- data.frame(x=rnorm(500)) df$y = rnorm(500)*0.1 + df$x df$label <- c("a") df$label[50] <- "point" df$size <- 2 ggplot(df) + geom_point(aes(x=x, y=y, color=label, size=size)) 当我这样做时,标有“点”(绿色)的散点绘制在标有“a”的红色点上。 什么控制这个在ggplot中的zsorting,即什么控制哪个点在哪个顶部? 例如,如果我想让所有的“a”点位于所有标记为“point”的点上(意思是说它们有时会部分地或完全地隐藏那个点)呢? 这是否依赖于标签的字母数字顺序? 我想find一个解决scheme,可以很容易地转换为rpy2。 谢谢

从PDF文件中提取文本数据

是否有可能从R中的PDF文件parsing文本数据? 似乎没有这样的提取相关的包 ,但有任何人试图或看到这在R完成? 在Python中有PDFMiner ,但是如果可能的话 ,我想保留这个分析。 有什么build议么?

错误:ggplot2中的stat_count()

在我的许多程序中,我一直使用ggplot2来渲染图表。 我已经将它们加载到shinyapps.io上,它们工作得很好。 但是,当我尝试在我的机器上运行该程序时,出现以下错误: Error : stat_count() must not be used with ay aesthetic. 以下是示例代码: ggplot(hashtg, aes(x=reorder(hashtag, Freq), y = Freq, fill = hashtag)) + geom_bar(stat="identity") + geom_bar(width = 0.4) + xlab("Hashtags Used") + ylab("Number of responses") + geom_text(aes(label=Freq), hjust = 1, colour = "white" ) 实际的代码有很多条形图的参数,如标题,主题和注释,但是我想他们不会妨碍输出。 我使用的是汇总数据,其中代码中的Freq是特定术语的频率。 当我寻求帮助时,我重复得到了使用stat = "identity"作为条形图的指示。 任何帮助将不胜感激。 会话信息如下: R version 3.2.0 […]