Tag: r

在Rmarkdown /编织隐藏R代码,只是显示结果

在我的R markdown代码中,我有时只想生成一个报告而不显示实际的代码(特别是当我把它发送给我的老板的时候)。 我怎样才能隐藏R代码,只显示graphics和结果 例如 “`{r fig.width=7, fig.height=6} a<-as.numeric(some data) hist(a, breaks=24) “` 显示命令和直方图。 我怎样才能从我的HTML报告中删除命令?

什么是R的Excel中的LEFT()和RIGHT()?

容易如此: a <- paste('left', 'right', sep = '') > a [1] "leftright" 现在让我想要产生一个bstring,它等于b的前4个字母,也就是说 > b [1] "left" 我该怎么办?

R的Windows文本编辑器的build议

对R的一个好的Windows文本编辑器的任何build议? 我一直在使用Tinn-R ,并且工作得相当好,但是很想知道别人用什么。

如何在用ggplot绘图时抑制警告

当把缺失值传递给ggplot的时候,它非常友善,并警告我们他们在场。 在交互式会话中这是可以接受的,但是在编写报告时,输出不会混杂在警告中,特别是在有很多警告的时候。 下面的例子有一个标签丢失,这会产生一个警告。 library(ggplot2) library(reshape2) mydf <- data.frame( species = sample(c("A", "B"), 100, replace = TRUE), lvl = factor(sample(1:3, 100, replace = TRUE)) ) labs <- melt(with(mydf, table(species, lvl))) names(labs) <- c("species", "lvl", "value") labs[3, "value"] <- NA ggplot(mydf, aes(x = species)) + stat_bin() + geom_text(data = labs, aes(x = species, y = value, label […]

两个向量的欧几里得距离

我如何find两个向量的欧几里德距离: x1 <- rnorm(30) x2 <- rnorm(30)

情节传说没有边界和白色背景

我在一个情节中有一个传说(从一个基本语句)经过它。 我怎样才能实现在传说附近隐藏的abline? 这应该可以通过设置图例背景白色,没有边界,但我怎么能做到这一点? 假设图表应该是这样的: windows.options(width=30, height=12) plot(1:10) abline(v=seq(1,10,1), col='grey', lty='dotted') legend(4.8, 3, "This legend text should not be disturbed by the dotted grey lines") 如果图例干扰点图的点:我怎样才能实现在图例附近的图例变得不可见(如上),但点仍然可见? windows.options(width=30, height=12) plot(1:10) abline(v=seq(1,10,1), col='grey', lty='dotted') legend(1, 5, "This legend text should not be disturbed by the dotted grey lines, but the plotted dots should still be visible") 最后:有没有办法在图例中引入换行符?

R:删除vector的最后一个元素

我怎样才能删除动物园系列的最后100个元素? 我知道这个名字[-element]符号,但是我不能完成这个工作来减less一个完整的部分

使用group_by(多个variables)时dplyr问题

我想开始使用dplyr来代替ddply,但是我无法得到它是如何工作的(我已阅读文档)。 例如,为什么当我尝试mutate()时,“group_by”函数不工作,因为它应该? 看mtcars: 库(车) 说我做了一个data.frame这是一个mtcars总结,分为“cyl”和“齿轮”: df1 <- mtcars %.% group_by(cyl, gear) %.% summarise( newvar = sum(wt) ) 然后说我想进一步总结这个数据框。 使用ddply,这将是直接的,但是当我尝试使用dplyr时,它实际上并不是“按…分组”: df2 <- df1 %.% group_by(cyl) %.% mutate( newvar2 = newvar + 5 ) 仍产生一个未分组的输出: cyl gear newvar newvar2 1 6 3 6.675 11.675 2 4 4 19.025 24.025 3 6 4 12.375 17.375 4 6 5 […]

R定义空白数据框的尺寸

我试图从一个数据集的多个子集收集一些数据,并需要创build一个数据框来收集结果。 我的问题是不知道如何创build一个定义数量的列的空白数据框,而实际上没有数据放入它。 collect1 <- c() ## i'd like to create empty df w/ 3 columns: `id`, `max1` and `min1` for(i in 1:10){ collect1$id <- i ss1 <- subset(df1, df1$id == i) collect1$max1 <- max(ss1$value) collect1$min1 <- min(ss1$value) } 我觉得这个问题非常愚蠢(我几乎觉得我以前曾经问过这个问题,但找不到它),但是非常感谢任何帮助。

pandas.apply并行化的状态()

在过去的几年中,有几篇文章涉及到pandas.apply()的parallelization ,或者是描述可以通过将数据结构化为数据pandas.apply()来解决的问题,以及如果实现了parallelization ,使用pandas.apply() 。 我向这里的专家们提出这个问题,这个能力的状态是什么, R已经有了这个能力。 目前没有干净的标准解决scheme。 重新编写整个函数和脚本来处理build议的解决方法是非常繁琐的。 Pythonpandas多处理应用 并行化后,pandasgroupby R中的并行和多核处理 Python多处理pool.map多个参数 在Python中的并行处理 通过multiprocessing.pool.map传递kwargs 传递参数和manager.dict在Python 2.7中的多处理 有没有一个简单的基于进程的python平行映射? pandas与rpy2和多处理 如何通过Sparkasynchronous地将函数应用于数据框的子集? 高效地将一个函数应用到分组的pandasDataFrame上 python dask DataFrame,支持(trivially parallelizable)row apply? Python多处理作业Celery任务,但AttributeError 在pandas python中并行化应用函数 在groupby上工作