Tag: r

R中的行名称和列名称

下面的函数对产生完全相同的结果吗? Pair 1) names() & colnames() 对2) row.names()和row.names()

R:注释掉代码块

可能重复: R:多行注释变通办法? 我想在R中注释掉好几行代码。有什么办法可以不必在每行之前加一个#有点像/* blocked out code */在SAS中/* blocked out code */ ?

用dplyr拟合几个回归模型

我想使用dplyr为每个小时(因子variables)拟合一个模型,我得到一个错误,并且我不太确定有什么问题。 df.h <- data.frame( hour = factor(rep(1:24, each = 21)), price = runif(504, min = -10, max = 125), wind = runif(504, min = 0, max = 2500), temp = runif(504, min = – 10, max = 25) ) df.h <- tbl_df(df.h) df.h <- group_by(df.h, hour) group_size(df.h) # checks out, 21 obs. for each factor […]

R:如何让grep返回匹配,而不是整个string

我有什么可能是一个真正愚蠢的问题在R问题。 道歉,因为这似乎应该是如此容易 – 我显然只是失去了一些东西。 我有一个string的vector,我们称之为alice 。 一些alice打印出来如下: T.8EFF.SP.OT1.D5.VSVOVA#4 T.8EFF.SP.OT1.D6.LISOVA#1 T.8EFF.SP.OT1.D6.LISOVA#2 T.8EFF.SP.OT1.D6.LISOVA#3 T.8EFF.SP.OT1.D6.VSVOVA#4 T.8EFF.SP.OT1.D8.VSVOVA#3 T.8EFF.SP.OT1.D8.VSVOVA#4 T.8MEM.SP#1 T.8MEM.SP#3 T.8MEM.SP.OT1.D106.VSVOVA#2 T.8MEM.SP.OT1.D45.LISOVA#1 T.8MEM.SP.OT1.D45.LISOVA#3 我希望grep给出在这些string中出现的D之后的数字,条件是包含“LIS”的string和空string或其他。 我希望grep能够给我一个捕获组的价值,而不是整个string。 这是我的R风味的正则expression式: pattern <- (?<=\\.D)([0-9]+)(?=.LIS) 没有太复杂。 但为了得到我所追求的,而不是仅仅使用grep(pattern, alice, value = TRUE, perl = TRUE)我正在做下面这些,看起来很糟糕: reg.out <- regexpr( "(?<=\\.D)[0-9]+(?=.LIS)", alice, perl=TRUE ) substr(alice,reg.out,reg.out + attr(reg.out,"match.length")-1) 现在看来,这看起来不是太难看,但是为了使这件事情变得琐碎起来,搞得一塌糊涂,实在令人尴尬。 任何人有关如何正确地去做这个指针? 奖金标志指向我的网页,解释我与$ , @和attr访问之间的区别。

如何从剪贴板复制和粘贴数据到R中?

标题说明了一切:我的数据在另一个应用程序中打开(例如电子表格,如Excel或文本编辑器)。 如果我将这些数据复制到我的操作系统剪贴板,我怎样才能读取到R作为data.frame?

常见问题标记为R数据结构

我正在阅读texinfo中的R FAQ源代码 ,并认为如果它被parsing为R结构,pipe理和扩展会更容易。 有几个现有的例子与此相关: 财富包 bibtex条目 Rd文件 每个都有一些理想的特征。 在我看来,常见问题在R社区中使用不足,因为他们缺乏:(1)通过R命令行(即通过R包)轻松访问; ii)强大的searchfunction; iii)交叉引用; 四)提供的软件包的扩展。 从包装的bibtex和fortunes绘制想法,我们可以构想一个新的系统,其中: 可以从R中search常见问题。典型的调用类似fortune()接口: faq("lattice print") ,或者faq() #surprise me! , faq(51) , faq(package="ggplot2") 。 包可以提供自己的FAQ.rda ,其格式尚不清楚(见下文) Sweave / knitr驱动程序可以输出格式良好的Markdown / LaTeX等。 题 但是我不确定什么是最好的input格式。 无论是转换现有的常见问题,或添加新的条目。 使用R语法与嵌套列表树(或特殊的S3 / S4 / ref class或structure , \list(title = "Something to be \\escaped", entry = "long text with quotes, links and […]

如何使用source('myfile.r')来源化R Markdown文件?

我经常有一个主要的R Markdown文件或者编辑LaTeX文件,我从其他R文件(例如,用于数据处理)中获取source文件。 但是,我认为在某些情况下,将这些源文件作为自己的可再生文档(例如,R Markdown文件不仅包括用于数据处理的命令,而且还产生解释数据处理的可重现文档决定)。 因此,我想在我的主R Markdown文件中有一个类似source('myfile.rmd')的命令。 这将提取和源代码myfile.rmd的R代码块内的所有R代码。 当然,这会导致错误。 以下命令工作: “`{r message=FALSE, results='hide'} knit('myfile.rmd', tangle=TRUE) source('myfile.R') “` 如果需要输出, results='hide'可以省略。 即,knitr将myfile.rmd的R代码输出到myfile.R 。 但是,这似乎并不完美: 它会导致创build一个额外的文件 如果需要控制显示,它需要出现在它自己的代码块中。 它不像简单的source(…)那样优雅。 因此,我的问题: 是否有一个更优雅的方式来源R R Markdown文件的R代码?

如何在ggplot2中移动或定位图例

我正在试图创build一个ggplot2阴谋与图下的传说。 ggplot2书上第112页说:“图例的位置和理由由主题设置legend.position控制,值可以是右,左,上,下,无(无图例)或数字位置”。 下面的代码可以工作(因为“right”是默认的),它也可以作为图例位置使用“none”,但是“left”,“top”,“bottom”,全部失败,出现“Error in grid.Call .graphics(“L_setviewport”,pvp,TRUE):视口的非有限位置和/或大小“ library(ggplot2) (myDat <- data.frame(cbind(VarX=10:1, VarY=runif(10)), Descrip=sample(LETTERS[1:3], 10, replace=TRUE))) qplot(VarX,VarY, data=myDat, shape=Descrip) + opts(legend.position="right") 我究竟做错了什么? 重新定位一个传奇必定非常普遍,所以我认为这是我。

如何控制write.table()输出中的小数位数?

处理数据时(例如,在data.frame中),用户可以通过使用控制显示数字 options(digits=3) 并像这样列出data.frame。 ttf.all 当用户需要像这样将数据粘贴到Excell中 write.table(ttf.all, 'clipboard', sep='\t',row.names=F) 数字参数被忽略,数字不被舍入。 看到很好的输出 > ttf.all year V1.xx V1.yx ratio1 V1.xy V1.yy ratioR V1.xx V1.yx ratioAL V1.xy V1.yy ratioRL 1 2006 227 645 35.2 67 645 10.4 150 645 23.3 53 645 8.22 2 2007 639 1645 38.8 292 1645 17.8 384 1645 23.3 137 1645 8.33 3 2008 […]

在ggplot2中使用facet_wrap和scales =“free”来设置单独的轴限制

我正在创build一个分面图,用预测值与残差图并排查看预测值与实际值。 我将使用shiny来帮助探索使用不同的训练参数进行build模的结果。 我用85%的数据训练模型,testing其余的15%,并重复这5次,每次收集实际/预测值。 计算残差后,我的data.frame如下所示: head(results) act pred resid 2 52.81000 52.86750 -0.05750133 3 44.46000 42.76825 1.69175252 4 54.58667 49.00482 5.58184181 5 36.23333 35.52386 0.70947731 6 53.22667 48.79429 4.43237981 7 41.72333 41.57504 0.14829173 我想要的是: pred与act和pred与resid并排情节 pred与pred的x / y范围/限制是相同的,理想情况下从min(min(results$act), min(results$pred))到max(max(results$act), max(results$pred)) pred与resid的x / y范围/限制不会受到我对实际vs.预测图表的影响。 仅对预测值绘制x并且仅绘制剩余范围的y是很好的。 为了同时查看这两个图,我将数据融化: library(reshape2) plot <- melt(results, id.vars = "pred") 现在绘制: library(ggplot2) p <- […]