Tag: r

R中的行名称和列名称: 下面的函数对产生完全相同的结果吗？ Pair 1） names() ＆ colnames() 对2） row.names()和row.names()

R：注释掉代码块: 可能重复： R：多行注释变通办法？我想在R中注释掉好几行代码。有什么办法可以不必在每行之前加一个＃有点像/* blocked out code */在SAS中/* blocked out code */ ？

用dplyr拟合几个回归模型: 我想使用dplyr为每个小时（因子variables）拟合一个模型，我得到一个错误，并且我不太确定有什么问题。 df.h <- data.frame( hour = factor(rep(1:24, each = 21)), price = runif(504, min = -10, max = 125), wind = runif(504, min = 0, max = 2500), temp = runif(504, min = – 10, max = 25) ) df.h <- tbl_df(df.h) df.h <- group_by(df.h, hour) group_size(df.h) # checks out, 21 obs. for each factor […]

R：如何让grep返回匹配，而不是整个string: 我有什么可能是一个真正愚蠢的问题在R问题。道歉，因为这似乎应该是如此容易 – 我显然只是失去了一些东西。我有一个string的vector，我们称之为alice 。一些alice打印出来如下： T.8EFF.SP.OT1.D5.VSVOVA#4 T.8EFF.SP.OT1.D6.LISOVA#1 T.8EFF.SP.OT1.D6.LISOVA#2 T.8EFF.SP.OT1.D6.LISOVA#3 T.8EFF.SP.OT1.D6.VSVOVA#4 T.8EFF.SP.OT1.D8.VSVOVA#3 T.8EFF.SP.OT1.D8.VSVOVA#4 T.8MEM.SP#1 T.8MEM.SP#3 T.8MEM.SP.OT1.D106.VSVOVA#2 T.8MEM.SP.OT1.D45.LISOVA#1 T.8MEM.SP.OT1.D45.LISOVA#3 我希望grep给出在这些string中出现的D之后的数字，条件是包含“LIS”的string和空string或其他。我希望grep能够给我一个捕获组的价值，而不是整个string。这是我的R风味的正则expression式： pattern <- (?<=\\.D)([0-9]+)(?=.LIS) 没有太复杂。但为了得到我所追求的，而不是仅仅使用grep(pattern, alice, value = TRUE, perl = TRUE)我正在做下面这些，看起来很糟糕： reg.out <- regexpr( "(?<=\\.D)[0-9]+(?=.LIS)", alice, perl=TRUE ) substr(alice,reg.out,reg.out + attr(reg.out,"match.length")-1) 现在看来，这看起来不是太难看，但是为了使这件事情变得琐碎起来，搞得一塌糊涂，实在令人尴尬。任何人有关如何正确地去做这个指针？奖金标志指向我的网页，解释我与$ ， @和attr访问之间的区别。

如何从剪贴板复制和粘贴数据到R中？: 标题说明了一切：我的数据在另一个应用程序中打开（例如电子表格，如Excel或文本编辑器）。如果我将这些数据复制到我的操作系统剪贴板，我怎样才能读取到R作为data.frame？

常见问题标记为R数据结构: 我正在阅读texinfo中的R FAQ源代码，并认为如果它被parsing为R结构，pipe理和扩展会更容易。有几个现有的例子与此相关：财富包 bibtex条目 Rd文件每个都有一些理想的特征。在我看来，常见问题在R社区中使用不足，因为他们缺乏：（1）通过R命令行（即通过R包）轻松访问; ii）强大的searchfunction; iii）交叉引用; 四）提供的软件包的扩展。从包装的bibtex和fortunes绘制想法，我们可以构想一个新的系统，其中：可以从R中search常见问题。典型的调用类似fortune()接口： faq("lattice print") ，或者faq() #surprise me! ， faq(51) ， faq(package="ggplot2") 。包可以提供自己的FAQ.rda ，其格式尚不清楚（见下文） Sweave / knitr驱动程序可以输出格式良好的Markdown / LaTeX等。题但是我不确定什么是最好的input格式。无论是转换现有的常见问题，或添加新的条目。使用R语法与嵌套列表树（或特殊的S3 / S4 / ref class或structure ， \list(title = "Something to be \\escaped", entry = "long text with quotes, links and […]

如何使用source（'myfile.r'）来源化R Markdown文件？: 我经常有一个主要的R Markdown文件或者编辑LaTeX文件，我从其他R文件（例如，用于数据处理）中获取source文件。但是，我认为在某些情况下，将这些源文件作为自己的可再生文档（例如，R Markdown文件不仅包括用于数据处理的命令，而且还产生解释数据处理的可重现文档决定）。因此，我想在我的主R Markdown文件中有一个类似source('myfile.rmd')的命令。这将提取和源代码myfile.rmd的R代码块内的所有R代码。当然，这会导致错误。以下命令工作： “`{r message=FALSE, results='hide'} knit('myfile.rmd', tangle=TRUE) source('myfile.R') “` 如果需要输出， results='hide'可以省略。即，knitr将myfile.rmd的R代码输出到myfile.R 。但是，这似乎并不完美：它会导致创build一个额外的文件如果需要控制显示，它需要出现在它自己的代码块中。它不像简单的source(…)那样优雅。因此，我的问题：是否有一个更优雅的方式来源R R Markdown文件的R代码？

如何在ggplot2中移动或定位图例: 我正在试图创build一个ggplot2阴谋与图下的传说。 ggplot2书上第112页说：“图例的位置和理由由主题设置legend.position控制，值可以是右，左，上，下，无（无图例）或数字位置”。下面的代码可以工作（因为“right”是默认的），它也可以作为图例位置使用“none”，但是“left”，“top”，“bottom”，全部失败，出现“Error in grid.Call .graphics（“L_setviewport”，pvp，TRUE）：视口的非有限位置和/或大小“ library(ggplot2) (myDat <- data.frame(cbind(VarX=10:1, VarY=runif(10)), Descrip=sample(LETTERS[1:3], 10, replace=TRUE))) qplot(VarX,VarY, data=myDat, shape=Descrip) + opts(legend.position="right") 我究竟做错了什么？重新定位一个传奇必定非常普遍，所以我认为这是我。

如何控制write.table（）输出中的小数位数？: 处理数据时（例如，在data.frame中），用户可以通过使用控制显示数字 options(digits=3) 并像这样列出data.frame。 ttf.all 当用户需要像这样将数据粘贴到Excell中 write.table(ttf.all, 'clipboard', sep='\t',row.names=F) 数字参数被忽略，数字不被舍入。看到很好的输出 > ttf.all year V1.xx V1.yx ratio1 V1.xy V1.yy ratioR V1.xx V1.yx ratioAL V1.xy V1.yy ratioRL 1 2006 227 645 35.2 67 645 10.4 150 645 23.3 53 645 8.22 2 2007 639 1645 38.8 292 1645 17.8 384 1645 23.3 137 1645 8.33 3 2008 […]

在ggplot2中使用facet_wrap和scales =“free”来设置单独的轴限制: 我正在创build一个分面图，用预测值与残差图并排查看预测值与实际值。我将使用shiny来帮助探索使用不同的训练参数进行build模的结果。我用85％的数据训练模型，testing其余的15％，并重复这5次，每次收集实际/预测值。计算残差后，我的data.frame如下所示： head(results) act pred resid 2 52.81000 52.86750 -0.05750133 3 44.46000 42.76825 1.69175252 4 54.58667 49.00482 5.58184181 5 36.23333 35.52386 0.70947731 6 53.22667 48.79429 4.43237981 7 41.72333 41.57504 0.14829173 我想要的是： pred与act和pred与resid并排情节 pred与pred的x / y范围/限制是相同的，理想情况下从min(min(results$act), min(results$pred))到max(max(results$act), max(results$pred)) pred与resid的x / y范围/限制不会受到我对实际vs.预测图表的影响。仅对预测值绘制x并且仅绘制剩余范围的y是很好的。为了同时查看这两个图，我将数据融化： library(reshape2) plot <- melt(results, id.vars = "pred") 现在绘制： library(ggplot2) p <- […]