Tag: r

如何根据子串匹配来selectR data.table行（一个像SQL一样）: 我有一个字符列data.table，并希望只select那些包含一个子string的行。等同于SQL WHERE x LIKE '%substring%' 例如 > Months = data.table(Name = month.name, Number = 1:12) > Months["mb" %in% Name] Empty data.table (0 rows) of 2 cols: Name,Number 我将如何select名称包含“MB”的行？

将R中的2个因子分组: 我有一列数据是A，B和C级别的因素，我有兴趣将这两个级别合并为一个因子，所以它会变成A和B，B = B和C，或者是一个新的variablesA和D，D = B和C.我可以想出很多方法来通过if语句循环遍历列，但我觉得应该有一个更优雅的方法，我想知道是否有人可以指向正确的方向。

从aov中提取p值: 我正在寻找提取R中anova产生的p值。这是我正在运行的： test <- aov(asq[,9] ~ asq[,187]) summary(test) 产量： Df Sum Sq Mean Sq F value Pr(>F) asq[, 187] 1 3.02 3.01951 12.333 0.0004599 *** Residuals 1335 326.85 0.24483 — Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 12 observations deleted due to missingness 当我看到一个结构，这是我所看到的。我通常可以通过列表来获得我所需要的东西，但是我很难用这个东西。谷歌search似乎也显示出比我更简单的结构。注意：ASQ是我的数据框。 str(test) […]

如何在R中将vector转换为matrix？: 我有一个有49个数值的向量。我想要一个7×7的数字matrix。是否有一些方便的自动转换语句我可以使用，或者我必须做7正确的向量子集的列分配到一个新的matrix？我希望有一些像c(myMatrix)相反的东西，当然可以给出我想要的行数和/或列数。

在data.frame中使用dplyr过滤全部案例（逐案删除）: 是否有可能使用dplyr过滤完整个案的data.frame？ complete.cases一个包含所有variables的列表。但是，这是a）详细的时候有很多的variables，b）当variables名称是不可知的（例如在一个函数，处理任何data.frame）。 library(dplyr) df = data.frame( x1 = c(1,2,3,NA), x2 = c(1,2,NA,5) ) df %.% filter(complete.cases(x1,x2))

在R中滚动连接data.table: 我想了解更多有关滚动连接工作的方式，并且有一些困惑，我希望有人能够为我澄清这一点。举一个具体的例子： dt1 <- data.table(id=rep(1:5, 10), t=1:50, val1=1:50, key="id,t") dt2 <- data.table(id=rep(1:5, 2), t=1:10, val2=1:10, key="id,t") 我期望这将产生一个长的data.table在dt2的价值滚动： dt1[dt2,roll=TRUE] 相反，正确的做法似乎是这样的： dt2[dt1,roll=TRUE] 有人可以向我解释更多关于如何joindata.table作品，因为我显然不能正确理解它。我认为dt1[dt2,roll=TRUE]对应于select * from dt1 right join dt2 on (dt1.id = dt2.id and dt1.t = dt2.t) sql的等价物，除了添加了locffunction。另外文档说： X[Y] is a join, looking up X's rows using Y (or Y's key if it has one) […]

自定义轴标签: 我有一个简单的geom_point图，其中xvariables是序数，取5个值（编码为1：5）。在图中，我想用5个相应的文本标签replace它。有没有可能在ggplot中做到这一点？

如何检测read.csv的正确编码？: 我有这个文件（http://b7hq6v.alterupload.com/en/），我想阅读R与read.csv 。但是我无法检测到正确的编码。这似乎是一种UTF-8。我在WindowsXP机器上使用R 2.12.1。任何帮助？

我怎样才能在这个散点图标记点？: 你能帮我把标签放在下面的图表上吗？我使用的代码是： valbanks<-scan("banks.txt", what=list(0,0,""), sep="", skip=1, comment.char="#") valbanks valj2007<-valbanks[[1]] valj2009<-valbanks[[2]] namebank<-valbanks[[3]] percent_losses<-(valj2009-valj2007)/valj2007 percent_losses abs_losses<-(valj2007-valj2009) abs_losses plot(abs_losses, percent_losses,main="Absolute Losses vs. Relative Losses(in%)",xlab="Losses (absolute, in miles of millions)",ylab="Losses relative (in % of January´2007 value",col="blue", pch = 19, cex = 1, lty = "solid", lwd = 2,text(percet_losses, abs_losses,namebank)) text(percet_losses, abs_losses,labels=namebank, cex= 0.7, offset = 10) 数据是： Value_Jan_2007 Value_Jan_2009 […]