Tag: r

如何根据子串匹配来selectR data.table行(一个像SQL一样)

我有一个字符列data.table,并希望只select那些包含一个子string的行。 等同于SQL WHERE x LIKE '%substring%' 例如 > Months = data.table(Name = month.name, Number = 1:12) > Months["mb" %in% Name] Empty data.table (0 rows) of 2 cols: Name,Number 我将如何select名称包含“MB”的行?

将R中的2个因子分组

我有一列数据是A,B和C级别的因素,我有兴趣将这两个级别合并为一个因子,所以它会变成A和B,B = B和C,或者是一个新的variablesA和D,D = B和C.我可以想出很多方法来通过if语句循环遍历列,但我觉得应该有一个更优雅的方法,我想知道是否有人可以指向正确的方向。

从aov中提取p值

我正在寻找提取R中anova产生的p值。 这是我正在运行的: test <- aov(asq[,9] ~ asq[,187]) summary(test) 产量: Df Sum Sq Mean Sq F value Pr(>F) asq[, 187] 1 3.02 3.01951 12.333 0.0004599 *** Residuals 1335 326.85 0.24483 — Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 12 observations deleted due to missingness 当我看到一个结构,这是我所看到的。 我通常可以通过列表来获得我所需要的东西,但是我很难用这个东西。 谷歌search似乎也显示出比我更简单的结构。 注意:ASQ是我的数据框。 str(test) […]

如何在R中将vector转换为matrix?

我有一个有49个数值的向量。 我想要一个7×7的数字matrix。 是否有一些方便的自动转换语句我可以使用,或者我必须做7正确的向量子集的列分配到一个新的matrix? 我希望有一些像c(myMatrix)相反的东西,当然可以给出我想要的行数和/或列数。

在data.frame中使用dplyr过滤全部案例(逐案删除)

是否有可能使用dplyr过滤完整个案的data.frame? complete.cases一个包含所有variables的列表。 但是,这是a)详细的时候有很多的variables,b)当variables名称是不可知的(例如在一个函数,处理任何data.frame)。 library(dplyr) df = data.frame( x1 = c(1,2,3,NA), x2 = c(1,2,NA,5) ) df %.% filter(complete.cases(x1,x2))

在R中滚动连接data.table

我想了解更多有关滚动连接工作的方式,并且有一些困惑,我希望有人能够为我澄清这一点。 举一个具体的例子: dt1 <- data.table(id=rep(1:5, 10), t=1:50, val1=1:50, key="id,t") dt2 <- data.table(id=rep(1:5, 2), t=1:10, val2=1:10, key="id,t") 我期望这将产生一个长的data.table在dt2的价值滚动: dt1[dt2,roll=TRUE] 相反,正确的做法似乎是这样的: dt2[dt1,roll=TRUE] 有人可以向我解释更多关于如何joindata.table作品,因为我显然不能正确理解它。 我认为dt1[dt2,roll=TRUE]对应于select * from dt1 right join dt2 on (dt1.id = dt2.id and dt1.t = dt2.t) sql的等价物,除了添加了locffunction。 另外文档说: X[Y] is a join, looking up X's rows using Y (or Y's key if it has one) […]

自定义轴标签

我有一个简单的geom_point图,其中xvariables是序数,取5个值(编码为1:5)。 在图中,我想用5个相应的文本标签replace它。 有没有可能在ggplot中做到这一点?

ggplot2备忘单

有很多一般的R作弊表 ,但是有没有ggplot2的作弊表?

如何检测read.csv的正确编码?

我有这个文件(http://b7hq6v.alterupload.com/en/),我想阅读R与read.csv 。 但是我无法检测到正确的编码。 这似乎是一种UTF-8。 我在WindowsXP机器上使用R 2.12.1。 任何帮助?

我怎样才能在这个散点图标记点?

你能帮我把标签放在下面的图表上吗? 我使用的代码是: valbanks<-scan("banks.txt", what=list(0,0,""), sep="", skip=1, comment.char="#") valbanks valj2007<-valbanks[[1]] valj2009<-valbanks[[2]] namebank<-valbanks[[3]] percent_losses<-(valj2009-valj2007)/valj2007 percent_losses abs_losses<-(valj2007-valj2009) abs_losses plot(abs_losses, percent_losses,main="Absolute Losses vs. Relative Losses(in%)",xlab="Losses (absolute, in miles of millions)",ylab="Losses relative (in % of January´2007 value",col="blue", pch = 19, cex = 1, lty = "solid", lwd = 2,text(percet_losses, abs_losses,namebank)) text(percet_losses, abs_losses,labels=namebank, cex= 0.7, offset = 10) 数据是: Value_Jan_2007 Value_Jan_2009 […]