Tag: r

增加轴刻度的数量: 我正在为某些数据生成图表，但滴答的数量太小，我需要读取更精确。有没有办法增加在ggplot2轴蜱的数量？我知道我可以告诉ggplot使用vector作为坐标轴，但是我想要的是增加所有数据的滴答数。换句话说，我想从数据中计算滴答数。可能ggplot做一些内部algorithm，但我找不到它是如何做，根据我想要改变。

在ggplot2中旋转和间隔轴标签: 我有一个情节，其中X轴是标签很长的因素。虽然可能不是一个理想的可视化，现在我想旋转这些标签是垂直的。我已经用下面的代码弄清楚了这一部分，但正如你所看到的那样，标签并不是完全可见的。 data(diamonds) diamonds$cut <- paste("Super Dee-Duper",as.character(diamonds$cut)) q <- qplot(cut,carat,data=diamonds,geom="boxplot") q + opts(axis.text.x=theme_text(angle=-90))

确定链接在一起的链接剧集的组: 把这个简单的链接ID数据框： test <- data.frame(id1=c(10,10,1,1,24,8),id2=c(1,36,24,45,300,11)) > test id1 id2 1 10 1 2 10 36 3 1 24 4 1 45 5 24 300 6 8 11 我现在想把所有链接的ID组合在一起。通过“链接”，我的意思是沿着链接链接，使一个组中的所有ID都被标记在一起。一种分支结构。即： Group 1 10 –> 1, 1 –> (24,45) 24 –> 300 300 –> NULL 45 –> NULL 10 –> 36, 36 –> NULL, Final group […]

在data.frame或matrix中加上行: 我是新手，一直在寻找过去一个小时如何在R做一个简单的function。我有一个非常大的数据框与行作为观察和列作为遗传标记。我想创build一个新的列，其中包含使用R的每个观察select列数的总和。如果我有200列和100行，我想要创build一个新的列有100行，并说列43至167的总和。列有1或0.与新列包含每个排，我将能够sorting遗传标记最多的个体。我觉得这是接近的东西： data$new=sum(data$[,43:167])

从R中的.5进行整理: 是的，我知道为什么我们总是凑到最接近的偶数，如果我们在两个数字的中间（即2.5变成2）。但是当我想要评估某些人的数据时，他们不想要这种行为。什么是最简单的方法来得到这个： x <- seq(0.5,9.5,by=1) round(x) 为1,2,3，…，10而不是0,2,2,4,4，…，10。编辑：要清除：1.4999四舍五入后应为1。（我认为这将是显而易见的）

发生数据丢失时geom_bar的宽度一致: 有没有办法在下面的时间序列例子中丢失数据时为geom_bar()设置一个固定的宽度？我已经尝试在aes()设置width ，但没有运气。比较2011年5月11日至6月11日在代码示例下方的阴影宽度。 colours <- c("#FF0000", "#33CC33", "#CCCCCC", "#FFA500", "#000000" ) iris$Month <- rep(seq(from=as.Date("2011-01-01"), to=as.Date("2011-10-01"), by="month"), 15) colours <- c("#FF0000", "#33CC33", "#CCCCCC", "#FFA500", "#000000" ) iris$Month <- rep(seq(from=as.Date("2011-01-01"), to=as.Date("2011-10-01"), by="month"), 15) d<-aggregate(iris$Sepal.Length, by=list(iris$Month, iris$Species), sum) d$quota<-seq(from=2000, to=60000, by=2000) colnames(d) <- c("Month", "Species", "Sepal.Width", "Quota") d$Sepal.Width<-d$Sepal.Width * 1000 g1 <- ggplot(data=d, aes(x=Month, y=Quota, color="Quota")) + […]

使用VBA在excel中融化/重塑？: 我正在调整一个新的工作，我与同事分享的大部分工作都是通过MS Excel进行的。我经常使用数据透视表，因此需要“堆叠”的数据，就是我为此所依赖的R中reshape （reshape2）包中的melt()函数的输出。任何人都可以让我开始在VBAmacros来完成这个，还是已经存在？ macros观纲要是：在Excel工作簿中select一个单元格范围。开始“融化”的macros。 macros将创build一个提示，“inputID列的数量”，在那里你可以input识别信息的前几列。（例如下面的R代码是4）。在标题为“melt”的excel文件中创build一个新的工作表，用于堆叠数据，并创build一个名为“variable”的新列，与原始select的数据列标题相同。换句话说，输出看起来和R中简单执行这两行的输出完全一样： require(reshape) melt(your.unstacked.dataframe, id.vars = 1:4) 这是一个例子： # unstacked data > df1 Year Month Country Sport No_wins No_losses High_score Total_games 2 2010 5 USA Soccer 4 3 5 9 3 2010 6 USA Soccer 5 3 4 8 4 2010 5 CAN Soccer 2 […]

如何使用具有双y轴ggplot的构面: 我一直试图从这里扩展我的scheme，以利用方面（特别是facet_grid() ）。我已经看到这个例子，但是我似乎无法得到它为我的geom_bar()和geom_point()组合。我试图使用从facet_wrap更改为facet_wrap的示例代码，这似乎也使第一个层不显示。当谈到栅格和栅格时，我是一个新手，所以如果有人能够给出一些指导，让我们看看如何让P1显示左边的y轴，P2显示在右边的y轴上，那将是非常棒的。数据 library(ggplot2) library(gtable) library(grid) library(data.table) library(scales) grid.newpage() dt.diamonds <- as.data.table(diamonds) d1 <- dt.diamonds[,list(revenue = sum(price), stones = length(price)), by=c("clarity","cut")] setkey(d1, clarity,cut) p1＆p2 p1 <- ggplot(d1, aes(x=clarity,y=revenue, fill=cut)) + geom_bar(stat="identity") + labs(x="clarity", y="revenue") + facet_grid(. ~ cut) + scale_y_continuous(labels=dollar, expand=c(0,0)) + theme(axis.text.x = element_text(angle = 90, hjust = 1), axis.text.y […]

将颜色和形状的图例组合成一个图例: 我从2 x 2研究devise创buildggplot情节，并希望使用2种颜色和2个符号来分类我的4个不同的治疗组合。目前我有2个传说，一个是颜色，一个是两个形状。我怎样才能将它们组合成一个单独的图例，所以我有一个蓝色圆圈，一个红色圆圈，一个蓝色三angular形和一个读取三angular形？一些数据： state1 <- c(rep(c(rep("N", 7), rep("Y", 7)), 2)) year <- rep(c(2003:2009), 4) group1 <- c(rep("C", 14), rep("E", 14)) group2 <- paste(state1, group1, sep = "") beta <- c(0.16,0.15,0.08,0.08,0.18,0.48,0.14,0.19,0.00,0.00,0.04,0.08,0.27,0.03,0.11,0.12,0.09,0.09,0.10,0.19,0.16,0.00,0.11,0.07,0.08,0.09,0.19,0.10) lcl <- c(0.13,0.12,0.05,0.05,0.12,0.35,0.06,0.13,0.00,0.00,0.01,0.04,0.20,0.00,0.09,0.09,0.06,0.06,0.07,0.15,0.11,0.00,0.07,0.03,0.05,0.06,0.15,0.06) ucl <- c(0.20,0.20,0.13,0.14,0.27,0.61,0.28,0.27,0.00,1.00,0.16,0.16,0.36,0.82,0.14,0.15,0.13,0.13,0.15,0.23,0.21,0.00,0.15,0.14,0.12,0.12,0.23,0.16) data <- data.frame(state1,year,group1,group2,beta,lcl,ucl) 情节： library(ggplot2) pd <- position_dodge(.65) ggplot(data = data, aes(x = year, y = […]

在R数据框中查找重复行重复的次数: 我有一个像下面的例子一样的数据框 a = c(1, 1, 1, 2, 2, 3, 4, 4) b = c(3.5, 3.5, 2.5, 2, 2, 1, 2.2, 7) df <-data.frame(a,b) 我可以通过下面的代码从R数据框中删除重复的行，但我怎样才能find每个重复的行重复多less次？我需要结果作为一个向量。 unique(df) 要么 df[!duplicated(df), ]