Tag: r

增加轴刻度的数量

我正在为某些数据生成图表,但滴答的数量太小,我需要读取更精确 。 有没有办法增加在ggplot2轴蜱的数量? 我知道我可以告诉ggplot使用vector作为坐标轴,但是我想要的是增加所有数据的滴答数。 换句话说,我想从数据中计算滴答数。 可能ggplot做一些内部algorithm,但我找不到它是如何做,根据我想要改变。

在ggplot2中旋转和间隔轴标签

我有一个情节,其中X轴是标签很长的因素。 虽然可能不是一个理想的可视化,现在我想旋转这些标签是垂直的。 我已经用下面的代码弄清楚了这一部分,但正如你所看到的那样,标签并不是完全可见的。 data(diamonds) diamonds$cut <- paste("Super Dee-Duper",as.character(diamonds$cut)) q <- qplot(cut,carat,data=diamonds,geom="boxplot") q + opts(axis.text.x=theme_text(angle=-90))

确定链接在一起的链接剧集的组

把这个简单的链接ID数据框: test <- data.frame(id1=c(10,10,1,1,24,8),id2=c(1,36,24,45,300,11)) > test id1 id2 1 10 1 2 10 36 3 1 24 4 1 45 5 24 300 6 8 11 我现在想把所有链接的ID组合在一起。 通过“链接”,我的意思是沿着链接链接,使一个组中的所有ID都被标记在一起。 一种分支结构。 即: Group 1 10 –> 1, 1 –> (24,45) 24 –> 300 300 –> NULL 45 –> NULL 10 –> 36, 36 –> NULL, Final group […]

在data.frame或matrix中加上行

我是新手,一直在寻找过去一个小时如何在R做一个简单的function。 我有一个非常大的数据框与行作为观察和列作为遗传标记。 我想创build一个新的列,其中包含使用R的每个观察select列数的总和。 如果我有200列和100行,我想要创build一个新的列有100行,并说列43至167的总和。列有1或0.与新列包含每个排,我将能够sorting遗传标记最多的个体。 我觉得这是接近的东西: data$new=sum(data$[,43:167])

从R中的.5进行整理

是的,我知道为什么我们总是凑到最接近的偶数,如果我们在两个数字的中间(即2.5变成2)。 但是当我想要评估某些人的数据时,他们不想要这种行为。 什么是最简单的方法来得到这个: x <- seq(0.5,9.5,by=1) round(x) 为1,2,3,…,10而不是0,2,2,4,4,…,10。 编辑:要清除:1.4999四舍五入后应为1。 (我认为这将是显而易见的)

发生数据丢失时geom_bar的宽度一致

有没有办法在下面的时间序列例子中丢失数据时为geom_bar()设置一个固定的宽度? 我已经尝试在aes()设置width ,但没有运气。 比较2011年5月11日至6月11日在代码示例下方的阴影宽度。 colours <- c("#FF0000", "#33CC33", "#CCCCCC", "#FFA500", "#000000" ) iris$Month <- rep(seq(from=as.Date("2011-01-01"), to=as.Date("2011-10-01"), by="month"), 15) colours <- c("#FF0000", "#33CC33", "#CCCCCC", "#FFA500", "#000000" ) iris$Month <- rep(seq(from=as.Date("2011-01-01"), to=as.Date("2011-10-01"), by="month"), 15) d<-aggregate(iris$Sepal.Length, by=list(iris$Month, iris$Species), sum) d$quota<-seq(from=2000, to=60000, by=2000) colnames(d) <- c("Month", "Species", "Sepal.Width", "Quota") d$Sepal.Width<-d$Sepal.Width * 1000 g1 <- ggplot(data=d, aes(x=Month, y=Quota, color="Quota")) + […]

使用VBA在excel中融化/重塑?

我正在调整一个新的工作,我与同事分享的大部分工作都是通过MS Excel进行的。 我经常使用数据透视表,因此需要“堆叠”的数据,就是我为此所依赖的R中reshape (reshape2)包中的melt()函数的输出。 任何人都可以让我开始在VBAmacros来完成这个,还是已经存在? macros观纲要是: 在Excel工作簿中select一个单元格范围。 开始“融化”的macros。 macros将创build一个提示,“inputID列的数量”,在那里你可以input识别信息的前几列。 (例如下面的R代码是4)。 在标题为“melt”的excel文件中创build一个新的工作表,用于堆叠数据,并创build一个名为“variable”的新列,与原始select的数据列标题相同。 换句话说,输出看起来和R中简单执行这两行的输出完全一样: require(reshape) melt(your.unstacked.dataframe, id.vars = 1:4) 这是一个例子: # unstacked data > df1 Year Month Country Sport No_wins No_losses High_score Total_games 2 2010 5 USA Soccer 4 3 5 9 3 2010 6 USA Soccer 5 3 4 8 4 2010 5 CAN Soccer 2 […]

如何使用具有双y轴ggplot的构面

我一直试图从这里扩展我的scheme,以利用方面(特别是facet_grid() )。 我已经看到这个例子 ,但是我似乎无法得到它为我的geom_bar()和geom_point()组合。 我试图使用从facet_wrap更改为facet_wrap的示例代码,这似乎也使第一个层不显示。 当谈到栅格和栅格时,我是一个新手,所以如果有人能够给出一些指导,让我们看看如何让P1显示左边的y轴,P2显示在右边的y轴上,那将是非常棒的。 数据 library(ggplot2) library(gtable) library(grid) library(data.table) library(scales) grid.newpage() dt.diamonds <- as.data.table(diamonds) d1 <- dt.diamonds[,list(revenue = sum(price), stones = length(price)), by=c("clarity","cut")] setkey(d1, clarity,cut) p1&p2 p1 <- ggplot(d1, aes(x=clarity,y=revenue, fill=cut)) + geom_bar(stat="identity") + labs(x="clarity", y="revenue") + facet_grid(. ~ cut) + scale_y_continuous(labels=dollar, expand=c(0,0)) + theme(axis.text.x = element_text(angle = 90, hjust = 1), axis.text.y […]

将颜色和形状的图例组合成一个图例

我从2 x 2研究devise创buildggplot情节,并希望使用2种颜色和2个符号来分类我的4个不同的治疗组合。 目前我有2个传说,一个是颜色,一个是两个形状。 我怎样才能将它们组合成一个单独的图例,所以我有一个蓝色圆圈,一个红色圆圈,一个蓝色三angular形和一个读取三angular形? 一些数据: state1 <- c(rep(c(rep("N", 7), rep("Y", 7)), 2)) year <- rep(c(2003:2009), 4) group1 <- c(rep("C", 14), rep("E", 14)) group2 <- paste(state1, group1, sep = "") beta <- c(0.16,0.15,0.08,0.08,0.18,0.48,0.14,0.19,0.00,0.00,0.04,0.08,0.27,0.03,0.11,0.12,0.09,0.09,0.10,0.19,0.16,0.00,0.11,0.07,0.08,0.09,0.19,0.10) lcl <- c(0.13,0.12,0.05,0.05,0.12,0.35,0.06,0.13,0.00,0.00,0.01,0.04,0.20,0.00,0.09,0.09,0.06,0.06,0.07,0.15,0.11,0.00,0.07,0.03,0.05,0.06,0.15,0.06) ucl <- c(0.20,0.20,0.13,0.14,0.27,0.61,0.28,0.27,0.00,1.00,0.16,0.16,0.36,0.82,0.14,0.15,0.13,0.13,0.15,0.23,0.21,0.00,0.15,0.14,0.12,0.12,0.23,0.16) data <- data.frame(state1,year,group1,group2,beta,lcl,ucl) 情节: library(ggplot2) pd <- position_dodge(.65) ggplot(data = data, aes(x = year, y = […]

在R数据框中查找重复行重复的次数

我有一个像下面的例子一样的数据框 a = c(1, 1, 1, 2, 2, 3, 4, 4) b = c(3.5, 3.5, 2.5, 2, 2, 1, 2.2, 7) df <-data.frame(a,b) 我可以通过下面的代码从R数据框中删除重复的行,但我怎样才能find每个重复的行重复多less次? 我需要结果作为一个向量。 unique(df) 要么 df[!duplicated(df), ]