用重复标识符传播data.frame / tibble

tidyr的文件表明,收集和传播是传递性的,但下面的例子与“虹膜”数据显示他们不是,但不清楚为什么。 任何澄清将不胜感激

iris.df = as.data.frame(iris) long.iris.df = iris.df %>% gather(key = feature.measure, value = size, -Species) w.iris.df = long.iris.df %>% spread(key = feature.measure, value = size, -Species) 

我期望dataframe“w.iris.df”与“iris.df”相同,但是却收到下列错误:

“错误:行的重复标识符(1,2,3,4,5,6,7,8,9 …”

我的一般问题是如何在这类数据集上反转“聚集”的应用。

Hadley的干预毫不令人吃惊地完美无瑕,但是在这之后,我终于把语法弄糊涂了……所以,为了什么是值得的,我发布了完全可操作的代码(对不起,我的语法与上面有点不一样):

 library(tidyr) library(dplyr) wide <- iris %>% mutate(row = row_number()) %>% gather(vars, val, -Species, -row) %>% spread(vars, val) head(wide) # Species row Petal.Length Petal.Width Sepal.Length Sepal.Width # 1 setosa 1 1.4 0.2 5.1 3.5 # 2 setosa 2 1.4 0.2 4.9 3.0 # 3 setosa 3 1.3 0.2 4.7 3.2 # 4 setosa 4 1.5 0.2 4.6 3.1 # 5 setosa 5 1.4 0.2 5.0 3.6 # 6 setosa 6 1.7 0.4 5.4 3.9 head(iris) # Sepal.Length Sepal.Width Petal.Length Petal.Width Species # 1 5.1 3.5 1.4 0.2 setosa # 2 4.9 3.0 1.4 0.2 setosa # 3 4.7 3.2 1.3 0.2 setosa # 4 4.6 3.1 1.5 0.2 setosa # 5 5.0 3.6 1.4 0.2 setosa # 6 5.4 3.9 1.7 0.4 setosa 

他们是一样的….只需要重新订购,如果你觉得它…

 wide <- wide[,c(3, 4, 5, 6, 1)] ## Reorder and then remove "row" column 

并做了。