Tag: r

重新排列数据框到一个表，相反的“融化”: 我有这样的巨大数据框： SN = c(1:100, 1:100, 1:100, 1:100) class = c(rep("A1", 100), rep("B2", 100), rep("C3", 100), rep("D4", 100)) # total 6000 levels myvar = rnorm(400) mydf = data.frame(SN, class, myvar) 我想“解开”一个表，每个级别的单列和myvar填充： SN A1 B2 C3 D4 ………….and so on for all 6000 我怎么能做到这一点，我知道这是一个简单的问题，但我无法弄清楚。

在另一个时间范围内返回数据子集的时间范围？: 有非常漂亮的方法来xts对象的子集。例如，可以通过以下方式获取所有年份，月份，date的所有数据，但严格地在上午9点30分到下午4点之间： my_xts["T09:30/T16:00"] 或者你可以通过做两个date之间的所有观察： my_xts["2012-01-01/2012-03-31"] 或者在某个date之前/之后的所有date： my_xts["/2011"] # from start of data until end of 2011 my_xts["2011/"] # from 2011 until the end of the data 我怎样才能得到所有年份的所有数据只有特定的几个月，或者只有特定的几个月的数据？还有其他的子集技巧吗？

Python编程语言的Python接口: 我对R很新，而且很习惯Python。我不太习惯写R代码。我正在寻找R接口的Python接口，这让我使用python的 R包。我做了谷歌的研究，发现几个包可以做到这一点： Rpy2 PypeR pyRserve 但不知道哪一个更好？哪些有更多的贡献者和更积极的使用？请注意我的主要要求是访问R包的Python途径。

ggplot中的酒吧sorting: 我已经看了这个论坛的答案，但似乎无法find这个具体问题的答案。我有以下数据，并且希望创build一个条形图，其中条形图按“值”从大到小sorting，而不是按字母顺序排列： breadth_data <- read.table(textConnection("Stakeholder Value 'Grantseekers' 0.90 'Donors' 0.89 'Community' 0.55 'Hurricane Relief Fund' 0.24 'Media' 0.19 'Employment Seekers' 0.12 'Affiliates' 0.10 'Youth' 0.09 'Women' 0.02 'Former Board Members' 0.01"), header=TRUE) 那么基本的条形图： c <- ggplot(breadth_data, aes(x=Stakeholder, y=Value)) c + geom_bar(stat="identity") + coord_flip() + scale_y_continuous('') + scale_x_discrete('') 我已经尝试了很多不同的重sorting和转换，我看到了StackOverflow，但我似乎无法find一个工程。我相信这是相当简单的，但我将不胜感激任何帮助！谢谢，格雷格

“其他”错误中意外的“其他”: 我得到这个错误：错误：“其他”中意外的“其他” 从这个if, else声明： if (dsnt<0.05) { wilcox.test(distance[result=='nt'],distance[result=='t'],alternative=c("two.sided"),paired=TRUE) } else { if (dst<0.05) { wilcox.test(distance[result=='nt'],distance[result=='t'],alternative=c("two.sided"),paired=TRUE) } else { t.test(distance[result=='nt'],distance[result=='t'],alternative=c("two.sided"),paired=TRUE) } } 这有什么问题？

如何删除具有NA值的“行”？: 可能重复： R – 使用data.frame中的NA删除行如何快速删除其中一列中的NA值的数据框中的“行”？所以 x1 x2 [1,] 1 100 [2,] 2 NA [3,] 3 300 [4,] NA 400 [5,] 5 500 应该导致： x1 x2 [1,] 1 100 [3,] 3 300 [5,] 5 500

将数据框中所有字符variables的所有值从小写转换为大写: 我有一个混合的字符和数字variables的数据框。 city,hs_cd,sl_no,col_01,col_02,col_03 Austin,1,2,,46,Female Austin,1,3,,32,Male Austin,1,4,,27,Male Austin,1,5,,20,Female Austin,2,2,,42,Female Austin,2,1,,52,Male Austin,2,3,,25,Male Austin,2,4,,22,Female Austin,3,3,,30,Female Austin,3,1,,65,Female 我想将数据框中的所有小写字符转换为大写字母。有没有办法一次完成这个任务，而不是在每个字符variables上重复执行？

Rdataframe的实际限制: 我一直在阅读关于如何read.table对于大型数据文件无效。另外R如何不适合大数据集。所以我想知道在哪里可以find实际限制，以及（1）读取各种大小的数据的性能图表（2）处理不同大小的数据。实际上，我想知道什么时候performance恶化，什么时候我碰到路障。此外，任何与C ++ / MATLAB或其他语言的比较都将非常有帮助。最后如果对Rcpp和RInside有什么特别的性能比较，那会很棒！

如何获取目录中的目录列表，如list.files（），而是“list.dirs（）”: 这可能是一个非常简单的问题 – 我可以使用list.files()来获取给定目录中的文件列表，但是如果我想获取目录列表，我该怎么做？在list.files()内的选项是不是正好在我面前？另外，我正在使用Windows，所以如果答案是shell到一些Linux / Unix命令，那对我来说不起作用。 .NET例如有一个Directory.GetFiles()方法和一个单独的Directory.GetDirectories()方法，所以我认为R将有一个类似的对。提前致谢。