Tag: r

重新排列数据框到一个表,相反的“融化”

我有这样的巨大数据框: SN = c(1:100, 1:100, 1:100, 1:100) class = c(rep("A1", 100), rep("B2", 100), rep("C3", 100), rep("D4", 100)) # total 6000 levels myvar = rnorm(400) mydf = data.frame(SN, class, myvar) 我想“解开”一个表,每个级别的单列和myvar填充: SN A1 B2 C3 D4 ………….and so on for all 6000 我怎么能做到这一点,我知道这是一个简单的问题,但我无法弄清楚。

在另一个时间范围内返回数据子集的时间范围?

有非常漂亮的方法来xts对象的子集。 例如,可以通过以下方式获取所有年份,月份,date的所有数据,但严格地在上午9点30分到下午4点之间: my_xts["T09:30/T16:00"] 或者你可以通过做两个date之间的所有观察: my_xts["2012-01-01/2012-03-31"] 或者在某个date之前/之后的所有date: my_xts["/2011"] # from start of data until end of 2011 my_xts["2011/"] # from 2011 until the end of the data 我怎样才能得到所有年份的所有数据只有特定的几个月,或者只有特定的几个月的数据? 还有其他的子集技巧吗?

Python编程语言的Python接口

我对R很新,而且很习惯Python。 我不太习惯写R代码。 我正在寻找R接口的Python接口,这让我使用python的 R包。 我做了谷歌的研究,发现几个包可以做到这一点: Rpy2 PypeR pyRserve 但不知道哪一个更好? 哪些有更多的贡献者和更积极的使用? 请注意我的主要要求是访问R包的Python途径 。

ggplot中的酒吧sorting

我已经看了这个论坛的答案,但似乎无法find这个具体问题的答案。 我有以下数据,并且希望创build一个条形图,其中条形图按“值”从大到小sorting,而不是按字母顺序排列: breadth_data <- read.table(textConnection("Stakeholder Value 'Grantseekers' 0.90 'Donors' 0.89 'Community' 0.55 'Hurricane Relief Fund' 0.24 'Media' 0.19 'Employment Seekers' 0.12 'Affiliates' 0.10 'Youth' 0.09 'Women' 0.02 'Former Board Members' 0.01"), header=TRUE) 那么基本的条形图: c <- ggplot(breadth_data, aes(x=Stakeholder, y=Value)) c + geom_bar(stat="identity") + coord_flip() + scale_y_continuous('') + scale_x_discrete('') 我已经尝试了很多不同的重sorting和转换,我看到了StackOverflow,但我似乎无法find一个工程。 我相信这是相当简单的,但我将不胜感激任何帮助! 谢谢, 格雷格

如何检查函数调用是否导致警告?

在R中,如何判断函数调用是否会导致警告? 也就是说,在调用函数后,我想知道这个调用实例是否产生了警告。

“其他”错误中意外的“其他”

我得到这个错误: 错误:“其他”中意外的“其他” 从这个if, else声明: if (dsnt<0.05) { wilcox.test(distance[result=='nt'],distance[result=='t'],alternative=c("two.sided"),paired=TRUE) } else { if (dst<0.05) { wilcox.test(distance[result=='nt'],distance[result=='t'],alternative=c("two.sided"),paired=TRUE) } else { t.test(distance[result=='nt'],distance[result=='t'],alternative=c("two.sided"),paired=TRUE) } } 这有什么问题?

如何删除具有NA值的“行”?

可能重复: R – 使用data.frame中的NA删除行 如何快速删除其中一列中的NA值的数据框中的“行”? 所以 x1 x2 [1,] 1 100 [2,] 2 NA [3,] 3 300 [4,] NA 400 [5,] 5 500 应该导致: x1 x2 [1,] 1 100 [3,] 3 300 [5,] 5 500

将数据框中所有字符variables的所有值从小写转换为大写

我有一个混合的字符和数字variables的数据框 。 city,hs_cd,sl_no,col_01,col_02,col_03 Austin,1,2,,46,Female Austin,1,3,,32,Male Austin,1,4,,27,Male Austin,1,5,,20,Female Austin,2,2,,42,Female Austin,2,1,,52,Male Austin,2,3,,25,Male Austin,2,4,,22,Female Austin,3,3,,30,Female Austin,3,1,,65,Female 我想将数据框中的所有小写字符转换为大写字母。 有没有办法一次完成这个任务,而不是在每个字符variables上重复执行?

Rdataframe的实际限制

我一直在阅读关于如何read.table对于大型数据文件无效。 另外R如何不适合大数据集。 所以我想知道在哪里可以find实际限制,以及(1)读取各种大小的数据的性能图表(2)处理不同大小的数据。 实际上,我想知道什么时候performance恶化,什么时候我碰到路障。 此外,任何与C ++ / MATLAB或其他语言的比较都将非常有帮助。 最后如果对Rcpp和RInside有什么特别的性能比较,那会很棒!

如何获取目录中的目录列表,如list.files(),而是“list.dirs()”

这可能是一个非常简单的问题 – 我可以使用list.files()来获取给定目录中的文件列表,但是如果我想获取目录列表,我该怎么做? 在list.files()内的选项是不是正好在我面前? 另外,我正在使用Windows,所以如果答案是shell到一些Linux / Unix命令,那对我来说不起作用。 .NET例如有一个Directory.GetFiles()方法和一个单独的Directory.GetDirectories()方法,所以我认为R将有一个类似的对。 提前致谢。