Tag: r

如何按组分组variables？: 假设我有两列数据。第一个包含“First”，“Second”，“Third”等类别。第二个包含表示我看到“First”的次数的数字。例如： Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 Second 3 我想按类别对数据进行sorting并对频率进行求和： Category Frequency First 30 Second 5 Third 34 我如何在R中做到这一点？

如何制作数据框的列表？: 如何制作dataframe列表，以及如何从列表中访问每个dataframe？我无法find这个简单的例子。所以我告诉我我的post太短了，所以我会通过把一些数据框放在一个列表中来让它滚动。 d1<-data.frame(y1<-c(1,2,3),y2<-c(4,5,6)) d2<-data.frame(y1<-c(3,2,1),y2<-c(6,5,4))

为什么这些数字不相等？: 下面的代码显然是错误的。有什么问题？ i <- 0.1 i <- i + 0.05 i ## [1] 0.15 if(i==0.15) cat("i equals 0.15") else cat("i does not equal 0.15") ## i does not equal 0.15

如何从长到宽的格式重塑数据？: 我在重新排列下面的数据框时遇到了问题： set.seed(45) dat1 <- data.frame( name = rep(c("firstName", "secondName"), each=4), numbers = rep(1:4, 2), value = rnorm(8) ) dat1 name numbers value 1 firstName 1 0.3407997 2 firstName 2 -0.7033403 3 firstName 3 -0.3795377 4 firstName 4 -0.7460474 5 secondName 1 -0.8981073 6 secondName 2 -0.3347941 7 secondName 3 -0.5013782 8 secondName 4 -0.1745357 我想重塑它，以便每个唯一的“名称”variables是rowname，其中“values”作为该行的观察值，“numbers”作为colnames。 […]

如何join（合并）数据框架（内部，外部，左，右）？: 给定两个dataframe： df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep("Alabama", 2), rep("Ohio", 1))) df1 # CustomerId Product # 1 Toaster # 2 Toaster # 3 Toaster # 4 Radio # 5 Radio # 6 Radio df2 # CustomerId State # 2 Alabama # […]

如何在每个组中创建一个滞后变量？: 我有一个data.table： set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "a"), c(3, 4))), value = rnorm(7)) data # groups time value # 1: b 1 -0.6264538 # 2: b 2 0.1836433 # 3: b 3 -0.8356286 # 4: a 1 1.5952808 # 5: a 2 0.3295078 # 6: a 3 -0.8204684 # 7: a […]

只读取有限的列数: 任何人都可以告诉我如何阅读下面的数据，每年只有前6个月（7列），例如通过使用read.table() ？ Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -25 2010 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -25 2011 -21 -27 -2 -6 -10 -32 -13 -12 -27 -30 -38 -29

在R中调试的一般建议: 使用我写的R函数时出现错误： Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: algorithm did not converge 我做了什么：逐步完成功能添加打印以查明错误发生在哪一行提示两个不应该使用glm.fit 。他们是window()和save() 。我的一般方法包括添加print和stop命令，逐行逐行扫描功能，直到找到异常。然而，我不清楚使用这些技术的错误来自代码。我甚至不确定代码中的哪些函数依赖于glm.fit 。我如何去诊断这个问题？

无法使用install.packages安装R-forge软件包: 这个问题是在R-sig-finance邮件列表上提出的，但是我不认为这是在stackoverflow上提出的。它是这样的：我在哪里可以获得在R-forge上托管的XYZ软件包的最新版本？我试图用install.packages安装它，但是这是发生了什么事： > install.packages("XYZ",repos="http://r-forge.r-project.org") Warning message: package 'XYZ' is not available (for R version 2.15.0) 在XYZ的R-forge网站上查看，我发现该软件包未能建立。因此，没有链接来下载源代码。有没有其他的方式来获得源代码？一旦我得到源代码，我怎么能把它变成一个包，我可以加载library("XYZ") ？

在编写自己的函数时如何使用R的省略号功能？: R语言有一个漂亮的功能来定义函数，可以使用不定数量的参数。例如，函数data.frame可以使用任意数量的参数，每个参数都会成为结果数据表中列的数据。用法示例： > data.frame(letters=c("a", "b", "c"), numbers=c(1,2,3), notes=c("do", "re", "mi")) letters numbers notes 1 a 1 do 2 b 2 re 3 c 3 mi 函数的签名包含一个省略号，如下所示： function (…, row.names = NULL, check.rows = FALSE, check.names = TRUE, stringsAsFactors = default.stringsAsFactors()) { [FUNCTION DEFINITION HERE] } 我想写一个类似的函数，取多个值并将它们合并成一个返回值（以及做一些其他的处理）。为了做到这一点，我需要弄清楚如何从函数的参数中“解压” … 我不知道该怎么做 data.frame的函数定义中的相关行是object <- as.list(substitute(list(…)))[-1L] ，这是我无法理解的。那么我怎样才能将函数签名中的省略号转换成例如一个列表呢？ […]