Tag: r

如何按组分组variables?

假设我有两列数据。 第一个包含“First”,“Second”,“Third”等类别。第二个包含表示我看到“First”的次数的数字。 例如: Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 Second 3 我想按类别对数据进行sorting并对频率进行求和: Category Frequency First 30 Second 5 Third 34 我如何在R中做到这一点?

如何制作数据框的列表?

如何制作dataframe列表,以及如何从列表中访问每个dataframe? 我无法find这个简单的例子。 所以我告诉我我的post太短了,所以我会通过把一些数据框放在一个列表中来让它滚动。 d1<-data.frame(y1<-c(1,2,3),y2<-c(4,5,6)) d2<-data.frame(y1<-c(3,2,1),y2<-c(6,5,4))

为什么这些数字不相等?

下面的代码显然是错误的。 有什么问题? i <- 0.1 i <- i + 0.05 i ## [1] 0.15 if(i==0.15) cat("i equals 0.15") else cat("i does not equal 0.15") ## i does not equal 0.15

如何从长到宽的格式重塑数据?

我在重新排列下面的数据框时遇到了问题: set.seed(45) dat1 <- data.frame( name = rep(c("firstName", "secondName"), each=4), numbers = rep(1:4, 2), value = rnorm(8) ) dat1 name numbers value 1 firstName 1 0.3407997 2 firstName 2 -0.7033403 3 firstName 3 -0.3795377 4 firstName 4 -0.7460474 5 secondName 1 -0.8981073 6 secondName 2 -0.3347941 7 secondName 3 -0.5013782 8 secondName 4 -0.1745357 我想重塑它,以便每个唯一的“名称”variables是rowname,其中“values”作为该行的观察值,“numbers”作为colnames。 […]

如何join(合并)数据框架(内部,外部,左,右)?

给定两个dataframe: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep("Alabama", 2), rep("Ohio", 1))) df1 # CustomerId Product # 1 Toaster # 2 Toaster # 3 Toaster # 4 Radio # 5 Radio # 6 Radio df2 # CustomerId State # 2 Alabama # […]

如何在每个组中创建一个滞后变量?

我有一个data.table: set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "a"), c(3, 4))), value = rnorm(7)) data # groups time value # 1: b 1 -0.6264538 # 2: b 2 0.1836433 # 3: b 3 -0.8356286 # 4: a 1 1.5952808 # 5: a 2 0.3295078 # 6: a 3 -0.8204684 # 7: a […]

只读取有限的列数

任何人都可以告诉我如何阅读下面的数据,每年只有前6个月(7列),例如通过使用read.table() ? Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -25 2010 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -25 2011 -21 -27 -2 -6 -10 -32 -13 -12 -27 -30 -38 -29

在R中调试的一般建议

使用我写的R函数时出现错误: Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: algorithm did not converge 我做了什么: 逐步完成功能 添加打印以查明错误发生在哪一行提示两个不应该使用glm.fit 。 他们是window()和save() 。 我的一般方法包括添加print和stop命令,逐行逐行扫描功能,直到找到异常。 然而,我不清楚使用这些技术的错误来自代码。 我甚至不确定代码中的哪些函数依赖于glm.fit 。 我如何去诊断这个问题?

无法使用install.packages安装R-forge软件包

这个 问题 是在R-sig-finance邮件列表上提出的,但是我不认为这是在stackoverflow上提出的。 它是这样的: 我在哪里可以获得在R-forge上托管的XYZ软件包的最新版本? 我试图用install.packages安装它,但是这是发生了什么事: > install.packages("XYZ",repos="http://r-forge.r-project.org") Warning message: package 'XYZ' is not available (for R version 2.15.0) 在XYZ的R-forge网站上查看,我发现该软件包未能建立。 因此,没有链接来下载源代码。 有没有其他的方式来获得源代码? 一旦我得到源代码,我怎么能把它变成一个包,我可以加载library("XYZ") ?

在编写自己的函数时如何使用R的省略号功能?

R语言有一个漂亮的功能来定义函数,可以使用不定数量的参数。 例如,函数data.frame可以使用任意数量的参数,每个参数都会成为结果数据表中列的数据。 用法示例: > data.frame(letters=c("a", "b", "c"), numbers=c(1,2,3), notes=c("do", "re", "mi")) letters numbers notes 1 a 1 do 2 b 2 re 3 c 3 mi 函数的签名包含一个省略号,如下所示: function (…, row.names = NULL, check.rows = FALSE, check.names = TRUE, stringsAsFactors = default.stringsAsFactors()) { [FUNCTION DEFINITION HERE] } 我想写一个类似的函数,取多个值并将它们合并成一个返回值(以及做一些其他的处理)。 为了做到这一点,我需要弄清楚如何从函数的参数中“解压” … 我不知道该怎么做 data.frame的函数定义中的相关行是object <- as.list(substitute(list(…)))[-1L] ,这是我无法理解的。 那么我怎样才能将函数签名中的省略号转换成例如一个列表呢? […]