Tag: read.csv

R中的read.csv()和read.csv2()之间的区别

在R中,read.csv()和read.csv2()有什么区别 官方文件说, 在各种欧洲语言环境中,由于逗号字符用作小数点,因此应该使用read.csv2函数 这是什么意思。 我没有看到任何表面上的差异。 谁能给出一个具体的例子来进一步澄清呢?

如何检测read.csv的正确编码?

我有这个文件(http://b7hq6v.alterupload.com/en/),我想阅读R与read.csv 。 但是我无法检测到正确的编码。 这似乎是一种UTF-8。 我在WindowsXP机器上使用R 2.12.1。 任何帮助?

在read.csv中指定colClasses

我试图在R中的read.csv函数中指定colClasses选项。在我的数据中,第一列“time”基本上是一个字符vector,而其余的列是数字。 data <- read.csv("test.csv", comment.char="" , colClasses=c(time="character", "numeric"), strip.white=FALSE) 在上面的命令中,我希望R在“时间”列中读取“字符”,其余的为数字。 尽pipe“data”variables在命令完成后确实得到了正确的结果,但R返回了以下警告。 我想知道如何解决这些警告? Warning messages: 1: In read.table(file = file, header = header, sep = sep, quote = quote, : not all columns named in 'colClasses' exist 2: In tmp[i[i > 0L]] <- colClasses : number of items to replace is not a multiple of replacement […]

read.csv中的多字节string无效

我正在尝试导入日文版的csv。 此代码: url <- 'http://www.mof.go.jp/international_policy/reference/itn_transactions_in_securities/week.csv' x <- read.csv(url, header=FALSE, stringsAsFactors=FALSE) 返回以下错误: Error in type.convert(data[[i]], as.is = as.is[i], dec = dec, na.strings = character(0L)) : invalid multibyte string at '<91>ΊO<8b>y<82>ёΓ<e0><8f>،<94><94><84><94><83><8c>_<96>񓙂̏󋵁@(<8f>T<8e><9f><81>E<8e>w<92><e8><95>񍐋@<8a>փx<81>[<83>X<81>j' 我尝试更改编码( Encoding(url) <- 'UTF-8' ,也latin1),并尝试删除read.csv参数,但在每种情况下收到相同的“无效多字节string”消息。 是否有应该使用不同的编码,还是有其他一些问题?

在read.table / read.csv中指定colClasses参数的自定义date格式

题: 在read.table / read.csv中使用colClasses参数时是否有指定date格式的方法? (我知道我可以在导入后进行转换,但是有很多这样的date列,在导入步骤中会更容易) 例: 我有一个.csv格式的date列%d/%m/%Y 。 dataImport <- read.csv("data.csv", colClasses = c("factor","factor","Date")) 这会导致转换错误。 例如,15/07/2008变成0015-07-20 。 可重复的代码: data <- structure(list(func_loc = structure(c(1L, 2L, 3L, 3L, 3L, 3L, 3L, 4L, 4L, 5L), .Label = c("3076WAG0003", "3076WAG0004", "3076WAG0007", "3076WAG0009", "3076WAG0010"), class = "factor"), order_type = structure(c(3L, 3L, 1L, 1L, 1L, 1L, 2L, 2L, 3L, 1L), .Label […]