Tag: xlsx

使用批处理将xlsx文件转换为csv

如何使用批处理脚本将多个xlsx文件转换为csv文件?

与xlsx包和choose.files冲突

加载xlsx包并使用choose.files,我遇到一个奇怪的问题。 一旦我将RStudio更新到最新版本(v0.97.237),这个问题就开始了。 如果我启动RStudio,然后加载xlsx(即library(xlsx) ),则软件包加载正常。 但是,如果我尝试使用choose.files() ,则RStudio会冻结(实际上,它会持续运行,如果不使用Win7任务pipe理器就不能closures它)。 如果我启动RStudio并首先使用choose.files,它工作得很好。 如果我然后运行library(xlsx)行,xlsx包将不会加载。 它给出了下面的错误。 我已经尝试重新安装xlsx包(与xlsxjars和rJava一起),但是没有奏效。 也没有重新安装Java。 有什么build议么? 我正在使用R v2.15.2。 library(xlsx) Loading required package: xlsxjars Loading required package: rJava Error occurred during initialization of VM Could not reserve enough space for object heap Error : .onLoad failed in loadNamespace() for 'xlsxjars', details: call: .jinit() error: Cannot create Java virtual machine (-4) […]

导入一个大的xlsx文件到R?

我想知道是否有人知道从“大”xlsx文件(〜20Mb)导入数据的方法。 我试图使用xlsx和XLConnect库。 不幸的是,两个使用rJava和我总是得到同样的错误: > library(XLConnect) > wb <- loadWorkbook("MyBigFile.xlsx") Error: OutOfMemoryError (Java): Java heap space 要么 > library(xlsx) > mydata <- read.xlsx2(file="MyBigFile.xlsx") Error in .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : java.lang.OutOfMemoryError: Java heap space 我也尝试在加载rJava之前修改java.parameters: > options( java.parameters = "-Xmx2500m") > library(xlsx) # load rJava > mydata <- read.xlsx2(file="MyBigFile.xlsx") Error in .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : […]

使用Python读取xlsx文件

我去年读到xlrd被更新为能够读取xlsx文件(Excel 2007,2010 )。 有没有关于这个发展的消息,还是使用其他的Python工具?

在Linux命令行中将xlsx转换为csv

我正在寻找一种方法来将xlsx文件转换为Linux中的csv文件,我不想使用PHP / Perl或类似的东西,因为我正在处理数百万行,所以我需要一些快速的东西。 我发现了一个名为xls2csv的Ubuntu的回购计划,但它只会转换xls(Office 2003)文件(我目前正在使用),但是,我需要添加对新的excel文件的支持,任何想法?

从R写入Excel时处理java.lang.OutOfMemoryError

xlsx软件包可用于从R读取和写入Excel电子表格。不幸的是,即使是中等大小的电子表格,也可能发生java.lang.OutOfMemoryError 。 尤其是, ## Error in .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : ## java.lang.OutOfMemoryError: Java heap space ## Error in .jcall("RJavaTools", "Ljava/lang/Object;", "newInstance", .jfindClass(class), : ## java.lang.OutOfMemoryError: GC overhead limit exceeded (其他相关例外也是可能的,但更less见) 在阅读电子表格时,也遇到过类似的问题。 导入一个大的xlsx文件到R? 使用Excel电子表格作为CSV数据存储介质的主要优点是可以在同一个文件中存储多个工作表,因此在这里我们考虑一个数据框列表,每个工作表要写入一个数据框。 这个示例数据集包含40个dataframe,每个dataframe包含两列高达200k行的数据。 它被devise成足够大以至于有问题,但是可以通过改变n_sheets和n_rows来改变大小。 library(xlsx) set.seed(19790801) n_sheets <- 40 the_data <- replicate( n_sheets, { n_rows <- sample(2e5, 1) data.frame( x = runif(n_rows), y […]

将Excel文件导入到R,xlsx或xls中

请有人可以帮助我最好的方式导入一个Excel 2007(.xlsx)文件到R.我已经尝试了几种方法,似乎没有工作。 我已经升级到2.13.1,Windows XP,xlsx 0.3.0,我不知道为什么错误不断出现。 我试过了: AB<-read.xlsx("C:/AB_DNA_Tag_Numbers.xlsx","DNA_Tag_Numbers") 要么 AB<-read.xlsx("C:/AB_DNA_Tag_Numbers.xlsx",1) 但我得到的错误: Error in .jnew("java/io/FileInputStream", file) : java.io.FileNotFoundException: C:\AB_DNA_Tag_Numbers.xlsx (The system cannot find the file specified) 谢谢。

处理大的xlsx文件

我需要自动适合大(30k +行)xlsx文件中的所有行。 下面的代码通过apache poi在小文件上工作,但是在大文件上出现OutOfMemoryError : Workbook workbook = WorkbookFactory.create(inputStream); Sheet sheet = workbook.getSheetAt(0); for (Row row : sheet) { row.setHeight((short) -1); } workbook.write(outputStream); 更新:不幸的是,增加堆大小不是一个选项 – OutOfMemoryError出现在-Xmx1024m和30k行不是一个上限。

Excel“外部表格不是预期的格式”。

我正在尝试使用下面显示的代码读取Excel(xlsx)文件。 我得到一个“外部表格不是预期的格式”。 错误,除非我已经在Excel中打开文件。 换句话说,我必须先在Excel中打开文件,然后才能从我的C#程序中读取。 xlsx文件在我们的networking上共享。 我怎样才能读取文件,而不必先打开它? 谢谢 string sql = "SELECT * FROM [Sheet1$]"; string excelConnection = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=" + pathname + ";Extended Properties=\"Excel 8.0;HDR=YES;IMEX=1;\""; using (OleDbDataAdapter adaptor = new OleDbDataAdapter(sql, excelConnection)) { DataSet ds = new DataSet(); adaptor.Fill(ds); }