Tag: csv

Python:比较两个CSV文件并search相似的项目

所以我有两个CSV文件,我试图比较,并得到相似的项目的结果。 第一个文件hosts.csv如下所示: Path Filename Size Signature C:\ a.txt 14kb 012345 D:\ b.txt 99kb 678910 C:\ c.txt 44kb 111213 第二个文件masterlist.csv如下所示: Filename Signature b.txt 678910 x.txt 111213 b.txt 777777 c.txt 999999 正如你所看到的,行不匹配,masterlist.csv总是大于hosts.csv文件。 我想要search的唯一部分是签名部分。 我知道这看起来像这样: hosts[3] == masterlist[1] 我正在寻找一个解决scheme,会给我像下面的东西(基本上hosts.csv文件与一个新的结果列): Path Filename Size Signature RESULTS C:\ a.txt 14kb 012345 NOT FOUND in masterlist D:\ b.txt 99kb 678910 FOUND in […]

如何使用逗号分隔值读写文本文件

如果我的文件是用逗号分隔的值,则如何从文件读取数据 1, 2, 3, 4, 5\n 6, 7, 8, 9, 10\n \n 并在读取文件后,我想要将数据写回其他文件上面相同的格式。 我可以得到总数的行,使用 string line; while(!file.eof()){ getline(file,line); numlines++; } numline–; // remove the last empty line 但是我怎么知道一行/一行的总位数? 我也有vector存储数据。 所以,我想读第一行,然后计算该行中的元素总数,这里是5(1,2,3,4,5),并将它们存储在数组/vector中,然后读取下一行并将它们存储在向量中再等等,直到我达到EOF。 然后,我想把这些数据写入文件,我想这会做数据写入文件的工作, numOfCols=1; for(int i = 0; i < vector.size(); i++) { file << vector.at(i); if((numOfCols<5) file << ",";//print comma (,) if((i+1)%5==0) { file << endl;//print […]

用Spark加载CSV文件

我是Spark的新手,我试图用Spark从文件中读取CSV数据。 这是我在做什么: sc.textFile('file.csv') .map(lambda line: (line.split(',')[0], line.split(',')[1])) .collect() 我希望这个调用给我一个我的文件的两个第一列的列表,但我得到这个错误: File "<ipython-input-60-73ea98550983>", line 1, in <lambda> IndexError: list index out of range 虽然我的CSV文件不止一列。

SQL Server批量插入带有不一致引号的CSV文件

是否有可能扩大插入(SQL Server)一个CSV文件,其中的字段是只有OCCASSIONALLY引号包围? 具体而言,引号仅包含那些包含“,”的字段。 换句话说,我有这样的数据(第一行包含标题): id, company, rep, employees 729216,INGRAM MICRO INC.,"Stuart, Becky",523 729235,"GREAT PLAINS ENERGY, INC.","Nelson, Beena",114 721177,GEORGE WESTON BAKERIES INC,"Hogan, Meg",253 由于引号不一致,我不能使用“”,“”作为分隔符,而且我也不知道如何创build一个格式文件来解决这个问题。 我尝试使用','作为分隔符,并将其加载到一个临时表中,其中每列是一个varchar,然后使用一些kludgy处理去除引号,但这也不起作用,因为包含','被分成多列。 不幸的是,我没有能力预先处理CSV文件。 这是无望的吗? 非常感谢您的任何build议。 顺便说一下,我看到这个post从csv的SQL批量导入 ,但在这种情况下,每个字段一直包裹在引号。 那么,在这种情况下,他可以用','作为分隔符,然后去掉引号。

将DataTable转换为CSVstream

目前有一个DataTable,但希望通过WebHandler将其stream式传输给用户。 FileHelpers有CommonEngine.DataTableToCsv(dt, "file.csv") 。 但它将其保存到文件中。 我怎样才能把它保存到stream? 我知道如何做到这一点,当我知道在先进的列或他们没有改变,但我想直接从数据表生成列标题。 如果我知道列我刚创build类: [DelimitedRecord(",")] public class MailMergeFields { [FieldQuoted()] public string FirstName; [FieldQuoted()] public string LastName; } 然后使用FileHelperEngine并添加logging: FileHelperEngine engine = new FileHelperEngine(typeof(MailMergeFields)); MailMergeFields[] merge = new MailMergeFields[dt.Rows.Count + 1]; // add headers merge[0] = new MailMergeFields(); merge[0].FirstName = "FirstName"; merge[0].LastName = "LastName"; int i = 1; // add records […]

如何创build和从PHP脚本下载CSV文件?

我是一个新手程序员,我search了很多关于我的问题,但找不到有用的解决scheme或教程。 我的目标是我有一个PHP数组,数组元素显示在页面上的列表中。 我想添加一个选项,这样,如果用户想要,他/她可以创build一个包含数组元素的CSV文件并下载它。 我不知道该怎么做 我也search了很多。 但还没有find有用的资源。 请给我提供一些教程或解决scheme或build议,由我自己来实施。 由于我是新手,请提供易于实施的解决scheme。 我的数组看起来像: Array ( [0] => Array ( [fs_id] => 4c524d8abfc6ef3b201f489c [name] => restaurant [lat] => 40.702692 [lng] => -74.012869 [address] => new york [postalCode] => [city] => NEW YORK [state] => ny [business_type] => BBQ Joint [url] => ) )

如何导入CSV数据到Django模型

我有一些CSV数据,我想使用示例CSV数据导入到Django模型中: 1;"02-01-101101";"Worm Gear HRF 50";"Ratio 1 : 10";"input shaft, output shaft, direction A, color dark green"; 2;"02-01-101102";"Worm Gear HRF 50";"Ratio 1 : 20";"input shaft, output shaft, direction A, color dark green"; 3;"02-01-101103";"Worm Gear HRF 50";"Ratio 1 : 30";"input shaft, output shaft, direction A, color dark green"; 4;"02-01-101104";"Worm Gear HRF 50";"Ratio 1 : 40";"input shaft, output […]

如何使用Postgres中的CSV文件更新选定的行?

我使用的Postgres,并希望做一个大的更新查询,将从一个CSV文件中提取,可以说我有一个表(id, banana, apple) 。 我想运行一个更新,改变香蕉,而不是苹果,每个新的香蕉和他们的ID将在一个CSV文件。 我试着看Postgres网站,但是例子正在杀死我。

哪种编码可以在Mac和Windows上使用Excel正确打开CSV文件?

我们有一个Web应用程序,可以导出包含UTF-8外部字符的CSV文件,而不需要BOM。 Windows和Mac用户都在Excel中获取垃圾回收字符。 我试图用BOM转换成UTF-8; Excel / Win很好,Excel / Mac显示乱码。 我正在使用Excel 2003 / Win,Excel 2011 / Mac。 以下是我尝试的所有编码: Encoding BOM Win Mac ——– — —————————- ———— utf-8 — scrambled scrambled utf-8 BOM WORKS scrambled utf-16 — file not recognized file not recognized utf-16 BOM file not recognized Chinese gibberish utf-16LE — file not recognized file not recognized […]

响应内容types为CSV

我需要在HTTP响应中发送一个CSV文件。 如何将输出响应设置为CSV格式? 这不工作: Response.ContentType = "application/CSV";