Tag: 字符编码

所有包含的字符集,以避免“java.nio.charset.MalformedInputException:input长度= 1”?

我用Java创build了一个简单的wordcount程序,通过目录的文本文件读取。 但是,我不断收到错误: java.nio.charset.MalformedInputException: Input length = 1 从这行代码: BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8")); 我知道我可能会得到这个,因为我使用了一个Charset ,它没有在文本文件中包含一些字符,其中一些包含了其他语言的字符。 但我想包括这些字符。 后来我在JavaDocs上了解到Charset是可选的,只用于更有效的读取文件,所以我将代码改为: BufferedReader reader = Files.newBufferedReader(file); 但是有些文件仍然会抛出MalformedInputException 。 我不知道为什么。 我想知道是否有一个全包的Charset ,将允许我阅读文字文件与许多不同types的字符 ? 谢谢。

将SSMS .rpt输出文件转换为.txt / .csv

我想将我的大型SSMS(SQL Server Management Studio)查询结果(2.5m行,9个字段)导出为.csv或逗号分隔的.txt(带标题)。 (MS SQL Server 2005 Management Studio。) 这样我就可以逐行读入VBA程序(对数据进行一定的计算)或者在Excel中对其进行查询(例如使用Microsoft Query)。 计算很复杂,我宁愿在SSMS以外的地方进行。 如果我selectSSMS中的“查询结果到文本”和一个小的答案(几行,例如高达200k),我当然可以简单地复制并粘贴到文本编辑器。 对于我这里的大回答,我当然可以复制和粘贴200k左右的行,每次10次,进入一个文本编辑器,如超编辑。 (当我同时尝试所有2.5米的时候,我在SSMS里面发现了一个内存警告。)但是对于未来我想要一个更优雅的解决scheme。 对于“查询结果到文件”,SSMS总是写入一个.rpt文件。 (如果在结果窗口中右键单击并select“另存为”,则会出现如上所述的内存错误。) – >所以看起来我唯一的select是让SSMS将结果输出到一个文件,即.rpt,然后将.rpt转换为.txt。 我假设这个.rpt是一个Crystal Reports文件? 或者不是。 我的电脑上没有Crystal Reports,所以我无法使用它来转换文件。 当在Ultra-Edit中打开.rpt时,它看起来很好。 但是,在Excel中的Microsoft Query中,标题不希望显示。 当我简单地使用VBA读写.rpt时,文件大小减半。 (330至180微克)。 在Microsoft Query中,标题确实显示(尽pipe第一个字段名有一个有趣的主angular,在其他完全不同的情况下,这在我之前发生过)。 我似乎能够在Excel中做有意义的数据透视表。 但是,当我在Ultra-Edit中打开这个新文件时,它显示中文字符! 难道还有一些有趣的angular色呢? – >是否有免费(和简单/安全)转换器应用程序可用的地方。 或者我应该相信,这个.txt对于读入我的VBA程序是很好的。 谢谢

Ruby on Rails 3,不兼容的字符编码:UTF-8和带有i18n的ASCII-8BIT

我遇到了Rails 3.0.1,Ruby 1.9.2和我的网站本地化的一些麻烦。 问题很简单,我在视图中有这样的东西: f.input :zip_code, :label => I18n.t('labels.zip_code') 和一个es.yml文件: es: labels: zip_code: "Este código postal no es valido." en.yml文件(它是纯粹的ASCII)没有问题,但是当网站设置为i18n.locale == 'es'我得到这个错误: incompatible character encodings: UTF-8 and ASCII-8BIT 我一直在寻找相当一段时间,但没有find一种方法来使用我的UTF-8翻译文件。 有人知道如何使它工作? 谢谢你的帮助。

SQL Server的默认字符编码

默认情况下 – Microsoft SQL Server中为数据库设置的字符编码是什么? 如何在SQL Server中看到当前的字符编码?

ASP.NET Excel导出编码问题

我在ASP.NET网站上做了一些Excel导出。 除了编码之外,一切都可以使用。 当我在Excel中打开它时,它看起来像这样: Eingabe Kosten jeGerätGerät:Gerätebezeichnung:BetriebsmittelHeizöl在“4 Dieselverbrauch in:4 这是我的代码: Response.Clear(); Response.ContentType = "application/ms-excel"; Response.AddHeader("Content-Disposition", "inline;filename=NachkalkGeraete.xls;"); var writer = new HtmlTextWriter(Response.Output); SomeControl.RenderControl(writer); /* FormView, Table, DataGrid… */ Response.End(); 我已经尝试明确设置编码..但没有发生变化: Response.Clear(); Response.ContentType = "application/vnd.ms-excel"; Response.AddHeader("Content-Disposition", "attachment; filename=NachkalkGeraete.xls"); Response.BufferOutput = true; Response.ContentEncoding = System.Text.Encoding.UTF8; Response.Charset = "UTF-8"; EnableViewState = false; System.IO.StringWriter tw = new System.IO.StringWriter(); HtmlTextWriter hw = […]

将byte 转换为char

如何将byte数组转换为C#中的char数组?

如何在SQL Server Management Studio中键入一个新的行字符

在打开的数据表的“datagrid”视图中,如何直接在SSMS中将新的行字符input到nvarchar字段中? 有一个ALT代码?

PowerShell的UTF-8输出

我正在尝试使用带有redirectI / O的Process.Start来使用string调用PowerShell.exe ,并使用UTF-8获取输出。 但我似乎无法做到这一点。 我试过了: 传递命令通过-Command参数运行 使用UTF-8编码将PowerShell脚本作为文件写入磁盘 使用带有BOM编码的UTF-8将PowerShell脚本作为文件写入磁盘 使用UTF-16将PowerShell脚本作为文件写入磁盘 在我的控制台应用程序和PowerShell脚本中设置Console.OutputEncoding 在PowerShell中设置$OutputEncoding 设置Process.StartInfo.StandardOutputEncoding 使用Encoding.Unicode而不是Encoding.UTF8 在任何情况下,当我检查给出的字节时,我得到不同的值到我原来的string。 我真的很喜欢解释为什么这不起作用。 这是我的代码: static void Main(string[] args) { DumpBytes("Héllo"); ExecuteCommand("PowerShell.exe", "-Command \"$OutputEncoding = [System.Text.Encoding]::UTF8 ; Write-Output 'Héllo';\"", Environment.CurrentDirectory, DumpBytes, DumpBytes); Console.ReadLine(); } static void DumpBytes(string text) { Console.Write(text + " " + string.Join(",", Encoding.UTF8.GetBytes(text).Select(b => b.ToString("X")))); Console.WriteLine(); } static int ExecuteCommand(string […]

Unicode可打印字符的范围是什么?

任何人都可以告诉我什么是Unicode可打印字符的范围? [例如Ascii可打印的字符范围是\ u0020 – \ u007f]

如何更正文件的字符编码?

我有一个ANSI编码的文本文件,不应该被编码为ANSI,因为有ANSI重音字符不支持。 我宁愿使用UTF-8。 数据可以正确解码还是在转码中丢失? 我可以使用哪些工具? 这里是我所拥有的一个样本: ç é 从上下文(café应该是咖啡馆)我可以看出这些应该是这两个字符: ç é