Tag: 编码

通过脚本中的vim将文件编码更改为utf-8: 在我们的服务器已经从Debian 4更新到5之后，我刚刚被击倒。我们切换到UTF-8环境，现在我们在浏览器上正确打印文本时遇到问题，因为所有文件都是非UTF8编码， 8859-1，ascii等我尝试了许多不同的脚本。我尝试的第一个是“iconv”。那一个不工作，它改变了内容，但文件的enconding仍然是非utf8。 enca，encamv，convmv和其他一些我通过apt-get安装的工具也有同样的问题。然后，我发现一个python代码，它使用chardet通用检测模块来检测文件的编码（工作正常），但使用unicode类或编解码类保存为utf-8不工作，没有任何错误。我发现将文件及其内容转换为UTF-8的唯一方法是vi。这些是我为一个文件做的步骤： vi filename.php :set bomb :set fileencoding=utf-8 :wq 而已。那个作品完美。但是怎样才能通过脚本来运行。我想写一个脚本（Linux shell），它遍历一个目录，获取所有的php文件，然后使用上面的命令使用vi转换它们。由于我需要启动vi应用程序，我不知道如何做这样的事情： "vi –run-command=':set bomb, :set fileencoding=utf-8' filename.php" 希望可以有人帮帮我。

如何读取包含特殊字符的ANSI编码文件: 我正在写一个TFS签入策略，它检查我们的源文件是否包含我们的文件头。我的问题是，我们的文件头包含一个特殊的字符“©”，不幸的是我们的一些源文件在ANSI编码。所以如果我在策略中读取这些文件，这个string看起来就像这个“Copyright？2009”。 string content = File.ReadAllText(pendingChange.LocalItem); 我厌倦了改变string的编码，但它没有帮助。那我该如何读取这些文件，才能得到正确的string“Copyright©2009”？感谢帮助！问候恩

在崇高文本中使用BOM将文件的编码设置为UTF8 3: 当我在Sublime Text 3中打开文件时，在底部我有一个选项来设置字符编码，如屏幕截图所示。可以select将它设置为UTF-8 ，在做了一些研究之后，UTF-8就没有BOM了，但是我想把它设置为UTF-8，如下所示：我怎样才能在ST3内做到这一点？任何帮助将不胜感激。谢谢

保存文件时Microsoft Excel使用什么字符集？: 我有一个Java应用程序读取已在Excel中创build的CSV文件（例如2007年）。有谁知道什么字符集MS Excel用来保存这些文件？我会猜到： windows-1255（Cp1255） ISO-8859-1 UTF8 但我无法使用这些字符集types中的任何一种来解码扩展字符（例如法语突出字母）。

用于存储经度和纬度的适当/最佳types: 在像C，C ++或D这样的系统级编程语言中，什么是存储经度和纬度的最佳types/编码？我看到的选项是： IEEE-754 FP为度或弧度度或弧度存储为一个32位或64位int的定点值整数范围映射到程度范围： – > deg = (360/2^32)*val 度，分，秒和分数秒作为位字段存储在一个int中某种结构。简单的解决scheme（FP）具有非常不均匀的分辨率（在英国的某个地方可以以微米计量，而在日本则不能），这是主要的缺点。这也有所有的FP比较和什么的问题。其他选项在数据生命周期的不同部分需要额外的努力。（生成，演示，计算等）一个有趣的select是浮动精度types，随着纬度的增加，它得到更多的位，经度变得更小（当它们靠近极点时）。相关的问题不完全包括这个：在MySQL中存储纬度/经度时使用的理想数据types是什么？在Java中使用纬度/经度值顺便说一下：32位在赤道约0.3英寸处给出E / W分辨率，这与高等级GPS设置可以工作的规模（在某些模式下，它们可以降至约0.5英寸）相近。 OTOH如果32位均匀地分布在地球表面，则可以在一侧上标注344m的正方形，5字节为21m，6B-> 1.3m和8B-> 5mm。我现在没有具体的用途，但是之前曾经和这种东西合作过，期待在某个时候再次。

为什么我应该使用人类可读的文件格式？: 为什么我应该使用人类可读的文件格式而不是二进制文件？当情况不是这样的时候，有没有这种情况？编辑：最初发布这个问题时，我确实有这个解释，但是现在并不那么重要：当回答这个问题时，我想引用提问者一个标准的答案，为什么使用人类可读的文件格式是一个好主意。然后我search了一个，找不到一个。所以这是个问题

更改记事本++的默认编码: 而已。我想一次打开所有文件（进行replace）。但notepad ++在ANSI中打开它们，我必须通过每个文件并将编码更改为UTF-8。

“用于编码UTF-8的不可映射字符”错误: 我在下面的方法得到一个编译错误。 public static boolean isValidPasswd(String passwd) { String reg = "^(?=.*[0-9])(?=.*[az])(?=.*[AZ])(?=.*[~#;:?/@&!\"'%*=¬.,-])(?=[^\\s]+$).{8,24}$"; return Pattern.matches(reg, passwd); } 在Utility.java:[76,74]不可映射的字符编码UTF-8。第74个字符是''' 我怎样才能解决这个问题？谢谢。

为表单提交Internet Explorer设置字符编码: 我有一个包含表单的页面。此页面的内容types为text / html; charset = utf-8。我需要使用ISO-8859-1字符编码将此表单提交给服务器。这是可能的Internet Explorer？设置accept-charset属性来形成元素，像这样，适用于Firefox，Opera等，但不适用于IE。 <form accept-charset="ISO-8859-1"> … </form> 编辑：这个表单是由服务器A创build的，并将提交给服务器B.我无法控制服务器B. 如果我设置服务器A服务内容与字符集ISO-8859-1一切正常，但我正在寻找一种方式，使服务器A的编码没有改变的工作。我有另外一个关于在服务器A中设置编码的问题

为什么真实世界的服务器更喜欢使用gzip而不是deflate编码？: 我们已经知道deflate编码在编码，解码和压缩速度方面比gzip更胜一筹。那么为什么没有大的网站（我可以find）发送它（当我使用接受它的浏览器）？雅虎声称放气是“不太有效”。为什么？我维护的HTTP服务器软件，宁愿放气，所以我想知道是否有一些真正的理由不继续这样做。