Tag: 编码

通过脚本中的vim将文件编码更改为utf-8

在我们的服务器已经从Debian 4更新到5之后,我刚刚被击倒。我们切换到UTF-8环境,现在我们在浏览器上正确打印文本时遇到问题,因为所有文件都是非UTF8编码, 8859-1,ascii等 我尝试了许多不同的脚本。 我尝试的第一个是“iconv”。 那一个不工作,它改变了内容,但文件的enconding仍然是非utf8。 enca,encamv,convmv和其他一些我通过apt-get安装的工具也有同样的问题。 然后,我发现一个python代码,它使用chardet通用检测模块来检测文件的编码(工作正常),但使用unicode类或编解码类保存为utf-8不工作,没有任何错误。 我发现将文件及其内容转换为UTF-8的唯一方法是vi。 这些是我为一个文件做的步骤: vi filename.php :set bomb :set fileencoding=utf-8 :wq 而已。 那个作品完美。 但是怎样才能通过脚本来运行。 我想写一个脚本(Linux shell),它遍历一个目录,获取所有的php文件,然后使用上面的命令使用vi转换它们。 由于我需要启动vi应用程序,我不知道如何做这样的事情: "vi –run-command=':set bomb, :set fileencoding=utf-8' filename.php" 希望可以有人帮帮我。

如何读取包含特殊字符的ANSI编码文件

我正在写一个TFS签入策略,它检查我们的源文件是否包含我们的文件头。 我的问题是,我们的文件头包含一个特殊的字符“©”,不幸的是我们的一些源文件在ANSI编码。 所以如果我在策略中读取这些文件,这个string看起来就像这个“Copyright?2009”。 string content = File.ReadAllText(pendingChange.LocalItem); 我厌倦了改变string的编码,但它没有帮助。 那我该如何读取这些文件,才能得到正确的string“Copyright©2009”? 感谢帮助! 问候恩

在崇高文本中使用BOM将文件的编码设置为UTF8 3

当我在Sublime Text 3中打开文件时,在底部我有一个选项来设置字符编码,如屏幕截图所示。 可以select将它设置为UTF-8 ,在做了一些研究之后,UTF-8就没有BOM了,但是我想把它设置为UTF-8,如下所示: 我怎样才能在ST3内做到这一点? 任何帮助将不胜感激。 谢谢

保存文件时Microsoft Excel使用什么字符集?

我有一个Java应用程序读取已在Excel中创build的CSV文件(例如2007年)。 有谁知道什么字符集MS Excel用来保存这些文件? 我会猜到: windows-1255(Cp1255) ISO-8859-1 UTF8 但我无法使用这些字符集types中的任何一种来解码扩展字符(例如法语突出字母)。

用于存储经度和纬度的适当/最佳types

在像C,C ++或D这样的系统级编程语言中,什么是存储经度和纬度的最佳types/编码? 我看到的选项是: IEEE-754 FP为度或弧度 度或弧度存储为一个32位或64位int的定点值 整数范围映射到程度范围: – > deg = (360/2^32)*val 度,分,秒和分数秒作为位字段存储在一个int中 某种结构。 简单的解决scheme(FP)具有非常不均匀的分辨率(在英国的某个地方可以以微米计量,而在日本则不能),这是主要的缺点。 这也有所有的FP比较和什么的问题。 其他选项在数据生命周期的不同部分需要额外的努力。 (生成,演示,计算等) 一个有趣的select是浮动精度types,随着纬度的增加,它得到更多的位,经度变得更小(当它们靠近极点时)。 相关的问题不完全包括这个: 在MySQL中存储纬度/经度时使用的理想数据types是什么? 在Java中使用纬度/经度值 顺便说一下:32位在赤道约0.3英寸处给出E / W分辨率,这与高等级GPS设置可以工作的规模(在某些模式下,它们可以降至约0.5英寸)相近。 OTOH如果32位均匀地分布在地球表面,则可以在一侧上标注344m的正方形,5字节为21m,6B-> 1.3m和8B-> 5mm。 我现在没有具体的用途,但是之前曾经和这种东西合作过,期待在某个时候再次。

为什么我应该使用人类可读的文件格式?

为什么我应该使用人类可读的文件格式而不是二进制文件? 当情况不是这样的时候,有没有这种情况? 编辑:最初发布这个问题时,我确实有这个解释,但是现在并不那么重要: 当回答这个问题时,我想引用提问者一个标准的答案,为什么使用人类可读的文件格式是一个好主意。 然后我search了一个,找不到一个。 所以这是个问题

更改记事本++的默认编码

而已 。 我想一次打开所有文件(进行replace)。 但notepad ++在ANSI中打开它们,我必须通过每个文件并将编码更改为UTF-8。

“用于编码UTF-8的不可映射字符”错误

我在下面的方法得到一个编译错误。 public static boolean isValidPasswd(String passwd) { String reg = "^(?=.*[0-9])(?=.*[az])(?=.*[AZ])(?=.*[~#;:?/@&!\"'%*=¬.,-])(?=[^\\s]+$).{8,24}$"; return Pattern.matches(reg, passwd); } 在Utility.java:[76,74]不可映射的字符 编码UTF-8。 第74个字符是''' 我怎样才能解决这个问题? 谢谢。

为表单提交Internet Explorer设置字符编码

我有一个包含表单的页面。 此页面的内容types为text / html; charset = utf-8。 我需要使用ISO-8859-1字符编码将此表单提交给服务器。 这是可能的Internet Explorer? 设置accept-charset属性来形成元素,像这样,适用于Firefox,Opera等,但不适用于IE。 <form accept-charset="ISO-8859-1"> … </form> 编辑:这个表单是由服务器A创build的,并将提交给服务器B.我无法控制服务器B. 如果我设置服务器A服务内容与字符集ISO-8859-1一切正常,但我正在寻找一种方式,使服务器A的编码没有改变的工作。 我有另外一个关于在服务器A中设置编码的问题

为什么真实世界的服务器更喜欢使用gzip而不是deflate编码?

我们已经知道deflate编码在编码,解码和压缩速度方面比gzip更胜一筹。 那么为什么没有大的网站(我可以find)发送它(当我使用接受它的浏览器)? 雅虎声称放气是“不太有效”。 为什么? 我维护的HTTP服务器软件,宁愿放气,所以我想知道是否有一些真正的理由不继续这样做。