Tag: 字符编码

如何从ASCII字符代码在C#中获取一个字符

我试图分析一个文件在c#中的字段(string)数组由ASCII码字符代码0,1和2分隔(在Visual Basic 6中,您可以通过使用Chr(0)或Chr(1)等产生这些) 我知道,在c#中的字符代码0,你可以做到以下几点: char separator = '\0'; 但是这不适用于字符代码1和2?

通过脚本中的vim将文件编码更改为utf-8

在我们的服务器已经从Debian 4更新到5之后,我刚刚被击倒。我们切换到UTF-8环境,现在我们在浏览器上正确打印文本时遇到问题,因为所有文件都是非UTF8编码, 8859-1,ascii等 我尝试了许多不同的脚本。 我尝试的第一个是“iconv”。 那一个不工作,它改变了内容,但文件的enconding仍然是非utf8。 enca,encamv,convmv和其他一些我通过apt-get安装的工具也有同样的问题。 然后,我发现一个python代码,它使用chardet通用检测模块来检测文件的编码(工作正常),但使用unicode类或编解码类保存为utf-8不工作,没有任何错误。 我发现将文件及其内容转换为UTF-8的唯一方法是vi。 这些是我为一个文件做的步骤: vi filename.php :set bomb :set fileencoding=utf-8 :wq 而已。 那个作品完美。 但是怎样才能通过脚本来运行。 我想写一个脚本(Linux shell),它遍历一个目录,获取所有的php文件,然后使用上面的命令使用vi转换它们。 由于我需要启动vi应用程序,我不知道如何做这样的事情: "vi –run-command=':set bomb, :set fileencoding=utf-8' filename.php" 希望可以有人帮帮我。

在Java中,如何查找string中的第一个字符是否为大写,而不使用正则expression式

在Java中,查找string中的第一个字符是否为大写,而不使用正则expression式。

json_encode():参数中的UTF-8序列无效

我使用utf8_general_ci归类对来自MySQL数据库的数据调用json_encode() 。 问题是有些行有奇怪的数据,我不能清理。 例如符号 ,所以一旦到达json_encode() ,就会失败,并带有json_encode(): Invalid UTF-8 sequence in argument 。 我尝试过使用utf8_encode()和utf8_decode() ,即使使用mb_check_encoding()但它一直在通过并造成严重破坏。 在Mac上运行PHP 5.3.10。 所以问题是 – 我怎样才能清理无效的utf8符号,保留其余的数据,以便json_encoding()将工作? 更新。 这是一个重现它的方法: echo json_encode(pack("H*" ,'c32e'));

如何从文本文件中删除非UTF-8字符

我有一堆用utf-8编码的阿拉伯文,英文,俄文文件。 试图用Perl脚本处理这些文件,我得到这个错误: Malformed UTF-8 character (fatal) 手动检查这些文件的内容,我发现了一些奇怪的字符。 现在我正在寻找一种方法来自动从文件中删除这些字符。 有没有办法呢?

保存文件时Microsoft Excel使用什么字符集?

我有一个Java应用程序读取已在Excel中创build的CSV文件(例如2007年)。 有谁知道什么字符集MS Excel用来保存这些文件? 我会猜到: windows-1255(Cp1255) ISO-8859-1 UTF8 但我无法使用这些字符集types中的任何一种来解码扩展字符(例如法语突出字母)。

如何在Java中转换ISO-8859-1和UTF-8?

有谁知道如何将string从ISO-8859-1转换为UTF-8并返回到Java? 我从网上获取一个string并将其保存在RMS(J2ME)中,但我想保留特殊字符,并从RMS获取string,但使用ISO-8859-1编码。 我该怎么做呢?

ASCII码是7位还是8位?

我的老师告诉我,ASCII是8位字符编码scheme。 但是它只被定义为0-127码,这意味着它可以适合7位。 那么难道说ASCII位实际上是7位代码吗? 当说ASCII是8位代码的时候,我们说什么意思呢?

Spring MVC中的UTF-8编码,FORMs问题

我有这个在web.xml中 <filter> <filter-name>encoding-filter</filter-name> <filter-class> org.springframework.web.filter.CharacterEncodingFilter </filter-class> <init-param> <param-name>encoding</param-name> <param-value>UTF-8</param-value> </init-param> <init-param> <param-name>forceEncoding</param-name> <param-value>true</param-value> </init-param> </filter> <filter-mapping> <filter-name>encoding-filter</filter-name> <url-pattern>/*</url-pattern> </filter-mapping> 并在file.jsp的顶部我有这样的: <%@ page pageEncoding="UTF-8" contentType="text/html; charset=UTF-8" %> 在<head> : <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> 和FORM以方法POST设置的拉丁-1以外的字符仍然不正确。

li:之前{content:“■”; }如何将这个特殊字符编码为电子邮件信纸中的一个恶棍?

自豪地着色我的liststyle项目符号没有任何图像url或span标签 ,通过: ul{ list-style: none; padding:0; margin:0; } li{ padding-left: 1em; text-indent: -1em; } li:before { content: "■"; padding-right:7px; } 尽pipe这些样式表可以完美的工作在圆angular边框和其他css3的东西上,尽pipe电子邮件的接收者(例如Eudora OSE 1)正确地呈现了所有的css样式,就像在浏览器中一样,还是有一个问题: •或者•变成&#adabacadabra; 终于在电子邮件中出现: 我怎么从这里开始?