Tag: 字符编码

如何将默认编码更改为UTF-8的Apache?

我正在使用托pipe公司,如果文件index.html不存在,它将列出目录中的文件,它使用iso-8859-1作为默认编码。 如果服务器是Apache,是否有办法将UTF-8设置为默认值? 更新:此外,我发现它实际上是使用HTML 3.2的DOCTYPE,然后根本没有字符集…所以它没有设置任何编码。 但有没有办法改变它使用UTF-8?

通过PrimeFacesinput组件检索的Unicodeinput已损坏

当我还在使用PrimeFaces v2.2.1时,我能够使用PrimeFacesinput组件(如<p:inputText>和<p:editor>inputunicodeinput,例如中文,并在托pipebean方法中检索input状态良好。 但是,升级到PrimeFaces v3.1.1后,所有这些字符都变成了Mojibake或问号。 只有拉丁文的input才算正常,是中文,阿拉伯文,希伯来文,西里尔文等变得格格不入的文字。 这是如何造成的,我该如何解决?

在Python 3中将string转换为字节的最佳方法是什么?

似乎有两种不同的方式将string转换为字节,如TypeError的答案中所示:“str”不支持缓冲区接口 哪种方法会更好或者更加Pythonic? 还是只是个人喜好的问题? b = bytes(mystring, 'utf-8') b = mystring.encode('utf-8')

在Python源码中使用utf-8编码

$ cat bla.py u = unicode('d…') s = u.encode('utf-8') print s $ python bla.py File "bla.py", line 1 SyntaxError: Non-ASCII character '\xe2' in file bla.py on line 1, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details 如何在源代码中声明utf-8string?

在MySQL数据库中用阿拉伯语保存数据

我已经改变了表和列的字符集,我得到了阿拉伯文字为? 标记在MYSQL数据库中 这里是桌子的devise CREATE DATABASE mydb DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; CREATE TABLE `categories` ( `category_id` tinyint(2) NOT NULL auto_increment, `category_name` varchar(50)character set utf8 NOT NULL , PRIMARY KEY (`category_id`) insert into `mydb`.`categories` (`category_id`, `category_name`) values (1,'کتگوری'); commit; 当我再次select查询时,它显示???? 作为文字? 谁能告诉我我在哪里做错了?

我真的需要将“&”编码为“&amp;”吗?

我在我的网站的<title>使用HTML5和UTF-8的“ & ”符号。 Google在其SERP上显示了&符号,正如其标题中的所有浏览器一样。 http://validator.w3.org给我这个: &没有开始一个字符引用。 (&可能应该已经逃过了)。 我真的需要做&amp; ? 我并不是为了validation而对我的页面进行validation,但我很好奇听到人们对此的意见,如果这很重要,为什么。

什么是字符编码,为什么我应该打扰它

我对字符编码的概念很困惑。 什么是Unicode,GBK等? 编程语言如何使用它们? 我需要打扰他们吗? 有没有更简单或更快的编程方式,而不必麻烦自己呢?

我怎样才能在PHP中获得一个string的hex转储?

我正在调查PHP5中的编码。 有没有办法得到一个string的原始hex转储? 即一个string中的每个字节(不是字符)的hex表示?

检测编码,并使所有的UTF-8

我正在从各种RSS源中读出大量文本,并将它们插入到我的数据库中。 当然,Feed中使用了几种不同的字符编码,例如UTF-8和ISO-8859-1。 不幸的是,文本的编码有时会出现问题。 例: 1)“Fußball”中的“ß”在我的数据库中应该是这样的:“Ÿ”。 如果是“Ÿ”,则显示正确。 2)有时,“Fußball”中的“ß”在我的数据库中是这样的:“ß”。 那当然是显示错误了。 3)在其他情况下,“ß”被保存为“ß” – 所以没有任何改变。 然后它也显示错误。 我能做些什么来避免案例2和3? 我怎样才能使所有的编码相同,最好是UTF-8? 何时必须使用utf8_encode(),何时必须使用utf8_decode()(显然是什么效果,但何时必须使用函数?),什么时候必须对input做什么? 你能帮助我,告诉我如何使一切相同的编码? 也许与函数mb-detect-encoding()? 我可以为此写一个函数吗? 所以我的问题是:1)如何找出文本使用什么编码2)如何将其转换为UTF-8 – 无论旧编码是什么 编辑:这样的function会工作吗? function correct_encoding($text) { $current_encoding = mb_detect_encoding($text, 'auto'); $text = iconv($current_encoding, 'UTF-8', $text); return $text; } 我已经testing过,但不起作用。 它出什么问题了?

在my.cnf中将MySQL默认字符集更改为UTF-8?

目前我们在PHP中使用以下命令将字符集设置为UTF-8 。 由于这是一个开销,我们希望将其设置为MySQL中的默认设置。 我们可以在/etc/my.cnf或其他位置执行此操作吗? SET NAMES 'utf8' SET CHARACTER SET utf8 我在/etc/my.cnf中查找了一个默认的字符集,但是没有关于字符集的东西。 在这一点上,我做了以下操作将MySQL字符集和归类variables设置为UTF-8: skip-character-set-client-handshake character_set_client=utf8 character_set_server=utf8 这是处理这个问题的正确方法吗?