Tag: 字符编码

如何将默认编码更改为UTF-8的Apache？: 我正在使用托pipe公司，如果文件index.html不存在，它将列出目录中的文件，它使用iso-8859-1作为默认编码。如果服务器是Apache，是否有办法将UTF-8设置为默认值？更新：此外，我发现它实际上是使用HTML 3.2的DOCTYPE，然后根本没有字符集…所以它没有设置任何编码。但有没有办法改变它使用UTF-8？

通过PrimeFacesinput组件检索的Unicodeinput已损坏: 当我还在使用PrimeFaces v2.2.1时，我能够使用PrimeFacesinput组件（如<p:inputText>和<p:editor>inputunicodeinput，例如中文，并在托pipebean方法中检索input状态良好。但是，升级到PrimeFaces v3.1.1后，所有这些字符都变成了Mojibake或问号。只有拉丁文的input才算正常，是中文，阿拉伯文，希伯来文，西里尔文等变得格格不入的文字。这是如何造成的，我该如何解决？

在Python 3中将string转换为字节的最佳方法是什么？: 似乎有两种不同的方式将string转换为字节，如TypeError的答案中所示：“str”不支持缓冲区接口哪种方法会更好或者更加Pythonic？还是只是个人喜好的问题？ b = bytes(mystring, 'utf-8') b = mystring.encode('utf-8')

在Python源码中使用utf-8编码: $ cat bla.py u = unicode('d…') s = u.encode('utf-8') print s $ python bla.py File "bla.py", line 1 SyntaxError: Non-ASCII character '\xe2' in file bla.py on line 1, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details 如何在源代码中声明utf-8string？

在MySQL数据库中用阿拉伯语保存数据: 我已经改变了表和列的字符集，我得到了阿拉伯文字为？标记在MYSQL数据库中这里是桌子的devise CREATE DATABASE mydb DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; CREATE TABLE `categories` ( `category_id` tinyint(2) NOT NULL auto_increment, `category_name` varchar(50)character set utf8 NOT NULL , PRIMARY KEY (`category_id`) insert into `mydb`.`categories` (`category_id`, `category_name`) values (1,'کتگوری'); commit; 当我再次select查询时，它显示???? 作为文字？谁能告诉我我在哪里做错了？

我真的需要将“＆”编码为“＆amp;”吗？: 我在我的网站的<title>使用HTML5和UTF-8的“ & ”符号。 Google在其SERP上显示了＆符号，正如其标题中的所有浏览器一样。 http://validator.w3.org给我这个：＆没有开始一个字符引用。（＆可能应该已经逃过了）。我真的需要做& ？我并不是为了validation而对我的页面进行validation，但我很好奇听到人们对此的意见，如果这很重要，为什么。

什么是字符编码，为什么我应该打扰它: 我对字符编码的概念很困惑。什么是Unicode，GBK等？编程语言如何使用它们？我需要打扰他们吗？有没有更简单或更快的编程方式，而不必麻烦自己呢？

我怎样才能在PHP中获得一个string的hex转储？: 我正在调查PHP5中的编码。有没有办法得到一个string的原始hex转储？即一个string中的每个字节（不是字符）的hex表示？

检测编码，并使所有的UTF-8: 我正在从各种RSS源中读出大量文本，并将它们插入到我的数据库中。当然，Feed中使用了几种不同的字符编码，例如UTF-8和ISO-8859-1。不幸的是，文本的编码有时会出现问题。例： 1）“Fußball”中的“ß”在我的数据库中应该是这样的：“ÂŸ”。如果是“ÂŸ”，则显示正确。 2）有时，“Fußball”中的“ß”在我的数据库中是这样的：“ÃƒÂŸ”。那当然是显示错误了。 3）在其他情况下，“ß”被保存为“ß” – 所以没有任何改变。然后它也显示错误。我能做些什么来避免案例2和3？我怎样才能使所有的编码相同，最好是UTF-8？何时必须使用utf8_encode（），何时必须使用utf8_decode（）（显然是什么效果，但何时必须使用函数？），什么时候必须对input做什么？你能帮助我，告诉我如何使一切相同的编码？也许与函数mb-detect-encoding（）？我可以为此写一个函数吗？所以我的问题是：1）如何找出文本使用什么编码2）如何将其转换为UTF-8 – 无论旧编码是什么编辑：这样的function会工作吗？ function correct_encoding($text) { $current_encoding = mb_detect_encoding($text, 'auto'); $text = iconv($current_encoding, 'UTF-8', $text); return $text; } 我已经testing过，但不起作用。它出什么问题了？

在my.cnf中将MySQL默认字符集更改为UTF-8？: 目前我们在PHP中使用以下命令将字符集设置为UTF-8 。由于这是一个开销，我们希望将其设置为MySQL中的默认设置。我们可以在/etc/my.cnf或其他位置执行此操作吗？ SET NAMES 'utf8' SET CHARACTER SET utf8 我在/etc/my.cnf中查找了一个默认的字符集，但是没有关于字符集的东西。在这一点上，我做了以下操作将MySQL字符集和归类variables设置为UTF-8： skip-character-set-client-handshake character_set_client=utf8 character_set_server=utf8 这是处理这个问题的正确方法吗？