Tag: unicode

如何国际化Java Web应用程序？: 我从Google那里了解到，国际化是我可以使我的Web应用程序使用所有语言的过程。我想了解Unicode的国际化进程，所以我从各处学习了Unicode。我能够了解Unicode如何将字符集编码为字节，再将字节解码为字符集。但是我不知道如何继续前进。我想学习如何比较string，我需要知道如何在我的web应用程序中实现国际化。有什么build议吗？请指导我我的目标：我的主要目标是开发一个用于翻译的Web应用程序（英语到阿拉伯语，反之亦然）。我想遵循国际化。我希望在所有三种浏览器（FF，Chrome，IE）中运行我的Web应用程序进行翻译。我如何做到这一点？

utf8_general_ci和utf8_unicode_ci有什么区别？: 在utf8_general_ci和utf8_unicode_ci ，在性能方面有什么区别吗？

反转string的最佳方法: 我只是不得不在C＃2.0中编写一个string反向函数（即LINQ不可用），并提出了这个问题： public string Reverse(string text) { char[] cArray = text.ToCharArray(); string reverse = String.Empty; for (int i = cArray.Length – 1; i > -1; i–) { reverse += cArray[i]; } return reverse; } 就我个人而言，我并不是对这个function感到兴奋，而是相信有更好的方法去做。在那儿？

URL中的Unicode字符: 2010年，您会在大型门户网站上提供包含UTF-8字符的url吗？根据URL上的RFC，禁止Unicode字符（请参阅此处）。他们必须百分比编码符合标准。但是我的主要观点是提供未编码字符的唯一目的是看起来漂亮的URL，所以百分比编码已经不存在了。所有的主stream浏览器似乎都是parsing这些URL，不pipeRFC说什么。然而，我的一般印象是，离开networking浏览器的领域时，它变得非常不稳固：将URL复制粘贴到文本文件，电子邮件，甚至是具有不同编码的网站 HTTP客户端库异国情调的浏览器，RSS阅读器我的印象是正确的，在这里可能会遇到麻烦，因此，如果您服务于非技术性的受众群体，那么这不是一个实际的解决scheme，重要的是即使引用并传递了所有链接也能正常工作。是否有一些神奇的方式在HTML中提供漂亮的url http://www.example.com/düsseldorf?neighbourhood=Lörick 可以复制+粘贴完整的特殊字符，但在旧客户端重复使用时可以正常工作？

在Windows控制台应用程序中输出unicodestring: 您好我试图输出unicodestring与控制台与iostreams和失败。我发现这一点：在c + +控制台应用程序中使用unicode字体和此代码段的作品。 SetConsoleOutputCP(CP_UTF8); wchar_t s[] = L"èéøÞǽлљΣæča"; int bufferSize = WideCharToMultiByte(CP_UTF8, 0, s, -1, NULL, 0, NULL, NULL); char* m = new char[bufferSize]; WideCharToMultiByte(CP_UTF8, 0, s, -1, m, bufferSize, NULL, NULL); wprintf(L"%S", m); 但是，我没有find任何方法正确输出与iostreams的Unicode。有什么build议么？这不起作用： SetConsoleOutputCP(CP_UTF8); utf8_locale = locale(old_locale,new boost::program_options::detail::utf8_codecvt_facet()); wcout.imbue(utf8_locale); wcout << L"¡Hola!" << endl; 编辑我找不到任何其他的解决scheme，而不是把这个片段包在一个stream中。希望有人有更好的想法。 //Unicode output for […]

如何将Unicode转义序列（如“\ u00ed”）解码为正确的UTF-8编码字符？: 有没有在PHP中的function，可以解码Unicode转义序列，如“ \u00ed ”到“ í ”和所有其他类似的事件？我在这里发现类似的问题，但似乎并没有工作。

删除Python unicodestring中的重音符号的最佳方法是什么？: 我在Python中有一个Unicodestring，我想删除所有的重音符（变音符号）。我在网上find了一个在Java中这样做的优雅方法：将Unicodestring转换为其长规格化forms（使用单独的字母和变音符号）删除Unicodetypes为“diacritic”的所有字符。我是否需要安装一个库，比如pyICU，或者只用python标准库就可以吗？那么python 3呢？重要说明：我想避免代码显式地从重音字符映射到非重音字符。

std :: wstring VS std :: string: 我无法理解std::string和std::wstring之间的区别。我知道wstring支持宽字符，如Unicode字符。我有以下问题：什么时候应该使用std::wstring std::string ？ std::string保存整个ASCII字符集，包括特殊字符吗？所有stream行的C ++编译器都支持std::wstring吗？什么是“ 宽字符 ”？

b字符在string前做了什么？: 显然，以下是有效的语法… my_string = b'The string' 我想知道… string的前面是什么意思？使用它的效果是什么？什么是适当的情况下使用它。我在这里find了一个相关的问题，但是这个问题是关于PHP的，虽然它说明b是用来表示string是二进制的，而不是unicode，这是需要代码从PHP版本<6兼容时迁移到PHP 6.我不认为这适用于Python。我没有在python网站上find关于在同一语法中使用u字符来指定一个string为unicode的文档。不幸的是，它没有提到该文件中任何地方的b字符。另外，出于好奇，除了b和u之外，还有其他的符号吗？

Javascript + Unicode正则expression式: 如何在JavaScript中使用支持Unicode的正则expression式？例如，应该有类似于\ w的东西，可以匹配任何字母或标记类别中的代码点（不仅仅是ASCII文件），并且希望有标点符号等[[P *]]的filter。