Tag: unicode

如何国际化Java Web应用程序?

我从Google那里了解到,国际化是我可以使我的Web应用程序使用所有语言的过程。 我想了解Unicode的国际化进程,所以我从各处学习了Unicode。 我能够了解Unicode如何将字符集编码为字节,再将字节解码为字符集。 但是我不知道如何继续前进。 我想学习如何比较string,我需要知道如何在我的web应用程序中实现国际化。 有什么build议吗? 请指导我 我的目标: 我的主要目标是开发一个用于翻译的Web应用程序(英语到阿拉伯语,反之亦然)。 我想遵循国际化。 我希望在所有三种浏览器(FF,Chrome,IE)中运行我的Web应用程序进行翻译。 我如何做到这一点?

utf8_general_ci和utf8_unicode_ci有什么区别?

在utf8_general_ci和utf8_unicode_ci ,在性能方面有什么区别吗?

反转string的最佳方法

我只是不得不在C#2.0中编写一个string反向函数(即LINQ不可用),并提出了这个问题: public string Reverse(string text) { char[] cArray = text.ToCharArray(); string reverse = String.Empty; for (int i = cArray.Length – 1; i > -1; i–) { reverse += cArray[i]; } return reverse; } 就我个人而言,我并不是对这个function感到兴奋,而是相信有更好的方法去做。 在那儿?

URL中的Unicode字符

2010年,您会在大型门户网站上提供包含UTF-8字符的url吗? 根据URL上的RFC,禁止Unicode字符(请参阅此处 )。 他们必须百分比编码符合标准。 但是我的主要观点是提供未编码字符的唯一目的是看起来漂亮的URL,所以百分比编码已经不存在了。 所有的主stream浏览器似乎都是parsing这些URL,不pipeRFC说什么。 然而,我的一般印象是,离开networking浏览器的领域时,它变得非常不稳固: 将URL复制粘贴到文本文件,电子邮件,甚至是具有不同编码的网站 HTTP客户端库 异国情调的浏览器,RSS阅读器 我的印象是正确的,在这里可能会遇到麻烦,因此,如果您服务于非技术性的受众群体,那么这不是一个实际的解决scheme,重要的是即使引用并传递了所有链接也能正常工作。 是否有一些神奇的方式在HTML中提供漂亮的url http://www.example.com/düsseldorf?neighbourhood=Lörick 可以复制+粘贴完整的特殊字符,但在旧客户端重复使用时可以正常工作?

在Windows控制台应用程序中输出unicodestring

您好我试图输出unicodestring与控制台与iostreams和失败。 我发现这一点: 在c + +控制台应用程序中使用unicode字体和此代码段的作品。 SetConsoleOutputCP(CP_UTF8); wchar_t s[] = L"èéøÞǽлљΣæča"; int bufferSize = WideCharToMultiByte(CP_UTF8, 0, s, -1, NULL, 0, NULL, NULL); char* m = new char[bufferSize]; WideCharToMultiByte(CP_UTF8, 0, s, -1, m, bufferSize, NULL, NULL); wprintf(L"%S", m); 但是,我没有find任何方法正确输出与iostreams的Unicode。 有什么build议么? 这不起作用: SetConsoleOutputCP(CP_UTF8); utf8_locale = locale(old_locale,new boost::program_options::detail::utf8_codecvt_facet()); wcout.imbue(utf8_locale); wcout << L"¡Hola!" << endl; 编辑我找不到任何其他的解决scheme,而不是把这个片段包在一个stream中。 希望有人有更好的想法。 //Unicode output for […]

如何将Unicode转义序列(如“\ u00ed”)解码为正确的UTF-8编码字符?

有没有在PHP中的function,可以解码Unicode转义序列,如“ \u00ed ”到“ í ”和所有其他类似的事件? 我在这里发现类似的问题,但似乎并没有工作。

删除Python unicodestring中的重音符号的最佳方法是什么?

我在Python中有一个Unicodestring,我想删除所有的重音符(变音符号)。 我在网上find了一个在Java中这样做的优雅方法: 将Unicodestring转换为其长规格化forms(使用单独的字母和变音符号) 删除Unicodetypes为“diacritic”的所有字符。 我是否需要安装一个库,比如pyICU,或者只用python标准库就可以吗? 那么python 3呢? 重要说明:我想避免代码显式地从重音字符映射到非重音字符。

std :: wstring VS std :: string

我无法理解std::string和std::wstring之间的区别。 我知道wstring支持宽字符,如Unicode字符。 我有以下问题: 什么时候应该使用std::wstring std::string ? std::string保存整个ASCII字符集,包括特殊字符吗? 所有stream行的C ++编译器都支持std::wstring吗? 什么是“ 宽字符 ”?

b字符在string前做了什么?

显然,以下是有效的语法… my_string = b'The string' 我想知道… string的前面是什么意思? 使用它的效果是什么? 什么是适当的情况下使用它。 我在这里find了一个相关的问题 ,但是这个问题是关于PHP的,虽然它说明b是用来表示string是二进制的,而不是unicode,这是需要代码从PHP版本<6兼容时迁移到PHP 6.我不认为这适用于Python。 我没有在python网站上find关于在同一语法中使用u字符来指定一个string为unicode的文档 。 不幸的是,它没有提到该文件中任何地方的b字符。 另外,出于好奇,除了b和u之外,还有其他的符号吗?

Javascript + Unicode正则expression式

如何在JavaScript中使用支持Unicode的正则expression式? 例如,应该有类似于\ w的东西,可以匹配任何字母或标记类别中的代码点(不仅仅是ASCII文件),并且希望有标点符号等[[P *]]的filter。