Tag: unicode

在CSS内容值中放置Unicode字符

我有个问题。 我find了向下箭头的HTML代码, ↓ (↓) 凉。 现在我需要像这样在CSS中使用它: nav a:hover {content:"&darr";} 自从↓显然是↓ 是一个HTML符号。 似乎有关于这些在css中使用的“逃脱unicode”符号的信息。 还有其他符号,例如\2020 ,我find了,但没有箭头。 什么是箭头代码?

Python __str__与__unicode__

有什么时候应该实现__str__()和__unicode__()的Python约定。 我看到__unicode__() __str__() __unicode__()更频繁地覆盖__unicode__() __str__()但它看起来并不一致。 实施一个和另一个比较好时,是否有特定的规则? 是否有必要/好的做法来执行这两个?

Ruby on Rails 3表单中的_snowman参数是什么?

在Ruby on Rails 3(目前使用Beta 4)中,我发现当使用form_tag或form_for helpers时,会出现一个名为_snowman的隐藏字段,其值为☃( Unicode \ x9731)。 那么,这是为了什么?

编码/解码有什么区别?

我从来没有确定,我明白str / unicode解码和编码之间的区别。 我知道str().decode()是用于当你有一个字节的string,你知道有一个特定的字符编码,给定的编码名称,它将返回一个Unicodestring。 我知道unicode().encode()根据给定的编码名称将unicode字符转换为一个字节的string。 但是我不明白str().encode()和unicode().decode()是什么。 任何人都可以解释,也可能还纠正我上面错了什么? 编辑: 几个答案给出了.encode在string上做了什么的信息,但是似乎没有人知道.decode对于unicode所做的。

如何获取utf-8string中给定字符的代码点号?

我想获得给定的UTF-8string的UCS-2代码点。 例如,“你好”这个词应该变成“0068 0065 006C 006C 006F”。 请注意,angular色可能来自任何语言,包括东亚语言之类的复杂脚本。 所以,问题归结为“将给定的字符转换为其UCS-2代码点” 但是,如何? 因为我很匆忙,请各位帮忙,非常感谢。 提前致谢 提问者回复的转录张贴为答案 感谢您的回复,但它需要在PHP 4或5,但不是6。 该string将是来自表单字段的用户input。 我想实现一个PHP版本的utf8to16或者utf8decode就好 function get_ucs2_codepoint($char) { // calculation of ucs2 codepoint value and assign it to $hex_codepoint return $hex_codepoint; } 你可以帮助我的PHP或可以完成与上述版本的PHP? 再次感谢你。

Java FileReader编码问题

我试图使用java.io.FileReader来读取一些文本文件,并将它们转换为string,但我发现结果是错误的编码,根本不可读。 这是我的环境: Windows 2003,操作系统编码:CP1252 Java 5.0 我的文件是UTF-8编码或CP1252编码,其中一些(UTF-8编码文件)可能包含中文(非拉丁)字符。 我使用下面的代码来完成我的工作: private static String readFileAsString(String filePath) throws java.io.IOException{ StringBuffer fileData = new StringBuffer(1000); FileReader reader = new FileReader(filePath); //System.out.println(reader.getEncoding()); BufferedReader reader = new BufferedReader(reader); char[] buf = new char[1024]; int numRead=0; while((numRead=reader.read(buf)) != -1){ String readData = String.valueOf(buf, 0, numRead); fileData.append(readData); buf = new char[1024]; } reader.close(); return […]

如何将Unicode转义序列转换为.NETstring中的Unicode字符?

假设你已经将一个文本文件加载到一个string中,并且你希望将所有Unicode转义符转换成string内的实际Unicode字符。 例: “以下是Unicode'u2320'中整数字符的上半部分,这是下半部分'\ U2321'。”

是否有一个Windows命令shell将显示Unicode字符?

假设我已经安装了字体,其中有适当的字形,是否有Windows XP的命令shell,将显示Unicode字符? 至less,应该正确显示Unicode的两件事: 目录列表。 我不在乎要input什么(dir,ls,get-childitem等),只要名称中带有Unicode字符的文件显示为正确的字形,而不是不可打印的字符框。 文本文件内容列表。 再次,只要字符被打印,对于我来说,如果它是“less”,“更多”,“猫”,“狗”等,并不重要。 我认识到,由于文件的字符编码,这是更复杂的,所以如果我必须在命令行中指定,那对我来说很好。 以下是我迄今为止所尝试的: CMD.EXE Windows PowerShell; 包括多语言版本。 Cygwin bash 没有运气。 我甚至尝试安装cmd / PowerShell的自定义字体 。 PowerShell和cmd.exe似乎是Unicode的意识,我可以复制/粘贴不可打印的盒子,它会粘贴到其他应用程序与正确的字符。 Cygwin(?)似乎转换为? 字符,并通过复制/粘贴。 有任何想法吗?

一个Unicode字符需要多less个字节?

我对编码有点困惑。 据我所知旧的ASCII字符每个字符一个字节。 Unicode字符需要多less个字节? 我假设一个Unicode字符可以包含来自任何语言的每个可能的字符 – 我是否正确? 那么每个字符需要多less字节? 而UTF-7,UTF-6,UTF-16等是什么意思? 他们是不同版本的Unicode? 我读了维基百科关于Unicode的文章,但对我来说很难。 我期待着看到一个简单的答案。

将Unicode输出到控制台在Windows中使用C ++

我还在学习C ++,所以请忍受我和我的草率代码。 我使用的编译器是Dev C ++。 我希望能够使用cout将Unicode字符输出到控制台。 当我尝试像下面这样的事情时: #include <iostream> int main() { std::cout << "Hello World!\n"; std::cout << "Blah blah blah some gibberish unicode: ĐĄßĞĝ\n"; system("PAUSE"); return 0; } 它输出奇怪的字符到控制台,如μA■Gg。 为什么这样做,我怎样才能显示ĐĄßĞĝ? 或者,这是不可能的Windows?