Tag: unicode

如何防止Unicode字符从JavaScript呈现为HTML中的表情符号?

我从FileFormat.Info的searchfindUnicode的特殊字符。 一些字符呈现为经典的黑白字形,如⚠(警告标志, \u26A0或\u26A0 ⚠ )。 这些都是可取的,因为我可以将CSS样式(如颜色)应用于它们。 其他人正在渲染为更新的卡通表情符号,如⌛(沙漏,< \u231B或⌛ )。 这些都是不可取的,因为我不能完全塑造它们。 看来,浏览器正在做这个改变,因为我能够看到在Mac Firefox上的沙漏字形,只是不是Mac Chrome或Mac Safari。 有没有办法强制浏览器显示旧的(平坦的单调)版本来显示? 更新 :看起来(从下面的评论)有一个文本演示文稿select器 , FE0E ,可用于强制文本与表情符号。 select器连接为字符代码的无后缀空格后缀,例如用于HTMLhex的⌛&#xFE0E或用于JS的\u231B\uFE0E 。 但是, 它并不是所有浏览器 (例如,Chrome和Edge) 都不被尊重 。

我怎样才能得到一个Unicode字符的代码?

比方说,我有这个: char registered = '®'; 或umlaut ,或任何unicode字符。 我怎么能得到它的代码?

有没有办法以编程方式确定一个字体文件是否具有特定的Unicode字形?

我正在开发一个可以包含相当复杂的math和科学公式的PDF文件。 该文本呈现在Times New Roman中,具有相当不错的Unicode覆盖范围,但并不完整。 我们有一个系统来replace在TNR中没有字形的代码点更多的Unicode字体完整字体(像大多数“陌生人”的math符号),但我似乎无法find一种方法来查询* .ttf文件来查看给定的字形是否存在。 到目前为止,我只是硬编码了哪个代码点的查找表,但我更喜欢自动解决scheme。 我在ASP.net下的web系统中使用VB.Net,但在任何编程语言/环境中的解决scheme将不胜感激。 编辑:win32解决scheme看起来不错,但我试图解决的具体情况是在ASP.Netnetworking系统。 有没有办法做到这一点,而不包括Windows API DLL到我的网站?

如何closuresVC ++项目中的Unicode?

我在Visual Studio 2008中有一个VC ++项目。 它是在编译器命令行( /D "_UNICODE" /D "UNICODE" )上定义unicode的符号,尽pipe在项目的预处理器部分中没有打开此符号。 替代文字http://i26.tinypic.com/14nz693.jpg 因此,我正在编译所有Win32库函数的Unicode版本,而不是ANSI版本。 例如在WinBase.h中,有: #ifdef UNICODE #define CreateFile CreateFileW #else #define CreateFile CreateFileA #endif // !UNICODE 在VC ++项目中打开的unicode在哪里,我怎么把它关掉?

Python – 我能检测unicodestring语言代码吗?

我面临的情况是,我正在阅读一串文本,我需要检测语言代码(en,de,fr,sp等)。 有一个简单的方法来做到这一点在Python中? 谢谢。

方法,常量,variables和字段的异名 – Bug或Feature?

在评论之后有些混乱 在PHP中有一个字母类名是安全的,例如A,B,C 我以为我提出了一个问题。 根据PHP手册,有效的类名应该与[a-zA-Z_\x7f-\xff][a-zA-Z0-9_\x7f-\xff]* 。 但显然,这不是强制执行,也不适用于其他任何事情: define('π', pi()); var_dump(π); class ␀ { private $␀ = TRUE; public function ␀() { return $this->␀; } } $␀ = new ␀; var_dump($␀ ); var_dump($␀->␀()); 工作正常(即使我的IDE不能显示␀)。 有些博学的人可以为我清楚吗? 我们可以使用任何Unicode吗? 如果是这样,从什么时候开始? 不是说我实际上只想用A-Za-z_但我很好奇。 澄清:我不是在一个正则expression式来validation类名,也不知道如果PHP内部使用它在手册中build议的正则expression式。 让我困惑的东西(显然是链接问题中的其他人)是为什么像$☂ = 1这样的东西可以在PHP中使用。 PHP6被认为是Unicode版本,但是PHP6处于中断状态。 但是,如果没有Unicode支持,为什么我可以这样做呢?

Ruby 1.9:我怎样才能正确地提升和取消多字节string?

所以matz决定在Ruby 1.9.1中保持上/[AZ]/i downcase为/[AZ]/i 。 ActiveSupport::Multibyte在Ruby 1.8.x中通过String#mb_chars已经有了很好的i18n情况。 但是,在Ruby 1.9.1下试用时,它似乎不起作用。 下面是我写的一个简单的testing脚本,以及我得到的输出: $ cat test.rb # encoding: UTF-8 puts("@ #{RUBY_VERSION} " + (__ENCODING__ rescue $KCODE).to_s) sd, su = "Iñtërnâtiônàlizætiøn", "IÑTËRNÂTIÔNÀLIZÆTIØN" def ps(u, d, k); puts "%-30s: %24s / %-24s" % [k, u, d] end ps sd.upcase, su.downcase, "Plain ruby" require 'rubygems'; require 'active_support' ps sd.upcase, su.downcase, "With active_support" […]

什么是实际使用中最常见的非BMP Unicode字符?

根据您的经验,目前最常见的是哪些Unicode字符,代码点,BMP(基础多语言平面)以外的范围? 这些是需要UTF-8中的4个字节或UTF-16中的替代项的。 我希望答案是中文和日文字符在名称中使用,但不包括在最广泛的CJK多字节字符集中,但在我最擅长的项目英文维基文库中,我们发现哥特字母是到目前为止更为普遍。 UPDATE 我已经写了几个软件工具来扫描整个维基百科的非BMP字符,发现令我惊讶的是,即使在日本维基百科中,哥特字母也是最常见的。 中文维基百科也是如此,但也有很多汉字被使用了50或70次,包括“𨭎”,“𠬠”和“𩷶”。

如何在android textview中通过unicode设置emoji

嗨,我想要做到以下几点: ??? unicode = U+1F60A String emoji = getEmijoByUnicode(unicode) String text = "So happy " textview.setText(text + emoji); 在我的textview中得到这个: 太高兴了😊 如何实现'getEmijoByUnicode(unicode)'? 应该是什么types的“unicode”? (String / char / int ??!) 请注意,我不想使用Drawables!

真的很好,不好的UTF-8例子testing数据

因此,我们有XSS备忘单来testing我们的XSS过滤 – 但除了一个良性的例子页面,我找不到任何邪恶或畸形的testing数据,以确保我的UTF-8代码可以处理错过的数据。 我在哪里可以find一些不错的数据来testing? 或者什么是一个棘手的字符序列?