Tag: utf 8

如何在Java中转换ISO-8859-1和UTF-8?

有谁知道如何将string从ISO-8859-1转换为UTF-8并返回到Java? 我从网上获取一个string并将其保存在RMS(J2ME)中,但我想保留特殊字符,并从RMS获取string,但使用ISO-8859-1编码。 我该怎么做呢?

Java Unicodestring长度

我正在努力获得Unicodestring的计数,并尝试各种选项。 看起来像一个小问题,但大大的打击。 在这里,我正在尝试获取stringstr1的长度。 我得到它为6.但实际上是3.移动光标在string“குமார்”也显示为3个字符。 基本上我想测量的长度和打印每个字符。 如“கு”,“ாா”,“ர்”。 public class one { public static void main(String[] args) { String str1 = new String("குமார்"); System.out.print(str1.length()); } } PS:这是泰米尔语。

“用于编码UTF-8的不可映射字符”错误

我在下面的方法得到一个编译错误。 public static boolean isValidPasswd(String passwd) { String reg = "^(?=.*[0-9])(?=.*[az])(?=.*[AZ])(?=.*[~#;:?/@&!\"'%*=¬.,-])(?=[^\\s]+$).{8,24}$"; return Pattern.matches(reg, passwd); } 在Utility.java:[76,74]不可映射的字符 编码UTF-8。 第74个字符是''' 我怎样才能解决这个问题? 谢谢。

UnicodeDecodeError:'ascii'编解码器无法解码位置2中的字节0xd1:序号不在范围内(128)

我正在尝试使用非常大的数据集,其中包含一些非标准字符。 我需要使用unicode,根据工作规范,但我很困惑。 (很可能这样做是错的。) 我打开CSV使用: 15 ncesReader = csv.reader(open('geocoded_output.csv', 'rb'), delimiter='\t', quotechar='"') 然后,我试图用下面的代码进行编码: name=school_name.encode('utf-8'), street=row[9].encode('utf-8'), city=row[10].encode('utf-8'), state=row[11].encode('utf-8'), zip5=row[12], zip4=row[13],county=row[25].encode('utf-8'), lat=row[22], lng=row[23]) 我编码除lat和lng之外的所有东西,因为那些需要被发送到一个API。 当我运行程序parsing数据集到我可以使用的时候,我得到以下的回溯。 Traceback (most recent call last): File "push_into_db.py", line 80, in <module> main() File "push_into_db.py", line 74, in main district_map = buildDistrictSchoolMap() File "push_into_db.py", line 32, in buildDistrictSchoolMap county=row[25].encode('utf-8'), lat=row[22], lng=row[23]) UnicodeDecodeError: 'ascii' codec […]

用于将所有表和字段更改为MYSQL中的utf-8-bin归类的脚本

有一个SQL或PHP脚本,我可以运行这将更改数据库中的所有表和字段中的默认sorting规则? 我可以自己写一个,但我认为这应该是在这样的网站上容易获得的东西。 如果我能在有人发帖之前自己想出一个,我会自己发贴。

如何发送UTF-8电子邮件?

当我发送电子邮件时,电子邮件不会显示英文以外的其他字符。 它确实显示如下: ä½™C”雅»ä» 可能知道这是什么原因? 即使我试图在脚本中添加Content-type和charset,它仍然显示相同。 我使用Mail::Factory("mail");

Latex中的UTF-8(或者至less是德文变音符号)

尝试使用列表软件包将源文件包含到我的latex文档中,在代码中的注释中出现了德语变音问题。 运用 \lstset{ extendedchars=\true, inputencoding=utf8x } 源文件中的变音符号(用UTF-8编码,没有BOM)被处理,但是它们被移动到它所包含的单词的开头。 // die Größe muss berücksichtigt werden 在input源文件中,变成 // die ößGre muss übercksichtigt werden 在输出文件中。 注:因为我发现我的初始设置错误,我大量编辑这个问题

使用'使用utf8' 给我“宽印字”

如果我运行下面的Perl程序: perl -e 'use utf8; print "鸡\n";' 我得到这个警告: Wide character in print at -e line 1. 如果我运行这个Perl程序: perl -e 'print "鸡\n";' 我没有得到警告。 我认为use utf8需要在Perl脚本中使用UTF-8字符。 为什么这不起作用,我该如何解决? 我正在使用Perl 5.16.2。 我有同样的问题,如果这是在一个文件中,而不是在命令行上的单线程。

使用FileWriter(Java)以UTF-8编写文件?

我有下面的代码,但是,我希望它作为一个UTF-8文件来处理外来字符。 有没有办法做到这一点,有一些需要有一个参数? 我真的很感激你的帮助。 谢谢。 try { BufferedReader reader = new BufferedReader(new FileReader("C:/Users/Jess/My Documents/actresses.list")); writer = new BufferedWriter(new FileWriter("C:/Users/Jess/My Documents/actressesFormatted.csv")); while( (line = reader.readLine()) != null) { //If the line starts with a tab then we just want to add a movie //using the current actor's name. if(line.length() == 0) continue; else if(line.charAt(0) == '\t') { […]

我怎样才能编译UTF8的LaTeX?

我以ISO标准做了我的文档。 它不支持变音符号,如ä和ö。 我需要他们。 该文档编译时不使用UTF8,而使用UTF8编译。 更准确地说,文档不会在我的main.tex的开始处被编译: \usepackage[utf8]{inputenc} 我怎样才能编译我的LaTeX文件在UTF8?