Tag: 编码

更改Python的默认编码?

当我从控制台运行我的应用程序时,我有许多“无法编码”和“无法解码” Python的问题。 但在Eclipse PyDev IDE中,默认的字符编码设置为UTF-8 ,我很好。 我四处寻找设置默认编码,并且有人说Python在启动时删除了sys.setdefaultencoding函数,我们不能使用它。 那么最好的解决scheme是什么?

检测编码,并使所有的UTF-8

我正在从各种RSS源中读出大量文本,并将它们插入到我的数据库中。 当然,Feed中使用了几种不同的字符编码,例如UTF-8和ISO-8859-1。 不幸的是,文本的编码有时会出现问题。 例: 1)“Fußball”中的“ß”在我的数据库中应该是这样的:“Ÿ”。 如果是“Ÿ”,则显示正确。 2)有时,“Fußball”中的“ß”在我的数据库中是这样的:“ß”。 那当然是显示错误了。 3)在其他情况下,“ß”被保存为“ß” – 所以没有任何改变。 然后它也显示错误。 我能做些什么来避免案例2和3? 我怎样才能使所有的编码相同,最好是UTF-8? 何时必须使用utf8_encode(),何时必须使用utf8_decode()(显然是什么效果,但何时必须使用函数?),什么时候必须对input做什么? 你能帮助我,告诉我如何使一切相同的编码? 也许与函数mb-detect-encoding()? 我可以为此写一个函数吗? 所以我的问题是:1)如何找出文本使用什么编码2)如何将其转换为UTF-8 – 无论旧编码是什么 编辑:这样的function会工作吗? function correct_encoding($text) { $current_encoding = mb_detect_encoding($text, 'auto'); $text = iconv($current_encoding, 'UTF-8', $text); return $text; } 我已经testing过,但不起作用。 它出什么问题了?

Java:如何确定一个stream的正确的字符集编码

参考以下线程: Java App:无法正确读取iso-8859-1编码的文件 什么是编程式确定inputstream/文件的正确字符集编码的最佳方法? 我曾尝试使用以下内容: File in = new File(args[0]); InputStreamReader r = new InputStreamReader(new FileInputStream(in)); System.out.println(r.getEncoding()); 但是在我知道用ISO8859_1编码的文件上面的代码会产生ASCII,这是不正确的,并且不允许我正确地将文件的内容呈现回控制台。

如何将hexstring转换为字节数组?

我们可以使用C#中的内置函数将hexstring转换为字节数组吗?还是必须为此创build自定义方法?

确定Python中文本的编码

我收到了一些编码的文本,但我不知道使用了什么字符集。 有没有一种方法来确定使用Python的文本文件的编码? 如何检测处理C# 的文本文件的编码/代码页 。

如何获得UTF-8在Java webapps中的工作?

我需要在我的Java webapp(servlets + JSP,不使用框架)中使用UTF-8来支持常规芬兰语文本和西里尔文字母,如特殊情况下的ЦжФ 。 我的设置如下: 开发环境:Windows XP 生产环境:Debian 使用的数据库:MySQL 5.x 用户主要使用Firefox2,但也使用Opera 9.x,FF3,IE7和Google Chrome访问该站点。 如何做到这一点?

如何检测文本文件的编码/代码页

在我们的应用程序中,我们接收来自不同来源的文本文件( .txt , .csv等)。 读取时,这些文件有时会包含垃圾,因为这些文件是在不同的/未知的代码页中创build的。 有没有办法(自动)检测文本文件的代码页? StreamReader构造函数中的detectEncodingFromByteOrderMarks适用于UTF8和其他unicode标记的文件,但是我正在寻找一种检测代码页的方法,例如ibm850 , ibm850 。 感谢您的回答,这就是我所做的。 我们收到的文件来自最终用户,他们没有关于代码页的线索。 接收者也是最终用户,到目前为止他们知道的关于代码页的问题:代码页存在,而且很烦人。 解: 在记事本中打开收到的文件,看一个乱码的文本。 如果有人被称为弗朗索瓦什么东西,用你的人类智慧,你可以猜测这个。 我创build了一个小应用程序,用户可以使用该应用程序打开文件,并在使用正确的代码页时input用户知道该文件将出现在文件中的文本。 循环遍历所有代码页,并显示用户提供的文本解决scheme。 如果popup更多的代码页,请让用户指定更多的文本。

cmd.exe使用什么编码/代码页?

当我在Windows中打开cmd.exe时,它使用什么编码? 如何检查当前使用哪种编码? 这取决于我的区域设置还是有任何环境variables要检查? 当你input一个特定的编码文件会发生什么? 有时候我会遇到乱码(使用不正确的编码),有时会出现这种情况。 但是,只要我不知道发生了什么,我就不会相信任何事情。 谁能解释一下?

如何在NSUserDefaults中存储自定义对象

好的,所以我一直在做些什么,我意识到我的问题,但我不知道如何解决这个问题。 我已经做了一个自定义的类来保存一些数据。 我为这个class级制作对象,我需要让他们在两节课之间持续。 在我把所有的信息放在NSUserDefaults ,但是这不起作用。 -[NSUserDefaults setObject:forKey:]: Attempt to insert non-property value '<Player: 0x3b0cc90>' of class 'Player'. 这是我在NSUserDefaults放入自定义类“Player”时得到的错误消息。 现在,我已经读了,显然NSUserDefaults只存储一些types的信息。 那么如何让我的对象进入NSUSerDefaults ? 我读到应该有一种方法来“编码”我的自定义对象,然后把它,但我不知道如何实现它,帮助将不胜感激! 谢谢! ****编辑**** 好吧,所以我使用下面给出的代码(谢谢!),但我仍然有一些问题。 基本上,代码现在崩溃,我不知道为什么,因为它不会给出任何错误。 也许我错过了一些基本的东西,我太累了,但我们会看到。 这里是我的自定义类“播放器”的实现: @interface Player : NSObject { NSString *name; NSNumber *life; //Log of player's life } //Getting functions, return the info – (NSString *)name; – (int)life; – (id)init; //These […]

查询string参数的Java URL编码

说我有一个url http://example.com/query?q= 我有一个用户input的查询,如: 随机词500英镑银行$ 我想要的结果是一个正确编码的url: http://example.com/query?q=random%20word%20%A3500%20bank%20%24 什么是达到这个目的的最好方法? 我尝试URLEncoder和创buildURI / URL对象,但没有一个出来很正确。