非ASCII字符的SyntaxError

我想parsing包含一些非ASCII cheracter的xml，

代码如下所示

from lxml import etree from lxml import objectify content = u'<?xml version="1.0" encoding="utf-8"?><div>Order date               : 05/08/2013 12:24:28</div>' mail.replace('\xa0',' ') xml = etree.fromstring(mail)

但它显示了我的错误行'内容= …'就像

 syntaxError: Non-ASCII character '\xc2' in file /home/projects/ztest/responce.py on line 3, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

在terminal它正在工作，但在eclipse IDE上运行时，它给我一个错误。

不知道如何克服..

您应该定义源代码编码，将其添加到您的脚本的顶部：

 # -*- coding: utf-8 -*-

它在控制台和IDE中的工作原理可能是由于不同的默认编码集。你可以通过运行来检查它：

 import sys print sys.getdefaultencoding()

另请参阅：

为什么要在python中通过string来声明unicode？
更改Python的默认编码？
正确的方式来定义Python源代码编码

非ASCII字符的SyntaxError

在C＃中将string转换为字节数组

Base64编码器和解码器

猜测在Java中表示为byte 的文本的编码

你什么时候应该使用escape来代替encodeURI / encodeURIComponent？

编码window.location.hash

将utf8字符转换为iso-88591并返回到PHP

我应该在Python3中使用编码声明吗？

在OS X Lion中，LANG未设置为UTF-8，如何解决？

在函数式编程中什么是无意义的风格？

如何检查string是unicode还是ascii？