为什么Python不能识别我的UTF-8编码的源文件？

这是一个非ASCII字符的tmp.py：

if __name__ == "__main__": s = 'ß' print(s)

运行它我得到以下错误：

 Traceback (most recent call last): File ".\tmp.py", line 3, in <module> print(s) File "C:\Python32\lib\encodings\cp866.py", line 19, in encode return codecs.charmap_encode(input,self.errors,encoding_map)[0] UnicodeEncodeError: 'charmap' codec can't encode character '\xdf' in position 0: character maps to <undefined>

Python文档说：

默认情况下，Python源文件被视为编码为UTF-8 …

我检查编码的方法是使用Firefox（也许有人会build议更明显的东西）。我在Firefox中打开tmp.py，如果我select查看 – >字符编码 – > Unicode（UTF-8），它看起来没问题，这就是它在这个问题上面的样子（wth？符号）。

如果我把：

 # -*- encoding: utf-8 -*-

作为tmp.py中的第一个string，它不会改变任何东西 – 错误仍然存在。

有人能帮我弄清楚我做错了什么吗？

您的terminal正在使用的编码不支持该字符：

 >>> '\xdf'.encode('cp866') Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/opt/local/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/encodings/cp866.py", line 12, in encode return codecs.charmap_encode(input,errors,encoding_map) UnicodeEncodeError: 'charmap' codec can't encode character '\xdf' in position 0: character maps to <undefined>

Python正在处理它很好，它是你的输出编码，无法处理它。

您可以尝试使用Windows控制台中的chcp 65001来切换您的代码页; chcp是一个用于更改代码页的Windows命令行命令。

我的OS X（使用UTF-8）可以处理它很好：

 >>> print('\xdf') ß

为什么Python不能识别我的UTF-8编码的源文件？

将int转换为ASCII并返回到Python

PHP使用MySQL的最佳sorting规则是什么？

Spring Security：数据库和applicationContext中的密码编码

“用于编码UTF-8的不可映射字符”错误

UnicodeEncodeError：“charmap”编解码器无法编码 – 字符映射到<undefined>，打印功能

Base64编码图像

编码和encryption之间的区别

在函数式编程中什么是无意义的风格？

Python Unicode编码错误

如何在Maven中configuration编码？