为什么Python不能识别我的UTF-8编码的源文件?

这是一个非ASCII字符的tmp.py:

if __name__ == "__main__": s = 'ß' print(s) 

运行它我得到以下错误:

 Traceback (most recent call last): File ".\tmp.py", line 3, in <module> print(s) File "C:\Python32\lib\encodings\cp866.py", line 19, in encode return codecs.charmap_encode(input,self.errors,encoding_map)[0] UnicodeEncodeError: 'charmap' codec can't encode character '\xdf' in position 0: character maps to <undefined> 

Python文档说 :

默认情况下,Python源文件被视为编码为UTF-8 …

我检查编码的方法是使用Firefox(也许有人会build议更明显的东西)。 我在Firefox中打开tmp.py,如果我select查看 – >字符编码 – > Unicode(UTF-8),它看起来没问题,这就是它在这个问题上面的样子(wth?符号)。

如果我把:

 # -*- encoding: utf-8 -*- 

作为tmp.py中的第一个string,它不会改变任何东西 – 错误仍然存​​在。

有人能帮我弄清楚我做错了什么吗?

One Solution collect form web for “为什么Python不能识别我的UTF-8编码的源文件?”

您的terminal正在使用的编码不支持该字符:

 >>> '\xdf'.encode('cp866') Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/opt/local/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/encodings/cp866.py", line 12, in encode return codecs.charmap_encode(input,errors,encoding_map) UnicodeEncodeError: 'charmap' codec can't encode character '\xdf' in position 0: character maps to <undefined> 

Python正在处理它很好,它是你的输出编码,无法处理它。

您可以尝试使用Windows控制台中的chcp 65001来切换您的代码页; chcp是一个用于更改代码页的Windows命令行命令。

我的OS X(使用UTF-8)可以处理它很好:

 >>> print('\xdf') ß 
  • Ruby将CSV文件读取为UTF-8和/或将ASCII-8Bit编码转换为UTF-8
  • 用BOMsearchUTF-8文件的优雅方法?
  • 如何在PHP中输出一个UTF-8 CSV,Excel将正确读取?
  • PHP:用UTF-8stringreplace最接近的7位ASCII等效的元音变音
  • utf-8字边界正则expression式在javascript中
  • Python和BeautifulSoup编码问题
  • Outlook自动清理我的换行符,并搞砸了我的电子邮件格式
  • PHP:如何删除string中的所有不可打印的字符?
  • 在Django中保存unicodestring时,MySQL“错误的string值”错误
  • “用于编码UTF-8的不可映射字符”错误
  • WebClient Unicode - 哪个UTF8?