Tag: 编码

如何检测文本文件的字符编码?

我尝试检测在我的文件中使用哪种字符编码。 我试着用这个代码来获得标准的编码 public static Encoding GetFileEncoding(string srcFile) { // *** Use Default of Encoding.Default (Ansi CodePage) Encoding enc = Encoding.Default; // *** Detect byte order mark if any – otherwise assume default byte[] buffer = new byte[5]; FileStream file = new FileStream(srcFile, FileMode.Open); file.Read(buffer, 0, 5); file.Close(); if (buffer[0] == 0xef && buffer[1] == 0xbb […]

ArrayBuffer以base64编码的string

我需要一个高效的(本地读取)的方式来转换一个ArrayBuffer到base64string需要在多部分职位上使用。

如何将Unicode编码的string转换为string

我有一个Unicode编码的string\uXXXX ,我想把它转换成一个普通的字母( UTF-8 )。 例如: String myString = "\u0048\u0065\u006C\u006C\u006F World"; 应该成为 "Hello World" 我知道,当我打印string,它显示Hello world 。 我的问题是我从Unix机器上的文件读取文件名,然后我search它们。 文件名是用Unicode编码的,当我search这些文件时,我找不到它们,因为它search的文件名是\uXXXX 。

使用PowerShell以不含BOM的UTF-8编写文件

使用UTF-8时, Out-File似乎强制BOM: $MyFile = Get-Content $MyPath $MyFile | Out-File -Encoding "UTF8" $MyPath 如何使用PowerShell以UTF-8编写不含BOM的文件?

Python UnicodeDecodeError – 我误解编码?

任何想法,为什么这不工作? 我真的认为'忽略'会做正确的事情。 >>> 'add \x93Monitoring\x93 to list '.encode('latin-1','ignore') Traceback (most recent call last): File "<interactive input>", line 1, in ? UnicodeDecodeError: 'ascii' codec can't decode byte 0x93 in position 4: ordinal not in range(128)

UTF-8与Unicode

我听到了人们的意见冲突 – 根据维基百科的说法, 请看这里 。 他们是一样的东西,不是吗? 有人可以澄清?

读取UTF-8 – BOM标记

我正在通过FileReader读取文件 – 文件是UTF-8解码(与BOM)现在我的问题是:我读取文件并输出一个string,但遗憾的是BOM标记也输出了。 为什么会发生? fr = new FileReader(file); br = new BufferedReader(fr); String tmp = null; while ((tmp = br.readLine()) != null) { String text; text = new String(tmp.getBytes(), "UTF-8"); content += text + System.getProperty("line.separator"); } 在第一行之后输出 ?<style>

如何在Excel VBA中对URL进行URL编码?

有没有一种内置的方式来对Excel VBA中的string进行URL编码,还是需要手动滚动此function?

正确的方式来定义Python源代码编码

PEP 263定义了如何定义Python源代码编码。 通常情况下,Python文件的前两行应该以: #!/usr/bin/python # -*- coding: <encoding name> -*- 但是我看到很多文件开头: #!/usr/bin/python # -*- encoding: <encoding name> -*- – > 编码而不是编码 。 那么声明文件编码的正确方法是什么? 编码是允许的,因为使用的正则expression式是懒惰的? 或者它只是声明文件编码的另一种forms? 我在问这个问题,因为PEP没有谈论编码 ,只是谈论编码 。

在C#中确定一个string的编码

有没有什么办法来确定在C#中的string的编码? 说,我有一个文件名string,但我不知道它是否以Unicode UTF-16或系统默认编码编码,我怎么知道?