Tag: utf 8

如何以UTF-8格式编写文件?

我有一堆文件不是UTF-8编码,我正在将网站转换为UTF-8编码。 我正在使用简单的脚本来存储我想要保存在utf-8中的文件,但这些文件被保存在旧的编码中: header('Content-type: text/html; charset=utf-8'); mb_internal_encoding('UTF-8'); $fpath="folder"; $d=dir($fpath); while (False !== ($a = $d->read())) { if ($a != '.' and $a != '..') { $npath=$fpath.'/'.$a; $data=file_get_contents($npath); file_put_contents('tempfolder/'.$a, $data); } } 如何以UTF-8编码保存文件?

UTF-8可以编码多less个字符?

如果UTF-8是8位的,那么不是说最多只能有256个不同的字符? 前128个码点与ASCII码相同。 但是它说UTF-8可以支持多达上百万个字符? 这个怎么用?

为什么Eclipse使用Cp1252编码?

道歉,如果这是一个非常业余的问题! 我知道Eclipse使用Cp1252作为其编码的默认值。 我最近创build了一个使用哈希映射将字母input转换为盲文的程序。 为此,我必须将编码方法更改为UTF-8。 我对这一点知之甚less,但是我读过的所有内容都表明UTF-8可以代表Unicode中的每个字符,并且有一个更大的识别符号库。 为什么这不是Eclipse的首选编码风格?

WebClient Unicode – 哪个UTF8?

当我创build一个WebClient来使用一些RESTful xml时,我可以指定unicode编码的两种方法: WebClient wc = new WebClient (); wc.Encoding = Encoding.UTF8; wc.Encoding = UTF8Encoding.UTF8; 哪个是正确/更好?

如何找出string是否已被URL编码?

我如何检查string是否已被编码? 例如,如果我编码TEST== ,我得到TEST%3D%3D 。 如果我再次编码最后一个string,我得到了TEST%253D%253D ,我必须知道之前,如果它已经编码… 我保存了编码参数,我需要search它们。 我不知道input参数,它们是什么 – 编码或不是,所以我必须知道,如果我必须在search之前编码或解码它们。

如何用钻石操作符(<>)读取UTF-8?

我想用Perl来读取UTF-8的input,不pipe它来自标准input还是来自文件,使用菱形运算符: while(<>){…} 。 所以我的脚本应该像以前一样用这两种方法调用,给出相同的结果: ./script.pl utf8.txt cat utf8.txt | ./script.pl 但是输出不同! 只有第二个调用(使用cat )似乎按照devise工作,正确读取UTF-8。 这是脚本: #!/usr/bin/perl -w binmode STDIN, ':utf8'; binmode STDOUT, ':utf8'; while(<>){ my @chars = split //, $_; print "$_\n" foreach(@chars); } 在两种情况下,我怎样才能正确读取UTF-8? 如果可能的话,我想继续使用钻石操作符<>来阅读。 编辑: 我意识到我可能应该描述不同的输出。 我的input文件包含这个序列: a\xCA\xA7b 。 用cat正确输出的方法是: a \xCA\xA7 b 但另一种方法给了我这个: a \xC3\x8A \xC2\xA7 b

PHP的substr()函数与utf-8在最后留下 标记

这是简单的代码 <?php $var = "Бензин Офиси А.С. также производит все типы жира и смазок и их побочных продуктов в его смесительных установках нефти машинного масла в Деринце, Измите, Алиага и Измире. У Компании есть 3 885 станций технического обслуживания, включая сжиженный газ (ЛПГ) станции под фирменным знаком Петрогаз, приблизительно 5 000 дилеров, двух смазочных смесительных […]

将utf8字符转换为iso-88591并返回到PHP

我的一些脚本使用不同的编码,当我尝试将它们合并时,这是一个问题。 但是我不能改变他们使用的编码,而是我想改变脚本A的结果的编码,并在脚本B中用它作为参数。 所以:有什么简单的方法在PHP中将string从UTF-8更改为ISO-88591? 我已经看过utf_encode和_decode,但他们不做我想要的。 为什么不存在任何“utf2iso()” – 函数或类似的? 我不认为我的字符不能写成ISO格式,所以不应该是一个大问题。

utf8_(en | de)代码从php7中删除?

我最近在我的开发服务器上切换到了PHP 7,直到现在,它已经运行良好。 由于我更新到PHP 7.0.3-10+deb.sury.org~trusty+1 (今天早些时候), utf8_decode和utf8_encode函数不再可用。 但是,他们在以前的PHP7版本中。 被调用时,会引发致命错误。 我读了这些函数是由mbstring扩展提供的,我用var_dump(extension_loaded('mbstring')); 被加载。 我怎样才能让上述function重新运作?

为什么一些网站的标题中有?utf8 =?

我注意到很多网站在search或只是浏览时都会添加一个名为utf的getvariables,并将其设置为等于复选标记( ?utf8=✓ )。 两个例子是: Dotabuff有它的searchurl。 例如:dotabuff.com/search?utf8=&&q=PPD Bibme也有它的searchurl。 例如:bibme.org/mla/website-citation/search?utf8=&&q=someurl.com