Tag: utf 8

PHP:如何删除string中的所有不可打印的字符?

我想我需要删除字符0-31和127, 有没有一个function或一段代码来有效地做到这一点。

UTF-8与Unicode

我听到了人们的意见冲突 – 根据维基百科的说法, 请看这里 。 他们是一样的东西,不是吗? 有人可以澄清?

MySQL和PHP:带西里尔文字符的UTF-8

我试图在MySQL表中插入西里尔值,但编码有问题。 PHP的: <?php $servername = "localhost"; $username = "a"; $password = "b"; $dbname = "c"; $conn = new mysqli($servername, $username, $password, $dbname); mysql_query("SET NAMES 'utf8';"); mysql_query("SET CHARACTER SET 'utf8';"); mysql_query("SET SESSION collation_connection = 'utf8_general_ci';"); if ($conn->connect_error) { die("Connection failed: " . $conn->connect_error); } $sql = "UPDATE `c`.`mainp` SET `search` = 'test тест' WHERE `mainp`.`id` =1;"; […]

如何在“<!DOCTYPE>”之前删除多个UTF-8 BOM序列?

使用PHP5(CGI)从文件系统输出模板文件,并有问题吐出原始的HTML。 private function fetch($name) { $path = $this->j->config['template_path'] . $name . '.html'; if (!file_exists($path)) { dbgerror('Could not find the template "' . $name . '" in ' . $path); } $f = fopen($path, 'r'); $t = fread($f, filesize($path)); fclose($f); if (substr($t, 0, 3) == b'\xef\xbb\xbf') { $t = substr($t, 3); } return $t; } 尽pipe我已经添加了BOM修正,但我仍然遇到Firefox接受它的问题。 […]

如何在phpMyAdmin中显示UTF-8字符?

我有我的数据库正确设置为UTF-8和正在处理包含日语字符的数据库。 如果我从MySQL命令行执行SELECT * …,我会正确地看到日文字符。 从数据库中提取数据并将其显示在网页上时,我可以正确地看到它。 但是,在phpMyAdmin中查看表格数据时,我只能看到垃圾文本。 即。 ç§ã¯æ-¥æœ¬æ-™C†ãŒå¥½ãã§ã™ã€,æ-¥æœ¬æ-™C†A,… 我怎样才能让phpMyAdmin显示日文中的字符? HTML页面上的字符编码设置为UTF-8。 编辑: 我已经尝试导出我的数据库,并在geany中打开.sql文件。 即使编码设置为UTF-8,字符仍然是乱码。 (但是,做一个mysqldump的数据库也显示乱码)。 数据库和所有表的字符集设置正确(在文件的任何位置都找不到“拉丁文”) CREATE DATABASE `japanese` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; 我已经添加了行my.cnf并重新启动mysql,但没有任何改变。 我正在使用Zend框架将数据插入到数据库中。 我打算为这个问题开一个奖金,因为我真的想知道这个问题。

PHP:在不知道原始字符集的情况下将任何string转换为UTF-8,或者至less尝试一下

我有一个应用程序,处理来自世界各地的客户,自然,我希望进入我的数据库的一切都是UTF-8编码。 对我来说主要的问题是我不知道什么编码的string的来源将是 – 它可能是从一个文本框(使用<form accept-charset="utf-8">只有在用户实际上是提交表单),或者它可能来自上传的文本文件,所以我实在无法控制input。 我需要的是一个函数或类,确保进入我的数据库的东西,尽可能地,UTF-8编码。 我试过iconv(mb_detect_encoding($text), "UTF-8", $text); 但有问题(如果input是“未婚妻”,则返回“未婚夫”)。 我已经尝试了很多东西= / 对于file upload,我喜欢让最终用户指定他们使用的编码,并向他们展示输出结果的预览,但是这并不能帮助防止恶意的黑客(事实上,这可能会使他们的生活更容易一点)。 我已经阅读了关于这个主题的其他SO问题,但他们似乎都有微妙的差别,例如“我需要parsingRSS提要”或“我从网站上抓取数据”(或者实际上,“你不能”)。 但是一定有一些东西至less有一个很好的尝试 !

PHP:用UTF-8stringreplace最接近的7位ASCII等效的元音变音

我想要做的是从string中删除所有的重音符号和变音符号,将“lärm”变成“andré”和“andre”。 我试图做的是utf8_decodestring,然后使用strtr,但由于我的源文件保存为UTF-8文件,我不能inputISO-8859-15字符的所有变音 – 编辑插入UTF-8字符。 很明显,解决scheme是包含一个ISO-8859-15文件,但是必须有一个更好的方法,而不是另外包含一个? echo strtr(utf8_decode($input), 'ŠŒŽšœžŸ¥µÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýÿ', 'SOZsozYYuAAAAAAACEEEEIIIIDNOOOOOOUUUUYsaaaaaaaceeeeiiiionoooooouuuuyy'); 更新:也许我有点不准确,我试图做的事情:我实际上并不想删除变音符号,而是用它们最接近的“单字符ASCII”replace它们。

如何用Java编写UTF-8文件?

我有一些当前的代码,问题是它创build一个1252代码页文件,我想迫使它创build一个UTF-8文件 任何人都可以帮我用这个代码,因为我说它目前的作品…但我需要强制保存在utf ..我可以传递一个参数或东西? 这是我的,任何帮助真的很感激 var out = new java.io.FileWriter( new java.io.File( path )), text = new java.lang.String( src || "" ); out.write( text, 0, text.length() ); out.flush(); out.close();

在Python源码中使用utf-8编码

$ cat bla.py u = unicode('d…') s = u.encode('utf-8') print s $ python bla.py File "bla.py", line 1 SyntaxError: Non-ASCII character '\xe2' in file bla.py on line 1, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details 如何在源代码中声明utf-8string?

将string编码为UTF-8

我有一个“ñ”字符的string,我有一些问题。 我需要将此string编码为UTF-8编码。 我已经试过这种方式,但它不起作用: byte ptext[] = myString.getBytes(); String value = new String(ptext, "UTF-8"); 如何将该string编码为utf-8?