Tag: domdocument

PHP DomDocument无法处理utf-8字符(☆)

networking服务器以utf-8编码提供响应,所有文件都以utf-8编码保存,我所知道的设置已经被设置为utf-8编码。 这里有一个快速的程序,来testing输出是否工作: <?php $html = <<<HTML <!doctype html> <html> <head> <meta charset="utf-8"> <title>Test!</title> </head> <body> <h1>☆ Hello ☆ World ☆</h1> </body> </html> HTML; $dom = new DomDocument("1.0", "utf-8"); $dom->loadHTML($html); header("Content-Type: text/html; charset=utf-8"); echo($dom->saveHTML()); 该scheme的输出是: <!DOCTYPE html> <html><head><meta charset="utf-8"><title>Test!</title></head><body> <h1>&acirc;˜† Hello &acirc;˜† World &acirc;˜†</h1> </body></html> 其中呈现为: ★你好††世界†† 我可能做错了什么? 我必须告诉DomDocument正确处理utf-8多less具体的内容?

如何保存没有HTML包装的DOMDocumentHTML?

我是下面的函数,我很努力地输出DOMDocument,而不会在输出内容之前附加XML,HTML, body和p标记包装。 build议修复: $postarray['post_content'] = $d->saveXML($d->getElementsByTagName('p')->item(0)); 只有当内容中没有块级元素时才能使用。 但是,如果在h1元素下面的例子中,saveXML产生的输出被截断为… 如果你喜欢</ p> 我已经指出这个post是一个可能的解决方法,但我不明白如何实现它到这个解决scheme(请参阅下面的注释尝试)。 有什么build议么? function rseo_decorate_keyword($postarray) { global $post; $keyword = "Jasmine Tea" $content = "If you like <h1>jasmine tea</h1> you will really like it with Jasmine Tea flavors. This is the last ocurrence of the phrase jasmine tea within the content. If there are other instances […]

DOM中的DOMDocument

我刚刚开始阅读有关DOM的文档和示例,以便抓取和解析文档。 例如,我有以下所示的文件的一部分: <div id="showContent"> <table> <tr> <td> Crap </td> </tr> <tr> <td width="172" valign="top"><a href="link"><img height="91" border="0" width="172" class="" src="img"></a></td> <td width="10">&nbsp;</td> <td valign="top"><table cellspacing="0" cellpadding="0" border="0"> <tbody><tr> <td height="30"><a class="px11" href="link">title</a><a><br> <span class="px10"></span> </a></td> </tr> <tr> <td><img height="1" width="580" src="crap"></td> </tr> <tr> <td align="right"> <a href="link"><img height="16" border="0" width="65" src="/buy"></a> </td> </tr> <tr> <td […]