如何使用xpathselect以下sibling / xml标签

我有一个HTML文件（来自Newegg），他们的HTML组织如下。规格表中的所有数据都是“ desc ”，而每个部分的标题都是“ 名称”。 以下是来自Newegg页面的两个数据示例。

<tr> <td class="name">Brand</td> <td class="desc">Intel</td> </tr> <tr> <td class="name">Series</td> <td class="desc">Core i5</td> </tr> <tr> <td class="name">Cores</td> <td class="desc">4</td> </tr> <tr> <td class="name">Socket</td> <td class="desc">LGA 1156</td>

 <tr> <td class="name">Brand</td> <td class="desc">AMD</td> </tr> <tr> <td class="name">Series</td> <td class="desc">Phenom II X4</td> </tr> <tr> <td class="name">Cores</td> <td class="desc">4</td> </tr> <tr> <td class="name">Socket</td> <td class="desc">Socket AM3</td> </tr>

最后，我希望有一个CPU类（已经设置），包括品牌，系列，核心和socketstypes的存储每个数据的类。这是我能想到去做这件事的唯一方法：

 if(parsedDocument.xpath(tr/td[@class="name"])=='Brand'): CPU.brand = parsedDocument.xpath(tr/td[@class="name"]/nextsibling?).text

并为此做其余的价值。我将如何完成这个下一步，是否有一个更简单的方法来做到这一点？

我将如何完成这个下一步，是否有一个更简单的方法来做到这一点？

您可以使用 ：

 tr/td[@class='name']/following-sibling::td

但我宁愿直接使用 ：

 tr[td[@class='name'] ='Brand']/td[@class='desc']

这假设 ：

评估XPathexpression式的上下文节点是所有tr元素的父节点 – 在您的问题中未显示。
每个tr元素只有一个td其中class属性的值为'name' ，只有一个td的class属性值为'desc' 。

尝试following-sibling轴（ following-sibling::td ）。

如何使用xpathselect以下sibling / xml标签

lxml etree xmlparser删除不需要的名称空间

如何重写这个函数来实现OrderedDict？

bs4.FeatureNotFound：找不到具有您请求的function的树生成器：lxml。你需要安装一个parsing器库吗？

无法在Mac OS X 10.9上安装Lxml

如何在不使用MacPorts或Fink的情况下在OS X Leopard上安装lxml？

Python：如何将html打印成文件

src / lxml / etree_defs.h：9：31：致命错误：libxml / xmlversion.h：没有这样的文件或目录

builtins.TypeError：必须是str，而不是字节

pip安装lxml错误

lxml安装错误ubuntu 14.04（内部编译错误）

如何使用xpathselect以下sibling / xml标签

lxml etree xmlparser删除不需要的名称空间

如何重写这个函数来实现OrderedDict？

bs4.FeatureNotFound：找不到具有您请求的function的树生成器：lxml。 你需要安装一个parsing器库吗？

无法在Mac OS X 10.9上安装Lxml

如何在不使用MacPorts或Fink的情况下在OS X Leopard上安装lxml？

Python：如何将html打印成文件

src / lxml / etree_defs.h：9：31：致命错误：libxml / xmlversion.h：没有这样的文件或目录

builtins.TypeError：必须是str，而不是字节

pip安装lxml错误

lxml安装错误ubuntu 14.04（内部编译错误）

bs4.FeatureNotFound：找不到具有您请求的function的树生成器：lxml。你需要安装一个parsing器库吗？