TagSoup与Jsoup与HTMLparsing器与HotSax vs

大量的HTMLparsing器select(并坚持)是令人难以置信的:

http://java-source.net/open-source/html-parsers

我如何select最适合以下要求的产品:

  1. 成熟(比其他的更less的错误)
  2. 生活和呼吸(即维持)
  3. 快速和资源高效(打算在Android上运行)

根据你的经验,你会推荐哪个HTMLparsing器(满足上述要求),为什么?

那么,我find了@BalusC在另一个线程上给出的答案:

  1. 如果您只是想使用基于XML的工具来遍历它: JTidy 。
  2. 如果你想unit testingHTML: HtmlUnit
  3. 如果你想从HTML中提取特定的数据: Jsoup

谢谢@BususC。