html中抽取标签时嵌套问题

最后更新:2023-10-18 21:03:33 | 状态:未完成

从html中抽取多个标签,如需要抽取a标签和li标签

最简单的是抽取两次
RegularUtil.fetchAllTag(html,"a")
RegularUtil.fetchAllTag(html,"li")

但这样有个问题,两个标签的顺序会乱,

如果需要保持顺序可以通过RegularUtil.fetchAllTag(html,"a","li");

但是一定注意:这里的a有可能被包含在li内部,这时li中的a不会再单独抽取

最近更新 搜索 提交