html中抽取标签时嵌套问题
最后更新:2023-10-18 21:03:33
|
状态:未完成
从html中抽取多个标签,如需要抽取a标签和li标签
最简单的是抽取两次
RegularUtil.fetchAllTag(html,"a")
RegularUtil.fetchAllTag(html,"li")
但这样有个问题,两个标签的顺序会乱,
如果需要保持顺序可以通过RegularUtil.fetchAllTag(html,"a","li");
但是一定注意:这里的a有可能被包含在li内部,这时li中的a不会再单独抽取