从html中抽取内容片段
最后更新:2023-10-18 20:56:37
|
状态:未完成
String html = "一段html源码";
获取所有 包含attribute属性 的标签与标签体,不支持相同标签嵌套
RegularUtil.getTagAndBodyWithAttribute(html, "class")
获取所有 包含attribute属性包含value值 的标签与标签体
RegularUtil.getTagAndBodyWithAttributeValue(html, "class", "a")
提取双标签<div>content<div>
依次取出p,table,div中的内容 有嵌套时只取外层
只能提取同时有 开始结束标签的内容,不能提取单标签内容如<img> <br/>
支持不同标签嵌套,但不支持相同标签嵌套
不区分大小写
RegularUtil.fetchPairedTag(String txt,String ... tags)