从html中抽取内容片段

最后更新:2023-10-18 20:56:37 | 状态:未完成

String html = "一段html源码";


获取所有 包含attribute属性 的标签与标签体,不支持相同标签嵌套

RegularUtil.getTagAndBodyWithAttribute(html, "class")


获取所有 包含attribute属性包含value值  的标签与标签体

RegularUtil.getTagAndBodyWithAttributeValue(html, "class", "a")



提取双标签<div>content<div>
依次取出p,table,div中的内容 有嵌套时只取外层 
只能提取同时有 开始结束标签的内容,不能提取单标签内容如<img> <br/>
支持不同标签嵌套,但不支持相同标签嵌套
不区分大小写
RegularUtil.fetchPairedTag(String txt,String ... tags)

最近更新 搜索 提交