正则表达式

发布日期:2022-01-25
最后更新:2025-07-02 22:45:20
阅读:6,307
这里并不是真的要写正则表达式,而是通过RegularUtil从文本内容中抽取内容,达到正则表达式的效果

如从一段html中抽取h1标签内的内容
抽带有指定属性的标签或标签体
对于复杂的格式可能需要抽取 某几个标记之间的内容
删除html标签但保留标签体
删除标签属性但保留标签与标签体

经常用于爬虫结果处理