正则表达式
最后更新:2024-03-05 17:11:45
|
状态:未完成
这里并不是真的要写正则表达式,而是通过RegularUtil从文本内容中抽取内容,达到正则表达式的效果
如从一段html中抽取h1标签内的内容
抽带有指定属性的标签或标签体
对于复杂的格式可能需要抽取 某几个标记之间的内容
删除html标签但保留标签体
删除标签属性但保留标签与标签体
经常用于爬虫结果处理