MissingSemester(3)正则表达式与数据整理

有时候我们需要利用搜索模式、正则表达式等结合来筛选数据吗,本篇主要概述了如何使用正则表达式

正则表达式

常用工具

正则表达式在线调试工具: https://regex101.com/
Github-LearnREGEX: https://github.com/cdoco/learn-regex-zh
简短的Regex教程与练习: https://regexone.com/

常见模式

.除换行符之外的”任意单个字符”
*匹配前面字符零次或多次
+匹配前面字符一次或多次
?作为后缀使用,将*+的模式从贪婪模式(默认)改完非贪婪模式

[abc]匹配 a, b 和 c 中的任意一个
(RX1|RX2)任何能够匹配RX1或RX2的结果
^行首锚点
$行尾锚点

捕获组与使用

在正则表达式中,我们可以使用圆括号来得到一个“捕获组capture groups”
被圆括号内的正则表达式匹配到的文本,都会被存入一系列以编号区分的捕获组中
使用/x来使用捕获组得到的内容,其中x是从1开始的数字,/1就是第一个捕获组的内容

小结:

正则表达式的核心还是在于多写多用,这里不多赘述了