多语言展示
当前在线:497今日阅读:2今日分享:38

python如何使用正则表达式

在使用python爬取网页数据时,有时候需要运用正则来过滤、抓取特定的文字,那么python里怎么调用正则方法呢?接下来分享一些我个人的小经验。
工具/原料
1

电脑

2

python

方法/步骤
1

match(pattern, string[, flag=0])函数Pattern:正则表达式String:待匹配的字符串Flags:可选参数,表示是否区分大小写、多行匹配等如果匹配,返回匹配到的第一个对象,否则Nonem.groups()列出所有正则的匹配项m.group(0), m.group(1),……取出第一个、第二个……匹配的子串

2

search(pattern, string[, flag=0])函数Pattern等参数和match一样如果搜索到匹配的子串,则返回匹配到的第一个对象,否则返回None

3

sub(pattern, sub, string, count函数Pattern:正则表达式Sub:要替换到字符串中去的部分String:待替换的字符串Count:替换多少个。默认是找到几个就替换几个返回string在执行之后的结果。如果没有找到可以被替换的子字符串,也依旧返回原字符串

4

split(pattern, string)函数Pattern:正则表达式String:待切割的字符串返回一个列表,这个列表由被切割出来的子串组成。如果找不到作为分割点的字符,则返回整个字符串

5

findall(pattern, string)函数Pattern:正则表达式String:待查找的字符串函数将所有满足条件的子字符串找出之后,放入一个列表并返回之。

6

compile(pattern[,flags=0])函数说明同match参数预编译,加快速度。返回一个regex对象,用法和re一样,只不过是不再需要输入pattern

注意事项
1

不要忘记import re哦

2

本文示例采用的python版本为2.6

推荐信息