首页 1 2 3 4 5 6 7

python笔记-正则表达式

什么是正则表达式：

正则表达式是一个特殊的字符序列，能帮助我们方便的检查一个字符串是否与某种模式匹配(定义往往都很枯燥)

也称之为”模式“，即可用于检查一个给定的字符串是否符合某种模式

举例：

我们定义一个模式，平常经常用到的日期模式：XXXX-XX-XX,2018-03-10

在正则表达式的模式定义语法里：\d用来指定一个数字，因此我们将日期的正则表达式的模式定义成：”\d\d\d\d-\d\d-\d\d"

什么是元字符：

元字符是一些在正则表达式中有特殊用途、不代表它本身字符意义的一组字符

利用元字符，我们可以控制字符串匹配的方式

比如上例中的\d,用来指定一个数字，“相当于[0-9]，匹配任何单个的数字字符”，而非d字母本身

元字符各自含义

正则表达式的完整元字符及各自的含义（主要有11个）：

      .   ^   $  *  +  ?  \   |   { }    []    ()

我们选挑重要的依次进行解释

1.[ ] 方括号

(1) 常用来指定一个字符集，如[abcd]匹配：a或b或c或d

(2) 元字符在”[]”中不起所用，比如：[a+]匹配：a或+

(3) 补集匹配：[^a]，匹配非a的一个字符

(4) 匹配连续字符：[a-zA-Z0-9]，匹配大小写英文字母和数字

2.^

匹配行首，直接匹配字符串中的每一个换行

3.$

匹配行尾，行尾是指：字符串尾，或一个换行字符后的任何位置

4.\

转义字符，如果要匹配”\”本身，需要使用再次转义：”\”

一些特殊字符：

\d：匹配：[0-9]

\D：匹配：[^0-9],与 \d 相反，匹配任何非十进制数字的字符

\s：匹配：任何空白符，即：[\t\n\r\f\v]

\S：匹配：任何非空白符，即：[^\t\n\r\f\v]

\w：匹配：[a-zA-Z0-9_ ],即匹配任何字符

\W：匹配：[^a-zA-Z0-9_ ],与\w相反

匹配前一个字符或子表达式出现0次或多次

例如：ca*t 将匹配 ct（0 个字符 a），cat（1 个字符 a），caaat（3 个字符 a）

匹配前一个字符或子表达式出现1次或多次

例如： ca+t 会匹配 cat 和 caaat，但不会匹配 ct。

7.？

匹配前一个字符或子表达式出现1次或0次

例如：大?帅哥可以匹配大帅哥，也可以匹配帅哥。

8.{ }

匹配前一个字符或子表达式出现指定次数（即代表重复）

{0,}：0次或多次，相当于”*”

{1,}：1次或多次，相当于”+”

{0,1}：0次或1次，相当于”?”

{m,n}：m次到n次(m <= n)，m是最少重复的次数，n是最多重复的次数

匹配除换行符以外的任意一个字符

每一种条件匹配一次，且"|“和”[]"效果是相同的，返回形式一样

例如：

print (re.findall(r"[abc]",“abc”))

[‘a’,‘b’,‘c’]

print (re.findall(r"[a|b|c]",“abc”))

[‘a’,‘b’,‘c’]

圆括号分组匹配使得匹配返回元组

例如：

print (re.findall(r"one two three four five six",a))

[‘one two three four five six’]

print (re.findall(r"(one) (two) (three) (four) (five) (six)",a))

[ ]返回空

python语言中的re模块

在python语言中，re模块用于提供正则表达式的全部功能，而re模块中最重要的两个函数是match()和re.search()

re.match()简介

格式：re.match(pattern,string,flag=0),

第一个参数pattern用于传入需要匹配的模式定义字符串

第二个参数string用于传入被匹配和检查的字符串内容

第三个flag用于传入标识，如是否区分大小写

例1：

import re

print(re.match("\d\d\d\d-\d\d-\d\d",“2018-03-09”))

运行结果：<_sre.SRE_Match object; span=(0, 10), match=‘2018-03-09’>

代表2018-03-09符合我们定义的日期模式

例2：

import re

print(re.match("\d\d\d\d-\d\d-\d\d",“2018-3-9”))

运行结果：NONE

代表不符合

思考一下，如何既满足符合一个数字的月份和日又符合两个数字的月份和日（见例3）

例3：

import re

print(re.match("\d\d\d\d-\d{1,2}-\d{1,2}",“2018-3-9”))

如果看不懂，请返回到上节8.{}介绍部分

例4：

再思考一下，下面的代码

import re

print(re.match("\d{4}-\d{1,2}-\d{1,2}",“2018-3-9”))

例5：

思考一下，下面的代码（可先看一下上一节\s和*的含义）

imprt re

print(re.match("\s*\d{4}-\d{1,2}-\d{1,2}"," 2017-05-08")

代码是为了兼容日期前面如果出现多个空格的情况使用 \s*

例6：

import re

print(re.match(“Dehom”,“Dehom Wang”))

回归最简单模式就是字符串本身，这很重要

补充知识:

Python中字符串前面加上 r 表示原生字符串，（r=raw)

Python里的原生字符串很好地解决了需要\转义字符这个问题，例如匹配一个数字的"\d"可以写成r"\d"。有了原生字符串，不用担心是不是漏写了反斜杠，写出来的表达式也更直观

nginx+flask+uwsgi部署遇到的坑

文章目录 1.环境：

LOG FILE SWITCH等待事件

log file switch completion，log file switch (archiving needed) log file switch (checkpoint incomplete) 这三个等待事件是没有

注册中心 Eureka Nacos使用和区别

Eureka：没用Eureka前需要用RestTemplate

CSS3设置文字最少显示2行，超过长度用省略号代替

CSS3 关于文字处理的样式学习 text-overflow属性 div.test{ text-overflow:ellipsis; } 默认值是clip 语法：

在云服务器上安装Jenkins

说明：Jenkins是一个部署项目的平台，通过Jenkins可以省去从项目开发–>部署项目之间的所有流程，做到代码提交即上线。本文介绍在云服务CentOS上安装Jenkins。前提安装Jenkins之前，先要在云服务上安装JD

帝国7.5标签+在PHP7.0,帝国CMS7.5支持PHP7.*系列，兼容性更好

本文将为您介绍的是帝国CMS7.5支持PHP7.*系列，兼容性更好,具体操作方法请看下文: PHP7版本对PHP改动大，去掉了MYSQL扩展模块等，导致部分函数无法正常使用。因而，帝国CMS7.5新增对PHP7.*系列运行环境的支持，兼容性更好。使用

nuxt webpack配置css,nuxt笔记

初始化： vue init nuxt/starter (类似 vue init webpack)

Rust 问答之 Cargo 是什么

Cargo：Rust 的构建工具和包管理器文章标题来自于 Rust 官网：

ElasticSearch安装与集群搭建

1.官网地址