0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

python語言之正則re使用方法

冬至配餃子 ? 來源:繆斯之子 ? 作者:肖新苗 ? 2022-08-23 10:35 ? 次閱讀

. \w \s \d a|b () [...] {} * +

1. 常用元字符

. 匹配除換行符以外的任意字符

\w 匹配字母或數(shù)字或下劃線

\s 匹配任意的空白符

\d 匹配數(shù)字

\n 匹配一個換行符

\t 匹配一個制表符

^ 匹配字符串的開始

$ 匹配字符串的結(jié)尾

\W 匹配非字母或數(shù)字或下劃線

\D 匹配非數(shù)字

\S 匹配非空白符

a|b 匹配字符a或字符b

() 匹配括號內(nèi)的表達式,也表示一個組

[...] 匹配字符組中的字符

[^...] 匹配除了字符組中字符的所有字符


2. 量詞:控制前面的元字符出現(xiàn)的次數(shù)


* 重復(fù)零次或更多次

+ 重復(fù)一次或更多次

? 重復(fù)零次或一次

{n} 重復(fù)n次

{n,} 重復(fù)n次或更多次


3. 貪婪匹配和惰性匹配


.* 貪婪匹配

.*? 非貪婪匹配


'''

點: 匹配所有不包括換行

+: 表示重復(fù)一次或者更多次,就是說如果條件一直符合的話,就連續(xù)匹配

import re

def test_dot():
data1 = 'hello \n world'
pattern = re.compile(r'.+')
res_list = pattern.findall(data1)
assert ['hello ', ' world'] == res_list, 're dot error'

2.點: 匹配所有包括換行

import re
def test_dot2():
# 有時候需要 . 能匹配所有字符,包括換行符, 就需要帶上參數(shù) re.S
data1 = ''

# (.+) 括號說明: 正常會取整個,加括號之后,就只取括號里面的了
ptn = re.compile(r'', re.S)
res_list = ptn.findall(data1)
assert ['hello \n world'] == res_list, 're dot 2 error'

3. \w: 匹配數(shù)字、字母 和 下劃線

import re
def test_w():
data1 = 'ab_@.121'
# + 表示重復(fù)一次或者更多次,就是說如果條件一直符合的話,就連續(xù)輸出,比如:ab_
ptn = re.compile(r'\w+')
res_list = ptn.findall(data1)
assert ['ab_', '121'] == res_list, 're w error'

4.\s: 匹配任意的空白字符

import re
def test_s():
data1 = 'a b\tc\n d$#'
ptn = re.compile(r'\s+')
res_list = ptn.findall(data1)
assert [' ', '\t', '\n '] == res_list, 're s error'

5.\d: 匹配數(shù)字

import re
def test_d():
data1 = 'yidong 10086,liantong 10010'
ptn = re.compile(r'\d+')
res_list = ptn.findall(data1)
assert ['10086', '10010'] == res_list, 're d error'

6.^: 有兩個地方用到: 1.本例中的匹配字符串的開始, 2. 在中括號中,取非

import re
def test_start():
data1 = 'ab1ab2'
ptn = re.compile(r'ab\d')
res_list = ptn.findall(data1)
assert ['ab1', 'ab2'] == res_list, 're ^ error'

# ^ 表示只匹配字符串的開始
data1 = 'ab1ab2'
ptn = re.compile(r'^ab\d')
res_list = ptn.findall(data1)
assert ['ab1'] == res_list, 're ^ 2 error'

7.$: 匹配字符串的結(jié)束

import re
def test_end():
data1 = '1ab2ab'
ptn = re.compile(r'\dab$')
res_list = ptn.findall(data1)
assert ['2ab'] == res_list, 're $ error'

8. |: a|b 匹配字符串a(chǎn)或字符串b

import re
def test_and():
data1 = '12a_3$dc'
ptn = re.compile(r'\d+|a|d|c')
res_list = ptn.findall(data1)
assert ['12', 'a', '3', 'd', 'c'] == res_list, 're | error'

9. (): 表示一個組

import re
def test_bracket():
data1 = ''
ptn = re.compile(r'')
res_list = ptn.findall(data1)
assert ('1', 'xiaoxinmiao') == res_list[0], 're () error'

10. (): 可以通過?P定義組名

import re
def test_bracket2():
# 可以設(shè)置分組名
data1 = ''
ptn = re.compile(r'')
iter_obj = ptn.finditer(data1)
res_obj = iter_obj.__next__()
assert '1' == res_obj.group(
'id') and 'xiaoxinmiao' == res_obj.group('name'), 're () error'

11.(): 當(dāng)有多組時的例子, 當(dāng)然這種情況,直接用例子9更方便

import re
def test_bracket3():
# 可以設(shè)置分組名
data1 = ''
ptn = re.compile(
r'')
iter_obj = ptn.finditer(data1)
ids, names = [], []
for i in iter_obj:
ids.append(i.group('id'))
names.append(i.group('name'))
assert ['1', '2'] == ids and ['miao1', 'miao2'] == names, 're () error'

12.[]: 匹配字符串中的字符, 其中 - 表示區(qū)間,例如:1-9表示1,2,3,4,5,6,7,8,9

import re
def test_bracket_mid():
data1 = '12dss#$$fwe564_'
ptn = re.compile(r'[1-9a-z_$]+')
res_list = ptn.findall(data1)
assert ['12dss', '$$fwe564_'] == res_list, 're [] error'

13.[^]: 匹配除了字符串中的值

import re
def test_bracket_mid2():
data1 = '12dss#$$fwe564_'
# [^] 表示不匹配里面的任何數(shù)
ptn = re.compile(r'[^1-9a-z_$]+')
res_list = ptn.findall(data1)
assert ['#'] == res_list, 're [] error'

14. +, * , ? 的理解,但是并不常用, 最常用的還是這個組合 .*?


def test_liangci():
data1 = 'abccd'
# +: 前一個字符出現(xiàn)1次或者多次
re_list = re.findall(r'abc+', data1)
assert ['abcc'] == re_list, 're + error'

# *: 前一個字符出現(xiàn)0次或者多次
re_list = re.findall(r'abf*', data1)
assert ['ab'] == re_list, 're + error'

# ?: 前一個字符出現(xiàn)0次或者1次
re_list = re.findall(r'abc?', data1)
assert ['abc'] == re_list, 're + error'

16. .*?: 非貪婪模式, 直接看例子

import re
def test_star2():
# .* 貪婪
data1 = '我愛北京天安門,天安門上太陽升.'
res_list = re.findall(r'我愛(.*)天安門', data1)
assert ['北京天安門,'] == res_list, 're .* error'
# .*? 非貪婪
res_list = re.findall(r'我愛(.*?)天安門', data1)
assert ['北京'] == res_list, 're .* error'

17. {}: {n}重復(fù)多次,{n,}重復(fù)多次或者更多次

import re
def test_bracket_big():
# 只有兩位數(shù)字才符合要求
data1 = 'a1b12c134d1234e'
res_list = re.findall(r'\d{2}', data1)
assert ['12', '13', '12', '34'] == res_list, r're {} error'
# 兩位,以及兩位以上的數(shù)字都符合要求
data1 = 'a1b12c134d1234e'
res_list = re.findall(r'\d{2,}', data1)
assert ['12', '134', '1234'] == res_list, r're {} error'

18. []: 實戰(zhàn),匹配中文

import re
def test_zh():
data1 ='我愛111北京%天安


審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 字符串
    +關(guān)注

    關(guān)注

    1

    文章

    566

    瀏覽量

    20386
  • python
    +關(guān)注

    關(guān)注

    53

    文章

    4753

    瀏覽量

    84089
  • ASSERT
    +關(guān)注

    關(guān)注

    0

    文章

    17

    瀏覽量

    7190
  • Split
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    5553
收藏 人收藏

    評論

    相關(guān)推薦

    pytorch和python的關(guān)系是什么

    在當(dāng)今的人工智能領(lǐng)域,Python已經(jīng)成為了最受歡迎的編程語言之一。Python的易學(xué)易用、豐富的庫和框架以及強大的社區(qū)支持,使其成為了數(shù)據(jù)科學(xué)、機器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域的首選語言。而
    的頭像 發(fā)表于 08-01 15:27 ?799次閱讀

    Python語言基礎(chǔ)2

    電子發(fā)燒友網(wǎng)站提供《Python語言基礎(chǔ)2.rar》資料免費下載
    發(fā)表于 07-17 17:23 ?1次下載

    四種編程語言之間的區(qū)別和聯(lián)系

    編程語言是一種人與計算機之間進行交流的方式,不同的編程語言有著不同的特點和用途。本文將對四種常見的編程語言——Python、Java、C++和JavaScript進行比較,分析它們的區(qū)
    的頭像 發(fā)表于 02-05 14:16 ?1090次閱讀

    EMC輻射發(fā)射RE整改方法

    EMC輻射發(fā)射RE整改方法
    的頭像 發(fā)表于 12-14 10:09 ?1033次閱讀
    EMC輻射發(fā)射<b class='flag-5'>RE</b>整改<b class='flag-5'>方法</b>

    查看python安裝路徑的方法

    Python是一種高級編程語言,常用于開發(fā)Web應(yīng)用、數(shù)據(jù)分析、人工智能等領(lǐng)域。在使用Python進行開發(fā)之前,我們需要先安裝Python解釋器,并了解
    的頭像 發(fā)表于 11-29 14:54 ?2830次閱讀

    python語言特點有哪些

    、詳實和細致的描述,共計超過1500字。 簡潔優(yōu)雅: Python以簡潔和優(yōu)雅的語法而著稱。相對于其他編程語言Python代碼通??雌饋砀忧逦鬃x。這得益于Python采用了面向?qū)?/div>
    的頭像 發(fā)表于 11-29 14:29 ?840次閱讀

    運行Python程序的幾種常見方法

    Python是一種高級編程語言,具有簡單易學(xué),易于閱讀和調(diào)試的特點。當(dāng)你完成了一個Python程序之后,你需要運行它以檢查程序是否按照預(yù)期工作。下面是運行Python程序的幾種常見
    的頭像 發(fā)表于 11-28 15:32 ?1946次閱讀

    Python編程語言屬于什么語言

    、易于學(xué)習(xí)和理解的語言,強調(diào)代碼的可讀性和簡潔性。Python的設(shè)計真正做到了"堅守一種方法",非常注重代碼的正確性和一致性。這也是為什么Python非常受歡迎的主要原因之一。接下來,
    的頭像 發(fā)表于 11-22 14:31 ?1151次閱讀

    什么是正則表達式?正則表達式如何工作?哪些語法規(guī)則適用正則表達式?

    正則表達式又稱規(guī)則表達式(Regular Expression,在代碼中常簡寫為 regex、regexp 或 RE),是一種用于匹配、查找、替換文本的強大工具。它能夠以特定的模式匹配字符串,從而
    的頭像 發(fā)表于 11-03 14:41 ?1807次閱讀
    什么是<b class='flag-5'>正則</b>表達式?<b class='flag-5'>正則</b>表達式如何工作?哪些語法規(guī)則適用<b class='flag-5'>正則</b>表達式?

    cnocr和tesseract的使用方法和效果

    今天嘗試了一下cnocr和tesseract,給大家分別講講兩個模塊的使用方法和效果。 1.準(zhǔn)備 開始之前,你要確保Python和pip已經(jīng)成功安裝在電腦上噢,如果沒有,請訪問這篇文章: 超詳細
    的頭像 發(fā)表于 11-02 14:37 ?1032次閱讀
    cnocr和tesseract的<b class='flag-5'>使用方法</b>和效果

    Go語言Python強多少

    1.都說Go語言性能非常強大,那么到底比Python強多少? 為了比較Go語言Python語言在單線程性能上的差距,我們可以做一個簡單實驗
    的頭像 發(fā)表于 11-02 14:05 ?442次閱讀
    Go<b class='flag-5'>語言</b>比<b class='flag-5'>Python</b>強多少

    C語言運算符的使用方法

    詳細介紹了C語言表達式、算術(shù)運算符、賦值運算符、關(guān)系運算符、條件結(jié)構(gòu)、邏輯運算符、位運算符的語法和使用方法,并討論了運算符的優(yōu)先級。
    發(fā)表于 11-02 11:30 ?948次閱讀
    C<b class='flag-5'>語言</b>運算符的<b class='flag-5'>使用方法</b>

    C語言循環(huán)結(jié)構(gòu)的使用方法

    詳細介紹了C語言while循環(huán)結(jié)構(gòu)、do-while循環(huán)結(jié)構(gòu)、for循環(huán)結(jié)構(gòu)、循環(huán)退出語句的語法和使用方法。
    發(fā)表于 11-02 11:26 ?1148次閱讀
    C<b class='flag-5'>語言</b>循環(huán)結(jié)構(gòu)的<b class='flag-5'>使用方法</b>

    Camelot模塊的使用方法

    :JSON,Excel,HTML和Sqlite。 下面給大家介紹這個模塊的使用方法: 1.準(zhǔn)備 開始之前,你要確保Python和pip已經(jīng)成功安裝在電腦上,如果沒有,可以訪問這篇文章: 超詳細Python
    的頭像 發(fā)表于 11-01 10:02 ?753次閱讀
    Camelot模塊的<b class='flag-5'>使用方法</b>

    輻射RE整改有哪些方法?

    輻射RE整改有哪些方法?|深圳比創(chuàng)達電子EMC
    的頭像 發(fā)表于 10-31 10:57 ?1446次閱讀
    輻射<b class='flag-5'>RE</b>整改有哪些<b class='flag-5'>方法</b>?