0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python中的正則表達(dá)式

麥辣雞腿堡 ? 來源:Python都知道 ? 作者:Python都知道 ? 2023-06-21 16:52 ? 次閱讀

哈嘍大家好,我是了不起,今天給大家講Python中的正則表達(dá)式

在Python中,正則表達(dá)式是一種強(qiáng)大的文本處理工具,它可以用來匹配、搜索、替換文本。正則表達(dá)式是一個特殊的字符序列,它可以描述一類字符串的特征,這樣我們就可以快速、高效地處理大量的文本數(shù)據(jù)。

基礎(chǔ)語法

在Python中,使用re模塊來操作正則表達(dá)式。re模塊提供了很多函數(shù),用于對字符串進(jìn)行正則匹配和替換。以下是一些常用的正則表達(dá)式元字符:

.:匹配任意一個字符,除了換行符

^:匹配字符串的開頭;

$:匹配字符串的結(jié)尾;

*:匹配前面的字符出現(xiàn)0次或多次;

+:匹配前面的字符出現(xiàn)1次或多次;

?:匹配前面的字符出現(xiàn)0次或1次;

{m}:匹配前面的字符出現(xiàn)m次;

{m,n}:匹配前面的字符出現(xiàn)m到n次;

[...]:匹配方括號中的任意一個字符;

[^...]:匹配不在方括號中的任意一個字符;

(ab):匹配括號中的字符串;

|:或操作符;

\\d:匹配任意一個數(shù)字字符;

\\D:匹配任意一個非數(shù)字字符;

\\w:匹配任意一個字母或數(shù)字字符;

\\W:匹配任意一個非字母或數(shù)字字符;

\\s:匹配任意一個空白字符;

\\S:匹配任意一個非空白字符。

基本用法

下面介紹一些正則表達(dá)式的基本用法:

re.search(pattern, string):搜索字符串中第一個與正則表達(dá)式匹配的子串,如果找到返回一個匹配對象,否則返回None。

re.match(pattern, string):匹配字符串的開頭與正則表達(dá)式是否匹配,如果找到返回一個匹配對象,否則返回None。

re.findall(pattern, string):搜索字符串中所有與正則表達(dá)式匹配的子串,返回一個列表。re.sub(pattern, repl, string):使用repl替換字符串中所有與正則表達(dá)式匹配的子串。

例如,要匹配字符串中的所有數(shù)字,可以使用以下代碼:

import re

text = 'abc123def456ghi789'
result = re.findall('\\d+', text)
print(result)  # Output: ['123', '456', '789']

高級用法

正則表達(dá)式還有一些高級用法,如分組、捕獲和反向引用等。

  1. 分組

    分組是將正則表達(dá)式中的一部分用括號括起來,形成一個子表達(dá)式。分組可以實現(xiàn)重復(fù)使用、捕獲子串等功能。例如,要匹配一個由4個數(shù)字組成的郵政編碼,可以使用以下代碼:

import re

text = 'My zip code is 1234.'
result = re.search('(\\d{4})', text)
print(result.group(1))  # 輸出為: 1234

在上面的代碼中,使用括號將\\d{4}這個子表達(dá)式分組,然后使用group(1)方法獲取第一個分組的內(nèi)容。

  1. 捕獲和非捕獲分組

正則表達(dá)式中的分組可以是捕獲分組或非捕獲分組。捕獲分組可以在匹配到的字符串中提取出子串,并將其作為分組的內(nèi)容返回;而非捕獲分組不會保存子串,并且不會作為分組的內(nèi)容返回。以下是一些例子:

import re

text = 'applebananaorange'

# 捕獲分組
result = re.search('(apple)(banana)(orange)', text)
print(result.groups())  # 輸出為: ('apple', 'banana', 'orange')

# 非捕獲分組
result = re.search('(?:apple)(banana)(orange)', text)
print(result.groups())  # 輸出為: ('banana', 'orange')

在上面的代碼中,第一個正則表達(dá)式包含3個捕獲分組,而第二個正則表達(dá)式包含1個非捕獲分組。在調(diào)用groups()方法時,第一個正則表達(dá)式返回的是3個分組的內(nèi)容,而第二個正則表達(dá)式只返回了1個分組的內(nèi)容。

  1. 反向引用

    反向引用是指在正則表達(dá)式中使用分組后,可以使用\\數(shù)字的方式來引用該分組的內(nèi)容。例如,要匹配一個由兩個相同字符組成的字符串,可以使用以下代碼:

import re

text = 'aba abb abc'

# 使用反向引用
result = re.findall(r'(\\w)\\1', text)
print(result)  # Output: ['a', 'b']

在上面的代碼中,使用(\\w)\\1來匹配由兩個相同字符組成的字符串,其中\\1表示對第一個分組的引用。

總結(jié)

本文介紹了Python中正則表達(dá)式的基本語法和用法,包括正則表達(dá)式的基本元字符、正則表達(dá)式的基本函數(shù)、正則表達(dá)式的高級用法等。正則表達(dá)式是一種非常強(qiáng)大的文本處理工具,在處理大量文本數(shù)據(jù)時可以發(fā)揮巨大的作用。希望本文能夠幫助讀者掌握Python中正則表達(dá)式的基本知識,提高文本處理的效率。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 字符
    +關(guān)注

    關(guān)注

    0

    文章

    232

    瀏覽量

    25154
  • python
    +關(guān)注

    關(guān)注

    55

    文章

    4767

    瀏覽量

    84375
收藏 人收藏

    評論

    相關(guān)推薦

    STM32串口DMA問題詳解

    作為一個概念而言,正則表達(dá)式對于Python來說并不是獨(dú)有的。但是,Python正則表達(dá)式在實際使用過程
    的頭像 發(fā)表于 10-30 14:49 ?6717次閱讀
    STM32串口DMA問題詳解

    什么是正則表達(dá)式?正則表達(dá)式如何工作?哪些語法規(guī)則適用正則表達(dá)式?

    正則表達(dá)式又稱規(guī)則表達(dá)式(Regular Expression,在代碼中常簡寫為 regex、regexp 或 RE),是一種用于匹配、查找、替換文本的強(qiáng)大工具。它能夠以特定的模式匹配字符串,從而
    的頭像 發(fā)表于 11-03 14:41 ?2737次閱讀
    什么是<b class='flag-5'>正則表達(dá)式</b>?<b class='flag-5'>正則表達(dá)式</b>如何工作?哪些語法規(guī)則適用<b class='flag-5'>正則表達(dá)式</b>?

    shell正則表達(dá)式學(xué)習(xí)

    正則表達(dá)式在計算機(jī)科學(xué),是指一個用來描述或者匹配一系列符合某個句法規(guī)則的字符串的單個字符串。在很多文本編輯器或其他工具里,正則表達(dá)式通常被用來檢索和/或替換那些符合某個模式的文本內(nèi)容。許多
    發(fā)表于 07-25 17:18

    初識 Python 正則表達(dá)式

    風(fēng)格的正則表達(dá)式模式。re 模塊使 Python 語言擁有全部的正則表達(dá)式功能。下面通過實例,一步一步來初步認(rèn)識正則表達(dá)式。比如在一段字符串
    發(fā)表于 03-17 16:44

    深入淺出boost正則表達(dá)式

    什么是正則表達(dá)式?正則表達(dá)式是一種用來描述一定數(shù)量文本的模式。Regex代表Regular Express. 如果您不知道什么是正則表達(dá)式,請看這篇文章:深入淺出之正則表達(dá)式
    發(fā)表于 09-08 18:09 ?9次下載

    精通正則表達(dá)式

    詳細(xì)的快速正則表達(dá)式的查詢電子書,簡單而豐富
    發(fā)表于 05-16 18:04 ?5次下載

    關(guān)于java正則表達(dá)式的用法詳解

    正則表達(dá)式 一個正則表達(dá)式是一個用于文本搜索的文本模式。換句話說,在文本搜索出現(xiàn)的模式。例如,你可以用正則表達(dá)式搜索網(wǎng)頁的郵箱地址或超鏈
    發(fā)表于 09-27 14:24 ?0次下載

    Python對字符串進(jìn)行搜索和查找詳細(xì)介紹

    作為一個概念而言,正則表達(dá)式對于Python來說并不是獨(dú)有的。但是,Python正則表達(dá)式在實際使用過程
    發(fā)表于 11-15 11:20 ?8044次閱讀

    快速入門IPv6和正則表達(dá)式

    對于日常開發(fā)只接觸IPv4,并沒有深入研究過正則表達(dá)式的開發(fā)者,面對IPv6和正則表達(dá)式,容易產(chǎn)生畏懼心理,覺得是兩座難以翻越的大山。本文通過一些表格整理對IPv6的表示方法,以及正則表達(dá)式
    的頭像 發(fā)表于 03-30 09:31 ?8889次閱讀
    快速入門IPv6和<b class='flag-5'>正則表達(dá)式</b>

    Python正則表達(dá)式教程之標(biāo)準(zhǔn)庫的完整介紹及使用示例說明

    本文介紹了Python對于正則表達(dá)式的支持,包括正則表達(dá)式基礎(chǔ)以及Python正則表達(dá)式標(biāo)準(zhǔn)庫的完整介紹及使用示例。本文的內(nèi)容不包括如何編寫
    發(fā)表于 01-23 16:00 ?3次下載
    <b class='flag-5'>Python</b><b class='flag-5'>正則表達(dá)式</b>教程之標(biāo)準(zhǔn)庫的完整介紹及使用示例說明

    Python正則表達(dá)式的學(xué)習(xí)指南

    本文介紹了Python對于正則表達(dá)式的支持,包括正則表達(dá)式基礎(chǔ)以及Python正則表達(dá)式標(biāo)準(zhǔn)庫的完整介紹及使用示例。本文的內(nèi)容不包括如何編寫
    發(fā)表于 09-15 08:00 ?0次下載
    <b class='flag-5'>Python</b><b class='flag-5'>正則表達(dá)式</b>的學(xué)習(xí)指南

    Python正則表達(dá)式指南

    本文介紹了Python對于正則表達(dá)式的支持,包括正則表達(dá)式基礎(chǔ)以及Python正則表達(dá)式標(biāo)準(zhǔn)庫的完整介紹及使用示例。本文的內(nèi)容不包括如何編寫
    發(fā)表于 03-26 09:13 ?10次下載
    <b class='flag-5'>Python</b><b class='flag-5'>正則表達(dá)式</b>指南

    初識 Python 正則表達(dá)式

    風(fēng)格的正則表達(dá)式模式。re 模塊使 Python 語言擁有全部的正則表達(dá)式功能。 下面通過實例,一步一步來初步認(rèn)識正則表達(dá)式。 比如在一段字符串
    的頭像 發(fā)表于 03-17 16:44 ?1394次閱讀

    python正則表達(dá)式的常用函數(shù)

    編譯正則表達(dá)式模式,返回一個正則對象的模式。(可以把那些常用的正則表達(dá)式編譯成正則表達(dá)式對象,這樣可以提高一點效率。)
    的頭像 發(fā)表于 03-18 16:12 ?1756次閱讀

    shell腳本基礎(chǔ):正則表達(dá)式grep

    在Linux上有許多命令可以使用正則表達(dá)式,其中最常見的是grep命令和sed命令。正則表達(dá)式有多種類型,每種類型可以使用的元字符類型不同。最常見的是基本正則表達(dá)式和擴(kuò)展
    的頭像 發(fā)表于 05-29 09:29 ?1194次閱讀
    shell腳本基礎(chǔ):<b class='flag-5'>正則表達(dá)式</b>grep