언어/Python

파이썬(Python) - 정규표현식(Regex) 특수문자 제거 설명 및 예제 소스 코드

[좋은사람] 2018. 7. 20. 18:54

Python - 정규표현식(Regular Expressions) 기본 설명

 

 정규표현식은 복잡한 문자열을 가공 및 처리할 경우 유용하게 사용할 수 있는 기법입니다.

② 파이썬 정규표현식은 강력한 기능을 제공하고 있으며, search, match, findall, sub 명령어 등으로 쉽게 사용할 수 있습니다.

③ 정규표현식은 책 한 권으로 분리 될 정도로 적지 않은 내용을 수반하지만, 실제 프로젝트를 수행 하시면서 필요한 경우 틈틈히 
    관련 이론을 공부하시는 것을 추천드립니다.
④ 오늘은 자주 사용하는 패턴인 특정 문자열 중에서 특수문자를 제거하는 예제를 간단하게 다뤄보겠습니다.


 

Python - 정규표현식 예제 소스 코드(문자열 내 특수문제 제거)

 

원본코드

1
2
3
4
5
6
7
8
9
10
11
12
13
14
import re
 
#텍스트 정제(전처리)
def cleanText(readData):
    #텍스트에 포함되어 있는 특수 문자 제거
    text = re.sub('[-=+,#/\?:^$.@*\"※~&%ㆍ!』\\‘|\(\)\[\]\<\>`\'…》]''', readData)
    return text
 
if __name__ == "__main__":
    oriText = "!@#abcdefghijklmn!@#$%^&*()"
    print('+++ 텍스트 특수문자 제거 전 +++')
    print('Original : ', oriText)
    print('+++ 텍스트 특수문자 제거 후 +++')
    print('After Text : ', cleanText(oriText))
cs


실행화면


 

Python 소스 코드 다운로드

 

소스코드 다운로드

- 이해가 잘 안되시면 소스코드를 다운로드 하셔서 실행해 보세요.

re_sub.zip


파이썬 정규표현식 레퍼런스 참고 :  https://docs.python.org/3/library/re.html