如下所示:
import re # 过滤不了\\ \ 中文()还有―――― r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符 # 者中规则也过滤不完全 r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+――!,。?、~@#¥%……&*()]+" # \\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中括号里放的是中文符号,第二个中括号前不能少|,否则过滤不完全 r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[――!\\\\,。=?、:“”‘'《》【】¥……()]+" # 去掉括号和括号内的所有内容 r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[――!\\\,。=?、:“”‘'¥……()《》【】]" text = "\崔芸,\\我爱=+你!【我//""们】~――――结/婚'吧::!这.!!_#??()个‘'“”¥$主|意()不错......!" print(re.sub(r1, , '', text))
以上这篇python过滤中英文标点符号的实例代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。