最近在 git 开了个小库..

learning regular expression in python.

什么是正则表达式?

正则表达式是一种被用于从文本中检索符合某些特定模式的文本。

正则表达式是从左到右来匹配一个字符串的。“Regular Expression”这个词太长了,我们通常使用它的缩写“regex”或者“regexp”。
正则表达式可以被用来替换字符串中的文本、验证表单、基于模式匹配从一个字符串中提取字符串等等。

这个库是干嘛的?

之前的很多正则教程有脱离语言相关性的教程和使用相关语言进行教学的。
但是多多少少都有一些问题,例如完全脱离语言的正则教程中的部分语法在某些语言中使用起来会和期望结果不一致。
于是就有了这个 python 实现的一些常用正则的用法展示,方便学习。

库中的内容

转载请注明出处啊~~

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
#!/usr/bin/python
import re


def main():
# <editor-fold desc='匹配任意字符关键字'>
pattern = re.compile(r'.a.\.xls')
result1 = pattern.findall('sales.xls'
'sales1.xls'
'orders3.xls'
'sales2.xls'
'sales3.xls'
'apac1.xls'
'europe2.xls'
'na1.xls'
'na2.xls'
'sa2.xls'
'ca1.xls')

print(result1) # ['na1.xls', 'na2.xls', 'sa2.xls', 'ca1.xls']
# </editor-fold>

# <editor-fold desc='匹配一组字符关键字[]'>
pattern = re.compile(r'[ns]a.\.xls')
result1 = pattern.findall('sales.xls'
'sales1.xls'
'orders3.xls'
'sales2.xls'
'sales3.xls'
'apac1.xls'
'europe2.xls'
'na1.xls'
'na2.xls'
'sa2.xls'
'ca1.xls')

print(result1) # ['na1.xls', 'na2.xls', 'sa2.xls']
# </editor-fold>

# <editor-fold desc='大小写'>
pattern = re.compile(r'[Rr]eg[Ee]x')

result1 = pattern.findall('RegEx or regex or REGEX.')

print(result1) # ['RegEx', 'regex']
# </editor-fold>

# <editor-fold desc='集合区间'>
pattern = re.compile(r'[ns]a[0123456789]\.xls')
pattern = re.compile(r'[ns]a[0-9]\.xls')

result1 = pattern.findall('sales.xls'
'sales1.xls'
'orders3.xls'
'sales2.xls'
'sales3.xls'
'apac1.xls'
'europe2.xls'
'sam.xls'
'na1.xls'
'na2.xls'
'sa1.xls'
'ca1.xls')

print(result1) # ['na1.xls', 'na2.xls', 'sa1.xls']
# </editor-fold>

# <editor-fold desc='读取rgb值'>
# [A-Z] 匹配A到Z所有大写字母
# [a-z] 匹配a到z所有小写字母
# [A-F] 匹配A到F所有大写字母
# [A-z] 匹配从ASCII字符A到ASCII字符z的所有字母
# [A-Za-z0-9] 匹配任何一个字母无论大小写或数字

pattern = re.compile(r'#[0-9A-Fa-f][0-9A-Fa-f][0-9A-Fa-f][0-9A-Fa-f][0-9A-Fa-f][0-9A-Fa-f]')

result1 = pattern.findall('body { background-color: #fefdb8; }'
'h1 { background-color: #0000ff; }'
'div { background-color: #d0f4e6; }'
'span { background-color: #f08970; }')

print(result1) # ['#fefdb8', '#0000ff', '#d0f4e6', '#f08970']
# </editor-fold>

# <editor-fold desc='排除关键字^'>
pattern = re.compile(r'[ns]a[^0-9]\.xls')

result1 = pattern.findall('sales.xls'
'sales1.xls'
'orders3.xls'
'sales2.xls'
'sales3.xls'
'apac1.xls'
'europe2.xls'
'sam.xls'
'na1.xls'
'na2.xls'
'sa1.xls'
'ca1.xls')

print(result1) # ['sam.xls']
# </editor-fold>

# <editor-fold desc='匹配空白字符'>
# 关键字
# [\b] 回退(并删除)一个字符(Backspace)
# \f 换页符
# \n 换行符
# \r 回车符
# \t 制表符
# \v 垂直制表符
pattern = re.compile(r'\r\n\r\n')

result1 = pattern.findall('101'
'202'
""
'303')

print(result1) # 匹配空行
# </editor-fold>

# <editor-fold desc='匹配特定字符串类型'>
# 匹配数字,非数字
# \d 任何一个数字字符 等价 [0-9]
# \D 任何一个非数字字符 等价 [^0-9]

# 匹配字母数字,非字母数字
# \w 任何一个字母数字字符(大小写均可)或下划线字符(等价于[a-zA-Z0-9_])
# \W 任何一个非字母数字字符或非下划线字符(等价于[^a-zA-Z0-9_])
pattern = re.compile(r'\w\d\w\d\w\d')

result1 = pattern.findall('11213\r\n'
'A1C2E3\r\n'
'48075\r\n'
'48237\r\n'
'M1B4F2\r\n'
'90046\r\n'
'H1H2H2\r\n')

print(result1) # ['A1C2E3', 'M1B4F2', 'H1H2H2']
# </editor-fold>

# <editor-fold desc='匹配空白字符,非空白字符'>
# \s 任何一个空白字符 等价 [\f\n\r\t\v]
# \S 任何一个非空白字符 等价 [^\f\n\r\t\v]

# </editor-fold>

# <editor-fold desc='匹配十六进制或八进制数值'>
# \x 十六进制
# ex: \x0A 对应ASCII10 等价于 \n

# \0 八进制
# ex: \011 对应ASCII9 等价于\t

# </editor-fold>

# <editor-fold desc='POSIX, 不过py不支持'>

# [:alnum:] 任何一个字母或数字(等价于[a-zA-Z0-9])
# [:alpha:] 任何一个字母(等价于[a-zA-Z])
# [:blank:] 空格或制表符(等价于[\t ])
# [:cntrl:] ASCII控制字符(ASCII 0到31, 再加上ASCII 127)
# [:digit:] 任何一个数字(等价于[0-9])
# [:graph:] 和[:print:]一样,但不包括空格
# [:lower:] 任何一个小写字母(等价于[a-z])
# [:print:] 任何一个可打印字符
# [:punct:] 既不属于[:alnum:], 也不属于[:cntrl:]的任何一个字符
# [:space:] 任何一个空白字符,包括空格(等价于[\f\n\r\t\v\ ])
# [:upper:] 任何一个大写字母(等价于[A-Z])
# [:xdigit:] 任何一个十六进制数字(等价于[a-fA-F0-9])

# </editor-fold>

# <editor-fold desc='匹配一个或多个字符'>
# +号匹配 1~N个字符
# []内\.和.等价
pattern = re.compile(r'[\w\.]+@[\w.]+\.\w+')

result1 = pattern.findall('ben@forta.com\n'
'ben.forta@forta.com\n'
'support@forta.com\n'
'ben@urgent.forta.com\n'
'spam@forta.com\n')

# ['ben@forta.com', 'ben.forta@forta.com', 'support@forta.com', 'ben@urgent.forta.com', 'spam@forta.com']
print(result1)

# </editor-fold>

# <editor-fold desc='匹配零个或多个字符'>
# *号匹配 0~N个字符
# []内\.和.等价
pattern = re.compile(r'\w+[\w.]*@[\w.]+\.\w+')

result1 = pattern.findall('.ben@forta.com\n'
'.ben.forta@forta.com\n')

# ['ben@forta.com', 'ben.forta@forta.com']
print(result1)

# </editor-fold>

# <editor-fold desc='匹配零个或一个字符'>
# ?号匹配 0~1个字符(最多一次)
pattern = re.compile(r'https?:\/\/[\w.\/]+')

result1 = pattern.findall('http://www.forta.com/ test https://www.forta.com/')

# ['http://www.forta.com/', 'https://www.forta.com/']
print(result1)

# </editor-fold>

# <editor-fold desc='匹配重复次数'>
# {次数}
pattern = re.compile(r'#[0-9A-Fa-f]{6}')

result1 = pattern.findall('body { background-color: #fefdb8; }'
'h1 { background-color: #0000ff; }'
'div { background-color: #d0f4e6; }'
'span { background-color: #f08970; }')

print(result1) # ['#fefdb8', '#0000ff', '#d0f4e6', '#f08970']

# </editor-fold>

# <editor-fold desc='区间范围'>
# {最小, 最大} ex:{2, 4} 最少重复2次, 最多重复4次
# {0,1} 等价于 ?
pattern = re.compile(r'\d{1,2}[-\/]\d{1,2}[-\/]\d{2,4}')

result1 = pattern.findall('4/8/17\n'
'10-6-2018\n'
'2/2/2\n'
'01-01-01\n')

# ['4/8/17', '10-6-2018', '01-01-01']
print(result1)

# </editor-fold>

# <editor-fold desc='至少重复多少次'>
# {至少次数,} 重复 至少次数 或更多
# {1,} 等价于 +
# 找出金额大于100的
pattern = re.compile(r'\d+: \$\d{3,}\.\d{2}')

result1 = pattern.findall('1001: $496.80\n'
'1002: $1290.69\n'
'1003: $26.43\n'
'1004: $613.42\n'
'1005: $7.61\n'
'1006: $414.90\n'
'1007: $25.00\n')

# ['1001: $496.80', '1002: $1290.69', '1004: $613.42', '1006: $414.90']
print(result1)

# </editor-fold>

# <editor-fold desc='防止过度匹配'>
# * + {} 都是greedy型
# 后面添加?就是 懒惰版本

# ['<b>AK</b> and <b>HI</b>']
pattern = re.compile(r'<[Bb]>.*<\/[Bb]>')
# ['<b>AK</b>', '<b>HI</b>']
pattern = re.compile(r'<[Bb]>.*?<\/[Bb]>')

result1 = pattern.findall('This offer is not available to customer living in <b>AK</b> and <b>HI</b>')

print(result1)

# </editor-fold>

# <editor-fold desc='单词边界'>
# \b 匹配单词边界

pattern = re.compile(r'\bcat\b')

result1 = pattern.findall('The cat scattered his food all over the room.')

# ['cat']
print(result1)

pattern = re.compile(r'\bcap')

result1 = pattern.findall('captain cap cape recap')

# ['cap', 'cap', 'cap']
print(result1)

pattern = re.compile(r'cap\b')

result1 = pattern.findall('captain cap cape recap')

# ['cap', 'cap']
print(result1)

# </editor-fold>

# <editor-fold desc='非单词边界'>
# \B 匹配非单词边界

pattern = re.compile(r'\B-\B')

result1 = pattern.findall('color - coded nine-digit')

# ['-']
print(result1)
# </editor-fold>

# <editor-fold desc='字符串边界'>
# ^ 字符串开头 ([]内^才是取反)
# $ 字符串结尾

# 如果xml之前有其他字符或者其他行, 就会匹配失败
# ['<?xml version='1.0' encoding='utf-8'?>']
pattern = re.compile(r'^\s*<\?xml.*\?>')
# 匹配尾巴的
# ['<manifest>']
pattern = re.compile(r'<manifest>$')

result1 = pattern.findall('<?xml version=\'1.0\' encoding=\'utf-8\'?><manifest><manifest>')

print(result1)

# </editor-fold>

# <editor-fold desc='多行模式'>
# (?m) 打开多行模式, 打开后会把换行符视为字符串分隔符
# 这样就可以用^$匹配字符串换行后的起始和结束位置

pattern = re.compile(r'(?m)^\s*\/\/.*$')

result1 = pattern.findall('// 注释1 \n'
'code123\n'
'// 注释2\n'
'code123 \n'
'//注释123 注释456')

# ['// 注释1 ', '// 注释2', '//注释123 注释456']
print(result1)

# </editor-fold>

# <editor-fold desc='子表达式'>
# () 关键字

# 无法正确匹配, 只能匹配 &nbsp;;;
pattern = re.compile(r'&nbsp;{2,}')

pattern = re.compile(r'(&nbsp;){2,}')

result1 = pattern.findall('Test&nbsp;&nbsp;&nbsp;&nbsp;Test')

# ['// 注释1 ', '// 注释2', '//注释123 注释456']
print(result1)

# ['12.123.12.200']
pattern = re.compile(r'\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}')

# [('12.123.14.200', '14.')]
pattern = re.compile(r'((\d{1,3}\.){3}\d{1,3})')

# ['14.']
pattern = re.compile(r'(\d{1,3}\.){3}\d{1,3}')

# ['12.123.14.200']
pattern = re.compile(r'(?:\d{1,3}\.){3}\d{1,3}')

result1 = pattern.findall('[12.123.14.200]')

print(result1)

# <re.Match object; span=(1, 14), match='12.123.14.200'>
print(re.search(pattern, '[12.123.14.200]'))

# [('1967', '19')]
pattern = re.compile(r'((19|20)\d{2})')

result1 = pattern.findall('1967-08-17')

print(result1)

# </editor-fold>

# <editor-fold desc='补充上面子表达式中的()和findall在py下的注意'>

s = 'adfad asdfasdf asdfas asdfawef asd adsfas '

reObj1 = re.compile(r'((\w+)\s+\w+)')

# [('adfad asdfasdf', 'adfad'), ('asdfas asdfawef', 'asdfas'), ('asd adsfas', 'asd')]
print(reObj1.findall(s))

reObj2 = re.compile(r'(\w+)\s+\w+')

# ['adfad', 'asdfas', 'asd']
print(reObj2.findall(s))

reObj3 = re.compile(r'\w+\s+\w+')

# ['adfad asdfasdf', 'asdfas asdfawef', 'asd adsfas']
print(reObj3.findall(s))

# 按以上代码例子讲解:
#
# findall函数返回的总是正则表达式在字符串中所有匹配结果的列表
# 此处主要讨论列表中'结果'的展现方式
# 即findall中返回列表中每个元素包含的信息
# 1.当给出的正则表达式中带有多个括号时
# 列表的元素为多个字符串组成的tuple
# tuple中字符串个数与括号对数相同
# 字符串内容与每个括号内的正则表达式相对应
# 并且排放顺序是按括号出现的顺序。
#
# 2.当给出的正则表达式中带有一个括号时
# 列表的元素为字符串
# 此字符串的内容与括号中的正则表达式相对应(不是整个正则表达式的匹配内容)
#
# 3.当给出的正则表达式中不带括号时
# 列表的元素为字符串
# 此字符串为整个正则表达式匹配的内容
#
# </editor-fold>

# <editor-fold desc='匹配有效ip'>
# 注意顺序
pattern = re.compile(
r'((((25[0-5])|(2[0-4]\d)|(1[0-9]\d)|(\d{1,2}))\.){3}((25[0-5])|(2[0-4]\d)|(1[0-9]\d)|(\d{1,2})))')

result1 = pattern.findall('[12.159.46.200]')

# [('12.159.46.200', '46.', '46', '', '', '159', '46', '200', '', '200', '', '')]
print(result1)

# 替换成更符合逻辑的写法会有问题
# 从左往右匹配, 如果满足就会给出结果
pattern = re.compile(
r'((((\d{1,2})|(1[0-9]\d)|(2[0-4]\d)|(25[0-5])|)\.){3}((\d{1,2})|(1[0-9]\d)|(2[0-4]\d)|(25[0-5])|))')

result1 = pattern.findall('[12.159.46.200]')

# [('12.159.46.20', '46.', '46', '46', '159', '', '', '20', '20', '', '', '')]
print(result1)

# </editor-fold>

# <editor-fold desc='反向引用或回溯引用(backreference)'>
# ()代表一个子表达式
# 之后使用\n(1开始)代表引用先前的第n个表达式
# 部分正则实现中\0可以代表整个表达式
# 注意多个()的情况

# ['of', 'and', 'are']
pattern = re.compile(r'[ ](\w+)[ ]\1')

# [(' of ', 'of'), (' and ', 'and'), (' are ', 'are')]
pattern = re.compile(r'([ ](\w+)[ ])\2')

# [(' of of', 'of'), (' and and', 'and'), (' are are', 'are')]
pattern = re.compile(r'([ ](\w+)[ ]\2)')

result1 = pattern.findall('xx of of xxx and and xxx are are.')

print(result1)

pattern = re.compile(r'(<[hH]([1-6])>.*?<\/[hH]\2>)')

result1 = pattern.findall('<body>\n'
'<h1>Test1</h1>\n'
'Test2\n'
'<h2>Test3</h2>\n'
'Test4\n'
'<h3>Test5</h3>\n'
'Test6<br/>\n'
'</body>\n')

# [('<h1>Test1</h1>', '1'), ('<h2>Test3</h2>', '2'), ('<h3>Test5</h3>', '3')]
print(result1)

# </editor-fold>

# <editor-fold desc='替换操作'>
# 替换的串中和backreference一样使用\n替换子表达式

pattern = re.compile(r'([\w\.]+@[\w.]+\.\w+)')

s = 'ben@forta.com\n' + \
'abcdefg\n' + \
'ben.forta@forta.com\n' + \
'abcdefg'

result1 = pattern.findall(s)
replstr = r'<a href="mailto:\1">\1</a>'

# ['ben@forta.com', 'ben.forta@forta.com']
print(result1)

print('---------------')
print(s)
print('----↓↓↓↓↓↓↓----')
print(pattern.sub(replstr, s))
print('---------------')

pattern = re.compile(r'(\d{3})(-)(\d{3})(-)(\d{4})')

s = '333-157-1507\n' + \
'123-403-1570\n' + \
'111-578-8456\n' + \
'234-237-4856'

result1 = pattern.findall(s)
replstr = r'(\1) \3-\5'

# [('333', '-', '157', '-', '1507'),
# ('123', '-', '403', '-', '1570'),
# ('111', '-', '578', '-', '8456'),
# ('234', '-', '237', '-', '4856')]
print(result1)

print('---------------')
print(s)
print('----↓↓↓↓↓↓↓----')
print(pattern.sub(replstr, s))
print('---------------')

# </editor-fold>

# <editor-fold desc='大小写转换'>
# 正则配合backreference
# \E \L,\U的结束符
# \l 将下一个字符转换成小写
# \L 将\L至\E之间的字符都转换成小写
# \u 将下一个字符转换成大写
# \U 将\U至\E之间的字符都转换成小写
# py的话需要像下面这样处理
# 以上关键字会报错

pattern = re.compile(r'([\w\.]+@[\w.]+\.\w+)')

s = 'ben@forta.com\n' + \
'abcdefg\n' + \
'ben.forta@forta.com\n' + \
'abcdefg'

result1 = pattern.findall(s)

# 'Test[{\U\1\E}]
def callback(word): return 'Test[{}]'.format(word.group(1).upper())

# ['ben@forta.com', 'ben.forta@forta.com']
print(result1)

print('---------------')
print(s)
print('----↓↓↓↓↓↓↓----')
print(pattern.sub(callback, s))
print('---------------')

# </editor-fold>

# <editor-fold desc='向前查找'>
# 查看已匹配文本之后的内容
# (?=)

# ['https:', 'https:']
pattern = re.compile(r'.+:')

# ['https', 'https']
pattern = re.compile(r'.+(?=:)')

result1 = pattern.findall('https://www.bilibili.com/\n'
'https://www.baidu.com/\n')

print(result1)

# </editor-fold>

# <editor-fold desc='向后查找'>
# (?<=)

pattern = re.compile(r'(?<=\$)[\d.]+')

result1 = pattern.findall('1.24\n'
'4685.6845\n'
'$ 4685.6845\n'
'$15978685.45\n'
'$12346785852.54$\n'
'4568.96 $64987.69\n')

# ['15978685.45', '12346785852.54', '64987.69']
print(result1)

# </editor-fold>

# <editor-fold desc='结合向前向后'>

pattern = re.compile(r'(?<=\<[tT][iI][tT][lL][eE]\>).*(?=\<\/[tT][iI][tT][lL][eE]\>)')

result1 = pattern.findall('<head>\n'
'<title>Test 123 learning regex.</title>\n'
'</head>')

# ['Test 123 learning regex.']
print(result1)

# </editor-fold>

# <editor-fold desc='否定式环视'>
# = 替换为 !
# ?= --> ?!
# ?<= --> ?<!

pattern = re.compile(r'\b(?<!\$)\d+\b')

result1 = pattern.findall('1 24\n'
'$30\n'
'200\n'
'$ 300123\n'
'$15945\n'
'$123454$\n'
'456896 $6498769\n')

# ['1', '24', '466845', '4686845', '456896']
print(result1)

# </editor-fold>

# <editor-fold desc='子表达式条件'>
# ?(n) n为子条件序号
# 添加条件判断

# 下面这个的解释:
# 直观的看可能比较懵逼
# 第一步先搜索左括号(
# 如果有左括号才匹配后面出现的右括号
# 否则就匹配-

# [('123-456-7890', ''), ('(123)456-7890', '('), ('123-456-7890', '')]
pattern = re.compile(r'((\()?\d{3}(?(2)\)|-)\d{3}-\d{4})')

# [('123-456-7890', '', '-', ''), ('(123)456-7890', '(', ')', ''), ('(123-456-7890', '(', '-', '')]
pattern = re.compile(r'((\()?\d{3}((2)?\)|-)\d{3}-\d{4})')

result1 = pattern.findall('123-456-7890\n'
'(123)456-7890\n'
'(123)-456-7890\n'
'(123-456-7890\n'
'1234567890\n'
'123 456 7890\n')

# [('123-456-7890', ''), ('(123)456-7890', '('), ('123-456-7890', '')]
print(result1)

# 配合?=使用
pattern = re.compile(r'(\d{5}((?=-)?-\d{4}))')

result1 = pattern.findall('11111\n'
'22222\n'
'33333-\n'
'44444-5555\n')

# [('44444-5555', '-5555')]
print(result1)

# </editor-fold>


if __name__ == '__main__':
main()
pass