本文介绍了三个正则表达式和函数的使用的实例,有兴趣的朋友们可以仔细看看! 第一题 用你学号的3位尾数作为访问http:// 125.220. 66. 143/学号三位. html例如你是10000031, 则访问http://125. 220. 66. 143/31. html 0被 动略过.你会发现一个数字,和一个链接。点击这个链接,又会发现一个链接。如此这样n次后,你会发现一个网页没有链接,并且出现Thus_ is the end的字样。求这些不同页面出现数的和 注意:本题采用本地打开html文件的方式 from bs4 import BeautifulSoup import re with open('E:/findsum/142.html', 'r')as wb_data: #用jupytor Notebook打开本地网页文件 Soup = BeautifulSoup(wb_data, 'html') #解析为网页格式 t=Soup.decode('GBK') #解析对应的字符 #print(t) pat='d+' number=re.findall(pat,t)[0] #读取下一个地址的网页数字 s=0 while 1: #循环直到不存在跳转页面为止 s+=eval(number) #(正则表达式找到的都是字符串,所以要强制转化为数字) str1='E:/findsum/'+number+'.html' #重新定义页面,循环操作 with open(str1, 'r')as wb_data: Soup = BeautifulSoup(wb_data, 'html') t=Soup.decode('GBK') pat='d+' number=re.findall(pat,t)[0] if number=='0000': #最后0000页面表示结束,结束后跳出,防止报错 break print('求和的结果为') print(s) 第二题 从文件读取数据,文件内容为38, 399, 229,2, 23, 22, 3434, 344,可以自己设计这个文件,用逗号为分隔符。 编写个函数,返回值为一个元组,包括了文件中所有数据和所有数据的积,所有数据的平均值和方差这四个数据 #定义一个函数求所有元素之积 def fun(list2): s=1 for i in list2: s*=i return s x=open('G:/临时文件/text1.txt','r').read()#读取文件 list0=[] list1=x.split(',') #去除逗号 list2=list(map(int,list1)) #解包列表(将列表中的字符串元素全部变成int型元素) print('列表为:',list2) import numpy as np print('所有数据和为',np.sum(list2)) print('所有数据的积为',fun(list2)) print('所有数据的平均值为',np.mean(list2)) print('方差为',np.var(list2)) list0.append(np.sum(list2)) list0.append(fun(list2)) list0.append(np.mean(list2)) list0.append(np.var(list2)) print('所求的元组为',tuple(list0))#最后转换元组 第三题 统计有多少个不同的座机电话号码多少不同的手机号码, 多少个不同的电子邮件?然后写入一个文件数字为座机号码数里 手机号码数里电子邮件数量+学号的立方做为结果 import numpy as np import re s=open('G:/临时文件/complex.txt','r').read() #读文件:open('路径','r').read() #写文件:open('路径','w').write() pat='d{4}-d{7}' pat1='d{3}-d{8}' x=set(re.findall(pat,s)).union(set(re.findall(pat1,s))) #union集合合并 pat2='d{11}' #十一位数的字符串 {}内表示符号的个数 y=set(re.findall(pat2,s)) #set去重 pat3='w+@+w+.+w' #w表示数字、字母、下划线等常规字符 #pat4='[a-zA-Z0-9]+@[a-zA-Z0-9]+.[a-zA-Z0-9]+' z=set(re.findall(pat3,s)) a=len(x) b=len(y) c=len(z) p=1750300142 d=a*b*c+p**3 print('座机电话号码数目为',a) print('手机号数目为',b) print('邮箱数目为',c) print('结果为',d) 著作权归作者所有
|
|