python爬取学校新闻_python爬虫获取校园网新闻

#利用模块打开校园网
res = .(url)
#把校园网的源代码存储到html变量当中
html = res.read()
#根据相应的网页代码编写正则表达式匹配
= pile(r'
(.*?) (.*?)')
#获取所有符合正则表达式的字符串
h = .(html)
【python爬取学校新闻_python爬虫获取校园网新闻】#因为主页前5个符合正则表达式的内容刚好是我们需要的内容

python爬取学校新闻_python爬虫获取校园网新闻

文章插图
for i in range(5):
#h[i][0]正则表达式第一个(.*?),h[i][1]为第二个
#输出h[i][0](题目)和h[i][1](日期)
print h[i][0]+" "+h[i][1]
运行结果