5.3 豆瓣电影 Top 250
结果保存到excel中的
import requests;from bs4 import BeautifulSoupimport xlwt# https://movie.douban.com/top250?start=25&filter=headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36 Edg/106.0.1370.42'}#获取翻页页面连接def top250Urls():purls=[]urls=[]for i in range(0,25,25):url = 'https://movie.douban.com/top250?start='+str(i)+'&filter='purls.append(url)for purl in purls:html=requests.get(url=purl,headers=headers).content.decode('utf-8')soup=BeautifulSoup(html,'html.parser')movie_div = soup.find_all('div', class_='item')for movie in movie_div:movieUrl = movie.find_all("div", class_="pic")[0]movieUrl=movieUrl.find('a')movieUrl=movieUrl.attrs.get('href')urls.append(movieUrl)return urls,def Top250():moviesTop=[]urls=top250Urls()[0]for url in urls:html=requests.get(url=url,headers=headers).content.decode('utf-8')soup=BeautifulSoup(html,"html.parser")title=soup.find_all('span',property="v:itemreviewed")[0].text;move_info=soup.find_all('div',id="info")[0]performer=move_info.find_all('a',rel="v:starring")actors=[]for per in performer:actors.append(per.text)typeSpan=move_info.find_all('span',property="v:genre")types=[]for type in typeSpan:types.append(type.text)content = soup.find_all('span', property="v:summary")[0].text.strip('\n')movies={'title': title,'performer': actors,'type': types,'content': content}moviesTop.append(movies)WriteExcle(moviesTop)# return moviesTop;def WriteExcle(movies):try:#1、创建Workbook对象,就是创建Excel文件work_boot=xlwt.Workbook(encoding='utf-8');#2、创建sheet表单sheet=work_boot.add_sheet('formName') #formName为表单名称#3、写入Excel表头header=['电影名','演员','类型','电影简介'];for i in range(len(header)):sheet.write(0,i,header[i]);#write(行,列,内容)#写入Excel内容for i inrange(len(movies)):sheet.write(i+1,0,movies[i]['title'])sheet.write(i+1, 1, movies[i]['performer'])sheet.write(i+1, 2, movies[i]['type'])sheet.write(i+1, 3, movies[i]['content'])#保存文件work_boot.save("小电影.xls")print('写入成功!')except:print('写入失败!')Top250()
- 26个数据分析案例——第五站:基于Scrapy的架构的数据采集
- 上半年发送旅客17.7亿人次,铁路“火车头”作用凸显 日均开行列车创历史之最
- 「发现最美铁路」“毛泽东号”机车,火车头中的“火车头” 铁路机车中国之最
- 宽凳科技公布最新进展:已完成百余座城市数据采集,即将发布首张全自动高精度地图
- 索尼dv机怎么使用,索尼DV机如何连接电脑实时采集图像和声音
- 贝壳采集器:二手车之家 数据采集
- 物通博联·5G数据采集网关模块无缝对接第三方平台
- 工业物联网系统下如何实现设备数据采集与设备维护
- ZigBee采集MPU6050数据
- 车间设备数据采集与MES系统应用