python爬取视频

技术2022-07-11 102

python爬取视频

利用python在在线播放的网页视频中爬取js文件的功能，即下载在线视频。

import requests //导入requests模块就可以通过requests找到url网址里面的内容

from multiprocessing import Pool //加入进程池提高下载速度找到在线视频的ts文件的url=‘ ’

ret=r.content将数据保存为二进制形式

with open(’./movie/{}’.format(url[-10:]),‘wb’) as f: f.write(ret) 将爬取的文件保存到./movie目录，movie目录为当前运行python文件目录下创建的目录

pool = Pool(20) //进程池设置为20个同时下载

for i in range(307): pool.apply_async(download, args = (i,))//利用循环下载多个ts视频片段，循环次数为视频片段数

pool.close() pool.join() //关闭进程池

cd到下载的ts文件的目录用copy /b *.ts 1.mp4 在cmd中将ts视频片段拼接即可

完整代码： import requests from multiprocessing import Pool def download(i): url=‘https://youku.cdn7-okzy.com/20200504/19183_3ffc76c2/1000k/hls/23475325ad8000d.ts’ %i

r=requests.get(url) ret=r.content with open('./movie/{}'.format(url[-10:]),'wb') as f: f.write(ret)

if name == ‘main’: pool = Pool(20) for i in range(307): pool.apply_async(download, args = (i,))

pool.close() pool.join()

Processed: 0.019, SQL: 9