利用python在在线播放的网页视频中爬取js文件的功能,即下载在线视频。
import requests //导入requests模块就可以通过requests找到url网址里面的内容
from multiprocessing import Pool //加入进程池提高下载速度 找到在线视频的ts文件的url=‘ ’
ret=r.content将数据保存为二进制形式
with open(’./movie/{}’.format(url[-10:]),‘wb’) as f: f.write(ret) 将爬取的文件保存到./movie目录,movie目录为当前运行python文件目录下创建的目录
pool = Pool(20) //进程池设置为20个同时下载
for i in range(307): pool.apply_async(download, args = (i,))//利用循环下载多个ts视频片段,循环次数为视频片段数
pool.close() pool.join() //关闭进程池
cd到下载的ts文件的目录用copy /b *.ts 1.mp4 在cmd中将ts视频片段拼接即可
完整代码: import requests from multiprocessing import Pool def download(i): url=‘https://youku.cdn7-okzy.com/20200504/19183_3ffc76c2/1000k/hls/23475325ad8000d.ts’ %i
r=requests.get(url) ret=r.content with open('./movie/{}'.format(url[-10:]),'wb') as f: f.write(ret)if name == ‘main’: pool = Pool(20) for i in range(307): pool.apply_async(download, args = (i,))
pool.close() pool.join()