python爬取视频

    技术2022-07-11  87

    python爬取视频

    利用python在在线播放的网页视频中爬取js文件的功能,即下载在线视频。

    import requests //导入requests模块就可以通过requests找到url网址里面的内容

    from multiprocessing import Pool //加入进程池提高下载速度 找到在线视频的ts文件的url=‘ ’

    ret=r.content将数据保存为二进制形式

    with open(’./movie/{}’.format(url[-10:]),‘wb’) as f: f.write(ret) 将爬取的文件保存到./movie目录,movie目录为当前运行python文件目录下创建的目录

    pool = Pool(20) //进程池设置为20个同时下载

    for i in range(307): pool.apply_async(download, args = (i,))//利用循环下载多个ts视频片段,循环次数为视频片段数

    pool.close() pool.join() //关闭进程池

    cd到下载的ts文件的目录用copy /b *.ts 1.mp4 在cmd中将ts视频片段拼接即可

    完整代码: import requests from multiprocessing import Pool def download(i): url=‘https://youku.cdn7-okzy.com/20200504/19183_3ffc76c2/1000k/hls/23475325ad8000d.ts’ %i

    r=requests.get(url) ret=r.content with open('./movie/{}'.format(url[-10:]),'wb') as f: f.write(ret)

    if name == ‘main’: pool = Pool(20) for i in range(307): pool.apply_async(download, args = (i,))

    pool.close() pool.join()
    Processed: 0.015, SQL: 9