使用第三方模块 1.新建一个文件夹,文件夹的名字非中文,名字也不要和模块名字一样. 2.进到文件夹里面去,命令运行:npm init -y这个命令可以理解成是初始化 3.下载模块, 去npm官网搜索模块,用他的说明来下 4.使用模块,去模块的官网,或者模块说明中来使用.
下载环节
创建一个文件夹(在这里我们以npmUse文件夹为例)打开cmd,找到指定文件夹下,输入命令npm init -y在npm官网上找到指定的模块,下载使用环节
部分效果展示代码展示 var Crawler = require("crawler"); const fs = require('fs') var c = new Crawler({ maxConnections : 10, // This will be called for each crawled page callback : function (error, res, done) { if(error){ console.log(error); }else{ var $ = res.$; // $ is Cheerio by default //a lean implementation of core jQuery designed specifically for the server // console.log($("title").text()); //把丁香园的新冠肺炎实时数据网站的body内容爬到,爬到后存到一个文件里面 fs.writeFile('./temp/1.txt',$("body").text(),(err)=>{ if(err == null){ console. log('爬取并保持成功!'); } }) } done(); } }); //新冠肺炎实时数据丁香园网站的, c. queue( 'https://ncov.dxy.cn/ncovh5/view/pneumonia' )
下载环节
创建一个文件夹(在这里我们以npmUse文件夹为例)打开cmd,找到指定文件夹下,输入命令npm init -y在npm官网上找到指定的模块,下载使用环节
效果展示代码展示 var Crawler = require("crawler"); var fs = require('fs'); var c = new Crawler({ encoding:null, jQuery:false,// set false to suppress warning message. callback:function(err, res, done){ if(err){ console.error(err.stack); }else{ fs.createWriteStream(res.options.filename).write(res.body); } done(); } }); // 爬取网站中的一个图片 c.queue({ uri:"http://pic1.sc.chinaz.com/files/pic/pic9/202005/apic25534.jpg", filename:"./picture.png" }); //爬取b站视频 c.queue({ uri:"//视频地址", filename:"./video.MP4", //让服务端伪装成客户端 headers :{'User -Agent': ' requests'} });注意: 当我们在爬取视频的时候,有时候会碰到反爬,所以要做一些小小的伪装headers :{'User -Agent': ' requests'}