简单易懂的 webpack 打包后 JS 的运行过程

    技术2024-08-10  65

    简单易懂的 webpack 打包后 JS 的运行过程 最近一直在学习 webpack 的相关知识,当清晰地领悟到 webpack 就是不同 loader 和 plugin 组合起来打包之后,只作为工具使用而言,算是入门了。当然,在过程中碰到数之不尽的坑,也产生了想要深入一点了解 webpack 的原理(主要是掉进坑能靠自己爬出来)。因而就从简单的入手,先看看使用 webpack 打包后的 JS 文件是如何加载吧。

    简单配置 既然需要用到 webpack,还是需要简单配置一下的,这里就简单贴一下代码,首先是 webpack.config.js:

    const path = require('path'); const webpack = require('webpack'); //用于插入html模板 const HtmlWebpackPlugin = require('html-webpack-plugin'); //清除输出目录,免得每次手动删除 const CleanWebpackPlugin = require('clean-webpack-plugin'); module.exports = { entry: { index: path.join(__dirname, 'index.js'), }, output: { path: path.join(__dirname, '/dist'), filename: 'js/[name].[chunkhash:4].js' }, module: {}, plugins: [ new CleanWebpackPlugin(['dist']), new HtmlWebpackPlugin({ filename: 'index.html', template: 'index.html', }), //持久化moduleId,主要是为了之后研究加载代码好看一点。 new webpack.HashedModuleIdsPlugin(), new webpack.optimize.CommonsChunkPlugin({ name: 'manifest', }) ] } 这是我能想到近乎最简单的配置,用到的两个额外下载的插件都是十分常用的,也已经在注释中简单说明了。 之后是两个简单的 js 文件: // test.js const str = 'test is loaded'; module.exports = str; // index.js const test = require('./src/js/test'); console.log(test);

    这个就不解释了,贴一下打包后,项目的目录结构应该是这样的:

    至此,我们的配置就完成了。

    从 index.js 开始看代码 先从打包后的 index.html 文件看看两个 JS 文件的加载顺序:

    <body> <script type="text/javascript" src="js/manifest.2730.js"></script> <script type="text/javascript" src="js/index.5f4f.js"></script> </body>

    可以看到,打包后 js 文件的加载顺序是先 manifest.js,之后才是 index.js,按理说应该先看 manifest.js 的内容的。然而这里先卖个关子,我们先看看 index.js 的内容是什么,这样可以带着问题去了解 manifest.js,也就是主流程的逻辑到底是怎样的,为何能做到模块化。

    // index.js webpackJsonp([0], { "JkW7": (function(module, exports, __webpack_require__) { const test = __webpack_require__("zFrx"); console.log(test); }), "zFrx": (function(module, exports) { const str = 'test is loaded'; module.exports = str; }) }, ["JkW7"]);

    删去各种奇怪的注释后剩下这么点内容,首先应该关注到的是 webpackJsonp 这个函数,可以看见是不在任何命名空间下的,也就是 manifest.js 应该定义了一个挂在 window 下的全局函数,index.js 往这个函数传入三个参数并调用。

    第一个参数是数组,现在暂时还不清楚这个数组有什么作用。

    第二个参数是一个对象,对象内都是方法,这些方法看起来至少接受两个参数(名为 zFrx 的方法只有两个形参)。看一眼这两个方法的内部,其实看见了十分熟悉的东西, module.exports,尽管看不见 require, 但有一个样子类似的 webpack_require,这两个应该是模块化的关键,先记下这两个函数。

    第三个参数也是一个数组,也不清楚是有何作用的,但我们观察到它的值是 JkW7,与参数2中的某个方法的键是一致的,这可能存在某种逻辑关联。

    至此,index.js 的内容算是过了一遍,接下来应当带着问题在 manifest.js 中寻找答案。

    manifest.js 代码阅读 由于没有配置任何压缩 js 的选项,因此 manifest.js 的源码大约在 150 行左右,简化后为 28 行(已经跑过代码,实测没问题)。鉴于精简后的代码真的不多,因而先贴代码,大家带着刚才提出的问题,先看看能找到几个答案:

    (function(modules) { window["webpackJsonp"] = function webpackJsonpCallback(chunkIds, moreModules, executeModules) { var moduleId, result; for (moduleId in moreModules) { if (Object.prototype.hasOwnProperty.call(moreModules, moduleId)) { modules[moduleId] = moreModules[moduleId]; } } if (executeModules) { for (i = 0; i < executeModules.length; i++) { result = __webpack_require__(executeModules[i]); } } return result; }; var installedModules = {}; function __webpack_require__(moduleId) { if (installedModules[moduleId]) { return installedModules[moduleId].exports; } var module = installedModules[moduleId] = { exports: {} }; modules[moduleId].call(module.exports, module, module.exports, __webpack_require__); return module.exports; } })([]);

    首先应该看到的是,manifest.js 内部是一个 IIFE,就是自执行函数咯,这个函数会接受一个空数组作为参数,该数组被命名为 modules。之后看到我们在 index.js 中的猜想,果然在 window 上挂了一个名为 webpackJsonp 的函数。它接受的三个参数,分别名为chunkIds, moreModules, executeModules。对应了 index.js 中调用 webpackJsonp 时传入的三个参数。而 webpackJsonp 内究竟是有怎样的逻辑呢?

    先不管定义的参数,webpackJsonp 先是 for in 遍历了一次 moreModules,将 moreModules 内的所有方法都存在 modules, 也就是自执行函数执行时传入的数组。

    之后是一个条件判断:

    if (executeModules) { for (i = 0; i < executeModules.length; i++) { result = __webpack_require__(executeModules[i]); } }

    判断 executeModules, 也就是第三个参数是否存在,如存在即执行 webpack_require 方法。在 index.js 调用 webpackJsonp 方法时,这个参数当然是存在的,因而要看看 webpack_require 方法是什么了。

    webpack_require 接受一个名为 moduleId 的参数。方法内部首先是一个条件判断,先不管。接下来看到赋值逻辑

    var module = installedModules[moduleId] = { exports: {} };

    结合刚才的条件判断,可以推测出 installedModules 是一个缓存的容器,那么前面的代码意思就是如果缓存中有对应的 moduleId,那么直接返回它的 exports,不然就定义并赋值一个吧。接着先偷看一下 webpack_require 的最后的返回值,可以看到函数返回的是 module.exports,那么 module.exports 又是如何被赋值的呢? 看看之后的代码:

    modules[moduleId].call(module.exports, module, module.exports, __webpack_require__);

    刚才我们知道 modules[moduleId] 就是 moreModules 中的方法,此处就是将 this 指定为 module.exports,再把module, module.exports, webpack_require 传入去作为参数调用。这三个参数是不是很熟悉?之前我们看 index.js 里面代码时,有一个疑问就是模块化是如何实现的。这里我们已经看出了眉目。

    其实 webpack 就是将每一个 js 文件封装成一个函数,每个文件中的 require 方法对应的就是 webpack_require, webpack_require 会根据传入的 moduleId 再去加载对应的代码。而当我们想导出 js 文件的值时,要么用 module.exports,要么用 exports,这就对应了module, module.exports两个参数。少接触这块的童鞋,应该就能理解为何导出值时,直接使用 exports = xxx 会导出失败了。简单举个例子:

    const module = { exports: {} }; function demo1(module) { module.exports = 1; } demo1(module); console.log(module.exports); // 1 function demo2(exports) { exports = 2; } demo2(module.exports); console.log(module.exports); // 1

    粘贴这段代码去浏览器跑一下,可以发现两次打印出来都是1。这和 wenpack 打包逻辑是一模一样的。

    梳理一下打包后代码执行的流程,首先 minifest.js 会定义一个 webpackJsonp 方法,待其他打包后的文件(也可称为 chunk)调用。当调用 chunk 时,会先将该 chunk 中所有的 moreModules, 也就是每一个依赖的文件也可称为 module (如 test.js)存起来。之后通过 executeModules 判断这个文件是不是入口文件,决定是否执行第一次 webpack_require。而 webpack_require 的作用,就是根据这个 module 所 require 的东西,不断递归调用 webpack_require,__webpack_require__函数返回值后供 require 使用。当然,模块是不会重复加载的,因为 installedModules 记录着 module 调用后的 exports 的值,只要命中缓存,就返回对应的值而不会再次调用 module。webpack 打包后的文件,就是通过一个个函数隔离 module 的作用域,以达到不互相污染的目的。

    小结 以上就是 webpack 打包后 js 文件是加载过程的简单描述,其实还是有很多细节没有说完的,比如如何异步加载对应模块, chunkId 有什么作用等,但由于篇幅所限 (还没研究透),不再详述。相关代码会放置 github 中,欢迎随时查阅顺便点star。

    感谢各位看官大人看到这里,知易行难,希望本文对你有所帮助~谢谢

    Processed: 0.014, SQL: 9