build
一、 Webpack 原理与基础配置
核心运行机制:Webpack 的构建原理与编译流程
Webpack 的本质是一个依赖图构建器。
- 初始化阶段 (Init): 读取并合并配置文件(
webpack.config.js、Shell 参数等),实例化Compiler对象,加载所有配置的插件(执行其apply方法)。 - 编译阶段 (Compile & Make): 从
entry入口文件出发,调用配置的loader翻译文件内容(如把.vue或.jsx翻译成纯 JS)。 - 构建模块: 找出该模块依赖的其他模块,递归执行本步骤,直到所有入口依赖的文件都经过了本步骤的处理。生成一棵包含所有模块关系的依赖树。
- 生成阶段 (Seal): 根据入口和模块之间的依赖关系,组装成一个个包含多个模块的
Chunk,再把每个Chunk转换成一个单独的文件加入到输出列表。 - 输出阶段 (Emit): 根据配置确定输出的路径和文件名,把文件内容写入到文件系统。
生态组件差异:Loader vs Plugin
- Loader(转换器): Webpack 默认只认识纯 JavaScript 和 JSON。Loader 的作用是文件格式转换。它工作在模块加载阶段,比如把 Less 转成 CSS,把 ES6+ 转成 ES5(
babel-loader)。 - Plugin(插件): 作用是功能扩展。它基于事件流机制工作,Webpack 在运行的生命周期中会广播出许多事件,Plugin 可以监听这些事件,在合适的时机通过 Webpack 提供的 API 改变输出结果(例如打包优化、资源管理、环境变量注入)。
体积分析手段与 Webpack Bundle Analyzer
如果打包出的 JS 异常庞大,我们不能盲目瞎猜。
- 分析方法: 使用
webpack-bundle-analyzer插件,或者生成stats.json上传到在线分析工具(如 Webpack Chart)。 - Webpack Bundle Analyzer 是什么: 它是一个插件,读取输出的
stats.json文件,并启动一个本地服务,用交互式矩形树图(Treemap)可视化展示每个输出 Bundle 中包含的模块及其体积。你能直观看到是哪个第三方库占了最大的面积(比如无意间全量引入了 moment.js 或 ECharts)。
核心配置项:externals 与 Vue CLI 审查
- externals** 作用:** 告诉 Webpack 在打包时,不要把指定的依赖(如 React、Vue、Lodash)打包进最终的 Bundle 中,而是在运行时从外部环境(通常是 CDN 的
<script>标签)获取。这能极大缩减打包体积,并利用浏览器的并发请求和缓存机制。 - 查看 Vue CLI 的内部配置: Vue CLI 隐藏了 Webpack 配置。在项目根目录下运行
vue inspect > output.js,可以将最终合并计算后的完整 Webpack 配置导出到一个文件中,方便查阅它到底用了哪些 Loader 和 Plugin。
优化原理:Tree Shaking
Tree Shaking 的本质是死代码消除(Dead Code Elimination)。
它强依赖于 ES6 模块语法的静态结构特性(import 和 export 的关系在编译时就能确定,不能在运行时动态引入)。
Webpack 在构建依赖图时,会顺藤摸瓜,给没有被其他模块使用的导出打上标记(例如 /* unused harmony export xxx */)。随后在代码压缩阶段,Terser 等压缩工具会把这些带有未被使用标记的死代码从最终代码中安全地移除。
二、 构建工具横向对比与迁移实战 (Webpack vs Vite)
工具横向对比:Webpack vs Vite
- Webpack(Bundle-based): 冷启动时,必须抓取并编译整个应用的依赖图,打包成一个或多个 Bundle 后,才启动开发服务器。项目越大,冷启动和 HMR(热更新)越慢。
- Vite(ESM-based): 利用现代浏览器原生支持 ES 模块(
<script type="module">)的特性。Vite 启动时只启动一个服务器,不打包源码。当浏览器请求特定的模块时,Vite 才按需编译并返回该模块。因此,无论项目多大,冷启动几乎是瞬间的。
Vite 底层机制:无 Loader 概念与模块识别
Vite 在开发环境是不使用 Rollup 的,它直接利用浏览器的原生 ESM 和基于 Koa/Connect 的本地 Node 服务器。
- 如何识别文件: 当浏览器请求一个
import './App.vue'时,Vite 的服务器中间件拦截该请求。它通过文件扩展名识别类型,然后调用内部转换逻辑(或 Vite 插件)将.vue文件实时编译成浏览器能看懂的 JS(包含 render 函数等),再设置Content-Type: application/javascript返回给浏览器。它用一套统一的插件 API 替代了 Webpack 繁琐的 Loader 机制。
升级背景与痛点:Webpack 4 到 Webpack 5 (Vue CLI 5)
- 痛点: 随着业务迭代,Webpack 4 的冷启动时间和二次构建时间可能达到数分钟,严重拖慢开发效率;内存占用过高导致 OOM(内存溢出)。
- 考量: Webpack 5 带来了突破性的
Persistent Cache(物理文件缓存),能让二次构建速度成倍提升;更好的 Tree Shaking 算法;以及模块联邦(Module Federation)为微前端提供底层支持。
三、 Monorepo 架构思考
业务拆分逻辑:PC 与移动端为何分离?
虽然响应式设计(Media Queries)可以一套代码适配多端,但这仅限于布局结构相似、交互逻辑一致的简单展示型页面。
对于复杂的业务系统,PC 端偏向复杂表单、海量数据表格、密集操作;移动端偏向单手操作、精简流程、不同的手势交互。强行用一套代码兼容,会导致组件内部充满 if (isMobile) 的判断,代码臃肿,且强行把移动端不需要的重量级 PC 依赖下发给了移动端,严重影响 Web 性能体验。
选型对比:为何选择 PNPM Workspace?
- Lerna 的局限: Lerna 过去是王者,但它本身主要解决发布和版本管理,依赖安装通常还要配合 Yarn 或 NPM,导致架构较重。
- PNPM Workspace 的优势: 速度极快、原生支持工作区(Workspace)间的包相互引用。最重要的是它的严格依赖树(避免幽灵依赖),在 Monorepo 这种依赖极其错综复杂的场景下,能保证各个子项目的依赖隔离和安全。
协作与落地:Monorepo 的挑战
Monorepo 是把相关的多个项目(哪怕是独立部署的前台、后台、组件库)放在一个 Git 仓库里。
- 困难点: 1. Git 权限管控颗粒度变粗(所有人都能看到所有代码)。
- CI/CD 流水线设计复杂:不能一提交代码就全部项目重新构建,需要配置工具(如 Turborepo 或 Nx)来精准计算影响范围,只构建变更相关的包。
- 依赖版本的统一管理挑战。
四、 包管理工具演进
工具横向对比:NPM vs Yarn vs PNPM
- NPM (早期): 嵌套依赖树,导致路径过长(Windows 下经常报错),相同包重复安装浪费空间。
- Yarn / NPM (较新版本): 引入扁平化(Hoisting)和 Lock 文件。解决了路径和版本一致性问题,但带来了幽灵依赖(Phantom Dependency)——你在项目里没有在
package.json中声明某个包,但因为扁平化被提升到了顶层,你的代码居然能直接require它。一旦底层依赖树变动,你的代码直接崩溃。 - PNPM: 采用全局存储(Store)和硬链接(Hard links)加软链接(Symlinks)的混合架构。既实现了极高的安装速度和磁盘节省,又维持了非扁平化的严格
node_modules结构,彻底根除幽灵依赖。
落地与收益:PNPM 替换实践
- 过程: 删除原有的
yarn.lock/package-lock.json和node_modules;使用pnpm import或直接pnpm install生成pnpm-lock.yaml;修复因为“幽灵依赖”导致的报错(在package.json中把缺失的依赖补全)。 - 收益: CI/CD 环境安装依赖的时间大幅缩短;本地开发机的磁盘空间占用成倍下降;依赖关系变得绝对确定。
五、 深度构建优化与体积治理
缓存优化
- Webpack 5: 配置
cache: { type: 'filesystem' },将模块的编译结果缓存到硬盘。 - Babel/Terser: 开启
babel-loader的cacheDirectory;开启 Terser 的多线程压缩和缓存(parallel: true)。
体积治理与数据
- 治理思路: 1. 合包拆包: 配置
SplitChunksPlugin,将变动极少的底层框架(React/Vue/Vue-Router)单独抽离成vendor.js(便于浏览器长期缓存);将巨大的第三方库(如 ECharts)单独打成一个 Chunk;业务代码按路由进行懒加载(Dynamic Import)。 -
- 依赖分析: 依赖
webpack-bundle-analyzer。
- 依赖分析: 依赖
- 指标: 从 200M 优化到几十兆,通常是指构建产物文件夹(dist)的总大小(里面包含了巨量的 SourceMap 文件)。实际上线时,SourceMap 是不会传给普通用户的。
依赖细节:lodash vs lodash-es
lodash是基于 CommonJS 规范打包的。哪怕你只写了import { cloneDeep } from 'lodash',由于 CJS 的动态性,Tree Shaking 很难生效,往往会把整个 lodash 全量打包。lodash-es是基于 ES Module 规范发布的版本。完美契合 Tree Shaking,只打包cloneDeep相关的代码,极大缩减体积。
网络与产物关系:80M 到 10M 的秘密
-
为什么产物大但网络小: 80MB 的 dist 往往包含了
.map文件(SourceMap 通常比源码大数倍,用于排查报错),且包含了图片等静态资源。浏览器请求时:- 不会请求
.map文件。 - 服务器(如 Nginx)通常开启了 Gzip 或 Brotli 压缩。文本文件(JS/CSS)的 Gzip 压缩率通常高达 70%~80%。
- 不会请求
-
继续优化的空间: 即使压缩后是 10MB,对于前端依然是灾难级的巨大(首屏加载会非常慢)。可以通过路由懒加载、图片走 CDN/WebP 格式压缩、提取公共基础库走 CDN 加载等方式,将首屏加载的 JS 控制在几百 KB 级别。
六、 模块格式标准
UMD 格式 (Universal Module Definition)
UMD 是一种兼容性极强的“大杂烩”规范。
- 原理: 它在内部做了判断:如果检测到环境支持 AMD(如 RequireJS),就用 AMD 规范导出;如果检测到支持 CommonJS(如 Node.js),就用 CJS 导出;如果啥都没有(比如直接在浏览器里
<script>引入),就把模块挂载到全局对象(window)上。 - 场景: 主要是开发开源库时使用。为了让用户无论用 Webpack 打包、Node.js 服务端渲染,还是最古老的
<script>标签直接引入,都能正常工作。
CDN 资源格式
当你从 CDN 引入一个资源(如 https://cdn.xxx.com/vue.js)时,它通常是:
- UMD 格式 或 IIFE(立即执行函数)格式:为了执行后直接在
window对象上暴露全局变量(如window.Vue)。 - ESM 格式:现在越来越多的现代 CDN 提供纯 ESM 产物(通常以
.mjs或通过特定 URL 路径区分),配合<script type="module" src="...">,允许在浏览器中直接进行基于标准的模块化加载。
这套知识体系的深度和广度关联非常紧密。比如理解了模块规范(ESM vs CJS),自然就能想通 Tree Shaking 的原理,也能解答 Webpack 和 Vite 核心差异的根源。