kangyana / daily-question

When your heart is set on something, you get closer to your goal with each passing day.
https://www.webpack.top
MIT License
3 stars 0 forks source link

【Q100】有了解过现在流行的 bundleless 构建工具吗? #100

Open kangyana opened 1 year ago

kangyana commented 1 year ago

1. bundle-less

随着项目的规模发展,webpack 的构建速度越来越慢。

因此,Bundleless 构建工具应运而生,诸如 SnowpackVite

和 Webpack 这种传统的打包工具相比,Vite 主要有两大主要优势:

kangyana commented 1 year ago

2. bundle-less 做了什么?

3. 拆多少包更合适?

打的包太多或者太少都可能出现加载性能的问题。 比如过多的嵌套 import 导致网络瀑布流的产生、bundle 太少不能充分利用 HTTP2 下并发请求的优势。

针对这个问题,我们曾做过一系列的性能测试,最后得出的结论如下:

4. no-bundle 服务

代表方案 Vite

在开发环境中,Vite 主要做了两件事情:

而生产环境下直接使用 Rollup 进行打包。 Vite 整体的优势是在于开发阶段,服务启动快、热更新快,明显地优化了开发者体验。

劣势及解决方案

no-bundle 方案虽然省去了 bundle 的开销,但仍然需要进行单文件的编译(如 TS、JSX、Less、Sass),编译的时长仍然可能会比较长(某些业务项目编译要 20 s 左右)。 Vite 在二次请求时会采用 Etag 标识返回协商缓存的内容,可以跳过编译消耗的时间,但服务重启后仍然需要进行全量的编译,体验不太好。 对此,一个比较好的解决方法是在服务退出时将 ModuleGraph 的内容缓存到本地,然后重启的时候激活缓存(hydrate),那么二次启动时仍然会使用协商缓存,达到比较快的首屏加载效果。

海量请求的加载性能问题

请求数量达到一定量级(1000 +)的时候,no-bundle 服务都会遇到加载性能问题,对 Vite 而言,尽管二次请求会使用协商缓存,但实际上请求仍然会发送,在开发环境中(一般的业务项目会使用代理进行本地开发)表现仍然不容乐观,以之前接入 Vite 的某个业务项目为例:

项目第一次构建 页面加载时间 热更新
webpack 80 s 构建 3~4 s 5 s
vite 10 s 构建 10 s 1 s
时间缩短 50% -50% 80% 以上

经过一系列的尝试,最后发现 Service Worker 缓存可以很好地解决这一类问题,思路如下:

Alt

简单来说就是把 Vite 的编译结果缓存到 Service Worker,并对于 HMR 的模块及其依赖模块禁用缓存,保证模块的编译结果永远是最新的。 优化之后页面加载时间由 10s 降低到了 5 s 以内,可以追的上 webpack 的速度。

(Vite 独有)开发/生产表现不一致

有不少人会吐槽 Vite 开发/生产环境的不一致性,因为开发环境使用 Esbuild + Dev Server 架构,而生产环境直接用 Rollup。 但由于生产环境的构建场景和开发阶段存在天然差异,开发和生产表现一致是不现实的。 所以问题的核心在于保证生产环境构建的稳定性。

而影响生产构建稳定性最主要的部分在于依赖的处理上,进一步说是对于 CommonJS 格式的依赖处理上面, 开发环境使用 esbuild 而生产环境下使用 @rollup/plugin-commonjs,就容易导致生产构建出现一些奇怪的问题, 如 @rollup/plugin-commonjs ignoreTryCatch行为 try-catch 代码块中的 require 语法转换, 这样对于某些依赖(如 jspdf-autotable)就会出现问题,而开发阶段使用 Esbuild 就不会出现。

解决这类问题有两种方案:

kangyana commented 1 year ago

5. 依赖产物的模块化分发

对于第三方依赖,我们可以将其进行预构建,然后将产物进行分发,这样所有的依赖可以被 external 掉了,可以很大程度上降低项目 bundle 的开销。

总体而言,这类方案有几大关键要素:

接下来我们可以对照现有的案例来分析。

现有方案概览

首先是 Vite 的依赖预构建方案,使用 esbuild 对第三方依赖进行打包, 基于浏览器原生 ESM 特性来加载第三方包的产物,同时将产物存储在本地,可以通过 Dev Server 访问产物资源。

其次包括开源社区的一些 ESM CDN 方案,如 Skypack、esm.sh。 前者服务并未开源,后者使用 esbuild 进行模块打包或者单文件转译。 这类方案也是依赖于浏览器原生 ESM 特性实现产物加载,通过第三方的 CDN 来进行产物分发,如通过 https://esm.sh/react@18.0.2 即可访问到对应的 react 包产物。

问题分析

当然,现有的依赖 Bundleless 方案并不能很好地运用到业务项目中,尤其是生产环境,因为以下的几个关键问题没有得到根本的解决:

产物语法和 Polyfill 安全问题

无论是 Vite 预构建还是社区开源的 Skypack 和 esm.sh 等 ESM CDN 方案,都不支持 ES3/ES5 语法降级,也没有基于 browserlist 的 polyfill 方案, 这样一来就很无法兼容旧版本浏览器,如大部分需要支持 Android 4.4 / iOS 9 机型的业务就无法使用这些方案。

产物的性能问题

Vite 会把项目中所有的依赖(包括 lodash/add 这种 subpath)各自打包为一个 bundle 文件,在大型项目中依赖产物的数量仍然很大(100 +)。 根据之前 Bundleless 性能测试的结果,巨大的文件请求数量显然会带来页面加载的性能问题。

而对于开源的 ESM CDN 方案,一般有两种构建模式,分别的 bundle 模式和非 bundle 模式。 在非 bundle 模式下会存在严重的网络瀑布流问题,而 bundle 模式下会把所有的间接依赖都打包进去,容易造成某些公共依赖重复打包的问题,使产物性能变差。 同时,这些 ESM CDN 方案都不支持产物的 Tree Shaking,对于任何包都只能全量引入依赖产物,无法做到按需加载。

模块化方案的兼容性问题

如果在生产环境也使用 ESM 格式的产物,那么很可能会产生兼容性问题,目前浏览器对于原生 ESM 的兼容性如下图:

Alt

对于需要兼容 IE11 或者低版本移动端机型的项目,现有的 ESM CDN 方案就无法使用了。

产物本地化调试问题

Vite 的预构建产物可以在本地使用,通过 Dev Server 分发,但也有一定的弊端:

而现有的 ESM CDN 产物本地化方面也显得捉襟见肘:

kangyana commented 1 year ago
  1. 依赖产物的模块化分发 的解决方案

    面对如上的核心问题,我们可以逐个展开思考,各个击破,解决思路分别如下:

根据如上的业界方案问题分析与解决思路,我们自研了一套依赖 Bundleless 的方案,整体架构如下:

Alt

基于 Import Map

在现有的社区方案中,一般用路径重写的方式来管理 CDN 依赖的路径,比如:

import React from 'react'
// 改写为
import React from '/-/v70/react@v17.0.1'

这么做导致一些问题:

我们希望用一个集中的空间来管理依赖关系,并避免多实例的问题,而 Import Map 就可以解决这些问题。接入原理如下:

<script type="importmap">
{
"imports": {
    // 保证单实例
    "react": "https://tosv.byted.org/obj/eden-internal/ulkl_lm_zlp/ljhwZthlaukjlkulzlp/npm_cdn/dev/react/17.0.2/0636c3a4.js",
    "react-dom": "https://tosv.byted.org/obj/eden-internal/ulkl_lm_zlp/ljhwZthlaukjlkulzlp/npm_cdn/dev/lodash/4.17.21/8ba9d138.js"
  }
}
</script>
<script type="module">
import React from 'react';
import ReactDOM from 'react-dom'
</script>

模块合并

首先基于 esbuild 将项目进行预打包(性能考虑),需要开启 metafile 配置,在 onEnd 钩子或者 build API 的返回值中可以获取构建元信息,即 meta 对象,由 inputs 字段可以解析出模块依赖图。

// meta 对象
{  
  "inputs": {
    // 当前模块路径
    "../node_modules/.pnpm/object-assign@4.1.1/node_modules/object-assign/index.js": {
      // 模块大小
      "bytes": 2108,
      // 依赖模块数组
      "imports": []
    },
    "../node_modules/.pnpm/react@17.0.2/node_modules/react/cjs/react.development.js": {
      "bytes": 72141,
      "imports": [
        {
          "path": "../node_modules/.pnpm/object-assign@4.1.1/node_modules/object-assign/index.js",
          "kind": "require-call"
        }
      ]
    },
  }
}

根据当前的模块依赖图信息,我们可以将项目中用到的依赖进行分组,通过特定的依赖分组算法产出一些依赖组的信息。

多包(combo)模式打包

Combo 模式打包即把多个依赖包打包到一起,主要会产生如下的问题:

解决方案:

不同包的导出名冲突问题

首先需要解决命名导出的问题,整体由两部分构成。 在构建时阶段注入一些带有包名前缀的 specifier,运行时根据包名取出这些 specifier,从根本上解决导出名冲突问题。

  1. 构建时注水 在构建之前需要探测 NPM 包所有的导出,包含以下的情况:

在拿到所有导出名的基础之上,构建虚拟模块,交由 bundler 进行打包,格式如下:

export { 包名_导出字段名 } from '包名';

也就是在 NPM 包每个导出名前面加上 包名_,完成注水过程,以防止重名。

  1. 运行时脱水 (Hydrate) 如上 包名_导出字段名 的这种导出在业务中是直接使用的,我们需要在模块系统中进行运行时拦截(脱水过程),把真正的导出字段名取出。

如以下的导入:

// 在以 esm 的方式对依赖进行 external 后,webpack 产物中的引入代码
import * as __WEBPACK_EXTERNAL_MODULE_react_router_ from 'react-reouter'

我们将会改写成以下的代码:

// 1. 换成临时变量
import * as __WEBPACK_EXTERNAL_MODULE_react_router_$0 from "react-router";
// 2. 对原来的变量重新赋值,通过 __EDEN_COMBO_HYDRATE__ 工具函数将导出名去掉包名前缀
// 如 react_router_Router => Router
var __WEBPACK_EXTERNAL_MODULE_react_router_ = __EDEN_COMBO_HYDRATE__(
  __WEBPACK_EXTERNAL_MODULE_react_router_$0,
  "react_router"
);

大量 subpath 问题

做实际落地项目的过程中发现第三方包中使用大量的 subpath,如下图的依赖分组结果所示:

Alt

这种情况下 import map 的体积会很大,因为每个 subpath 都会对应一个远程地址。 解决方案是进行 subpath 合并打包,如 @babel/runtime/helper/esm/assertThisInitialized@babel/runtime/helpers/esm/inheritsLoose,原始产物中的引入代码如下:

import * as __WEBPACK_EXTERNAL_MODULE_babel_runtime_helers_esm_inheritsLoose from '@babel/runtime/helpers/esm/inheritsLoose';
import * as __WEBPACK_EXTERNAL_MODULE_babel_runtime_helers_esm_assertThisInitialized from '@babel/runtime/helpers/esm/assertThisInitialized';

这样对于 @babel/runtime 只留下一个 importmap 的 key-value 对,有效减少 import map 的体积。

产物 Tree Shaking

在 esbuild 预打包阶段扫描源文件所用到的 specifier,然后构建对应的虚拟模块交给打包器进行打包:

export { cloneDeep } from 'lodash-es'
export { Spin } from '@douyinfe/semi-ui'

这样可以做到一定程度的 Tree Shaking。

Polyfill 安全

根据不同的 runtimeTarget 要求(Eden 默认自带以下前三种 runtimeTarget,包括 Modern、PCLegacy、MobileLegacy)和产物模块格式,注入不同的 Polyfill 内容:

Polyfill 内容在所有第三方包编译完成后进行累计去重,然后统一打包成一个 Chunk,通过 script 标签注入到页面中:

Alt

产物本地化

依赖产物本地化有两个好处:

具体的做法如下: 在使用编译服务将依赖包打包完成并上传 CDN 后,构建插件会重新请求 CDN 的资源,并将资源写入到本地磁盘中。

Alt

然后,构建插件通过在本地 Dev Server 加入中间件来对本地临时目录启用静态资源服务。 与此同时,插入到 HTML 中的 import map 的远程 CDN 产物被改写为本地静态资源服务的地址。 因此,最后项目中访问到的第三方包资源即为临时目录中的产物代码。