如何加快 Node.js 应用的启动速度

时间：2019-09-20 16:21:25 来源：作者：

我们平时在开发部署 Node.js 应用的过程中，对于应用进程启动的耗时很少有人会关注，大多数的应用 5 分钟左右就可以启动完成，这个过程中会涉及到和集团很多系统的交互，这个耗时看起来也没有什么问题。

目前，集团 Serverless 大潮已至，Node.js serverless-runtime 作为前端新研发模式的基石，也发展的如火如荼。Serverless 的优势在于弹性、高效、经济，如果我们的 Node.js FaaS 还像应用一样，一次部署耗时在分钟级，无法快速、有效地响应请求，甚至在脉冲请求时引发资源雪崩，那么一切的优势都将变成灾难。

所有提供 Node.js FaaS 能力的平台，都在绞尽脑汁的把冷/热启动的时间缩短，这里面除了在流程、资源分配等底层基建的优化外，作为其中提供服务的关键一环 —— Node.js 函数，本身也应该参与到这场时间攻坚战中。

Faas平台从接到请求到启动业务容器并能够响应请求的这个时间必须足够短，当前的总目标是 500ms，那么分解到函数运行时的目标是 100ms。这 100ms 包括了 Node.js 运行时、函数运行时、函数框架启动到能够响应请求的时间。巧的是，人类反应速度的极限目前科学界公认为 100ms。

Node.js 有多快

在我们印象中 Node.js 是比较快的，敲一段代码，马上就可以执行出结果。那么到底有多快呢？

以最简单的 console.log 为例（例一），代码如下：

// console.js
console.log(process.uptime() * 1000);

在 Node.js 最新 LTS 版本 v10.16.0 上，在我们个人工作电脑上：

node console.js
// 平均时间为 86ms
time node console.js
// node console.js 0.08s user 0.03s system 92% cpu 0.114 total

看起来，在 100ms 的目标下，留给后面代码加载的时间不多了。。。

在来看看目前函数平台提供的容器里的执行情况：

node console.js
// 平均时间在 170ms
time node console.js
// real 0m0.177s
// user 0m0.051s
// sys 0m0.009s

Emmm… 情况看起来更糟了。

我们在引入一个模块看看，以 serverless-runtime 为例（例二）：

// require.js
console.time('load');
require('serverless-runtime');
console.timeEnd('load');

本地环境：

node reuqire.js
// 平均耗时 329ms

服务器环境：

node require.js
// 平均耗时 1433ms

我枯了。。。

这样看来，从 Node.js 本身加载完，然后加载一个函数运行时，就要耗时 1700ms。

看来 Node.js 本身并没有那么快，我们 100ms 的目标看起来很困难啊！

为什么这么慢

为什么会运行的这么慢？而且两个环境差异这么大？我们需要对整个运行过程进行分析，找到耗时比较高的点，这里我们使用 Node.js 本身自带的 profile 工具。

node --prof require.js
node --prof-process isolate-xxx-v8.log > result
[Summary]:
ticks total nonlib name
 60 13.7% 13.8% JAVAScript
 371 84.7% 85.5% C++
 10 2.3% 2.3% GC
 4 0.9% Shared libraries
 3 0.7% Unaccounted
[C++]:
ticks total nonlib name
 198 45.2% 45.6% node::contextify::ContextifyScript::New(v8::FunctionCallbackInfo<v8::Value> const&)
 13 3.0% 3.0% node::fs::InternalModuleStat(v8::FunctionCallbackInfo<v8::Value> const&)
 8 1.8% 1.8% void node::Buffer::(anonymous namespace)::StringSlice<(node::encoding)1>(v8::FunctionCallbackInfo<v8::V
alue> const&)
 5 1.1% 1.2% node::GetBinding(v8::FunctionCallbackInfo<v8::Value> const&)
 4 0.9% 0.9% __memmove_ssse3_back
 4 0.9% 0.9% __GI_mprotect
 3 0.7% 0.7% v8::internal::StringTable::LookupStringIfExists_NoAllocate(v8::internal::String*)
 3 0.7% 0.7% v8::internal::Scavenger::ScavengeObject(v8::internal::HeapObjectReference**, v8::internal::HeapObject*)
 3 0.7% 0.7% node::fs::Open(v8::FunctionCallbackInfo<v8::Value> const&)

对运行时启动做同样的操作

[Summary]:
ticks total nonlib name
 236 11.7% 12.0% JavaScript
 1701 84.5% 86.6% C++
 35 1.7% 1.8% GC
 47 2.3% Shared libraries
 28 1.4% Unaccounted
[C++]:
ticks total nonlib name
 453 22.5% 23.1% t node::fs::Open(v8::FunctionCallbackInfo<v8::Value> const&)
 319 15.9% 16.2% T node::contextify::ContextifyContext::CompileFunction(v8::FunctionCallbackInfo<v8::Value> const&)
 93 4.6% 4.7% t node::fs::InternalModuleReadJSON(v8::FunctionCallbackInfo<v8::Value> const&)
 84 4.2% 4.3% t node::fs::Read(v8::FunctionCallbackInfo<v8::Value> const&)
 74 3.7% 3.8% T node::contextify::ContextifyScript::New(v8::FunctionCallbackInfo<v8::Value> const&)
 45 2.2% 2.3% t node::fs::InternalModuleStat(v8::FunctionCallbackInfo<v8::Value> const&)
 ...

可以看到，整个过程主要耗时是在 C++ 层面，相应的操作主要为 Open、ContextifyContext、CompileFunction。这些调用通常是出现在 require 操作中，主要覆盖的内容是模块查找，加载文件，编译内容到 context 等。

看来，require 是我们可以优化的第一个点。

如何更快

从上面得知，主要影响我们启动速度的是两个点，文件 I/O 和代码编译。我们分别来看如何优化。

▐ 文件 I/O

整个加载过程中，能够产生文件 I/O 的有两个操作：

一、查找模块

因为 Node.js 的模块查找其实是一个嗅探文件在指定目录列表里是否存在的过程，这其中会因为判断文件存不存在，产生大量的 Open 操作，在模块依赖比较复杂的场景，这个开销会比较大。

二、读取模块内容

找到模块后，需要读取其中的内容，然后进入之后的编译过程，如果文件内容比较多，这个过程也会比较慢。

那么，如何能够减少这些操作呢？既然模块依赖会产生很多 I/O 操作，那把模块扁平化，像前端代码一样，变成一个文件，是否可以加快速度呢？

说干就干，我们找到了社区中一个比较好的工具 ncc，我们把 serverless-runtime 这个模块打包一次，看看效果。

服务器环境：

ncc build node_modules/serverless-runtime/src/index.ts
node require.js
// 平均加载时间 934ms

看起来效果不错，大概提升了 34% 左右的速度。

但是，ncc 就没有问题嘛？我们写了如下的函数：

import * as _ from 'lodash';
import * as Sequelize from 'sequelize';
import * as Pandorajs from 'pandora';
console.log('lodash: ', _);
console.log('Sequelize: ', Sequelize);
console.log('Pandorajs: ', Pandorajs);

测试了启用 ncc 前后的差异：

可以看到，ncc 之后启动时间反而变大了。这种情况，是因为太多的模块打包到一个文件中，导致文件体积变大，整体加载时间延长。可见，在使用 ncc 时，我们还需要考虑 tree-shaking 的问题。

▐ 代码编译

我们可以看到，除了文件 I/O 外，另一个耗时的操作就是把 Javascript 代码编译成 v8 的字节码用来执行。我们的很多模块，是公用的，并不是动态变化的，那么为什么每次都要编译呢？能不能编译好了之后，以后直接使用呢？

这个问题，V8 在 2015 年已经替我们想到了，在 Node.js v5.7.0 版本中，这个能力通过 VM.Script 的 cachedData暴露了出来。而且，这些 cache 是跟 V8 版本相关的，所以一次编译，可以在多次分发。

我们先来看下效果：

//使用 v8-compile-cache 在本地获得 cache，然后部署到服务器上
node require.js
// 平均耗时 868ms

大概有 40% 的速度提升，看起来是一个不错的工具。

但它也不够完美，在加载 code cache 后，所有的模块加载不需要编译，但是还是会有模块查找所产生的文件 I/O 操作。

▐ 黑科技

如果我们把 require 函数做下修改，因为我们在函数加载过程中，所有的模块都是已知已经 cache 过的，那么我们可以直接通过 cache 文件加载模块，不用在查找模块是否存在，就可以通过一次文件 I/O 完成所有的模块加载，看起来是很理想的。

不过，可能对远程调试等场景不够优化，源码索引上会有问题。这个，之后会做进一步尝试。

近期计划

有了上面的一些理论验证，我们准备在生产环境中将上述优化点，如：ncc、code cache，甚至 require 的黑科技，付诸实践，探索在加载速度，用户体验上的平衡点，以取得速度上的提升。

其次，会 review 整个函数运行时的设计及业务逻辑，减少因为逻辑不合理导致的耗时，合理的业务逻辑，才能保证业务的高效运行。

最后，Node.js 12 版本对内部的模块默认做了 code cache，对 Node.js 默认进程的启动速度提升比较明显，在服务器环境中，可以控制在 120ms 左右，也可以考虑引用尝试下。

未来思考

其实，V8 本身还提供了像 Snapshot 这样的能力，来加快本身的加载速度，这个方案在 Node.js 桌面开发中已经有所实践，比如 NW.js、Electron 等，一方面能够保护源码不泄露，一方面还能加快进程启动速度。Node.js 12.6 的版本，也开启了 Node.js 进程本身的在 user code 加载前的 Snapshot 能力，但目前看起来启动速度提升不是很理想，在 10% ~ 15% 左右。我们可以尝试将函数运行时以 Snapshot 的形式打包到 Node.js 中交付，不过效果我们暂时还没有定论，现阶段先着手于比较容易取得成果的方案，硬骨头后面在啃。

另外，Java 的函数计算在考虑使用 GraalVM 这样方案，来加快启动速度，可以做到 10ms 级，不过会失去一些语言上的特性。这个也是我们后续的一个研究方向，将函数运行时整体编译成 LLVM IR，最终转换成 native 代码运行。不过又是另一块难啃的骨头。

作者：杜佳昆（凌恒）

Tags：Node.js 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

Node.js安装及环境配置之Windows篇

一、安装环境1、本机系统：Windows 10 Pro（64位） 2、Node.js：v12.14.1（64位）二、安装Node.js步骤1、下载对应你系统的Node.js版本: https://nodejs.org/en/download/ 2、选安装目录...【详细内容】

2020-11-26　　Tags: Node.js 点击:(105)　　评论:(0)　　加入收藏

使用Node.js搭建一个简单的http服务器

首先你要现在你的电脑上安装好node.js 地址：https://nodejs.org/en/download/ 安装好了会出现这个：然后写代码：//使用Node搭建一个简单的http服务器//加载http模块let http...【详细内容】

2020-10-23　　Tags: Node.js 点击:(100)　　评论:(0)　　加入收藏

一些小众却有用的 Node.js 包

yargs 是一个用来处理命令行参数的包，可以帮你处理自行设置的命令行标志和输入的任何类型的数据，其中包括布尔值、浮点数和字符串等。这个包非常简单明了，不需要在项目中编写大量的样板代码。...【详细内容】

2020-10-10　　Tags: Node.js 点击:(65)　　评论:(0)　　加入收藏

使用 Node.js 打通支付宝支付（沙箱环境）

沙箱环境 (Beta) 是协助开发者进行接口功能开发及主要功能联调的辅助环境，模拟了开放平台部分产品的主要功能和主要逻辑。可用于在产品上线前了解环境、组合和调试各种接口。...【详细内容】

2020-09-17　　Tags: Node.js 点击:(187)　　评论:(0)　　加入收藏

Node.js构建 Web 服务

这部分示例将致力于用 Node.js 模拟一个类似于 Apache 的 Web 服务器，处理浏览器端的请求，将相关的页面响应给浏览器。首先，我们要在code目录下执行mkdir 03_webSever命令来创...【详细内容】

2020-08-31　　Tags: Node.js 点击:(63)　　评论:(0)　　加入收藏

全局变量、事件绑定、缓存爆炸？Node.js内存泄漏问题分析

Node.js 使用的是 V8 引擎，会自动进行垃圾回收（Garbage Collection，GC），因而写代码的时候不需要像 C/C++ 一样手动分配、释放内存空间，方便不少，不过仍然需要注意内存的使用，避免造成内存泄漏（Memory Leak）。...【详细内容】

2020-08-24　　Tags: Node.js 点击:(67)　　评论:(0)　　加入收藏

Node.js的九大后端框架介绍

Node.js有许多框架可以选择，包括老牌的Express，Koa，新晋的Egg，Nest等等。...【详细内容】

2020-07-12　　Tags: Node.js 点击:(68)　　评论:(0)　　加入收藏

2020年值得关注的8个顶级Node.js框架

Node.js允许程序员在服务器端使用Javascript语言和脚本，这很快导致它在全世界范围内被迅速采用。Node.js在过去十年里慢慢爬上了流行的阶梯，并根据这次Stack overflow的调查，...【详细内容】

2020-07-09　　Tags: Node.js 点击:(141)　　评论:(0)　　加入收藏

使用阿里云Ubuntu部署Node.js服务

前言本篇文章适用于Node.js（Express后台）+MongoDB开发的项目流程1.远程连接到服务器可以登录阿里云远程连接到自己的服务器，也可以使用git-bash登录：ssh root@公网IP2.更新aptap...【详细内容】

2020-07-04　　Tags: Node.js 点击:(39)　　评论:(0)　　加入收藏

Node.js实现将文字与图片合成技巧

作者：诀九前端名狮转发链接： https://mp.weixin.qq.com/s/BMg8bFUwa4gmm6v2acAe7Q前言在头条发布文章时，需要为文章配置一个封面图片。我的常规做法就是网上搜一张图片，然后利...【详细内容】

2020-06-22　　Tags: Node.js 点击:(118)　　评论:(0)　　加入收藏

▌简易百科推荐

深入理解glibc malloc：malloc() 与 free() 原理图解

本文分为三个等级自顶向下地分析了glibc中内存分配与回收的过程。本文不过度关注细节，因此只是分别从arena层次、bin层次、chunk层次进行图解，而不涉及有关指针的具体操作。前...【详细内容】

2021-12-28　　linux技术栈　　　　Tags:glibc 　点击:(3)　　评论:(0)　　加入收藏

最完整的Vue教程-从零开始编写可视化大屏

摘要（OF作品展示）OF之前介绍了用python实现数据可视化、数据分析及一些小项目，但基本都是后端的知识。想要做一个好看的可视化大屏，我们还要学一些前端的知识（vue），网上有很多比...【详细内容】

2021-12-27　　项目与数据管理　　　　Tags:Vue 　点击:(2)　　评论:(0)　　加入收藏

程序的执行流程和开发工具介绍

程序是如何被执行的&emsp;&emsp;程序是如何被执行的？许多开发者可能也没法回答这个问题，大多数人更注重的是如何编写程序，却不会太注意编写好的程序是如何被运行，这并不是一个好...【详细内容】

2021-12-23　　IT学习日记　　　　Tags:程序　点击:(9)　　评论:(0)　　加入收藏

单点登录(SSO)看这一篇还不够！这次不慌了

阅读收获✔️1. 了解单点登录实现原理✔️2. 掌握快速使用xxl-sso接入单点登录功能一、早期的多系统登录解决方案单系统登录解决方案的核心是cookie，cookie携带会话id在浏览器...【详细内容】

2021-12-23　　程序yuan　　　　Tags:单点登录( 　点击:(8)　　评论:(0)　　加入收藏

手把手教你构建一个简单的Eclipse RCP应用

下载Eclipse RCP IDE如果你电脑上还没有安装Eclipse，那么请到这里下载对应版本的软件进行安装。具体的安装步骤就不在这赘述了。创建第一个标准Eclipse RCP应用（总共分为六步）1...【详细内容】

2021-12-22　　阿福ChrisYuan　　　　Tags:RCP应用　点击:(7)　　评论:(0)　　加入收藏

浅析 Token 价值的意义及来源

今天想简单聊一聊 Token 的 Value Capture，就是币的价值问题。首先说明啊，这个话题包含的内容非常之光，Token 的经济学设计也可以包含诸多问题，所以几乎不可能把这个问题说的清...【详细内容】

2021-12-21　　唐少华TSH　　　　Tags:Token 　点击:(10)　　评论:(0)　　加入收藏

在VUE中实现效果"换一换"功能

实现效果：假如有10条数据，分组展示，默认在当前页面展示4个，点击换一批，从第5个开始继续展示，到最后一组，再重新返回到第一组 data() { return { qList: [], //处理后...【详细内容】

2021-12-17　　Mason程　　　　Tags:VUE 　点击:(14)　　评论:(0)　　加入收藏

阿里资深软件测试工程师总结的这几点，让小白轻松搞懂性能调优

什么是性能调优？(what) 为什么需要性能调优？(why) 什么时候需要性能调优？(when) 什么地方需要性能调优？(where) 什么时候来进行性能调优？(who) 怎么样进行性能调优？(How) 硬件配...【详细内容】

2021-12-16　　软件测试小p　　　　Tags:性能调优　点击:(20)　　评论:(0)　　加入收藏

抖音防烧屏脚本 – Tasker 脚本分享，适用于 OLED 屏幕

Tasker 是一款适用于 Android 设备的高级自动化应用，它可以通过脚本让重复性的操作自动运行，提高效率。不知道从哪里听说的抖音 app 会导致 OLED 屏幕烧屏。于是就现学现卖，自...【详细内容】

2021-12-15　　ITBang　　　　Tags:抖音防烧屏　点击:(25)　　评论:(0)　　加入收藏

Rust 核心团队“有毒”

11 月 23 日，Rust Moderation Team（审核团队）在 GitHub 上发布了辞职公告，即刻生效。根据公告，审核团队集体辞职是为了抗议 Rust 核心团队（Core team）在执行社区行为准则和标准上...【详细内容】

2021-12-15　　InfoQ　　　　Tags:Rust 　点击:(25)　　评论:(0)　　加入收藏

推荐资讯

聊聊如何自定义数据脱	河南人到底有多爱吃面
人称“犬中四煞”的4	离婚后，约定每月给孩子
“三皇五帝”分别是哪	印度低种姓群体如何翻
日本研发“飞行摩托”	2021年Steam最畅销游