如何用JavaScript实现一个支持语法高亮的代码编辑器？

betcha

发布时间：2025-09-21 22:27:01

342人浏览过

来源于php中文网

原创

答案是：实现语法高亮编辑器需解决文本解析、DOM操作与光标同步难题，核心是词法分析与高效渲染。

如何用javascript实现一个支持语法高亮的代码编辑器？

实现一个支持语法高亮的代码编辑器，核心在于将用户输入的纯文本代码，通过一套预设的规则（通常是正则表达式），解析成不同类型的“词法单元”（比如关键字、字符串、注释等），然后利用CSS为这些词法单元应用不同的样式。这听起来直接，但实际操作中，如何优雅地处理用户输入、光标定位以及性能优化，才是真正的挑战所在。

解决方案

要自己从零开始搭建一个语法高亮编辑器，这事儿比想象中要复杂得多，但也不是不可能。我的经验告诉我，这更像是一场对前端DOM操作和文本解析能力的综合考验。

最直接的思路，你可能会想到

textarea

，毕竟它是为文本输入而生。但问题来了，

textarea

内部的文本是“一团”的，你没法给其中某个单词单独加个颜色。所以，我们得另辟蹊径。

通常有两种主流方法：

立即学习“Java免费学习笔记（深入）”；

一种是

textarea

+ 覆盖层 (
div
) 的方案。你把一个透明的

textarea

放在最上层，负责接收用户的输入和处理光标。在它下面，放一个

div

，这个

div

的内容和

textarea

的内容完全同步。当

textarea

的内容发生变化时，我们把这个内容取出来，用 JavaScript 跑一遍语法高亮的逻辑，生成带有

标签（这些

带有不同的CSS类，比如

keyword

string

comment

等）的HTML，然后塞到下面的

div

里。这样，用户看起来就像是在一个能高亮的区域打字。这个方案的关键在于，你需要非常精细地同步

textarea

和

div

的滚动条位置，以及更头疼的光标位置。光标这东西，在

textarea

里是纯文本索引，但在

div

里，它得对应到具体的DOM节点和文本偏移，这中间的转换和维护简直是一场噩梦，尤其是当你的高亮逻辑导致DOM结构频繁变化时。

另一种是

contenteditable

div
的方案。这个方案的诱惑力在于，

contenteditable

元素本身就允许你直接编辑其内部的HTML结构，这意味着你可以直接在用户输入时修改DOM，插入带有样式的

。它似乎解决了

textarea

的核心痛点。但别高兴太早，

contenteditable

带来的问题也不少。首先是浏览器兼容性，不同浏览器对它的行为支持程度有微妙的差异。其次，它默认会允许用户输入富文本，比如复制粘贴带格式的内容，这对于代码编辑器来说是不可接受的。你需要拦截这些行为，强制只允许纯文本输入。更关键的是，当你对

contenteditable

内部的DOM进行高亮操作（比如重新插入

标签）时，光标的位置会非常容易丢失或跳动。你必须手动保存和恢复

Selection

对象，这又是一堆精细的DOM操作和逻辑。

无论哪种方案，核心的语法高亮逻辑都离不开词法分析。你需要定义一套规则（通常是正则表达式），来识别代码中的各种元素：

关键字：
```
function
```
,
```
let
```
,
```
const
```
,
```
if
```
,
```
else
```
等
字符串：
```
'hello'
```
,
```
"world"
```
注释：
```
// single line
```
,
```
/* multi-line */
```
数字：
```
123
```
,
```
3.14
```
操作符：
```
+
```
,
```
-
```
,
```
=
```
,
```
==
```
变量/函数名： 剩下的普通标识符

当你有了这些规则，你就可以遍历代码字符串，找出这些“词法单元”，然后给它们套上对应的

标签。这听起来像个循环替换的过程，但实际上，你需要一个更健壮的“分词器”（tokenizer），它能一次性扫描并识别出所有token，同时处理好优先级和嵌套关系。

所以，与其说是“实现一个编辑器”，不如说是在“管理一个复杂的文本渲染与交互系统”。很多时候，我们最终还是会选择 CodeMirror、Monaco Editor 或 Ace Editor 这样的成熟库，它们已经把这些坑都填平了，并且提供了大量高级功能，比如代码补全、错误提示、多光标等。但理解其背后的原理，对于我们使用和定制这些库，无疑是巨大的帮助。

为什么不直接用

textarea

就能实现语法高亮？

这个问题我被问过不止一次，每次我都会解释，

textarea

的设计初衷就是为了提供一个纯文本的输入区域，它内部的文本内容被视为一个不可分割的整体。你无法像操作普通

div

里的HTML那样，对

textarea

里的某个词、某个字符应用单独的CSS样式。

TextIn Tools

是一款免费在线OCR工具，包含文字识别、表格识别，PDF转文件，文件转PDF、其他格式转换，识别率高，体验好，免费。

下载

想象一下，你有一段代码

const message = "Hello";

。如果你想让

const

变成蓝色，

"Hello"

变成绿色，

变成灰色，

textarea

压根不提供这样的粒度控制。它的内部结构是扁平的，就像一个纯文本文件，你只能改变整个

textarea

的字体、颜色、背景等整体样式，而不能针对其内部的某个子串进行样式修改。

要实现语法高亮，我们必须能够把代码中的不同部分（例如关键字、字符串、注释）标记出来，然后给它们应用不同的CSS类。这在HTML中，通常是通过

标签来实现的。比如，

const message = "Hello";

。而

textarea

根本不支持在其内容中插入任何HTML标签。它会把所有你尝试插入的

都当作普通文本显示出来。

所以，我们才不得不采取那些“曲线救国”的方案，比如用一个

div

盖在

textarea

下面，或者直接使用

contenteditable

元素，这些都是为了绕开

textarea

的纯文本限制，以便我们能直接操作DOM，从而实现精细化的样式控制。这就像你不能直接在纸上给某个字涂色，但你可以把那个字抠出来，贴一张有颜色的纸在下面，或者直接用有颜色的笔写。

contenteditable

和

textarea

div

覆盖方案各有什么优缺点？

这两种方案，我个人都尝试过，每种都有它让人抓狂的地方，也都有它能让你松一口气的时候。选择哪个，真的得看你的具体需求和对复杂度的接受程度。

textarea

+
div
覆盖方案：

优点：
- 输入处理相对简单：
```
textarea
```
  天生就是用来处理文本输入的，它的光标、选择、复制、粘贴等行为都是浏览器原生支持且非常稳定的。你不需要费心去模拟这些核心的文本编辑功能。
- 纯文本内容获取容易： 你可以直接从
```
textarea.value
```
  拿到最纯粹的代码文本，这对于编译、保存或者其他文本处理操作非常方便，不需要额外清理DOM结构。
- 高亮逻辑与输入分离： 高亮渲染在一个独立的
```
div
```
  中，理论上可以减少对输入体验的干扰。
缺点：
- 光标/选择同步是噩梦： 这是这个方案最大的痛点。
```
textarea
```
  的光标是基于字符索引的，而下面的
```
div
```
  的高亮内容是基于DOM节点的。当高亮逻辑重新渲染
```
div
```
  时，如果DOM结构发生变化（比如插入或移除了
  标签），你必须精确地将
```
textarea
```
  中的光标位置映射到
```
div
```
  中的DOM节点和文本偏移量，然后手动恢复。这涉及到
```
Range
```
  和
```
Selection
```
  API，而且非常容易出错，尤其是在处理多行、复杂高亮或者用户拖拽选择时。
- 滚动同步：
```
textarea
```
  和
```
div
```
  的滚动条需要保持一致，这需要监听
```
scroll
```
  事件并手动同步。
- 性能挑战： 每次输入都重新渲染整个
```
div
```
  的HTML，对于大文件来说，性能会是个问题。你需要引入防抖、节流，甚至局部更新的策略。
- 视觉一致性： 字体、行高、内边距等CSS属性必须在
```
textarea
```
  和
```
div
```
  之间精确匹配，否则会出现错位。

contenteditable

div
方案：

优点：
- DOM操作直接： 最大的优势是你可以直接在
```
contenteditable
```
  元素内部进行DOM操作，插入
  标签来实现高亮。这意味着光标和选择理论上是在同一个DOM树中，管理起来可能更“自然”一些（注意，是“可能”）。
- 更灵活的扩展性： 如果你未来想添加更复杂的富文本功能，比如代码块折叠、行号显示与内容绑定等，
```
contenteditable
```
  提供了更大的自由度。
缺点：
- 浏览器兼容性与行为不一致： 不同的浏览器对
```
contenteditable
```
  的实现有细微差异，这会导致一些意想不到的行为或bug。
- 富文本输入问题：
```
contenteditable
```
  默认允许用户输入富文本（比如加粗、斜体，甚至粘贴带格式的内容）。你需要编写大量的事件监听器来拦截这些行为，强制只允许纯文本输入，这本身就是个不小的工程。
- 光标/选择维护依然复杂： 尽管光标在同一个DOM树中，但当你重新高亮（即修改
```
contenteditable
```
  内部的DOM结构）时，光标位置仍然容易丢失。你还是需要用到
```
Range
```
  和
```
Selection
```
  API来保存和恢复光标。这和
```
textarea
```
  方案的复杂性不相上下，只是处理的上下文不同。
- 获取纯文本内容复杂： 你需要从
```
contenteditable.innerText
```
  或
```
textContent
```
  中提取纯文本，但如果内部有大量的
  标签，有时候可能会带出一些不必要的空白或格式。
- 安全性： 如果不小心，允许用户直接修改DOM可能会带来一些安全风险（虽然对于客户端代码编辑器来说，这通常不是首要考虑）。

总的来说，如果你追求的是一个相对简单、稳定的纯文本代码高亮，且不介意光标同步的复杂性，

textarea

div

方案可能更直观。但如果你需要更强的定制性、更复杂的交互，并且愿意投入精力去驯服

contenteditable

的“野性”，那么后者可能提供更大的潜力。但无论如何，这两种方案都会让你在光标和选择的维护上掉一层皮。

实现一个基础的JavaScript语法高亮器需要关注哪些技术细节？

要自己动手实现一个基础的JavaScript语法高亮器，除了前面提到的选择

textarea

div

还是

contenteditable

之外，还有一些核心的技术细节是无论如何都绕不过去的，它们直接决定了你的高亮器能否稳定、高效地工作。

词法分析（Tokenization）的策略和正则表达式： 这是高亮器的“大脑”。你需要一套强大的正则表达式来识别JavaScript代码中的不同“词法单元”（tokens）。
- 关键字：
```
/\b(const|let|var|function|if|else|for|while|return|new|this|class|extends|import|export)\b/g
```
- 字符串：
```
/("|')(?:(?!\1)\\|.)*\1/g
```
  (处理单引号和双引号，并考虑转义字符)
- 注释：
```
/\/\/[^\n]*|\/\*[\s\S]*?\*\//g
```
  (单行和多行注释)
- 数字：
```
/\b\d+(\.\d+)?([eE][+-]?\d+)?\b/g
```
- 操作符/标点：
```
/[+\-*/%=&|^!~<>{}[\](),.;:]/g
```
- 标识符：
```
/\b[a-zA-Z_$][a-zA-Z0-9_$]*\b/g
```
  (变量名、函数名等)
关键在于，这些正则表达式的匹配顺序很重要。比如，你得先匹配注释和字符串，因为它们内部可能包含关键字，但你不希望这些关键字被高亮。一个常见的分词策略是，从代码字符串的开头开始，依次尝试匹配最长的、优先级最高的token，匹配到了就“消耗”掉这部分字符串，然后从剩余的部分继续。这通常比简单的
```
String.prototype.replace
```
链式调用要健壮得多。
DOM操作与性能优化： 每一次用户输入，都可能触发高亮逻辑，进而修改DOM。频繁的DOM操作是前端性能的杀手。
- 局部更新： 尽量避免每次都重新渲染整个文档。如果只修改了一行，尝试只更新那一行对应的DOM。但这又会引入新的复杂性，比如如何精确识别哪一行被修改了。
- 文档片段（DocumentFragment）： 当你需要插入大量DOM节点时，先将它们添加到
```
DocumentFragment
```
  中，然后一次性将
```
DocumentFragment
```
  插入到实际DOM树中。这能减少重绘和回流的次数。
- 虚拟DOM（Virtual DOM）： 如果你的项目规模足够大，或者你已经在使用React/Vue等框架，可以考虑利用它们的虚拟DOM机制来管理高亮部分的渲染。但对于一个基础的编辑器，这可能有点杀鸡用牛刀。
防抖（Debounce）/节流（Throttle）： 用户打字速度可能很快，你不可能在每次按键都立即执行完整的语法高亮逻辑。
- 使用防抖函数，例如设置一个200-300毫秒的延迟，只有当用户停止输入一段时间后，才触发高亮渲染。这能显著提升用户体验，避免UI卡顿。
光标位置的维护： 这绝对是整个实现中最令人头疼的部分。无论你选择哪种方案，当高亮逻辑修改了DOM结构时，浏览器的原生光标位置很可能会丢失或跳到不正确的地方。
- Selection
  和
  Range
  API：在进行DOM修改之前，你需要使用
```
window.getSelection()
```
  获取当前的
```
Selection
```
  对象，然后通过
```
Selection.getRangeAt(0)
```
  获取到
```
Range
```
  对象。这个
```
Range
```
  对象包含了光标的起始和结束位置（
```
startContainer
```
  ,
```
startOffset
```
  ,
```
endContainer
```
  ,
```
endOffset
```
  ）。
- 映射与恢复： 修改DOM后，你需要根据原始的
```
Range
```
  信息，计算出在新的DOM结构中对应的位置，然后创建一个新的
```
Range
```
  对象，并用
```
Selection.removeAllRanges()
```
  和
```
Selection.addRange(newRange)
```
  来恢复光标。这通常需要一个复杂的算法，将纯文本的偏移量映射到DOM节点的文本内容偏移量。例如，一个纯文本偏移量
```
N
```
  可能对应着
```
abcdef
```
  中的
```
def
```
  节点的
```
c
```
  字符之后。
滚动同步（针对
```
textarea
```
+
div
方案）：确保
```
textarea
```
和下层
```
div
```
的滚动位置始终保持一致。
- 监听
```
textarea
```
  的
```
scroll
```
  事件，然后将
```
scrollTop
```
  和
```
scrollLeft
```
  应用到下层的
```
div
```
  上。
处理不完整代码和错误： 用户在输入时，代码往往是不完整的（比如只输入了一个开括号，还没输入闭括号）。你的高亮器不能因为代码不完整就崩溃或者显示错误。
- 确保正则表达式能够优雅地处理不匹配的引号、未闭合的注释等情况。
代码示例（分词器骨架）：

function highlightCode(code) {
    let highlightedHtml = '';
    let lastIndex = 0;

    // 优先级：注释 > 字符串 > 关键字 > 数字 > 标识符
    const tokenRegexes = [
        { regex: /(\/\/[^\n]*|\/\*[\s\S]*?\*\/)/g, type: 'comment' },
        { regex: /("|')(?:(?!\1)\\|.)*\1/g, type: 'string' },
        { regex: /\b(const|let|var|function|if|else|for|while|return|new|this|class|extends|import|export)\b/g, type: 'keyword' },
        { regex: /\b\d+(\.\d+)?([eE][+-]?\d+)?\b/g, type: 'number' },
        { regex: /[+\-*/%=&|^!~<>{}[\](),.;:]/g, type: 'operator' },
        // ... 其他类型，如标识符、布尔值等，放在后面
    ];

    let matches = [];
    tokenRegexes.forEach(tokenDef => {
        let match;
        // 每次都从头开始匹配，但只记录有效（不重叠）的匹配
        while ((match = tokenDef.regex.exec(code)) !== null) {
            matches.push({
                start: match.index,
                end: match.index + match[0].length,
                type: tokenDef.type,
                value: match[0]
            });
        }
    });

    // 对匹配结果进行排序，并处理重叠（通常是取最长或优先级最高的）
    // 这一步是词法分析的核心，确保每个字符只被一个token覆盖
    matches.sort((a, b) => a.start - b.start);
    let finalTokens = [];
    let currentPos = 0;
    for (const match of matches) {
        if (match.start >= currentPos) {
            // 如果当前匹配在当前位置之后，说明中间可能有普通文本
            if (match.start > currentPos) {
                finalTokens.push({
                    type: 'plain',
                    value: code.substring(currentPos, match.start)
                });
            }
            finalTokens.push(match);
            currentPos = match.end;
        } else if (match.end > currentPos) {
            // 处理重叠：如果当前匹配覆盖了已经处理的部分，且当前匹配更长或优先级更高，则替换
            // 这是一个简化的处理，实际可能更复杂
            // 对于JS高亮，通常是优先匹配注释和字符串，然后是关键字
            // 这里的简单排序+覆盖可以处理大部分情况
            const lastToken = finalTokens[finalTokens.length - 1];
            if (lastToken && lastToken.end < match.end) { // 如果新匹配更长
                 // 复杂的优先级判断和替换逻辑
            }
        }
    }
    // 添加末尾的普通文本
    if (currentPos < code.length) {
        finalTokens.push({
            type: 'plain',
            value: code.substring(currentPos)
        });
    }

    // 将tokens转换为HTML
    finalTokens.forEach(token => {
        if (token.type === 'plain

如何在 Prettier 中保留空花括号中的单个空格（如 { }）

什么是javascript中的可选catch绑定？_它如何简化错误处理代码？

什么是javascript的函数式编程_为什么不可变性在函数式编程中重要

如何在网页中安全地请求并使用文件系统编辑权限

如何管理Javascript中的依赖_怎样使用Javascript模块打包工具？