写中文文档时，如何去掉源码中换行导致的空格？

0.12 可以玩 regex 魔法了，regex 现在可以跨不同的 text

typst

测试一下，效果怎么样。✓

测试一下，
效果怎么样。✗

// https://www.w3.org/TR/clreq/#table_of_punctuation_marks
#let han-or-punct = "[-\p{sc=Hani}。．，、：；！‼？⁇⸺——……⋯⋯～–—·・‧/／「」『』“”‘’（）《》〈〉【】〖〗〔〕［］｛｝＿﹏●•]"
#show regex(han-or-punct + " " + han-or-punct): it => {
  let (a, _, b) = it.text.clusters()
  a + b
}

测试一下，
效果怎么样。✓

不过建议使用 cjk-unbreak 而非自行构造，这样可以避免某些细节问题。

typst

#import "@preview/cjk-unbreak:0.2.3": remove-cjk-break-space 
#show: remove-cjk-break-space 

测试一下，
效果怎么样。✓

细节问题

在整个正则表达式匹配的边界，标点宽度会有问题。

typst

“七斤嫂，你‘恨棒打人’。……”✓

“七斤嫂，你‘恨棒打人’。
……”✗

#show regex("[。] [……]"): it => {
  let (a, _, b) = it.text.clusters()
  a + b
}

“七斤嫂，你‘恨棒打人’。
……”✗

而 cjk-unbreak 不存在这个问题。

typst

#import "@preview/cjk-unbreak:0.2.3": remove-cjk-break-space
#show: remove-cjk-break-space

“七斤嫂，你‘恨棒打人’。
……”✓

另请参见

贡献者

Y.D.X.

Shiqian Xia

梦飞翔

页面历史

最后编辑于 3 个月前

查看完整历史

写中文文档时，如何去掉源码中换行导致的空格？

写中文文档时，如何去掉源码中换行导致的空格？ ​

另请参见

贡献者

页面历史

Preview:

写中文文档时，如何去掉源码中换行导致的空格？