huacnlee / autocorrect

A linter and formatter to help you to improve copywriting, correct spaces, words, and punctuations between CJK (Chinese, Japanese, Korean).
https://huacnlee.github.io/autocorrect
MIT License
921 stars 34 forks source link

spellcheck: 中文词语纠正需要空格分割 #123

Open Dunky-Z opened 1 year ago

Dunky-Z commented 1 year ago

Hi,遇到两个小问题。版本v2.5.4

  1. 如果想要将中文的词语纠正,文本里的词语只有在被空格分割的情况下才会被纠正

      rules:
        # Auto add spacing between CJK (Chinese, Japanese, Korean) and English words.
        # 0 - off, 1 - error, 2 - warning
        space-word: 1
        # Add space between some punctuations.
        space-punctuation: 1
        # Add space between brackets (), [] when near the CJK.
        space-bracket: 1
        # Convert to fullwidth.
        fullwidth: 1
        # To remove space near the fullwidth punctuations.
        no-space-fullwidth: 1
        # To remove space arouned the fullwidth quotes “”, ''.
        no-space-fullwidth-quote: 1
        # Fullwidth alphanumeric characters to halfwidth.
        halfwidth-word: 1
        # Fullwidth punctuations to halfwidth in english.
        halfwidth-punctuation: 1
        # Spellcheck
        spellcheck: 2
    
      spellcheck:
        mode: 1
        words:
          - 蛋炒饭 = 拉面
      # 如果这样无法纠正
      我爱吃蛋炒饭加火腿。
      # 这样才会被纠正
      - 我爱吃 蛋炒饭 加火腿。
      + 我爱吃 拉面 加火腿。
  2. 括号后的标点符号不会被纠正
    # 最后的括号是中文括号,加了英文句点,预期结果应该是句点被改为中文句号,但是没有被纠正
    我爱吃蛋炒饭加(火腿).
     # 英文情况一样,英文括号加中文句号,预期情况句号应该被纠正为句点
     I love (china)。
huacnlee commented 1 year ago

spellcheck 一直还处于实验阶段,目前还有不少问题待解决。

我最近再想想怎么解决这些问题。实际上 Spellcheck 哪里如果遇到重复的词语或连贯的处理起来会有问题的。

Dunky-Z commented 1 year ago

@huacnlee 嗯嗯,好的谢谢。辛苦了