Closed TAKEDA-Takashi closed 5 years ago
簡単にやるならばHTMLタグ自体を全部無視ですね(おそらく昔の挙動はこれだった) https://github.com/textlint-rule/textlint-rule-sentence-length/pull/7 あたりで数え方が変わった。
ちゃんとやるならばら、
https://github.com/textlint/textlint-util-to-string がHTML nodeをそのままHTML文字列として返してしまってるので、この辺でHTMLとして表示したときの文字列(ぼんやりと白いもの
)をどうにかして取得して返す感じですね。(Markdownの中のHTMLをパースして、表示文字列の位置情報を取得して扱うのが一番良いのだけど、rehypeしかその辺できないのかも。)
修正確認しました! 実際に利用しているのは https://github.com/textlint-ja/textlint-rule-preset-ja-technical-writing なのですが、パッケージの更新はbotで自動化しているみたいなので、反映待ってみます。 ありがとうございました!
patchアップデートなので、npm update textlint-rule-sentence-length --depth 3
とかで子パッケージのアップデートができるかもしれないですね。(もしくはnpm rmしてnpm install)
概要
aタグなどを文章中に含めた場合、そのaタグの属性値なども文字数としてカウントしてしまい、本来の文章よりも長く判定されてしまう。
期待する挙動
タグ自体は無視して、本来のテキスト部分でカウントしてほしい。
再現手順