misskey-dev / mfm.js

An MFM parser implementation with TypeScript.
MIT License
108 stars 19 forks source link

絵文字の正規表現に Unicode Property Escapes を使う #119

Closed syuilo closed 1 year ago

syuilo commented 1 year ago

軽くなる

syuilo commented 1 year ago

意外と微妙だった

syuilo commented 1 year ago

https://util.unicode.org/UnicodeJsps/list-unicodeset.jsp?a=%5B:Emoji=Yes:%5D

Emojiかどうか判定しつつ0-9ではないかチェックすれば良いかも?

marihachi commented 1 year ago

よく分からないけどtwemojiの正規表現を置き換えるということ?

syuilo commented 1 year ago

yes

marihachi commented 1 year ago

正直、絵文字のセットがどういう感じになってるのかぼくはよく分からないので、絵文字エンジニアが必要そう

mei23 commented 1 year ago

Unicode Emojiパターンは、Twemojiで使える絵文字 (Misskeyで使用しているTwemoji) と一致させる必要がある。 Unicode Property Escapesは、ブラウザによって対応Unicodeバージョンが違いそう。 だからまず無理だと思うのだわ。