Open t-tk opened 1 year ago
サクラエディタ v2の内部コードはUTF16拡張です。 また、Unicode(UTF8(UTF-8 BOMあり)、UTF8N(UTF-8 BOMなし)、UTF16(≒UTF-16BE BOMなし、UTF-16BE BOMあり、UTF-16LE BOMあり)、UTF-16LE BOMなし、CESU8(≒Oracle版UTF-8))以外でも、Windowsが対応する文字コードであれば読み書きできることになっています。
通常のUTF16との差分は以下です。
0xDCXX
の XX
を使い、「ラウンドトリップできない文字(≒SJIS→UNICODE→SJISで元に戻せない文字。)」と「UNICODEに存在しない文字(≒SJISのコードページに存在しない文字)」を表現します。サクラエディタ v2は「NEC選定IBM拡張文字」を含むSJISのテキストを正しく表示できません。
ご回答ありがとうございます。 CP932 だけでも結構ややこしいことを初めて知りました。 https://ja.wikipedia.org/wiki/Microsoft%E3%82%B3%E3%83%BC%E3%83%89%E3%83%9A%E3%83%BC%E3%82%B8932
Shift_JISで表現した場合、「Windows-31J」の機種依存文字のうち、「NEC特殊文字」と 「IBM拡張文字」に対応していて「NEC選定IBM拡張文字」に非対応、ということでしょうか?
「非対応」というのが微妙ですが、
Windows-31J → Wide文字列(UTF16LE) → Windows-31J の変換を行った際に、元に戻せない文字が約400文字あり、 それらの文字は「化けて見える」ということです。
対応できますが「パフォーマンスの懸念がある+要望がない」で作業してない状態です。
お世話になっております。 https://sakura-editor.github.io/intro.html の中で、
という記述がありますが、現在の状況も間違いないでしょうか?
私は、内部がUnicode化されたSakura Editorがリリースされて久しいものと思っています。