leoleoasd / blog

Hosted by Github Pages.
0 stars 1 forks source link

随想 | 有关乱码 | About gibberish | Leo's blog #44

Open leoleoasd opened 2 years ago

leoleoasd commented 2 years ago

https://leoleoasd.me/2021/11/29/sui-xiang-you-guan-luan-ma-about-gibberish/

随想 有关乱码首先给出几种常见『乱码』: md5 378e3ce9f0c8243012cb32cedde1ad31 sha1 b4d254b6620924a05e95bf76f5dace64edcf9086 sha256 3e9818cc4bf74e65419e72f89104dca674dcb215c1487dd25fed541cd6363d72 base32 MNUGC3THNJUWC3TMO

yatounoneko commented 2 years ago

確實,正如你所述亂碼并不是完全無法閲讀。就好比網頁中的BIG5和GBK在不同系統語言下的差異,其實并不是完全看不懂。 大部分時候只不過是錯誤轉碼的產物

就好比:斕掊稛岆徨憩岆徨ˋ滖嶒賸甜?綎賸媼笭滖徨饒符岆淩腔徨ㄛ褫眕想眳?祥褫閥徨﹝

這是一個的BIG5被轉成了GBK的亂碼,不過其中會真正丟失掉的就變成“?”的符號

像這類:斕掊稛岆徨憩岆徨ˋ滖嶒賸甜?綎賸媼笭滖徨饒符岆淩腔徨ㄛ褫眕想眳?祥褫閥徨﹝

就很像是UTF-8/GBK/BIG5被轉成iso-8859-1或者windows-1252,經過二重轉碼才失去了真正的意義

加密的特徵就比較明顯,被加密后的字串依舊是可閲讀的,只不過每個格式不同特徵也不同而已。熟悉的人一般都能看得出差別,不熟悉的人只能看到一堆字串。

(比如我就什麽都看不懂x 只知道和什麽MD5的hash很像)

leoleoasd commented 2 years ago

確實,正如你所述亂碼并不是完全無法閲讀。就好比網頁中的BIG5和GBK在不同系統語言下的差異,其實并不是完全看不懂。 大部分時候只不過是錯誤轉碼的產物

就好比:斕掊稛岆徨憩岆徨ˋ滖嶒賸甜?綎賸媼笭滖徨饒符岆淩腔徨ㄛ褫眕想眳?祥褫閥徨﹝

這是一個的BIG5被轉成了GBK的亂碼,不過其中會真正丟失掉的就變成“?”的符號

像這類:斕掊稛岆徨憩岆徨ˋ滖嶒賸甜ï�¿?綎賸媼笭滖徨饒符岆淩腔徨ㄛ褫眕想眳?祥褫閥î�™î»±å¾¨ï¹�

就很像是UTF-8/GBK/BIG5被轉成iso-8859-1或者windows-1252,經過二重轉碼才失去了真正的意義

加密的特徵就比較明顯,被加密后的字串依舊是可閲讀的,只不過每個格式不同特徵也不同而已。熟悉的人一般都能看得出差別,不熟悉的人只能看到一堆字串。

~(比如我就什麽都看不懂x 只知道和什麽MD5的hash很像)~

确实,平常见到的真正像/dev/random那种随机乱码还是少。绝大部分『乱码』都是不知道啥意思或者错误解码的码