liujiusheng / blog

个人博客,blog
19 stars 0 forks source link

gzip压缩技术深入研究 #211

Open liujiusheng opened 2 years ago

liujiusheng commented 2 years ago

image

查看Chrome的network可以发现有:deflate、gzip、br三个选项,要想掌握浏览器压缩技术,还有很多要学习的。

deflate与gzip解压的代码几乎相同,可以合成一块代码。

deflate使用inflateInit(),而gzip使用inflateInit2()进行初始化,比 inflateInit()多一个参数: -MAX_WBITS,表示处理raw deflate数据。因为gzip数据中的zlib压缩数据块没有zlib header的两个字节。

使用inflateInit2时要求zlib库忽略zlib header。

在zlib手册中要求windowBits为8..15,但是实际上其它范围的数据有特殊作用,见zlib.h中的注释,如负数表示raw deflate。

Apache的deflate变种可能也没有zlib header,需要添加假头后处理。即MS的错误deflate (raw deflate).zlib头第1字节一般是0x78, 第2字节与第一字节合起来的双字节应能被31整除,详见rfc1950。例如Firefox的zlib假头为0x7801,python zlib.compress()结果头部为0x789c。

deflate 是最基础的算法,gzip 在 deflate 的 raw data 前增加了 10 个字节的 gzheader,尾部添加了 8 个字节的校验字节(可选 crc32 和 adler32) 和长度标识字节。

gzip官网

gzip标准规范,内容很少,可很快阅读完。