nazarlitvin / gulp-utm2html

Add UTM tags to URL in HTML file
1 stars 2 forks source link

UTF Encoding #4

Open dudeonthehorse opened 7 years ago

dudeonthehorse commented 7 years ago

Библиотека преобразовывает кириллицу в unicode сущности типа

Выпуск № 284 — 5:0 в пользу путешествий по России

хотя в оригинале используется

Выпуск № 284 — 5:0 в пользу путешествий по России

fogrew commented 6 years ago

@dudeonthehorse поделись подробностями. На какой версии ноды запускаешь? Кодируется в юникод содержимое ссылки или содержимое атрибута href?

dudeonthehorse commented 6 years ago

@Gurylev, привет. Кодируется вся кириллица в html-документе вообще. Что на шестой ноде была проблема, что сейчас на восьмой.

fogrew commented 6 years ago

а версия ноды?) в идеале вообще инструкцию по воспроизведению бага.

dudeonthehorse commented 6 years ago

Ты хочешь сказать, что твоя кириллица не кодируется? Btw, это заметно только в исходном коде и при просмотре билда текстовым редактором. Инспектор хрома ест нормально.

Текущая нода v8.7.0

Баг воспроизводится на чистой gulp-таске с кириллическим текстом в обрабатываемом файле

fogrew commented 6 years ago

У меня кодируется не весь документ, а только всё до ближайшего родителя. Но не суть.

Проблема решается исправлением 52 строчки на такую

var $ = cheerio.load(file.contents, { decodeEntities: false });

Мне ленно пилить пул реквест, извиняйте.

dudeonthehorse commented 6 years ago

Спасибо, кодировку это пофиксило. Но поломался рендеринг кастомных тегов в inky, который тоже юзает cheerio.

Это я уже покурю сам. Ты пусечка <3