InfoAmazonia / jeo-theme

GNU General Public License v3.0
2 stars 0 forks source link

[ WPML ] InfoAmazonia - URL Problems after migration qTranslate -> WPML #374

Open pamelars86 opened 3 years ago

pamelars86 commented 3 years ago

UPDATE

03/03/2021 Notei aqui que o sitemap do site está incluindo páginas que não existem e que possuem /pt-br/ e /pt-pt/ na URL. Aqui onde vocês podem verificar isto ocorrendo:

O nosso idioma português não mostra o idioma na URL. Como essas páginas estão dando erro 404 e como isso é um dos fatores considerados pelo Google para o rankeamento do site, queria pedir que vocês subissem um pouco a prioridade dessa questão. Não é urgente, mas não é de baixa prioridade.

Uma outra questão de redirecionamento é que alguns posts perderam o "portugues" nos seus slugs. Deve ter algo a ver com a migração do qTranslate para o WPML... Não sei se afeta outros idiomas, mas o padrão é:

Foi de... https://infoamazonia.org/pt/2020/11/portugues-repavimentacao-da-br-319-pode-aumentar-quatro-vezes-o-desmatamento-no-amazonas/ para... https://infoamazonia.org/2020/11/05/repavimentacao-da-br-319-pode-aumentar-quatro-vezes-o-desmatamento-no-amazonas/

O fim do /pt não é um problema porque o redirecionamento ocorre normalmente sem isso. Mas sem o "portugues" o WordPress não encontra o slug correto. Então precisaria redirecionar com código 301 todos esses que foram mudados. A questão é que nem todos perderam esse "portugues". Tipo aqui: https://infoamazonia.org/2020/08/28/portugues-ministerio-do-meio-ambiente-anuncia-paralisacao-total-de-acoes-de-combate-a-desmatamento-e-queimadas/

ORIGINAL ISSUE

É preciso limpar do banco de dados as versões antigas dos idiomas que foram deixados pelo caminho pelo WPML: https://dev.infoamazonia.org/wp-admin/admin.php?page=sitepress-multilingual-cms%2Fmenu%2Flanguages.php

image

willowmagrini commented 3 years ago

@bwstefano estou testando formas de gerar novamente o sitemap sem as páginas que estão dando 404, elas não existem nem com pt-br nem sem.

Quanto a segunda questão, todas as páginas com "portugues-" na frente eu não consegui entender o problema. a página citada (essa) Não apresenta problemas e a url dela com "portugues-" na frente não esta indexada pelo google, você está seguro que ela existia dessa forma?

Se fizermos um redirecionamento dos posts que tem "portugues-" antes do resto da url iremos quebrar as que realmente possuem "portugues-" na slug.

Se achar necessário podemos fazer uma chamada para conversar sobre isso.

bwstefano commented 3 years ago

@willowmagrini,

estou testando formas de gerar novamente o sitemap sem as páginas que estão dando 404, elas não existem nem com pt-br nem sem.

Uma possibilidade poderia ser tentar remover do banco de dados estes dois idiomas (pt-br e pt-pt) criados no WPML durante o processo de migração.

Quanto a segunda questão, todas as páginas com "portugues-" na frente eu não consegui entender o problema. a página citada (essa) Não apresenta problemas e a url dela com "portugues-" na frente não esta indexada pelo google, você está seguro que ela existia dessa forma?

O problema não é a indexação pelo Google. É que há links que postamos nas redes sociais e acabaram quebrando. Neste exemplo você pode ver que ela existia, sim, desta forma: https://abc.infoamazonia.org/pt/2020/11/portugues-repavimentacao-da-br-319-pode-aumentar-quatro-vezes-o-desmatamento-no-amazonas/

Se fizermos um redirecionamento dos posts que tem "portugues-" antes do resto da url iremos quebrar as que realmente possuem "portugues-" na slug.

Você tem razão e eu também não sei se a quantidade de posts atingidos por este problema é significativa... Uma possibilidade seria obter a lista de posts do site antigo, ver quantas vezes aparecem URLs com "portugues-" ou "espanol-" e comparar com este número para o site em produção.

Mas caminhar a uma solução que envolvesse buscar os posts que perderam estes trechos dos slugs para fazer direcionamentos um a um parece bem trabalhosa...

Outra possibilidade poderia ser fazer a regra de redirecionamento ser condicional, como o WordPress faz por padrão (tipo esta URL, que ele redireciona para o correspondente mais próximo quando a URL exata não é encontrada). Então, a regra seria: se não houver URL como a inserida, tente o correspondente mais próximo com "portugues-" ou "espanol-" no início do slug. Faz sentido? É possível?

willowmagrini commented 2 years ago

@bwstefano faremos o seguinte, buscar no banco todas as páginas que tem o título portugues- ou espanhol- , remover isso do titulo e do link e redirecionar todas as urls que comecem por espanhol- e portugues- para a mesma url sem o prefixo.

bwstefano commented 2 years ago

Perfeito, @willowmagrini. Isso deve resolver a segunda questão. Aí só falta a primeira, dos idiomas do WPML deixados pra trás.

willowmagrini commented 2 years ago

Para solucionar o problema do mapa devemos apagar as segyuintes paginas:

bwstefano commented 2 years ago

Beleza, @willowmagrini. Pode apagar.

willowmagrini commented 2 years ago

Feita a remoção das páginas do sitemap.

Feitas as alterações no banco, esta é a lista dos posts alterados: https://docs.google.com/spreadsheets/d/1o3uUNJUYKMkD42oo39bZSXzpWuMeS0CoqD_er3Yq1U8/edit#gid=0

Existem 4 páginas que páginas parecem não existir mas tem os ids relacionados, seguem links e links de edição.

Que continham portugues-: https://infoamazonia.org/2019/08/satelites-de-la-nasa-muestran-una-alta-tasa-de-incendios-junto-con-la-deforestacion/ https://infoamazonia.org/wp-admin/post.php?post=73229&action=edit

https://infoamazonia.org/2019/11/decenio-perdido-la-tasa-de-destruccion-de-amazonia-vuelve-a-los-niveles-de-2008/ https://infoamazonia.org/wp-admin/post.php?post=73311&action=edit

Que continham espanol-: https://infoamazonia.org/2018/10/florencia-en-el-amazonas-la-opera-en-espanol-dedicada-a-la-selva/ https://infoamazonia.org/wp-admin/post.php?post=74866&action=edit

https://infoamazonia.org/que-retrata-los-impactos-del-hombre-sobre-la-amazonia/ https://infoamazonia.org/wp-admin/post.php?post=75178&action=edit