KiwiHC16 / Abeille

Abeille pour Jeedom (Gateway ZiGate)
GNU Affero General Public License v3.0
60 stars 52 forks source link

Zigate v2 ne communique plus avec les équipements suite aux dernières mises à jour Abeille #2490

Closed ValFaure closed 7 months ago

ValFaure commented 1 year ago

Bonjour,

J'ai fait la mise à jour vers abeille 221104-BETA-1 et j'ai perdu la communication avec tous mes équipements. Idem après passage à la 221105-BETA-1. La plupart sont passés en Time-Out dans la page santé. J'ai une ampoule qui est bien notée en OK, tout comme la Zigate, mais aucune commande ne fonctionne. J'ai dans les logs un "WARNING: Zigate1 cmd 0100 TIMEOUT (SQN=, SQNAPS=) => Considering zigate available. " qui revient quand je tente une commande.

Une idée sur ce qui peut avoir causé ce souci ? J'ai tenté de reflasher la Zigate mais sans succès. Je suis sur une PiZigateV2 avec firmware 3.22.

Ci-joint les logs pris après redémarrage des deamons et tentative d'une commande ON sur l'ampoule. AbeilleLogs-221106.tar.gz

PS : pour info, il y a eu une mise à jour Jeedom vers la 4.3.9 au même moment

tcharp38 commented 1 year ago

Tu peux me montrer un snapsot de la page config ? Et la page santé ?

ValFaure commented 1 year ago

Oui pas de souci. Les voilà :

Page santé 1 Page santé 2 Page config 1 Page config 2

tcharp38 commented 1 year ago

Je note que tu es sur le canal 20. Est ce ton choix ? Ou le resultat du mode "auto" ? Si pas ton choix, je te suggere de changer le canal vers 11 plus commun, et redemarrer la Zigate.

ValFaure commented 1 year ago

C'est le résultat du mode auto. J'avais une Pizigate v1 avant j'avais tout en canal 11. Quand je suis passé sur la v2 c'était le canal 20 par défaut.

Je vais faire le test en canal 11 pour voir.

ValFaure commented 1 year ago

Idem avec le canal 11. Je n'arrive même plus à faire une simple inclusion (la Zigate clignote bien pourtant). J'ai lancé le script de test comme indiqué sur le wiki de Zigate.fr et tout à l'air OK pourtant. J'ai tenté de recharger une sauvegarde du système d'il y a deux jours et ça me fait pareil. Je commence à me dire que c'est pas dépendant de la version d'Abeille et qu'il y a un truc qui à sauter sur le Pi mais je vois pas ce qui a pu se passer (et c'est arriver juste après les maj dans Jeedom). Et aussi j'ai ce message d'erreur au démarrage de Jeedom :
ERREUR: Abeille1, Message corrompu (taille payload incorrecte, taille=10B, att=0B)

Je vais tester avec une toute nouvelle install de jeedom pour voir.

tcharp38 commented 1 year ago

Ha pour creuser cette erreur j'ai besoin du package de logs. Pense y de maniere generale, a mettre de coté suite à chaque evenement que tu pointes. sinon je n'ai aucune trace sur laquelle travailler.

Mais info interessante. Si tu es revenu sur une ancienne version d'Abeille et que ca ne change pas la donne, je prefere ca mais il faut quand meme trouver la cause.

Seby9576 commented 1 year ago

Hello,

Dans réseau tu as quelque chose ? Les demons sont ok ? La clé est ok ? image

Seby9576 commented 1 year ago

@ValFaure tu n'as plus de pb ?

ValFaure commented 1 year ago

Désolé pour la réponse tardive. J'ai manqué de temps ces derniers jours.

J'ai quand même commandé une nouvelle Pizigate en parallèle car je commençais à avoir des doutes sur son bon fonctionnement (peut-être le module radio qui avait lâché), mais c'est pareil malgré le changement. Bon il faut dire que j'ai fait un clone de la mémoire de l'ancienne Zigate et je suis resté sur mon Jeedom de prod. Pour être sûr il faut que je teste nouvelle Pizigate en reflashant à zéro et jeedom vierge mais j'ai pas encore eu l'occasion.

@KiwiHC16, pour le message "Erreur payload", je te joins les logs pris juste après le redémarrage, sans aucune commande lancée.

@Seby9576, tout est OK sur la page config du plugin (le test retourne OK et la lecture de la version du firmware fonctionne).

Je commence de plus en plus à penser que quelque chose à été corrompu sur la Zigate à un moment donné. Pour moi ça a été concomitant à la màj Abeille parce que j'ai perdu toute la connectivité juste après mais c'est peut-être juste une coïncidence de timing ? J'ai aussi remarqué que la LED de la Zigate s'éteint en mode Flash au lieu de simplement diminuer d'intensité (comme c'était le cas sur la V1). Ça me le fait en tout cas sur les deux Pizigate V2 (mais bon là encore peut-être dû au clonage de Zigate). Est-ce que ce serait pas aussi un problème "GPIO" sur le pi ? Bref, je suis bien content que vous m'aidiez mais j'ai peur de vous faire perdre votre temps si c'est pas lié à Abeille. Je me fais petit à petit à l'idée de devoir tout refaire dans jeedom (en espérant que tout soit OK sur une install toute fresh) !

AbeilleLogs-221114.tar.gz

ValFaure commented 1 year ago

Bon du nouveau. J'ai reflashé la Zigate avec effacement du PDM et j'ai pu réinclure des équipements. Ca se resynchronise bien dans mon Jeedom de prod donc je ne devrais pas avoir plus à faire qu'une réinclusion de chaque équipement. J'ai toujours le message "Erreur payload" au démarrage cependant. Tant que ça fonctionne ça me dérange pas vraiment mais à surveiller car je vais peut-être me retrouver avec le même soucis lors d'une prochaine update.

Pour ma part l'issue peut être clôturée. Merci pour vos réponses !

tcharp38 commented 1 year ago

Il y a une autre beta qui devrait etre dispo demain. On refait le point apres. Je n'ai pas vu ton erreur "payload" dans les derniers logs du coup si ca se reproduit... n'hesite pas à me filer le package.

ValFaure commented 1 year ago

Le message d'erreur est dans les premières lignes de AbeilleParser.log :

ERROR: Abeille1, Message corrompu (taille payload incorrecte, taille=10B, att=0B)

tcharp38 commented 1 year ago

ok. Jamais compris ce pb. C'est tres vieux et je n'arrive pas à reproduire. C'est comme si plusieurs démons tournaient en //. Heureusement que c'est rare mais en même temps ca aide pas a trouver le souci. Je sèche jusque la :(

ValFaure commented 1 year ago

Bon bah retour à la case départ. J'ai fait toutes les réinclusions, tout fonctionnait nickel, je reboot jeedom -> tout est de nouveau KO. En effet l'idée que c'est comme si plusieurs démons tournaient en même temps est pertinente. Ca fait comme si Abeille perdait la main sur la Zigate et n'arrivait pu à envoyer les commandes. Tous les équipements finissent petit à petit en timeout. Pourtant si je fais une réinterrogation du réseau dans Réseau Abeille -> Table des liens, les équipements ont l'air de répondre. C'est très bizarre...

tcharp38 commented 1 year ago

Tu remets le dernier package ?

ValFaure commented 1 year ago

Voici les derniers packages de logs. Je me suis demandé s'il n'y avait pas un lien avec l'initialisation en mode production de la Zigate après un reboot. Sur le site de Zigate.fr il est dit de mettre les commandes GPIO pour Wiringpi dans le fichier /etc/rc.local. Or quand je ne mets rien dans rc.local et que je boot jeedom, la Zigate ne s'allume pas évidemment et pas d'erreur "payload". Ensuite je la mets en production en tapant les commandes via ssh et redémarre le plugin Abeille et pas de message d'erreur non plus (mais pas mieux niveau communication avec les équipements).

Du coup premier package de logs sans activation Zigate via rc.local :
23:15 : boot 23:18 : commandes GPIO via ssh 23:18:54 : restart démon Abeille 23:19:30 : envoi commande ON sur une ampoule

Et deuxième package de logs en mode normal avec rc.local.

AbeilleLogs-221114-2320-sans rc.local.tar.gz AbeilleLogs-221114-2329-avec rc.local.tar.gz

Je sais pas si tout ça pourra t'aider. Merci déjà pour le temps que tu y passes ! Moi pour ce soir en tout cas je lâche l'affaire !

tcharp38 commented 1 year ago

Les traces de ces logs sont nouvelles pour moi. je n'ai par ex jamais vu cette erreur "Type=8000/Status, Status=06/Unknown-06"

Peux tu revenir sur le FW 3.21 ? Sauf erreur le 3.22 est toujours en "Release Candidate". D'autre part, mets à jour Abeille sur la derniere beta STP (221114-BETA-2). Les commandes GPIO sont faites par Abeille des lors que "wiringPi" est installé.

ValFaure commented 1 year ago

Franchement je m'arrache les cheveux !

Bref j'y comprends plus rien. Quand je fais un erase complet de la Zigate je peut repartir pour un tour et tout fonctionne. Puis plus rien d'un coup sans prévenir. Mais un erase + restauration ça ça marche pas !??? Bon, faut encore que je refasse une inclusion de tous les équipements, sans brancher l'ampoule pour laquelle j'ai un doute, et que je vois si ça tient. Je me sens pas le courage de le faire encore une fois ce soir. Je vais retenter demain.

AbeilleLogs-221115.tar.gz

EDIT : Pour ce soir j'ai reflashé à nouveau la zigate et inclus seulement une seule ampoule qui a toujours bien fonctionné. J'ai toujours quelques "zigateAckCheck(): WARNING: Zigate1 cmd 0100 TIMEOUT (SQN=14, SQNAPS=24) => Considering zigate available" dans les logs mais je peux commander l'ampoule et ça tient même après un redémarrage de Jeedom. Je vais voir d'ici demain ce que ça donne. Par contre je confirme que si je ne mets pas les commandes GPIO au boot dans /etc/rc.local, Abeille ne me met pas la Zigate en mode production. Et j'ai toujours le message "erreur payload" au boot de jeedom.

tcharp38 commented 1 year ago

Je suis aussi perdu que toi. La derniere config est donc

Soit tu laisses tourner cette nuit, soit tu forces la reinterrogation reseau et me files les logs dans la foulée, avec un status.

Ne fais rien d'autre. Histoire qu'on arrive à suivre ce qui a pu declencher ca. Ha et note bien l'heure de chaque evenement que tu enclenches. Ca aide dans l'historique. Un dernier point puisque j'essaie de passer en revue plein de points.. peux tu me montrer ce que tu mets dans rc.local ?

tcharp38 commented 1 year ago

Laisse tomber l'histoire de 'rc.local'. J'ai compris le bug. Ca sera fixé dans la prochaine beta. Uniquement ce point bien sur.

ValFaure commented 1 year ago

Bonne nouvelle pour le rc.local, au moins quelque chose de positif sera ressorti de tout ça.

Bon sinon je crois que l'on va pouvoir clore l'issue. Je commence à être quasiment certain que c'est le programme de flash DK6Programmer utilisé sur la zigate et les commandes reprises sur le site Zigate.fr qui foutent la merde.

J'ai encore tout bien pu réinclure ce soir et tout a fonctionné sans aucun problème jusqu'à ce que je décide de faire une sauvegarde de la Zigate avec la commande ./DK6Programmer -s /dev/ttyAMA0 -P 115200 -d FLASH:0x9FFFF@0=dump.bin.

Ça doit corrompre une partie de l'EEPROM à un moment donné c'est pas possible, toutes les commandes de mes équipements ont arrêté de répondre juste après. Par contre la commande pour flasher le firmware + reset de la zigate fonctionne, donc au moins je peux revenir en arrière (au prix de tout devoir réinclure, mais bon je commence à avoir le coup de main !).

Merci en tout cas pour le temps que tu y auras passé.

tcharp38 commented 1 year ago

Du coup tu penses que le fait de "dumper" ta zigate fiche la pagaille ? Ca dit quoi ?

ValFaure commented 1 year ago

Disons que ça semble vraiment corrélé, parce que j'ai vraiment tout perdu juste après la commande, alors que l'ampoule incluse hier fonctionnait toujours ce soir et que j'avais pu faire toutes les autres inclusions sans problème tout le reste de la soirée.

Après j'ai toujours un petit doute, parce que j'ai pas de message d'erreur quand j'utilise l'outil de flash, et que quand j'ai eu le problème à l'origine c'était juste après une mise à jour Jeedom/Abeille et lui je ne l'avais pas utilisé.

Mais il y a bien quelque chose qui met la Zigate en carafe, et ça doit corrompre un endroit de la mémoire que je ne récupère qu'après un flash du firmware avec effacement du PDM. Après pour savoir ce qu'il se passe exactement je sèche.

Il me reste à tester une nouvelle fois à partir de la Zigate vierge et ne pas toucher à l'outil de flash et voir si ça tient dans ce cas là.

tcharp38 commented 1 year ago

Ok, assez en ligne avec toi cote corruption. L'erreur 06 c'est du jamais vu. Donc zigate vierge ET erase EEPROM (ou erase PDM) + 1 inclusion et du me dis comment ca se comporte ?

ValFaure commented 1 year ago

Voilà, je viens de me remotiver à faire une nouvelle inclusion de tous les équipements. Heureusement j'en ai pas une centaine ! Donc à l'instant T tout fonctionne. Je vais rien faire de plus ce soir, laisser tourner 24h, et voir ce que ça donne.

Par contre je viens de voir en passant sur la page de la Ruche/Zigate, que le canal qui a été mis par défaut est le 15. Pas un souci pour moi mais je me rappelle qu'avant il y avait un champ avec un masque en hexa pour forcer un canal et maintenant c'est une liste déroulante, mais c'est moins clair sur comment tu valides le changement de canal en manuel.

tcharp38 commented 1 year ago

Moins clair ? Il faut que je revois la doc alors. Tu choisis le canal si par auto, et tu redémarres Abeille. Ça devrait suffire

ValFaure commented 1 year ago

Oui par moins clair je voulais dire qu'on ne sait plus trop si le changement de canal est pris en compte. Avant il y avait un masque hexa à remplir et un bouton au bout de la ligne pour valider. Maintenant la liste déroulante est plus pratique pour chosir un canal mais une fois validé ça revient sur Auto et on ne sait pas si ça a été pris en compte, on ne sait pas non plus forcément que le changement ne sera valable qu'après un redémarrage de la Zigate (peut-être une info bulle pour ça). Quand à la doc elle parle encore de masque hexa pour le changement de canal sur certaines pages (d'ailleurs on tombe encore sur une ancienne doc Abeille via recherche Google).

Bon sinon je viens de faire la mise à jour vers 20221114-BETA-2 et j'ai à nouveau perdu toute la communication avec mes équipements alors que tout fonctionnait nickel depuis la dernière inclusion. Je ne sais vraiment plus quoi penser. Avant je n'avais aucun souci lors des updates et je ne vois pas ce qui a pu changer. Par ailleurs je ne sais pas si cette mise-à-jour incluait le fix pour se passer de rc.local mais en tout cas ma Zigate ne s'est pas mise en production toute seule au reboot de Jeedom.

Je te joins un nouveau package de logs au cas où.

AbeilleLogs-221118 (1).tar.gz

tcharp38 commented 1 year ago

Ok pour ton retour sur le changement de canal. Tu as raison. A revoir.

Le fix 'rc.local' n'est toujours pas poussé. Donc la tu as fait quoi exactement ? Reflash + erase PDM + inclusion ? Combien d equipements reinclus ?

tcharp38 commented 1 year ago

@ValFaure Tu en es ou de tes déboires ?

ValFaure commented 1 year ago

Alors, pas eu le temps de me repencher dessus ce week-end, je vais pouvoir m'y remettre ce soir. Il faut que je me fasse une procédure de test pour essayer d'isoler le problème. Je vais tenter avec seulement 1 ou 2 équipements d'inclus et essayer de trouver à quel moment exactement je perds la com.

Sur mon dernier message où tout avait fonctionné j'avais pu tout réinclure en partant comme les autres fois d'un reset total (flash firmware + erase PDM). Et ça avait pas bougé jusqu'à ce que je lance la maj Abeille. Mais comme la fois d'avant ça avait sauté avec l'outil de flash et pas de maj Abeille, le seul lien qui me reste théoriquement c'est un problème matériel sur la Zigate.

Mais j'ai aussi changé la Zigate a un moment donné donc ça me laisse penser que ça peut aussi être un problème avec le Pi. Ou alors un soucis Jeedom ? Il me reste donc a essayer ces deux cas de figure : test avec un autre Pi (j'en ai un autre sous la main), test avec Jeedom tout juste installé. Bref encore pas mal de troubleshooting à faire... En tout cas on s'éloigne d'un problème purement Abeille car je n'aurait pas été le seul à avoir ce problème je pense depuis tous ces derniers jours. Je viens de faire l'update vers la 20221119-BETA-2. Je pars de là et on va bien voir.

PS : j'ai aussi remarqué que lorsque tout va bien la page objet d'un équipement depuis Abeille dans Jeedom charge instantanément, alors que ça met 3 à 5 secondes quand pas de com avec l'équipement. C'est peut-être juste lié au fait que l'équipement soit en timeout ?

tcharp38 commented 1 year ago

En ligne avec toi. Test sur un seul équipement facile d'accès à proximité de la zigate. Et tu ne fais que des étapes simples que si tout est bon in moment

ValFaure commented 1 year ago

Bon déjà un premier progrès. J'ai fini par trouver une méthode reproductible qui me permet de restaurer la Zigate. Ça ne me dit pas d'où peut venir le problème mais au moins en cas de corruption de la mémoire de la Zigate j'ai un moyen de refaire fonctionner les équipements sans tout réinclure. Je suis parti d'une autre commande trouvée sur le site Zigate.fr pour faire une sauvegarde (et une restauration) du PDM uniquement.

Voici donc ce qui fonctionne :

  1. Inclusion d'une seule ampoule pour les tests (sur canal 11)
  2. Arrêt du démon Abeille.
  3. Sauvegarde du PDM avec la commande ./DK6Programmer -s /dev/ttyAMA0 -P 115200 -d FLASH:@0x96000=NVM_dump.bin
  4. Effacement complet de la Zigate avec la commande ./DK6Programmer -s /dev/ttyAMA0 -P 115200 -e FLASH -Y -p ZiGatev2-321.bin
  5. Redémarrage du démon Abeille : Zigate se met par défaut sur le canal 25.
  6. Passage de la Zigate sur canal 11 (sélection dans la liste déroulante, utilisation du nouveau bouton "Appliquer" de la dernière Beta, appui sur bouton "Reset SW"). Le changement de canal fonctionne bien. Confirmation du non-fonctionnement de l'ampoule (plus de PDM).
  7. Nouvel arrêt du démon Abeille.
  8. Injection dans la Zigate de la sauvegarde du PDM avec la commande ./DK6Programmer -s /dev/ttyAMA0 -P 115200 -Y -p FLASH:@0x96000=[_nom du fichier de dump_].bin
  9. Redémarrage du démon Abeille : le canal reste bien sur 11. Par contre pas de réaction de l'ampoule avant 3 redémarrages supplémentaires du démon à la suite (j'ai essayé avec un seul redémarrage et en attendant 5 mn mais ça n'a pas fonctionné).

J'ai pu reproduire ce fonctionnement trois fois de suite (avec bizarrement à chaque fois les trois redémarrages du démon à la suite à la fin qui ont été nécessaires avant de retrouver une action sur l'ampoule). Pas de redémarrage de Jeedom pendant toutes ces séquences.

Il me reste a essayer de tomber sur une nouvelle perte de communication et espérer trouver une piste de cause à effet. Au moins je serai plus serein sachant que je peux restaurer le PDM de la Zigate. J'ai déjà essayé de faire quelques manipulations : reboot Jeedom, plusieurs reboots du démon Abeille, sauvegarde Jeedom + désinstallation/réinstallation Abeille + rechargement de la sauvegarde. Et pour l'instant ça tient. Je vais continuer avec de nouvelles inclusions. Je précise aussi que j'ai désactivé les scénarios dans Jeedom le temps de faire toutes les manips.

Je te joins à nouveau un package de logs pris lors des actions 2 à 10. On sait jamais. AbeilleLogs-221121.tar.gz

tcharp38 commented 1 year ago

La premiere remarque qui me vient à l'esprit et que je viens d'apprendre c'est que certains equipements restent sur le canal sur lequel ils ont ete appairés. Donc si inclusion sur 25.. il ne fonctionnera plus sur un autre.

Le canal 25 est surement le choix de la zigate (mode auto) dans ton environnement.

Pour l'instant dans tes logs pas d'erreur 06 qui revient.

ValFaure commented 1 year ago

Eh bah ça aura pas duré longtemps... Ce qui fonctionnait pour l'ampoule seule n'a pas été reproductible. J'ai pu à nouveau refaire une inclusion de tous les équipements, tout tester OK, et bien sûr j'ai voulu faire une sauvegarde du PDM... Et c'est là que ça s'est de nouveau arrêté de fonctionner. Et impossible de restaurer le PDM comme précédemment. Donc il y a quelque chose qui change mais quoi ? Est-ce que ça peut venir du fait de rajouter des groupes sur les équipements par la suite (groupes que je rajoute aussi dans la Zigate) ? Faut que je trouve des tests plus poussés à faire sur un seul équipement. Et en essayer des différents (interrupteur ou prise).

Pour l'inclusion j'ai tout fait sur le canal 11. Et tous les équipements ont fonctionné. Mais en effet si je m'amuse à changer de canal entre deux inclusions, ceux qui ont été enregistrés sur le premier canal ne répondront plus sur le deuxième.

tcharp38 commented 1 year ago

On dirait que c'est ton etape de sauvegarde qui fout tout en l'air.

On a vraiment besoin de voir à partir de quel "evenement" les erreurs 06 apparaissent mais si tu as refait toutes les inclusions j'ai bien peur que ca fasse beaucoup d'infos à la fois. Il faut donc que tu suives le log "AbeilleParser" pour essayer de voir quel evenement met la pagaille. En ligne avec ca ?

ValFaure commented 1 year ago

Ok je vais surveiller le parser en ré-essayant de provoquer la perte de com avec un seul objet inclus. Ce qui m'intrigue c'est que j'ai pu faire la sauvegarde et restauration du PDM trois fois de suite hier sans problème tant que je n'avais que l'ampoule. Mais une fois tout ré-inclus, là ça a foiré. Faut que je trouve le moment où ça bascule.

ValFaure commented 1 year ago

Ca y est j'ai trouvé ce qui fout la merde ! C'est quand la Zigate est associée à des groupes. J'ai retiré tous ses groupes et j'ai instantanément retrouvé le contrôle sur des équipements. Ils sont pratiquement tous sortis de TimeOut en quelques minutes (à part quelques intérrupteurs IKEA que j'ai dû réinclure). Plus d'erreurs 06 dans le parser non plus là où avant j'avais 3-4 itérations après un appui sur une commande et rien qui se passait.

Bon faudrait juste comprendre pourquoi ça fait ça. Parce que là en l'état la Zigate ne traite aucun appui sur un bouton pour déclencher un scénario du fait qu'elle ne fait plus partie d'aucun groupe. Dans mon setup elle est sensée appartenir à 5 groupes différents. Faudrait que je teste si ça le fait dès un seul groupe ou pas. Du coup ça te fait penser à un problème connu ?

tcharp38 commented 1 year ago

Super !! Non aucun probleme connu en ce qui me concerne.

Peux tu du coup ajouter 1 groupe à la fois (je suppose sur un equipement en particulier) surveiller le parser à chaque fois et des que ca merde mettre les logs de cote.

Si on arrive à extraire + precisement, je transfere à Zigate. Mais bravo !!

tcharp38 commented 1 year ago

En fait j'ai besoin de + de details sur ton histoire de groupes. Tu ajoutes donc des groupes à la zigate, mais combien ? Parce que du coup je dois pouvoir reproduire qqch. Les groupes cote Zigate je fais jamais.

ValFaure commented 1 year ago

Alors j'ai entre 5 et 6 groupes que je mets sur la Zigate (c'est justement pour ça que j'étais passé à la V2 car la Zigate V1 était limitée à 5).

Sur les derniers tests je m'étais limité à 5 groupes (en gros un groupe correspond à une pièce de mon logement et est en relation avec les interrupteurs et les ampoules présents dans chaque pièce.

Exemple avec la chambre : 1 interrupteur sur la table de chevet, 1 à l'entrée, et une ampoule. Tous sont dans le groupe 0032 (ajout fait après inclusion grâce au bonton "Add group" de la page du plugin. Déjà ça me permet d'avoir un fonctionnement autonome. Si jamais jeedom est arrêté je peux toujiurs commander la lumière. Ensuite j'ajoute le groupe à la Zigate (toujours avec le même bouton "Add group"), ce qui me permet de récupérer l'évent de l'appui sur un des interrupteurs (Click Middle) et pouvoir déclencher mes scénarios en lien avec cet appui.

Tout cela a toujours très bien fonctionné jusqu'a ces derniers jours (d'où premier post). De là à savoir ce qui a pu causer le souci à l'origine... Est-ce que ça peut être dû au fait que mes groupes commencent par des 0 ?

tcharp38 commented 1 year ago

Donc tu penses que c'est le fait de mettre 6 groupes qui provoque la pagaille.

Peux tu me filer le package de logs juste à ce moment ? (ex 5 groupes ok, ajoute le 6iem, ca merde => logs)

ValFaure commented 1 year ago

Non je pense pas, car sur les derniers tests je n'avais que 5 groupes.

Je n'ai pas l'occasion de tester tout de suite mais je tenterai de rajouter des groupes 1 à 1 et voir à quel moment je retrouve des erreurs 06 dans les logs. Après même quand j'ai eu 6 groupes, tout fonctionnait bien tant que je laissais la Zigate tranquille (pas de sauvegarde du PDM ou de mise à jour d'Abeille)

tcharp38 commented 1 year ago

Comme tu semblais dire qu'il y avait un lien avec les groupes je vais faire qq essais de mon côté.

ValFaure commented 1 year ago

Ok. Donc il y a bien un lien avec les groupes. J'ai fait plusieurs tests, je perds bien la com dès que j'atteins 5 groupes dans la Zigate. J'ai fait les tests suivants :

  1. Dump PDM avec 0 groupe + reset Zigate + restauration du PDM -> OK
  2. Dump PDM avec 1 groupe + reset Zigate + restauration du PDM -> OK
  3. Dump PDM avec 5 groupes -> apparitions des erreurs 06 dans les logs et perte de la com, sans même le reset de la Zigate (le PDM a juste été lu, aucune écriture sur la mémoire de la Zigate théoriquement).

Dans le cas 3 je retrouve la communication dès que je retire un groupe à la Zigate et que je redémarre le démon. J'ai essayé avec deux numéros de groupes différents en cinquième ajout (0042 ou 0052), pour être sûr que ça ne venait pas d'un groupe en particulier, et le problème est bien le même.

Je te joins 3 paquets de logs correspondants aux 3 points cités. Dans chaque j'ai fait plusieurs appuis sur mon interrupteur qui est dans le groupe 0022 et qui me déclenche un scénario. Ca fonctionne bien dans les cas 1 et 2, pas dans le cas 3 du coup. Le troisième package est le plus conséquent il y a plusieurs ajouts et retraits de groupe dans la Zigate et redémarrage du démon. En espérant que ça puisse t'être utile.

Au moins j'ai maintenant un moyen simple de faire repartir mes équipements (remettre seulement 4 groupes dans la Zigate et reboot du démon). D'ailleurs je peux ensuite rajouter le cinquième groupe et ça continue à fonctionner.

AbeilleLogs-221123_reset+restorePDMsansgroupe.tar.gz AbeilleLogs-221123_reset+restorePDM_1groupe(0022).tar.gz AbeilleLogs-221123_dumpPDM_5groupes.tar.gz

tcharp38 commented 1 year ago

Corrige moi si je me trompe mais les 5 groupes n'expliquent pas tout. Si tu ne fais pas de dump, tu n'as pas de soucis n'est ce pas ? J'ai fait des essais sur ma v1 jusqu'a 5 groupes et rien vu. Mais peut etre que la v2 a une faille.

En regardant le dernier log "AbeilleLogs-221123_dumpPDM_5groupes" je vois des trucs etranges mais je pige pas ce qui s'est passé entre.. par contre toi tu peux regarder en meme temps que tes manips. Le message 8062 donne la liste des groupes et c'est tres bizarre.

On voit des choses comme 1 seul groupe au debut

[2022-11-23 16:37:04] Abeille1, Type=8062/Group membership, SQN=60, EP=0B, ClustId=0004, Capacity=18, GroupCount=01, Addr=0D74 [2022-11-23 16:37:04] Groups: 0052

ou

[2022-11-23 16:35:47] Abeille1, Type=8062/Group membership, SQN=4A, EP=0B, ClustId=0004, Capacity=18, GroupCount=01, Addr=3410 [2022-11-23 16:35:47] Groups: 0012

mais vers la fin du log il y a 16 groupes (10 en hexa)

[2022-11-23 17:20:07] Abeille1, Type=8062/Group membership, SQN=00, EP=01, ClustId=0004, Capacity=10, GroupCount=10, Addr=0000 [2022-11-23 17:20:07] Groups: 0022/0032/0012/0052/0000/0000/0000/0000/0000/0000/0000/0000/0000/0000/0000/0000

Ca me semble débile

ValFaure commented 1 year ago

Oui difficile de savoir ce qui ne va pas exactement. Je te confirme que la Zigate peut fonctionner avec les 5 groupes sans problème tant qu'il ne semble pas y avoir un accès particulier (mais lequel ?) et que j'ai pu pour l'instant constaté soit lors d'un dump, soit lors d'une mise à jour Abeille.

Les messages que tu cites correspondent à mon avis à quand j'ai fait l'ajout du groupe quand il n'y en a qu'un de listé (il semble indiquer "Groupcount : 01" pour signifier le total de groupe qui vient d'être ajouté). Et le message avec les 16 groupes correspondrait plutôt à quand j'ai fait un "Get group" depuis la page Abeille une fois les groupes ajoutés, et dans ce cas il ne ferait que lister les 16 emplacements de groupe dispos sur la Zigate V2 (5 sur la V1), et 0000 correspond à un emplacement vide. Après j'ai pas vraiment d'expertise dans le déchiffrage des messages des logs malheureusement.

tcharp38 commented 1 year ago

Ce retour de "groupcount" n'est pas coherent. Et je crois que le groupe 0000 n'est pas interdit donc ca peut pas etre plusieurs fois le 0000. Mais j'avoue ne pas savoir encore quoi reporter à Zigate.

tcharp38 commented 1 year ago

Salut @ValFaure Des news ? Est ce que si tu dump ni restore tout fonctionne correctement ?

tcharp38 commented 1 year ago

Salut @ValFaure Des news ? Est ce que si tu dump ni restore tout fonctionne correctement ?

ValFaure commented 1 year ago

Salut. Alors je n'ai pas retouché à la programmation de la Zigate et tout a fonctionné sans problème. Par contre il y a quelques jours, mise à jour de Jeedom et donc reboot : de nouveau perdu la communication. J'ai donc fait un "Remove group" sur la Zigate pour redescendre à 4 et c'est reparti. J'ai pu repasser à 6 groupes ensuite sans problème et ça fonctionne bien depuis. Pas plus d'info sur le pourquoi du comment mais au moins j'ai une solution fonctionnelle et reproductible.