alastria / alastria-node

How to install a node in Alastria Red-T (Quorum technology) and tips to deploy and use it
https://alastria.io/
Apache License 2.0
81 stars 299 forks source link

Problema con el funcionamiento de nodo regular #312

Closed ghost closed 5 years ago

ghost commented 6 years ago

El nodo en cuestión funcionaba correctamente desde que se creó. En los últimos días su funcionamiento no ha sido el esperado ya que lo arrancamos y funciona con normalidad al principio pero llega un momento en que el proceso geth empieza consumir recursos de CPU y memoria hasta que consume toda la memoria y se para el proceso.

Hemos intentado cambiar el ulimit en la máquina y el problema de memoria continua.

topn

quorum.log

Gracias de antemano.

netmanito commented 6 years ago

Buenos días, Podrías rellenar la información requerida en la plantilla de incidencias? La adjunto a continuación. Gracias

System information

Network: Arrakis | ….

Node type: `Validator | Regular | BootNode’

Node name: VAL_Alastria_TestNet_2_8_00

Geth version: geth version

OS & Version: Windows/Linux/OSX

Expected behavior

Behavior obtained

Steps to reproduce the error

Backtrace

[backtrace]
ghost commented 6 years ago

System information Network: Arrakis | …. Node type: Regular Node name: REG_Tribalyte_TestNet_2_4_00 Geth version: 1.7.2-stable-94e1e31e OS & Version: Ubuntu 16.04.4 LTS Expected behavior Correcto funcionamiento del nodo. Behavior obtained Caída del nodo pasado un tiempo debido al consumo de memoria y CPU Steps to reproduce the error Se inicia el nodo con $ sudo ./start.sh Pasado un tiempo el nodo cae. Backtrace [backtrace]

xvilapueyo commented 5 years ago

Hola,

A nosotros nos está ocurriendo lo mismo, aquí la info del sistema:

System information Node type: Regular Node name: REG_ValidatedID_TestNet_2_16_00 OS & Version: Ubuntu 16.04.5 LTS (GNU/Linux 4.15.0-1025-azure x86_64) Geth version:

Version: 1.7.2-stable Git Commit: 94e1e31eb6a97e08dff4e44a8695dab1252ca3bc Quorum Version: 2.0.2-Alastria Architecture: amd64 Network Id: 1 Go Version: go1.9.5 Operating System: linux

El log de quorum: quorum_20181109222201.log

marcosio commented 5 years ago

@rdemera , @xvilapueyo hemos publicado una nueva versión del cliente Quorum y para verificar que todo va como debe ¿Sería posible que la actualizarais con el binario de esta release https://github.com/alastria/quorum/releases/tag/v2.0.2.2.Alastria_EthNetstats_IBFT?

xvilapueyo commented 5 years ago

Ahora lo probamos @marcosio .

Para ello es necesario ejecutar de nuevo el scripts/bootstrap.sh del último commit del repo alastria-node, ¿es así?

marcosio commented 5 years ago

En realidad no es necesario, si queréis descargar con wget o curl el binario que se ha incluido en la release desde el nodo y sustituirlo en /usr/local/bin.

ghost commented 5 years ago

Nos sigue sin funcionar correctamente. El proceso que hemos seguido ha sido el siguiente: Reiniciamos la máquina virtual, y restauramos el nodo a partir de las keys que teníamos guardadas. $ git clone https://github.com/alastria/alastria-node $ ./bootstrap.sh $ ./init.sh backup general REG_Tribalyte_TestNet_2_4_00 $ ./update.sh Nos sigue dando el error de fatal error: runtime: out of memory. Adjunto el log. quorum_20181114114624.log

Así que lo intento con el binario de la release, lo sustituyó en /usr/local/bin (le doy permisos de ejecución chmod +x) . Inicio otra vez el nodo con: $ ./start.sh También me da error runtime: out of memory quorum_20181114120959.log

Siempre que empieza el proceso de geth el uso de recursos (memoria y cpu) es exagerado en comparación con una ejecución normal. La memoria solo crece.

xvilapueyo commented 5 years ago

A nosotros sí que nos ha solucionado el comportamiento. Hemos copiado el geth y de momento lleva 24h estable.

En nuestro caso la máquina tiene 16Gb de RAM.

marcosio commented 5 years ago

@rdemera, parece que el nodo está activo en la red, ¿Puedes verificar que el nodo es estable en este momento?

IvanSaizIOB commented 5 years ago

Hola @rdemera alguna novedad respecto a esta issue? ¿Puedes indicarnos el estado actual del nodo? Gracias

ghost commented 5 years ago

Hola @IvanSaizIOB , hemos intentado resolver el problema por muchas maneras pero sigue sin funcionar (actualizando con el nuevo binario, tirando el nodo y volver a levantarlo). No sigue dando el mismo error de memoria.

JuanLuisGozaloFdez commented 5 years ago

Al ser este un issue relacionado con Arrakis, damos por cerrado este incidente. Por favor, si alguien tiene una incidencia con la Red Telsius de este tipo de incidencia, por favor, indicadlo en un nuevo ticket.