Netdata es una utilidad de Linux extremadamente optimizada que proporciona monitoreo de rendimiento en tiempo real (por segundo) para sistemas Linux , aplicaciones, dispositivos SNMP, etc. y muestra gráficos interactivos completos que representan absolutamente todos los valores recopilados en el navegador web para analizarlos.
¡Netdata es sencillo ! Comparado con otros , es increíblemente fácil de configurar . No requiere casi ninguna configuración y da una interfaz de trabajo con muchas estadísticas de forma predeterminada.
Y a diferencia de las otras soluciones que hemos comprobado, Netdata brinda monitoreo por segundo en tiempo real Puede ver la actualización del CPU / memoria en tiempo real.
Netdata también proporciona alertas . Instala una tonelada de alertas por defecto.
Por defecto, Netdata almacena estadísticas recopiladas en el mismo servidor.Esto es muy conveniente si está empezando. También se puede configurar para enviar estadísticas a un servidor central .
Problemas de Netdata
Netdata tiene tres grandes problemas:
Historia limitada.
Sin garantía por defecto.
No hay agregación de estadísticas en varios servidores.
El enfoque de Netdata en el monitoreo por segundo en tiempo real también es su mayor defecto: es bueno para rastrear estadísticas de las últimas horas solamente. El propósito de Netdata es permitirle evitar las herramientas CLI para diagnosticar una interrupción. Pero si quieres analizar un incidente histórico, entonces Netdata no es tan bueno en eso.
El motivo de esto es que Netdata no admite la reducción de la resolución de datos de estadísticas más antiguos. Puede configurar el historial de Netdata a un tamaño arbitrario, pero su resolución siempre será por segundo. A pesar del eficiente formato de base de datos de series de tiempo de memoria de Netdata, almacenar datos por segundo durante, por ejemplo, dos meses, requiere una gran cantidad de memoria.
Dicho esto, Netdata puede configurarse para enviar sus datos a Prometheus .No es ideal pero existe la opción.
El autor de Netdata afirma que los datos que expone, las estadísticas del sistema, no son datos confidenciales. El autor también afirma que el panel de Netdata es de solo lectura. Por lo tanto, no es necesario desautorizar el acceso al panel de Netdata por parte de partes no autorizadas. No compramos esto…
Por un lado, Netdata contiene un servidor HTTP incorporado. El análisis de encabezados HTTP es una fuente notoria de vulnerabilidades de seguridad, y los servidores probados en la batalla como Apache, Nginx y Node.js necesitaron muchos intentos para hacerlo bien. Netdata cuenta con un servidor HTTP y un analizador personalizados, pero el autor está muy seguro de su seguridad . El autor es un tipo inteligente, pero un error, especialmente en C, se comete fácilmente. Cuando se trata de seguridad, debemos errar por el lado de la precaución.
Finalmente, no estamos tan seguros de que las estadísticas del sistema no puedan ser abusadas. Aunque a primera vista no podemos imaginar cómo, la historia de los ataques de canal lateral han enseñado que muchas de las vulnerabilidades utilizan mecanismos no obvios. Specter y Meltdown son los ejemplos más destacados.
Hay maneras de organizar la seguridad a ti mismo. El panel de Netdata es HTTP simple, así que lo coloco detrás de un proxy inverso Nginx con SSL. El mecanismo de replicación de Netdata, el mecanismo que envía las estadísticas a un servidor central, no es HTTP y, por lo tanto, no se puede poner detrás de Nginx.
Sin embargo hay un problema final. El mecanismo de replicación y el tablero de Netdata se encuentran en el mismo puerto. Eso significa que un servidor esclavo de Netdata puede acceder a todas las estadísticas almacenadas en el servidor maestro de Netdata, a través del canal a través del cual normalmente envía sus propios datos de estadísticas.
Netdata separa sus estadísticas por servidor. No hay manera de, por ejemplo, mostrar el uso de la CPU de varios servidores dentro de un solo gráfico. Esto es aceptable si tiene una pequeña cantidad de servidores, pero si desea tener un panel para monitorear 100 servidores simultáneamente, entonces esto es problemático.