Monitoring System Based on Telemetry in Network CESNET3

Monitorovací systém založený na telemetrii v síti CESNET3

Supervisors

Editors

Other contributors

Journal Title

Journal ISSN

Volume Title

Publisher

České vysoké učení technické v Praze
Czech Technical University in Prague

Research Projects

Organizational Units

Journal Issue

Abstract

Cílem této práce je návrh a nasazení monitorovacího systému založeného na technolgii Model-Driven telemetrie. Tato technologie je poměrně nová, kdy RFC 9232, které ji částečně popisuje bylo vydáno teprve v květnu 2022. Tato prace navazuje na moji bakalářskou práci, ve které jsem zkoumal telemetrii a její možné nasazení do budoucna. Navržený monitorovací systém bude mít za úkol sběr stavových dat ze síťových zažízení provozovaných sdružením CESNET. Sbírané informace budou primárně ohledně stavu zařízení samotných a jejích síťových rozhraní. Systém se sestává z několika částí. Tyto části jsou kolektory pro sběr dat, časová databáze pro uložení dat, visualizační nástroje pro zobrazení statistik v přívětivé formě a správa celého systému. Kolektory jsou nasazeny pomocí softwaru Telegraf jako kontejnery v systému Docker. Časová databáze je použita InfluxDB. Pro vizualizaci jsou použity nástroje Nagios a Grafana. Celá správa systému je udělána pomocí nástoje Ansible. Výsledkem práce je monitorovací systém, který slouží pro dohled sítě ve sdružení CESNET. Práce může sloužit jako inspirace pro ostatní poskytovatele síťových služeb.

The thesis focuses on designing and deploying a monitoring system based on Model-Driven Telemetry technology. This technology is relatively recent. The RFC 9232, partly describing it, was released in May 2022. The thesis is the continuation of my bachelor thesis, in which I have researched MDT and its possible usage in the future. The goal of the system is to monitor operational state data from network devices managed by CESNET. Primary information is data concerning the condition of the devices and statistics about their network interfaces. The system consists of several parts to be able to fulfill requirements. The parts are: collectors for assembling data, a time-series database for storing them, visualization tools for displaying the data in a user-friendly way and, finally, management of the whole system. The colletors are deployed Telegraf container instances in Docker, InfluxDB is used as a time-series database, Grafana and Nagios are used as visualization tools, and Ansible is used for the management of all the systems. The result of this work is a system that serves as monitoring of the CESNET network. The thesis could serve as inspiration for other service providers that are considering deploying similar monitoring system.

Description

Citation

Endorsement

Review

Supplemented By

Referenced By