L’utilizzo dell’AIOps per il monitoring, cioè dell’Artificial Intelligence for IT Operations al servizio del monitoraggio di infrastruttura, applicazioni e reti, rappresenta oggi la nuova frontiera dell’automazione. Secondo la definizione di Gartner, “l’AIOps combina big data e machine learning per automatizzare i processi di IT Operations, compresa la correlazione degli eventi, il rilevamento delle anomalie e la determinazione della causalità”.
Se questa è diventata ormai un’esigenza di qualsiasi ambiente IT per ciascuna industry, lo è ancor di più per il mondo telco. La complessità del monitoraggio a cui devono far fronte le telco, infatti, è causata dalla continua evoluzione verso paradigmi software-defined, controlled network e, ovviamente, nuovi scenari dettati dal 5G. Ognuno di questi ambienti è in continuo movimento e tende a spostarsi verso architetture cloud-native che possono funzionare su reti pubbliche, private e ibride. Ecco perché l’AIOps può rappresentare la migliore risposta per il monitoring delle telco.
AIOps nel monitoring, l’importanza del real time
Nella ricerca di soluzioni e pratiche funzionali a monitorare una quantità di dati e informazioni sempre più grande, l’industria delle telecomunicazioni si sta orientando verso sistemi di intelligenza artificiale e algoritmi di machine learning in grado di elaborare e analizzare sia il traffico dei clienti sia quello proveniente dalle infrastrutture di rete. Con l’avvertenza, come ricordato sopra, che oltre alle reti tradizionali, il monitoring deve focalizzarsi anche sulle nuove infrastrutture di rete virtualizzate. Il tutto, poi, deve confluire in una visione d’insieme unificata, approfondita, scalabile e che dia risultati in tempo reale.
Basti pensare che il metodo consueto di data acquisition & sifting, cioè di acquisizione e “setacciamento” dei dati, non genera quel fenomeno che oggi va sotto il nome di “data swamps”, ovvero “paludi di dati” in attesa di essere analizzati. Il rischio sarebbe infatti un duplice danno alle telco: rende tardiva la risoluzione dei problemi e comporta costi di storage sempre più insostenibili.
I benefici della closed-loop automation per le telco
L’AIOps nel monitoring conferisce agli operatori telefonici quella velocità di elaborazione che occorre per rilevare un potenziale grave guasto o il rischio di un devastante attacco DDoS (distributed denial-of-service), offrendo un protocollo di rilevamento e di mitigazione tempestivi. Non solo, ma fornisce quel set di intelligent responses che non si limitano a identificare gli eventi minacciosi, ma a porre rimedio prima che abbiano conseguenze sul servizio e sulla user experience.
A questo proposito, una delle caratteristiche più significative dell’AIOps associato al monitoring è la cosiddetta closed-loop automation, vale a dire la capacità di valutare continuamente le condizioni della rete in real time, le richieste di traffico e la disponibilità delle risorse per determinare il miglior posizionamento del traffico allo scopo di definire automaticamente qualità del servizio e utilizzo delle risorse ottimali. La closed-loop automation è una pratica particolarmente apprezzata dalle aziende telco perché riduce la necessità di interventi manuali nei processi operativi chiave e garantisce standard di servizio sempre elevati.
Il perché di una soluzione “agnostica” nell’AIOps monitoring
Un’ultima considerazione riguardo all’AIOps per il monitoring di cui le telco devono tenere conto, proprio per la difficoltà di dover trattare con un volume sempre crescente di dati in formati strutturati e non strutturati provenienti da una varietà di fonti eterogenee, è l’importanza del carattere “agnostico” della soluzione. Ciò significa che, sebbene esistano dei vendor a livello globale con verticalizzazioni in diversi settori economici, compreso quello delle telco, è opportuno l’affiancamento di un system integrator che non solo aiuti l’organizzazione nella scelta della piattaforma AIOps più idonea, ma anche nell’implementazione operativa del modello di monitoraggio.
L’approccio nel monitoring, in definitiva, dovrebbe culminare idealmente in una piattaforma/servizio altamente performante e resiliente con cui riuscire, all’interno del carico di migliaia di dati e a fronte di numerosi eventi, a trovare la root cause in maniera rapida e accurata. Solo così è possibile pervenire alla soluzione in anticipo sulla possibile insorgenza di qualsiasi disservizio.