Nelle reti telco di grandi dimensioni, le anomalie possono propagarsi rapidamente e causare disservizi diffusi. Grazie a un sistema basato su Machine Learning e modelli a grafo, questo gruppo telco è riuscito a individuare i problemi nelle primissime fasi, intervenendo prima che impattassero sugli utenti finali.

Il cliente è un importante gruppo di telecomunicazioni italiano e internazionale che gestisce una rete ampia e complessa, a supporto di milioni di utenti e servizi critici.

Garantire la continuità del servizio in una rete articolata e altamente interconnessa rappresentava una sfida crescente.

In particolare:

  • Le anomalie erano difficili da individuare nelle fasi iniziali
  • L’impatto e la propagazione dei problemi erano complessi da prevedere
  • Era necessario analizzare grandi volumi di dati eterogenei quasi in tempo reale
  • Gli interventi avvenivano spesso in modo reattivo, dopo l’insorgere dei disservizi

Ridurre i tempi di rilevazione era fondamentale per migliorare l’affidabilità del servizio.

La soluzione si basa su Machine Learning e modelli a grafo per l’analisi del comportamento della rete.

Gli algoritmi di Machine Learning sono addestrati per riconoscere le prime manifestazioni delle anomalie, mentre la rappresentazione a grafo consente di comprendere relazioni, dipendenze e potenziali effetti di propagazione.

Le visualizzazioni live basate su grafi permettono agli esperti di dominio di:

  • Analizzare le anomalie nel loro contesto
  • Integrare la conoscenza operativa
  • Velocizzare il processo decisionale

Il sistema è compatibile con lo stack tecnologico esistente.

BitBang ha progettato e implementato una piattaforma su misura in grado di:

  • Analizzare continuamente i dati di rete in quasi tempo reale
  • Individuare anomalie sin dalle fasi iniziali
  • Modellare la rete come un grafo per valutare impatti e propagazioni
  • Integrare le competenze umane tramite strumenti visuali interattivi

I team operativi ricevono alert tempestivi corredati dalle informazioni necessarie per intervenire rapidamente.

Il sistema ha generato benefici concreti:

  • Le anomalie vengono identificate prima che causino disservizi agli utenti
  • I team operativi possono intervenire con maggiore tempestività
  • I guasti su larga scala vengono spesso evitati
  • Almeno 300.000 utenti ogni anno non subiscono interruzioni del servizio

L’affidabilità complessiva della rete e la customer experience sono migliorate sensibilmente.