Monitoraggio e statistiche Indice SBN

Per garantire la correttezza e la qualità dei dati dell’Indice, catalogo collettivo alimentato con funzioni di catalogazione partecipata on-line e con riversamenti batch, è stato necessario prevedere regolari attività di monitoraggio e di manutenzione; si è pertanto ritenuto indispensabile dotarlo di strumenti finalizzati alla rilevazione delle attività svolte dai Poli e al controllo sulla qualità e quantità dei dati che vi risiedono. A tale scopo sono state sviluppate funzioni di governo e monitoraggio delle prestazioni del sistema, dell'incremento della base dati, nonché strumenti di intercettazione dei duplicati e di eventuali squadrature, mediante produzione di report statistici. Attualmente l’Indice raccoglie in un’unica base dati integrata record relativi al Libro Antico, Libro Moderno, alla ex base dati Musica (Musica a stampa e Manoscritti musicali) ed è predisposto per gestire altro tipo di materiale quale la cartografia e la grafica.

Le statistiche sull’Indice SBN vengono lanciate utilizzando un’interfaccia appositamente costituita, interrogabile sul Web; quasi tutte le statistiche presenti permettono di utilizzare filtri, anche in combinazione, che variano in relazione al tipo di statistica. A fronte di una richiesta, il sistema produce due file, uno in formato PDF e l’altro in XML leggibile anche mediante il prodotto Excel.
Le statistiche presenti sono divise in cinque tipologie:

  • Statistiche sui dati, suddivise in frequenze ed elenchi. Le prime individuano la consistenza della base dati: quantità di titoli, autori, soggetti, classi, localizzazioni, etc. presenti nell’Indice SBN e selezionabili per tipologia di materiale; gli elenchi permettono l’estrazione di liste di autori, simboli di classificazione e titoli riferiti a materiale librario, musicale, grafico, cartografico, selezionabili mediante canali specifici
  • Statistiche sulle attività dei Poli che riguardano sia le catalogazioni complessive (catture, creazioni, correzioni differenziate per anno, etc.) divise per Polo, sia le catalogazioni di un Polo, divise per biblioteca; anche in queste statistiche è ammessa la selezione sulla tipologia di materiale. Sono inoltre previste statistiche sulle attività di catalogazione semantica in Indice (creazioni e catture di soggetti e classi)
  • Statistiche sulle prestazioni del sistema relativamente ai tempi medi di risposta delle transazioni, con l’individuazione di quelle più problematiche
  • Statistiche sulle duplicazioni, intese a rilevare, attraverso una serie di algoritmi, eventuali duplicazioni presenti nell’archivio autori e nell’archivio titoli dell’Indice SBN
  • Statistiche sulle squadrature, intese a rilevare, sempre mediante una serie di algoritmi, eventuali squadrature presenti nell’archivio autori e nell’archivio titoli.

La terza tipologia di report è utile ai tecnici informatici per monitorare il sistema e le sue capacità di risposta.

I report prodotti dalle ultime due tipologie di statistiche sono utilizzati quali strumenti di supporto alle attività di pulizia degli archivi, operate da utenti “esperti”, membri di Istituzioni che partecipano alla bonifica dell’Indice (Struttura). Mediante un’altra interfaccia, (Interfaccia diretta) gli utenti della Struttura possono richiamare i file relativi alle liste di duplicati e squadrature prodotti dalle statistiche e, utilizzando procedure centralizzate on-line, possono intervenire direttamente in Indice per realizzare gli interventi correttivi necessari quali, ad esempio: accorpamento di titoli, autori o soggetti; variazioni nella descrizione di un titolo o di un autore, delle qualificazioni, dei numeri standard; variazioni di legami titolo/titolo o titolo/autore; spostamento titoli da un autore a un altro, da un soggetto all’altro, cancellazione autori, soggetti, etc.