Alcune statistiche sull'OPAC SBN
Antonella Cossu - ICCU
Dopo un periodo di accesso sperimentale nel maggio del 1997, dal mese di giugno l'OPAC SBN è consultabile da tutti su Internet ed è accessibile 24 ore su 24 all'indirizzo: http://opac.sbn.it.
Il programma di statistica http-analyze 1.9e, applicato al gateway Web, permette di individuare in modo costante alcuni dati relativi all'accesso al sistema in modalità WWW e alla sua efficienza. Le statistiche sono consultabili in linea sull'interfaccia Web cliccando sul pulsante accessi nella maschera di ricerca oppure sulla voce statistiche di accesso nella maschera di ingresso. Le indicazioni che seguono sono state tratte esaminando mese per mese le voci relative al periodo che va da giugno 1997 a febbraio 1998. I dati relativi al mese di novembre sono andati persi per un errore del programma. I dati relativi al mese di giugno si riferiscono a un periodo ridotto che va dal 16 al 30 giugno e sono citati, ma non utilizzati per il calcolo delle percentuali.
1. Traffico
Per calcolare il traffico del server vengono presi in considerazione due tipi di dati che si riferiscono rispettivamente alla quantità di informazione trasmessa e al carico di domanda da parte dell'utenza. Il primo dato si misura sulla base del numero di kbytes inviati dal server, il secondo sulla base del numero di richieste pervenute.
Numero di kbytes trasferiti in un mese
| mese | Kb trasferiti |
| giugno |
387319 |
| luglio |
861109 |
| agosto |
695241 |
| settembre |
1541206 |
| ottobre |
2001497 |
| novembre |
|
| dicembre |
2444015 |
| gennaio |
3059151 |
| febbraio |
2977298 |
Numero di richieste pervenute in un mese
| mese | numero di richieste |
| giugno |
93859 |
| luglio |
217830 |
| agosto |
165699 |
| settembre |
393171 |
| ottobre |
520019 |
| novembre |
|
| dicembre |
604691 |
| gennaio |
749437 |
| febbraio |
862293 |
Media delle richieste per giorno e per ora
| mese | media delle richieste per giorno | media delle richieste per ora |
| giugno |
3128 |
130 |
|
luglio |
7026 |
292 |
|
agosto |
5523 |
230 |
| settembre |
13105 |
546 |
| ottobre |
16774 |
698 |
| novembre | ||
| dicembre |
19506 |
812 |
| gennaio |
24175 |
1007 |
| febbraio |
30796 |
1283 |
Da luglio a febbraio il traffico è costantemente aumentato a parte il calo prevedibile del mese di agosto. Nel periodo preso in esame il numero di kbytes trasferiti dal server è più che triplicato e il numero di richieste è quasi quadruplicato con un incremento particolarmente evidente nella media delle richieste per ora.
2. Profilo di uso del server
Per delineare il profilo di uso del server, rilevare cioè i valori relativi alla consultazione da parte dell'utenza, vengono presi in considerazione i dati sulla distribuzione delle richieste nel tempo e sulla loro provenienza.
2.1 Distribuzione delle richieste nel tempo
Dal numero di accessi al sistema in un determinato periodo di tempo si possono individuare i giorni della settimana e le ore del giorno in cui sono pervenute più richieste e si può verificare se vi siano punte costanti nelle richieste e quindi periodi di maggior appesantimento del sistema.
Numero massimo di richieste in un giorno
| mese | numero massimo di richieste in un giorno | giorno del mese | giorno della settimana |
| giugno |
9460 |
26 giugno |
giovedì |
| luglio |
12537 |
16 luglio |
mercoledì |
| agosto |
10703 |
21 agosto |
giovedì |
| settembre |
20498 |
30 settembre |
martedì |
| ottobre |
30048 |
31 ottobre |
venerdì |
| novembre | |||
| dicembre |
36589 |
16 dicembre |
martedì |
| gennaio |
38443 |
27 gennaio |
martedì |
| febbraio |
41530 |
25 febbraio |
mercoledì |
numero massimo di richieste in un'ora
| mese | numero massimo di richieste in un'ora | giorno | ora |
| giugno |
1521 |
25 giugno |
ore 12 mmss |
| luglio |
1650 |
31 luglio |
ore 10 mmss |
| agosto |
1840 |
26 agosto |
ore 12 mmss |
| settembre |
2876 |
16 settembre |
ore 10 mmss |
| ottobre |
3307 |
23 ottobre |
ore 11 mmss |
| novembre |
|
|
|
| dicembre |
4288 |
12 dicembre |
ore 11 mmss |
| gennaio |
3995 |
30 gennaio |
ore 12 mmss |
| febbraio |
4965 |
18 febbraio |
ore 11 mmss |
Ora in cui si è concentrato il massimo numero di richieste
| mese | ora | numero complessivo di richieste nell'ora di punta | numero totale di richieste |
| giugno |
ore 10 mmss |
10384 |
93859 |
| luglio |
ore 11 mmss |
23217 |
217830 |
| agosto |
ore 12 mmss |
20163 |
165699 |
|
settembre |
ore 12 mmss |
43220 |
393171 |
| ottobre |
ore 11 mmss |
59784 |
520019 |
| novembre | |||
| dicembre |
ore 11 mmss |
62400 |
604691 |
| gennaio |
ore 11 mmss |
73525 |
749437 |
| febbraio |
ore 11 mmss |
91136 |
862293 |
Se le richieste sembrano uniformemente distribuite tra i giorni della settimana, le ore in cui il sistema risulta più consultato sono quelle della mattina tra le 10 e le 12 con un picco tra le 11 e le 12. Circa il 10% delle richieste sono indirizzate al sistema nell'ora di punta.
2.2 Distribuzione degli accessi per sito e luogo di provenienza
Le statistiche sulla provenienza delle richieste prendono in considerazione i dati relativi al sito e al paese come compaiono nell'indirizzo URL dell'utente. Nel caso del gateway Web dell'OPAC SBN questi dati non risultano significativi per la presenza di un firewall che protegge la rete interna e la separa logicamente dal resto di Internet; tutte le richieste vengono filtrate e non è possibile delinearne il tragitto né definirne la provenienza. Le uniche statistiche significative sono quelle relative al mese di maggio quando l'accesso era sperimentale e il firewall non era ancora attivo.
3. Efficienza del sistema
Per valutare l'efficienza del sistema si prendono in considerazione le richieste che determinano l'invio di files (documenti, immagini od ogni altro tipo di oggetto Html) da parte del server o del- la memoria di cache. Queste risposte sono ritenute positive perché misurano l'effettiva interazione con l'utenza. Va fatto notare che si considerano positive tutte le risposte che determinano la trasmissione di una pagina Html e quindi di uno o più files, anche quelle che non forniscono l'informazione richiesta dall'utente (es.: nessun documento trovato, server busy).
Risposte positive
| mese | totale delle risposte | risposte positive | percentuale |
| giugno |
93859 |
92343 |
|
| luglio |
217830 |
212543 |
97,6% |
| agosto |
165699 |
162543 |
98,1% |
| settembre |
393171 |
380127 |
96,9% |
| ottobre |
520019 |
509636 |
98% |
| novembre | |||
| dicembre |
604691 |
601491 |
99,5% |
| gennaio |
749437 |
745671 |
99,5% |
| febbraio |
862293 |
857642 |
99,5% |
Risposte negative
Sono considerate negative le risposte a richieste che non danno luogo a trasmissione di files.
| mese | risposte negative | percentuale |
| giugno |
1516 |
|
| luglio |
5287 |
2,4% |
| agosto |
3156 |
1,9% |
| settembre |
12344 |
3,1% |
| ottobre |
10383 |
2% |
| novembre | ||
| dicembre |
3200 |
0,5% |
| gennaio |
3766 |
0,5% |
| febbraio |
4646 |
0,5% |
Tipologia delle risposte negative
cod 302 redirected requests (la pagina ha cambiato indirizzo)
cod 404 not found (la pagina richiesta non esiste sul server)
cod 500 server error (errore del server)
cod 403 forbidden requests (l'accesso alla pagina richiesta non è consentito)
A partire da dicembre c'è un calo nella percentuale delle risposte negative del sistema che si mantiene allo 0.5 % anche nei mesi di gennaio e febbraio. Va tenuto presente che nel periodo preso in esame tendono a diminuire le risposte per server error.
Conclusioni
Da questa prima e sommaria analisi si possono trarre alcune conclusioni. Il programma di statistica applicato al gateway Web permette di valutare il traffico e l'efficienza nella versione WWW, attualmente l'unica accessibile a tutti e quindi la più ampiamente interrogata, ma non consente di valutare il numero di visitatori e le abitudini degli utenti. Il protocollo HTTP infatti non mantiene la sessione e quindi non consente di rilevare per quanto tempo un visitatore consulta la pagina e quando la lascia.
L'indagine sulla provenienza delle richieste, sulle basi dati più frequentemente consultate (Indice, Musica, Libro antico, Libro moderno) e sui canali di ricerca più utilizzati permetterebbe di valutare la tipologia e le modalità di consultazione dell'utenza. Questa analisi è possibile sui files di log del server OPAC dove vengono registrati i colloqui tra gli utenti e il server in tutte le modalità di accesso (a carattere, WWW, Z-39.50, OLUIT). Per questo motivo si sta studiando l'utilizzo di un programma di statistica sul server OPAC che permetta di effettuare un'indagine non limitata ad un solo tipo di interrogazione e consenta di trarre valutazioni significative anche sulla tipologia, le preferenze e le modalità di consultazione dell'utenza.