Alcune statistiche sull'OPAC SBN

Antonella Cossu - ICCU 

Dopo un periodo di accesso sperimentale nel maggio del 1997, dal mese di giugno l'OPAC SBN è consultabile da tutti su Internet ed è accessibile 24 ore su 24 all'indirizzo: http://opac.sbn.it.

Il programma di statistica http-analyze 1.9e, applicato al gateway Web, permette di individuare in modo costante alcuni dati relativi all'accesso al sistema in modalità WWW e alla sua efficienza. Le statistiche sono consultabili in linea sull'interfaccia Web cliccando sul pulsante accessi nella maschera di ricerca oppure sulla voce statistiche di accesso nella maschera di ingresso. Le indicazioni che seguono sono state tratte esaminando mese per mese le voci relative al periodo che va da giugno 1997 a febbraio 1998. I dati relativi al mese di novembre sono andati persi per un errore del programma. I dati relativi al mese di giugno si riferiscono a un periodo ridotto che va dal 16 al 30 giugno e sono citati, ma non utilizzati per il calcolo delle percentuali.

1. Traffico

Per calcolare il traffico del server vengono presi in considerazione due tipi di dati che si riferiscono rispettivamente alla quantità di informazione trasmessa e al carico di domanda da parte dell'utenza. Il primo dato si misura sulla base del numero di kbytes inviati dal server, il secondo sulla base del numero di richieste pervenute.

Numero di kbytes trasferiti in un mese

mese Kb trasferiti
giugno

387319

luglio

861109

agosto

695241

settembre

1541206

ottobre

 2001497

novembre

  

dicembre

2444015

gennaio

3059151

febbraio

2977298

Numero di richieste pervenute in un mese

mese numero di richieste
giugno

93859

luglio

217830

agosto

165699

settembre

393171

ottobre

520019

novembre

  

dicembre

604691

gennaio

749437

febbraio

862293

Media delle richieste per giorno e per ora

mese media delle richieste per giorno media delle richieste per ora
giugno

3128

130

luglio

7026

292

agosto

5523

230

settembre

13105

546

ottobre

16774

698

novembre    
dicembre

19506

812

gennaio

24175

1007

febbraio

30796

1283

Da luglio a febbraio il traffico è costantemente aumentato a parte il calo prevedibile del mese di agosto. Nel periodo preso in esame il numero di kbytes trasferiti dal server è più che triplicato e il numero di richieste è quasi quadruplicato con un incremento particolarmente evidente nella media delle richieste per ora.

2. Profilo di uso del server

Per delineare il profilo di uso del server, rilevare cioè i valori relativi alla consultazione da parte dell'utenza, vengono presi in considerazione i dati sulla distribuzione delle richieste nel tempo e sulla loro provenienza.

2.1 Distribuzione delle richieste nel tempo

Dal numero di accessi al sistema in un determinato periodo di tempo si possono individuare i giorni della settimana e le ore del giorno in cui sono pervenute più richieste e si può verificare se vi siano punte costanti nelle richieste e quindi periodi di maggior appesantimento del sistema.

Numero massimo di richieste in un giorno

mese numero massimo di richieste in un giorno giorno del mese giorno della settimana
giugno

9460

26 giugno

giovedì

luglio

12537

16 luglio

mercoledì

agosto

10703

21 agosto

giovedì

settembre

20498

30 settembre

martedì

ottobre

30048

31 ottobre

venerdì

novembre      
dicembre

36589

16 dicembre

martedì

gennaio

38443

27 gennaio

martedì

febbraio

41530

25 febbraio

mercoledì

numero massimo di richieste in un'ora

mese  numero massimo di richieste in un'ora giorno ora
giugno

1521

25 giugno

ore 12 mmss

luglio

1650

31 luglio

ore 10 mmss

agosto

1840

26 agosto

ore 12 mmss

settembre

2876

16 settembre

ore 10 mmss

ottobre

3307

23 ottobre

ore 11 mmss

novembre

  

  

  

dicembre

4288

12 dicembre

ore 11 mmss

gennaio

3995

30 gennaio

ore 12 mmss

febbraio

4965

18 febbraio

ore 11 mmss

Ora in cui si è concentrato il massimo numero di richieste

mese ora numero complessivo di richieste nell'ora di punta numero totale di richieste
giugno

ore 10 mmss

10384

93859

luglio

ore 11 mmss

23217

217830

agosto

ore 12 mmss

20163

165699

settembre

ore 12 mmss

43220

393171

ottobre

ore 11 mmss

59784

520019

novembre      
dicembre

ore 11 mmss

62400

604691

gennaio

ore 11 mmss

73525

749437

febbraio

ore 11 mmss

91136

862293

Se le richieste sembrano uniformemente distribuite tra i giorni della settimana, le ore in cui il sistema risulta più consultato sono quelle della mattina tra le 10 e le 12 con un picco tra le 11 e le 12. Circa il 10% delle richieste sono indirizzate al sistema nell'ora di punta.

2.2 Distribuzione degli accessi per sito e luogo di provenienza

Le statistiche sulla provenienza delle richieste prendono in considerazione i dati relativi al sito e al paese come compaiono nell'indirizzo URL dell'utente. Nel caso del gateway Web dell'OPAC SBN questi dati non risultano significativi per la presenza di un firewall che protegge la rete interna e la separa logicamente dal resto di Internet; tutte le richieste vengono filtrate e non è possibile delinearne il tragitto né definirne la provenienza. Le uniche statistiche significative sono quelle relative al mese di maggio quando l'accesso era sperimentale e il firewall non era ancora attivo.

3. Efficienza del sistema

Per valutare l'efficienza del sistema si prendono in considerazione le richieste che determinano l'invio di files (documenti, immagini od ogni altro tipo di oggetto Html) da parte del server o del- la memoria di cache. Queste risposte sono ritenute positive perché misurano l'effettiva interazione con l'utenza. Va fatto notare che si considerano positive tutte le risposte che determinano la trasmissione di una pagina Html e quindi di uno o più files, anche quelle che non forniscono l'informazione richiesta dall'utente (es.: nessun documento trovato, server busy).

Risposte positive

mese totale delle risposte risposte positive percentuale
giugno

93859

92343

  
luglio

217830

212543

97,6%

agosto

165699

162543

98,1%

settembre

393171

380127

96,9%

ottobre

520019

509636

98%

novembre      
dicembre

604691

601491

99,5%

gennaio

749437

745671

99,5%

febbraio

862293

857642

99,5%

Risposte negative

Sono considerate negative le risposte a richieste che non danno luogo a trasmissione di files.

mese risposte negative percentuale
giugno

1516

    

luglio

5287

2,4%

agosto

3156

1,9%

settembre

12344

3,1%

ottobre

10383

2%

novembre    
dicembre

3200

0,5%

gennaio

3766

0,5%

febbraio

4646

0,5%

Tipologia delle risposte negative

cod 302 redirected requests (la pagina ha cambiato indirizzo)

cod 404 not found (la pagina richiesta non esiste sul server)

cod 500 server error (errore del server)

cod 403 forbidden requests (l'accesso alla pagina richiesta non è consentito)

A partire da dicembre c'è un calo nella percentuale delle risposte negative del sistema che si mantiene allo 0.5 % anche nei mesi di gennaio e febbraio. Va tenuto presente che nel periodo preso in esame tendono a diminuire le risposte per server error.

Conclusioni

Da questa prima e sommaria analisi si possono trarre alcune conclusioni. Il programma di statistica applicato al gateway Web permette di valutare il traffico e l'efficienza nella versione WWW, attualmente l'unica accessibile a tutti e quindi la più ampiamente interrogata, ma non consente di valutare il numero di visitatori e le abitudini degli utenti. Il protocollo HTTP infatti non mantiene la sessione e quindi non consente di rilevare per quanto tempo un visitatore consulta la pagina e quando la lascia.

L'indagine sulla provenienza delle richieste, sulle basi dati più frequentemente consultate (Indice, Musica, Libro antico, Libro moderno) e sui canali di ricerca più utilizzati permetterebbe di valutare la tipologia e le modalità di consultazione dell'utenza. Questa analisi è possibile sui files di log del server OPAC dove vengono registrati i colloqui tra gli utenti e il server in tutte le modalità di accesso (a carattere, WWW, Z-39.50, OLUIT). Per questo motivo si sta studiando l'utilizzo di un programma di statistica sul server OPAC che permetta di effettuare un'indagine non limitata ad un solo tipo di interrogazione e consenta di trarre valutazioni significative anche sulla tipologia, le preferenze e le modalità di consultazione dell'utenza.


torna su