Il recupero del pregresso presso l'Università degli studi di Milano

(Alessandro Emilio - Divisione coordinamento delle biblioteche. Università degli studi di Milano)

Presso l’Università degli Studi di Milano, nel giugno 1999 è stato avviato un progetto di catalogazione retrospettiva che, mediante la conversione in formato elettronico di circa 550.000 schede cartacee, si propone l’obiettivo di rendere disponibile in linea l’informazione sull’intero patrimonio librario dell’Ateneo.

Il lavoro è stato suddiviso in due lotti, per rispettivi quantitativi di 350.000 e 200.000 schede; il primo è stato completato il 31 gennaio u.s., il secondo dovrà concludersi entro dicembre 2001.

In base agli ambiti disciplinari, il materiale bibliografico risulta in percentuale così suddiviso:

Lettere e Giurisprudenza 83 %
Agraria 9 %
Medicina veterinaria 2 %
Scienze della terra 3 %
Biologia 3 %

Fasi preliminari e preparatorie

Il coordinamento dell'intero progetto, curato dalla Divisione coordinamento delle biblioteche, si è rivelato particolarmente impegnativo in considerazione dei seguenti elementi: la frammentazione del materiale bibliografico in un numero molto elevato di biblioteche [1], l'eterogeneità di "tradizioni catalografiche" nei rispettivi cataloghi, la necessità di proseguire un'uniformità di trattamento per le schede e di criteri metodologici per i catalogatori, l'esigenza di organizzare e coordinare un'efficiente attività di supervisione e di supporto da parte del personale universitario.

Anche le fasi preliminari e preparatorie si sono rivelate abbastanza lunghe e onerose; in particolare, a monte di tutto il progetto, è stato necessario individuare la metodologia più vantaggiosa per il recupero, attraverso lo studio di letteratura specifica, il confronto con esperienze straniere e l’attenta disamina dei vantaggi correlati ad ogni possibile opzione.

A tale proposito, sono state analizzate tutte le ipotesi possibili, con accurato vaglio di vantaggi e svantaggi:

  • scannerizzazione delle schede: avrebbe comportato un elevato rischio di errore a causa della qualità grafica dei cataloghi; inoltre, a posteriori si sarebbe reso necessario un oneroso intervento di bonifica sulla banca dati;
  • cattura da database internazionali: per il materiale in lingua italiana avrebbe rivelato un tasso di recupero troppo basso; d’altro canto, non avrebbe comportato un significativo miglioramento di qualità, perché le schede cartacee erano già ricche di accessi ed informazioni[2];
  • immissione dei dati in un archivio locale, con successiva conversione in UNIMARC ed esportazione nell’OPAC: avrebbe comportato la rinuncia ai benefici della catalogazione partecipata, nonché lo svantaggio di creare due archivi separati per materiale corrente e pregresso;
  • immissione dei dati in SBN: in sede di valutazione finale, grazie al rapporto costi/tempi/benefici, si è rivelata l’ipotesi più vantaggiosa, a causa dell’alto tasso di recupero e all’utilizzo del software di catalogazione veloce RAP (realizzato dall’Università degli Studi di Padova) che ha diminuito i tempi di immissione.

Quanto al tasso di recupero da Indice, un sondaggio effettuato su un campione di 3.000 schede aveva permesso di prevedere una percentuale di catture intorno al 50%: tale stima si è poi rivelata esatta, considerando la media riscontrata nei vari ambiti disciplinari (con oscillazioni dal 70 al 30%).

Una volta individuata la metodologia di recupero, si è resa indispensabile un’accurata fase preparatoria, che è possibile sintetizzare secondo lo schema seguente.

  • Analisi dei singoli cataloghi cartacei, molto difformi tra loro per tipologia, completezza, stratificazione di regole catalografiche. Ove possibile, si è scelto di lavorare sul catalogo topografico, in considerazione dei seguenti vantaggi: diminuisce la possibilità di errori nelle segnature, perché si lavora su “blocchi compatti” delle varie sezioni; i cassetti non vengono sottratti alla consultazione degli utenti; si individuano con più facilità eventuali schede mancanti; è più agevole avere una visione complessiva delle opere in più volumi e delle collane. Va peraltro sottolineato che le schede dei nostri topografici contengono anche il tracciato, da cui è possibile evincere gli accessi secondari: in assenza di questo importante elemento, la scelta sarebbe ricaduta sul catalogo per autori.
  • Individuazione e segnalazione delle schede da non considerare all’interno di ogni cassetto (opere già schedate in SBN, volumi smarriti, spogli).
  • Integrazione, sulla scheda, di eventuali dati insufficienti per la catalogazione in SBN[3].
  • Compilazione di un vademecum ad uso dei catalogatori, contenente le linee-guida per conoscere la procedura di lavoro, il trattamento delle schede - con particolare riguardo alle opere in più volumi[4] - e le specificità di ogni singola biblioteca[5].
  • Quantificazione delle work-stations necessarie e della produttività minima; definizione dei tempi e delle modalità di lavoro.

2. Metodologia e procedure di lavoro

Per la fase operativa vera e propria, il lavoro è stato appaltato a una società esterna (CAeB, Cooperativa archivistica e bibliotecaria) tramite un bando di gara europeo; infatti, considerata l’enorme entità del lavoro, sarebbe stato impossibile completarne la realizzazione in tempi ragionevoli da parte del personale interno dell’Università.

Sono state allestite 20 stazioni di lavoro SBN (poi elevate a 24) attive per circa 10 ore al giorno.

Ogni postazione SBN è collegata sia al Polo MIL/Cilea sia al Polo PUV[6] (tramite una sessione telnet), per consentire agli operatori di utilizzare un software di catalogazione veloce[7] creato e messo a disposizione dall’Università di Padova.

Dal punto di vista tecnico, la procedura di lavoro è stata impostata nel modo seguente:

  • la notizia viene cercata in Indice: se presente, viene normalmente catturata e collocata, secondo le ordinarie procedure della catalogazione in SBN;
  • se non presente in Indice, la notizia viene creata sul Polo PUV, tramite il software di catalogazione veloce;
  • terminata la creazione, la notizia viene immediatamente importata nel Polo locale (MIL) per procedere con l’inventariazione e la collocazione.

Per salvaguardare la ricchezza dei cataloghi originari, vengono recuperati tutti gli accessi desumibili dalla scheda (autori principali e secondari fino ad un massimo di tre; collana; titolo originale), tranne i soggetti.

Per il materiale antico, è invece opportuna una valutazione a sé stante. Nonostante questa tipologia di materiale abbia una bassissima incidenza nel presente progetto[8] – e non vada quindi ad inficiare la qualità generale dello stesso - occorre purtroppo constatare che in questo caso è assai difficoltoso ottenere un risultato di buon livello. Pertanto, andrebbe valutata con molta cautela l’ipotesi di procedere ad analoghe iniziative.

Infatti, la catalogazione retrospettiva del materiale antico non solo presenta maggiori “limiti qualitativi” rispetto al moderno[9], ma è anche troppo gravosa in termini di ricaduta sul lavoro di supporto: nonostante i cataloghi cartacei siano di buona qualità, si è costretti a controllare tutte le notizie create per cautelarsi dagli errori “ricorrenti”[10] e per fare, se necessario, adeguate verifiche su repertori; ne consegue la necessità di segnalare (o eseguire) frequenti rettifiche tornando più volte sulle medesime descrizioni: il tutto, per ottenere un risultato qualitativamente sproporzionato rispetto al dispendio di tempo ed energie[11].

Se si aggiunge, da ultimo, che un discreto numero di schede risulta intrattabile per “incompatibilità catalografica” con obsoleti standard descrittivi e che le opere in più volumi sono in gran parte così complesse da richiedere dirette verifiche sui libri, è onesto concludere, alla luce del rapporto qualità/costi/benefici, che la conversione retrospettiva di cataloghi cartacei per il materiale antico presenta troppi rischi e difficoltà per non suscitare dubbi sulla validità intrinseca dell’operazione.

3. Supporto e controllo da parte del personale interno

Per la realizzazione di un lavoro di tale entità, si è rivelata indispensabile una costante e impegnativa collaborazione da parte del personale interno.

Oltre all’attività di progettazione, coordinamento e supervisione da parte della Divisione coordinamento biblioteche, si è reso necessario il coinvolgimento di personale bibliotecario sia per le fasi di preparazione (selezione schede, integrazione dati mancanti), sia per il supporto durante l’esecuzione dei lavori (soluzione di problemi catalografici non risolvibili con il solo esame della scheda), sia per il controllo sul lavoro effettuato dalla ditta (il contratto prevede un controllo a campione del 10%, con applicazione di penali).

In particolare, si vuole sottolineare l’onerosità della fase di controllo: si è proceduto a una precisa codificazione e registrazione degli errori, nonché a un loro conteggio preciso e costante, allo scopo di rilevarne l’incidenza statistica e ottenere un feedback positivo sul lavoro stesso.

In relazione a tutte le suddette attività di supporto, per quantificarne l’impatto sul personale interno, può essere utile ricordare che, nel nostro caso, sono stati stimati 465 giorni/uomo di lavoro per il solo 1999.

Non va trascurata, infine, l’accresciuta mole di lavoro per il personale addetto alle attività di “ordinaria manutenzione” SBN: gli allineamenti e gli interventi di bonifica in Indice sono aumentati in maniera esponenziale, proporzionalmente all’aumento degli inserimenti.

4. Considerazioni finali

Nel complesso, dopo il completamento del primo lotto relativo al recupero di 350.000 schede, è possibile esprimere alcune considerazioni ed osservazioni, nell’auspicio che possano rivelarsi utili per la realizzazione di progetti dalle analoghe caratteristiche.

In primo luogo, è evidente la necessità di dedicare molta attenzione alle fasi preparatorie, nella consapevolezza che un’accurata impostazione iniziale diminuirà la mole di problemi e la perdita di tempo durante l’esecuzione dei lavori; inoltre, occorre valutare in modo realistico l’impatto sugli aspetti tecnici e organizzativi, anche per definire le modalità di lavoro[12] più consone alle esigenze locali. Nel nostro caso, un punto critico è ravvisabile nella sottovalutazione preliminare del sovraccarico di lavoro sull’elaboratore CILEA, che ha comportato, soprattutto in fase di avvio, parecchi rallentamenti e malfunzionamenti dalle conseguenze facilmente immaginabili.

Si vuole poi ribadire che è opportuno non sottovalutare la fase di controllo sul lavoro svolto, indispensabile per garantire una buona qualità del risultato: occorre però dedicarvi molta attenzione perché, senza un’accurata pianificazione di tutta la procedura[13] e delle risorse necessarie, il rischio di vanificarne l’utilità sarebbe davvero elevato.

In sede di analisi finale, comunque, è possibile tracciare un bilancio positivo nei confronti del progetto in corso presso il nostro Ateneo: infatti, a fronte di costi notevoli (in termini sia economici sia di risorse impegnate), il risultato complessivo è molto incoraggiante, se si considerano alcuni elementi peculiari di questo lavoro.

In primo luogo, va considerato che si tratta di uno dei più cospicui recuperi sinora effettuati in Italia, con ricaduta positiva su vari fronti: oltre al grande vantaggio per tutte le biblioteche SBN e in particolare per quelle universitarie – che troveranno già catalogata una gran parte del proprio patrimonio – si avrà anche un notevole beneficio per la didattica e la ricerca, grazie al notevole arricchimento dell’OPAC Indice e dell’OPAC d’Ateneo.

Inoltre, grazie alla completezza delle schede originarie – di cui vengono recuperati tutti gli accessi - e all’effettuazione dei controlli, si riesce ad ottenere una buona qualità dei dati (nonostante si tratti di livello REC); di conseguenza, considerato il costo[14] dell’operazione, il rapporto qualità/prezzo può dirsi molto soddisfacente.

Infine, non va trascurato l’elemento della cooperazione tra più enti: per questo progetto, il nostro Ateneo ha potuto contare sulla collaborazione dell’Università degli Studi di Padova, che ha concesso il software RAP, e della Regione Lombardia, che ha contribuito con un finanziamento di £. 400.000.000.


[1] Oltre alle biblioteche centrali (Lettere e giurisprudenza, Agraria, Veterinaria, etc.), occorre considerare le numerose biblioteche di istituto o dipartimento che fanno riferimento ad esse, creando una situazione molto articolata: basti pensare che a Lettere e Giurisprudenza le biblioteche complessive ammontano a una trentina.

[2] Se le schede di partenza fossero scarne, la cattura di record bibliografici da database internazionali si rivelerebbe un’ottima risorsa per arricchire il catalogo.

[3] Molte schede relative ad opere in più volumi o in continuazione non presentavano la chiara indicazione dei volumi posseduti: è stato quindi necessario chiudere la segnatura di collocazione (es.: 75. D. 13-18) e segnalare, ove possibile, i numeri di inventario dei singoli libri. In casi eccezionali, si è dovuto integrare addirittura il titolo specifico.

[4] La casistica dei problemi per le opere in più volumi è abbastanza ampia. In particolare, per i libri senza titolo significativo non si riescono a ricostruire né la data né il numero di pagine, perché la scheda cartacea presenta la descrizione dell’opera complessiva (con data multipla): in tal caso, se l’opera non è già presente in Indice con le singole inferiori, si è costretti a creare una superiore chiusa. Per i volumi con titolo proprio il problema sarebbe ancora peggiore, ma fortunatamente,  nella maggior parte dei nostri cataloghi, esistono in tal caso le singole schede.

[5] Ad esempio: struttura della collocazione, codice di consultabilità (A/Z), caratteristiche generali del catalogo cartaceo.

[6] Per questo motivo, tutte le notizie create sono identificate dalla sigla PUV e risultano localizzate, oltre che nella biblioteca reale (MIL -LL, AG, MV , TE, IB o SM), anche in una biblioteca fittizia “PUV-RP Biblioteca di recupero del pregresso” appositamente creata allo scopo. In altre parole, tutte le notizie localizzate in Indice nella Biblioteca PUV-RP sono in realtà possedute da una biblioteca MIL, come risulta dalle localizzazioni successive. La situazione è comunque transitoria, perché la biblioteca PUV-RP dovrebbe essere cancellata al termine del progetto.

[7] Tale software, denominato RAP (recupero automatico del pregresso), è stato ideato e sviluppato a cura del Centro di Ateneo per le Biblioteche (in collaborazione con il Centro di Calcolo di Ateneo) dell’Università degli Studi di Padova.
Consente un’immissione rapida dei dati grazie a una schermata compatta: in un’unica videata, è possibile inserire le righe ISBD, la carta d’identità, tre legami autore e tre legami titolo. Inoltre, come interessante opportunità di catalogazione derivata, è possibile ricercare e attingere descrizioni bibliografiche dall’archivio della Library of Congress: il record selezionato viene importato nella schermata principale e può essere eventualmente modificato prima di essere registrato nell’archivio SBN. L’uso di RAP è limitato al materiale moderno. Ulteriori dettagli all’indirizzo http://www.unipd.it/sbn/rap/PRINCIPALE-2bis.html.

[8] Si tratta di circa 10.000 volumi su un totale di 570.000, ovvero di una percentuale inferiore al 2%.

[9] Anche per l’antico è previsto il recupero di tutti gli accessi desumibili dalla scheda (autori, tipografi, collane, titoli originali; perfino titoli subordinati e alternativi), ma ciò nonostante esistono limiti oggettivi: per esempio, dalle schede è impossibile verificare la corretta trascrizione delle lettere U/V, con evidente rischio di compromettere la chiave di ricerca; in altri casi, il troncamento del titolo sulla scheda avviene prima dei 50 caratteri prescritti da SBN.

[10] E’ facile incorrere in errori quali la duplicazione di tipografi o l’errata ripartizione di opere suddivise in parti; si pensi inoltre all’oggettiva difficoltà di interpretare alcuni reticoli (quando non c’è  piena corrispondenza tra descrizione su scheda e notizia in rete) e alla complessa gestione di alcuni casi specifici come gli esemplari mutili.

[11] Impronte, segnature e legami con marche tipografiche mancheranno infatti in ogni caso, perché richiederebbero una catalogazione con il libro in mano.

[12] Ad esempio, la scelta di eseguire i lavori in sede (condizione richiesta nello stesso bando di gara) si è rivelata per noi particolarmente opportuna. Infatti, considerata la necessità di collaborare in modo assiduo e diretto con i catalogatori della ditta, seguire i lavori a distanza sarebbe stato molto difficoltoso.

[13] Nel nostro caso, oltre ad aver stabilito le procedure per il conteggio e la correzione degli errori, si è anche proceduto ad una codificazione e definizione dei medesimi, cercando di stabilire accordi chiari con la ditta. E’ una fase delicata in cui ogni particolare va ponderato con attenzione, per evitare di smarrirsi nel mare magnum di dubbi e contestazioni che inevitabilmente si profileranno.

[14] Si tratta di un costo equo in linea con gli standard internazionali: £. 3.990 a scheda (+ IVA).

Torna su