La base dati del Censimento delle edizioni del XVI secolo

Tiziana Brunetti - ICCU

EDIT16 è la sigla che identifica il Censimento delle edizioni italiane del XVI secolo. Il progetto nasce nella metà degli anni ottanta al fine di documentare la produzione italiana a stampa del XVI secolo (edizioni stampate tra il 1501 e il 1600 in Italia, in qualsiasi lingua, e all’estero, in lingua italiana), effettuare una ricognizione del patrimonio posseduto a livello nazionale e costituire pertanto, dopo l’IGI, un ulteriore passo per la realizzazione di una bibliografia nazionale retrospettiva. Progetto ambizioso e difficile in un paese come l’Italia dove, al contrario di quanto avviene per esempio in Francia o Gran Bretagna, non esiste una biblioteca in grado di documentare in modo consistente la produzione libraria antica, ma il patrimonio è diffuso su tutto il territorio nazionale.

Al Censimento, curato dal Laboratorio della bibliografia retrospettiva dell’ICCU, partecipano infatti oltre 1200 biblioteche tra statali, di enti locali, ecclesiastiche e private che collaborano in vario modo. Alcune hanno schedato, seguendo le normative EDIT16, parte o tutto il loro patrimonio, altre inviano le proprie schede di catalogo, altre ancora effettuano la ricognizione del posseduto sulla base delle liste inviate dall’ICCU, segnalando eventuali integrazioni e modifiche. La peculiarità di EDIT16 consiste proprio nella sua struttura, nel fatto di essere un censimento su base nazionale, il che, a confronto di altre iniziative similari, lo rende unico.

Il Censimento tuttavia ha avuto da sempre il suo punto debole nella lentezza della messa a disposizione delle informazioni, diffuse fino ad ora solo attraverso i volumi a stampa. La complessità delle operazioni necessarie alla identificazione e localizzazione delle edizioni ha infatti consentito di pubblicare dal 1989 ad oggi solo quattro volumi relativi alle edizioni con intestazione A-C. Nel corso del 1995, grazie ai finanziamenti previsti dalla legge 145/92 per progetti di inventariazione, precatalogazione e catalogazione dei beni culturali, il Laboratorio ha avuto finalmente l’opportunità di progettare l’automazione del Censimento e di realizzare diversi obiettivi tra i quali, in primo luogo, quello di rendere disponibili le informazioni senza attendere l’uscita dei volumi a stampa.

Dal mese di giugno dello scorso anno il Laboratorio è dotato di una base dati in rete di PC, in ambiente SQL e sistema operativo Windows per la gestione del materiale bibliografico e dei prodotti editoriali del Censimento. Da allora la sigla EDIT16 identifica anche la base dati e il s/w di gestione.

Il s/w EDIT16

La procedura EDIT16 realizzata dalla società SOSEBI ha permesso di raggiungere importanti obiettivi. Il primo è stato, come già detto, quello di rendere immediatamente fruibili non solo le notizie relative ad edizioni già "censite" (controllate e localizzate), come avviene appunto attraverso i volumi, ma tutto il patrimonio di notizie raccolte dall’ICCU su vari supporti e fino ad ora in buona parte consultabili solo presso il Laboratorio di bibliografia retrospettiva. Si tratta di notizie che si trovano in diverse fasi di lavorazione all’interno del Censimento e quindi non sono omogenee. Nella base dati convivono infatti, distinguibili dal livello, notizie già controllate, localizzate e pubblicate (livello massimo), notizie localizzate ma solo parzialmente controllate dal personale responsabile del censimento (livello medio) e infine notizie di varia provenienza (schede di biblioteche, repertori, cataloghi a stampa ecc.) non controllate e talvolta anche non localizzate (livello minimo).

Si è consapevoli che mettere a disposizione anche notizie non controllate può essere rischioso ma si è altrettanto consapevoli che i tempi necessari ai responsabili del Censimento per identificare i diversi esemplari posseduti dalle biblioteche e arrivare alla definizione di ogni singola edizione, di eventuali varianti ecc. sono molto lunghi mentre l’utenza ha diritto ad una informazione immediata seppure parziale.

EDIT16 vuole comunque continuare ad essere, come in passato, un utile strumento sia per studi sull’editoria e sulla cultura del XVI secolo che per la catalogazione del materiale antico. Si chiede perciò all’utente un’attenzione particolare al livello della notizia: solo quelle di livello massimo possono considerarsi "censite" cioè validate dai responsabili di EDIT16 e localizzate sul territorio nazionale; le altre sono provvisorie sia per quanto riguarda le localizzazioni che la correttezza della descrizione bibliografica. Tra queste è ipotizzabile un certo numero di errori e di duplicazioni e non si può escludere la presenza di "fantasmi bibliografici". Solo per le prime quindi si può considerare EDIT16 un riferimento bibliografico affidabile, le altre possono subire variazioni o, in qualche caso, essere eliminate.

Altro obiettivo è stato quello di dare adeguata risposta alle esigenze di ricerca di un’utenza altamente specializzata. Per questo, pur se costruita in modo da garantire la completa integrazione con la base dati SBN, la procedura si avvale di archivi, campi e funzionalità che consentono tipologie di ricerca originali in grado di soddisfare le esigenze informative degli utenti interessati all’editoria del Cinquecento.

L’interrogazione, con la possibilità di associare, in qualsiasi combinazione, parametri relativi a tutti i campi dei diversi archivi consente di ottenere in risposta non solo notizie bibliografiche, ma anche notizie relative ad autori, tipografi o marche (tipografi che hanno utilizzato una certa insegna o una certa marca, o quelli che hanno avuto attività in un certo luogo e in un certo anno ecc.). EDIT16 fornisce infatti, oltre alle descrizioni bibliografiche anche notizie su titoli di raggruppamento, autori e tipografi compilate secondo lo schema delle Direttive per le voci di autorità dell’IFLA. Tali informazioni contengono riferimenti ai repertori in cui è citato l’autore, il tipografo o il titolo, la forma del nome o del titolo presente negli stessi repertori, e, per autori e tipografi, anche informazioni biografiche e le forme del nome presenti nelle edizioni del XVI secolo. Dei tipografi vengono inoltre date informazioni relative a luoghi e date di attività, ad indirizzi e/o insegne, alle marche utilizzate. La procedura consente infine di associare immagini alle marche e, in casi particolari, anche alle notizie bibliografiche quando siano ritenute utili alla identificazione (frontespizi di diverse edizioni distinguibili solo per il tipo di carattere, la diversa composizione grafica ecc.).

Il s/w EDIT16 ha consentito inoltre di razionalizzare le procedure di lavoro e di assicurare agli operatori del Censimento strumenti utili nelle varie fasi della catalogazione. In questo senso vanno per esempio le procedure di monitoraggio della base dati che consentono di eseguire operazioni di statistica e di controllo (di coerenza o completezza) delle notizie di un settore determinato o della globalità dell’archivio (l’operatore può effettuare statistiche e controlli personalizzati scegliendo di volta in volta i parametri da associare per ottenere il risultato desiderato). E ancora le procedure di bibliografia che consentono la catalogazione dei repertori utilizzati per la definizione delle edizioni e delle voci di autorità e, attraverso l’integrazione con le procedure di catalogazione e ricerca bibliografica, il controllo in immissione delle sigle dei repertori e la visualizzazione della descrizione in chiaro di quelli citati come fonte.

In questo senso va interpretata anche una particolare gestione delle relazioni tra date di pubblicazione, tipografi e luoghi che consente agli operatori del Censimento di avere, al momento della catalogazione, un quadro completo delle date di attività dei tipografi, sia generali che legate ai singoli luoghi. Per queste ultime viene offerto il confronto tra quattro tipologie di date di attività: date risultanti da tutte le edizioni in archivio, date risultanti dalle sole edizioni "controllate", date ricavate da repertori e infine date risultanti dalla integrazione di quelle tratte da repertori e quelle "controllate".

Poiché la gestione delle notizie avviene in rete locale si è inoltre reso necessario sviluppare particolari funzionalità per distinguere, ad esempio, i settori di competenza dei vari operatori oppure le diverse fasi di lavorazione delle notizie al fine di ottenere i prodotti editoriali. La procedura consente infatti di effettuare tutte le operazioni necessarie alla stampa del volume del Censimento: estrazione e ordinamento delle edizioni controllate e localizzate, attribuzione del numero di volume, compilazione dei rinvii e degli indici. La stampa del volume è totalmente automatica, anche per quanto riguarda il formato e lo stile dei caratteri.

Altro obiettivo infine è stato quello di rendere disponibili per la catalogazione partecipata in SBN le notizie della base dati EDIT16 per le quali si possano considerare ultimati i controlli da parte degli operatori del Censimento. L’alimentazione della base dati SBN è garantita da un s/w di conversione EDIT16-SBN e SBN-EDIT16 e da un s/w di confronto per la migrazione dei dati in SBN.

EDIT16 e SBN

Nell’analisi che ha preceduto la realizzazione del s/w EDIT16 si è sempre tenuto presente l’esigenza di una perfetta compatibilità e integrazione con SBN. Le notizie presenti in EDIT16 hanno, accanto ad un proprio identificativo, anche il BID, VID o MID che le identifica in SBN al fine di evitare duplicazioni nello scambio di dati tra i due sistemi.

EDIT16 rispetto allo standard SBN prevede una serie di funzioni aggiuntive (estrazione delle notizie per liste di controllo e prodotti editoriali, gestione della bibliografia del Censimento, prenotazione di settori della base dati, gestione delle immagini ecc.) e di conseguenza nuovi archivi (Tipografi, Luoghi, Authority file, Bibliografia, Segreteria), nuovi legami (tipografo - luogo, tipografo - marca, luogo - luogo ecc.) e nuovi campi. Sono stati inoltre introdotti molti controlli on line (coerenza tra la data codificata, quella presente nell’area della pubblicazione e quella presente nell’impronta, coerenza tra l’indicazione della paginazione presente nell’area della descrizione fisica e il suffisso che indica la carta dalla quale sono ricavati gli ultimi due gruppi dell’impronta ecc.) per evitare, nei limiti del possibile, errori durante l’immissione dei dati.

Di ogni monografia vengono gestite le localizzazioni (controllate o tratte da repertori e in attesa di conferma) e i repertori che citano l’edizione, mentre particolari meccanismi (flag di prenotazione, innalzamento status di settori della base dati, ecc.) sono strettamente legati all’iter operativo del Censimento. Ad ogni notizia di monografia è inoltre legato un "taccuino" che consente di raccogliere, in relazione a ciascuna area della descrizione, le proposte di correzione inviate dalle biblioteche.

Non vengono invece gestiti i titoli di natura W in quanto non si prevede la catalogazione a più livelli, e i titoli di natura B in quanto la differenza tra un titolo di raggruppamento controllato o meno è rilevabile dal livello della notizia bibliografica.

Per consentire la massima omogeneità con le notizie presenti nell’archivio SBN, si è deciso di basare la catalogazione sulla Guida SBN - Libro antico, anche se con qualche modifica dovuta alle particolari esigenze del Censimento. In particolare si è stabilito di non adottare la catalogazione a più livelli mentre qualche problema di adozione comportano quelle parti della normativa che più di altre presuppongono una catalogazione "libro in mano". Gli operatori del Censimento arrivano infatti alla definizione delle edizioni attraverso il confronto di catalogazioni effettuate da altri secondo diverse normative. Nonostante molti riscontri vengano eseguiti direttamente sugli esemplari (se posseduti da biblioteche romane) o indirettamente su fotocopie, tuttavia rimane una parte, non trascurabile, di notizie per le quali i controlli vengono svolti solo attraverso l’esame di repertori e schede inviate dalle biblioteche che ovviamente non sempre contengono gli elementi necessari ad una catalogazione puntuale come richiesto dalla normativa SBN.

Ad esempio una parte della normativa di difficile applicazione è sicuramente quella che riguarda l’area della pubblicazione in quanto richiede la conoscenza dell’esatta dislocazione delle informazioni sulla pubblicazione. Perciò si è chiesto alle biblioteche che collaborano al censimento una maggiore puntualità nella descrizione ed una maggiore disponibilità a rispondere a nostre richieste di informazioni. La possibilità di applicare questa parte della normativa dipende dalla risposta delle biblioteche a questo impegno aggiuntivo. Il lavoro sulle edizioni della lettera D, attualmente in corso, consentirà di fare delle verifiche e definire quanta parte delle norme SBN si è in grado di seguire. Ovviamente nella base dati convivranno a lungo notizie descritte secondo le vecchie e le nuove normative.

Per quanto riguarda le codifiche si sono effettuate scelte difformi solo quando assolutamente necessario. E’ il caso, per esempio del codice Data di pubblicazione. Il s/w EDIT16 doveva garantire la produzione in modo totalmente automatico del volume del Censimento nella forma fino ad oggi conosciuta. Nel volume le notizie sono ordinate cronologicamente in modo analitico all’interno delle singole intestazioni (es. [prima del 1520], 1520, [dopo il 1520] ecc.). Si è pertanto resa necessaria una codifica più puntuale. Integrazioni e modifiche non costituiscono però un problema di compatibilità con SBN in quanto i dati, prima del riversamento, vengono ricondotti allo standard previsto e forniti in formato "migrazione".

Ci si è infine preoccupati di ridurre per quanto possibile le duplicazioni (di notizie bibliografiche, autori, tipografi) che fisiologicamente comporta una qualsiasi migrazione di dati in Indice.

L’attuale s/w di "migrazione antico - antico", attraverso il quale si può alimentare la base dati SBN, prevede, come è noto, un processo totalmente automatico di riconoscimento e conseguente accorpamento delle notizie relative ad una stessa edizione. Due notizie sono ritenute uguali quando abbiano stessa natura, livello gerarchico, chiave titolo (primi cinquanta caratteri), data, paese, luogo e lingua, stessi tipografi e almeno un autore in comune. E’ sufficiente una banale differenza, per esempio l’errata trascrizione di un carattere nel titolo o una piccola diversità nel nome di un autore, perché una notizia sia duplicata. E’ ovvio quindi che il sistema ha una ragionevole possibilità di successo solo quando la base dati migrante è costruita secondo le stesse modalità previste in SBN sia per quanto riguarda i codici e i legami che le regole di catalogazione e quando si effettui un controllo preventivo sul nome di autori e tipografi.

EDIT16 non rispetta in pieno queste condizioni in quanto il Censimento, partito prima di SBN, è costituito in buona parte di dati che rispondono a criteri descrittivi antecedenti la nuova normativa ed è caratterizzato, soprattutto per le catalogazioni meno recenti, da una accentuata propensione all’abbreviazione del titolo che lo rende incompatibile con l’algoritmo di riconoscimento del s/w di migrazione SBN. La normativa originaria, seguita per le lettere A-B, prevedeva ad esempio la sistematica eliminazione del nome dell’autore; comunque quasi mai, anche nelle catalogazioni successive, si verifica il rispetto della trascrizione integrale dei primi cinquanta caratteri.

Si valutò che in una normale migrazione, pur controllando autori e tipografi, si sarebbe probabilmente duplicata la quasi totalità delle notizie in comune tra i due archivi. Era quindi assolutamente necessario fornire al s/w di "migrazione antico - antico" notizie riconoscibili. D’altra parte era necessario creare anche un s/w di migrazione verso EDIT16 per alimentare, con il minimo di duplicazioni, la base dati del Censimento con notizie provenienti da SBN o da qualsiasi altra base dati dotata di una uscita in formato UNIMARC. Per questo è stato sviluppato un s/w di "migrazione controllata" che consente agli operatori del Censimento di individuare, tra coppie di notizie "simili", quelle che si riferiscono alla medesima edizione (il riconoscimento e l’eventuale accorpamento avviene on line ma vengono prodotte anche liste). L’algoritmo di estrazione delle notizie "simili" prevede l’uguaglianza della prima parola del titolo (con l’eccezione di una lista di parole scarsamente significative), di almeno un tipografo e della data, se certa. Nel caso l’operatore verifichi che la coppia di notizie in esame si riferisce ad una stessa edizione può scegliere di accorpare la notizia di provenienza esterna su quella interna o viceversa; in entrambi i casi comunque, per notizie provenienti da SBN è prevista l’acquisizione del BID.

Si pensò quindi che facendo precedere la migrazione (totalmente automatica) EDIT16-SBN da una migrazione (controllata) SBN-EDIT16 si poteva risolvere il problema di eccessive duplicazioni in Indice antico. Le notizie in comune tra i due archivi, per le quali vanno immesse in SBN solo le localizzazioni di provenienza EDIT16, potevano infatti essere accorpate sulla base dell’uguaglianza del BID evitando al s/w di "migrazione antico - antico" confronti, di esito incerto, su descrizioni autore o titolo.

La preoccupazione di evitare duplicazioni in Indice riguarda non solo le notizie bibliografiche ma anche notizie relative ad autori e tipografi. In particolare poiché, come detto, il tipografo è un dato fondamentale per l’individuazione automatica di notizie "simili", è essenziale che nei due archivi si scelga la stessa forma del nome. Per questo è in corso un’attività di controllo incrociato sui nomi dei tipografi italiani del XVI secolo presenti nei due archivi a seguito della quale sono stati effettuati a tutt’oggi circa 450 interventi di correzione in Indice antico tra accorpamenti e variazione di descrizione.

EDIT16: stato attuale e prospettive

Attualmente la base dati contiene circa 36.000 notizie bibliografiche delle quali circa 24.000 (relative alle lettere A-H) provengono dal riversamento di dati già posseduti su supporto magnetico, le rimanenti sono frutto dell’attività di immissione svolta lo scorso anno da personale esterno assunto nell’ambito dei finanziamenti della legge 145/92. Entro il prossimo mese di aprile, attraverso un nuovo progetto nell’ambito della legge 538/93 saranno immesse altre 12.000 notizie bibliografiche e 10.000 descrizioni relative a authority file di autori e tipografi, mentre è in corso e sarà presto ultimato l’inserimento di oltre 1500 notizie bibliografiche relative ai repertori utilizzati per la definizione delle edizioni e delle voci di autorità di titoli uniformi, autori e tipografi.

Al momento la base dati è consultabile solo presso il Laboratorio della bibliografia retrospettiva, ma contiamo al più presto di renderla disponibile attraverso la rete Internet. Vanno prima risolti i problemi relativi alla tutela giuridica dei dati e alla tariffazione dei servizi. Per quanto riguarda la produzione di un CD-ROM si pensa di realizzarlo dopo il completamento della immissione dati prevista nel progetto sopra indicato e di una attività di "pulizia" generale della base dati.

Data la complessità dei controlli di premigrazione sopra descritti, la prima migrazione in SBN, che interesserà le notizie relative ad edizioni con intestazione A-C, è prevista tra la fine dell’anno in corso e i primi mesi del prossimo. Al momento è stata avviata la prima fase di controllo sulle edizioni provenienti da SBN che vanno integrate, se carenti, con i dati indispensabili al corretto funzionamento del processo di confronto. Non va dimenticato infatti che in Indice antico sono presenti, a seguito delle normali migrazioni dei Poli, notizie immesse con le procedure di catalogazione del libro moderno (prima del rilascio del s/w SBN antico) e pertanto prive del collegamento al tipografo.

Nel prossimo futuro, infine, l’Istituto si pone due ulteriori obiettivi: avviare lo studio di una maggiore integrazione tra EDIT16 e SBN e accelerare la conclusione del Censimento attraverso la produzione in tempi brevi delle liste di edizioni necessarie alle biblioteche per la rilevazione di tutto il loro posseduto. Compatibilmente con i tempi di risposta delle biblioteche, l’attuazione del progetto consentirebbe di rendere disponibile entro pochi anni un prodotto ancora non definitivo (per l’identificazione e la descrizione controllata delle singole edizioni necessitano tempi molto più lunghi), ma di indubbia rilevanza dal momento che si tratterebbe di una delle più ricche basi dati di edizioni del Cinquecento, indispensabile per la conoscenza, tutela, valorizzazione e fruizione del nostro patrimonio culturale.

torna su