L'archivio soggetti e classi dell'Indice SBN

   Maria Lucia Di Geso - ICCU

L'archivio dei soggetti e delle classi dell'Indice è nato nell'ambito del progetto "Accessibilità delle basi dati residenti sull'Indice SBN", al fine di accrescere le potenzialità del sistema OPAC: infatti, relativamente alla sola base dati Libro moderno, si è pensato di sviluppare delle funzionalità che permettessero la ricerca semantica dei documenti, mediante l'interrogazione per soggetto e/o per classe. A tale obiettivo si è aggiunto quello di offrire un supporto nella catalogazione semantica all'utente bibliotecario, mediante il riversamento di queste informazioni anche nel d/b gestionale di Indice.

Per il conseguimento di questi obiettivi è stato definito un progetto specifico che è stato presentato al Comitato di Gestione SBN nella riunione del 10 ottobre 1996 ed ha trovato concordi tutti i membri del Comitato nelle sue finalità. Come si è cercato di illustrare in questa breve nota, l'archivio dei soggetti e delle classi di Indice ha caratteristiche e funzioni diverse da quello di Polo: non si intende cioè gestirlo secondo il principio della catalogazione partecipata in linea, ma si vuole fornire con esso, da un lato, uno strumento di alimentazione dell'OPAC, dall'altro, un eventuale aiuto al bibliotecario sia nell'attività di soggettazione e classificazione del materiale corrente, sia, soprattutto, nel recupero del retrospettivo. Si intende in tal modo rispondere alle esigenze di quei Poli che, da più tempo, hanno richiesto di poter vedere ed eventualmente catturare dall'Indice SBN i soggetti e le classi immessi da altri Poli, specialmente dal Polo CFI/BNI.

Il progetto ha previsto varie fasi di lavoro, alcune delle quali sono già state realizzate, altre sono in via di attuazione e altre da completare.

Costituzione della base dati soggetti e classi di Indice

Il primo passo è stato quello di costituire nel d/b gestionale dell'Indice SBN un archivio di soggetti e classi che permettesse di arricchire le notizie già presenti nella base dati Libro Moderno di queste utili informazioni. Per garantire omogeneità e coerenza dei dati dell'archivio, si è stabilito di inserire solo soggetti creati secondo le regole del Soggettario delle biblioteche italiane, e simboli di classificazione relativi al sistema di classificazione decimale Dewey, essendo questi gli strumenti di indicizzazione più diffusi nelle nostre biblioteche.

Per l'alimentazione della base dati dei soggetti e dei simboli di classificazione in Indice si è fatta una distinzione tra:

  • notizie bibliografiche già presenti e presumibilmente già soggettate e classificate sui Poli;
  • notizie bibliografiche che avrebbero alimentato l'Indice dopo la creazione della base dati suddetta

Alimentazione della base dati con procedure batch

Per le notizie già presenti in Indice si è deciso di realizzare delle procedure centrali e di polo che permettessero uno scarico batch dei soggetti e delle classi di alcuni poli SBN.

La scelta dei Poli in grado di alimentare l'Indice SBN di tali informazioni si è basata su due principi: la qualità dei dati e il livello di "copertura" dell'archivio. E' stata data quindi la priorità al Polo della Biblioteca Nazionale Centrale di Firenze (CFI/BNI) che, anche nel campo della catalogazione semantica, costituisce il punto di riferimento per la maggior parte delle biblioteche italiane. Per la parte delle notizie di Indice non possedute dalla CFI/BNI si è deciso di effettuare un. rilievo statistico che ha evidenziato quali erano i Poli che garantivano, con il loro apporto di informazioni, la maggiore copertura dell'Indice. Sono stati quindi individuati altri 10 poli SBN (1) che, per le dimensioni del loro archivio e per la qualità dei dati, erano in grado di dotare di soggetti e classi le notizie rimanenti (ad es. materiale straniero, etc.). Tali Poli hanno collaborato all'alimentazione della base Indice, fornendo all'ICCU il nastro dei dati su soggetti, classi e relativi legami a notizie che è stato riversato prima sul d/b gestionale e poi sull'OPAC di Indice. Questa fase si è conclusa nel febbraio del 1997 e ha condotto alla creazione di un archivio di dimensioni ragguardevoli.

Alimentazione on-line e gestione dei soggetti/classi in Indice

Oltre alla prima fase, che è consistita essenzialmente nella realizzazione di procedure batch, il progetto ne ha prevista una seconda, basata sulla realizzazione di procedure on-line, interne alla funzione di catalogazione, e relative alle attività di inserimento, cattura, correzione, e cancellazione dei soggetti/classi in Indice. Per quanto riguarda le procedure centrali, dal 16 dicembre del 1997 sono già attivabili sul sistema di esercizio dell'Indice le transazioni real-time che con- sentono la gestione dei soggetti e delle classi a livello centrale. In particolare, sono state realizzate le funzioni di:

  • Inserimento/Correzione soggetti;
  • Inserimento/Correzione classi;
  • Inserimento/Cancellazione legami notizia-soggetto;
  • Inserimento/Cancellazione legami notizia-classe;
  • Interrogazione soggetti e classi per BID;
  • Prospettazione ulteriori soggetti e classi legati a un BID.

Inserimento dei soggetti/classi

Per le nuove notizie che verranno inserite (ma anche per quelle già presenti in Indice che ancora non hanno soggetto e/o classe), il progetto ha previsto la realizzazione di una procedura di alimentazione on-line: il bibliotecario di un Polo che stia soggettando o classificando una notizia posseduta, potrà inviare il soggetto e/o la classe all'Indice, arricchendolo di tali informazioni. Tale funzione verrà attivata all'interno della procedura di Gestione bibliografica e sarà opzionale. La procedura di soggettazione e classificazione in Indice sarà difforme da quella esistente sul Polo: non vi sarà una funzione di identificazione soggetto o classe, ma il Polo si limiterà ad inviare i dati semantici.

Correzione della base dati

Occorre distinguere due tipologie di correzione: a) correzione della stringa di soggetto e dell'equivalente verbale del simbolo di classificazione; b) correzione del legame soggetto/notizia e classe/notizia.

a) La correzione della descrizione di una stringa di soggetto o di una classe si rende necessaria qualora si riscontrino errori nella formulazione della stringa, nell'ordine di citazione, nell'uso di termini non accettati e, per la classificazione, nell'equivalente verbale del simbolo. In tale caso, la correzione incide solo sul soggetto/classe ed è indipendente dalla quantità di notizie collegate. Tale tipologia di correzione può essere considerata, dal punto di vista dell'Indice, come un caso particolare di alimentazione della base dati, in cui il record soggetto/classe inviato dal Polo sostituisce quello errato presente in Indice.

b) La correzione del legame soggetto/notizia e classe/notizia si rende, invece necessaria qualora si siano assegnati erroneamente ad una notizia un soggetto o una classe corretti da un punto di vista formale, ma concettualmente errati per il documento in esame. In tal caso il soggetto e/o la classe devono continuare ad esistere come dati semantici di altre notizie presenti nella base dati. La correzione si traduce pertanto nella sequenza di due operazioni:

  • cancellazione del vecchio legame notizia-soggetto/classe;
  • inserimento di un nuovo legame notizia-soggetto/classe ed eventuale inserimento del soggetto/classe, qualora questi non siano già presenti in Indice.

Sull'ammissibilità di entrambe le tipologie di correzione, l'indice potrà decidere in funzione dei profilo del Polo operante rispetto a quello corrispondente al soggetto/classe presente in base dati. A tale proposito, occorrerà definire una scala di priorità dei Poli, in base alla quale, ad es. i soggetti e le classi immessi dal Polo CFI non siano modificabili se non dalla Biblioteca Nazionale Centrale di Firenze. La procedura di correzione dei soggetti/classi in Indice non scatenerà allineamenti verso i Poli. Si è deciso infatti di lasciare al Polo la libertà di correggere o meno il suo soggetto/classe, a fronte di una correzione avvenuta in Indice, ben sapendo che ciò potrà comportare, in certi casi, un disallineamento tra Polo ed Indice nel campo della catalogazione semantica.

In relazione alle attività di fusione di notizie uguali in Indice, operate sia dai Poli che dalla Struttura, si è previsto che, a fronte di tali fusioni, fosse possibile trasferire i soggetti e le classi della notizia accorpata sulla notizia accorpante, qualora questa ne sia sprovvista. Si è esclusa la possibilità di "accodare" ad una stessa notizia soggetti diversi o uguali provenienti da più Poli.

Cattura dei soggetti e classi dall'Indice

L'archivio dei soggetti e delle classi di Indice, come si è detto, è già a disposizione dei Poli SBN per l'eventuale cattura. Tale funzione, facoltativa, potrà essere attivata sia dopo la cattura di una notizia dall'Indice, sia dopo l'identificazione in Polo di una notizia già presente, sempre all'interno della funzione di Gestione bibliografica. Spetterà al s/w di Polo effettuare i controlli di non duplicazione fra il soggetto/classe catturato in Indice e quelli già presenti sulla sua base dati.

Per quanto riguarda i s/w di Polo, lo sviluppo a breve termine di tali procedure è finanziato, al momento, per il solo applicativo BULL ed è in via di realizzazione, come anche per il nuovo applicativo Unix in architettura client/server; poiché all'ICCU sono state richieste dalle Regioni le specifiche di Indice relative alle funzionalità sopra descritte, si auspica che in futuro anche gli altri applicativi possano dotarsi di questa parte di s/w.

Caricamento dei soggetti e delle classi sull'OPAC di Indice e modalità della ricerca semantica

Fin dal primi mesi del 1997, l'archivio dei soggetti e dei simboli di classificazione attribuiti alle notizie è stato caricato sull'OPAC dell'Indice, per permetterne l'interrogazione anche attraverso questi due canali di ricerca. Attualmente l'OPAC è l'unico strumento a disposizione per effettuare la ricerca di una notizia in Indice mediante il soggetto e/o la classe; infatti queste funzionalità non sono presenti nell'Interrogazione Indice in emulazione terminale 3270, né nella funzione di Interrogazione Indice partendo dalla Catalogazione. Nell'OPAC la ricerca semantica è possibile solo per la base dati Libro moderno in quanto è l'unica, delle tre basi dati presenti, a disporre di queste informazioni.

La ricerca per soggetto può avvenire o digitando nel canale soggetto uno o più parole di ricerca o consultando le liste (lista per parole o lista per stringhe). Se si sceglie la prima ipotesi, il sistema visualizza immediatamente le notizie bibliografiche che hanno per soggetto la/le parole digitate. Se si sceglie la ricerca per liste, è possibile ottenere una lista di parole presenti nelle stringhe di soggetto (lista per parole) o l'insieme delle stringhe di soggetto che cominciano con un dato termine (lista per stringhe). Una volta scelta la parola o la stringa di interesse, il sistema visualizza le notizie collegate.

Nella ricerca per classe mediante la scorrimento di liste è stata prevista la prospettazione di due liste diverse: una lista di numeri che, a partire dal numero digitato, prospetta i simboli di classificazione con il relativo equivalente verbale; e una lista di descrizioni che prospetta, in ordine alfabetico, le intestazioni delle classi a partire dalla parola digitata. Una volta scelta la classe di interesse, il sistema visualizza le notizie classificate con quel numero.

Situazione attuale e prospettive future

Attualmente, nell'Indice SBN, vi sono in tutto: 860.290 titoli che possiedono uno o più soggetti; 796.013 titoli che possiedono la classe; 572.838 titoli che possiedono sia il soggetto che la classe; per un totale di 1.083.465 titoli che sono soggettati e/o classificati.

Considerando che, in totale, le pubblicazioni presenti nell'Indice ammontano a circa 2.816.000, ne deriva che di queste quasi il 40% possiede o il soggetto o la classe. Occorre inoltre ricordare che l'archivio dei soggetti/classi non è stato più aggiornato dal febbraio 1997, ma l'ICCU ha nuovamente chiesto la collaborazione dei Poli per incrementarlo con un nuovo scarico batch relativo ai dati semantici delle notizie inserite nel corso dell'ultimo anno; pertanto la percentuale delle pubblicazioni soggettate e/o classificate dovrebbe considerevolmente aumentare, nel corso dei prossimi mesi.

Tale archivio, per le modalità con cui è stato realizzato, necessita indubbiamente di un'attività di monitoraggio e pulizia simile a quanto si è fatto e si sta facendo per le notizie in SBN. Si dovrà prevedere, fra l'altro, a livello organizzativo, la creazione di una struttura simile a quella già esistente per la pulizia degli autori e dei titoli e la creazione di un software in grado di intercettare errori, duplicazioni, discordanze, difformità etc. L'ICCU intende muoversi per il futuro in questa direzione, con un progetto finalizzato a tale scopo.

Infine, quando saranno attive le funzionalità di Polo relative alla Gestione dei soggetti in Indice, sarà possibile ottenere un incremento maggiore e regolare dell'archivio dei soggetti e classi, a vantaggio sia dell'utente finale sia dell'utente bibliotecario che, se vorrà, potrà usufruire dei vantaggi della cooperazione anche nel campo della catalogazione semantica.


(1) I Poli individuati sono stati i seguenti: CFI/BNI, MIL, L01, BVE, VEA, PUV, UFI, UBO, RAV, NAP, IEI.


torna su