Il sito è attualmente in manutenzione.
Ci scusiamo per il disagio.



 

Documentazione

 

Riferimenti a documentazione generale su biblioteche digitali, codifica testuale e metadati.

 

Architettura

L'intera archiettura software di BibIt si basa su prodotti open source. Le sezioni statiche del sito sono gestite dal un server web Apache 2 con estensione PHP 4. Le funzioni di 'visulizzazione del testo' in formasto HTML e di 'ricerca testuale' della biblioteca digitale sono basate sul framework XTF (eXtensible Text Framework) sviluppato dalla California Digital Library e adattato da Fabio Ciotti. Questo sistema produce dinamicamente una versione HTML dei documenti XML, e ne indicizza i contenuti, consentendo di effettuare ricerche full-text e contestuali.

 

Il sistema di gestione back-office dei metadati è stato implementato con una applicazione Web J2se/ STRUTS (battezzata B-MES) che si appoggia sul DB XML nativo (Exist). Il servlet viene eseguito dall'application server Tomcat 6. Il front-end per l'interrogazione dei metadati si basa su procedure XQuery eseguite da Exist in cooperazione con il framework di pubbblicazione XML Apache Cocoon.

 

Metadati

L'architettura della biblioteca, basata in buona parte sul modello OAIS, prevede un sistema per la gestione delle risorse digitali (archiviazione in formato XML/TEI e disseminazione in vari formati) e un sistema per la gestione dei metadati associati a ciascun oggetto, basato sullo schema METS e su un insieme di schemi ausiliari.

 

Lo schema METS (adottato in funzione di AIP) costituisce un framework nel quale raccogliere i metadati descrittivi, tecnici e strutturali relativi a ciascuna risorsa testuale facente parte della collezione. All'interno del framework METS sono stati inseriti i seguenti schemi di metadati:

 

  • MODS 3.0 per la registrazione dei metadati descrittivi dell'oggetto digitale;
  • BibiIt Digital Text Metadata Set (DTMS), uno schema sviluppato internamente per la registrazione dei metadati tecnici dei diversi formati testuali che costituiscono le diverse manifestazioni di una risorsa;
  • METS Schema for Rights Declaration (http://cosimo.stanford.edu/sdr/metsrights.xsd), uno schema sviluppato presso la Library of Congress per la registrazione di semplici informazioni sullo stato giuridico della risorsa digitale;
  • BibIt Digital Provenance Metadata Set (DPMS), uno schema sviluppato internamente per la registrazione dei metadati relativi alla provenienza e alla storia degli interventi di trasformazione della risorsa digitale.

 

Ogni documento METS contiene infine i puntatori ai diversi file che contengono in vari formati la risorsa testuale. Il TEI Header dei testi XML è generato automaticamente mediante una trasformazione XSL a partire dal record METS.

 

Codifica testuale

Bibit ha adottato come linguaggio di codifica dei testi lo schema di codifica della Text Encoding Initiative (TEI P4), basato sulla sintassi del linguaggio XML (Extensible markup Language). Per chi non abbia alcuna consocenza di questo schema di codifca abbiamo predisposto una breve introduzione alla Text Encoding.

 

Data la vastità dello schema TEI, nell’ambito del progetto Bibit sono stati individuati diversi livelli di codifica ai quali un testo può essere sottoposto. Attualmente i testi della biblioteca digitale sono tutti ai seguenti livelli di codifica:

  • Livello 1: divisioni strutturali, citazioni esplicite, enfasi e segmenti in lingue diverse dalla lingua base del testo
  • Livello 2: divisioni strutturali con indicazioni esplicite di tipologia, citazioni esplicite, enfasi, titoli di testi citati e segmenti in lingue diverse dalla lingua base del testo, semplici interventi editoriali

 

 

Documentazione relativa allo schema di codifica BibIt

 

Manuale di riferimento per la codifica testuale: livello 1

DTD TEI P4 BibIt

Documentazione estensioni alla DTD TEI P4