[Intestazione pagina non disponibile nel Web corrente]

Data base gerarchici, relazionali e information retrival.

L’organizzazione di dati e la scelta dei campi non è un banale fatto tecnico, poiché la base dati è la rappresentazione della realtà che si vuole conoscere, la sua struttura è di vitale importanza per poter disporre di un valido supporto alle analisi e alle sintesi in altre parole la bontà delle conclusioni di una ricerca dipendono in egual misura dalla bontà dei dati e da quella della loro organizzazione.

Se è vero che la schematizzazione dei dati e la codifica favoriscono le possibilità di ricerca e di analisi occorre però aver presente che strutturazione non è sinonimo di semplificazione e quindi la struttura deve tenere conto della complessità degli oggetti che si vogliono analizzare e ciò è particolarmente importante nel campo dell' archeologia e della storia dell' arte in cui la complessità degli elementi in gioco è massima.

Per rappresentare i dati in informatica si utilizzano fondamentalmente due  tipi di stutture:

quella gerarchica e quella relazionale

  Strutture gerarchiche

Si tratta di sistemi efficaci per descrivere realtà logicamente ordinate, le componenti delle informazioni vengono ordinate in modo gerarchico secondo la loro dipendenza.

E’ il sistema più vecchio di data base e per questo è utilizzato in moltissime banche dati si basa su una struttura ad albero (appunto gerarchica) in cui ogni livello contiene tutti i livelli precedenti.

Rispecchia un ordinamento della realtà di tipo aristotelico, basato su categorie o se preferite su scatole cinesi.

  In un sistema gerarchico i rapporti tra i livelli sono sempre del tipo contenitore - contenuto e non ci sono collegamenti orizzontali tra elementi in contenitori diversi, un record padre può contenere uno o più tipo di record figli e a sua volta può essere subordinato ad un altro record

Lo schema seguente mostra un esempio di come potrebbe essere adottata la struttura gerarchica nel contesto archeologico.

wpe1.jpg (16714 byte)

Questo sistema si adatta bene alla classificazione tuttavia si noti come eventuali immagini (di ambienti, monumenti us o reperti) verrebbero ad essere registrate in record diversi e su livelli diversi della struttura e non potrebbero quindi essere trattate in modo omogeneo.

La rigidità dello schema gerarchico risiede nel fatto che una sola può essere la logica che lega tra loro gli elementi di un livello con quello successivo e la ricerca può essere rallentata, anche se si sa esattamente a quale livello cercare, dal fatto che le informazioni possono essere distribuite su più rami paralleli (si veda ad esempio il caso precedentemente citato delle immagini) infine per aggiungere un nuovo elemento occorre individuare esattamente in che punto della struttura (ramo) va collocato.

La struttura Relazionale

Attraverso una struttura relazionale è possibile invece considerare lo stesso oggetto contemporaneamente sotto punti di vista diversi, cronologico, tipologico normativo ecc. mentre con una struttura gerarchica è possibile solo un tipo di interdipendenza tra gli oggetti.

Tale sistema consiste nel porre tra loro in relazione oggetti diversi in maniera libera e risulta a mio avviso particolarmente adatto a rappresentare oggetti della cultura materiale che oltre alle loro intrinseche complessità assommano tre dimensioni nello spazio e  tre nel tempo (genesi, durata, distruzione).

Dallo schema logico fornito in forma grafica a titolo di esempio si capisce bene quale sia la complessità dei diversi dati e dei loro collegamenti, tuttavia essa non è altro che una rappresentazione neanche troppo raffinata degli schemi mentali utilizzati da un ricercatore nello studio della realtà  archeologica; se almeno questa parte del lavoro di collazione tra indizi ed elementi diversi viene registrata nella macchina, sarà forse possibile liberare energie mentali e mnemoniche per sintesi di livello superiore.

La struttura relazionale è per sua natura aperta ad evoluzioni, quella gerarchica molto meno.

E’ anche possibile attraverso l’ istituzione di relazioni di appartenenza (parte di) attivare una struttura gerarchica all’ interno di una relazionale ma tale struttura può essere sostituita in qualsiasi momento da un’altra basata su un’ altra logica

Cliccate qui per vedere  nel dettaglio uno schema relazionale applicato all' archeologia

Le relazioni possono essere di tre tipi:

punto elenco uno a uno
punto elenco uno a molti
punto elenco molti a molti

Attraverso di esse è possibile definire il tipo di rapporti esistenti tra i dati contenuti in diverse tabelle evitando duplicazioni

Differenze

La struttura gerarchica ha il pregio della semplicità e della chiarezza e si adatta bene a organizzare dati ben conosciuti e con poche variabili, per contro la struttura relazionale si presta meglio a descrivere realtà molto articolate.

Abbiamo visto come i dati di più record simili vengano conservati in tabelle, la struttura gerarchica consente la visualizzazione di una tabella alla vota oppure di una tabella con più sottotabelle appartenenti all' ordine inferiore della struttura secondo uno schema simile ad una scheda cartacea o ad un foglio elettronico.

Nelle strutture relazionali invece è possibile creare delle "viste" personalizzate dei dati aggregandoli dalle tabelle che hanno relazioni e per questo il tradizionale concetto di scheda è rivoluzionato

Una struttura dati ha indubbiamente tra le sue funzioni quella di agevolare le ricerche, anche se questo non deve condizionare troppo la logica di acquisizione a questo scopo   le strutture gerarchiche utilizzano la tecnica dell’ information retrival cioè dell’ indicizzazione preventiva, si creano cioè preventivamente degli indici che indirizzano la ricerca verso i record e le tabelle del database che contengono quel tipo di dati, inoltre si può ricorrere a parole chiave che opportunamente indicizzate consentono un' ottima reperibilità dei dati. Questo tuttavia provoca un aumento dello spazio su disco occupato dai dati che può arrivare fino a 10 volte la dimensione iniziale.

Le strutture relazionali invece effettuano la ricerca sul momento e quindi sono potenzialmente più lente, tuttavia non necessitano di parole chiave e si possono utilizzare le stesse relazioni interne per spostasi da un dato all' altro, di questo occorre tenere conto nel disegnare una architettura relazionale perchè un buon sistema di relazioni previene la maggior parte delle ricerche, mentre è comunque possibile indicizzare quei campi (ad esempio il nome di un oggetto) in cui è più probabile che vengano effettuate delle ricerche.

Regole di base

Qualunque sia la struttura dati prescelta occorre avere sempre ben presente qual è l’oggetto del nostro data base , ciò spesso è meno banale di quanto si possa pensare.

Ad esempio se state classificando delle foto dovete decidere se i record riguardano:

punto elenco delle stampe
punto elenco dei negativi
punto elenco l’azione dello scatto
punto elenco il contenuto dell’ immagine

Infatti gli scatti sono azioni uniche ed irripetibili, i negativi sono unici ma duplicabili, le stampe sono oggetti seriali ed i contenuti possono essere comuni a più negativi, stampe o scatti.

La domanda chiave "che cosa esattamente vogliamo rappresentare?" va quindi tenuta sempre presente e deve condizionare tutte le scelte per definire il focus di ogni tabella, contemporaneamente occorre capire quali gruppi di dati sono tra loro interconnessi e vanno trattati in maniera unitaria. In pratica è un processo non dissimile da quello che ci troviamo di fronte in uno scavo stratigrafico o nel creare una tipologia ceramica, dobbiamo decidere in modo coerente che cosa è opportuno accorpare e cosa separare e quali sono le discriminanti logiche di questa operazione.

Indipendentemente dalla struttura adottata alcune scelte sono critiche per la realizzazione di un data base efficace

  1. Abbiamo visto come  innanzi tutto  è importante avere ben chiaro il focus del DB ovvero che cosa si sta schedando.
  2. Occorre scegliere in maniera completa e non equivocabile i descrittori, cioè i campi che definiscono il focus.
  3. Occorre stimare approssimativamente il numero massimo dei record
  4. E' necessario definire quali di questi campi vanno obbligatoriamente riempiti affinchè l’ informazione risulti valida
  5. Bisogna stabilire la codifica ovvero quali campi devono essere controllati da lessici che garantiscano uniformità nei dati.

Quale sistema adottare?

I tradizionali metodi di catalogazione ed information retrival sono funzionali ad usi statistici e di ricerca; ciò che invece è tipico della ricerca umanistica è correlare tra loro più dati o più documenti di natura diversa occorre quindi progettare una banca dati multimediale che possa accogliere i vari tipi di documenti e metterli tra loro in relazione.

Preliminarmente sarà   opportuno separare i dati dal programma in modo da poter gestire la stessa base di dati con più applicativi diversi, anche contemporaneamente.

E' inoltre altrettanto importante definire una architettura aperta del modello di dati per disporre di uno strumento flessibile che possa adattarsi alle esigenze della ricerca e svilupparsi nel tempo supportando sia approfondimenti che utilizzi imprevisti dei dati.

Molti e diversi sono i dati che intervengono in una ricerca archeologica o storico artistica, la tabella seguente  riassume  il quadro generale:

wpe27.jpg (36092 byte)

I sistemi di archiviazione tradizionali (Information retrival) consentono ricerche anche raffinate, tuttavia i documenti che utilizziamo  hanno  la particolarità di fornire nuovi spunti ed interpretazioni ad ogni successiva lettura e nessuna codifica per quanto raffinata può consentire ciò. E’ più opportuno perciò  digitalizzare i documenti integralmente.

Uno schema sia pure ancora grossolano di come possono essere organizzati i dati è riportato di seguito

wpe2.jpg (51115 byte)

E' evidente la funzione del DB centrale che ha lo scopo di correlare tra loro i diversi dati conservando memoria dell' autore e della data dei collegamenti un tale modello di dati privilegia la navigazione rispetto alla ricerca , come in un ipertesto, tuttavia mantiene la struttura di data base relazionale e può conservare memoria dei collegamenti e delle attribuzioni che vanno così ad arricchire il contenuto dei documenti creando una memoria storica della ricerca

 

Esercitazione

Provate a delineare una struttura che organizzi la bibliografia archeologica (articoli di Rivista, Miscellanee, atti di Convegni, Monografie, Corpora).

Utilizzate prima la struttura gerarchica e poi quella relazionale e valutate quale risulta più efficace.

Per scaricare il materiale mostrato in aula cliccate qui

Se avete problemi nello scaricare la lezione vedete le istruzioni