L’organizzazione di dati e la scelta dei campi non è un banale fatto tecnico, poiché la base dati è la rappresentazione della realtà che si vuole conoscere, la sua struttura è di vitale importanza per poter disporre di un valido supporto alle analisi e alle sintesi in altre parole la bontà delle conclusioni di una ricerca dipendono in egual misura dalla bontà dei dati e da quella della loro organizzazione.[Intestazione pagina non disponibile nel Web corrente]
Data base gerarchici, relazionali e information retrival.
Se è vero che la schematizzazione dei dati e la codifica favoriscono le possibilità di ricerca e di analisi occorre però aver presente che strutturazione non è sinonimo di semplificazione e quindi la struttura deve tenere conto della complessità degli oggetti che si vogliono analizzare e ciò è particolarmente importante nel campo dell' archeologia e della storia dell' arte in cui la complessità degli elementi in gioco è massima.
Per rappresentare i dati in informatica si utilizzano fondamentalmente due tipi di stutture:
quella gerarchica e quella relazionale
Strutture gerarchiche Si tratta di sistemi efficaci per descrivere realtà logicamente ordinate, le componenti delle informazioni vengono ordinate in modo gerarchico secondo la loro dipendenza.E’ il sistema più vecchio di data base e per questo è utilizzato in moltissime banche dati si basa su una struttura ad albero (appunto gerarchica) in cui ogni livello contiene tutti i livelli precedenti.
Rispecchia un ordinamento della realtà di tipo aristotelico, basato su categorie o se preferite su scatole cinesi.
In un sistema gerarchico i rapporti tra i livelli sono sempre del tipo contenitore - contenuto e non ci sono collegamenti orizzontali tra elementi in contenitori diversi, un record padre può contenere uno o più tipo di record figli e a sua volta può essere subordinato ad un altro record
Lo schema seguente mostra un esempio di come potrebbe essere adottata la struttura gerarchica nel contesto archeologico.
Questo sistema si adatta bene alla classificazione tuttavia si noti come eventuali immagini (di ambienti, monumenti us o reperti) verrebbero ad essere registrate in record diversi e su livelli diversi della struttura e non potrebbero quindi essere trattate in modo omogeneo.
La rigidità dello schema gerarchico risiede nel fatto che una sola può essere la logica che lega tra loro gli elementi di un livello con quello successivo e la ricerca può essere rallentata, anche se si sa esattamente a quale livello cercare, dal fatto che le informazioni possono essere distribuite su più rami paralleli (si veda ad esempio il caso precedentemente citato delle immagini) infine per aggiungere un nuovo elemento occorre individuare esattamente in che punto della struttura (ramo) va collocato.
Tale sistema consiste nel porre tra loro in relazione oggetti diversi in maniera libera e risulta a mio avviso particolarmente adatto a rappresentare oggetti della cultura materiale che oltre alle loro intrinseche complessità assommano tre dimensioni nello spazio e tre nel tempo (genesi, durata, distruzione).
Dallo schema logico fornito in forma grafica a titolo di esempio si capisce bene quale sia la complessità dei diversi dati e dei loro collegamenti, tuttavia essa non è altro che una rappresentazione neanche troppo raffinata degli schemi mentali utilizzati da un ricercatore nello studio della realtà archeologica; se almeno questa parte del lavoro di collazione tra indizi ed elementi diversi viene registrata nella macchina, sarà forse possibile liberare energie mentali e mnemoniche per sintesi di livello superiore.
La struttura relazionale è per sua natura aperta ad evoluzioni, quella gerarchica molto meno.
E’ anche possibile attraverso l’ istituzione di relazioni di appartenenza (parte di) attivare una struttura gerarchica all’ interno di una relazionale ma tale struttura può essere sostituita in qualsiasi momento da un’altra basata su un’ altra logica
Cliccate qui per vedere nel dettaglio uno schema relazionale applicato all' archeologia
Le relazioni possono essere di tre tipi:
uno a uno | |
uno a molti | |
molti a molti |
Attraverso di esse è possibile definire il tipo di rapporti esistenti tra i dati contenuti in diverse tabelle evitando duplicazioni
Differenze La struttura gerarchica ha il pregio della semplicità e della chiarezza e si adatta bene a organizzare dati ben conosciuti e con poche variabili, per contro la struttura relazionale si presta meglio a descrivere realtà molto articolate.Abbiamo visto come i dati di più record simili vengano conservati in tabelle, la struttura gerarchica consente la visualizzazione di una tabella alla vota oppure di una tabella con più sottotabelle appartenenti all' ordine inferiore della struttura secondo uno schema simile ad una scheda cartacea o ad un foglio elettronico.
Nelle strutture relazionali invece è possibile creare delle "viste" personalizzate dei dati aggregandoli dalle tabelle che hanno relazioni e per questo il tradizionale concetto di scheda è rivoluzionato
Una struttura dati ha indubbiamente tra le sue funzioni quella di agevolare le ricerche, anche se questo non deve condizionare troppo la logica di acquisizione a questo scopo le strutture gerarchiche utilizzano la tecnica dell’
information retrival cioè dell’ indicizzazione preventiva, si creano cioè preventivamente degli indici che indirizzano la ricerca verso i record e le tabelle del database che contengono quel tipo di dati, inoltre si può ricorrere a parole chiave che opportunamente indicizzate consentono un' ottima reperibilità dei dati. Questo tuttavia provoca un aumento dello spazio su disco occupato dai dati che può arrivare fino a 10 volte la dimensione iniziale.Le strutture relazionali invece effettuano la ricerca sul momento e quindi sono potenzialmente più lente, tuttavia non necessitano di parole chiave e si possono utilizzare le stesse relazioni interne per spostasi da un dato all' altro, di questo occorre tenere conto nel disegnare una architettura relazionale perchè un buon sistema di relazioni previene la maggior parte delle ricerche, mentre è comunque possibile indicizzare quei campi (ad esempio il nome di un oggetto) in cui è più probabile che vengano effettuate delle ricerche.
Regole di base
Qualunque sia la struttura dati prescelta occorre avere sempre ben presente qual è l’oggetto del nostro data base , ciò spesso è meno banale di quanto si possa pensare.Ad esempio se state classificando delle foto dovete decidere se i record riguardano
:delle stampe | |
dei negativi | |
l’azione dello scatto | |
il contenuto dell’ immagine |
Infatti gli scatti sono azioni uniche ed irripetibili, i negativi sono unici ma duplicabili, le stampe sono oggetti seriali ed i contenuti possono essere comuni a più negativi, stampe o scatti.
La domanda chiave "che cosa esattamente vogliamo rappresentare?" va quindi tenuta sempre presente e deve condizionare tutte le scelte per definire il focus di ogni tabella, contemporaneamente occorre capire quali gruppi di dati sono tra loro interconnessi e vanno trattati in maniera unitaria. In pratica è un processo non dissimile da quello che ci troviamo di fronte in uno scavo stratigrafico o nel creare una tipologia ceramica, dobbiamo decidere in modo coerente che cosa è opportuno accorpare e cosa separare e quali sono le discriminanti logiche di questa operazione.
Indipendentemente dalla struttura adottata alcune scelte sono critiche per la realizzazione di un data base efficace
Preliminarmente sarà opportuno separare i dati dal programma in modo da poter gestire la stessa base di dati con più applicativi diversi, anche contemporaneamente.
E' inoltre altrettanto importante definire una architettura aperta del modello di dati per disporre di uno strumento flessibile che possa adattarsi alle esigenze della ricerca e svilupparsi nel tempo supportando sia approfondimenti che utilizzi imprevisti dei dati.
Molti e diversi sono i dati che intervengono in una ricerca archeologica o storico artistica, la tabella seguente riassume il quadro generale:
Uno schema sia pure ancora grossolano di come possono essere organizzati i dati è riportato di seguito
E' evidente la funzione del DB centrale che ha lo scopo di correlare tra loro i diversi dati conservando memoria dell' autore e della data dei collegamenti un tale modello di dati privilegia la navigazione rispetto alla ricerca , come in un ipertesto, tuttavia mantiene la struttura di data base relazionale e può conservare memoria dei collegamenti e delle attribuzioni che vanno così ad arricchire il contenuto dei documenti creando una memoria storica della ricerca
Esercitazione Provate a delineare una struttura che organizzi la bibliografia archeologica (articoli di Rivista, Miscellanee, atti di Convegni, Monografie, Corpora).
Utilizzate prima la struttura gerarchica e poi quella relazionale e valutate quale risulta più efficace.
Per scaricare il materiale mostrato in aula cliccate qui
Se avete problemi nello scaricare la lezione vedete le istruzioni