La biblioteca digitale consente di vedere parte dei documenti di una biblioteca tradizionale attraverso un monitor: in particolare si tratta sempre di collezioni uniformi da un punto di vista tematico, complessivamente organizzate e per questo dotate di un insieme di relazioni interdocumentali e intradocumentali, e mediante un adeguato apparato di metadati. In questo senso possiamo distinguere una biblioteca digitale da un insieme non organizzato di informazioni assolutamente eterogenee come il Web, ma anche da molti archivi testuali che attualmente sono disponibili su Internet e che si presentano come depositi testuali piuttosto che come vere e proprie biblioteche.
Internet ormai ospita un ingente numero di banche dati testuali, di varia tipologia che si spacciano per biblioteche digitali: in realtà gran parte di queste esperienze sono ancora lontane dall'incarnare esattamente la definizione proposta precedentemente ma nello stesso tempo dimostrano l'enorme potenzialità della rete come strumento di diffusione dell'informazione e di fruizione del sapere. Spesso, infatti, si incorre in un errore di valutazione: occorre infatti operare una distinzione tra quelle biblioteche che mettono a disposizione una o più pagine Web informative su orari, servizi, collezioni, storia e talvolta anche l'accesso remoto al proprio catalogo in linea, l'OPAC (Online Public Access Catalog) - e solo per questo si spacciano per biblioteche digitali - e quelle che associano il proprio catalogo con le risorse digitali. La crescente popolarità di Internet, infatti, ha spinto molte biblioteche che avevano già automatizzato il proprio catalogo a metterlo a disposizione dell'intera comunità degli utilizzatori di Internet, inizialmente attraverso il protocollo Telnet e recentemente anche attraverso la più amichevole interfaccia grafica del Web ma sempre limitandosi ai soli riferimenti bibliografici.
Il problema della conservazione a lungo termine del patrimonio documentale è di capitale importanza sia per le biblioteche tradizionali che per quelle digitali ma, mentre per le prime il concetto di conservazione si lega alla deperibilità dei materiali (libri, periodici, incunaboli, manoscritti documenti d'archivio etc.), per le seconde esso si articola su tre livelli: livello hardware, livello software e livello dei sistemi di codifica dei documenti. La curva di invecchiamento delle tecnologie informatiche, infatti, è molto rapida e impone un periodico aggiornamento di qualsiasi sistema informativo e contemporaneamente tale aggiornamento rende, a volte, inaccessibili le risorse informative generate mediante gli strumenti divenuti obsoleti. Questo può portare ad una situazione in apparenza paradossale: i libri a stampa possono tranquillamente superare i cinquecento anni di vita mantenendo pressoché inalterata la loro condizione fisica mentre un documento elettronico rischia di divenire inutilizzabile nel giro di pochissimi anni; per questo la conservazione a lungo termine dei documenti digitali richiede l'adozione di sistemi standardizzati.
Un altro tratto distintivo delle biblioteche digitali su Internet, infine, riguarda il tipo di ente, organizzazione o struttura che ha realizzato la biblioteca e ne cura la manutenzione. Si possono riconoscere in particolare tre classi: progetti realizzati all'interno del mondo bibliotecario tradizionale, progetti di ricerca accademici e progetti non istituzionali a carattere volontario.
Il primo gruppo è costituito da una serie di sperimentazioni avviate dalle grandi biblioteche nazionali o da consorzi bibliotecari, con forti finanziamenti pubblici o, per quanto attiene al nostro continente, comunitari.
Il secondo gruppo è costituito da sperimentazioni e servizi realizzati in ambito accademico, solitamente molto specializzati perché possono disporre di strumenti tecnologici e di competenze specifiche molto qualificate.
Il terzo gruppo è costituito da organizzazioni e associazioni private no - profit di natura volontaria che creano database di testi che l'utente può prelevare liberamente e poi utilizzare: si tratta, ovviamente, di testi liberi dai diritti d'autore (di cui si parlerà nei paragrafi successivi). Le edizioni elettroniche contenute in questi archivi, tuttavia, non hanno sempre un grado di affidabilità filologica elevato. L'esempio probabilmente più famoso in Italia è costituito dal
Progetto Manuzio, gestito dall'associazione culturale senza fini di lucro Liber Liber , fondato con lo scopo di promuovere la realizzazione di una biblioteca di testi elettronici liberamente e gratuitamente consultabili e scaricabili, comprendente in primo luogo i classici della letteratura italiana. Si tratta di un progetto volontario nato sulla scia di iniziative simili sorte all'estero e sempre dedicate alla letteratura locale, quali il Progetto Gutenberg . Di ogni volume viene fornita non l'immagine ma la trascrizione in formato ASCII al fine rendere possibili una serie di operazioni (ricerche veloci di termini, analisi statistiche,…) che in un libro tradizionale sarebbero possibili solo con un grande dispiego di energie e di tempo e si garantisce, inoltre, la correttezza filologica di ogni testo.