L'HyperText Markup Language (HTML) è il linguaggio utilizzato per dare forma ai milioni di documenti che popolano World Wide Web. Si tratta di un linguaggio orientato alla descrizione di documenti testuali con alcune estensioni per il trattamento di dati multimediali e soprattutto di collegamenti ipertestuali.
Lo sviluppo dell'HTML negli anni è stato piuttosto disordinato. Nella sua prima versione ufficiale, il linguaggio era estremamente semplice, e non prevedeva la possibilità di rappresentare fenomeni testuali ed editoriali complessi. Di conseguenza le sue specifiche hanno subito diverse revisioni ed estensioni, che hanno dato origine a diverse versioni ufficiali, nonché ad una serie di estensioni introdotte dai vari produttori di browser Web. Questi raffinamenti successivi, accogliendo le sollecitazioni provenienti da una comunità di utenti sempre più vasta e variegata, hanno progressivamente allargato la capacità rappresentazionale del linguaggio, introducendo elementi dedicati al controllo strutturale e formale dei documenti.
Le revisioni ufficiali vengono gestite da un gruppo di lavoro del
World Wide Web Consortium. Nel dicembre del 1997 è stata rilasciata ufficialmente l'ultima versione del linguaggio, denominata HTML 4. HTML 4.0 aggiorna notevolmente la precedente versione 3.2, e accoglie molte novità che erano precedentemente parte dei vari dialetti proprietari (ad esempio la tecnologia dei frame, che permette di suddividere la finestra del browser in sottofinestre contenenti file diversi, e le tabelle).
Ma le caratteristiche più rilevanti di questa versione sono senza dubbio l'attenzione dedicata alla internazionalizzazione e l'integrazione del linguaggio HTML con un sistema di fogli di stile in modo da distinguere la struttura astratta del documento dalla sua presentazione formale. Inoltre HTML 4.0 è in grado di rappresentare sistemi di scrittura che hanno direzioni di scrittura diverse da quella occidentale (ad esempio gli arabi scrivono da destra verso sinistra). Dunque, potenzialmente, esso permette la redazione e distribuzione di documenti redatti in ogni lingua e alfabeto e di documenti multilingua.
Queste innovazioni si aggiungono agli elementi di base di HTML, che permettono di strutturare un documento e di inserire riferimenti ipertestuali e oggetti multimediali in una pagina Web. Ad esempio è possibile indicare i diversi livelli dei titoli di un documento, lo stile dei caratteri (corsivo, grassetto...), i capoversi, la presenza di liste (numerate o no). Volendo realizzare un documento ipermediale, avremo a disposizione anche marcatori specifici per la definizione dei link ipertestuali e per l'inserimento di immagini. Naturalmente le immagini non sono parte integrante del file HTML, che in quanto tale è un semplice file di testo. I file grafici vengono inviati come oggetti autonomi dal server, e inseriti in una pagina Web solo durante l'operazione di visualizzazione effettuata dal browser. I formati di immagini digitali standard su Web sono il GIF e il JPEG. Si tratta di sistemi di codifica grafica in grado di comprimere notevolmente la dimensione del file, e pertanto particolarmente adatti ad un uso su rete. Attraverso i
comandi HTML è possibile anche specificare alcune strutture interattive come moduli di immissione attraverso cui l'utente può inviare comandi e informazioni al server e attivare speciali procedure (ricerche su database, invio di posta elettronica e anche pagamenti attraverso carta di credito!); oppure disegnare tabelle.