Definizione — Le Caption (o Closed Captions, CC) sono testi sincronizzati che riproducono dialoghi e suoni significativi (rumori, musica, speaker) direttamente nel player. A differenza dei “sottotitoli” tradizionali usati per la traduzione, le caption includono informazioni non verbali utili alle persone sorde o ipoudenti.
Perché contano (accessibilità & SEO)
- Accessibilità: rendono fruibili i contenuti audiovisivi a chi non può sentire o ha difficoltà di comprensione del parlato.
- UX & contesti d’uso: utili anche in ambienti rumorosi o silenziosi (ufficio, mezzi pubblici).
- SEO: i testi delle caption (file
.vtt
) favoriscono indicizzazione tematica e “AI Overview”.
Mappatura normativa
- WCAG 2.1: 1.2.2 Captions (Prerecorded) (A); 1.2.4 Captions (Live) (AA); correlazioni con 1.2.1/1.2.3 per audio/video.
- EN 301 549: requisiti per il web che referenziano i criteri WCAG nella sezione 9 (es. 9.1.2.2, 9.1.2.4).
Come implementarle in HTML5
Usa il tag
con file WebVTT:
<video controls="" width="640" poster="/media/cover.jpg">
<source class="img-fluid w-100" src="/media/video.mp4" type="video/mp4" />
<track kind="captions" class="img-fluid w-100" src="/media/it.vtt" srclang="it" label="Italiano" default="">
<track kind="captions" class="img-fluid w-100" src="/media/en.vtt" srclang="en" label="English">
Il tuo browser non supporta il video HTML5.
</track>
</track>
</video>
Esempio minima struttura .vtt
:
WEBVTT
00:00:02.000 --> 00:00:04.500
[Musica di apertura]
00:00:05.000 --> 00:00:08.000
Speaker: Benvenuti alla guida sull’accessibilità.
Buone pratiche
- Completezza: includi suoni rilevanti e identificazione del parlante.
- Sincronizzazione: testi visibili quando il suono è percepibile (± 100–200 ms).
- Leggibilità: 2–3 righe max, 32–40 caratteri/linea, contrasto sufficiente, area che non copra elementi critici.
- Multilingua: un file VTT per lingua; imposta
default
sulla lingua principale.
- Live caption: per dirette/streaming prevedi stenotipia o ASR con supervisione umana.
Errori comuni
- Fornire solo trascrizione fuori sincrono (non basta per WCAG 1.2.2/1.2.4).
- Usare “open captions” rasterizzate nel video senza possibilità di attivazione/disattivazione.
- Dimenticare suoni non verbali (es. “porta che sbatte”, “applausi”).
Checklist rapida
- Per tutti i video preregistrati: file
.vtt
accurato e sincronizzato (WCAG 1.2.2 A).
- Per le dirette: servizio di caption live (WCAG 1.2.4 AA).
- Contrasto e dimensione testo adeguati; niente sovrapposizioni critiche.
Voci correlate e collegamenti utili
Naviga il Glossario dell'accessibilità A-Z
Richiedi una consulenza gratuita
Il nostro team di Web Accessibility Expert certificati UNI 11621-3 è pronto a guidarti con le migliori soluzioni per il tuo business!
Contattaci adesso