Dal glossario dell'accessibilità

AccessiWeb: il web accessibile e inclusivo

C

Caption (Closed Captions, CC)

Trascrizione sincronizzata dell’audio (dialoghi e suoni significativi) mostrata nel player; le closed si possono attivare/disattivare, le open sono sempre visibili.

Definizione — Le Caption (o Closed Captions, CC) sono testi sincronizzati che riproducono dialoghi e suoni significativi (rumori, musica, speaker) direttamente nel player. A differenza dei “sottotitoli” tradizionali usati per la traduzione, le caption includono informazioni non verbali utili alle persone sorde o ipoudenti.

Perché contano (accessibilità & SEO)

  • Accessibilità: rendono fruibili i contenuti audiovisivi a chi non può sentire o ha difficoltà di comprensione del parlato.
  • UX & contesti d’uso: utili anche in ambienti rumorosi o silenziosi (ufficio, mezzi pubblici).
  • SEO: i testi delle caption (file .vtt) favoriscono indicizzazione tematica e “AI Overview”.

Mappatura normativa

  • WCAG 2.1: 1.2.2 Captions (Prerecorded) (A); 1.2.4 Captions (Live) (AA); correlazioni con 1.2.1/1.2.3 per audio/video.
  • EN 301 549: requisiti per il web che referenziano i criteri WCAG nella sezione 9 (es. 9.1.2.2, 9.1.2.4).

Come implementarle in HTML5

Usa il tag con file WebVTT:

<video controls="" width="640" poster="/media/cover.jpg">
<source class="img-fluid w-100" src="/media/video.mp4" type="video/mp4" />
<track kind="captions" class="img-fluid w-100" src="/media/it.vtt" srclang="it" label="Italiano" default="">
<track kind="captions" class="img-fluid w-100" src="/media/en.vtt" srclang="en" label="English">
Il tuo browser non supporta il video HTML5.
</track>
</track>
</video>

Esempio minima struttura .vtt:

WEBVTT
00:00:02.000 --> 00:00:04.500
[Musica di apertura]
00:00:05.000 --> 00:00:08.000
Speaker: Benvenuti alla guida sull’accessibilità.

Buone pratiche

  • Completezza: includi suoni rilevanti e identificazione del parlante.
  • Sincronizzazione: testi visibili quando il suono è percepibile (± 100–200 ms).
  • Leggibilità: 2–3 righe max, 32–40 caratteri/linea, contrasto sufficiente, area che non copra elementi critici.
  • Multilingua: un file VTT per lingua; imposta default sulla lingua principale.
  • Live caption: per dirette/streaming prevedi stenotipia o ASR con supervisione umana.

Errori comuni

  • Fornire solo trascrizione fuori sincrono (non basta per WCAG 1.2.2/1.2.4).
  • Usare “open captions” rasterizzate nel video senza possibilità di attivazione/disattivazione.
  • Dimenticare suoni non verbali (es. “porta che sbatte”, “applausi”).

Checklist rapida

  • Per tutti i video preregistrati: file .vtt accurato e sincronizzato (WCAG 1.2.2 A).
  • Per le dirette: servizio di caption live (WCAG 1.2.4 AA).
  • Contrasto e dimensione testo adeguati; niente sovrapposizioni critiche.

Voci correlate e collegamenti utili

Naviga il Glossario dell'accessibilità A-Z

Richiedi una consulenza gratuita

Il nostro team di Web Accessibility Expert certificati UNI 11621-3 è pronto a guidarti con le migliori soluzioni per il tuo business!

Contattaci adesso
Parla con un esperto di accessibilità

Ultimi articoli dal blog

Scopri il widget per l'accessibilità web

AccessiWeb

Soluzioni per un web accessibile e inclusivo

Inizia la tua prova gratuita