Uno dei problemi più complessi da affrontare riguarda la codifica di caratteri non numerici in digitale. Si sono susseguiti nel tempo tantissimi standard, ampliando di volta in volta la quantità di caratteri codificabili in modo da poter andare incontro alle esigenze delle lingue più disparate.
Gli URI sono una sintatti usata nel WWW per definire i nomi e gli indirizzi di risorse su Internet, risolvendo il problema di creare un meccanismo di accesso unificato alle risorse disponibili via rete.
Una risorsa è una qualunque struttura che sia oggetto di scambio nel WWW, a prescindere dal tipo di contenuto. Una risorsa potrebbe essere una voce in un database, l’output di una elaborazione o un concetto astratto.
Attraverso gli URI il WWW è stato in grado di identificare risorse accessibili tramite i vari protocolli (HTTP, FTP, ecc.) in maniera universare e indipendentemente dal protocollo usato.
Gli URI si dividono in due grandi categorie, che sono gli URL e gli URN: