Imagen con letras Unicode escritas sobre un fondo de caracteres varios. — svensson. *Unicode* (CC BY-NC)

Un identificador en Java es una secuencia ilimitada sin espacios de letras y dígitos Unicode, de forma que el primer símbolo de la secuencia debe ser una letra, un símbolo de subrayado (_) o el símbolo dólar ($). Por ejemplo, son válidos los siguientes identificadores:

x5      ατη    NUM_MAX    numCuenta

En la definición anterior decimos que un identificador es una secuencia ilimitada de caracteres Unicode. Pero… ¿qué es Unicode? Unicode es un código de caracteres o sistema de codificación, un alfabeto que recoge los caracteres de prácticamente todos los idiomas importantes del mundo. Las líneas de código en los programas se escriben usando ese conjunto de caracteres Unicode.

Esto quiere decir que en Java se pueden utilizar varios alfabetos como el Griego, Árabe o Japonés. De esta forma, los programas están más adaptados a los lenguajes e idiomas locales, por lo que son más significativos y fáciles de entender tanto para los programadores que escriben el código, como para los que posteriormente lo tienen que interpretar, para introducir alguna nueva funcionalidad o modificación en la aplicación.

Imagen con fondo y palabras varias: identificadores, clases, atributos, etc. — Mª Flor Moncada Añón (Elaboración Propia) (CC BY-NC)

El estándar Unicode originalmente utilizaba 16 bits, pudiendo representar hasta 65.536 caracteres distintos, que es el resultado de elevar dos a la potencia dieciséis. Actualmente Unicode puede utilizar más o menos bits, dependiendo del formato que se utilice: UTF-8, UTF-16 ó UTF-32. A cada carácter le corresponde unívocamente un número entero perteneciente al intervalo de 0 a 2 elevado a n, siendo n el número de bits utilizados para representar los caracteres. Por ejemplo, la letra ñ es el entero 164. Además, el código Unicode es “compatible” con el código ASCII, ya que para los caracteres del código ASCII, Unicode asigna como código los mismos 8 bits, a los que les añade a la izquierda otros 8 bits todos a cero. La conversión de un carácter ASCII a Unicode es inmediata.

Recomendación

Una buena práctica de programación es seleccionar nombres adecuados para las variables, que sean lo más descriptivos posible. Eso ayuda a que el programa se autodocumente y evita un número excesivo de comentarios para aclarar el código. ¡Es muy conveniente hacer el esfuerzo de pensar en un identificador apropiado para las variables!

Para saber más

Enlace para acceder a la documentación sobre las distintas versiones de Unicode en la página web oficial del estándar:

Documentación sobre Unicode