Estructuras de almacenamiento de información.

Caso práctico

Fotografía de María.
Ministerio de Educación y FP (CC BY-NC)



Ana ha recibido un pequeño encargo de parte de su tutora, María. Se trata de que realice un pequeño programita, muy sencillo pero fundamental.

-Hola Ana -dice María-, hoy tengo una tarea especial para ti.

-¿Sí? -responde Ana-. Estoy deseando, últimamente no hay nada que se me resista, llevo dos semanas en racha.

-Bueno, quizás esto se te resista un poco más, es fácil, pero tiene cierta complicación. Un cliente para el que hicimos una aplicación, nos ha dicho si podemos ayudarle. El cliente tiene una aplicación para gestionar los pedidos que recibe de sus clientes. Normalmente, recibe por correo electrónico los pedidos en un formato concreto que todos sus clientes llevan tiempo usando. El cliente suele transcribir el pedido desde el correo electrónico a la aplicación, copiando dato a dato, pero nos ha preguntado si es posible que copie todo el pedido de golpe, y que la aplicación lo procese, detectando posibles errores en el pedido.

-¿Qué? -dice María con cierta perplejidad.

-Me alegra que te guste -dice María esbozando una sonrisa picara-, sé que te gustan los retos.

-Pero, ¿eso cómo se hace? ¿Cómo compruebo yo si el pedido es válido? ¿Y si el cliente ha puesto un producto que no existe?

-No mujer, se trata de comprobar si el pedido tiene el formato correcto y transformarlo de forma que se incorpore fácilmente a los otros pedidos que tenga el cliente en su base de datos. De la verificación de si hay algún producto que no existe, o de si hay alguna incoherencia en el pedido se encarga otra parte del software, que ya he realizado yo.

magen de las manos de una persona insertando datos en el ordenador a través del teclado.
ITE. Óscar Javier Estupiñán Estupiñán (CC BY-NC)

Cuando el volumen de datos a manejar por una aplicación es elevado, no basta con utilizar variables. Manejar los datos de un único pedido en una aplicación puede ser relativamente sencillo, pues un pedido está compuesto por una serie de datos y eso simplemente se traduce en varias variables. Pero, ¿qué ocurre cuando en una aplicación tenemos que gestionar varios pedidos a la vez?

Lo mismo ocurre en otros casos. Para poder realizar ciertas aplicaciones se necesita poder manejar datos que van más allá de meros datos simples (números y letras). A veces, los datos que tiene que manejar la aplicación son datos compuestos, es decir, datos que están compuestos a su vez de varios datos más simples. Por ejemplo, un pedido está compuesto por varios datos, los datos podrían ser el cliente que hace el pedido, la dirección de entrega, la fecha requerida de entrega y los artículos del pedido.

Los datos compuestos son un tipo de estructura de datos, y en realidad ya los has manejado. Las clases son un ejemplo de estructuras de datos que permiten almacenar datos compuestos, y el objeto en sí, la instancia de una clase, sería el dato compuesto. Pero, a veces, los datos tienen estructuras aún más complejas, y son necesarias soluciones adicionales.

Aquí podrás aprender esas soluciones adicionales. Esas soluciones consisten básicamente en la capacidad de poder manejar varios datos del mismo o diferente tipo de forma dinámica y flexible.

1.- Introducción a las estructuras de almacenamiento.

Lista de números de la que hay que calcular el mayor.
Salvador Romero Villegas (CC BY-NC)

¿Cómo almacenarías en memoria un listado de números del que tienes que extraer el valor máximo? Seguro que te resultaría fácil. Pero, ¿y si el listado de números no tiene un tamaño fijo, sino que puede variar en tamaño de forma dinámica? Entonces la cosa se complica.

Un listado de números que aumenta o decrece en tamaño es una de las cosas que aprenderás a utilizar aquí, utilizando estructuras de datos. Pasaremos por alto las clases y los objetos, pues ya los has visto con anterioridad, pero debes saber que las clases en sí mismas son la evolución de un tipo de estructuras de datos conocidas como datos compuestos (también llamadas registros). Las clases, además de aportar la ventaja de agrupar datos relacionados entre sí en una misma estructura (característica aportada por los datos compuestos), permiten agregar métodos que manejen dichos datos, ofreciendo una herramienta de programación sin igual. Pero todo esto ya lo sabías.

Las estructuras de almacenamiento, en general, se pueden clasificar de varias formas. Por ejemplo, atendiendo a si pueden almacenar datos de diferente tipo, o si solo pueden almacenar datos de un solo tipo, se pueden distinguir:

  • Estructuras con capacidad de almacenar varios datos del mismo tipo: varios números, varios caracteres, etc. Ejemplos de estas estructuras son los arrays, las cadenas de caracteres, las listas y los conjuntos.
  • Estructuras con capacidad de almacenar varios datos de distinto tipo: números, fechas, cadenas de caracteres, etc., todo junto dentro de una misma estructura. Ejemplos de este tipo de estructuras son las clases.

Otra forma de clasificar las estructuras de almacenamiento va en función de si pueden o no cambiar de tamaño de forma dinámica:

  • Estructuras cuyo tamaño se establece en el momento de la creación o definición y su tamaño no puede variar después. Ejemplos de estas estructuras son los arrays y las matrices (arrays multimensionales).
  • Estructuras cuyo tamaño es variable (conocidas como estructuras dinámicas). Su tamaño crece o decrece según las necesidades de forma dinámica. Es el caso de las listas, árboles, conjuntos y, como veremos también, el caso de algunos tipos de cadenas de caracteres.

Por último, atendiendo a la forma en la que los datos se ordenan dentro de la estructura, podemos diferenciar varios tipos de estructuras:

  • Estructuras que no se ordenan de por sí, y debe ser el programador el encargado de ordenar los datos si fuera necesario. Un ejemplo de estas estructuras son los arrays.
  • Estructuras ordenadas. Se trata de estructuras que al incorporar un dato nuevo a todos los datos existentes, este se almacena en una posición concreta que irá en función del orden. El orden establecido en la estructura puede variar dependiendo de las necesidades del programa: alfabético, orden numérico de mayor a menor, momento de inserción, etc.

Todavía no conoces mucho de las estructuras, y probablemente todo te suena raro y extraño. No te preocupes, poco a poco irás descubriéndolas. Verás que son sencillas de utilizar y muy cómodas.

Estructura de datos que almacena uno o varios datos de diferente tipo (números enteros, cadenas de texto, números flotantes, ...) de forma conjunta, porque dichos datos están íntimamente relacionados entre sí. Por ejemplo, una dirección está compuesta de varios datos: calle (cadena de texto), número (número entero), código postal (cadena de texto), etc.

Autoevaluación

Pregunta

El tamaño de las estructuras de almacenamiento siempre se determina en el momento de la creación. ¿Verdadero o falso?

Respuestas

Verdadero.

Falso.

Retroalimentación

2.- Cadenas de caracteres.

Caso práctico

Ana está asustada, le acaban de asignar una nueva tarea y le acaban de enviar por correo el formato del archivo que tiene que procesar. El archivo tiene un formato concreto, un tanto extraño. Primero tiene una cabecera con información general del pedido, y luego tiene los artículos del pedido, cada uno en una línea diferente. ¿Podrá realizar la tarea encomendada?. En este momento lo que le preocupa es cómo evaluar las líneas del pedido, mas adelante se encargará de estudiar cómo se puede leer el contenido del fichero y procesarlo.

La empresa recibe los pedidos siguiendo un modelo normalizado. En realidad se trata de una pequeña aplicación web que al rellenar un formulario, envía un correo electrónico con la información siguiendo una estructura fija. A continuación puedes ver un ejemplo:

Persona utilizando un ordenador de mano.
ITE idITE=160222 (CC BY-NC)
## PEDIDO ##
Número de pedido: { 20304 }
Cliente: { Muebles Bonitos S.A. }
Código del cliente: { 00293 }
Dirección de factura: { C/ De en frente, 11 }
} Dirección de entrega: { C/ De al lado, 22 }
Nombre del contacto: { Elias }
Teléfono del contacto: { 987654321 }
Correo electrónico del contacto: { mail@mail1234.com }
Fecha preferente de entrega: { 19/11/2012 }
Forma de pago: { Transferencia }
## ARTICULOS ##
{ Código Artículo | Descripción | Cantidad }
{ 0001231 | Tuercas tipo 1 | 200 }
{ 0001200 | Tornillos tipo 1 | 200 }
{ 0002200 | Arandelas tipo 2 | 200 }
## FIN ARTICULOS ##
## FIN PEDIDO ##

Como puedes observar, el pedido tiene una estructura fija, y solamente cambian los datos que están entre llaves. El resto del texto es fijo, dado que como se ha dicho antes, el pedido lo genera una aplicación web, y lo envía por correo electrónico al cliente.

Cuando un cliente solicita un pedido a esta empresa, no puede poner en ningún campo los símbolos "{", "}", ni "|", porque entonces entraría en conflicto con el formato enviado por correo y daría problemas, así que se optó por impedir que el cliente pudiera poner dichos caracteres extraños. Esto garantiza que cada campo del pedido se va a poder leer adecuadamente.

Lo más conflictivo, es la sección de artículos del pedido, en su primera parte, tiene una especie de cabecera que ayuda a identificar que es cada una de las columnas. Y después, tiene tantas líneas como artículos tenga el pedido, si tiene 100 artículos, tendrán 100 líneas que incluirán: código del artículo, descripción del artículo y la cantidad.

Fotografía que muestra la imagen de una cadena.
ITE. Pedro García Barbudo (CC BY-NC)

Probablemente, una de las cosas que mas utilizarás cuando estés programando en cualquier lenguaje de programación son las cadenas de caracteres. Las cadenas de caracteres son estructuras de almacenamiento que permiten almacenar una secuencia de caracteres de casi cualquier longitud. Y la pregunta ahora es, ¿qué es un carácter?

En Java y en todo lenguaje de programación, y por ende, en todo sistema informático, los caracteres se codifican como secuencias de bits que representan a los símbolos usados en la comunicación humana. Estos símbolos pueden ser letras, números, símbolos matemáticos e incluso ideogramas y pictogramas.

La codificación es la representación interna de cada carácter dentro de un ordenador. Cada símbolo usado en la comunicación humana tiene que traducirse en una serie de unos y ceros que puedan almacenarse en el ordenador, dado que un símbolo, como tal, no puede almacenarse. Después será el software del ordenador el encargado de transformar el código binario en una representación gráfica reconocible por el ser humano. Las codificaciones más extendidas son American Standard Code for Information Interchange.ASCII International Organization for Standardization885915, y la más usada hoy día, 8-bit Unicode Transformation Format.UTF-8, recogida dentro las codificaciones del estándar Unicode (UTF8, 16-bit Unicode Transformation Format.UTF-16 y Unicode Transformation Format.UTF-32).

Imagen, ilustración o dibujo que en algunos idiomas puede tener un significado y que pueden ser leídos, como por ejemplo los ideogramas del egipcio antiguo, del chino o del japonés.

Signo, generalmente a modo de dibujo, que representa una idea, un símbolo común o una figura real. Un ejemplo de pictograma son los emoticonos, con ellos se expresan emociones.

Para saber más

Si quieres puedes profundizar en la codificación de caracteres leyendo el siguiente artículo de la Wikipedia.

Codificación de caracteres.

La forma más habitual de ver escrita una cadena de caracteres es como un literal de cadena. Consiste simplemente en una secuencia de caracteres entre comillas dobles, por ejemplo: "Ejemplo de cadena de caracteres".

En Java, los literales de cadena son en realidad instancias de la clase String, lo cual quiere decir que, por el mero hecho de escribir un literal, se creará una instancia de dicha clase. Esto da mucha flexibilidad, puesto que permite crear cadenas de muchas formas diferentes, pero obviamente consume mucha memoria. La forma más habitual es crear una cadena partiendo de un literal:

String cad="Ejemplo de cadena";

En este caso, el literal de cadena situado a la derecha del igual es en realidad una instancia de la clase String. Al realizar esta asignación hacemos que la variable cad se convierta en una referencia al objeto ya creado. Otra forma de crear una cadena es usando el operador new y un constructor, como por ejemplo:

String cad=new String ("Ejemplo de cadena");

Cuando se crean las cadenas de esta forma, se realiza una copia en memoria de la cadena pasada por parámetro. La nueva instancia de la clase String hará referencia por tanto a la copia de la cadena, y no al original.

Reflexiona

Fijate en el siguiente línea de código, ¿cuantas instancias de la clase String ves?

String cad="Ejemplo de cadena 1"; cad="Ejemplo de cadena 2"; cad=new String("Ejemplo de cadena 3");

2.1.- Operaciones avanzadas con cadenas de caracteres (I).

¿Qué operaciones puedes hacer con una cadena? Muchas más de las que te imaginas. Empezaremos con la operación mas sencilla: la concatenación. La concatenación es la unión de dos cadenas, para formar una sola. En Java es muy sencillo, pues sólo tienes que utilizar el operador de concatenación (signo de suma):

String cad = "¡Bien"+"venido!";

System.out.println(cad);

En la operación anterior se esta creando una nueva cadena, resultado de unir dos cadenas: una cadena con el texto "¡Bien", y otra cadena con el texto "venido!". La segunda línea de código muestra por la salida estándar el resultado de la concatenación. El resultado de su ejecución será que aparecerá el texto "¡Bienvenido!" por la pantalla.

Otra forma de usar la concatenación, que ilustra que cada literal de cadena es a su vez una instancia de la clase String, es usando el método concat del objeto String:

String cad="¡Bien".concat("venido!");

System.out.printf(cad);

Fíjate bien en la expresión anterior, pues genera el mismo resultado que la primera opción y en ambas participan tres instancias de la clase String. Una instancia que contiene el texto "¡Bien", otra instancia que contiene el texto "venido!", y otra que contiene el texto "¡Bienvenido!". La tercera cadena se crea nueva al realizar la operación de concatenación, sin que las otras dos hayan desaparecido. Pero no te preocupes por las otras dos cadenas, pues se borrarán de memoria cuando el recolector de basura detecte que ya no se usan.

Fíjate además, que se puede invocar directamente un método de la clase String, posponiendo el método al literal de cadena. Esto es una señal de que al escribir un literal de cadena, se crea una instancia del objeto inmutable String.

Pero no solo podemos concatenar una cadena a otra cadena. Gracias al método toString() podemos concatenar cadenas con literales numéricos e instancias de otros objetos sin problemas.

La salida estándar refiere al lugar donde por defecto se muestra la información en un programa, generalmente es la pantalla, aunque se puede configurar que la salida estándar sea otra, como por ejemplo una impresora.

Es una pieza clave de Java. Se trata de un mecanismo para ir eliminando de memoria aquellas instancias de clases u objetos que ya no están siendo utilizados.

Los objetos inmutables son aquellos que no se pueden modificar una vez creados. Es el caso de los String de Java, así como las clases envoltorio Integer, Float, Double, etc.

El método toString() es un método disponible en todas las clases de Java. Su objetivo es simple, permitir la conversión de una instancia de clase en cadena de texto, de forma que se pueda convertir a texto el contenido de la instancia. Lo de convertir, no siempre es posible, hay clases fácilmente convertibles a texto, como es la clase Integer, por ejemplo, y otras que no se pueden convertir, y que el resultado de invocar el método toString() es información relativa a la instancia.

La gran ventaja de la concatenación es que el método toString() se invocará automáticamente, sin que tengamos que especificarlo, por ejemplo:

Integer i1=new Integer (1223); // La instancia i1 de la clase Integer contiene el número 1223.

System.out.println("Número: " + i1); // Se mostrará por pantalla el texto "Número: 1223"

En el ejemplo anterior, se ha invocado automáticamente i1.toString(), para convertir el número a cadena. Esto se realizará para cualquier instancia de clase concatenada, pero cuidado, como se ha dicho antes, no todas las clases se pueden convertir a cadenas.

Autoevaluación

Pregunta

¿Qué se mostrará como resultado de ejecutar el siguiente código System.out.println(4+1+"-"+4+1); ?

Respuestas

Mostrará la cadena "5-41".

Mostrará la cadena "41-14".

Esa operación dará error.

Retroalimentación

2.1.1.- Operaciones avanzadas con cadenas de caracteres (II).

Vamos a continuar revisando las operaciones que se pueden realizar con cadenas. Como verás las operaciones a realizar se complican un poco a partir de ahora. En todos los ejemplos la variable cad contiene la cadena "¡Bienvenido!", como se muestra en las imágenes.

  • int length(). Retorna un número entero que contiene la longitud de una cadena, resultado de contar el número de caracteres por la que esta compuesta. Recuerda que un espacio es también un carácter.
    Imagen que ilustra como cada carácter de una cadena ocupa una única posición, y que el número de posiciones de la cadena es en definitiva la longitud de la cadena.
    Salvador Romero Villegas (CC BY-NC)
  • Imagen que ilustra la posición de cada carácter en una cadena de 12 caracteres, la cadena es “¡Bienvenido!”. Los caracteres empiezan a numerarse en cero, hasta la longitud total de la cadena menos uno. El primero carácter, el carácter cero, será el carácter más a la izquierda de la cadena. El último carácter será el símbolo de cerrar admiración (!). Los caracteres se pueden obtener individualmente con el método charAt de la clase String.
    Salvador Romero Villegas (CC BY-NC)
    char charAt(int pos). Retorna el carácter ubicado en la posición pasada por parámetro. El carácter obtenido de dicha posición será almacenado en un tipo de dato char. Las posiciones se empiezan a contar desde el 0 (y no desde el 1), y van desde 0 hasta longitud - 1.Por ejemplo, el código siguiente mostraría por pantalla el carácter "v":
    
    
    char t = cad.charAt(5);
    
    System.out.println(t);
  • String substring(int beginIndex, int endIndex). Este método permite extraer una subcadena de otra de mayor tamaño. Una cadena compuesta por todos los caracteres existentes entre la posición beginIndex y la posición endIndex - 1. Por ejemplo, si pusiéramos cad.substring(0,5) en nuestro programa, sobre la variable cad anterior, dicho método devolvería la subcadena "¡Bien" tal y como se muestra en la imagen.
    Imagen que ilustra el conjunto de caracteres a los que corresponderían dos extracciones de caracteres usando el método substring, sobre la cadena “¡Bienvenido!”. La primera extracción va desde el carácter 0 al 5, y correspondería con la subcadena “¡Bien”. La segunda extracción va desde el carácter 5 al 11 y correspondería con la subcadena “venido!”. La tercera extracción extrae los caracteres desde la posición 2 en adelante, y extraería la cadena “ienvenido!”.
    Salvador Romero Villegas (CC BY-NC)
  • String substring (int beginIndex). Cuando al método substring solo le proporcionamos un parámetro, extraerá una cadena que comenzará en el carácter con posición beginIndex e irá hasta el final de la cadena. En el siguiente ejemplo se mostraría por pantalla la cadena "ienvenido!":
    
    
    String subcad = cad.substring(2);
    
    System.out.println(subcad);

Otra operación muy habitual es la conversión de número a cadena y de cadena a número. Imagínate que un usuario introduce su edad. Al recoger la edad desde la interfaz de usuario, capturarás generalmente una cadena, pero, ¿cómo compruebas que la edad es mayor que 0? Para poder realizar esa comprobación tienes que pasar la cadena a número. Empezaremos por ver como se convierte un número a cadena.

Los números generalmente se almacenan en memoria como números binarios, es decir, secuencias de unos y ceros con los que se puede operar (sumar, restar, etc.). No debes confundir los tipos de datos que contienen números (int, short, long, float y double) con las secuencias de caracteres que representan un número. No es lo mismo 123 que "123", el primero es un número y el segundo es una cadena formada por tres caracteres: '1', '2' y '3'.

Convertir un número a cadena es fácil desde que existe, para todas las clases Java, el método toString(). Gracias a ese método podemos hacer cosas como las siguientes:

String cad2="Número cinco: " + 5;

System.out.println(cad2);

El resultado del código anterior es que se mostrará por pantalla "Número cinco: 5", y no dará ningún error. Esto es posible gracias a que Java convierte el número 5 a su clase envoltorio (wrapper class) correspondiente (Integer, Float, Double, etc.), y después ejecuta automáticamente el método toString() de dicha clase.

Las clases envoltorio son clases que encapsulan tipos de datos básicos, tales como int, short, double, etc. Sirven básicamente para poder usar los tipos básicos como si fueran objetos. Las clases envoltorio son generalmente inmutables.

Reflexiona

¿Cuál crees que será el resultado de poner System.out.println("A"+5f)? Pruébalo y recuerda: no olvides indicar el tipo de literal (f para lo literales de números flotantes, y d para los literales de números dobles), así obtendrás el resultado esperado y no algo diferente.

2.1.2.- Operaciones avanzadas con cadenas de caracteres (III).

Imagen que muestra un muñeco, junto con una cinta de medir que mide su estatura, ilustrando que la comparación de objetos es sencilla para nosotros, pero no tan fácil para un ordenador.
ITE idITE=109534 (CC BY-NC)

¿Cómo comprobarías que la cadena "3" es mayor que 0? No puedes comparar directamente una cadena con un número, así que necesitarás aprender cómo convertir cadenas que contienen números a tipos de datos numéricos (int, short, long, float o double). Esta es una operación habitual en todos los lenguajes de programación, y Java, para este propósito, ofrece los métodos valueOf, existentes en todas las clases envoltorio descendientes de la clase Number: Integer, Long, Short, Float y Double.

Veamos un ejemplo de su uso para un número de doble precisión, para el resto de las clases es similar:

String c="1234.5678";

double n;
try {  

     n=Double.valueOf(c).doubleValue();

} catch (NumberFormatException e)

{  /* Código a ejecutar si no se puede convertir */  }

Fijate en el código anterior, en él puedes comprobar cómo la cadena c contiene en su interior un número, pero escrito con dígitos numéricos (caracteres). El código escrito esta destinado a transformar la cadena en número, usando el método valueOf. Este método lanzará la excepción NumberFormatException si no consigue convertir el texto a número. En el siguiente archivo, tienes un ejemplo más completo, donde aparecen también ejemplos para las otros tipos numéricos:

Ejemplo de conversión de cadena de texto a número.

Seguro que ya te vas familiarizando con este embrollo y encontrarás interesante todas estas operaciones. Ahora te planteamos otro reto: imagina que tienes que mostrar el precio de un producto por pantalla. Generalmente, si un producto vale, por ejemplo 3,3 euros, el precio se debe mostrar como "3,30 ", es decir, se le añade un cero extra al final para mostrar las centésimas. Con lo que sabemos hasta ahora, usando la concatenación en Java, podemos conseguir que una cadena se concatene a un número flotante, pero el resultado no será el esperado. Prueba el siguiente código:

float precio=3.3f;

System.out.println("El precio es: "+precio+"€");

Si has probado el código anterior, habrás comprobado que el resultado no muestra "3,30 €" sino que muestra "3,3 €". ¿Cómo lo solucionamos? Podríamos dedicar bastantes líneas de código hasta conseguir algo que realmente funcione, pero no es necesario, dado que Java y otros lenguajes de programación (como C), disponen de lo que se denomina formateado de cadenas. En Java podemos "formatear" cadenas a través del método estático format disponible en el objeto String. Este método permite crear una cadena proyectando los argumentos en un formato específico de salida. Lo mejor es verlo con un ejemplo, veamos cuál sería la solución al problema planteado antes:

float precio=3.3f;

String salida=string.format ("El precio es: %.2f €", precio));

System.out.println(salida);

El formato de salida, también denominado "cadena de formato", es el primer argumento del método format. La variable precio, situada como segundo argumento, es la variable que se proyectará en la salida siguiendo un formato concreto. Seguro que te preguntarás, ¿qué es "%.2f"? Pues es un especificador de formato, e indica cómo se deben formatear o proyectar los argumentos que hay después de la cadena de formato en el método format.

Operación consistente en especificar como queremos que se transforme un dato, generalmente numérico, en cadena. Dicha conversión permite especificar de forma precisa cosas como el número de decimales que queremos que tenga el resultado.

Es una subcadena dentro de una cadena que especifica como se debe formatear un dato concreto que se pasa como argumento al método format. El especificador de formato está formado por un carácter de escape seguido de varios símbolos destinados a describir como será el formato de salida.

Debes conocer

En el Anexo I de esta Unidad puedes profundizar sobre el método format y los especificadores de formato.

2.1.3.- Operaciones avanzadas con cadenas de caracteres (IV).

¿Cómo puedo comprobar si dos cadenas son iguales? ¿Qué más operaciones ofrece Java sobre las cadenas? Java ofrece un montón de operaciones más sobre cadenas de caracteres. En la siguiente tabla puedes ver las operaciones más importantes. En todos los ejemplos expuestos, las variables cad1, cad2 y cad3 son cadenas ya existentes, y la variable num es un número entero mayor o igual a cero.

Varias personas operando en un quirófano.
Mass Communication Specialist 3rd Class Matthew Jackson. U.S. Navy (Dominio público)
.
Métodos importantes de la clase String.
Método. Descripción
cad1.compareTo(cad2) Permite comparar dos cadenas entre sí lexicográficamente. Retornará 0 si son iguales, un número menor que cero si la cadena (cad1) es anterior en orden alfabético a la que se pasa por argumento (cad2), y un número mayor que cero si la cadena es posterior en orden alfabético.
cad1.equals(cad2) Cuando se comparan si dos cadenas son iguales, no se debe usar el operador de comparación "==", sino el método equals. Retornará true si son iguales, y false si no lo son.
cad1.compareToIgnoreCase(cad2)
cad1.equalsIgnoreCase(cad2)
El método compareToIgnoreCase funciona igual que el método compareTo, pero ignora las mayúsculas y las minúsculas a la hora de hacer la comparación. Las mayúsculas van antes en orden alfabético que las minúsculas, por lo que hay que tenerlo en cuenta. El método equalsIgnoresCase es igual que el método equals pero sin tener en cuenta las minúsculas.
cad1.trim() Genera una copia de la cadena eliminando los espacios en blanco anteriores y posteriores de la cadena.
cad1.toLowerCase() Genera una copia de la cadena con todos los caracteres a minúscula.
cad1.toUpperCase() Genera una copia de la cadena con todos los caracteres a mayúsculas.
cad1.indexOf(cad2)
cad1.indexOf(cad2,num)
Si la cadena o carácter pasado por argumento está contenida en la cadena invocante, retorna su posición, en caso contrario retornará -1. Opcionalmente se le puede indicar la posición a partir de la cual buscar, lo cual es útil para buscar varias apariciones de una cadena dentro de otra.
cad1.contains(cad2) Retornará true si la cadena pasada por argumento está contenida dentro de la cadena. En caso contrario retornará false.
cad1.startsWith(cad2) Retornará true si la cadena comienza por la cadena pasada como argumento. En caso contrario retornará false.
cad1.endsWith(cad2) Retornará true si la cadena acaba por la cadena pasada como argumento. En caso contrario retornará false.
cad1.replace(cad2,cad3) Generará una copia de la cadena cad1, en la que se reemplazarán todas las apariciones de cad2 por cad3. El reemplazo se hará de izquierda a derecha, por ejemplo: reemplazar "zzz" por "xx" en la cadena "zzzzz" generará "xxzz" y no "zzxx".

Autoevaluación

Pregunta

¿Cuál será el resultado de ejecutar cad1.replace("l","j").indexOf("ja") si cad1 contiene la cadena "hojalata"?

Respuestas

2.

3.

4.

-1.

Retroalimentación

2.1.4.- Operaciones avanzadas con cadenas de caracteres (V).

Imagen que muestra varios módulos de memoria, donde se almacenan los datos que va manejando nuestro programa.
ITE. Juan Manuel Rubio Marauri idITE=133011 (CC BY-NC)

¿Sabes cuál es el principal problema de las cadenas de caracteres? Su alto consumo de memoria. Cuando realizamos un programa que realiza muchísimas operaciones con cadenas, es necesario optimizar el uso de memoria.

En Java, String es un objeto inmutable, lo cual significa, entre otras cosas, que cada vez que creamos un String, o un literal de String, se crea un nuevo objeto que no es modificable. Java proporciona la clase StringBuilder, la cual es un mutable, y permite una mayor optimización de la memoria. También existe la clase StringBuffer, pero consume mayores recursos al estar pensada para aplicaciones multi-hilo, por lo que en nuestro caso nos centraremos en la primera.

Pero, ¿en que se diferencian StringBuilder de la clase String? Pues básicamente en que la clase StringBuilder permite modificar la cadena que contiene, mientras que la clase String no. Como ya se dijo antes, al realizar operaciones complejas se crea una nueva instancia de la clase String.

Veamos un pequeño ejemplo de uso de esta clase. En el ejemplo que vas a ver, se parte de una cadena con errores, que modificaremos para ir haciéndola legible. Lo primero que tenemos que hacer es crear la instancia de esta clase. Se puede inicializar de muchas formas, por ejemplo, partiendo de un literal de cadena:

StringBuilder strb=new StringBuilder ("Hoal Muuundo");

Y ahora, usando los métodos append (insertar al final), insert (insertar una cadena o carácter en una posición específica), delete (eliminar los caracteres que hay entre dos posiciones) y replace (reemplazar los caracteres que hay entre dos posiciones por otros diferentes), rectificaremos la cadena anterior y la haremos correcta:

  1. strb.delete(6,8); Eliminamos las 'uu' que sobran en la cadena. La primera 'u' que sobra está en la posición 6 (no olvides contar el espacio), y la última 'u' a eliminar está en la posición 7. Para eliminar dichos caracteres de forma correcta hay que pasar como primer argumento la posición 6 (posición inicial) y como segundo argumento la posición 8 (posición contigua al último carácter a eliminar), dado que la posición final no indica el último carácter a eliminar, sino el carácter justo posterior al último que hay que eliminar (igual que ocurría con el método substring).
  2. strb.append ("!"); Añadimos al final de la cadena el símbolo de cierre de exclamación.
  3. strb.insert (0,"¡"); Insertamos en la posición 0, el símbolo de apertura de exclamación.
  4. strb.replace (3,5,"la"); Reemplazamos los caracteres 'al' situados entre la posición inicial 3 y la posición final 4, por la cadena 'la'. En este método ocurre igual que en los métodos delete y substring, en vez de indicar como posición final la posición 4, se debe indicar justo la posición contigua, es decir 5.

StringBuilder contiene muchos métodos de la clase String (charAt, indexOf, lenght, substring, replace, etc.), pero no todos, pues son clases diferentes con funcionalidades realmente diferentes.

Es lo contrario a un objeto inmutable. Son objetos que una vez creados se pueden modificar sin problemas.

Se trata de aplicaciones que ejecutan varias líneas de ejecución simultáneamente y que necesitan acceder a datos compartidos. Cuando varias líneas de ejecución, cada una a su ritmo, necesitan acceder a datos compartidos hay que tener mucho cuidado, para que los datos que manejan no sean incoherentes.

Debes conocer

En la siguiente página puedes encontrar más información (en inglés) sobre como utilizar la clase StringBuilder.

Uso de la clase StringBuilder.

Autoevaluación

Pregunta

Rotar una cadena es poner simplemente el primer carácter al final, y retroceder el resto una posición. Después de unas cuantas rotaciones la cadena queda igual. ¿Cuál de las siguientes expresiones serviría para hacer una rotación (rotar solo una posición)?

Respuestas

stb.delete (0,1); strb.append(stb.charAt(0));

strb.append(strb.charAt(0));strb.delete(0, 1);

strb.append(strb.charAt(0));strb.delete(0);

strb.append(strb.charAt(1));strb.delete(1,2);

Retroalimentación

2.2.- Expresiones regulares (I).

Fotografía en la que se ve un DNI y otros documentos de una cartera.
ITE idITE=111041 (CC BY-NC)

¿Tienen algo en común todos los números de DNI y de NIE? ¿Podrías hacer un programa que verificara si un DNI o un NIE es correcto? Seguro que sí. Si te fijas, los números de DNI y los de NIE tienen una estructura fija: X1234567Z (en el caso del NIE) y 1234567Z (en el caso del DNI). Ambos siguen un patrón que podría describirse como: una letra inicial opcional (solo presente en los NIE), seguida de una secuencia numérica y finalizando con otra letra. ¿Fácil no?

Pues esta es la función de las expresiones regulares: permitir comprobar si una cadena sigue o no un patrón preestablecido. Las expresiones regulares son un mecanismo para describir esos patrones, y se construyen de una forma relativamente sencilla. Existen muchas librerías diferentes para trabajar con expresiones regulares, y casi todas siguen, más o menos, una sintaxis similar, con ligeras variaciones. Dicha sintaxis nos permite indicar el patrón de forma cómoda, como si de una cadena de texto se tratase, en la que determinados símbolos tienen un significado especial. Por ejemplo "[01]+" es una expresión regular que permite comprobar si una cadena conforma un número binario. Veamos cuáles son las reglas generales para construir una expresión regular:

  • Podemos indicar que una cadena contiene un conjunto de símbolos fijo, simplemente poniendo dichos símbolos en el patrón, excepto para algunos símbolos especiales que necesitarán un carácter de escape como veremos más adelante. Por ejemplo, el patrón "aaa" admitirá cadenas que contengan tres aes.
  • "[xyz]". Entre corchetes podemos indicar opcionalidad. Solo uno de los símbolos que hay entre los corchetes podrá aparecer en el lugar donde están los corchetes. Por ejemplo, la expresión regular "aaa[xy]" admitirá como válidas las cadenas "aaax" y la cadena "aaay". Los corchetes representan una posición de la cadena que puede tomar uno de varios valores posibles.
  • "[a-z]" "[A-Z]" "[a-zA-Z]". Usando el guión y los corchetes podemos indicar que el patrón admite cualquier carácter entre la letra inicial y la final. Es importante que sepas que se diferencia entre letras mayúsculas y minúsculas, no son iguales de cara a las expresiones regulares.
  • "[0-9]". Y nuevamente, usando un guión, podemos indicar que se permite la presencia de un dígito numérico entre 0 y 9, cualquiera de ellos, pero solo uno.

Con las reglas anteriores podemos indicar el conjunto de símbolos que admite el patrón y el orden que deben tener. Si una cadena no contiene los símbolos especificados en el patrón, en el mismo orden, entonces la cadena no encajará con el patrón. Veamos ahora como indicar repeticiones:

  • "a?". Usaremos el interrogante para indicar que un símbolo puede aparecer una vez o ninguna. De esta forma la letra "a" podrá aparecer una vez o simplemente no aparecer.
  • "a*". Usaremos el asterisco para indicar que un símbolo puede aparecer una vez o muchas veces, pero también ninguna. Cadenas válidas para esta expresión regular serían "aa", "aaa" o "aaaaaaaa".
  • "a+". Usaremos el símbolo de suma para indicar que otro símbolo debe aparecer al menos una vez, pudiendo repetirse cuantas veces quiera.
  • "a{1,4}" . Usando las llaves, podemos indicar el número mínimo y máximo de veces que un símbolo podrá repetirse. El primer número del ejemplo es el número 1, y quiere decir que la letra "a" debe aparecer al menos una vez. El segundo número, 4, indica que como máximo puede repetirse cuatro veces.
  • "a{2,}". También es posible indicar solo el número mínimo de veces que un carácter debe aparecer (sin determinar el máximo), haciendo uso de las llaves, indicando el primer número y poniendo la coma (no la olvides).
  • "a{5}". A diferencia de la forma anterior, si solo escribimos un número entre llaves, sin poner la coma detrás, significará que el símbolo debe aparecer un número exacto de veces. En este caso, la "a" debe aparecer exactamente 5 veces.
  • "[a-z]{1,4}[0-9]+". Los indicadores de repetición se pueden usar también con corchetes, dado que los corchetes representan, básicamente, un símbolo. En el ejemplo anterior se permitiría de una a cuatro letras minúsculas, seguidas de al menos un dígito numérico.

Modelo con el que encaja la información que estamos analizando o que simplemente se ha utilizado para construir dicha información. Un patrón, en el caso de la informática, está constituido por una serie de reglas fijas que deben cumplirse o ser seguidas para formar la información. Las direcciones de correo electrónico, por ejemplo, todas tienen la misma forma, y eso es porque todas siguen el mismo patrón para ser construidas.

Ejercicio resuelto

Con lo visto hasta ahora ya es posible construir una expresión regular capaz de verificar si una cadena contiene un DNI o un NIE, ¿serías capaz de averiguar cuál es dicha expresión regular?

2.2.1.- Expresiones regulares (II).

Imagen en la que se ven varias piezas de un puzzle sueltas encima de una mesa.
ITE idITE=110172 (CC BY-NC)


¿Y cómo uso las expresiones regulares en un programa? Pues de una forma sencilla. Para su uso, Java ofrece las clases Pattern y Matcher contenidas en el paquete java.util.regex.*. La clase Pattern se utiliza para procesar la expresión regular y "compilarla", lo cual significa verificar que es correcta y dejarla lista para su utilización. La clase Matcher sirve para comprobar si una cadena cualquiera sigue o no un patrón. Veamoslo con un ejemplo:

Pattern p=Pattern.compile("[01]+");

Matcher m=p.matcher("00001010");

if (m.matches()) System.out.println("Si, contiene el patrón");

else System.out.println("No, no contiene el patrón");

En el ejemplo, el método estático compile de la clase Pattern permite crear un patrón, dicho método compila la expresión regular pasada por parámetro y genera una instancia de Pattern (p en el ejemplo). El patrón p podrá ser usado múltiples veces para verificar si una cadena coincide o no con el patrón, dicha comprobación se hace invocando el método matcher, el cual combina el patrón con la cadena de entrada y genera una instancia de la clase Matcher (m en el ejemplo). La clase Matcher contiene el resultado de la comprobación y ofrece varios métodos para analizar la forma en la que la cadena ha encajado con un patrón:

  • m.matches(). Devolverá true si toda la cadena (de principio a fin) encaja con el patrón o false en caso contrario.
  • m.lookingAt(). Devolverá true si el patrón se ha encontrado al principio de la cadena. A diferencia del método matches(), la cadena podrá contener al final caracteres adicionales a los indicados por el patrón, sin que ello suponga un problema.
  • m.find(). Devolverá true si el patrón existe en algún lugar la cadena (no necesariamente toda la cadena debe coincidir con el patrón) y false en caso contrario, pudiendo tener más de una coincidencia. Para obtener la posición exacta donde se ha producido la coincidencia con el patrón podemos usar los métodos m.start() y m.end(), para saber la posición inicial y final donde se ha encontrado. Una segunda invocación del método find() irá a la segunda coincidencia (si existe), y así sucesivamente. Podemos reiniciar el método find(), para que vuelva a comenzar por la primera coincidencia, invocando el método m.reset().

Veamos algunas construcciones adicionales que pueden ayudarnos a especificar expresiones regulares más complejas:

  • "[^abc]". El símbolo "^", cuando se pone justo detrás del corchete de apertura, significa "negación". La expresión regular admitirá cualquier símbolo diferente a los puestos entre corchetes. En este caso, cualquier símbolo diferente de "a", "b" o "c".
  • "^[01]+$". Cuando el símbolo "^" aparece al comienzo de la expresión regular, permite indicar comienzo de línea o de entrada. El símbolo "$" permite indicar fin de línea o fin de entrada. Usándolos podemos verificar que una línea completa (de principio a fin) encaje con la expresión regular, es muy útil cuando se trabaja en modo multilínea y con el método find().
  • ".". El punto simboliza cualquier carácter.
  • "\\d". Un dígito numérico. Equivale a "[0-9]".
  • "\\D". Cualquier cosa excepto un dígito numérico. Equivale a "[^0-9]".
  • "\\s". Un espacio en blanco (incluye tabulaciones, saltos de línea y otras formas de espacio).
  • "\\S". Cualquier cosa excepto un espacio en blanco.
  • "\\w". Cualquier carácter que podrías encontrar en una palabra. Equivale a "[a-zA-Z_0-9]".

Las cadenas que contienen en su interior más de un salto de línea a veces no se procesan bien con las expresiones regulares, dado que estas se limitan a verificar generalmente solo la primera línea. El modo multilínea permite buscar líneas completas que encajan con un patrón dentro de una cadena que contiene varias líneas.

Autoevaluación

Pregunta

¿En cuáles de las siguientes opciones se cumple el patrón "A.\\d+"?

Respuestas

"GA-99" si utilizamos el método find.

"GAX99" si utilizamos el método lookingAt.

"AX99-" si utilizamos el método matches.

"A99" si utilizamos el método matches.

Retroalimentación

2.2.2.- Expresiones regulares (III).

Imagen que muestra los símbolos de paréntesis impresos en un teclado.
ITE idITE=112591 (CC BY-NC)


¿Te resultan difíciles las expresiones regulares? Al principio siempre lo son, pero no te preocupes. Hasta ahora has visto como las expresiones regulares permiten verificar datos de entrada, permitiendo comprobar si un dato indicado sigue el formato esperado: que un DNI tenga el formato esperado, que un email sea un email y no otra cosa, etc. Pero ahora vamos a dar una vuelta de tuerca adicional.

Los paréntesis, de los cuales no hemos hablado hasta ahora, tienen un significado especial, permiten indicar repeticiones para un conjunto de símbolos, por ejemplo: "(#[01]){2,3}". En el ejemplo anterior, la expresión "#[01]" admitiría cadenas como "#0" o "#1", pero al ponerlo entre paréntesis e indicar los contadores de repetición, lo que estamos diciendo es que la misma secuencia se tiene que repetir entre dos y tres veces, con lo que las cadenas que admitiría serían del estilo a: "#0#1" o "#0#1#0".

Pero los paréntesis tienen una función adicional, y es la de permitir definir grupos. Un grupo comienza cuando se abre un paréntesis y termina cuando se cierra el paréntesis. Los grupos permiten acceder de forma cómoda a las diferentes partes de una cadena cuando esta coincide con una expresión regular. Lo mejor es verlo con un ejemplo (seguro que te resultará familiar):

Pattern p=Pattern.compile("([XY]?)([0-9]{1,9})([A-Za-z])");

Matcher m=p.matcher("X123456789Z Y00110011M 999999T");

while (m.find())
{

   System.out.println("Letra inicial (opcional):"+m.group(1));

   System.out.println("Número:"+m.group(2));

   System.out.println("Letra NIF:"+m.group(3));

}

Usando los grupos, podemos obtener por separado el texto contenido en cada uno de los grupos. En el ejemplo anterior, en el patrón hay tres grupos: uno para la letra inicial (grupo 1), otro para el número del DNI o NIE (grupo 2), y otro para la letra final o letra NIF (grupo 3). Al ponerlo en grupos, usando el método group(), podemos extraer la información de cada grupo y usarla a nuestra conveniencia.

Ten en cuenta que el primer grupo es el 1, y no el 0. Si pones m.group(0) obtendrás una cadena con toda la ocurrencia o coincidencia del patrón en la cadena, es decir, obtendrás la secuencia entera de símbolos que coincide con el patrón.

En el ejemplo anterior se usa el método find, éste buscará una a una, cada una de las ocurrencias del patrón en la cadena. Cada vez que se invoca, busca la siguiente ocurrencia del patrón y devolverá true si ha encontrado una ocurrencia. Si no encuentra en una iteración ninguna ocurrencia es porque no existen más, y retornará false, saliendo del bucle. Esta construcción while es muy típica para este tipo de métodos y para las iteraciones, que veremos más adelante.

Lo último importante de las expresiones regulares que debes conocer son las secuencias de escape. Cuando en una expresión regular necesitamos especificar que lo que tiene que haber en la cadena es un paréntesis, una llave, o un corchete, tenemos que usar una secuencia de escape, dado que esos símbolos tienen un significado especial en los patrones. Para ello, simplemente antepondremos "\\" al símbolo. Por ejemplo, "\\(" significará que debe haber un paréntesis en la cadena y se omitirá el significado especial del paréntesis. Lo mismo ocurre con "\\[", "\\]", "\\)", etc. Lo mismo para el significado especial del punto, éste, tiene un significado especial (¿Lo recuerdas del apartado anterior?) salvo que se ponga "\\.", que pasará a significar "un punto" en vez de "cualquier carácter". La excepción son las comillas, que se pondrían con una sola barra: "\"".

Para saber más

Con lo estudiado hasta ahora, ya puedes utilizar las expresiones regulares y sacarles partido casi que al máximo. Pero las expresiones regulares son un campo muy amplio, por lo que es muy aconsejable que amplíes tus conocimientos con el siguiente enlace:

Tutorial de expresiones regulares en Java (en inglés).

Debes conocer

Existen herramientas online disponibles para evaluar expresiones regulares en diferentes lenguajes, entre ellas Java.

En el siguiente enlace puedes acceder a un ejemplo de los muchos que existen en la red.

Freeformatter.com

3.- Creación de arrays.

Caso práctico

Fotografía de una mujer pensando.
ITE idITE=109713 (CC BY-NC)

Después del susto inicial, al recibir el archivo con el formato de pedido, Ana se puso a pensar. Vio que lo más adecuado era procesar el archivo de pedido línea a línea, viendo con que corresponde cada línea a través de expresiones regulares. Aún no le preocupa el procesamiento del fichero, sino más bien cómo procesar los datos leídos del mismo.

Para identificar si hay un inicio o fin de sección dentro del pedido, así como el inicio o fin del listado de artículos, ha decidido usar la siguiente expresión regular:

"^##[ ]*(FIN){0,1}[ ]*(PEDIDO|ARTICULOS)[ ]*##$".

Y para identificar cada dato del pedido (nombre, dirección, etc.) va a utilizar la siguiente expresión regular: 

"^(.+):.*\\{(.*)\\}$"

Al usar grupos le permitirá separar el nombre del campo (dirección por ejemplo) de su valor (dirección concreta). La expresión regular le ha costado mucho trabajo y ha tenido que pedir ayuda, pero después, una vez que la ha conseguido, se ha dado cuenta de que ha sido relativamente fácil.

Ana ha decidido de todas formas verificar sus expresiones regulares a través de alguna herramienta online. Para ello, se ha puesto a investigar sobre algunas de ellas y en principio utilizará freeformatter. Para ello, tomando los datos de ejemplo del fichero de pedidos, podrá comprobar que sus expresiones regulares están bien formadas.

Ya tiene parte del trabajo hecho. Como comentamos arriba, aún no le preocupa el procesado del fichero sino la parte de artículos. Básicamente tiene dudas sobre donde almacenar la información procesada, en especial, la lista de artículos.

Acrónimo inglés de8-bit Unicode Transformation Format, que significa formato de Transformación Unicode de 8 bits. Una de las codificaciones de caracteres, recogidas dentro del estándar Unicode, más utilizada hoy día.

Ilustración que describe la numeración de las diferentes posiciones de un array de números enteros. En la imagen aparece los datos de un array de 10 posiciones, y una etiqueta en la que cada elemento está numerado, empezando por el cero como posición del primer elemento, hasta el 9, como posición del último elemento del array.
Salvador Romero Villegas. (CC BY-NC)

¿Y dónde almacenarías tú la lista de artículos del pedido? Una de las soluciones es usar arrays, puede que sea justo lo que necesita Ana, pero puede que no. Todos los lenguajes de programación permiten el uso de arrays, veamos como son en Java.

Los arrays permiten almacenar una colección de objetos o datos del mismo tipo. Son muy útiles y su utilización es muy simple:

  • Declaración del array. La declaración de un array consiste en decir "esto es un array" y sigue la siguiente estructura: "tipo[] nombre;". El tipo será un tipo de variable o una clase ya existente, de la cual se quieran almacenar varias unidades.
  • Creación del array. La creación de un array consiste en decir el tamaño que tendrá el array, es decir, el número de elementos que contendrá, y se pone de la siguiente forma: "nombre=new tipo[dimension]", donde dimensión es un número entero positivo que indicará el tamaño del array. Una vez creado el array este no podrá cambiar de tamaño.

Veamos un ejemplo de su uso:

int[] n; // Declaración del array.

n = new int[10]; //Creación del array reservando para el un espacio en memoria.

int[] m=new int[10]; // Declaración y creación en un mismo lugar.

Una vez hecho esto, ya podemos almacenar valores en cada una de las posiciones del array, usando corchetes e indicando en su interior la posición en la que queremos leer o escribir, teniendo en cuenta que la primera posición es la cero y la última el tamaño del array menos uno. En el ejemplo anterior, la primera posición sería la 0 y la última sería la 9.

Autoevaluación

Pregunta

¿Cuáles de las siguientes opciones permitiría almacenar más de 50 números decimales?

Respuestas

int[] numeros; numeros=new int[51];

int[] numeros; numeros=new float[52];

double[] numeros; numeros=new double[53];

float[] numeros=new float[54];

Retroalimentación

3.1.- Uso de arrays unidimensionales.

Hombre mirando la pantalla de un ordenador mientras está trabajando.
Stockbyte DVD-CD Num. V43 (CC BY-NC)

Ya sabes declarar y crear de arrays, pero, ¿cómo y cuando se usan? Pues existen tres ámbitos principalmente donde se pueden usar, y los tres son muy importantes: modificación de una posición del array, acceso a una posición del array y paso de parámetros.

La modificación de una posición del array se realiza con una simple asignación. Simplemente se especifica entre corchetes la posición a modificar después del nombre del array. Veamoslo con un simple ejemplo:

int[] Numeros=new int[3]; // Array de 3 números (posiciones del 0 al 2).

Numeros[0]=99; // Primera posición del array.

Numeros[1]=120; // Segunda posición del array.

Numeros[2]=33; // Tercera y última posición del array.

El acceso a un valor ya existente dentro de una posición del array se consigue de forma similar, simplemente poniendo el nombre del array y la posición a la cual se quiere acceder entre corchetes:

int suma=Numeros[0] + Numeros[1] + Numeros[2];

Para nuestra comodidad, los arrays, como objetos que son en Java, disponen de una propiedad pública muy útil. La propiedad length nos permite saber el tamaño de cualquier array, lo cual es especialmente útil en métodos que tienen como argumento un array.

System.out.println("Longitud del array: "+Numeros.length); 

El tercer uso principal de los arrays, como se dijo antes, es en el paso de parámetros. Para pasar como argumento un array a una función o método, esta debe tener en su definición un parámetro declarado como array. Esto es simplemente que uno de los parámetros de la función sea un array. Veamos un ejemplo:

int sumaarray (int[] j) {

        int suma=0;

        for (int i=0; i<j.length;i++)

            suma=suma+j[i];

        return suma; 

} 

En el método anterior se pasa como argumento un array numérico, sobre el cual se calcula la suma de todos los números que contiene. Es un uso típico de los arrays, fijate que especificar que un argumento es un array es igual que declarar un array, sin la creación del mismo. Para pasar como argumento un array a una función, simplemente se pone el nombre del array:

int suma=sumaarray (Numeros);

En Java las variables se pasan por copia a los métodos, esto quiere decir que cuando se pasa una variable a un método, y se realiza una modificación de su valor en dicho método, el valor de la variable en el método desde el que se ha realizado la invocación no se modifica. Pero cuidado, eso no pasa con los arrays. Cuando dicha modificación se realiza en un array, es decir, se cambia el valor de uno de los elementos del array, si que cambia su valor de forma definitiva. Veamos un ejemplo que ilustra ambas cosas:

public static void main(String[] args) {

     int j=0; int[] i=new int(1);  i[0]=0;

     modificaArray(j,i); 

     System.out.println(j+"-"+i[0]);  /* Mostrará por pantalla "0–1", puesto que el contenido del array es   

          modificado en la función, y aunque la variable j también se modifica, se modifica una copia de la misma,

          dejando el original intacto */

} 

int modificaArray(int j, int[] i); {

     j++; int[0]++;  /* Modificación de los valores de la variable, solo afectará al array, no a j */

}


3.2.- Inicialización.

Imagen que muestra una colección ordenada de piezas de diferente color.
ITE. Francisco Javier Martínez Adrados (CC BY-NC)

Rellenar un array, para su primera utilización, es una tarea muy habitual que puede ser rápidamente simplificada. Vamos a explorar dos sistemas que nos van a permitir inicializar un array de forma cómoda y rápida.

En primer lugar, una forma habitual de crear un array y rellenarlo es simplemente a través de un método que lleve a cabo la creación y el rellenado del array. Esto es sencillo desde que podemos hacer que un método retorne un array simplemente indicando en la declaración que el valor retornado es tipo[], donde tipo de dato primitivo (int, short, float,...) o una clase existente (String por ejemplo). Veamos un ejemplo:

static int[] ArrayConNumerosConsecutivos (int totalNumeros) {

        int[] r=new int[totalNumeros];

        for (int i=0;i<totalNumeros;i++) r[i]=i;

        return r;

}

En el ejemplo anterior se crea un array con una serie de números consecutivos, empezando por el cero, ¿sencillo no? Este uso suele ahorrar bastantes líneas de código en tareas repetitivas. Otra forma de inicializar los arrays, cuando el número de elementos es fijo y sabido a priori, es indicando entre llaves el listado de valores que tiene el array. En el siguiente ejemplo puedes ver la inicialización de un array de tres números, y la inicialización de un array con tres cadenas de texto:

int[] array = {10, 20, 30};

String[] diassemana= {"Lunes", "Martes", "Miércoles", "Jueves", "Viernes", "Sábado", "Domingo"};

Pero cuidado, la inicialización solo se puede usar en ciertos casos. La inicialización anterior funciona cuando se trata de un tipo de dato primitivo (int, short, float, double, etc.) o un String, y algunos pocos casos más, pero no funcionará para cualquier objeto.

Cuando se trata de un array de objetos, la inicialización del mismo es un poco más liosa, dado que el valor inicial de los elementos del array de objetos será null, o lo que es lo mismo, crear un array de objetos no significa que se han creado las instancias de los objetos. Hay que crear, para cada posición del array, el objeto del tipo correspondiente con el operador new. Veamos un ejemplo con la clase StringBuilder. En el siguiente ejemplo solo aparecerá null por pantalla:

StringBuilder[] j=new StringBuilderStringBuilder[10];

for (int i=0; i<j.length;i++) System.out.println("Valor" +i + "="+j[i]); // Imprimirá null para los 10 valores.

Para solucionar este problema podemos optar por lo siguiente, crear para cada posición del array una instancia del objeto:

StringBuilder[] j=new StringBuilder[10];

for (int i=0; i<j.length;i++) j[i]=new StringBuilder("cadena "+i);  

Una variable que almacena un objeto en realidad es un apuntador a la zona de memoria donde se almacena dicho objeto. Cuando dicha variable, no apunta a ningún objeto, porque el objeto no se ha creado con el operador new, entonces la variable apunta a null, para indicar que no hace referencia todavía a ningún objeto.

Reflexiona

Para acceder a una propiedad o a un método cuando los elementos del array son objetos, puedes usar la notación de punto detrás de los corchetes, por ejemplo: diassemana[0].length. Fijate bien en el array diassemana anterior y piensa en lo que se mostraría por pantalla con el siguiente código:

System.out.println(diassemana[0].substring(0,2)); 

Autoevaluación

Pregunta

¿Cuál es el valor de la posición 3 del siguiente array: String[] m=new String[10]?

Respuestas

null.

Una cadena vacía.

Daría error y no se podría compilar.

Retroalimentación

4.- Arrays multidimensionales.

Caso práctico

Fotografía de María.
Ministerio de Educación (CC BY-NC)

Ana sigue dándole vueltas a como almacenar los diferentes datos del pedido, y sobre todo, sobre como procesar los artículos, dado que los artículos del pedido pueden ser más de uno. Ha pensado en crear primero una clase para almacenar los datos del pedido, llamada Pedido, donde cada dato del pedido sea un atributo de la clase. Pero claro, los artículos son más de uno y no puede saber cuantos atributos necesitará.

Para almacenar los artículos ha pensado en crear una clase llamada Articulo donde se meterían todos los datos de cada artículo, y después en la clase Pedido poner un array de artículos. Pero no lo tiene claro y ha decidido preguntar a su tutora, María.

¿Qué estructura de datos utilizarías para almacenar los píxeles de una imagen digital? Normalmente las imágenes son cuadradas así que una de las estructuras más adecuadas es la matriz. En la matriz cada valor podría ser el color de cada píxel. Pero, ¿qué es una matriz a nivel de programación? Pues es un array con dos dimensiones, o lo que es lo mismo, un array cuyos elementos son arrays de números.

Los arrays multidimensionales están en todos los lenguajes de programación actuales, y obviamente también en Java. La forma de crear un array de dos dimensiones en Java es la siguiente:

int[][] a2d=new int[4][5];

El código anterior creará un array de dos dimensiones, o lo que es lo mismo, creará un array que contendrá 4 arrays de 5 números cada uno. Veámoslo con un ejemplo gráfico:

Imagen en la que se muestra visualmente como un array de dos dimensiones es en realidad un array en el que cada posición es otro array. En la imagen se ve un array donde la primera dimensión es 4 (contiene 4 arrays), y la segunda dimensión es 5 (cada array contiene un array de 5 elementos).
Salvador Romero Villegas (CC BY-NC)

Al igual que con los arrays de una sola dimensión, los arrays multidimensionales deben declararse y crearse. Podremos hacer arrays multidimensionales de todas las dimensiones que queramos y de cualquier tipo. En ellos todos los elementos del array serán del mismo tipo, como en el caso de los arrays de una sola dimensión. La declaración comenzará especificando el tipo o la clase de los elementos que forman el array, después pondremos tantos corchetes como dimensiones tenga el array y por último el nombre del array, por ejemplo:

int [][][] arrayde3dim; 

La creación es igualmente usando el operador new, seguido del tipo y los corchetes, en los cuales se especifica el tamaño de cada dimensión:

arrayde3dim=new int[2][3][4];

Todo esto, como ya has visto en un ejemplo anterior, se puede escribir en una única sentencia.

Punto que compone una imagen digital.

Estructura matemática compuesta de datos numéricos dispuestos en filas y columnas, similar a una tabla.

Autoevaluación

Completa con los números que faltan:

int[][][] k=new int[10][11][12]; 


El array anterior es de dimensiones, y tiene un total de números enteros.

Habilitar JavaScript

4.1.- Uso de arrays multidimensionales.

¿Y en que se diferencia el uso de un array multidimensional con respecto a uno de una única dimensión? Pues en muy poco la verdad. Continuaremos con el ejemplo del apartado anterior:

int[][] a2d=new int[4][5];

Para acceder a cada uno de los elementos del array anterior, habrá que indicar su posición en las dos dimensiones, teniendo en cuenta que los índices de cada una de las dimensiones empieza a numerarse en 0 y que la última posición es el tamaño de la dimensión en cuestión menos 1.

Puedes asignar un valor a una posición concreta dentro del array, indicando la posición en cada una de las dimensiones entre corchetes:

a2d[0][0]=3;

Y como es de imaginar, puedes usar un valor almacenado en una posición del array multidimensional simplemente poniendo el nombre del array y los índices del elemento al que deseas acceder entre corchetes, para cada una de las dimensiones del array. Por ejemplo:

int suma=a2d[0][0]+a2d[0][1]+a2d[0][2]+a2d[0][3]+a2d[0][4];

Como imaginarás, los arrays multidimensionales pueden también ser pasados como parámetros a los métodos, simplemente escribiendo la declaración del array en los argumentos del método, de forma similar a como se realizaba para arrays de una dimensión. Por ejemplo:

static int sumaarray2d(int[][] a2d) {

        int suma = 0;

        for (int i1 = 0; i1 < a2d.length; i1++) 

            for (int i2 = 0; i2 < a2d[i1].length; i2++)  suma += a2d[i1][i2];

        return suma;

    }

Del código anterior, fijate especialmente en el uso del atributo length (que nos permite obtener el tamaño de un array). Aplicado directamente sobre el array nos permite saber el tamaño de la primera dimensión (a2d.length). Como los arrays multidimensionales son arrays que tienen como elementos arrays (excepto el último nivel que ya será del tipo concreto almacenado), para saber el tamaño de una dimensión superior tenemos que poner el o los índices entre corchetes seguidos de length (a2d[i1].length).

Para saber al tamaño de una segunda dimensión (dentro de una función por ejemplo) hay que hacerlo así y puede resultar un poco engorroso, pero gracias a esto podemos tener arrays multidimensionales irregulares.

Imagen en la que se muestra visualmente como se crea un array de dos dimensiones irregular. Aparece escrito el código para crear el array irregular, similar al que aparece en los contenidos. El array creado tiene una primera dimensión de tamaño 4, en la que se almacenan 4 arrays, cada uno de un tamaño diferente (4, 5, 3 y 5 respectivamente).
Salvador Romero Villegas (CC BY-NC)

Una matriz es un ejemplo de array multidimensional regular, ¿por qué? Pues porque es un array que contiene arrays de números todos del mismo tamaño. Cuando esto no es así, es decir, cuando los arrays de la segunda dimensión son de diferente tamaño entre sí, se puede decir que es un array multidimensional irregular. En Java se puede crear un array irregular de forma relativamente fácil, veamos un ejemplo para dos dimensiones.

  • Declaramos y creamos el array pero sin especificar la segunda dimensión. Lo que estamos haciendo en realidad es crear simplemente un array que contendrá arrays, sin decir como son de grandes los arrays de la siguiente dimensión: int[][] irregular=new int[3][];
  • Después creamos cada uno de los arrays unidimensionales (del tamaño que queramos) y lo asignamos a la posición correspondiente del array anterior: irregular[0]=new int[7]; irregular[1]=new int[15]; irregular[2]=new int[9];

Recomendación

Cuando uses arrays irregulares, por seguridad, es conveniente que verifiques siempre que el array no sea null en segundas dimensiones, y que la longitud sea la esperada antes de acceder a los datos:

if (irregular[1]!=null && irregular[1].length>10) {...} 

4.2.- Inicialización de arrays multidimensionales.

¿En qué se diferencia la inicialización de arrays unidimensionales de arrays multidimensionales? En muy poco. La inicialización de los arrays multidimensionales es igual que la de los arrays unidimensionales.

Para que una función retorne un array multidimensional, se hace igual que en arrays unidimensionales. Simplemente hay que poner el tipo de dato seguido del número de corchetes correspondiente, según el número de dimensiones del array. Eso claro, hay que ponerlo en la definición del método:

int[][] inicializarArray (int n, int m)

{

     int[][] ret=new int[n][m];

     for (int i=0;i<n;i++)

          for (int j=0;j<m;j++)

               ret[i][j]=n*m;

     return ret;

}

También se puede inicializar un array multidimensional usando las llaves, poniendo después de la declaración del array un símbolo de igual, y encerrado entre llaves los diferentes valores del array separados por comas, con la salvedad de que hay que poner unas llaves nuevas cada vez que haya que poner los datos de una nueva dimensión, lo mejor es verlo con un ejemplo:

int[][] a2d={{0,1,2},{3,4,5},{6,7,8},{9,10,11}};

int[][][] a3d={{{0,1},{2,3}},{{0,1},{2,3}}};

El primer array anterior sería un array de 4 por 3 y el siguiente sería un array de 2x2x2. Como puedes observar esta notación a partir de 3 dimensiones ya es muy liosa y normalmente no se usa. Utilizando esta notación también podemos inicializar rápidamente arrays irregulares, simplemente poniendo separados por comas los elementos que tiene cada dimensión:

int[][] i2d={{0,1},{0,1,2},{0,1,2,3},{0,1,2,3,4},{0,1,2,3,4,5}};

int[][][] i3d={ { {0,1},{0,2} } , {{0,1,3}} , {{0,3,4},{0,1,5} } };


Es posible que en algunos libros y en Internet se refieran a los arrays usando otra terminología. A los arrays unidimensionales es común llamarlos también arreglos o vectores, a los arrays de dos dimensiones es común llamarlos directamente matrices, y a los arrays de más de dos dimensiones es posible que los veas escritos como matrices multidimensionales. Sea como sea, lo más normal en la jerga informática es llamarlos arrays, término que procede del inglés.

Autoevaluación

Pregunta

Dado el siguiente array: int[][][] i3d={{{0,1},{0,2}}, {{0,1,3}},{{0,3,4},{0,1,5}}};

¿Cuál es el valor de la posición [1][1][2]?

Respuestas

3

4

5

Ninguno de los anteriores.

Retroalimentación

Para saber más

Las matrices tienen asociadas un amplio abanico de operaciones (transposición, suma, producto, etc.). En la siguiente página tienes ejemplos de como realizar algunas de estas operaciones, usando por supuesto arrays:

Operaciones básicas con matrices.

5.- Conclusiones.

A lo largo de esta unidad hemos trabajado con las primeras estructuras de datos compuestas, es decir, aquellas que están formadas por datos primitivos u otros datos compuestos. Como hemos podido comprobar, estas estructuras son necesarias para almacenar colecciones de datos. Entre las estructuras trabajadas en esta unidad se encuentran las cadenas de texto y los arrays, que tienen como particularidad de que son estructuras estáticas, es decir, su tamaño se define en tiempo de compilación y no puede variar durante la ejecución de la aplicación. Además, se han introducido las expresiones regulares como una de las herramientas más potentes para la validación de cadenas de texto.

Ilustración que muestra el mapa conceptual de la Unidad 6.
Ministerio de Educación y FP (CC BY-NC)

En próximas unidades trabajaremos con estructuras de datos dinámicas. Pero antes, en la unidad de trabajo 6, introduciremos y trataremos de que queden claros dos de los conceptos más importantes de la POO, la herencia y el polimorfimo, que además están íntimamente relacionados con las unidades de trabajo restantes. Además, trabajaremos con otros conceptos avanzados relacionados con la POO.

Anexo I.- Formateado de cadenas en Java.

Sintaxis de las cadenas de formato y uso del método format.

En Java, el método estático format de la clase String permite formatear los datos que se muestran al usuario o la usuaria de la aplicación. El método format tiene los siguientes argumentos:

  • Cadena de formato. Cadena que especifica cómo será el formato de salida, en ella se mezclará texto normal con especificadores de formato, que indicarán cómo se debe formatear los datos.
  • Lista de argumentos. Variables que contienen los datos cuyos datos se formatearán. Tiene que haber tantos argumentos como especificadores de formato haya en la cadena de formato.

Los especificadores de formato comienzan siempre por "%", es lo que se denomina un carácter de escape (carácter que sirve para indicar que lo que hay a continuación no es texto normal, sino algo especial). El especificador de formato debe llevar como mínimo el símbolo "%" y un carácter que indica la conversión a realizar, por ejemplo "%d".

 

La conversión se indica con un simple carácter, y señala al método format cómo debe ser formateado el argumento. Dependiendo del tipo de dato podemos usar unas conversiones u otras. Veamos las conversiones más utilizadas:

Listado de conversiones más utilizada y ejemplos.
Tipo de conversión Especificación de formato Tipos de datos aplicables Ejemplo Resultado del ejemplo
Valor lógico o booleano. "%b" o "%B" Boolean (cuando se usan otros tipos de datos siempre lo formateará escribiendo true).
boolean b=true;

String d= String.format("Resultado: %b", b);

System.out.println (d);
Resultado: true
Cadena de caracteres. "%s" o "%S" Cualquiera, se convertirá el objeto a cadena si es posible (invocando el método toString).
String cad="hola mundo";

String d= String.format("Resultado: %s", cad);

System.out.println (d);
Resultado: hola mundo
Entero decimal "%d" Un tipo de dato entero.
int i=10;

String d= String.format("Resultado: %d", i);

System.out.println (d);
Resultado: 10
Número en notación científica "%e" o "%E" Flotantes simples o dobles.
double i=10.5;

String d= String.format("Resultado: %E", i);

System.out.println (d);
Resultado: 1.050000E+01
Número decimal "%f" Flotantes simples o dobles.
float i=10.5f;

String d= String.format("Resultado: %f", i);

System.out.println (d);
Resultado: 10,500000
Número en notación científica o decimal (lo más corto) "%g" o "%G" Flotantes simples o dobles. El número se mostrará como decimal o en notación científica dependiendo de lo que sea mas corto.
double i=10.5;

String d= String.format("Resultado: %g", i);

System.out.println (d);
Resultado: 10.5000

 

Ahora que ya hemos visto alguna de las conversiones existentes (las más importantes), veamos algunos modificadores que se le pueden aplicar a las conversiones, para ajustar como queremos que sea la salida. Los modificadores se sitúan entre el carácter de escape ("%") y la letra que indica el tipo de conversión (d, f, g, etc.).

Podemos especificar, por ejemplo, el número de caracteres que tendrá como mínimo la salida de una conversión. Si el dato mostrado no llega a ese ancho en caracteres, se rellenará con espacios (salvo que se especifique lo contrario):

%[Ancho]Conversión

El hecho de que esté entre corchetes significa que es opcional. Si queremos por ejemplo que la salida genere al menos 5 caracteres (poniendo espacios delante) podríamos ponerlo así:

String.format ("%5d",10);

Se mostrará el "10" pero también se añadirán 3 espacios delante para rellenar. Este tipo de modificador se puede usar con cualquier conversión.

Cuando se trata de conversiones de tipo numéricas con decimales, solo para tipos de datos que admitan decimales, podemos indicar también la precisión, que será el número de decimales mínimos que se mostrarán:

%[Ancho][.Precisión]Conversión

Como puedes ver, tanto el ancho como la precisión van entre corchetes, los corchetes no hay que ponerlos, solo indican que son modificaciones opcionales. Si queremos, por ejemplo, que la salida genere 3 decimales como mínimo, podremos ponerlo así:

String.format ("%.3f",4.2f);

Como el número indicado como parámetro solo tiene un decimal, el resultado se completará con ceros por la derecha, generando una cadena como la siguiente: "4,200".

Una cadena de formato puede contener varios especificadores de formato y varios argumentos. Veamos un ejemplo de una cadena con varios especificadores de formato:

String np="Lavadora";

int u=10;

float ppu = 302.4f;

float p=u*ppu;

String output=String.format("Producto: %s; Unidades: %d; Precio por unidad: %.2f €; Total: %.2f €", np, u, ppu, p);

System.out.println(output);

Cuando el orden de los argumentos es un poco complicado, porque se reutilizan varias veces en la cadena de formato los mismos argumentos, se puede recurrir a los índices de argumento. Se trata de especificar la posición del argumento a utilizar, indicando la posición del argumento (el primer argumento sería el 1 y no el 0) seguido por el símbolo del dólar ("$"). El índice se ubicaría al comienzo del especificador de formato, después del porcentaje, por ejemplo:

int i=10;

int j=20;

String d=String.format("%1$d multiplicado por %2$d (%1$dx%2$d) es %3$d",i,j,i*j);

System.out.println(d);

El ejemplo anterior mostraría por pantalla la cadena "10 multiplicado por 20 (10x20) es 200". Los índices de argumento se pueden usar con todas las conversiones, y es compatible con otros modificadores de formato (incluida la precisión).

Para saber más

Si quieres profundizar en los especificadores de formato puedes acceder a la siguiente página (en inglés), donde encontrarás información adicional acerca de la sintaxis de los especificadores de formato en Java:

Sintaxis de los especificadores de formato.