Almacenando datos.

Caso práctico

Foto de Ada mirando al frente.
Ministerio de Educación y FP (CC BY-NC)

Ada está repasando los requisitos de la aplicación informática que están desarrollando para la clínica veterinaria.

En particular, ahora mismo se está centrando en estudiar las necesidades respecto al almacenamiento de datos. Ada piensa que hay ciertas partes de la aplicación que no necesitan una base de datos para guardar los datos, y sería suficiente con emplear ficheros. Por ejemplo, para guardar datos de configuración de la aplicación.

Tras repasar, se reúne con  María y Juan para planificar adecuadamente el tema de los ficheros que van a usar en la aplicación, ya que es un asunto muy importante, que no deben dejar aparcado por más tiempo.

Precisamente Antonio, que cada vez está más entusiasmado con la idea de estudiar algún ciclo, de momento, está matriculado y cursando el módulo de Programación, y está repasando para el examen que tiene la semana que viene, uno de los temas que le "cae" es precisamente el de almacenamiento de información en ficheros.

1.- Introducción.

Carpetas de documentos en archivadores.
Stephanie Booth (CC BY-NC)

Cuando desarrollas programas, en la mayoría de ellos los usuarios pueden pedirle a la aplicación que realice cosas y pueda suministrarle datos con los que se quiere hacer algo. Una vez introducidos los datos y las órdenes, se espera que el programa manipule de alguna forma esos datos, para proporcionar una respuesta a lo solicitado.

Además, normalmente interesa que el programa guarde los datos que se le han introducido, de forma que si el programa termina, los datos no se pierdan y puedan ser recuperados en una sesión posterior. La forma más normal de hacer esto es mediante la utilización de ficheros, que se guardarán en un dispositivo de memoria no volátil (normalmente un disco).

Por tanto, sabemos que el almacenamiento en variables o vectores (arrays) es temporal, los datos se pierden en las variables cuando están fuera de su ámbito o cuando el programa termina. Las computadoras utilizan ficheros para guardar los datos, incluso después de que el programa termine su ejecución. Se suele denominar a los datos que se guardan en ficheros datos persistentes, porque existen, persisten más allá de la ejecución de la aplicación. Los ordenadores almacenan los ficheros en unidades de almacenamiento secundario como discos duros, discos ópticos, etc. En esta unidad veremos cómo hacer con Java estas operaciones de crear, actualizar y procesar ficheros.

A todas estas operaciones, que constituyen un flujo de información del programa con el exterior, se les conoce como Entrada/Salida (E/S).

Distinguimos dos tipos de E/S: la E/S estándar que se realiza con el terminal del usuario y la E/S a través de ficheros, en la que se trabaja con ficheros de disco.

Todas las operaciones de E/S en Java vienen proporcionadas por el paquete estándar del API de Java denominado java.io que incorpora interfaces, clases y excepciones para acceder a todo tipo de ficheros.

El contenido de un archivo puede interpretarse como campos y registros (grupos de campos), dándole un significado al conjunto de bits que en realidad posee.

Para saber más

A continuación puedes ampliar tus conocimientos sobre Entrada y Salida en general, en el mundo de la informática. Verás que es un basto tema lo que abarca.

Entrada y Salida.

1.1.- Excepciones.

Mensaje de error que dice error 404, lso calcetines que buscabas no se encontraron.
Luis Fernando Pienda Mahecha (CC BY)

Cuando se trabaja con archivos, es normal que pueda haber errores, por ejemplo: podríamos intentar leer un archivo que no existe, o podríamos intentar escribir en un archivo para el que no tenemos permisos de escritura. Para manejar todos estos errores debemos utilizar excepciones. Las dos excepciones más comunes al manejar archivos son:

  • FileNotFoundException: Si no se puede encontrar el archivo.
  • IOException: Si no se tienen permisos de lectura o escritura o si el archivo está dañado.

Un esquema básico de uso de la captura y tratamiento de excepciones en un programa, podría ser este, importando el paquete java.io.IOException:

Estructura de código Java para capturar excepciones. Se incluye en archivo enlazado bajo la imagen.
José Javier Bermúdez Hernández. (CC BY-NC)

Código de la estructura para gestionar excepciones. (1.00 KB)

Situación anómala durante la ejecución de un programa. En Java cuando se produce algún tipo de error se lanza una excepción.

Autoevaluación

Pregunta

Señala la opción correcta:

Respuestas

Java no ofrece soporte para excepciones.

Un campo y un archivo es lo mismo.

Si se intenta abrir un archivo que no existe, entonces saltará una excepción.

Ninguna es correcta.

Retroalimentación

Para saber más

En el siguiente enlace hay un manual muy interesante de Java, en la web w3schools. Puedes consultar más información sobre las excepciones en Java así como de otros aspectos del lenguaje que te puedan interesar. La parte mas interesante de este portal es que explica de manera abreviada (en inglés) los contenidos con muchos ejemplos que además pueden ser ejecutados en línea. Además, contiene numerosos ejercicios en línea que te ayudarán a afianzar todos los contenidos. Otra parte muy interesante es que también tiene contenidos de otros lenguajes, como Javascript o PHP.

Excepciones en Java.

2.- Concepto de flujo.

Caso práctico

Antonio está estudiando un poco antes de irse a dormir. Se ha tomado un vaso de leche con cacao y está repasando el concepto de flujo. Entenderlo al principio, cuando lo estudió por primera vez, le costó un poco, pero ya lo entiende a la perfección y piensa que si le sale alguna pregunta en el examen de la semana que viene, sobre esto, seguro que la va a acertar.

Antonio de pie y de perfil, con los brazos flexionados a media altura.
Ministerio de Educación y FP (CC BY-NC)



Esquema en el que se ve una entidad rectangular fuente y otro programa, y entre medias una línea que representa un flujo de lectura. Más abajo lo mismo pero a la izquierda pone Programa y a la derecha Destino, y entre las dos una línea que representa un flujo de escritura.
Ministerio de Educación y FP (CC BY-NC)

La clase Stream representa un flujo o corriente de datos, es decir, un conjunto secuencial de bytes, como puede ser un archivo, un dispositivo de entrada/salida (en adelante E/S), memoria, un conector TCP/IP (Protocolo de Control de Transmisión/Protocolo de Internet), etc.

Cualquier programa realizado en Java que necesite llevar a cabo una operación de entrada salida lo hará a través de un stream.

Un flujo o stream es una abstracción de aquello que produzca o consuma información. Es una entidad lógica.

Las clases y métodos de E/S que necesitamos emplear son las mismas independientemente del dispositivo con el que estemos actuando, luego, el núcleo de Java, sabrá si tiene que tratar con el teclado, el monitor, un sistema de archivos o un socket de red liberando al programador de tener que saber con quién está interactuando.

La vinculación de un flujo al dispositivo físico la hace el sistema de entrada y salida de Java.

En resumen, será el flujo el que tenga que comunicarse con el sistema operativo concreto y "entendérselas" con él. De esta manera, no tenemos que cambiar absolutamente nada en nuestra aplicación, que va a ser independiente tanto de los dispositivos físicos de almacenamiento como del sistema operativo sobre el que se ejecuta. Esto es primordial en un lenguaje multiplataforma y tan altamente portable como Java.

Autoevaluación

Pregunta

Señala la opción correcta:

Respuestas

La clase Stream puede representar, al instanciarse, a un archivo.

Si programamos en Java, hay que tener en cuenta el sistema operativo cuando tratemos con flujos, pues varía su tratamiento debido a la diferencia de plataformas.

La clase keyboard es la clase a utilizar al leer flujos de teclado.

La vinculación de un flujo al dispositivo físico la hace el hardware de la máquina.

Retroalimentación

3.- Clases relativas a flujos.

Caso práctico

Otro aspecto importante que Ada trata con María y Juan, acerca de los ficheros para la aplicación de la clínica, es el tipo de ficheros a  usar. Es decir, deben estudiar si es conveniente utilizar ficheros para almacenar datos en ficheros de texto, o si deben utilizar ficheros binarios. María comenta -Quizás debemos usar los dos tipos de ficheros, dependerá de qué se vaya a guardar, -Juan le contesta -tienes razón María, pero debemos pensar entonces cómo va el programa a leer y a escribir la información, tendremos que utilizar las clases Java adecuadas según los ficheros que decidamos usar. 

Primer plano de María, mirando hacia el frete.
Ministerio de Educación y FP (CC BY-NC)

Existen dos tipos de flujos, flujos de bytes (byte streams) y flujos de caracteres (character streams).

  • Los flujos de caracteres (16 bits) se usan para manipular datos legibles por humanos (por ejemplo un fichero de texto). Vienen determinados por dos clases abstractas: Reader y Writer. Dichas clases manejan flujos de caracteres Unicode. De ellas derivan subclases concretas que implementan los métodos definidos destacados los métodos read() y write() que, en este caso, leen y escriben caracteres de datos respectivamente.
  • Los flujos de bytes (8 bits) se usan para manipular datos binarios, legibles solo por la maquina (por ejemplo un fichero de programa). Su uso está orientado a la lectura y escritura de datos binarios. El tratamiento del flujo de bytes viene determinado por dos clases abstractas que son InputStream y OutputStream. Estas dos clases son las que definen los métodos que sus subclases tendrán implementados y, de entre todos, destacan read() y write() que leen y escriben bytes de datos respectivamente.

Las clases del paquete java.io se pueden ver en la ilustración. Destacamos las clases relativas a flujos:

  • BufferedInputStream: permite leer datos a través de un flujo con un buffer intermedio.
  • BufferedOutputStream: implementa los métodos para escribir en un flujo a través de un buffer.
  • FileInputStream: permite leer bytes de un fichero.
  • FileOutputStream: permite escribir bytes en un fichero o descriptor.
  • StreamTokenizer: esta clase recibe un flujo de entrada, lo analiza (parse) y divide en diversos pedazos (tokens),  permitiendo leer uno en cada momento.
  • StringReader: es un flujo de caracteres cuya fuente es una cadena de caracteres o string.
  • StringWriter: es un flujo de caracteres cuya salida es un buffer de cadena de caracteres, que puede utilizarse para construir un string.

Destacar que hay clases que se "montan" sobre otros flujos para modificar la forma de trabajar con ellos. Por ejemplo, con BufferedInputStream podemos añadir un buffer a un flujo FileInputStream, de manera que se mejore la eficiencia de los accesos a los dispositivos en los que se almacena el fichero con el que conecta el flujo.

El estándar Unicode son unas normas de codificación de caracteres que utilizan de 8 a 32 bits para asignar un nombre y un código único a carácter o símbolo de cada posible lenguaje.

3.1.- Ejemplo comentado de una clase con flujos.

Se pueden apreciar perlas de cristal de diferentes colores
JD Hancock (CC BY)

Vamos a ver un ejemplo con una de las clases comentadas, en concreto, con StreamTokenizer.

La clase StreamTokenizer obtiene un flujo de entrada y lo divide en "tokens". El flujo tokenizer puede reconocer identificadores, números y otras cadenas.

El ejemplo que puedes descargarte en el siguiente recurso, muestra cómo utilizar la clase StreamTokenizer para contar números y palabras de un fichero de texto. Se abre el flujo con ayuda de la clase FileReader, y puedes ver cómo se "monta" el flujo StreamTokenizer sobre el FileReader, es decir, que se construye el objeto StreamTokenizer con el flujo FileReader como argumento, y entonces se empieza a iterar sobre él.

Clase para leer palabras y números.

El método nextToken devuelve un int que indica el tipo de token leído. Hay una serie de constantes definidas para determinar el tipo de token:

  • TT_WORD indica que el token es una palabra.
  • TT_NUMBER indica que el token es un número.
  • TT_EOL indica que se ha leído el fin de línea.
  • TT_EOF indica que se ha llegado al fin del flujo de entrada.

En el código de la clase, apreciamos que se iterará hasta llegar al fin del fichero. Para cada token, se mira su tipo, y según el tipo se incrementa el contador de palabras o de números.

Autoevaluación

Indica si la siguiente afirmación es verdadera o falsa.

Pregunta 1

Según el sistema operativo que utilicemos, habrá que utilizar un flujo u otro. ¿Verdadero o Falso?

4.- Flujos.

Caso práctico

Ana, antonio y una amiga sentados en el banco de un parque.
Ministerio de Educación y FP (CC BY-NC)

Ana y Antonio salen de clase.  Antonio ha quedado con una amiga y Ana va camino de casa pensando en lo que le explicaron en clase hace unos días. Como se quedó con dudas, también le consultó a María. En concreto, le asaltaban dudas sobre cómo leer y escribir datos por teclado en un programa, y también varias dudas sobre lectura y escritura de información en ficheros. María le solventó las dudas hablándole sobre el tema, pero aún así, tenía que probarlo tranquilamente en casa, haciéndose unos pequeños ejemplos, para comprobar toda la nueva información aprendida.

-Antes de irte, -dice Antonio a Ana, -siéntate a hablar con nosotros un rato.

-Bueno, pero me voy a ir enseguida, -contesta Ana-.

Hemos visto qué es un flujo y que existe un árbol de clases amplio para su manejo. Ahora vamos a ver en primer lugar los flujos predefinidos, también conocidos como de entrada y salida, y después veremos los flujos basados en bytes y los flujos basados en carácter.

Camino de agua sobre las losas del suelo.
David.nikonvscanon (CC BY)

Citas para pensar

"Lo escuché y lo olvidé, lo vi y lo entendí, lo hice y lo aprendí". Confucio.

4.1.- Flujos predefinidos. Entrada y salida estándar.

Cartel que reza: “Entrada”.
Ces-VLC (CC BY-NC)

Tradicionalmente, los usuarios del sistema operativo Unix, Linux y también MS-DOS, han utilizado un tipo de entrada/salida conocida comúnmente por entrada/salida estándar. El fichero de entrada estándar (stdin) es típicamente el teclado. El fichero de salida estándar (stdout) es típicamente la pantalla (o la ventana del terminal). El fichero de salida de error estándar (stderr) también se dirige normalmente a la pantalla, pero se implementa como otro fichero de forma que se pueda distinguir entre la salida normal y (si es necesario) los mensajes de error.

Java tiene acceso a la entrada/salida estándar a través de la clase System. En concreto, los tres ficheros que se implementan son:

  • Stdin. Es un objeto de tipo InputStream, y está definido en la clase System como flujo de entrada estándar. Por defecto es el teclado, pero puede redirigirse para cada host o cada usuario, de forma que se corresponda con cualquier otro dispositivo de entrada.
  • Stdout. System.out implementa stdout como una instancia de la clase PrintStream. Se pueden utilizar los métodos print() y println() con cualquier tipo básico Java como argumento.
  • Stderr. Es un objeto de tipo PrintStream. Es un flujo de salida definido en la clase System y representa la salida de error estándar. Por defecto, es el monitor, aunque es posible redireccionarlo a otro dispositivo de salida.

Para la entrada, se usa el método read para leer de la entrada estándar:

  • int System.in.read();
    • Lee el siguiente byte (char) de la entrada estándar.
  • int System.in.read(byte[] b);
    • Leer un conjunto de bytes de la entrada estándar y lo almacena en el vector b.

Para la salida, se usa el método print para escribir en la salida estándar:

  • System.out.print(String);
    • Muestra el texto en la consola.
  • System.out.println(String);
    • Muestra el texto en la consola y seguidamente efectúa un salto de línea.

Normalmente, para leer valores numéricos, lo que se hace es tomar el valor de la entrada estándar en forma de cadena y entonces usar métodos que permiten transformar el texto a números (int, float, double, etc.) según se requiera.

Funciones de conversión.
Método Funcionamiento
byte Byte.parseByte(String) Convierte una cadena en un número entero de un byte
short Short.parseShort(String) Convierte una cadena en un número entero corto
int Integer.parseInt(String) Convierte una cadena en un número entero
long Long.parseLong(String) Convierte una cadena en un número entero largo
float Float.parseInt(String) Convierte una cadena en un número real simple
double Double.parseInt(String) Convierte una cadena en un número real doble
boolean Boolean.parseBoolean(String) Convierte una cadena en un valor lógico

4.2.- Flujos predefinidos. Entrada y salida estándar. Ejemplo.

Veamos un ejemplo en el que se lee por teclado hasta pulsar la tecla de retorno, en ese momento el programa acabará imprimiendo por la salida estándar la cadena leída.

Para ir construyendo la cadena con los caracteres leídos podríamos usar la clase StringBuffer o la StringBuilder. La clase StringBuffer permite almacenar cadenas que cambiarán en la ejecución del programa. StringBuilder es similar, pero no es síncrona. De este modo, para la mayoría de las aplicaciones, donde se ejecuta un solo hilo, supone una mejora de rendimiento sobre StringBuffer.

El proceso de lectura ha de estar en un bloque try..catch.

Código Java donde se lee desde teclado y se escribe por la salida estándar lo leído por teclado.Se incluye en archivo enlazado bajo la imagen.
José Javier Bermúdez Hernández (CC BY-NC)

Código del proceso de lectura.
 

Autoevaluación

Pregunta

Señala la opción correcta:

Respuestas

Read es una clase de System que permite leer caracteres.

StringBuffer permite leer y StringBuilder escribir en la salida estándar.

La clase keyboard también permite leer flujos de teclado.

Stderr por defecto dirige al monitor pero se puede direccional a otro dispositivo.

Retroalimentación

Debes conocer

En este vídeo puedes ver un ejemplo sencillo y explicado sobre la gestión de las excepciones de I/O en Java.

4.3.- Flujos basados en bytes.

Este tipo de flujos es el idóneo para el manejo de entradas y salidas de bytes, y su uso por tanto está orientado a la lectura y escritura de datos binarios.

Para el tratamiento de los flujos de bytes, Java tiene dos clases abstractas que son InputStream y OutputStream. Cada una de estas clases abstractas tiene varias subclases concretas, que controlan las diferencias entre los distintos dispositivos de E/S que se pueden utilizar.

class FileInputStream extands InputStream {

    FileInputStream (String fichero) throws FileNotFoundException;

    FileInputStream (File fichero) throws FileNotFoundException;

    ... ... ...

  }

class FileOutputStream extends OutputStream {

    FileOutputStream (String fichero) throws FileNotFoundException;

    FileOutputStream (File fichero) throws FileNotFoundException;

    ... ... ...

            }

OutputStream y el InputStream y todas sus subclases, reciben en el constructor el objeto que representa el flujo de datos para el dispositivo de entrada o salida.

Por ejemplo, podemos copiar el contenido de un fichero en otro:

Código Java para copiar de un fichero origen a otro destino.  Se incluye en archivo enlazado bajo la imagen.
José Javier Bermúdez Hernández (CC BY-NC)

Código de copiar.

Recomendación

En los enlaces siguientes puedes ver la documentación oficial de Oracle sobre FileInputStream y sobre FileOutputStream.

4.4.- Flujos basados en caracteres.

Pantalla en la que aparecen muchos caracteres en idioma oriental.
Macglee (CC BY-NC-SA)

Las clases orientadas al flujo de bytes nos proporcionan la suficiente funcionalidad para realizar cualquier tipo de operación de entrada o salida, pero no pueden trabajar directamente con caracteres Unicode, los cuales están representados por dos bytes. Por eso, se consideró necesaria la creación de las clases orientadas al flujo de caracteres para ofrecernos el soporte necesario para el tratamiento de caracteres.

Para los flujos de caracteres, Java dispone de dos clases abstractas: Reader y Writer.

Reader, Writer, y todas sus subclases, reciben en el constructor el objeto que representa el flujo de datos para el dispositivo de entrada o salida.

Hay que recordar que cada vez que se llama a un constructor se abre el flujo de datos y es necesario cerrarlo cuando no lo necesitemos.

Existen muchos tipos de flujos dependiendo de la utilidad que le vayamos a dar a los datos que extraemos de los dispositivos.

Un flujo puede ser envuelto por otro flujo para tratar el flujo de datos de forma cómoda. Así, un bufferWriter nos permite manipular el flujo de datos como un buffer, pero si lo envolvemos en un PrintWriter lo podemos escribir con muchas más funcionalidades adicionales para diferentes tipos de datos.

En este ejemplo de código, se ve cómo podemos escribir la salida estándar a un fichero. Cuando se teclee la palabra "salir", se dejará de leer y entonces se saldrá del bucle de lectura.

Podemos ver cómo se usa InputStreamReader que es un puente de flujos de bytes a flujos de caracteres: lee bytes y los decodifica a caracteres. BufferedReader lee texto de un flujo de entrada de caracteres, permitiendo efectuar una lectura eficiente de caracteres, vectores y líneas.

Como vemos en el código, usamos FileWriter para flujos de caracteres, pues para datos binarios se utiliza FileOutputStream.

Código Java donde se leen líneas de caracteres de la entrada, hasta que se teclee la palabra salir.Se incluye en archivo enlazado bajo la imagen.
José Javier Bermúdez Hernández (CC BY-NC)

Autoevaluación

Indica si es verdadera o falsa la siguiente afirmación:


Pregunta 1

Para flujos de caracteres es mejor usar las clases Reader y Writer en vez de InputStream y OutputStream.

Caso práctico

Trata de implementar en Netbeans el ejemplo mostrado en la imagen anterior. Recuerda que se trata de un algoritmo que lee de un fichero de texto línea a línea y las va mostrando por pantalla hasta encontrar la palabra "Salir".

Una mejora o ampliación podría ser que el mismo algoritmo vuelque el contenido del fichero origen a otro fichero de destino.

4.5.- Rutas de los ficheros.

Mapa en el que se ve la ruta de Magallanes y ElCano.
Ministerio de Educación y FP (CC BY-NC)

En los ejemplos que vemos en el tema estamos usando la ruta de los ficheros tal y como se usan en MS-DOS, o Windows, es decir, por ejemplo:

c:\datos\Programacion\fichero.txt

 

Cuando operamos con rutas de ficheros, el carácter separador entre directorios o carpetas suele cambiar dependiendo del sistema operativo en el que se esté ejecutando el programa.

Para evitar problemas en la ejecución de los programas cuando se ejecuten en uno u otro sistema operativo, y por tanto persiguiendo que nuestras aplicaciones sean lo más portables posibles, se recomienda usar en Java: File.separator.

Podríamos hacer una función que al pasarle una ruta nos devolviera la adecuada según el separador del sistema actual, del siguiente modo:

Código en Java para crear un fichero. Se incluye en archivo enlazado bajo la imagen.
José Javier Bermúdez Hernández (CC BY-NC)
Código de separador de rutas. (1 KB)

Autoevaluación

Indica si es verdadera o falsa la siguiente afirmación.

Pregunta 1

Cuando trabajamos con fichero en Java, no es necesario capturar las excepciones, el sistema se ocupa automáticamente de ellas. ¿Verdadero o Falso?

5.- Trabajando con ficheros.

Caso práctico

Juan le comenta a María -Tenemos que programar una copia de seguridad diaria de los datos del ficheros de texto plano que utiliza el programa para guardar la información. -Mientras María escucha a Juan, recuerda que para copias de seguridad, siempre ha comprobado que la mejor opción es utilizar ficheros secuenciales. 

Juan de pie hablando, gesticulando con los brazos.
Ministerio de Educación y FP (CC BY-NC)
Mano introduciendo un disquete en el ordenador.
Ministerio de Educación y FP (CC BY-NC)

¿Crees que es una buena opción la que piensa María o utilizarías otra en su lugar?

En este apartado vas a ver muchas cosas sobre los ficheros: cómo leer y escribir en ellos, aunque ya hemos visto algo sobre eso, hablaremos de las formas de acceso a los ficheros: secuencial o de  manera aleatoria.

Siempre hemos de tener en cuenta que la manera de proceder con ficheros debe ser:

  • Abrir o bien crear si no existe el fichero.
  • Hacer las operaciones que necesitemos.
  • Cerrar el fichero, para no perder la información que se haya modificado o añadido.

También es muy importante el control de las excepciones, para evitar que se produzcan fallos en tiempo de ejecución. Si intentamos abrir sin más un fichero, sin comprobar si existe o no, y no existe, saltará una excepción.

Para saber más

En el siguiente enlace a la wikipedia podrás ver la descripción de varias extensiones que pueden presentar los archivos.

Extensión de un archivo.

5.1.- Escritura y lectura de información en ficheros.

Mano escribiendo a bolígrafo sobre un papel.
ITE (CC BY-NC)

Acabamos de mencionar los pasos fundamentales para proceder con ficheros: abrir, operar, cerrar.

Además de esas consideraciones, debemos tener en cuenta también las clases Java a emplear, es decir, recuerda que hemos comentado que si vamos a tratar con ficheros de texto, es más eficiente emplear las clases de Reader Writer, frente a las clases de InputStream y OutputStream que están indicadas para flujos de bytes.

Otra cosa a considerar, cuando se va a hacer uso de ficheros, es la forma de acceso al fichero que se va a utilizar, si va a ser de manera secuencial o bien aleatoria. En un fichero secuencial, para acceder a un dato debemos recorrer todo el fichero desde el principio hasta llegar a su posición. Sin embargo, en un fichero de acceso aleatorio podemos posicionarnos directamente en una posición del fichero, y ahí leer o escribir.

Aunque ya has visto un ejemplo que usa BufferedReader, insistimos aquí sobre la filosofía de estas clases, que usan la idea de un buffer.

La idea es que cuando una aplicación necesita leer datos de un fichero, tiene que estar esperando a que el disco en el que está el fichero le proporcione la información.

Un dispositivo cualquiera de memoria masiva, por muy rápido que sea, es mucho más lento que la CPU del ordenador.

Así que, es fundamental reducir el número de accesos al fichero a fin de mejorar la eficiencia de la aplicación, y para ello se asocia al fichero una memoria intermedia, el buffer, de modo que cuando se necesita leer un byte del archivo, en realidad se traen hasta el buffer asociado al flujo, ya que es una memoria mucho más rápida que cualquier otro dispositivo de memoria masiva.

Cualquier operación de Entrada/Salida a ficheros puede generar una IOException, es decir, un error de Entrada/Salida. Puede ser por ejemplo, que el fichero no exista, o que el dispositivo no funcione correctamente, o que nuestra aplicación no tenga permisos de lectura o escritura sobre el fichero en cuestión. Por eso, las sentencias que involucran operaciones sobre ficheros, deben ir en un bloque try.

Es la posibilidad de acceder a un elemento arbitrario de una secuencia de datos en el mismo tiempo.

Consiste en un tipo de almacenamiento permanente, no volátil, a diferencia de la memoria principal del ordenador que sí es volátil, pero posee mayor capacidad de almacenamiento que la memoria principal, aunque es más lenta que ésta.

Autoevaluación

Señala si es verdadera o es falsa la siguiente afirmación:

Pregunta 1

La idea de usar buffers con los ficheros es incrementar los accesos físicos a disco. ¿Verdadero o falso?

5.2.- Ficheros binarios y ficheros de texto (I).

Página de un libro con texto.
Entropyer (CC BY-NC)

Ya comentamos anteriormente que los ficheros se utilizan para guardar la información en un soporte: disco duro, disquetes, memorias usb, dvd, etc., y posteriormente poder recuperarla. También distinguimos dos tipos de ficheros: los de texto y los binarios.

En los ficheros de texto la información se guarda como caracteres. Esos caracteres están codificados en Unicode, o en ASCII u otras codificaciones de texto.

En la siguiente porción de código puedes ver cómo para un fichero existente, que en este caso es texto.txt, averiguamos la codificación que posee, usando el método getEncoding()

Obtener codificación.  Se incluye en archivo enlazado bajo la imagen.
José Javier Bermúdez Hernández (CC BY-NC)
Código para mostrar codificación de fichero.

Para archivos de texto, se puede abrir el fichero para leer usando la clase FileReader. Esta clase nos proporciona métodos para leer caracteres. Cuando nos interese no leer carácter a carácter, sino leer líneas completas, podemos usar la clase BufferedReader a partir de FileReader. Lo podemos hacer de la siguiente forma:

File arch = new File ("C:\\fich.txt");

FileReader fr = new FileReader (arch);

BufferedReader br = new BufferedReader(fr);

...

String linea = br.readLine();

Para escribir en archivos de texto lo podríamos hacer, teniendo en cuenta:

FileWriter fich = null;

PrintWriter pw = null;

fich = new FileWriter("/fich2.txt");

pw = new PrintWriter(fichero);

pw.println("Linea de texto");

...

Si el fichero al que queremos escribir existe y lo que queremos es añadir información, entonces pasaremos el segundo parámetro como true:

FileWriter("/fich2.txt",true);

 

Para saber más

En el siguiente enlace a wikipedia puedes ver el código ASCII.

Código Ascii.

5.2.1.- Ficheros binarios y ficheros de texto (II).

Pantalla negra con caracteres en hexadecimal.
Paulnasca (Dominio público)

Los ficheros binarios almacenan la información en bytes, codificada en binario, pudiendo ser de cualquier tipo: fotografías, números, letras, archivos ejecutables, etc.

Los archivos binarios guardan una representación de los datos en el fichero. O sea que, cuando se guarda texto no se guarda el texto en sí, sino que se guarda su representación en código UTF-8.

Para leer datos de un fichero binario, Java proporciona la clase FileInputStream. Dicha clase trabaja con bytes que se leen desde el flujo asociado a un fichero. Aquí puedes ver un ejemplo comentado.

Leer de fichero binario con buffer. (3.00 KB)

Para escribir datos a un fichero binario, la clase nos permite usar un fichero para escritura de bytes en él, es la clase FileOutputStream. La filosofía es la misma que para la lectura de datos, pero ahora el flujo es en dirección contraria, desde la aplicación que hace de fuente de datos hasta el fichero, que los consume.

En la siguiente presentación puedes ver un esquema de cómo utilizar buffer para optimizar la lectura de teclado desde consola, por medio de las envolturas, podemos usar métodos como readline(), de la clase BufferedReader, que envuelve a un objeto de la clase InputStreamReader.

Envolturas o Wrappers

Ilustración que muestra el uso de envolturas en java.

Envolturas o Wrappers

Ilustración que muestra el uso de envolturas de forma gráfica

Envolturas o Wrappers

Todas las imágenes son propiedades del Ministerio de Educación y FP bajo licencia CC BY-NC.

Es un formato de codificación de caracteres Unicode usando símbolos de longitud variable.

Autoevaluación

Señala si es verdadera o falsa la siguiente afirmación:

Pregunta 1

Para leer datos desde un fichero codificados en binario empleamos la clase FileOutputStream. ¿Verdadero o falso?

5.3.- Modos de acceso. Registros.

Tres cuadrados consecutivos representando tres registros y uno más a la derecha
Ministerio de Educación y FP (CC BY-NC)

En Java no se impone una estructura en un fichero, por lo que conceptos como el de registro que si existen en otros lenguajes, en principio no existen en los archivos que se crean con Java. Por tanto, los programadores deben estructurar los ficheros de modo que cumplan con los requerimientos de sus aplicaciones.

Así, el programador definirá su registro con el número de bytes que le interesen, moviéndose luego por el fichero teniendo en cuenta ese tamaño que ha definido.

Se dice que un fichero es de acceso directo o de organización directa cuando para acceder a un registro n cualquiera, no se tiene que pasar por los n-1 registros anteriores. En caso contrario, estamos hablando de ficheros secuenciales.

Con Java se puede trabajar con ficheros secuenciales y con ficheros de acceso aleatorio.

En los ficheros secuenciales, la información se almacena de manera secuencial, de manera que para recuperarla se debe hacer en el mismo orden en que la información se ha introducido en el archivo. Si por ejemplo queremos leer el registro del fichero que ocupa la posición tres (en la ilustración sería el número 5), tendremos que abrir el fichero y leer los primeros tres registros, hasta que finalmente leamos el registro número tres.

Por el contrario, si se tratara de un fichero de acceso aleatorio, podríamos acceder directamente a la posición tres del fichero, o a la que nos interesara.

Autoevaluación

Pregunta

Señala la opción correcta:

Respuestas

Java sólo admite el uso de ficheros aleatorios.

Con los ficheros de acceso aleatorio se puede acceder a un registro determinado directamente.

Los ficheros secuenciales se deben leer de tres en tres registros.

Todas son falsas.

Retroalimentación

5.4.- Acceso secuencial.

Un cero con ojos y cejas.
Ministerio de Educación y FP (CC BY-NC)

En el siguiente ejemplo vemos cómo se escriben datos en un fichero secuencial: el nombre y apellidos de una persona utilizando el método writeUTF() que proporciona DataOutputStream, seguido de su edad que la escribimos con el método writeInt() de la misma clase. A continuación escribimos lo mismo para una segunda persona y de nuevo para una tercera. Después cerramos el fichero. Y ahora lo abrimos de nuevo para ir leyendo de manera secuencial los datos almacenados en el fichero, y escribiéndolos a consola.

Escribir y leer. 

Fíjate al ver el código, que hemos tenido la precaución de ir escribiendo las cadenas de caracteres con el mismo tamaño, de manera que sepamos luego el tamaño del registro que tenemos que leer.

Por tanto para buscar información en un fichero secuencial, tendremos que abrir el fichero e ir leyendo registros hasta encontrar el registro que buscamos.

¿Y si queremos eliminar un registro en un fichero secuencial, qué hacemos? Esta operación es un problema, puesto que no podemos quitar el registro y reordenar el resto. Una opción, aunque costosa, sería crear un nuevo fichero. Recorremos el fichero original y vamos copiando registros en el nuevo hasta llegar al registro que queremos borrar. Ese no lo copiamos al nuevo, y seguimos copiando hasta el final, el resto de registros al nuevo fichero. De este modo, obtendríamos un nuevo fichero que sería el mismo que teníamos pero sin el registro que queríamos borrar. Por tanto, si se prevé que se va a borrar en el fichero, no es recomendable usar un fichero de este tipo, o sea, secuencial.

Autoevaluación

Señala si es verdadera o es falsa la siguiente afirmación:

Pregunta 1

Para encontrar una información almacenada en la mitad de un fichero secuencial, podemos acceder directamente a esa posición sin pasar por los datos anteriores a esa información.  ¿Verdadero o Falso?

5.5.- Acceso aleatorio.

Fichas en un archivador.
Ministerio de Educación y FP (CC BY-NC)

A veces no necesitamos leer un fichero de principio a fin, sino acceder al fichero como si fuera una base de datos, donde se accede a un registro concreto del fichero. Java proporciona la clase RandomAccessFile para este tipo de entrada/salida.

La clase RandomAccessFile permite utilizar un fichero de acceso aleatorio en el que el programador define el formato de los registros.

RandomAccessFile objFile = new RandomAccessFile( ruta, modo );

Donde ruta es la dirección física en el sistema de archivos y modo puede ser:

  • "r" para sólo lectura.
  • "rw" para lectura y escritura.

La clase RandomAccessFile implementa los interfaces DataInput y DataOutput. Para abrir un archivo en modo lectura haríamos:

RandomAccessFile in = new RandomAccessFile(“input.dat”, “r”);

Para abrirlo en modo lectura y escritura:

RandomAccessFile inOut = new RandomAccessFile(“input.dat”, “rw”);

Esta clase permite leer y escribir sobre el fichero, no se necesitan dos clases diferentes.

Hay que especificar el modo de acceso al construir un objeto de esta clase: sólo lectura o lectura/escritura.

Dispone de métodos específicos de desplazamiento como seek y skipBytes para poder moverse de un registro a otro del fichero, o posicionarse directamente en una posición concreta del fichero.

No está basada en el concepto de flujos o streams.

En el siguiente enlace tienes información general sobre el uso de ficheros de acceso secuencial en Java. Introduce los métodos más utilizados para el uso de este tipo de ficheros y además contiene tres ejemplos muy útiles y didácticos.

Uso de ficheros de acceso aleatorio

Autoevaluación

Indica si es verdadera o es falsa la siguiente afirmación:

Pregunta 1

Para decirle el modo de lectura y escritura a un objeto RandomAccessFile debemos pasar como parámetro "rw". ¿Verdadero o Falso?

6.- Aplicaciones del almacenamiento de información en ficheros.

Caso práctico

Antonio ha quedado con Ana para estudiar sobre el tema de ficheros. De camino a la biblioteca, Ana le pregunta a Antonio -¿Crees que los ficheros se utilizan realmente, o ya están desfasados y sólo se utilizan las bases de datos? -Antonio tras pensarlo un momento le dice a Ana -Yo creo que sí, piensa en el mp3 que usas muchas veces, la música va grabada en ese tipo de ficheros.

Primer plano de Antonio, mirando hacia el frente.
Ministerio de Educación y FP (CC BY-NC)
ontenido de un archivo XML.
Dreftymac (CC BY-SA)

¿Has pensado la diversidad de ficheros que existe, según la información que se guarda?

Las fotos que haces con tu cámara digital, o con el móvil, se guardan en ficheros. Así, existe una gran cantidad de ficheros de imagen, según el método que usen para guardar la información. Por ejemplo, tenemos los ficheros de extensión: .jpg, .tiff, gif, .bmp, etc.

La música que oyes en tu mp3 o en el reproductor de mp3 de tu coche, está almacenada en ficheros que almacenan la información en formato mp3.

Los sistemas operativos, como Linux, Windows, etc., están constituidos por un montón de instrucciones e información que se guarda en ficheros.

El propio código fuente de los lenguajes de programación, como Java, C, etc., se guarda en ficheros de texto plano la mayoría de veces.

También se guarda en ficheros las películas en formato .avi, .mp4, etc.

Y por supuesto, se usan mucho actualmente los ficheros XML, que al fin y al cabo son ficheros de texto plano, pero que siguen una estructura determinada. XML se emplea mucho para el intercambio de información estructurada entre diferentes plataformas.

Autoevaluación

Indica si es verdadera o falsa la siguiente afirmación:

Pregunta 1

Un fichero .bmp guarda información de música codificada.  ¿Verdadero o falso?

7.- Utilización de los sistemas de ficheros.

Caso práctico

Ana está estudiando en la biblioteca, junto a Antonio. Está repasando lo que le explicaron en clase sobre las operaciones relativas a ficheros en Java. En concreto, está mirando lo relativo a crear carpetas o directorios, listar directorios, borrarlos, operar en definitiva con ellos. Va a repasar ahora en la biblioteca, para tener claros los conceptos y cuando llegue de vuelta a casa, probar a compilar algunos ejemplos que a ella misma se le ocurran.

Primer plano de Ana, mirando hacia el frente.
Ministerio de Educación y FP (CC BY-NC)

Trazo represntando una carpeta.
Tim Morgan (CC BY)


Has visto en los apartados anteriores cómo operar en ficheros: abrirlos, cerrarlos, escribir en ellos, etc.

Lo que no hemos visto es lo relativo a crear y borrar directorios, poder filtrar archivos, es decir, buscar sólo aquellos que tengan determinada característica, por ejemplo, que su extensión sea: .txt.

Ahora veremos cómo hacer estas cosas, y también como borrar ficheros, y crearlos, aunque crearlos ya lo hemos visto en algunos ejemplos anteriores.

7.1.- Clase File.

Carretera estadounidense con el suelo indicando ruta 66.
Vicente Villamón (CC BY-SA)

La clase File proporciona una representación abstracta de ficheros y directorios.

Esta clase, permite examinar y manipular archivos y directorios, independientemente de la plataforma en la que se esté trabajando: Linux, Windows, etc.

Las instancias de la clase File representan nombres de archivo, no los archivos en sí mismos.

El archivo correspondiente a un nombre dado podría ser que no existiera, por ello, habrá que controlar las posibles excepciones.

Al trabajar con File, las rutas pueden ser:

  • Relativas al directorio actual.
  • Absolutas si la ruta que le pasamos como parámetro empieza por
    • La barra "/" en Unix, Linux.
    • Letra de unidad (C:, D:, etc.) en Windows.
    • UNC(universal naming convention) en windows, como por ejemplo:
      
      
      File miFile=new File("\\\\mimaquina\\download\\prueba.txt");

A través del objeto File, un programa puede examinar los atributos del archivo, cambiar su nombre, borrarlo o cambiar sus permisos. Dado un objeto file, podemos hacer las siguientes operaciones con él:

  • Renombrar el archivo, con el método renameTo(). El objeto File dejará de referirse al archivo renombrado, ya que el String con el nombre del archivo en el objeto File no cambia.
  • Borrar el archivo, con el método delete(). También, con deleteOnExit() se borra cuando finaliza la ejecución de la máquina virtual Java.
  • Crear un nuevo fichero con un nombre único. El método estático createTempFile() crea un fichero temporal y devuelve un objeto File que apunta a él. Es útil para crear archivos temporales, que luego se borran, asegurándonos tener un nombre de archivo no repetido.
  • Establecer la fecha y la hora de modificación del archivo con setLastModified(). Por ejemplo, se podría hacer: new File("prueba.txt").setLastModified(new Date().getTime()); para establecerle la fecha actual al fichero que se le pasa como parámetro, en este caso prueba.txt.
  • Crear un directorio con el método mkdir(). También existe mkdirs(), que crea los directorios superiores si no existen.
  • Listar el contenido de un directorio. Los métodos list() y listFiles() listan el contenido de un directorio list() devuelve un vector de String con los nombres de los archivos, listFiles() devuelve un vector de objetos File.
  • Listar los nombres de archivo de la raíz del sistema de archivos, mediante el método estático listRoots().

Autoevaluación

Indica si es verdadera o falsa la siguiente afirmación:

Pregunta 1

Un objeto de la clase File representa un fichero en sí mismo. ¿Verdadero o falso?

7.2.- Interface FilenameFilter.

Escurridor metálico.
Pau Bou (CC BY-NC-SA)

En ocasiones nos interesa ver la lista de los archivos que encajan con un determinado criterio.

Así, nos puede interesar un filtro para ver los ficheros modificados después de una fecha, o los que tienen un tamaño mayor del que indiquemos, etc.

El interface FilenameFilter se puede usar para crear filtros que establezcan criterios de filtrado relativos al nombre de los ficheros. Una clase que lo implemente debe definir e implementar el método:

boolean accept(File dir, String nombre)

Este método devolverá verdadero (true), en el caso de que el fichero cuyo nombre se indica en el parámetro nombre aparezca en la lista de los ficheros del directorio indicado por el parámetro dir.

En el siguiente ejemplo vemos cómo se listan los ficheros de la carpeta c:\datos que tengan la extensión .odt. Usamos try y catch para capturar las posibles excepciones, como que no exista dicha carpeta.

Imagen del código Java para filtrar ficheros en una carpeta llamada datos, del disco duro.
José Javier Bermúdez Hernández. (CC BY-NC)

Filtrar ficheros. (2.00 KB)

Autoevaluación

Indica si la siguiente afirmación es verdadera o falsa:

Pregunta 1

Una clase que implemente FileNameFilter puede o no implementar el método accept. ¿Verdadero o Falso?

7.3.- Creación y eliminación de ficheros y directorios.

Podemos crear un fichero del siguiente modo:

  • Creamos el objeto que encapsula el fichero, por ejemplo, suponiendo que vamos a crear un fichero llamado miFichero.txt, en la carpeta C:\\prueba, haríamos:
    
    
    File fichero = new File("c:\\prueba\\miFichero.txt");

  • A partir del objeto File creamos el fichero físicamente, con la siguiente instrucción, que devuelve un boolean con valor true si se creó correctamente, o false si no se pudo crear:
    
    
    fichero.createNewFile()

Para borrar un fichero, podemos usar la clase File, comprobando previamente si existe, del siguiente modo:

  • Fijamos el nombre de la carpeta y del fichero con:
    
    
    File fichero = new File("C:\\prueba", "agenda.txt");

  • Comprobamos si existe el fichero con exists() y si es así lo borramos con:
    
    
    fichero.delete();

Para crear directorios, podríamos hacer:

Imagen del código Java para crear carpetas.
José Javier Bermúdez Hernández (CC BY-NC)

Crear directorios.

Para borrar un directorio con Java tenemos que borrar cada uno de los ficheros y directorios que éste contenga. Al poder almacenar otros directorios, se podría recorrer recursivamente el directorio para ir borrando todos los ficheros.

Se puede listar el contenido del directorio con:

File[] ficheros = directorio.listFiles();

y entonces poder ir borrando. Si el elemento es un directorio, lo sabemos mediante el método isDirectory,

8.- Almacenamiento de objetos en ficheros. Persistencia. Serialización.

Caso práctico

Ana ya tiene los conocimientos suficientes para llevar a cabo la tarea de procesar el fichero de pedidos y poder cargarlo en una estructura de datos en memoria. Con lo aprendido en esta unidad consigue la pieza que necesita para abordar la tarea. Así:

  1. Para el tratamiento del fichero podrá utilizar las clases estudiadas que permiten procesar y leer un fichero de texto línea a línea.
  2. Para la validación de cada línea leída decidió utilizar expresiones regulares, que ya ha probado y validado.
  3. Por último, decisión que también tenía tomada, decidió utilizar varias estructuras para almacenar los pedidos: un mapa de pedidos y una lista de artículo ordenada por código de artículo.

En el siguiente enlace puedes acceder al código completo comentado desarrollada por Ana.

Proyecto Procesar Pedidos

¡Échale un vistazo al código y tratar de implementarlo y ejecutarlo!

Caso práctico

Para la aplicación de la clínica veterinaria María le propone a Juan emplear un fichero para guardar los datos de los clientes de la clínica. -Como vamos a guardar datos de la clase Cliente, tendremos que serializar los datos.

María sentada, trabajando escribiendo con un ordenador, mirando a la pantalla y tecleando.
Ministerio de Educación y FP (CC BY-NC)



coche azul y coche rojo haciendo una carrera en el ciberespacio.
Ballistik Coffee Boy (CC BY)

¿Qué es la serialización? Es un proceso por el que un objeto se convierte en una secuencia de bytes con la que más tarde se podrá reconstruir el valor de sus variables. Esto permite guardar un objeto en un archivo.

Para serializar un objeto:

  • éste debe implementar el interface java.io.Serializable. Este interface no tiene métodos, sólo se usa para informar a la JVM (Java Virtual Machine) que un objeto va a ser serializado.
  • Todos los objetos incluidos en él tienen que implementar el interfaz Serializable.

Todos los tipos primitivos en Java son serializables por defecto. (Al igual que los arrays y otros muchos tipos estándar).

Para leer y escribir objetos serializables a un stream se utilizan las clases java: ObjectInputStream y ObjectOutputStream.

En el siguiente ejemplo se puede ver cómo leer un objeto serializado que se guardó antes. En este caso, se trata de un String serializado:

FileInputStream fich = new FileInputStream(“str.out”);

ObjectInputStream os = new ObjectInputStream(fich);

Object o = os.readObject();

Así vemos que readObject lee un objeto desde el flujo de entrada fich. Cuando se leen objetos desde un flujo, se debe tener en cuenta qué tipo de objetos se esperan en el flujo, y se han de leer en el mismo orden en que se guardaron.

Autoevaluación

Indica si es verdadera o falsa la siguiente afirmación:

Pregunta 1

Para serializar un fichero basta con implementar el interface Serializable. ¿Verdadero o falso?

8.1.- Serialización: utilidad.

Letras en rojo en las que se lee serializable.
José Javier Bermúdez Hernández. (CC BY-NC)

La serialización en Java se desarrolló para utilizarse con RMI. RMI necesitaba un modo de convertir los parámetros necesarios a enviar a un objeto en una máquina remota, y también para devolver valores desde ella, en forma de flujos de bytes. Para datos primitivos es fácil, pero para objetos más complejos no tanto, y ese mecanismo es precisamente lo que proporciona la serialización.

El método writeObject se utiliza para guardar un objeto a través de un flujo de salida. El objeto pasado a writeObject debe implementar el interfaz Serializable.

FileOutputStream fisal = new FileOutputStream(“cadenas.out”);

ObjectOutputStream oos = new ObjectOutputStream(fisal);

Oos.writeObject();

La serialización de objetos se emplea también en la arquitectura de componentes software JavaBean. Las clases bean se cargan en herramientas de construcción de software visual, como NetBeans. Con la paleta de diseño se puede personalizar el bean asignando fuentes, tamaños, texto y otras propiedades.

Una vez que se ha personalizado el bean, para guardarlo, se emplea la serialización: se almacena el objeto con el valor de sus campos en un fichero con extensión .ser, que suele emplazarse dentro de un fichero .jar.

Java Remote Method Interface, permite invocar un método de manera remota, que puede estar ejecutando en una otra máquina.

Para saber más

En este enlace a puedes ver un vídeo en el que se crea una aplicación sobre serialización. No está hecha con NetBeans, sino con Eclipse, pero eso no presenta ningún inconveniente.

9.- Conclusiones

La persistencia de datos en memoria secundaria es un requisito fundamental para las aplicaciones software: es la única forma de que los datos no se pierden cuando la aplicación finaliza la ejecución. En esta unidad hemos trabajado con todo tipo de ficheros en memoria secundaria para almacenar tanto datos binarios como caracteres. Además, hemos conocido el concepto de flujo o stream. Como hemos podido comprobar, a través del paquete java.io, el API Java proporciona clases e interfaces para que el almacenamiento y recuperación de datos hacia/desde ficheros sea una tarea sencilla.

Ilustración que muestra el mapa conceptual de la Unidad de Trabajo 9
Ministerio de Educación y FP (CC BY-NC)

Un paso más en la persistencia de datos será el uso de base de datos, algo que dejaremos para la última unidad del curso. En la siguiente unidad nos centraremos en la construcción de interfaces gráficas de usuario.