SlideShare una empresa de Scribd logo
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
FUNDAMENTOS
DE PROGRAMACIÓN
Algoritmos, estructura
de datos y objetos
Cuarta edición
Fundamentos_de_programacion_Algoritmos_e.pdf
FUNDAMENTOS
DE PROGRAMACIÓN
Algoritmos, estructura
de datos y objetos
Cuarta edición
Luis Joyanes Aguilar
Catedrático de Lenguajes y Sistemas Informáticos
Facultad de Informática, Escuela Universitaria de Informática
Universidad Pontificia de Salamanca campus de Madrid
MADRID • BOGOTÁ • BUENOS AIRES • CARACAS • GUATEMALA • LISBOA • MÉXICO
NUEVA YORK • PANAMÁ • SAN JUAN • SANTIAGO • SÃO PAULO
AUCKLAND • HAMBURGO • LONDRES • MILÁN • MONTREAL • NUEVA DELHI • PARÍS
SAN FRANCISCO • SIDNEY • SINGAPUR • ST LOUIS • TOKIO • TORONTO
FUNDAMENTOS DE PROGRAMACIÓN. Algoritmos, estructura de datos
y objetos. Cuarta edición.
No está permitida la reproducción total o parcial de este libro, ni su tratamiento
informático, ni la transmisión de ninguna forma o por cualquier medio, ya sea elec-
trónico, mecánico, por fotocopia, por registro u otros métodos, sin el permiso previo
y por escrito de los titulares del Copyright.
DERECHOS RESERVADOS © 2008, respecto a la cuarta edición en español, por
McGRAW-HILL/INTERAMERICANA DE ESPAÑA, S. A. U.
Edificio Valrealty, 1.ª planta
Basauri, 17
28023 Aravaca (Madrid)
ISBN: 978-84-481-6111-8
Depósito legal: M.
Editores: José Luis García y Cristina Sánchez
Técnicos editoriales: Blanca Pecharromán y María León
Preimpresión: Nuria Fernández Sánchez
Cubierta: Escriña Diseño Gráfico
Compuesto en: Gráficas Blanco, S. L.
Impreso en:
IMPRESO EN ESPAÑA - PRINTED IN SPAIN
Contenido
Prefacio a la cuarta edición................................................................................................................................................... xvii
PARTE I. ALGORITMOS Y HERRAMIENTAS DE PROGRAMACIÓN................................................ 1
Capítulo 1. Introducción a las computadoras y los lenguajes de programación................................................................ 3
INTRODUCCIÓN......................................................................................................................................................... 3
1.1. ¿Qué es una computadora?.................................................................................................................................. 4
1.1.1. Origen de las computadoras .................................................................................................................... 5
1.1.2. Clasificación de las computadoras........................................................................................................... 6
1.2. Organización física de una computadora............................................................................................................. 7
1.2.1. Dispositivos de Entrada/Salida (E/S): periféricos ................................................................................... 8
1.2.2. La memoria principal............................................................................................................................... 9
1.2.3. Unidades de medida de memoria ............................................................................................................ 10
1.2.4. El procesador ........................................................................................................................................... 12
1.2.5. Propuestas para selección de la computadora ideal para aprender programación o para actividades
profesionales ............................................................................................................................................ 14
1.3. Representación de la información en las computadoras ..................................................................................... 15
1.3.1. Representación de textos ......................................................................................................................... 15
1.3.2. Representación de valores numéricos...................................................................................................... 16
1.3.3. Representación de imágenes.................................................................................................................... 17
1.3.4. Representación de sonidos....................................................................................................................... 18
1.4. Codificación de la información ........................................................................................................................... 19
1.4.1. Sistemas de numeración .......................................................................................................................... 19
1.5. Dispositivos de almacenamiento secundario (almacenamento masivo).............................................................. 21
1.5.1. Discos magnéticos ................................................................................................................................... 21
1.5.2. Discos ópticos: CD-ROM y DVD ........................................................................................................... 21
1.5.3. Discos y memorias Flash USB................................................................................................................ 24
1.5.4. Otros dispositivos de Entrada y Salida (E/S) .......................................................................................... 24
1.6. Conectores de dispositivos de E/S....................................................................................................................... 26
1.6.1. Puertos serie y paralelo............................................................................................................................ 26
1.6.2. USB.......................................................................................................................................................... 27
1.6.3. Bus IEEE Firewire – 1394....................................................................................................................... 27
1.7. Redes, Web y Web 2.0......................................................................................................................................... 28
1.7.1. Redes P2P, igual-a-igual (peer-to-peer, P2P).......................................................................................... 29
1.7.2. Aplicaciones de las redes de comunicaciones......................................................................................... 29
1.7.3. Módem..................................................................................................................................................... 30
1.7.4. Internet y la World Wide Web ................................................................................................................. 30
1.8. El software (los programas)................................................................................................................................. 32
1.8.1. Software del sistema................................................................................................................................ 32
1.8.2. Software de aplicación............................................................................................................................. 33
1.8.3. Sistema operativo..................................................................................................................................... 34
1.8.3.1. Multiprogramación/Multitarea.................................................................................................. 35
1.8.3.2. Tiempo compartido (múltiples usuarios, time sharing) ........................................................... 35
1.8.3.3. Multiproceso............................................................................................................................. 35
1.9. Lenguajes de programación............................................................................................................................... 36
1.9.1. Traductores de lenguaje: el proceso de traducción de un programa..................................................... 37
1.9.2. La compilación y sus fases.................................................................................................................... 38
1.9.3. Evolución de los lenguajes de programación........................................................................................ 39
1.9.4. Paradigmas de programación................................................................................................................. 40
1.10. Breve historia de los lenguajes de programación.............................................................................................. 42
RESUMEN.................................................................................................................................................................... 43
Capítulo 2. Metodología de la programación y desarrollo de software............................................................................. 45
INTRODUCCIÓN......................................................................................................................................................... 45
2.1. Fases en la resolución de problemas ................................................................................................................... 46
2.1.1. Análisis del problema .............................................................................................................................. 47
2.1.2. Diseño del algoritmo................................................................................................................................ 48
2.1.3. Herramientas de programación................................................................................................................ 48
2.1.4. Codificación de un programa................................................................................................................... 51
2.1.5. Compilación y ejecución de un programa............................................................................................... 52
2.1.6. Verificación y depuración de un programa.............................................................................................. 52
2.1.7. Documentación y mantenimiento............................................................................................................ 53
2.2. Programación modular......................................................................................................................................... 54
2.3. Programación estructurada .................................................................................................................................. 54
2.3.1. Datos locales y datos globales................................................................................................................. 55
2.3.2. Modelado del mundo real........................................................................................................................ 56
2.4. Programación orientada a objetos........................................................................................................................ 56
2.4.1. Propiedades fundamentales de la orientación a objetos.......................................................................... 57
2.4.2. Abstracción .............................................................................................................................................. 57
2.4.3. Encapsulación y ocultación de datos....................................................................................................... 58
2.4.4. Objetos..................................................................................................................................................... 59
2.4.5. Clases....................................................................................................................................................... 61
2.4.6. Generalización y especialización: herencia............................................................................................. 61
2.4.7 Reusabilidad............................................................................................................................................. 63
2.4.8. Polimorfismo............................................................................................................................................ 63
2.5. Concepto y características de algoritmos ............................................................................................................ 64
2.5.1. Características de los algoritmos............................................................................................................. 65
2.5.2. Diseño del algoritmo................................................................................................................................ 66
2.6. Escritura de algoritmos........................................................................................................................................ 68
2.7. Representación gráfica de los algoritmos............................................................................................................ 69
2.7.1. Pseudocódigo........................................................................................................................................... 70
2.7.2. Diagramas de flujo................................................................................................................................... 71
2.7.3. Diagramas de Nassi-Schneiderman (N-S)............................................................................................... 80
RESUMEN.................................................................................................................................................................... 81
EJERCICIOS................................................................................................................................................................. 81
Capítulo 3. Estructura general de un programa.................................................................................................................. 83
INTRODUCCIÓN......................................................................................................................................................... 83
3.1. Concepto de programa......................................................................................................................................... 84
3.2. Partes constitutivas de un programa .................................................................................................................... 84
3.3. Instrucciones y tipos de instrucciones ................................................................................................................. 85
3.3.1. Tipos de instrucciones ............................................................................................................................. 85
3.3.2. Instrucciones de asignación..................................................................................................................... 86
3.3.3. Instrucciones de lectura de datos (entrada) ............................................................................................. 87
3.3.4. Instrucciones de escritura de resultados (salida) ..................................................................................... 87
3.3.5. Instrucciones de bifurcación.................................................................................................................... 87
3.4. Elementos básicos de un programa ..................................................................................................................... 89
3.5. Datos, tipos de datos y operaciones primitivas ................................................................................................... 89
3.5.1. Datos numéricos ...................................................................................................................................... 90
3.5.2. Datos lógicos (booleanos) ....................................................................................................................... 92
3.5.3. Datos tipo carácter y tipo cadena............................................................................................................. 92
vi Contenido
3.6. Constantes y variables ....................................................................................................................................... 92
3.6.1. Declaración de constants y variables..................................................................................................... 94
3.7. Expresiones........................................................................................................................................................ 94
3.7.1. Expresiones aritméticas......................................................................................................................... 95
3.7.2. Reglas de prioridad................................................................................................................................ 97
3.7.3. Expresiones lógicas (booleanas)........................................................................................................... 99
3.8. Funciones internas............................................................................................................................................. 102
3.9. La operación de asignación............................................................................................................................... 104
3.9.1. Asignación aritmética............................................................................................................................ 105
3.9.2. Asignación lógica .................................................................................................................................. 105
3.9.3. Asignación de cadenas de caracteres..................................................................................................... 105
3.9.4. Asignación múltiple............................................................................................................................... 105
3.9.5. Conversión de tipo................................................................................................................................. 106
3.10. Entrada y salida de información........................................................................................................................ 107
3.11. Escritura de algoritmos/programas.................................................................................................................... 108
3.11.1. Cabecera del programa o algoritmo.................................................................................................... 108
3.11.2. Declaración de variables ..................................................................................................................... 108
3.11.3. Declaración de constantes numéricas.................................................................................................. 109
3.11.4. Declaración de constantes y variables carácter................................................................................... 109
3.11.5. Comentarios......................................................................................................................................... 110
3.11.6. Estilo de escritura de algoritmos/programas....................................................................................... 111
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS.............................................................................................. 113
CONCEPTOS CLAVE.................................................................................................................................................. 124
RESUMEN.................................................................................................................................................................... 124
EJERCICIOS................................................................................................................................................................. 125
Capítulo 4. Flujo de control I: Estructuras selectivas......................................................................................................... 127
INTRODUCCIÓN......................................................................................................................................................... 127
4.1. El flujo de control de un programa...................................................................................................................... 128
4.2. Estructura secuencial ........................................................................................................................................... 128
4.3. Estructuras selectivas........................................................................................................................................... 130
4.4. Alternativa simple (si-entonces/if-then).................................................................................................... 131
4.4.1. Alternativa doble (si-entonces-sino/if-then-else).................................................................... 132
4.5. Alternativa múltiple (según_sea, caso de/case)........................................................................................ 137
4.6. Estructuras de decisión anidadas (en escalera).................................................................................................... 144
4.7. La sentencia ir-a (goto) ................................................................................................................................... 148
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS.............................................................................................. 151
CONCEPTOS CLAVE.................................................................................................................................................. 154
RESUMEN.................................................................................................................................................................... 154
EJERCICIOS................................................................................................................................................................. 155
Capítulo 5. Flujo de control II: Estructuras repetitivas ...................................................................................................... 157
INTRODUCCIÓN......................................................................................................................................................... 157
5.1. Estructuras repetitivas.......................................................................................................................................... 158
5.2. Estructura mientras ("while") ..................................................................................................................... 160
5.2.1. Ejecución de un bucle cero veces............................................................................................................ 162
5.2.2. Bucles infinitos ........................................................................................................................................ 163
5.2.3. Terminación de bucles con datos de entrada........................................................................................... 163
5.3. Estructura hacer-mientras ("do-while") ................................................................................................. 165
5.4. Diferencias entre mientras (while) y hacer-mientras (do-while): una aplicación en C++.................... 167
5.5. Estructura repetir ("repeat") ........................................................................................................................ 168
5.6. Estructura desde/para ("for") ........................................................................................................................ 171
5.6.1. Otras representaciones de estructuras repetitivas desde/para (for).................................................... 171
5.6.2. Realización de una estructura desde con estructura mientras ............................................................ 174
5.7. Salidas internas de los bucles .............................................................................................................................. 175
5.8. Sentencias de salto interrumpir (break) y continuar (continue)............................................................ 176
5.8.1. Sentencia interrumpir (break)........................................................................................................... 176
5.8.2. Sentencia continuar (continue)......................................................................................................... 177
Contenido vii
5.9. Comparación de bucles while, for y do-while: una aplicación en C++ ..................................................... 178
5.10. Diseño de bucles (lazos).................................................................................................................................... 179
5.10.1. Bucles para diseño de sumas y productos........................................................................................... 179
5.10.2. Fin de un bucle.................................................................................................................................... 179
5.11. Estructuras repetitivas anidadas......................................................................................................................... 181
5.11.1. Bucles (lazos) anidados: una aplicación en C++ ................................................................................ 183
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS.............................................................................................. 186
CONCEPTOS CLAVE.................................................................................................................................................. 197
RESUMEN.................................................................................................................................................................... 197
EJERCICIOS................................................................................................................................................................. 198
REFERENCIAS BIBLIOGRÁFICAS.......................................................................................................................... 199
Capítulo 6. Subprogramas (subalgoritmos): Funciones ..................................................................................................... 201
INTRODUCCIÓN......................................................................................................................................................... 201
6.1. Introducción a los subalgoritmos o subprogramas............................................................................................ 202
6.2. Funciones........................................................................................................................................................... 203
6.2.1. Declaración de funciones......................................................................................................................... 204
6.2.2. Invocación a las funciones....................................................................................................................... 205
6.3. Procedimientos (subrutinas) ................................................................................................................................ 210
6.3.1. Sustitución de argumentos/parámetros.................................................................................................... 211
6.4. Ámbito: variables locales y globales................................................................................................................... 215
6.5. Comunicación con subprogramas: paso de parámetros....................................................................................... 218
6.5.1. Paso de parámetros .................................................................................................................................. 219
6.5.2. Paso por valor .......................................................................................................................................... 219
6.5.3. Paso por referencia................................................................................................................................... 220
6.5.4. Comparaciones de los métodos de paso de parámetros .......................................................................... 221
6.5.5. Síntesis de la transmisión de parámetros................................................................................................. 223
6.6. Funciones y procedimientos como parámetros ................................................................................................... 225
6.7. Los efectos laterales............................................................................................................................................. 227
6.7.1. En procedimientos ................................................................................................................................... 227
6.7.2. En funciones ............................................................................................................................................ 228
6.8. Recursión (recursividad)...................................................................................................................................... 229
6.9. Funciones en C/C++ , Java y C# ......................................................................................................................... 231
6.10. Ámbito (alcance) y almacenamiento en C/C++ y Java....................................................................................... 233
6.11. Sobrecarga de funciones en C++ y Java.............................................................................................................. 235
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS.............................................................................................. 238
CONCEPTOS CLAVE.................................................................................................................................................. 242
RESUMEN.................................................................................................................................................................... 242
EJERCICIOS................................................................................................................................................................. 243
PARTE II. ESTRUCTURA DE DATOS ......................................................................................................... 245
Capítulo 7. Estructuras de datos I (arrays y estructuras).................................................................................................... 247
INTRODUCCIÓN......................................................................................................................................................... 247
7.1. Introducción a las estructuras de datos................................................................................................................ 248
7.2. Arrays (arreglos) unidimensionales: los vectores................................................................................................ 248
7.3. Operaciones con vectores .................................................................................................................................... 251
7.3.1. Asignación ............................................................................................................................................... 252
7.3.2. Lectura/escritura de datos........................................................................................................................ 253
7.3.3. Acceso secuencial al vector (recorrido)................................................................................................... 253
7.3.4. Actualización de un vector ...................................................................................................................... 255
7.4. Arrays de varias dimensiones.............................................................................................................................. 258
7.4.1. Arrays bidimensionales (tablas/matrices)................................................................................................ 258
7.5. Arrays multidimensionales .................................................................................................................................. 260
7.6. Almacenamiento de arrays en memoria .............................................................................................................. 262
7.6.1. Almacenamiento de un vector ................................................................................................................. 262
7.6.2. Almacenamiento de arrays multidimensionales...................................................................................... 263
viii Contenido
7.7. Estructuras versus registros ............................................................................................................................... 265
7.7.1. Registros ................................................................................................................................................ 265
7.8. Arrays de estructuras......................................................................................................................................... 266
7.9. Uniones.............................................................................................................................................................. 268
7.9.1. Unión versus estructura ......................................................................................................................... 268
7.10. Enumeraciones................................................................................................................................................... 270
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS.............................................................................................. 272
CONCEPTOS CLAVE.................................................................................................................................................. 282
RESUMEN.................................................................................................................................................................... 282
EJERCICIOS................................................................................................................................................................. 283
Capítulo 8. Las cadenas de caracteres................................................................................................................................ 285
INTRODUCCIÓN......................................................................................................................................................... 285
8.1. Introducción......................................................................................................................................................... 286
8.2. El juego de caracteres.......................................................................................................................................... 286
8.2.1. Código ASCII .......................................................................................................................................... 286
8.2.2. Código EBCDIC...................................................................................................................................... 287
8.2.3. Código universal Unicode para Internet.................................................................................................. 287
8.2.4. Secuencias de escape............................................................................................................................... 289
8.3. Cadena de caracteres............................................................................................................................................ 289
8.4. Datos tipo carácter............................................................................................................................................... 291
8.4.1. Constantes................................................................................................................................................ 291
8.4.2. Variables................................................................................................................................................... 291
8.4.3. Instrucciones básicas con cadenas........................................................................................................... 292
8.5. Operaciones con cadenas..................................................................................................................................... 293
8.5.1. Cálculo de la longitud de una cadena...................................................................................................... 293
8.5.2. Comparación............................................................................................................................................ 294
8.5.3. Concatenación.......................................................................................................................................... 295
8.5.4. Subcadenas............................................................................................................................................... 296
8.5.5. Búsqueda.................................................................................................................................................. 297
8.6. Otras funciones de cadenas.................................................................................................................................. 297
8.6.1. Insertar ..................................................................................................................................................... 298
8.6.2. Borrar....................................................................................................................................................... 298
8.6.3. Cambiar.................................................................................................................................................... 299
8.6.4. Conversión de cadenas/números.............................................................................................................. 300
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS.............................................................................................. 300
CONCEPTOS CLAVE.................................................................................................................................................. 305
RESUMEN.................................................................................................................................................................... 305
EJERCICIOS................................................................................................................................................................. 306
Capítulo 9. Archivos (ficheros) .......................................................................................................................................... 307
INTRODUCCIÓN......................................................................................................................................................... 307
9.1. Archivos y flujos (stream): La jerarquía de datos ............................................................................................... 308
9.1.1. Campos .................................................................................................................................................... 309
9.1.2. Registros .................................................................................................................................................. 309
9.1.3. Archivos (ficheros) .................................................................................................................................. 310
9.1.4. Bases de datos.......................................................................................................................................... 310
9.1.5. Estructura jerárquica................................................................................................................................ 310
9.1.6. Jerarquía de datos .................................................................................................................................... 311
9.2. Conceptos y definiciones = terminología............................................................................................................ 312
9.2.1. Clave (indicativo)..................................................................................................................................... 312
9.2.2. Registro físico o bloque........................................................................................................................... 312
9.2.3. Factor de bloqueo..................................................................................................................................... 312
9.3. Soportes secuenciales y direccionables ............................................................................................................... 313
9.4. Organización de archivos..................................................................................................................................... 314
9.4.1. Organización secuencial .......................................................................................................................... 314
9.4.2. Organización directa................................................................................................................................ 315
9.4.3. Organización secuencial indexada........................................................................................................... 316
Contenido ix
9.5. Operaciones sobre archivos............................................................................................................................... 317
9.5.1. Creación de un archivo.......................................................................................................................... 318
9.5.2. Consulta de un archivo .......................................................................................................................... 318
9.5.3. Actualización de un archivo .................................................................................................................. 319
9.5.4. Clasificación de un archivo ................................................................................................................... 319
9.5.5. Reorganización de un archivo ............................................................................................................... 320
9.5.6. Destrucción de un archivo..................................................................................................................... 320
9.5.7. Reunión, fusión de un archivo............................................................................................................... 320
9.5.8. Rotura/estallido de un archivo............................................................................................................... 321
9.6. Gestión de archivos............................................................................................................................................ 321
9.6.1. Crear un archivo .................................................................................................................................... 322
9.6.2. Abrir un archivo..................................................................................................................................... 322
9.6.3. Cerrar archivos....................................................................................................................................... 324
9.6.4. Borrar archivos ...................................................................................................................................... 324
9.7. Flujos ................................................................................................................................................................. 324
9.7.1. Tipos de flujos ....................................................................................................................................... 325
9.7.2. Flujos en C++ ........................................................................................................................................ 325
9.7.3. Flujos en Java ........................................................................................................................................ 325
9.7.4. Consideraciones prácticas en Java y C#................................................................................................ 326
9.8. Mantenimiento de archivos................................................................................................................................ 326
9.8.1. Operaciones sobre registros................................................................................................................... 328
9.9. Procesamiento de archivos secuenciales (algoritmos) ...................................................................................... 328
9.9.1. Creación................................................................................................................................................. 328
9.9.2. Consulta................................................................................................................................................. 329
9.9.3. Actualización......................................................................................................................................... 332
9.10. Procesamiento de archivos directos (algoritmos).............................................................................................. 335
9.10.1. Operaciones con archivos directos...................................................................................................... 335
9.10.2. Clave-dirección.................................................................................................................................... 341
9.10.3. Tratamiento de las colisiones .............................................................................................................. 341
9.10.4. Acceso a los archivos directos mediante indexación.......................................................................... 341
9.11. Procesamiento de archivos secuenciales indexados.......................................................................................... 343
9.12. Tipos de archivos: consideraciones prácticas en C/C++ y Java........................................................................ 344
9.12.1. Archivos de texto................................................................................................................................. 344
9.12.2. Archivos binarios................................................................................................................................. 345
9.12.3. Lectura y escritura de archivos............................................................................................................ 345
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS.............................................................................................. 346
CONCEPTOS CLAVE.................................................................................................................................................. 352
RESUMEN.................................................................................................................................................................... 352
EJERCICIOS................................................................................................................................................................. 353
Capítulo 10. Ordenación, búsqueda e intercalación............................................................................................................. 355
INTRODUCCIÓN......................................................................................................................................................... 355
10.1. Introducción....................................................................................................................................................... 356
10.2. Ordenación......................................................................................................................................................... 357
10.2.1. Método de intercambio o de burbuja .................................................................................................. 358
10.2.2. Ordenación por inserción .................................................................................................................... 363
10.2.3. Ordenación por selección.................................................................................................................... 365
10.2.4. Método de Shell .................................................................................................................................. 368
10.2.5. Método de ordenación rápida (quicksort) ........................................................................................... 370
10.3. Búsqueda............................................................................................................................................................ 374
10.3.1. Búqueda secuencial............................................................................................................................. 374
10.3.2. Búqueda binaria................................................................................................................................... 379
10.3.3. Búsqueda mediante transformación de claves (hasting)..................................................................... 383
10.4. Intercalación ...................................................................................................................................................... 388
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS.............................................................................................. 391
CONCEPTOS CLAVE.................................................................................................................................................. 402
RESUMEN.................................................................................................................................................................... 402
EJERCICIOS................................................................................................................................................................. 403
x Contenido
Capítulo 11. Ordenación, búsqueda y fusión externa (archivos).......................................................................................... 405
INTRODUCCIÓN......................................................................................................................................................... 405
11.1. Introducción....................................................................................................................................................... 406
11.2. Archivos ordenados ........................................................................................................................................... 406
11.3. Fusión de archivos............................................................................................................................................. 406
11.4. Partición de archivos.......................................................................................................................................... 410
11.4.1. Clasificación interna............................................................................................................................ 410
11.4.2. Partición por contenido ....................................................................................................................... 410
11.4.3. Selección por sustitución..................................................................................................................... 411
11.4.4. Partición por secuencias...................................................................................................................... 413
11.5. Clasificación de archivos................................................................................................................................... 414
11.5.1. Clasificación por mezcla directa ......................................................................................................... 414
11.5.2. Clasificación por mezcla natural......................................................................................................... 417
11.5.3. Clasificación por mezcla de secuencias equilibridas.......................................................................... 421
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS.............................................................................................. 422
CONCEPTOS CLAVE.................................................................................................................................................. 426
RESUMEN.................................................................................................................................................................... 426
EJERCICIOS................................................................................................................................................................. 427
Capítulo 12. Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas)........................................................ 429
INTRODUCCIÓN......................................................................................................................................................... 429
12.1. Introducción a las estructuras de datos.............................................................................................................. 430
12.1.1. Estructuras dinámicas de datos ........................................................................................................... 430
12.2. Listas.................................................................................................................................................................. 431
12.3. Listas enlazadas................................................................................................................................................. 433
12.4. Procesamiento de listas enlazadas..................................................................................................................... 436
12.4.1. Implementación de listas enlazadas con punteros............................................................................... 436
12.4.2. Implementación de listas enlazadas con arrays (arreglos).................................................................. 442
12.5. Listas circulares................................................................................................................................................. 450
12.6. Listas doblemente enlazadas ............................................................................................................................. 450
12.6.1. Inserción .............................................................................................................................................. 451
12.6.2. Eliminación.......................................................................................................................................... 452
12.7. Pilas.................................................................................................................................................................... 452
12.7.1. Aplicaciones de las pilas..................................................................................................................... 458
12.8. Colas .................................................................................................................................................................. 460
12.8.1. Representación de las colas................................................................................................................. 461
12.8.2. Aprovechamiento de la memoria ........................................................................................................ 467
12.9. Doble cola.......................................................................................................................................................... 468
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS.............................................................................................. 469
CONCEPTOS CLAVE.................................................................................................................................................. 476
RESUMEN.................................................................................................................................................................... 477
EJERCICIOS................................................................................................................................................................. 477
Capítulo 13. Estructuras de datos no lineales (árboles y grafos) ......................................................................................... 479
INTRODUCCIÓN......................................................................................................................................................... 479
13.1. Introducción....................................................................................................................................................... 480
13.2. Árboles............................................................................................................................................................... 480
13.2.1. Terminología y representación de un árbol general............................................................................ 481
13.3. Árbol binario...................................................................................................................................................... 482
13.3.1. Terminología de los árboles binarios .................................................................................................. 483
13.3.2. Árboles binarios completos................................................................................................................. 484
13.3.3. Conversión de un árbol general en árbol binario................................................................................ 485
13.3.4. Representación de los árboles binarios ............................................................................................... 489
13.3.5. Recorrido de un árbol binario ............................................................................................................. 493
13.4. Árbol binario de búsqueda................................................................................................................................. 495
13.4.1. Búsqueda de un elemento.................................................................................................................... 497
13.4.2. Insertar un elemento............................................................................................................................ 498
13.4.3. Eliminación de un elemento................................................................................................................ 499
Contenido xi
13.5. Grafos ................................................................................................................................................................ 506
13.5.1. Terminología de grafos........................................................................................................................ 506
13.5.2. Representación de grafos .................................................................................................................... 509
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS.............................................................................................. 512
CONCEPTOS CLAVE.................................................................................................................................................. 516
RESUMEN.................................................................................................................................................................... 516
EJERCICIOS ................................................................................................................................................................ 517
Capítulo 14. Recursividad..................................................................................................................................................... 519
INTRODUCCIÓN......................................................................................................................................................... 519
14.1. La naturaleza de la recursividad........................................................................................................................ 520
14.2. Recursividad directa e indirecta ........................................................................................................................ 524
14.2.1. Recursividad indirecta......................................................................................................................... 527
14.2.2. Condición de terminación de la recursión .......................................................................................... 528
14.3. Recursión versus iteración................................................................................................................................. 528
14.4. Recursión infinita............................................................................................................................................... 531
14.5. Resolución de problemas complejos con recursividad ..................................................................................... 535
14.5.1. Torres de Hanoi ................................................................................................................................... 535
14.5.2. Búsqueda binaria recursiva.................................................................................................................. 540
14.5.3. Ordenación rápida (QuickSort) ........................................................................................................... 542
14.5.4. Ordenación mergesort ......................................................................................................................... 545
CONCEPTOS CLAVE.................................................................................................................................................. 548
RESUMEN.................................................................................................................................................................... 548
EJERCICIOS................................................................................................................................................................. 549
PROBLEMAS............................................................................................................................................................... 549
PARTE III. PROGRAMACIÓN ORIENTADA A OBJETOS Y UML 2.1 ................................................. 551
Capítulo 15. Tipos abstractos de datos, objetos y modelado con UML 2.1 ........................................................................ 553
INTRODUCCIÓN......................................................................................................................................................... 553
15.1. Programación estructurada (procedimental)...................................................................................................... 554
15.1.1. Limitaciones de la programación estructurada ................................................................................... 554
15.1.2. Modelado de objetos del mundo real.................................................................................................. 555
15.2. Programación orientada a objetos ..................................................................................................................... 556
15.2.1. Objetos................................................................................................................................................. 557
15.2.2. Tipos abstractos de datos: CLASES.................................................................................................... 558
15.3. Modelado e identificación de objetos................................................................................................................ 560
15.4. Propiedades fundamentales de orientación a objetos........................................................................................ 561
15.4.1. Abstracción.......................................................................................................................................... 561
15.4.2. La abstracción en el software.............................................................................................................. 561
15.4.3. Encapsulamiento y ocultación de datos .............................................................................................. 562
15.4.4 Herencia............................................................................................................................................... 562
15.4.5. Reutilización o reusabilidad................................................................................................................ 563
15.4.6. Polimorfismo ....................................................................................................................................... 564
15.5. Modelado de aplicaciones: UML ...................................................................................................................... 565
15.5.1. Lenguaje de modelado ........................................................................................................................ 566
15.5.2. ¿Qué es un lenguaje de modelado?..................................................................................................... 566
15.6. Diseño de software con UML ........................................................................................................................... 567
15.6.1. Desarrollo de software orientado a objetos con UML........................................................................ 568
15.6.2. Especificaciones de UML ................................................................................................................... 568
15.7. Historia de UML................................................................................................................................................ 568
15.7.1. El futuro de UML 2.1.......................................................................................................................... 569
15.8. Terminología de orientación a objetos .............................................................................................................. 569
CONCEPTOS CLAVE.................................................................................................................................................. 570
RESUMEN.................................................................................................................................................................... 570
EJERCICIOS................................................................................................................................................................. 570
xii Contenido
Capítulo 16. Diseño de clases y objetos: Representaciones gráficas en UML .................................................................... 573
INTRODUCCIÓN......................................................................................................................................................... 573
16.1. Diseño y representación gráfica de objetos en UML........................................................................................ 574
16.1.1. Representación gráfica en UML ......................................................................................................... 575
16.1.2. Características de los objetos .............................................................................................................. 576
16.1.3. Estado .................................................................................................................................................. 577
16.1.4. Múltiples instancias de un objeto........................................................................................................ 579
16.1.5. Evolución de un objeto........................................................................................................................ 579
16.1.6. Comportamiento.................................................................................................................................. 580
16.1.7. Identidad.............................................................................................................................................. 582
16.1.8. Los mensajes ....................................................................................................................................... 582
16.1.9. Responsabilidad y restricciones .......................................................................................................... 584
16.2. Diseño y representación gráfica de clases en UML.......................................................................................... 584
16.2.1. Representación gráfica de una clase ................................................................................................... 585
16.2.2. Declaración de una clase..................................................................................................................... 588
16.2.3. Reglas de visibilidad ........................................................................................................................... 590
16.2.4. Sintaxis ................................................................................................................................................ 592
16.3. Declaración de objetos de clases....................................................................................................................... 593
16.3.1. Acceso a miembros de la clase: encapsulamiento .............................................................................. 595
16.3.2. Declaración de métodos ...................................................................................................................... 597
16.3.3. Tipos de métodos................................................................................................................................. 601
16.4. Constructores..................................................................................................................................................... 602
16.4.1. Constructor por defecto....................................................................................................................... 603
16.5. Destructores....................................................................................................................................................... 606
16.6. Implementación de clases en C++..................................................................................................................... 607
16.6.1. Archivos de cabecera y de clases........................................................................................................ 608
16.6.2. Clases compuestas............................................................................................................................... 609
16.7. Recolección de basura....................................................................................................................................... 610
16.7.1. El método finalize ().................................................................................................................... 610
CONCEPTOS CLAVE.................................................................................................................................................. 611
RESUMEN.................................................................................................................................................................... 611
EJERCICIOS................................................................................................................................................................. 613
LECTURAS RECOMENDADAS................................................................................................................................ 614
Capítulo 17. Relaciones entre clases: Delegaciones, asociaciones, agregaciones, herencia................................................ 615
INTRODUCCIÓN......................................................................................................................................................... 615
17.1. Relaciones entre clases...................................................................................................................................... 616
17.2. Dependencia ...................................................................................................................................................... 616
17.3. Asociación ......................................................................................................................................................... 617
17.3.1. Multiplicidad ....................................................................................................................................... 619
17.3.2. Restricciones en asociaciones ............................................................................................................. 620
17.3.3. Asociación cualificada......................................................................................................................... 620
17.3.4. Asociaciones reflexivas ....................................................................................................................... 620
17.3.5. Diagrama de objetos............................................................................................................................ 621
17.3.6. Clases de asociación............................................................................................................................ 621
17.3.7. Restricciones en asociaciones ............................................................................................................. 625
17.4. Agregación......................................................................................................................................................... 626
17.4.1 Composición........................................................................................................................................ 628
17.5. Jerarquía de clases: generalización y especialización....................................................................................... 629
17.5.1. Jerarquías de generalización/especialización...................................................................................... 631
17.6. Herencia: clases derivadas................................................................................................................................. 634
17.6.1. Herencia simple................................................................................................................................... 634
17.6.2. Herencia múltiple ................................................................................................................................ 635
17.6.3. Niveles de herencia ............................................................................................................................ 636
17.6.4. Declaración de una clase derivada ...................................................................................................... 638
17.6.5. Consideraciones de diseño .................................................................................................................. 639
17.7. Accesibilidad y visibilidad en herencia............................................................................................................. 640
17.7.1. Herencia pública.................................................................................................................................. 640
Contenido xiii
17.7.2. Herencia privada.................................................................................................................................. 640
17.7.3. Herencia protegida............................................................................................................................... 641
17.8. Un caso de estudio especial: herencia múltiple................................................................................................. 642
17.8.1. Características de la herencia múltiple................................................................................................ 644
17.9. Clases abstractas................................................................................................................................................ 645
17.9.1. Operaciones abstractas ........................................................................................................................ 646
CONCEPTOS CLAVE.................................................................................................................................................. 647
RESUMEN.................................................................................................................................................................... 647
EJERCICIOS................................................................................................................................................................. 648
PARTE IV. METODOLOGÍA DE LA PROGRAMACIÓN Y DESARROLLO DE SOFTWARE ................. 649
Capítulo 18. Resolución de problemas y desarrollo de software: Metodología de la programación .................................. 653
INTRODUCCIÓN......................................................................................................................................................... 653
18.1. Abstracción y resolución de problemas........................................................................................................... 654
18.1.1. Descomposición procedimental......................................................................................................... 654
18.1.2. Diseño descendente ........................................................................................................................... 655
18.1.3. Abstracción procedimental................................................................................................................ 656
18.1.4. Abstracción de datos.......................................................................................................................... 656
18.1.5. Ocultación de la información ............................................................................................................ 657
18.1.6. Programación orientada a objetos ..................................................................................................... 657
18.1.7. Diseño orientado a objetos ................................................................................................................ 657
18.2. El ciclo de vida del software ........................................................................................................................... 658
18.2.1. El ciclo de vida del software tradicional (modelo en cascada) ........................................................ 658
18.2.2. El proceso unificado.......................................................................................................................... 660
18.2.3. Cliente, desarrollador y usuario......................................................................................................... 661
18.3. Fase de análisis: requisitos y especificaciones ................................................................................................ 662
18.4. Diseño .............................................................................................................................................................. 664
18.5. Implementación (codificación)........................................................................................................................ 666
18.6. Pruebas e integración....................................................................................................................................... 666
18.6.1. Verificación........................................................................................................................................ 667
18.6.2. Técnicas de pruebas........................................................................................................................... 667
18.7. Mantenimiento................................................................................................................................................. 669
18.7.1. La obsolescencia: programas obsoletos ............................................................................................ 669
18.7.2. Iteración y evolución del software .................................................................................................... 669
18.8. Principios de diseño de sistemas de software.................................................................................................. 670
18.8.1. Modularidad mediante diseño descendente....................................................................................... 670
18.8.2. Abstracción y encapsulamiento......................................................................................................... 671
18.8.3. Modificabilidad.................................................................................................................................. 671
18.8.4. Comprensibilidad y fiabilidad ........................................................................................................... 672
18.8.5. Interfaces de usuario.......................................................................................................................... 672
18.8.6. Programación segura contra fallos .................................................................................................... 673
18.8.7. Facilidad de uso................................................................................................................................. 673
18.8.8. Eficiencia ........................................................................................................................................... 674
18.8.9. Estilo de programación, documentación y depuración ..................................................................... 674
18.9. Estilo de programación.................................................................................................................................... 674
18.9.1. Modularizar un programa en subprogramas...................................................................................... 674
18.9.2. Evitar variables globales en subprogramas ....................................................................................... 675
18.9.3. Usar nombres significativos para identificadores.............................................................................. 675
18.9.4. Definir constantes con nombres ........................................................................................................ 676
18.9.5. Evitar el uso de ir (goto) .................................................................................................................. 676
18.9.6. Uso adecuado de parámetros valor/variable...................................................................................... 676
18.9.7. Uso adecuado de funciones............................................................................................................... 677
18.9.8. Tratamiento de errores....................................................................................................................... 677
18.9.9. Legibilidad......................................................................................................................................... 677
18.10. La documentación............................................................................................................................................ 678
18.10.1. Manual del usuario .......................................................................................................................... 679
xiv Contenido
18.10.2. Manual de mantenimiento (documentación para programadores).................................................. 680
18.10.3. Reglas de documentación ................................................................................................................ 681
18.11. Depuración....................................................................................................................................................... 681
18.11.1. Localización y reparación de errores............................................................................................... 681
18.11.2. Depuración de sentencias si-entonces-sino ..................................................................................... 682
18.11.3. Los equipos de programación.......................................................................................................... 683
18.12. Diseño de algoritmos....................................................................................................................................... 683
18.13. Pruebas (testing) .............................................................................................................................................. 684
18.13.1. Errores de sintaxis (de compilación) ............................................................................................... 685
18.13.2. Errores en tiempo de ejecución ....................................................................................................... 685
18.13.3. Errores lógicos................................................................................................................................. 686
18.13.4. El depurador..................................................................................................................................... 686
18.14. Eficiencia ......................................................................................................................................................... 687
18.14.1. Eficiencia versus legibilidad (claridad) ........................................................................................... 689
18.15. Transportabilidad ............................................................................................................................................. 689
CONCEPTOS CLAVE.................................................................................................................................................. 689
RESUMEN.................................................................................................................................................................... 690
APÉNDICES......................................................................................................................................................... 689
Apéndice A. Especificaciones del lenguaje algorítmico UPSAM 2.0.................................................................................. 691
Apéndice B. Prioridad de operadores................................................................................................................................... 713
Apéndice C. Código ASCII y Unicode................................................................................................................................. 717
Apéndice D. Guía de sintaxis del lenguaje C ....................................................................................................................... 723
Bibliografía y recursos de programación ............................................................................................................................ 751
Contenido xv
Fundamentos_de_programacion_Algoritmos_e.pdf
Prefacio a la cuarta edición
La informática y las ciencias de la computación en los primeros años del siglo xxi vienen marcadas por los avan-
ces tecnológicos de la pasada década. Los más de veinte años de vida de la computadora personal (PC) y los más
de cincuenta años de la informática/computación tradicional vienen acompañados de cambios rápidos y evolutivos
en las disciplinas clásicas. El rápido crecimiento del mundo de las redes y, en consecuencia, la World Wide Web
hacen revolucionarios a estos cambios y afectan al cuerpo de conocimiento de los procesos educativos y profesio-
nales.
Así, como declara ACM en su informe final (15 de diciembre de 2001) CC2001 Computer Science, la formación
en carreras de informática, ciencias de la computación o ingeniería de sistemas deberá prestar especial importancia
a temas tales como:
• Algoritmos y estructuras de datos.
• La World Wide Web y sus aplicaciones.
• Las tecnologías de red y en especial aquellas basadas en TCP/IP.
• Gráficos y multimedia.
• Sistemas empotrados.
• Bases de datos relacionales.
• Inteoperabilidad.
• Programación orientada a objetos.
• Interacción Persona-Máquina.
• …
ACM, velando porque sus miembros —al fin y al cabo, representantes de la comunidad informática mundial— si-
gan los progresos científicos y, en consecuencia, culturales y sociales derivados de las innovaciones tecnológicas, ha
trabajado durante muchos años en un nuevo modelo curricular de la carrera de ingeniero informático o ingeniero de
sistemas (computer sciences) y a finales del 2001 publicó su anteproyecto de currículo profesional (informe CC2001).
El cuerpo de conocimiento incluido en este informe contempla una estructura con 14 grupos de conocimiento que
van desde las Estructuras Discretas a la Ingeniería de Software pasando por Fundamentos de Programación (Progra-
mming Fundamentals, PF). En nuestro caso, y para reconocimiento de las citadas palabras, nos cabe el honor de que
nuestra obra, que ha cumplido recientemente VEINTE AÑOS DE VIDA, tenga el mismo título en español (Funda-
mentos de Programación, Programming Fundamentals) que uno de los 14 grupos de conocimiento ahora reco-
mendados como disciplina fundamental por la ACM dentro de su currículo de Computer Science. Así, en el citado
currículo se incluyen descriptores tales como: construcciones de programación fundamentales, algoritmos y resolu-
ción de problemas, estructuras de datos fundamentales y recursividad o recursión.
También los planes de estudios de ingeniería informática en España (superior y técnicas de sistemas o de gestión)
y de otras ingenierías (telecomunicaciones, industriales, etc.) y de ingeniería de sistemas en Latinoamérica, incluyen
asignaturas tales como Metodología de la Programación, Fundamentos de Programación o Introducción a la Pro-
gramación.
Del estudio comparado de las citadas recomendaciones curriculares, así como de planes de estudios conocidos
de carreras de ingeniería de sistemas y licenciaturas en informática de universidades latinoamericanas, hemos llega-
do a la consideración de que la iniciación de un estudiante de ingeniería informática o de ingeniería de sistemas en
las técnicas de programación del siglo xxi requiere no sólo del aprendizaje clásico del diseño de algoritmos y de la
comprensión de las técnicas orientadas a objetos, sino un método de transición hacia tecnologías de Internet. Por
otra parte, un libro dirigido a los primeros cursos de introducción a la programación exige no sólo la elección de un
lenguaje de programación adecuado si no, y sobre todo, «proporcionar al lector las herramientas para desarrollar
programas correctos, eficientes, bien estructurados y con estilo, que sirvan de base para la construcción de unos fun-
damentos teóricos y prácticos que le permitan continuar con éxito sus estudios de los cursos superiores de su carrera,
así como su futura especialización en ciencias e ingeniería». En consecuencia y de modo global, la obra pretende
enseñar técnicas de análisis, diseño y construcción de algoritmos, estructuras de datos y objetos, así como reglas
para la escritura de programas, eficientes tanto estructurados, fundamentalmente, como orientados a objetos.
De modo complementario, y no por ello menos importante, se busca también enseñar al alumno técnicas de abstrac-
ción que le permitan resolver los problemas de programación del modo más sencillo y racional pensando no sólo en
el aprendizaje de reglas de sintaxis y construcción de programas, sino, y sobre todo, aprender a pensar para conseguir
la resolución del problema en cuestión de forma clara, eficaz y fácil de implementar en un lenguaje de programación
y su ejecución posterior en una computadora u ordenador.
OBJETIVOS DEL LIBRO
El libro pretende enseñar a programar utilizando conceptos fundamentales, tales como:
1. Algoritmos (conjunto de instrucciones programadas para resolver una tarea específica).
2. Datos (una colección de datos que se proporcionan a los algoritmos que se han de ejecutar para encontrar una
solución: los datos se organizarán en estructuras de datos).
3. Objetos (conjunto de datos y algoritmos que los manipulan, encapsulados en un tipo de dato conocido como
objeto).
4. Clases (tipos de objetos con igual estado y comportamiento, o dicho de otro modo, los mismos atributos y
operaciones).
5. Estructuras de datos (conjunto de organizaciones de datos para tratar y manipular eficazmente datos homo-
géneos y heterogéneos).
6. Temas avanzados (recursividad, métodos avanzados de ordenación y búsqueda, relaciones entre clases, etc.).
Los dos primeros aspectos, algoritmos y datos, han permanecido invariables a lo largo de la corta historia de la
informática/computación, pero la interrelación entre ellos sí que ha variado y continuará haciéndolo. Esta interrelación
se conoce como paradigma de programación.
En el paradigma de programación procedimental (procedural o por procedimientos) un problema se modela di-
rectamente mediante un conjunto de algoritmos. Por ejemplo, la nómina de una empresa o la gestión de ventas de un
almacén se representan como una serie de funciones que manipulan datos. Los datos se almacenan separadamente y
se accede a ellos o bien mediante una posición global o mediante parámetros en los procedimientos. Tres lenguajes
de programación clásicos, FORTRAN, Pascal y C, han representado el arquetipo de la programación procedimental,
también relacionada estrechamente y —normalmente— conocida como programación estructurada. La programa-
ción con soporte en C y Pascal proporciona el paradigma procedimental tradicional con un énfasis en funciones,
plantillas de funciones y algoritmos genéricos.
En la década de los ochenta, el enfoque del diseño de programas se desplazó desde el paradigma procedimental
al orientado a objetos apoyado en los tipos abstractos de datos (TAD). Desde entonces conviven los dos paradigmas.
En el paradigma orientado a objetos un problema se modela un conjunto de abstracciones de datos (tipos de datos)
conocidos como clases. Las clases contienen un conjunto de instancias o ejemplares de la misma que se denominan
objetos, de modo que un programa actúa como un conjunto de objetos que se relacionan entre sí. La gran diferencia
entre ambos paradigmas reside en el hecho de que los algoritmos asociados con cada clase se conocen como interfaz
pública de la clase y los datos se almacenan privadamente dentro de cada objeto, de modo que el acceso a los datos
está oculto al programa general y se gestionan a través de la interfaz.
Así pues, en resumen, los objetivos fundamentales de esta obra son: aprendizaje y formación en algoritmos y
programación estructurada, estructuras de datos y programación orientada a objetos. Evidentemente, la mejor forma
de aprender a programar es con la ayuda de un lenguaje de programación. Apoyados en la experiencia de nuestras
tres primeras ediciones y en los resultados conseguidos con nuestros alumnos y lectores, hemos seguido apostando
por utilizar un lenguaje algorítmico —pseudolenguaje— que apoyado en un pseudocódigo (seudocódigo) en español
nos permitiera enseñar al alumno las técnicas y reglas de programación y que su aprendizaje fuese rápido y gradual.
Naturalmente, además del pseudocódigo hemos utilizado las otras herramientas de programación clásicas y probadas
como los diagramas de flujo o los diagramas N-S.
xviii Prefacio a la cuarta edición
En esta cuarta edición hemos seguido utilizando el mismo lenguaje algorítmico al que ya se le añadió las cons-
trucciones y estructuras necesarias para incorporar en sus especificaciones las técnicas orientadas a objetos. Así,
hemos seguido utilizando nuestro lenguaje UPSAM inspirado en los lenguajes estructurados por excelencia, C, Pas-
cal y FORTRAN, y le hemos añadido las propiedades de los lenguajes orientados a objetos tales como C++, Java y
C#, en la mejor armonía posible y con unas especificaciones que hemos incluido en los Apéndices I a V del sitio de
Internet del libro (www.mhe.es/joyanes), como ya hiciéramos también en las tres primeras ediciones.
EL LIBRO COMO HERRAMIENTA DOCENTE
En el contenido de la obra hemos tenido en cuenta no sólo las directrices de los planes de estudio españoles de in-
geniería informática (antigua licenciatura en informática), ingeniería técnica en informática y licenciatura en ciencias
de la computación, sino también de ingenierías, tales como industriales, telecomunicaciones, agrónomos o minas, o
las más jóvenes, como ingeniería en geodesia, ingeniería química o ingeniería telemática. Nuestro conocimiento del
mundo educativo latinoamericano nos ha llevado a pensar también en las carreras de ingeniería de sistemas compu-
tacionales y las licenciaturas en informática y en sistemas de información, como se las conoce en Latinoamérica.
El contenido del libro se ha escrito pensando en un posible desarrollo de dos cuatrimestres o semestres o en un
año completo, y siguiendo los descriptores (temas centrales) recomendados en las directrices del Ministerio de Edu-
cación y Ciencia español para los planes de estudio de Ingeniería en Informática, Ingeniería Técnica en Informá-
tica e Ingeniería Técnica en Informática, y los planes de estudios de Ingeniería de sistemas y Licenciaturas en
Informática con el objeto de poder ser utilizado también por los estudiantes de primeros semestres de estas carreras.
Igualmente pretende seguir las directrices que contiene el Libro Blanco de Informática en España para la futura ca-
rrera Grado en Ingeniería Informática adaptada al futuro Espacio Europeo de Educación Superior (Declaración de
Bolonia). Desde el punto de vista de currículum, se pretende que el libro pueda servir para asignaturas tales como
Introducción a la Programación, Fundamentos de Programación y Metodología de la Programación, y también, si
el lector o el maestro/profesor lo consideran oportuno, para cursos de Introducción a Estructuras de Datos y/o a
Programación Orientada a Objetos.
No podíamos dejar de lado las recomendaciones de la más prestigiosa organización de informáticos del mundo,
ACM, anteriormente citada. Se estudió en su momento los Curricula de Computer Science vigentes durante el largo
periodo de elaboración de esta obra (68, 78 y 91), pero siguiendo la evolución del último curricula, por lo que tras su
publicación el 15 de diciembre de 2001 del «Computing Curricula 2001 Computer Science» estudiamos el citado cu-
rrículo y durante la escritura de nuestra tercera edición consideramos cómo introducir también sus directrices más
destacadas; como lógicamente no se podía seguir todas las directrices de su cuerpo de conocimiento al pie de la letra,
analizamos en profundidad las unidades más acordes con nuestros planes de estudios: Programming Fundamentals
(PF), Algorithms and Complexity (AL) y Programming Languages (PL). Por suerte nuestra obra incorporaba la mayo-
ría de los temas importantes recomendados en las tres citadas unidades de conocimiento, en gran medida de la unidad
PF, y temas específicos de programación orientado a objetos y de análisis de algoritmos de las unidades PL y AL.
El contenido del libro abarca los citados programas y comienza con la introducción a los algoritmos y a la pro-
gramación, para llegar a estructuras de datos y programación orientada a objetos. Por esta circunstancia la estructura
del curso no ha de ser secuencial en su totalidad sino que el profesor/maestro y el alumno/lector podrán estudiar sus
materias en el orden que consideren más oportuno. Esta es la razón principal por la cual el libro se ha organizado en
cuatro partes y en cuatro apéndices y ocho apéndices en Internet.
Se trata de describir los dos paradigmas más populares en el mundo de la programación: el procedimental y el
orientado a objetos. Los cursos de programación en sus niveles inicial y medio están evolucionando para aprovechar
las ventajas de nuevas y futuras tendencias en ingeniería de software y en diseño de lenguajes de programación, es-
pecíficamente diseño y programación orientada a objetos. Numerosas facultades y escuelas de ingenieros, junto con
la nueva formación profesional (ciclos formativos de nivel superior) en España y en Latinoamérica, están introdu-
ciendo a sus alumnos en la programación orientada a objetos, inmediatamente después del conocimiento de la pro-
gramación estructurada, e incluso —en ocasiones antes—. Por esta razón, una metodología que se podría seguir sería
impartir un curso de algoritmos e introducción a la programación (parte I) seguido de estructuras de datos (parte II)
y luego seguir con un segundo nivel de programación avanzada y programacion orientada a objetos (partes II, III y
IV) que constituyen las cuatro partes del libro. De modo complementario, si el alumno o el profesor/maestro lo desea
se puede practicar con algún lenguaje de programación estructurado u orientado a objetos, ya que pensando en esa
posibilidad se incluyen en la página web del libro, apéndices con guías de sintaxis de los lenguajes de programación
más populares hoy día, C, C++, Java y C# e incluso se han mantenido resúmenes de guías de sintaxis de Pascal,
FORTRAN y Modula-2.
Prefacio a la cuarta edición xix
Uno de los temas más debatidos en la educación en informática o en ciencias de la computación (Computer
Sciences) es el rol de la programación en el currículo introductorio. A través de la historia de la disciplina —como
fielmente reconoce en la introducción del Capítulo 7 relativo a cursos de introducción, ACM en su Computing Cu-
rricula 2001 [ACM91]— la mayoría de los cursos de introducción a la informática se han centrado principalmente
en el desarrollo de habilidades o destrezas de programación. La adopción de un curso de introducción a la progra-
mación proviene de una serie de factores prácticos e históricos e incluyen los siguientes temas:
• La programación es una técnica esencial que debe ser dominada por cualquier estudiante de informática. Su
inserción en los primeros cursos de la carrera asegura que los estudiantes tengan la facilidad necesaria con la
programación para cuando se matriculan en los cursos de nivel intermedio y avanzado.
• La informática no se convirtió en una disciplina académica hasta después que la mayoría de las instituciones
ha desarrollado un conjunto de cursos de programación introductorias que sirvan a una gran audiencia.
• El modelo de aprendizaje en programación siguió desde el principio las tempranas recomendaciones del Currí-
culo 68 [ACM68] que comenzaba con un curso denominado «Introducción a la Computación», en la que la
abrumadora mayoría de los temas estaban relacionados con la programación. Con posterioridad, y en el currí-
culum del 78 de la ACM [ACM78] definía a estos cursos como «Introducción a la Programación» y se les
denominó CS1 y CS2; hoy día se le sigue denominando así por la mayoría de los profesores y universidades
que seguimos criterios emanados de la ACM.
La fluidez en un lenguaje de programación es prerrequisito para el estudio de las ciencias de la computación. Ya
en 1991 el informe CC1991 de la ACM reconocía la exigencia del conocimiento de un lenguaje de programación.
• Los programas de informática deben enseñar a los estudiantes cómo usar al menos bien un lenguaje de progra-
mación. Además, recomendamos que los programas en informática deben enseñar a los estudiantes a ser com-
petentes en lenguajes y que hagan uso de al menos dos paradigmas de programación. Como consecuencia de
estas ideas, el currículo 2001 de la ACM contempla la necesidad de conceptos y habilidades que son funda-
mentales en la práctica de la programación con independencia del paradigma subyacente. Como resultado de
este pensamiento, el área de Fundamentos de Programación incluye unidades sobre conceptos de programación,
estructuras de datos básicas y procesos algorítmicos. Además de estas unidades fundamentales se requieren
conceptos básicos pertenecientes a otras áreas, como son Lenguajes de Programación (PL, Programming Lan-
guages) y de Ingeniería de Software (SE, Software Engineering).
Los temas fundamentales que considera el currículo 2001 son:
• construcciones fundamentales de programación,
• algoritmos y resolución de problemas,
• estructuras de datos fundamentales,
• recursión o recursividad,
• programación controlada por eventos,
de otras áreas, Lenguajes de Programación (PL), destacar:
• revisión de lenguajes de programación,
• declaraciones y tipos,
• mecanismos de abstracción,
• programación orientada a objetos,
y de Ingeniería de Software (SE):
• diseño de software,
• herramientas y entornos de software,
• requisitos y especificaciones de software.
Este libro se ha escrito pensando en que pudiera servir de referencia y guía de estudio para un primer curso de
introducción a la programación, con una segunda parte que, a su vez, sirviera como continuación y para un posible
segundo curso, de estructuras de datos y programación orientada a objetos. El objetivo final que busca es, no sólo
xx Prefacio a la cuarta edición
describir la sintaxis de un lenguaje de programación, sino, y sobre todo, mostrar las características más sobresalien-
tes del lenguaje algorítmico y a la vez enseñar técnicas de programación estructurada y orientada a objetos. Así pues,
los objetivos fundamentales son:
• Énfasis fuerte en el análisis, construcción y diseño de programas.
• Un medio de resolución de problemas mediante técnicas de programación.
• Una introducción a la informática y a las ciencias de la computación usando una herramienta de programación
denominada pseudocódigo.
• Aprendizaje de técnicas de construcción de programas estructurados y una iniciación a los programas orientados
a objetos.
Así se tratará de enseñar las técnicas clásicas y avanzadas de programación estructurada, junto con técnicas
orientadas a objetos. La programación orientada a objetos no es la panacea universal de un programador del siglo xxi,
pero le ayudará a realizar tareas que, de otra manera, serían complejas y tediosas.
El contenido del libro trata de proporcionar soporte a un año académico completo (dos semestres o cuatrimestres),
alrededor de 24 a 32 semanas, dependiendo lógicamente de su calendario y planificación. Los diez primeros capítu-
los pueden comprender el primer semestre y los restantes capítulos pueden impartirse en el segundo semestre. Lógi-
camente la secuencia y planificación real dependerá del maestro o profesor que marcará y señalará semana a semana
la progresión que él considera lógica. Si usted es un estudiante autodidacta, su propia progresión vendrá marcada por
las horas que dedique al estudio y al aprendizaje con la computadora, aunque no debe variar mucho del ritmo citado
al principio de este párrafo.
EL LENGUAJE ALGORÍTMICO DE PROGRAMACIÓN UPSAM 2.0
Los cursos de introducción a la programación se apoyan siempre en un lenguaje de programación o en un pseudo-
lenguaje sustentado sobre un pseudocódigo. En nuestro caso optamos por esta segunda opción: el pseudolenguaje
con la herramienta del pseudocódigo en español o castellano. Desde la aparición de la primera edición, allá por fina-
les de los años ochenta, apostamos fundamentalmente por el pseudocódigo para que junto con los diagramas de flujo
y diagramas N-S nos ayudara a explicar técnicas de programación a nuestros alumnos. Con ocasión de la publicación
de la segunda edición (año 1996) no sólo seguimos apostando otra vez, y fundamentalmente, por el pseudocódigo
sino que juntamos los trabajos de todos los profesores del antiguo Departamento de Lenguajes y Sistemas Informá-
ticos e Ingeniería de Software de la Facultad de Informática y Escuela Universitaria de Informática de la Universidad
Pontificia de Salamanca en el campus de Madrid y le dimos forma a la versión 1.0 del lenguaje UPSAM1
.
La versión 1.0 de UPSAM se apoyaba fundamentalmente en los lenguajes de programación Pascal (Turbo Pascal)
y C, con referencias a FORTRAN, COBOL y BASIC, y algunas ideas del lenguaje C++ que comenzaba ya a ser un
estándar en el mundo de la programación. Java nació en 1995 mientras el libro estaba en imprenta, aunque la edición
de nuestra obra se publicó en 1996. Por ello el lenguaje algorítmico sólo contenía reglas de sintaxis y técnicas de
programación estructurada. Sin embargo, en la segunda mitad de los noventa, C++ se acabó por imponer como es-
tándar en el mundo de la programación, y Java iba asentándose como lenguaje de programación para la Web e Inter-
net, por lo que la nueva especificación algorítmica debería contemplar estos lenguajes emergentes, consolidado en el
caso de C++.
En los primeros años del siglo XXI, Java se terminó de implantar como lenguaje universal de Internet y también
como lenguaje estándar para el aprendizaje de programación de computadoras; pero además, y sobre todo, para cur-
sos de programación orientada a objetos y estructuras de datos. De igual modo, C#, el lenguaje creado y presentado
por Microsoft a comienzos del año 2000, como competidor de Java y extensión de C/C++, también ha pasado a ser
una realidad del mundo de construcción de software y aunque no ha tenido tanta aceptación en el mundo del apren-
dizaje educativo de la programación, sí se ha implantado como lenguaje de desarrollo principalmente para plataformas
.Net. Por todo ello, la versión 2.0 del lenguaje algorítmico UPSAM que presentamos ya en la tercera edición de esta
obra, se apoyó fundamentalmente en C y C++, así como en Java y C#, aunque hemos intentado no olvidar sus viejos
orígenes apoyados en Pascal y Turbo Pascal, y algo menos en FORTRAN y COBOL.
Así pues, la versión 2.0 del lenguaje UPSAM presentada en 2003 y hoy revisada con la actualización 2.1, se
apoyaba en los quince años de vida (originalmente dicha versión se conocía como UPS; hoy hace ya veinte años) y
1
En los prólogos de la segunda y tercera edición, se referencian los nombres de todos los profesores que intervinimos en la redacción de la
especificación de la versión 1.0 y 2.0 y, por consiguiente, figuran como autores de dicha especificación.
Prefacio a la cuarta edición xxi
se construyó como mejora de la versión 1.0 presentada en la primera y segunda edición de esta obra. Para completar
la versión algorítmica, en el Apéndice D, se incluye una guía rápida de referencia del lenguaje C, “padre de todos
los lenguajes modernos”, y en el portal del libro (www.mhe.es/joyanes) se incluyen guías de todos los lenguajes
de programación considerados en la especificación UPSAM 2.1.
En la versión 2.0 trabajamos todos los profesores, de aquel entonces, del área de programación de la Universidad
Pontificia de Salamanca en el campus de Madrid, pero de un modo muy especial los profesores compiladores de to-
das las propuestas de nuestros compañeros, además del autor de esta obra. Especialmente quiero destacar a los pro-
fesores Luis Rodríguez Baena, Víctor Martín García, Lucas Sánchez García, Ignacio Zahonero Martínez y
Matilde Fernández Azuela. Cabe destacar también la gran contribución y revisión de la versión 2.0 del profesor
Joaquín Abeger, y restantes compañeros del entonces departamento de Lenguajes y Sistemas Informáticos e Ingenie-
ría de Software de la Facultad de Informática y Escuela Universitaria de Informática de la Universidad Pontificia de
Salamanca en el campus de Madrid, cuyas aportaciones han sido fundamentales para que la versión 2.0 viera la luz.
Deseo resaltar de modo muy especial la gran aportación práctica y de investigación a todas las versiones de UP-
SAM realizada por los profesores de Procesadores de Lenguajes (Compiladores), María Luisa Díez Plata y Enrique
Torres Franco, que durante numerosos cursos académicos han implementado partes del lenguaje en un traductor, en
las prácticas y proyectos de compiladores diseñados por y para los alumnos de la citada asignatura de cuarto curso
(séptimo y octavo semestre), en algunos casos funcionando con prototipos. De igual forma, deseo expresar mi agra-
decimiento a la profesora de la Universidad de Alicante, Rosana Latorre Cuerda, que no sólo ha apoyado conti-
nuamente esta obra sino que además ha utilizado el lenguaje algorítmico UPSAM en sus clases de compiladores y
de programación.
Muchos —innumerables diría yo— son los profesores, colegas, y sin embargo amigos, que me han apoyado, re-
visado y dado ideas para mejorar las sucesivas ediciones del lenguaje algorímico. Es imposible enumerarlos a todos
aquí —y asumo el enorme riesgo de haber olvidado a muchos, a los que ya pido y presento mis disculpas— por lo
que trataré de enumerar al menos a aquellos que me vienen a la memoria en este instante —que los duendes de las
imprentas me exigen sea ya— y reitero mis disculpas a todos los que ahora no figuran (y trataré de que estén en el
sitio oficial del libro y en próximas ediciones). Gracias infinitas a todos: María Eugenia Valesani (Universidad Na-
cional del Nordeste, Argentina), Héctor Castán Rodríguez (Universidad Pontificia de Salamanca, campus de Madrid),
Vidal Alonso Secades, Alfonso López Rivero y Miguel Ángel Sánchez Vidales (Universidad Pontificia de Salamanca,
campus de Salamanca), David La Red (Universidad Nacional del Nordeste, Argentina), Óscar Sanjuán Martínez y
Juan Manuel Cueva Lovelle (Universidad de Oviedo), Darwin Muñoz (Unibe, República Dominicana), Ricardo Mo-
reno (Universidad Tecnológica de Pereira, Colombia), Miguel Cid (INTEC, República Dominicana), Julio Perrier
(Universidad Autónoma de Santo Domingo, República Dominicana), Quinta Ana Pérez (ITLA, República Dominica-
na), Jorge Torres (Tecnológico de Monterrey, campus de Querétaro, México), Augusto Bernuy (UTP, Lima, Perú),
Juan José Moreno (Universidad Católica de Uruguay), Manuel Pérez Cota (Universidad de Vigo), Ruben González
(Universidad Pontificia de Salamanca, campus de Madrid), José Rafael García-Bermejo Giner (Universidad de Sala-
manca), Víctor Hugo Medina García y Giovanni Tarazona (Universidad Distrital, Bogotá, Colombia), Luz Mayela
Ramírez y mi querido Jota Jota (Universidad Católica de Colombia), Alveiro (de la Universidad Cooperativa de Co-
lombia), Marcelo (de la Universidad de Caldas), Sergio Ríos (Universidad Pontificia de Salamanca, campus de Sala-
manca), Rosana Latorre Cuerda (Universidad de Salamanca)... bueno, son tantos que necesitaría quizá un tiempo
infinito para nombrarlos a todos. A los ausentes, mis disculpas; y a todos, gracias: esta obra es, en gran parte, vuestra,
con todas vuestras ayudas, críticas, apoyos y con todo cuanto el corazón pueda hablar.
Espero que la versión 2.1, la actual, y la futura, 3.0, sean capaces de recoger todo el trabajo de nuestro grupo de
investigación y de todos los profesores de universidades amigas.
CARACTERÍSTICAS IMPORTANTES DEL LIBRO
Fundamentos de programación, cuarta edición, utiliza en cada capítulo los siguientes elementos clave para conseguir
obtener el mayor rendimiento del material incluido:
• Objetivos. Enumera los conceptos y técnicas que el lector y los estudiantes aprenderán en el capítulo. Su lec-
tura ayudará a los estudiantes a determinar si se han cumplido estos objetivos después de terminar el capítulo.
• Contenido. Índice completo del capítulo que facilita la lectura y la correcta progresión en la lectura y com-
prensión de los diferentes temas que se exponen posteriormente.
• Introducción. Abre el capítulo con una breve revisión de los puntos y objetivos más importantes que se trata-
rán y todo aquello que se puede esperar del mismo.
xxii Prefacio a la cuarta edición
• Descripción del capítulo. Explicación usual de los apartados correspondientes del capítulo. En cada capítulo
se incluyen ejemplos y ejercicios resueltos. Los listados de los programas completos o parciales se escriben en
letra “courier” con la finalidad principal de que puedan ser identificados fácilmente por el lector. Todos ellos
han sido probados para facilitar la práctica del lector/alumno.
• Conceptos clave. Enumera los términos de computación, informáticos y de programación (terminología) más
notables que se han descrito o tratado en el capítulo.
• Resumen del capítulo. Revisa los temas importantes que los estudiantes y lectores deben comprender y recor-
dar. Busca también ayudar a reforzar los conceptos clave que se han aprendido en el capítulo.
• Ejercicios. Al final de cada capítulo se proporciona a los lectores una lista de ejercicios sencillos de modo que
le sirvan de oportunidad para que puedan medir el avance experimentado mientras leen y siguen —en su
caso— las explicaciones del profesor relativas al capítulo.
• Problemas. En muchos capítulos se incluyen enunciados de problemas propuestos para realizar por el alumno
y que presentan una mayor dificultad que los ejercicios antes planteados. Se suelen incluir una serie de activi-
dades y proyectos de programación que se le proponen al lector como tarea complementaria de los ejercicios.
A lo largo de todo el libro se incluyen una serie de recuadros —sombreados o no— que ofrecen al lector conse-
jos, advertencias y reglas de uso del lenguaje y de técnicas de programación, con la finalidad de que puedan ir asi-
milando conceptos prácticos de interés que les ayuden en el aprendizaje y construcción de programas eficientes y de
fácil lectura.
• Recuadro. Conceptos importantes que el lector debe considerar durante el desarrollo del capítulo.
• Consejo. Ideas, sugerencias, recomendaciones... al lector, con el objetivo de obtener el mayor rendimiento
posible del lenguaje y de la programación.
• Precaución. Advertencia al lector para que tenga cuidado al hacer uso de los conceptos incluidos en el recuadro
adjunto.
• Nota. Normas o ideas que el lector debe seguir preferentemente en el diseño y construcción de sus programas.
ORGANIZACIÓN DEL LIBRO
El libro se ha dividido en cuatro partes a efectos de organización para su lectura y estudio gradual. Dado que el co-
nocimiento es acumulativo, se comienza en los primeros capítulos con conceptos conceptuales y prácticos, y se avan-
za de modo progresivo hasta llegar a las técnicas avanzadas y a una introducción a la ingeniería de software que
intentan preparar al lector/estudiante para sus estudios posteriores. Como complemento y ayuda al lector durante sus
estudios y para su posterior formación profesional, se han incluido una gran cantidad de apéndices que incluyen fun-
damentalmente guías de sintaxis de los lenguajes de programación más populares con el objetivo de facilitar la im-
plementación de los algoritmos en el lenguaje de programación elegido para «dialogar» con la computadora. Así
mismo, y para ayudar a la preparación del aprendizaje, lecturas y estudios futuros, se ha incluido una amplia guía de
recursos de programación (libros, revistas y sitios Web «URLs») que hemos consultado en la elaboración de nuestra
obra y seguimos consultando también en nuestra vida profesional.
PARTE I. ALGORITMOS Y HERRAMIENTAS DE PROGRAMACIÓN
Esta parte es un primer curso de programación para alumnos principiantes en asignaturas de introducción a la pro-
gramación en lenguajes estructurados y sirve tanto para cursos introductorios de carácter semestral, tales como In-
troducción a la Programación, Metodología de la Programación o Fundamentos de programación, en primeros
cursos de carreras de ingeniería informática, ingeniería de sistemas y licenciatura en informática o en sistemas de
información, y asignaturas de programación de ingeniería y de ciencias. Contiene esta parte los fundamentos teóricos
y prácticos relativos a la organización de una computadora y los lenguajes de programación, así como la descripción
de las herramientas de programación más frecuentemente utilizadas en el campo de la programación. Se incluyen
también en esta parte los elementos básicos constitutivos de un programa y las herramientas de programación utili-
zadas, tales como algoritmos, diagramas de flujo, etc. La segunda mitad de esta primera parte es una descripción
teórico-práctica de las estructuras utilizadas para controlar el flujo de instrucciones de un programa y una descripción
detallada del importante concepto de subprograma (procedimiento/función), piedra angular de la programación mo-
dular y estructurada.
Prefacio a la cuarta edición xxiii
Capítulo 1. Introducción a las computadoras y los lenguajes de programación. Las computadoras son herramien-
tas esenciales en muchas áreas de la vida: profesional, industrial, empresarial, académica,... en realidad, en casi todos
los campos de la sociedad. Las computadoras funcionan correctamente con la ayuda de los programas. Los programas
se escriben mediante lenguajes de programación que previamente se han escrito en algoritmos u otras herramientas,
tales como diagramas de flujo. Este capítulo introductorio describe la organización de una computadora y sus dife-
rentes partes junto con el concepto de programa y de lenguaje de programación. Así mismo y al objeto de que el
lector pueda entender los fundamentos teóricos en que se asienta la programación, se incluye una breve historia de
los lenguajes de programación más influyentes y que, en el caso de la tercera edición, han servido de inspiración para
la nueva versión del pseudocódigo UPSAM 2.0: es decir, C, C++, Java y C#, con referencias lógicas al histórico
Pascal.
Capítulo 2. Metodología de la programación y desarrollo de software. En este capítulo se describen métodos para
la resolución de problemas con computadora y con un lenguaje de programación (en nuestro caso el pseudolen-
guaje o lenguaje algorítmico UPSAM 2.0). Se explican las fases de la resolución de un problema junto con las
técnicas de programación modular y estructurada. Se inicia en este capítulo la descripción del concepto, función y
uso de algoritmo. Uno de los objetivos más importantes de este libro es el aprendizaje, diseño y construcción de
algoritmos.
Capítulo 3. Estructura general de un programa. Enseña la organización y estructura general de un programa así
como su creación y proceso de ejecución. Se describen los elementos básicos de un programa: tipos de datos, cons-
tantes, variables y entradas/salidas de datos. También se introduce al lector en la operación de asignación así como
en el concepto de función interna. De igual forma se estudian los importantes conceptos de expresiones y operaciones
junto con sus diferentes tipos.
Capítulo 4. Flujo de control I: Estructuras selectivas. Introduce al concepto de estructura de control y, en particu-
lar, estructuras de selección, tales como si-entonces ("if-then"), según_sea/caso_de ("switch/case").
Se describen también las estructuras de decisión anidadas. Así mismo se explica también la «denostada» sentencia
ir_a (goto), cuyo uso no se recomienda pero sí el conocimiento de su funcionamiento,
Capítulo 5. Flujo de control II: Estructuras repetitivas. El capítulo introduce las estructuras repetitivas (mientras
("while"), hacer-mientras ("do-while"), repetir ("repeat"), desde/para ("for")). Examina la re-
petición (iteración) de sentencias en detalle y compara los bucles controlados por centinela, bandera, etc. Explica
precauciones y reglas de uso de diseño de bucles. Compara los tres diferentes tipos de bucles, así como el concepto
de bucles anidados.
Capítulo 6. Subprogramas (subalgoritmos): Funciones. La resolución de problemas complejos se facilita con-
siderablemente si se divide en problemas más pequeños (subproblemas). La resolución de estos problemas se
realiza con subalgoritmos (subprogramas) que a su vez se dividen en dos grandes categorías: funciones y proce-
dimientos.
PARTE II. ESTRUCTURA DE DATOS
Esta parte es clave en el aprendizaje de técnicas de programación. Tal es su importancia que los planes de estudio de
cualquier carrera de ingeniería informática o de ciencias de la computación incluye una asignatura troncal denomi-
nada Estructura de datos.
Capítulo 7. Estructuras de datos I (arrays y estructuras). Examina la estructuración de los datos en arrays o grupos
de elementos dato del mismo tipo. El capítulo presenta numerosos ejemplos de arrays de uno, dos o múltiples índices.
También se explican los otros tipos de estructuras de datos básicas: estructuras y registros. Estas estructuras de datos
permiten encapsular en un tipo de dato definido por el usuario otros datos heterogéneos. Así mismo se describe el
concepto de arrays de estructuras y arrays de registros.
Capítulo 8. Las cadenas de caracteres. Se examina el concepto de carácter y de cadena (String) junto con su
declaración e inicialización. Se introducen conceptos básicos de manipulación de cadenas: lectura y asignación jun-
to con operaciones básicas, tales como longitud, concatenación, comparación, conversión y búsqueda de caracteres
y cadenas. Las operaciones de tratamiento de caracteres y cadenas son operaciones muy usuales en todo tipo de pro-
gramas.
xxiv Prefacio a la cuarta edición
Capítulo 9. Archivos (ficheros). El concepto de archivo junto con su definición e implementación es motivo de es-
tudio en este capítulo. Los tipos de archivos más usuales junto con las operaciones básicas de manipulación se estu-
dian con detenimiento.
Capítulo 10. Ordenación, búsqueda e intercalación. Las computadoras emplean una gran parte de su tiempo en
operaciones de búsqueda, clasificación y mezcla de datos. Los archivos se sitúan adecuadamente en dispositivos de
almacenamiento externo que son más lentos que la memoria central pero que, por el contrario, tienen la ventaja de
almacenamiento permanente después de apagar la computadora. Se describen los algoritmos de los métodos más
utilizados en el diseño e implementación de programas.
Capítulo 11. Ordenación, búsqueda y fusión externa (archivos). Normalmente los datos almacenados de modo
permanente en dispositivos externos requieren para su procesamiento el almacenamiento en la memoria central. Por
esta circunstancia, las técnicas de ordenación y búsqueda sobre arrays y vectores comentados en el capítulo anterior
necesitan una profundización en cuanto a técnicas y métodos. Una de las técnicas más importantes es la fusión o
mezcla. En el capítulo se describen las técnicas de manipulación externa de archivos.
Capítulo 12. Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas). Una lista enlazada es una
estructura de datos que mantiene una colección de elementos, pero el número de ellos no se conoce por anticipado
o varía en un amplio rango. La lista enlazada se compone de elementos que contienen un valor y un puntero. El ca-
pítulo describe los fundamentos teóricos y las operaciones que se pueden realizar en la lista enlazada. También se
describen los distintos tipos de listas enlazadas, tales como doblemente enlazadas y circulares. Las ideas abstractas
de pila y cola se describen en el capítulo. Pilas y colas se pueden implementar de diferentes maneras, bien con vec-
tores (arrays) o con listas enlazadas.
Capítulo 13. Estructuras de datos no lineales (árboles y grafos). Los árboles son otro tipo de estructura de datos
dinámica y no lineal. Se estudian las operaciones básicas en los árboles junto con sus operaciones fundamentales.
Capítulo 14. Recursividad. El importante concepto de recursividad (propiedad de una función de llamarse a sí mis-
ma) se introduce en el capítulo junto con algoritmos complejos de ordenación y búsqueda en los que además se es-
tudia su eficiencia.
PARTE III. PROGRAMACIÓN ORIENTADA A OBJETOS Y UML 2.1.
Nuestra experiencia en la enseñanza de la programación orientada a objetos a estudiantes universitarios data de fina-
les de la década de los ochenta. En este largo periodo, los primitivos y básicos conceptos de orientación a objetos se
siguen manteniendo desde el punto de vista conceptual y práctico, tal y como se definieron hace treinta años. Hoy la
programación orientada a objetos es una clara realidad y por ello cualquier curso de introducción a la programación
aconseja, al menos, incluir un pequeño curso de orientación a objetos que puede impartirse como un curso indepen-
diente, como complemento de la Parte II o como parte de un curso completo de introducción a la programación que
comienza en el Capítulo 1.
Capítulo 15. Tipos abstractos de datos, objetos y modelado con UML 2.1. Este capítulo describe los conceptos
fundamentales de la orientación a objetos: clases, objetos y herencia. La definición y declaración de una clase junto
con su organización y estructura se explican detenidamente. Se describen también otros conceptos importantes, tales
como polimorfismo, ligadura dinámica y sobrecarga y un resumen de la terminología orientada a objetos.
Capítulo 16. Diseño de clases y objetos: representaciones gráficas en UML. Una de las tareas fundamentales de
un programador es el diseño y posterior implementación de una clase y de un objeto en un lenguaje de programación.
Para realizar esta tarea con eficiencia se exige el uso de una herramienta gráfica. UML es el lenguaje de modelado
unificado estándar en el campo de la ingeniería de software y en el capítulo se describen las notaciones gráficas bá-
sicas de clases y objetos.
Capítulo 17. Relaciones entre clases: Delegaciones, asociaciones, agregaciones, herencia. En este capítulo se in-
troducen los conceptos fundamentales de las relaciones entre clases: asociación, agregación y generalización/espe-
cialización. Se describen todas estas relaciones así como las notaciones gráficas que las representan en el lenguaje
de modelado UML.
Prefacio a la cuarta edición xxv
PARTE IV. METODOLOGÍA DE LA PROGRAMACIÓN Y DESARROLLO DE SOFTWARE
En esta parte se describen reglas prácticas para la resolución de problemas mediante programación y a su posterior
desarrollo de software. Estas reglas buscan proporcionar al lector reglas de puesta a punto de programas junto con
directrices de metodología de programación que faciliten al lector la tarea de diseñar y construir programas con ca-
lidad y eficiencia junto con una introducción a la ingeniería de software.
Capítulo 18. Resolución de problemas y desarrollo de software: Metodología de la programación. En el capítulo
se analiza el desarrollo de un programa y sus diferentes fases: análisis, diseño, codificación, depuración, pruebas y
mantenimiento. Estos principios básicos configuran la ingeniería de software como ciencia que pretende la concep-
ción, diseño y construcción de programas eficientes.
APÉNDICES
En todos los libros dedicados a la enseñanza y aprendizaje de técnicas de programación es frecuente incluir apéndi-
ces de temas complementarios a los explicados en los capítulos anteriores. Estos apéndices sirven de guía y referen-
cia de elementos importantes del lenguaje y de la programación de computadoras.
Apéndice A. Especificaciones del lenguaje algorítmico UPSAM 2.0. Se describen los elementos básicos del lengua-
je algorítmico en su versión 2.0 junto con la sintaxis de todos los componentes de un programa. Asímismo se espe-
cifican las palabras reservadas y símbolos reservados. En relación con la versión 1.0 de UPSAM es de destacar una
nueva guía de especificaciones de programación orientada a objetos, novedad en esta versión y que permitirá la tra-
ducción del pseudocódigo a los lenguajes orientados a objetos tales como C++, Java o C#.
Apéndice B. Prioridad de operadores. Tabla que contiene todos los operadores y el orden de prioridad y asociativi-
dad en las operaciones cuando aparecen en expresiones.
Apéndice C. Código ASCII y Unicode. Tablas de los códigos de caracteres que se utilizan en programas de compu-
tadoras. El código ASCII es el más universal y empleado de modo masivo por programadores de todo el mundo y,
naturalmente, es el que utilizan la mayoría de las computadoras actuales. Unicode es un lenguaje mucho más amplio
que utilizan las computadoras personales para realizar programas y aplicaciones en cualquier tipo de computadora y
en Internet. Unicode proporciona un número único para cada carácter, sin importar la plataforma, sin importar el
programa, sin importar el idioma. La importancia de Unicode reside, entre otras cosas, en que está avalado por líde-
res de la industria tales como Apple, HP, IBM, Microsoft, Oracle, Sun, entre otros. También es un requisito para los
estándares modernos, tales como XML, Java, C#, etc.
Apéndice D. Guía de sintaxis del lenguaje C. En este apéndice se hace una descripción de la sintaxis, gramática y
especificaciones más importantes del lenguaje C.
Bibliografía y recursos de programación: Libros, Revistas, Web, Compiladores. Enumeración de los libros más
sobresalientes empleados por el autor en la escritura de esta obra, así como otras obras importantes de referencia que
ayuden al lector que desee profundizar o ampliar aquellos conceptos que considere necesario conocer con más dete-
nimiento. Listado de sitios Web de interés para la formación en Java, tanto profesionales como medios de comuni-
cación, especialmente revistas especializadas.
APÉNDICES EN EL SITIO WEB (www.mhe.es/joyanes)
Apéndice I. Guía de sintaxis de Pascal y Turbo Pascal. Aunque ya está muy en desuso en la enseñanza de la pro-
gramación el lenguaje Pascal, su sintaxis y estructura sigue siendo un modelo excelente de aprendizaje y es ésta la
razón de seguir incluyendo esta guía de sintaxis en la obra.
Apéndice II. Guía de sintaxis del lenguaje ANSI C. Especificaciones, normas de uso y reglas de sintaxis del len-
guaje de programación C en su versión estándar ANSI/ISO.
Apéndice III. Guía de sintaxis del lenguaje ANSI/ISO C++ estándar. Especificaciones, normas de uso y reglas de
sintaxis del lenguaje de programación C++ en su versión estándar ANSI/ISO.
xxvi Prefacio a la cuarta edición
Apéndice IV. Guía de sintaxis del lenguaje Java 2. Descripción detallada de los elementos fundamentales del es-
tándar Java: especificaciones, reglas de uso y de sintaxis.
Apéndice V. Guía de sintaxis del lenguaje C#. Descripción detallada de los elementos fundamentales del lenguaje
C#: especificaciones, reglas de uso y de sintaxis.
Apéndice VI. Palabras reservadas: C++, Java y C#. Listados de palabras reservadas (clave) de los lenguajes de
programación C++, Java y C#. Se incluye también una tabla comparativa de las palabras reservadas de los tres len-
guajes de programación.
Apéndice VII. Glosario de palabras reservadas de C/C++. Glosario terminológico de las palabras reservadas del
lenguaje de programación C/C++ con una breve descripción y algunos ejemplos de uso de cada palabra.
Apéndice VIII. Glosario de palabras reservadas de C#. Glosario terminológico de las palabras reservadas del len-
guaje de programación C# con una breve descripción y algunos ejemplos de uso de cada palabra.
AGRADECIMIENTOS
Un libro nunca es fruto único del autor, sobre todo si el libro está concebido como libro de texto y autoaprendizaje,
y pretende llegar a lectores y estudiantes de informática y de computación, y, en general, de ciencias e ingeniería, así
como autodidactas en asignaturas tales como programación (introducción, fundamentos, avanzada, etc.). Esta obra
no es una excepción a la regla y son muchas las personas que nos han ayudado a terminarla. En primer lugar deseo
agradecer a mis colegas de la Universidad Pontificia de Salamanca en el campus de Madrid, y en particular del De-
partamento de Lenguajes y Sistemas Informáticos e Ingeniería de Software de la misma que desde hace muchos años
nos ayudan y colaboran en la impartición de las diferentes asignaturas del departamento y sobre todo en la elaboración
de los programas y planes de estudio de las mismas. A todos ellos les agradezco públicamente su apoyo y ayuda.
Esta cuarta edición ha sido leída y revisada con toda minuciosidad y —fundamentalmente— rigurosidad por los
siguientes profesores de la Universidad Pontificia de Salamanca en el campus de Madrid: Matilde Fernández Azue-
la, Lucas Sánchez García e Ignacio Zahonero Martínez (mi eterno agradecimiento).
Como ya comenté anteriormente, muchos otros profesores españoles y latinoamericanos me han ayudado en la
concepción y realización de esta obra y de otras muchas, de una u otra manera, apoyándome con su continua cola-
boración y sugerencia de ideas para la puesta en marcha de asignaturas del área de programación, en temas tan va-
riados como Fundamentos de Programación, Lenguajes de programación tales como BASIC, Visual Basic, Pascal,
C, C++, Java o Delphi. Citar a todos ellos me llevaría páginas completas. Sí, al menos, y como reconocimiento si-
lencioso, decir que además de España, se incluyen todos los países latinoamericanos desde México, Perú, Venezuela
o Colombia a Argentina, Uruguay y Chile en el cono sur, pasando por Guatemala o República Dominicana en Cen-
troamérica. En cualquier forma, sí quería destacar de modo especial a la profesora M.ª Eugenia Valesany de la Uni-
versidad Nacional del Nordeste de Corrientes en Argentina, por la labor de rigurosa revisión que realizó sobre la
segunda edición y la gran cantidad de sugerencias y propuestas que me ha hecho para esta nueva edición motivada
fundamentalmente por su extraordinaria y valiosa investigación al mundo de los algoritmos y de la programación. A
todos ellos y a todos nuestros lectores y alumnos de España y Latinoamérica, una vez más, nuestro agradeci-
miento eterno.
Además de a nuestros compañeros en la docencia y a nuestros alumnos, no puedo dejar de agradecer, una vez
más, a mi editor —y sin embargo amigo— José Luis García Jurado, que inició y puso en marcha todo el proyecto
de esta 4.ª edición, y también a mi nueva editora, Cristina Sánchez, que ha terminado dicho proyecto, las constantes
muestras de afecto y comprensión que han tenido con mi obra. Esta ocasión, como no era menos, tampoco ha sido
una excepción. Sin embargo, ahora he de resaltar esa gran amistad que nos une. La elaboración de esta obra por mil
circunstancias ha entrañado, más que nunca, tal vez muchas más dificultades que otras obras nuestras. De nuevo y
con gran paciencia, me han ayudado, comprendido y tolerado mis mil y una duda, sugerencias, retrasos, etc. No
puedo por menos de expresar mi infinito reconocimiento y agradecimiento. Sin esta comprensión y su apoyo continuo
posiblemente hoy todavía no habría visto la luz esta obra, debido a mis grandes retrasos en la entrega del original y
posteriores revisiones de imprenta. Con el corazón en la mano, mi eterno agradecimiento. Pero en esta ocasión tam-
bién deseo agradecer las muchas atenciones que mis editores de McGraw-Hill México dedican siempre a mis obras.
Sus consejos, ideas y sugerencias siempre son un enorme aliciente y una ayuda inestimable. Sus consejos, ideas y
sugerencias, unido a su gran paciencia y comprensión con el autor por sus muchos retrasos en la entrega de origina-
les, han hecho que la obra haya sido mejorada considerablemente en el proceso de edición.
Prefacio a la cuarta edición xxvii
Naturalmente —y aunque ya los he citado anteriormente—, no puedo dejar de agradecer a nuestros numerosos
alumnos, estudiantes y lectores, en general, españoles y latinoamericanos, que continuamente me aconsejan, critican
y proporcionan ideas para mejoras continuas de mis obras. Sin todo lo que hemos aprendido, seguimos aprendiendo
y seguiremos aprendiendo de ellos y sin su aliento continuo me sería prácticamente imposible terminar mis nuevas
obras y, en especial, este libro. De modo muy especial deseo reiterar mi agradecimiento a tantos y tantos colegas de
universidades españolas y latinoamericanas que apoyan nuestra labor docente y editorial. Mi más sincero reconoci-
miento y agradecimiento, una vez más, a todos: alumnos, lectores, colegas, profesores, maestros, monitores y edito-
res. Muy bien sé que siempre estaré en deuda con vosotros. Mi único consuelo es que vuestro apoyo me sigue dando
fuerza en esta labor académica y que, allá por donde mis derroteros profesionales me llevan, siempre está presente
ese inmenso e impagable agradecimiento a esa enorme ayuda que me prestáis. Gracias, una vez más, por vuestra
ayuda.
En Carchelejo (Jaén) y en Madrid, otoño de 2007.
El autor
xxviii Prefacio a la cuarta edición
1 Fundamentos de programación
PARTE I
Algoritmos y herramientas
de programación
CONTENIDO
Capítulo 1. Introducción a las computadoras y los lenguajes de programación
Capítulo 2. Metodología de la programación y desarrollo de software
Capítulo 3. Estructura general de un programa
Capítulo 4. Flujo de control I: Estructuras selectivas
Capítulo 5. Flujo de control II: Estructuras repetitivas
Capítulo 6. Subprogramas (subalgoritmos): Funciones
Fundamentos_de_programacion_Algoritmos_e.pdf
CAPÍTULO 1
Introducción a las computadoras
y los lenguajes de programación
1.1. ¿Qué es una computadora?
1.2. Organización física de una computadora
1.3. Representación de la información en las
computadoras
1.4. Codificación de la información
1.5. Dispositivos de almacenamiento secundario
(almacenamento masivo)
1.6. Conectores de dispositivos de E/S
1.7. Redes, Web y Web 2.0
1.8. El software (los programas)
1.9. Lenguajes de programación
1.10. Breve historia de los lenguajes de progra-
mación
RESUMEN
Las computadoras (ordenadores) electrónicas moder-
nas son uno de los productos más importantes del
siglo XXI ya que se han convertido en un dispositivo
esencial en la vida diaria de las personas, como un
electrodoméstico más del hogar o de la oficina y han
cambiado el modo de vivir y de hacer negocios. Cons-
tituyen una herramienta esencial en muchas áreas:
empresa, industria, gobierno, ciencia, educación..., en
realidad en casi todos los campos de nuestras vidas.
Son infinitas las aplicaciones que se pueden realizar
con ellas: consultar el saldo de una cuenta corriente,
retirar dinero de un banco, enviar o recibir mensajes
por teléfonos celulares (móviles) que a su vez están
conectados a potentes computadoras, escribir docu-
mentos, navegar por Internet, enviar y recibir correos
electrónicos (e-mail), etc.
El papel de los programas de computadoras es
fundamental; sin una lista de instrucciones a seguir,
la computadora es virtualmente inútil. Los lenguajes
de programación nos permiten escribir esos progra-
mas y por consiguiente comunicarnos con las compu-
tadoras. La principal razón para que las personas
aprendan lenguajes y técnicas de programación es
utilizar la computadora como una herramienta para
resolver problemas.
En el capítulo se introducen conceptos importantes
tales como la organización de una computadora, el
hardware, el software y sus componentes, y se intro-
ducen los lenguajes de programación más populares
C, C++, Java o C#.
INTRODUCCIÓN
4 Fundamentos de programación
1.1. ¿QUÉ ES UNA COMPUTADORA?
Las computadoras se construyen y se incluyen en todo tipo de dispositivos: automóviles (coches/carros), aviones,
trenes, relojes, televisiones... A su vez estas máquinas pueden enviar, recibir, almacenar, procesar y visualizar infor-
mación de todo tipo: números, texto, imágenes, gráficos, sonidos, etc. Estas potentes máquinas son dispositivos que
realizan cálculos a velocidades increíbles (millones de operaciones de las computadoras personales hasta cientos de
millones de operaciones de las supercomputadoras). La ejecución de una tarea determinada requiere una lista de ins-
trucciones o un programa. Los programas se escriben normalmente en un lenguaje de programación específico, tal
como C, para que pueda ser comprendido por la computadora.
Una computadora1
es un dispositivo electrónico, utilizado para procesar información y obtener resultados, capaz
de ejecutar cálculos y tomar decisiones a velocidades millones o cientos de millones más rápidas que puedan hacer-
lo los seres humanos. En el sentido más simple una computadora es “un dispositivo” para realizar cálculos o com-
putar. El término sistema de computadora o simplemente computadora se utiliza para enfatizar que, en realidad, son
dos partes distintas: hardware y software. El hardware es la computadora en sí misma. El software es el conjunto de
programas que indican a la computadora las tareas que debe realizar. Las computadoras procesan datos bajo el con-
trol de un conjunto de instrucciones denominadas programas de computadora. Estos programas controlan y dirigen
a la computadora para que realice un conjunto de acciones (instrucciones) especificadas por personas especializadas,
llamadas programadores de computadoras.
Los datos y la información se pueden introducir en la computadora por una entrada (input) y a continuación se
procesan para producir una salida (output, resultados), como se observa en la Figura 1.1. La computadora se puede
considerar como una unidad en la que se colocan ciertos datos (entrada de datos), se procesan y se produce un re-
sultado (datos de salida o información). Los datos de entrada y los datos de salida pueden ser, realmente, de cualquier
tipo: texto, dibujos, sonido, imágenes... El sistema más sencillo para comunicarse una persona con la computadora
es mediante un teclado, una pantalla (monitor) y un ratón (mouse). Hoy día existen otros dispositivos muy populares
tales como escáneres, micrófonos, altavoces, cámaras de vídeo, teléfonos inteligentes, agendas PDA, reproductores
de música MP3, iPod, etc.; de igual manera, a través de módems, es posible conectar su computadora con otras com-
putadoras a través de la red Internet.
Como se ha dicho antes, los componentes físicos que constituyen la computadora, junto con los dispositivos que
realizan las tareas de entrada y salida, se conocen con el término hardware o sistema físico. El programa se encuen-
tra almacenado en su memoria; a la persona que escribe programas se llama programador y al conjunto de programas
escritos para una computadora se llama software. Este libro se dedicará casi exclusivamente al software, pero se hará
una breve revisión del hardware como recordatorio o introducción según sean los conocimientos del lector en esta
materia.
Una computadora consta de varios dispositivos (tales como teclado, pantalla, “ratón” (mouse), discos duros, me-
morias, escáner, DVD, CD, memorias flash, unidades de proceso, impresoras, etc.) que son conocidos como hardware.
Los programas de computadora que se ejecutan o “corren” (run) sobre una máquina se conocen como software. El
coste del hardware se ha reducido drásticamente en los últimos años y sigue reduciéndose al menos en términos de
relación precio/prestaciones, ya que por el mismo precio es posible encontrar equipos de computadoras con unas
prestaciones casi el doble de las que se conseguían hace tan sólo dos o tres años por un coste similar2
. Afortunada-
mente, el precio del software estándar también se ha reducido drásticamente, pero por suerte cada día se requieren
más aplicaciones específicas y los programadores profesionales cada día tienen ante sí grandes retos y oportunidades,
de modo que los esfuerzos y costes que requieren los desarrollos modernos suelen tener compensaciones económicas
para sus autores.
1
En España está muy extendido el término ordenador para referirse a la traducción de la palabra inglesa computer. El DRAE (Diccionario
de la Real Academia Española, realizado por la Academia Española y todas las Academias de la Lengua de Latinoamérica, África y Asia) acepta,
indistintamente, los términos sinónimos: computador, computadora y ordenador. Entre las diferentes acepciones define la computadora electróni-
ca como: “máquina electrónica, analógica o digital, dotada de una memoria de gran capacidad y de métodos de tratamiento de la información
capaz de resolver problemas matemáticos y lógicos mediante la utilización automática de programas informáticos”. En el Diccionario panhispá-
nico de dudas (Madrid: RAE, 2005, p. 157), editado también por la Real Academia Española y la Asociación de Academias de la Lengua Espa-
ñola, se señala que el término computadora (del término inglés computer) se utiliza en la mayoría de los países de América, mientras que el
masculino computador es de uso mayoritario en Chile y Colombia; en España se usa preferentemente el término ordenador, tomado del francés
ordinateur. En este reciente diccionario la definición de computador es “Máquina electrónica capaz de realizar un tratamiento automático de la
información y de resolver con gran rapidez problemas matemáticos y lógicos mediante programas informáticos”.
2
A título meramente comparativo resaltar que el primer PC que tuvo el autor de esta obra, comprado en la segunda mitad de los ochenta,
costó unos 5-6.000$ y sólo contemplaba una unidad central de 512 KB, disco duro de 10 MB y una impresora matricial.
Introducción a las computadoras y los lenguajes de programación 5
1.1.1. Origen de las computadoras
La primera computadora digital que reseña la historia de la informática, se puede considerar, fue diseñada a finales
de la década de los treinta por el Dr. John Atanasoff y el estudiante de postgrado Clifford Berry3
en la Universidad
de Iowa (Iowa State University). Diseñaron la computadora para realizar cálculos matemáticos en física nuclear.
Sin embargo, la primera computadora electrónica digital de aplicaciones o propósito general se llamaba ENIAC
y se terminó en 1946 en la Universidad de Pennsylvania, fue financiada por el Ejército de EE.UU. (U.S. Army). La
ENIAC pesaba 30 toneladas y ocupaba un espacio de 30 por 50 pies. Se utilizaba esencialmente para predicciones
de tiempo, cálculos da tablas balísticas, cálculos de energía atómica. Sus diseñadores fueron J. Prespert Eckert y John
Mauchley.
En el mismo año de 1946, el Dr. John Von Neumann de Princeton University propuso el concepto de computa-
dora con programa almacenado que consistía en un programa cuyas instrucciones se almacenaban en la memoria de
la computadora.
Von Neumann descubrió que era posible que los programas se almacenaran en la memoria de la computadora y
que se podrían cambiar más fácilmente que las complejas conexiones de cables y fijaciones de interruptores del
ENIAC. Von Neumann diseñó una computadora basada en esta idea. Su diseño ha constituido el nacimiento de la
computación moderna y ha dado origen a la denominada arquitectura de Von Neumann que es la base de las com-
putadoras digitales actuales.
Estas computadoras primitivas utilizaban tubos de vacío como componentes electrónicos básicos. No sólo eran
muy voluminosas, sino lentas y difíciles de manipular a la par que requerían usos y cuidados especiales. Los avances
tecnológicos en semiconductores, transistores y circuitos integrados concluyeron en diseñar y fabricar las nuevas
generaciones de computadoras que conducían a máquinas más pequeñas, más rápidas y más económicas que sus
predecesoras.
En la década de los setenta, los fabricantes Altair (suele considerarse la primera microcomputadora de la historia)
y Apple fabrican la primera microcomputadora de la historia. Steve Jobs y Stephen Wozniac construyen el Apple, la
primera computadora doméstica de la historia. Por aquella época otras compañías que fabricaron microcomputadoras
fueron Commodore, Radio Shack, Heathkit y en Europa, Sinclair que fabricó el mítico ZX Spectrum con el que
aprendieron a programar y a jugar con videojuegos muchos de los grandes ingenieros, catedráticos, etc., de esta dé-
cada. Eran computadoras que en aquella época no eran aceptadas por la comunidad profesional, las empresas y las
industrias.
El 12 de agosto de 1981 IBM presentó en Nueva York y en otras ciudades norteamericanas, la primera computa-
dora de escritorio de la historia, denominada por su inventor, IBM PC (Personal Computer, computadora personal de
IBM), cuyo software fundamental fue desarrollado por una joven compañía conocida como Microsoft. El PC se con-
virtió en un éxito instantáneo hasta llegar a convertirse en un aparato o dispositivo electrónico4
de uso general, al
3
En su honor se conoce como computadora de Atanasoff-Berry.
4
Coomodity, el término por el que se conoce en inglés un dispositivo electrónico de consumo que se puede comprar en un gran almacén.
COMPUTADORA
Programa
Datos de
entrada
(entrada) Datos de
salida
(resultados)
Figura 1.1. Proceso de información en una computadora.
6 Fundamentos de programación
estilo de una TV o un equipo de música. Sin embargo, conviene recordar que el PC, tal como se le conoce en la ac-
tualidad, no fue la primera computadora personal ya que le precedieron otras máquinas con microprocesadores de
8 bits, muy populares en su tiempo, tales como Apple II, Pet CBM, Atari, TRS-80, etc., y el mítico ZX Spectrum,
de los diferentes fabricantes citados en el párrafo anterior.
El término PC se utiliza indistintamente con el término genérico de computadora de escritorio o computadora
portátil (desktop) o (laptop)5
.
1.1.2. Clasificación de las computadoras
Las computadoras modernas se pueden clasificar en computadoras personales, servidores, minicomputadoras, gran-
des computadoras (mainframes) y supercomputadoras.
Las computadoras personales (PC) son las más populares y abarcan desde computadoras portátiles (laptops o
notebooks, en inglés) hasta computadoras de escritorio (desktop) que se suelen utilizar como herramientas en los
puestos de trabajo, en oficinas, laboratorios de enseñanza e investigación, empresas, etc. Los servidores son compu-
tadoras personales profesionales y de gran potencia que se utilizan para gestionar y administrar las redes internas de
las empresas o departamentos y muy especialmente para administrar sitios Web de Internet. Las computadoras tipo
servidor son optimizadas específicamente para soportar una red de computadoras, facilitar a los usuarios la compar-
tición de archivos, de software o de periféricos como impresoras y otros recursos de red. Los servidores tienen me-
morias grandes, altas capacidades de memoria en disco e incluso unidades de almacenamiento masivo como unidades
de cinta magnética u ópticas, así como capacidades de comunicaciones de alta velocidad y potentes CPUS, normal-
mente específicas para sus cometidos.
Estaciones de trabajo (Workstation) son computadoras de escritorio muy potentes destinadas a los usuarios pero
con capacidades matemáticas y gráficas superiores a un PC y que pueden realizar tareas más complicadas que un PC
en la misma o menor cantidad de tiempo. Tienen capacidad para ejecutar programas técnicos y cálculos científicos,
y suelen utilizar UNIX o Windows NT como sistema operativo.
Las minicomputadoras, hoy día muchas veces confundidas con los servidores, son computadoras de rango me-
dio, que se utilizan en centros de investigación, departamentos científicos, fábricas, etc., y que poseen una gran ca-
pacidad de proceso numérico y tratamiento de gráficos, fundamentalmente, aunque también son muy utilizadas en el
mundo de la gestión, como es el caso de los conocidos AS/400 de IBM.
Las grandes computadoras (mainframes) son máquinas de gran potencia de proceso y extremadamente rápidas
y además disponen de una gran capacidad de almacenamiento masivo. Son las grandes computadoras de los bancos,
universidades, industrias, etc. Las supercomputadoras6
son las más potentes y sofisticadas que existen en la actua-
lidad; se utilizan para tareas que requieren cálculos complejos y extremadamente rápidos. Estas computadoras utilizan
numerosos procesadores en paralelo y tradicionalmente se han utilizado y utilizan para fines científicos y militares
en aplicaciones tales como meteorología, previsión de desastres naturales, balística, industria aeroespacial, satélites,
aviónica, biotecnología, nanotecnología, etc. Estas computadoras emplean numerosos procesadores en paralelo y se
están comenzando a utilizar en negocios para manipulación masiva de datos. Una supercomputadora, ya popular es
el Blue Gene de IBM o el Mare Nostrum de la Universidad Politécnica de Cataluña.
Además de esta clasificación de computadoras, existen actualmente otras microcomputadoras (handheld compu-
ters, computadoras de mano) que se incorporan en un gran número de dispositivos electrónicos y que constituyen el
corazón y brazos de los mismos, por su gran capacidad de proceso. Este es el caso de los PDA (Asistentes Persona-
les Digitales) que en muchos casos vienen con versiones específicas para estos dispositivos de los sistemas operativos
populares, como es el caso de Windows Mobile, y en otros casos utilizan sistemas operativos exclusivos como es el
caso de Symbiam y Palm OS. También es cada vez más frecuente que otros dispositivos de mano, tales como los
teléfonos inteligentes, cámaras de fotos, cámaras digitales, videocámaras, etc., incorporen tarjetas de memoria de
128 Mb hasta 4 GB, con tendencia a aumentar.
5
En muchos países de Latinoamérica, el término computadora portátil, es más conocido popularmente por su nombre en inglés, laptop.
6
En España existen varias supercomputadoras. A destacar, las existentes en el Centro de Supercomputación de Galicia, la de la Universidad
Politécnica de Valencia y la de la Universidad Politécnica de Madrid. En agosto de 2004 se puso en funcionamiento en Barcelona, en la sede de
la Universidad Politécnica de Cataluña, otra gran supercomputadora, en este caso de IBM que ha elegido España y, en particular Barcelona, como
sede de esta gran supercomputadora que a la fecha de la inauguración se prevé esté entre las cinco más potentes del mundo. Esta supercomputa-
dora denominada Mare Nostrum es una de las más potentes del mundo y está ubicada en el Centro de Supercomputación de Barcelona, dirigido
por el profesor Mateo Valero, catedrático de Arquitectura de Computadoras de la Universidad Politécnica de Cataluña.
Introducción a las computadoras y los lenguajes de programación 7
1.2. ORGANIZACIÓN FÍSICA DE UNA COMPUTADORA
Los dos componentes principales de una computadora son: hardware y software. Hardware es el equipo físico o los
dispositivos asociados con una computadora. Sin embargo, para ser útil una computadora necesita además del equipo
físico, un conjunto de instrucciones dadas. El conjunto de instrucciones que indican a la computadora aquello que
deben hacer se denomina software o programas y se escriben por programadores. Este libro se centra en la ense-
ñanza y aprendizaje de la programación o proceso de escribir programas.
Una red consta de un número de computadoras conectadas entre sí directamente o a través de otra computadora
central (llamada servidor), de modo que puedan compartir recursos tales como impresoras, unidades de almacena-
miento, etc., y que pueden compartir información. Una red puede contener un núcleo de PC, estaciones de trabajo y
una o más computadoras grandes, así como dispositivos compartidos como impresora.
La mayoría de las computadoras, grandes o pequeñas, están organizadas como se muestra en la Figura 1.2. Una
computadora consta fundamentalmente de cinco componentes principales: dispositivos de entrada; dispositivos de
salida; unidad central de proceso (UCP) o procesador (compuesto de la UAL, Unidad Aritmética y Lógica y la UC,
Unidad de Control); la memoria principal o central; memoria secundaria o externa y el programa.
Si a la organización física de la Figura 1.2 se le añaden los dispositivos para comunicación exterior con la com-
putadora, aparece la estructura típica de un sistema de computadora que, generalmente, consta de los siguientes dis-
positivos de hardware:
• Unidad Central de Proceso, UCP (CPU, Central Processing Unit).
• Memoria principal.
• Memoria secundaria (incluye medios de almacenamiento masivo como disquetes, memorias USB, discos duros,
discos CD-ROM, DVD...).
• Dispositivos de entrada tales como teclado y ratón.
• Dispositivos de salida tales como monitores o impresoras.
• Conexiones de redes de comunicaciones, tales como módems, conexión Ethernet, conexiones USB, conexiones
serie y paralelo, conexión Firewire, etc.
Dispositivos
de entrada
Unidad
de control
Memoria
central
Unidad
aritmética
y lógica
Dispositivos
de salida
Memoria externa
(almacenamiento
permanente)
UCP (Procesador)
Figura 1.2. Organización física de una computadora.
Las computadoras sólo entienden un lenguaje compuesto únicamente por ceros y unos. Esta forma de comunica-
ción se denomina sistema binario digital y en el caso concreto de las máquinas computadoras, código o lenguaje
máquina. Este lenguaje máquina utiliza secuencias o patrones de ceros y unos para componer las instrucciones que
posteriormente reciben de los diferentes dispositivos de la computadora, tales como el microprocesador, las unidades
de discos duros, los teclados, etc.
La Figura 1.2 muestra la integración de los componentes que conforman una computadora cuando se ejecuta un
programa; las flechas conectan los componentes y muestran la dirección del flujo de información.
8 Fundamentos de programación
El programa se debe transferir primero de la memoria secundaria a la memoria principal antes de que pueda
ser ejecutado. Los datos se deben proporcionar por alguna fuente. La persona que utiliza un programa (usuario de
programa) puede proporcionar datos a través de un dispositivo de entrada. Los datos pueden proceder de un archi-
vo (fichero), o pueden proceder de una máquina remota vía una conexión de red de la empresa o bien la red In-
ternet.
Los datos se almacenan en la memoria principal de una computadora a la cual se puede acceder y manipu-
lar mediante la unidad central de proceso (UCP). Los resultados de esta manipulación se almacenan de nuevo en
la memoria principal. Por último, los resultados (la información) de la memoria principal se pueden visualizar en un
dispositivo de salida, guardar en un almacenamiento secundario o enviarse a otra computadora conectada con ella
en red.
Unidad de control
Unidad lógica
y aritmética
Memoria central
Datos
de entrada
Datos
de salida
Programa
Unidad central de proceso
Figura 1.3. Unidad Central de Proceso.
Uno de los componentes fundamentales de un PC es la placa base (en inglés, motherboard o mainboard) que es
una gran placa de circuito impreso que conecta entre sí los diferentes elementos contenidos en ella y sobre la que se
conectan los elementos más importantes del PC: zócalo del microprocesador, zócalos de memoria, diferentes conec-
tores, ranuras de expansión, puertos, etc.
Los paquetes de datos (de 8, 16, 32, 64 o más bits a la vez) se mueven continuamente entre la CPU y todos los demás
componentes (memoria RAM, disco duro, etc.). Estas transferencias se realizan a través de buses. Los buses son los cana-
les de datos que interconectan los componentes del PC; algunos están diseñados para transferencias pequeñas y otros para
transferencias mayores. Existen diferentes buses siendo el más importante el bus frontal (FSB, Front Side Bus) en los sis-
temas actuales o bus del sistema (en sistemas más antiguos) y que conectan la CPU o procesador con la memoria RAM.
Otros buses importantes son los que conectan la placa base de la computadora con los dispositivos periféricos del PC y se
denominan buses de E/S.
1.2.1. Dispositivos de Entrada/Salida (E/S): periféricos
Los dispositivos de Entrada/Salida (E/S) [Input/Output (I/O) en inglés] permiten la comunicación entre la computa-
dora y el usuario. Los dispositivos de entrada, como su nombre indica, sirven para introducir datos (información) en
la computadora para su proceso. Los datos se leen de los dispositivos de entrada y se almacenan en la memoria cen-
tral o interna. Los dispositivos de entrada convierten la información de entrada en señales eléctricas que se almacenan
en la memoria central. Dispositivos de entrada típicos son los teclados; otros son: lectores de tarjetas —ya en des-
uso—, lápices ópticos, palancas de mando (joystick), lectores de códigos de barras, escáneres, micrófonos, etc.
Introducción a las computadoras y los lenguajes de programación 9
Hoy día tal vez el dispositivo de entrada más popular es el ratón (mouse) que mueve un puntero electrónico sobre
la pantalla que facilita la interacción usuario-máquina7
.
Los dispositivos de salida permiten representar los resultados (salida) del proceso de los datos. El dispositivo de
salida típico es la pantalla (CRT)8
o monitor. Otros dispositivos de salida son: impresoras (imprimen resultados en
papel), trazadores gráficos (plotters), reconocedores de voz, altavoces, etc.
El teclado y la pantalla constituyen —en muchas ocasiones— un único dispositivo, denominado terminal. Un
teclado de terminal es similar al teclado de una máquina de escribir moderna con la diferencia de algunas teclas ex-
tras que tiene el terminal para funciones especiales. Si está utilizando una computadora personal, el teclado y el
monitor son dispositivos independientes conectados a la computadora por cables. En ocasiones, la impresora se co-
noce como dispositivo de copia dura (hard copy), debido a que la escritura en la impresora es una copia permanen-
te (dura) de la salida, y en contraste a la pantalla se la denomina dispositivo de copia blanda (soft copy), ya que la
pantalla actual se pierde cuando se visualiza la siguiente.
Los dispositivos de entrada/salida y los dispositivos de almacenamiento secundario o auxiliar (memoria externa)
se conocen también con el nombre de dispositivos periféricos o simplemente periféricos ya que, normalmente, son
externos a la computadora. Estos dispositivos son unidades de discos [disquetes (ya en desuso), CD-ROM, DVD,
cintas, etc.], videocámaras, teléfonos celulares (móviles), etc. Todos los dispositivos periféricos se conectan a las
computadoras a través de conectores y puertos (ports) que son interfaces electrónicos.
1.2.2. La memoria principal
La memoria de una computadora almacena los datos de entrada, programas que se han de ejecutar y resultados. En
la mayoría de las computadoras existen dos tipos de memoria principal: memoria de acceso aleatorio RAM que
soporta almacenamiento temporal de programas y datos y memoria de sólo lectura ROM que almacena datos o
programas de modo permanente.
La memoria central (RAM, Random, Access Memory) o simplemente memoria se utiliza para almacenar, de
modo temporal información, datos y programas. En general, la información almacenada en memoria puede ser de
dos tipos: las instrucciones de un programa y los datos con los que operan las instrucciones. Para que un programa
se pueda ejecutar (correr, rodar, funcionar..., en inglés run), debe ser situado en la memoria central, en una operación
denominada carga (load) del programa. Después, cuando se ejecuta (se realiza, funciona) el programa, cualquier dato
a procesar por el programa se debe llevar a la memoria mediante las instrucciones del programa. En la memoria
central, hay también datos diversos y espacio de almacenamiento temporal que necesita el programa cuando se eje-
cuta y así poder funcionar9
.
La memoria principal es la encargada de almacenar los programas y datos que se están ejecutando y su principal
característica es que el acceso a los datos o instrucciones desde esta memoria es muy rápido.
Es un tipo de memoria volátil (su contenido se pierde cuando se apaga la computadora); esta memoria es, en rea-
lidad, la que se suele conocer como memoria principal o de trabajo; en esta memoria se pueden escribir datos y leer
de ella. Esta memoria RAM puede ser estática (SRAM) o dinámica (DRAM) según sea el proceso de fabricación.
Las memorias RAM actuales más utilizadas son las SDRAM en sus dos tipos: DDR (Double Data Rate) y DDR2.
En la memoria principal se almacenan:
• Los datos enviados para procesarse desde los dispositivos de entrada.
• Los programas que realizarán los procesos.
• Los resultados obtenidos preparados para enviarse a un dispositivo de salida.
La memoria ROM, es una memoria que almacena información de modo permanente en la que no se puede es-
cribir (viene pregrabada “grabada” por el fabricante) ya que es una memoria de sólo lectura. Los programas alma-
7
Todas las acciones a realizar por el usuario se realizarán con el ratón con la excepción de las que requieren de la escritura de datos por
teclado. El nombre de ratón parece que proviene de la similitud del cable de conexión con la cola de un ratón. Hoy día, sin embargo, este razo-
namiento carece de sentido ya que existen ratones inalámbricos que no usan cable y se comunican entre sí a través de rayos infrarrojos.
8
Cathode Ray Tube: Tubo de rayos catódicos.
9
En la jerga informática también se conoce esta operación como “correr un programa”.
10 Fundamentos de programación
cenados en ROM no se pierden al apagar la computadora y cuando se enciende, se lee la información almacenada en
esta memoria. Al ser esta memoria de sólo lectura, los programas almacenados en los chips ROM no se pueden mo-
dificar y suelen utilizarse para almacenar los programas básicos que sirven para arrancar la computadora.
Con el objetivo de que el procesador pueda obtener los datos de la memoria central más rápidamente, la mayoría
de los procesadores actuales (muy rápidos) utilizan con frecuencia una memoria denominada caché que sirva para
almacenamiento intermedio de datos entre el procesador y la memoria principal. La memoria caché —en la actuali-
dad— se incorpora casi siempre al procesador.
Los programas y los datos se almacenan en RAM. Las memorias de una computadora personal se miden en uni-
dades de memoria (se describen en el apartado 1.2.3) y suelen ser actualmente de 512 MB a 1, 2 o 3 GB, aunque ya
es frecuente encontrar memorias centrales de 4 y 8 GB en computadoras personales y en cantidad mayor en compu-
tadoras profesionales y en servidores.
Normalmente una computadora contiene mucha más memoria RAM que memoria ROM interna; también la can-
tidad de memoria se puede aumentar hasta un máximo especificado, mientras que la cantidad de memoria ROM,
normalmente es fija. Cuando en la jerga informática y en este texto se menciona la palabra memoria se suele referir
a memoria RAM que normalmente es la memoria accesible al programador.
La memoria RAM es una memoria muy rápida y limitada en tamaño, sin embargo la computadora tiene otro tipo
de memoria denominada memoria secundaria o almacenamiento secundario que puede crecer comparativamente en
términos mucho mayores. La memoria secundaria es realmente un dispositivo de almacenamiento masivo de infor-
mación y por ello, a veces, se la conoce como memoria auxiliar, almacenamiento auxiliar, almacenamiento externo
y memoria externa.
1.2.3. Unidades de medida de memoria
La memoria principal es uno de los componentes más importantes de una computadora y sirve para almacena-
miento de información (datos y programas). Existen dos tipos de memoria y de almacenamiento: Almacenamiento
principal (memoria principal o memoria central) y almacenamiento secundario o almacenamiento masivo (discos,
cintas, etc.).
La memoria central de una computadora es una zona de almacenamiento organizada en centenares o millares de
unidades de almacenamiento individual o celdas. La memoria central consta de un conjunto de celdas de memoria
(estas celdas o posiciones de memoria se denominan también palabras, aunque no “guardan” analogía con las pa-
labras del lenguaje). Cada palabra puede ser un grupo de 8 bits, 16 bits, 32 bits o incluso 64 bits, en las computado-
ras más modernas y potentes. Si la palabra es de 8 bits se conoce como byte. El término bit (dígito binario)10
se
deriva de las palabras inglesas “binary digit” y es la unidad de información más pequeña que puede tratar una com-
putadora. El término byte es muy utilizado en la jerga informática y, normalmente, las palabras de 16 bits se suelen
conocer como palabras de 2 bytes, y las palabras de 32 bits como palabras de 4 bytes.
{
bit
10010011
byte
Figura 1.4. Relación entre un bit y un byte.
La memoria central de una computadora puede tener desde unos centenares de millares de bytes hasta millones de
bytes. Como el byte es una unidad elemental de almacenamiento, se utilizan múltiplos para definir el tamaño de la
memoria central: Kilobyte (KB) igual a 1.024 bytes11
(210
), Megabyte (MB) igual a 1.024 × 1.024 bytes (220
= 1.048.576),
10
Binario se refiere a un sistema de numeración basado en los dos números o dígitos, 0 y 1; por consiguiente, un bit es o bien un 0 o bien
un 1.
11
Se adoptó el término Kilo en computadoras debido a que 1.024 es muy próximo a 1.000, y por eso en términos familiares y para que los
cálculos se puedan hacer fáciles mentalmente se asocia 1 KB a 1.000 bytes y 1 MB a 1.000.000 de bytes y 1 GB a 1.000.000.000 de bytes. Así,
cuando se habla en jerga diaria de 5 KB estamos hablando, en rigor, de 5 × 1.024 = 5.120 bytes, pero en cálculos consideramos 5.000 bytes. De
Introducción a las computadoras y los lenguajes de programación 11
Gigabyte (GB) igual a 1.024 MB (230
= 1.073.741.824). Las abreviaturas MB y GB se han vuelto muy populares
como unidades de medida de la potencia de una computadora.
Desgraciadamente la aplicación de estos prefijos representa un mal uso de la terminología de medidas, ya que en
otros campos las referencias a las unidades son potencias de 10. Por ejemplo, las medidas en distancias, Kilómetro
(Km) se refiere a 1.000 metros, las medidas de frecuencias, Megahercio (MHz) se refieren a 1.000.000 de hercios.
En la jerga informática popular para igualar terminología, se suele hablar de 1 KB como 1.000 bytes y 1 MB como
1.000.000 de bytes y un 1 GB como 1.000 millones de bytes, sobre todo para correspondencia y fáciles cálculos
mentales, aunque como se observa en la Tabla 1.1 estos valores son sólo aproximaciones prácticas.
Tabla 1.1. Unidades de medida de almacenamiento
Byte Byte (B) equivale a 8 bits
Kilobyte Kbyte (KB) equivale a 1.024 bytes (103
)
Megabyte Mbyte (MB) equivale a 1.024 Kbytes (106
)
Gigabyte Gbyte (GB) equivale a 1.024 Mbytes (109
)
Terabyte Tbyte (TB) equivale a 1.024 Gbytes (1012
)
Petabyte Pbyte (PB) equivale a 1.024 Tbytes (1015
)
Exabyte Ebyte (EB) equivale a 1.024 Pbytes (1018
)
Zettabyte Zbyte (ZB) equivale a 1.024 Ebytes (1021
)
Yotta Ybyte (YB) equivale a 1.024 Zbytes (1024
)
1 Tb = 1.024 Gb; 1 GB = 1.024 Mb = 1.048.576 Kb = 1.073.741.824 b
Celda de memoria
• La memoria de una computadora es una secuencia ordenada de celdas de memoria.
• Cada celda de memoria tiene una única dirección que indica su posición relativa en la memoria.
• Los datos se almacenan en una celda de memoria y constituyen el contenido de dicha celda.
Byte
Un byte es una posición de memoria que puede contener ocho bits. Cada bit sólo puede contener dos valores
posibles, 0 o 1. Se requieren ocho bits (un byte) para codificar un carácter (una letra u otro símbolo del teclado).
Bytes, direcciones, memoria
La memoria principal se divide en posiciones numeradas que se denominan bytes. A cada byte se asocia un
número denominado dirección. Un número o una letra se representan por un grupo de bytes consecutivos en
una posición determinada. La dirección del primer byte del grupo se utiliza como la dirección más grande de esta
posición de memoria.
Espacio de direccionamiento
Para tener acceso a una palabra en la memoria se necesita un identificador que a nivel de hardware se le conoce como
dirección. Existen dos conceptos importantes asociados a cada celda o posición de memoria: su dirección y su con-
tenido. Cada celda o byte tiene asociada una única dirección que indica su posición relativa en memoria y mediante
este modo se guarda correspondencia con las restantes representaciones de las palabras Kilo, Mega, Giga... Usted debe considerar siempre los
valores reales para 1 KB, 1 MB o 1 GB, mientras esté en su fase de formación y posteriormente en el campo profesional desde el punto de vista
de programación, para evitar errores técnicos en el diseño de sus programas, y sólo recurrir a las cifras mil, millón, etc., para la jerga diaria.
12 Fundamentos de programación
la cual se puede acceder a la posición para almacenar o recuperar información. La información almacenada en una
posición de memoria es su contenido. La Figura 1.5 muestra una memoria de computadora que consta de 1.000 po-
siciones en memoria con direcciones de 0 a 999 en código decimal. El contenido de estas direcciones o posiciones
de memoria se llaman palabras, que como ya se ha comentado pueden ser de 8, 16, 32 y 64 bits. Por consiguiente,
si trabaja con una máquina de 32 bits, significa que en cada posición de memoria de su computadora puede alojar
32 bits, es decir 32 dígitos, bien ceros o unos.
.
.
.
325
999
998
997
3
2
1
0
Direcciones
Contenido de la
dirección 997
Figura 1.5. Memoria central de una computadora.
Las direcciones de memoria se definen usando enteros binarios sin signo o sus correspondientes enteros deci-
males.
El número de posiciones únicas identificables en memoria se denomina espacio de direccionamiento. Por ejem-
plo, en una memoria de 64 kilobytes (KB) y un tamaño de palabra de un byte tienen un espacio de direccionamiento
que varía de 0 a 65.535 (64 KB, 64 × 1.024 = 65.536).
Los bytes sirven para representar los caracteres (letras, números y signos de puntuación adicionales) en un códi-
go estándar internacional denominado ASCII (American Standard Code for Information Interchange), utilizado por
todas las computadoras del mundo, o bien en un código estándar más moderno denominado Unicode. Todos estos
símbolos se almacenan en memoria y con ellos trabajan las computadoras.
1.2.4. El procesador
El procesador o Unidad Central de Proceso, UCP (CPU, Central Processing Unit) controla el funcionamiento de
la computadora y realiza sus funciones de procesamiento de los datos, constituyendo el cerebro y corazón de la com-
putadora o también su sistema nervioso. Se encarga de un modo práctico de realizar numerosos cálculos y operacio-
nes ordenadas por los diferentes programas instalados en la computadora.
Cada computadora tiene al menos una UCP para interpretar y ejecutar las instrucciones de cada programa, reali-
zar las manipulaciones de datos aritméticos y lógicos, y comunicarse con todas las restantes partes de la máquina
indirectamente a través de la memoria.
Un moderno procesador o microprocesador, es una colección compleja de dispositivos electrónicos. En una com-
putadora de escritorio o en una portátil (laptop o notebook) la UCP se aloja junto con otros chips y componentes
electrónicos en la placa base también denominada placa madre (motherboard). La elección de la placa base propor-
cionará una mayor o menor potencia a la computadora y está compuesta por numerosos componentes electrónicos y
se ramifica hacia todos los periféricos externos a través de conectores (puertos) colocados en la mayoría de las veces
en la parte posterior del equipo, principalmente en los equipos de sobremesa y torre, mientras que en los equipos
portátiles o portables, están colocados no sólo en la parte posterior sino también en las partes laterales o incluso de-
lantera.
Existen numerosos fabricantes de procesadores aunque, entre otros, los más acreditados son Intel, AMD, Trans-
meta (empresa conocida por estar vinculada en sus orígenes con Linus Torvald creador del sistema operativo Linux),
IBM, Motorola y Sun Microsystems. En cuanto a familias en concreto, los más populares son: Pentium de Intel (que
Introducción a las computadoras y los lenguajes de programación 13
incluye Celeron y Xeon), Opteron de AMD, SPARC de Sun Microsystemas, Crusoe de Transmeta, Centrino Core 2
y Centro Core 2 Duo de Intel que se instalan en portátiles, etc.
Todas las UCP tienen una velocidad de trabajo, regulada por un pequeño cristal de cuarzo, y que se conoce como
frecuencia de reloj. El cristal vibra a un elevado número de ciclos de reloj. Con cada ciclo de reloj se envía un impul-
so a la UCP, y en principio, cada pulsación puede hacer realizar una o más tareas a la UCP. El número de ciclos de
reloj por segundo se mide en hertzios. El cristal de la UCP vibra millones de veces por segundo y por esta razón la
velocidad del reloj se calcula en millones de oscilaciones (megahercios o MHz) o miles de millones de ciclos por se-
gundo, gigahercios (GHz). En consecuencia la velocidad de los microprocesadores se mide en MHz o en GHz. De esta
forma si el procesador de su equipo funciona a 3 GHz significa que realiza 3 millones de operaciones por segundo.
Generaciones de microprocesadores
El PC original de 1981 trabajaba a 4,77 MHz y su microprocesador era el Intel 8088. Trabajaba a 16 bits interna-
mente, aunque el bus externo para comunicarse con el resto de componentes era tan sólo de 8 bits. El microprocesa-
dor Intel 8088 fue lanzado al mercado en junio de 1979, aunque con anterioridad (junio de 1978) Intel lanzó el 8086.
Estos microprocesadores con sus diferentes modelos, constituyeron la primera generación o familia de microproce-
sadores. En total, Intel ha lanzado numerosas generaciones o familias de procesadores que han permanecido en el
mercado durante varios años durante los cuales se ha ido incrementando la frecuencia de reloj.
En 1993 Intel presentó el Pentium II, Motorola el 68060 y AMD el K5. Desde entonces Intel y AMD, fundamen-
talmente, han continuado presentando numerosas generaciones o familias de procesadores que permanecen en el
mercado durante varios años incrementando la frecuencia de reloj con cada nuevo modelo además de otras caracte-
rísticas importantes. En el año 2000 Intel presentó el Pentium IV y AMD el Athlon XP y Duron, desencadenantes de
los potentes procesadores existentes hoy día y que han servido de soporte a la mayoría de las computadoras perso-
nales de la primera década de los 2000. En 2004, Intel presentó los Pentium M, D y Core Duo, mientras que AMD
presentó en 2005, el AMD Athlon.
En enero de 2006, Intel lanzó el procesador Core Duo, optimizado para aplicaciones de procesos múltiples y
multitarea. Puede ejecutar varias aplicaciones complejas simultáneamente, como juegos con gráficos potentes o pro-
gramas que requieran muchos cálculos y al mismo tiempo puede descargar música o analizar su PC con un antivirus
en segundo plano. A finales del mismo año, Intel presentó el Core 2 Duo que dobla la potencia de cálculo y reduce
considerablemente el consumo de energía. Intel sigue fabricando para sus equipos de sobremesa y portátiles, proce-
sadores Pentium (Pentium D y Pentium 4) y procesadores Celeron
En 2007 han aparecido los procesadores de más de un núcleo, tales como Intel Core 2 Quad, AMD Quad Core
y AMD Quad FX, todos ellos de cuatro núcleos y en 2008 se espera el lanzamiento de procesadores Intel y AMD
con más de ocho núcleos. De igual modo Intel también fabrica Pentium de dos y cuatro núcleos. (Pentium Dual Core,
Pentium Cuad Core) y Athlon 64 y con tendencia a aumentar el número de núcleos.
Proceso de ejecución de un programa
El ratón y el teclado introducen datos en la memoria central cuando se ejecuta el programa. Los datos intermedios o
auxiliares se transfieren desde la unidad de disco a la pantalla y a la unidad de disco, a medida que se ejecuta el
programa.
Cuando un programa se ejecuta, se debe situar primero en memoria central de igual modo que los datos. Sin
embargo, la información almacenada en la memoria se pierde (borra) cuando se apaga (desconecta de la red eléctri-
ca) la computadora, y por otra parte le memoria central es limitada en capacidad. Por esta razón, para poder disponer
de almacenamiento permanente, tanto para programas como para datos, se necesitan dispositivos de almacenamien-
to secundario, auxiliar o masivo (mass storage, o secondary storage).
En el campo de las computadoras es frecuente utilizar la palabra memoria y almacenamiento o memoria exter-
na, indistintamente. En este libro —y recomendamos su uso— se utilizará el término memoria sólo para referirse a
la memoria central.
Comparación de la memoria central y la memoria auxiliar
La memoria central o principal es mucho más rápida y cara que la memoria auxiliar. Se deben transferir los datos
desde la memoria auxiliar hasta la memoria central, antes de que puedan ser procesados. Los datos en memoria
central son: volátiles y desaparecen cuando se apaga la computadora. Los datos en memoria auxiliar son per-
manentes y no desaparecen cuando se apaga la computadora.
14 Fundamentos de programación
1.2.5. Propuestas para selección de la computadora ideal para aprender
programación o para actividades profesionales
Las computadoras personales que en el primer trimestre de 2008 se comercializan para uso doméstico y en oficinas
o en las empresas suelen tener características comunes, y es normal que sus prestaciones sean similares a las utiliza-
das en los laboratorios de programación de Universidades, Institutos Tecnológicos y Centros de Formación Profesio-
nal. Por estas razones en la Tabla 1.2 se incluyen recomendaciones de características técnicas medias que son, nor-
malmente, utilizadas, para prácticas de aprendizaje de programación, por el alumno o por el lector autodidacta, así
como por profesionales en su actividad diaria.
Tabla 1.2. Características técnicas recomendadas para computadoras de escritorio (profesionales y uso doméstico)
Procesador
(Computadora de sobremesa-
computadora portátil o laptop)
Intel
www.intel.com/cd/products/services/emea/spa/processors/322163.htm*
Procesadores para equipos de sobremesa
• Intel Core 2 Extreme
• Intel Core 2 Quad
• Intel Core 2 Duo
• Intel Celeron, Celeron D y Celeron
de doble núcleo
• Pentium Extreme
• Pentium D Edition
• Pentium 4
Procesadores para portátiles (laptop)
• Intel Centrino Duo con procesador Intel Core Duo
• Intel Pentium e Intel Celeron
AMD
www.amd.com/es-es/Processors/ProductInformation/0,,30_118,00.html*
Procesadores para equipos de sobremesa
• AMD Phenom Quad Core
• AMD Athlon
• AMD Sempron
Procesadores para portátiles (laptop)
• Tecnología Mobile AMD Turion 64 × 2
Dual Core
• Mobile Athlon 64 × 2
• Mobile AMD Sempron
Memoria RAM 512 MB, 1 GB a 4 GB DDR2
Disco duro SATA 80 GB, 160 G, 250 GB, 320 GB y superiores
Tarjeta gráfica Memoria dedicada o compartida, 256-1.024 Mb
Nvidia GeForce
ATI Mobility Radeom
Intel
Grabadora DVD +/– RW de doble capa
Blue-Ray
HD-DVD (desde febrero de 2008, se ha dejado de comercializar por Toshiba)
Pantalla 7", 11,1", 11,9", 12,1", 13", 13,3", 14", 15", 15,4", 17", 19", 20"
Sistema operativo Windows XP, Mac OS
Windows Vista Home, Premiun, Business, Ultimate
Mac OS
Linux
Redes y conectividad Wifi
Bluetooth v2.0
LAN
USB 2.0
Protocolos a, b, g, n
Ethernet 10/100, 10/100/1000
Varios puertos (2 o más)
Otras características WebCam de 1,3-2 Mpixel
Sintonizadora TV
GPS integrado
Lector multitarjetas
Firewire
3G (UMTS), 3,5 G (HSDPA), 3,75 G (HSUPA), HSPA (ya existen en el mercado computadoras
con banda ancha móvil —HSPA— integrada, p.e. modelo DELL Vostro 1500)
* En estas direcciones Web, el lector encontrará todas las especificaciones y características técnicas más sobresalientes de los procesadores de los
fabricantes Intel y AMD.
Introducción a las computadoras y los lenguajes de programación 15
1.3. REPRESENTACIÓN DE LA INFORMACIÓN EN LAS COMPUTADORAS
Una computadora es un sistema para procesar información de modo automático. Un tema vital en el proceso de fun-
cionamiento de una computadora es estudiar la forma de representación de la información en dicha computadora. Es
necesario considerar cómo se puede codificar la información en patrones de bits que sean fácilmente almacenables
y procesables por los elementos internos de la computadora.
Las formas de información más significativas son: textos, sonidos, imágenes y valores numéricos y, cada una de
ellas presentan peculiaridades distintas. Otros temas importantes en el campo de la programación se refieren a los
métodos de detección de errores que se puedan producir en la transmisión o almacenamiento de la información y a
las técnicas y mecanismos de comprensión de información al objeto de que ésta ocupe el menor espacio en los dis-
positivos de almacenamiento y sea más rápida su transmisión.
1.3.1. Representación de textos
La información en formato de texto se representa mediante un código en el que cada uno de los distintos símbolos
del texto (tales como letras del alfabeto o signos de puntuación) se asignan a un único patrón de bits. El texto se
representa como una cadena larga de bits en la cual los sucesivos patrones representan los sucesivos símbolos del
texto original.
En resumen, se puede representar cualquier información escrita (texto) mediante caracteres. Los caracteres que
se utilizan en computación suelen agruparse en cinco categorías:
1. Caracteres alfabéticos (letras mayúsculas y minúsculas, en una primera versión del abecedario inglés).
A, B, C, D, E, ... X, Y, Z, a, b, c, ... , X, Y, Z
2. Caracteres numéricos (dígitos del sistema de numeración).
0, 1, 2, 3, 4, 5, 6, 7, 8, 9 sistema decimal
3. Caracteres especiales (símbolos ortográficos y matemáticos no incluidos en los grupos anteriores).
{ } Ñ ñ ! ? & > # ç ...
4. Caracteres geométricos y gráficos (símbolos o módulos con los cuales se pueden representar cuadros, figu-
ras geométricas, iconos, etc.
|
—
| ||—
—
♠ ∼ ...
5. Caracteres de control (representan órdenes de control como el carácter para pasar a la siguiente línea [NL]
o para ir al comienzo de una línea [RC, retorno de carro, “carriage return, CR”] emitir un pitido en el ter-
minal [BEL], etc.).
Al introducir un texto en una computadora, a través de un periférico, los caracteres se codifican según un código
de entrada/salida de modo que a cada carácter se le asocia una determinada combinación de n bits.
Los códigos más utilizados en la actualidad son: EBCDIC, ASCII y Unicode.
• Código EBCDIC (Extended Binary Coded Decimal Inter Change Code).
Este código utiliza n = 8 bits de forma que se puede codificar hasta m = 28
= 256 símbolos diferentes. Éste
fue el primer código utilizado para computadoras, aceptado en principio por IBM.
• Código ASCII (American Standard Code for Information Interchange).
El código ASCII básico utiliza 7 bits y permite representar 128 caracteres (letras mayúsculas y minúsculas
del alfabeto inglés, símbolos de puntuación, dígitos 0 a 9 y ciertos controles de información tales como retorno
de carro, salto de línea, tabulaciones, etc.). Este código es el más utilizado en computadoras, aunque el ASCII
ampliado con 8 bits permite llegar a 28
(256) caracteres distintos, entre ellos ya símbolos y caracteres especia-
les de otros idiomas como el español.
16 Fundamentos de programación
• Código Unicode
Aunque ASCII ha sido y es dominante en la representación de los caracteres, hoy día se requiere de la
necesidad de representación de la información en muchas otras lenguas, como el portugués, español, chino, el
japonés, el árabe, etc. Este código utiliza un patrón único de 16 bits para representar cada símbolo, que permi-
te 216
bits o sea hasta 65.536 patrones de bits (símbolos) diferentes.
Desde el punto de vista de unidad de almacenamiento de caracteres, se utiliza el archivo (fichero). Un archivo
consta de una secuencia de símbolos de una determinada longitud codificados utilizando ASCII o Unicode y que se
denomina archivo de texto. Es importante diferenciar entre archivos de texto simples que son manipulados por los
programas de utilidad denominados editores de texto y los archivos de texto más elaborados que se producen por
los procesadores de texto, tipo Microsoft Word. Ambos constan de caracteres de texto, pero mientras el obtenido con
el editor de texto, es un archivo de texto puro que codifica carácter a carácter, el archivo de texto producido por un
procesador de textos contiene números, códigos que representan cambios de formato, de tipos de fuentes de letra y
otros, e incluso pueden utilizar códigos propietarios distintos de ASCII o Unicode.
1.3.2. Representación de valores númericos
El almacenamiento de información como caracteres codificados es ineficiente cuando la información se registra como
numérica pura. Veamos esta situación con la codificación del número 65; si se almacena como caracteres ASCII uti-
lizando un byte por símbolo, se necesita un total de 16 bits, de modo que el número mayor que se podía almacenar
en 16 bits (dos bytes) sería 99. Sin embargo, si utilizamos notación binaria para almacenar enteros, el rango puede
ir de 0 a 65.535 (216
– 1) para números de 16 bits. Por consiguiente, la notación binaria (o variantes de ellas) es la
más utilizada para el almacenamiento de datos numéricos codificados.
La solución que se adopta para la representación de datos numéricos es la siguiente: al introducir un número en
la computadora se codifica y se almacena como un texto o cadena de caracteres, pero dentro del programa a cada
dato se le envía un tipo de dato específico y es tarea del programador asociar cada dato al tipo adecuado correspon-
diente a las tareas y operaciones que se vayan a realizar con dicho dato.
El método práctico realizado por la computadora es que una vez definidos los datos numéricos de un programa,
una rutina (función interna) de la biblioteca del compilador (traductor) del lenguaje de programación se encarga de
transformar la cadena de caracteres que representa el número en su notación binaria.
Existen dos formas de representar los datos numéricos: números enteros o números reales.
Representación de enteros
Los datos de tipo entero se representan en el interior de la computadora en notación binaria. La memoria ocupada
por los tipos enteros depende del sistema, pero normalmente son dos, bytes (en las versiones de MS-DOS y versiones
antiguas de Windows y cuatro bytes en los sistemas de 32 bits como Windows o Linux). Por ejemplo, un entero al-
macenado en 2 bytes (16 bits):
1000 1110 0101 1011
Los enteros se pueden representar con signo (signed, en C++) o sin signo (unsigned, en C++); es decir, nú-
meros positivos o negativos. Normalmente, se utiliza un bit para el signo. Los enteros sin signo al no tener signo
pueden contener valores positivos más grandes. Normalmente, si un entero no se especifica “con/sin signo” se suele
asignar con signo por defecto u omisión.
El rango de posibles valores de enteros depende del tamaño en bytes ocupado por los números y si se representan
con signo o sin signo (la Tabla 1.3 resume características de tipos estándar en C++).
Representación de reales
Los números reales son aquellos que contienen una parte decimal como 2,6 y 3,14152. Los reales se representan
en notación científica o en coma flotante; por esta razón en los lenguajes de programación, como C++, se conocen
como números en coma flotante.
Existen dos formas de representar los números reales. La primera se utiliza con la notación del punto decimal
(ojo en el formato de representación español de números decimales, la parte decimal se representa por coma).
Introducción a las computadoras y los lenguajes de programación 17
EJEMPLOS
12.35 99901.32 0.00025 9.0
La segunda forma para representar números en coma flotante en la notación científica o exponencial, conocida
también como notación E. Esta notación es muy útil para representar números muy grandes o muy pequeños.
Opcional (signo +/–)
Se puede utilizar el E
Signo +/o u omitido
+6.45 E+15
Punto decimal opcional
Ningún espacio
{
Notación exponencial
Exponente
Mantisa
Base de numeración (10, 2...)
N = M · BE
EJEMPLOS
2.52 e + 8 equivale a 252000000
8.34 E – 4 equivale a 8.34/104
= 0.000834
7E5 equivale a 7000000
–18.35e15 equivale a -18500000000000000
5.95E25 equivale a 595000000000000000000000
9.11e – 31 equivale a 0.000000000000000000000000000000911
Representación de caracteres
Un documento de texto se escribe utilizando un conjunto de caracteres adecuado al tipo de documento. En los lengua-
jes de programación se utilizan, principalmente, dos códigos de caracteres. El más común es ASCII (American Stan-
dard Code for Information Interchange) y algunos lenguajes, tal como Java, utilizan Unicode (www.unicode.org).
Ambos códigos se basan en la asignación de un código numérico a cada uno de los tipos de caracteres del código.
En C++, los caracteres se procesan normalmente usando el tipo char, que asocia cada carácter a un código nu-
mérico que se almacena en un byte.
El código ASCII básico que utiliza 7 bits (128 caracteres distintos) y el ASCII ampliado a 8 bits (256 caracteres
distintos) son los códigos más utilizados. Así se pueden representar caracteres tales como 'A', 'B', 'c', '$', '4',
'5', etc.
La Tabla 1.3, recoge los tipos enteros, reales y carácter utilizados en C++, la memoria utilizada (número de bytes
ocupados por el dato) y el rango de números.
1.3.3. Representación de imágenes
Las imágenes se adquieren mediante periféricos especializados tales como escáneres, cámaras digitales de vídeo,
cámaras fotográficas, etc. Una imagen, al igual que otros tipos de información, se representa por patrones de bits,
generados por el periférico correspondiente. Existen dos métodos básicos para representar imágenes: mapas de bits
y mapas de vectores.
18 Fundamentos de programación
En las técnicas de mapas de bits, una imagen se considera como una colección de puntos, cada uno de los cuales
se llama pixel (abreviatura de “picture element”). Una imagen en blanco y negro se representa como una cadena lar-
ga de bits que representan las filas de píxeles en la imagen, donde cada bit es bien 1 o bien 0, dependiendo de que
el pixel correspondiente sea blanco o negro. En el caso de imágenes en color, cada pixel se representa por una com-
binación de bits que indican el color de los pixel. Cuando se utilizan técnicas de mapas de bits, el patrón de bits
resultante se llama mapa de bits, significando que el patrón de bits resultante que representa la imagen es poco más
que un mapa de la imagen.
Muchos de los periféricos de computadora —tales como cámaras de vídeo, escáneres, etc.— convierten imágenes
de color en formato de mapa de bits. Los formatos más utilizados en la representación de imágenes se muestran en
la Tabla 1.4.
Tabla 1.4. Mapas de bits
Formato Origen y descripción
BMP Microsoft. Formato sencillo con imágenes de gran calidad pero con el inconveniente de ocupar mucho (no
útil para la web).
JPEG Grupo JPEG. Calidad aceptable para imágenes naturales. Incluye compresión. Se utiliza en la web.
GIF CompuServe. Muy adecuado para imágenes no naturales (logotipos, banderas, dibujos anidados...). Muy
usado en la web.
Mapas de vectores. Otros métodos de representar una imagen se fundamentan en descomponer la imagen en una
colección de objetos tales como líneas, polígonos y textos con sus respectivos atributos o detalles (grosor, color, etc.).
Tabla 1.5. Mapas de vectores
Formato Descripción
IGES ASME/ANSI. Estándar para intercambio de datos y modelos de (AutoCAD...).
Pict Apple Computer. Imágenes vectoriales.
EPS Adobe Computer.
TrueType Apple y Microsoft para EPS.
1.3.4. Representación de sonidos
La representación de sonidos ha adquirido una importancia notable debido esencialmente a la infinidad de aplicacio-
nes multimedia tanto autónomas como en la web.
El método más genérico de codificación de la información de audio para almacenamiento y manipulación en
computadora es mostrar la amplitud de la onda de sonido en intervalos regulares y registrar las series de valores ob-
Tabla 1.3. Tipos enteros reales, en C++
Carácter y bool
Tipo Tamaño Rango
short (short int) 2 bytes –32.738..32.767
int 4 bytes –2.147.483.648 a 2.147.483.647
long (long int) 4 bytes –2.147.483.648 a 2.147.483.647
float (real) 4 bytes 10–38
a 1038
(aproximadamente)
double 8 bytes 10–308
a 10308
(aproximadamente)
long double 10 bytes 10–4932
a 104932
(aproximadamente)
char (carácter) 1 byte Todos los caracteres ASCII
bool 1 byte True (verdadero) y false (falso)
Introducción a las computadoras y los lenguajes de programación 19
tenidos. La señal de sonido se capta mediante micrófonos o dispositivos similares y produce una señal analógica que
puede tomar cualquier valor dentro de un intervalo continuo determinado. En un intervalo de tiempo continuo se
dispone de infinitos valores de la señal analógica, que es necesario almacenar y procesar, para lo cual se recurre a
una técnica de muestreo. Las muestras obtenidas se digitalizan con un conversor analógico-digital, de modo que la
señal de sonido se representa por secuencias de bits (por ejemplo, 8 o 16) para cada muestra. Esta técnica es similar
a la utilizada, históricamente, por las comunicaciones telefónicas a larga distancia. Naturalmente, dependiendo de la
calidad de sonido que se requiera, se necesitarán más números de bits por muestra, frecuencias de muestreo más
altas y lógicamente más muestreos por períodos de tiempo12
.
Como datos de referencia puede considerar que para obtener reproducción de calidad de sonido de alta fidelidad
para un disco CD de música, se suele utilizar, al menos, una frecuencia de muestreo de 44.000 muestras por segundo.
Los datos obtenidos en cada muestra se codifican en 16 bits (32 bits para grabaciones en estéreo). Como dato anec-
dótico, cada segundo de música grabada en estéreo requiere más de un millón de bits.
Un sistema de codificación de música muy extendido en sintetizadores musicales es MIDI (Musical Instruments
Digital Interface) que se encuentra en sintetizadores de música para sonidos de videojuegos, sitios web, teclados
electrónicos, etc.
1.4. CODIFICACIÓN DE LA INFORMACIÓN
La información que manejan las computadoras es digital. Esto significa que esta información se construye a partir
de unidades contables llamadas dígitos. Desde el punto de vista físico, las unidades de una computadora están cons-
tituidas por circuitos formados por componentes electrónicos denominados puertas, que manejan señales eléctricas
que no varían de modo continuo sino que sólo pueden tomar dos estados discretos (dos voltajes). Cerrado y abierto,
bajo y alto, 0 y 1. De este modo la memoria de una computadora está formada por millones de componentes de na-
turaleza digital que almacenan uno de dos estados posibles.
Una computadora no entiende palabras, números, dibujos ni notas musicales, ni incluso letras del alfabeto. De
hecho, sólo entienden información que ha sido descompuesta en bits. Un bit, o dígito binario, es la unidad más pe-
queña de información que una computadora puede procesar. Un bit puede tomar uno de dos valores: 0 y 1. Por esta
razón las instrucciones de la máquina y los datos se representan en códigos binarios al contrario de lo que sucede en
la vida cotidiana en donde se utiliza el código o sistema decimal.
1.4.1. Sistemas de numeración
El sistema de numeración más utilizado en el mundo es el sistema decimal que tiene un conjunto de diez dígitos (0
al 9) y con la base de numeración 10. Así, cualquier número decimal se representa como una expresión aritmética
de potencias de base 10; por ejemplo, 1.492, en base 10, se representa por la cantidad:
1492 = 1.103
+ 4.102
+ 9.101
+ 2.100
= 1.1000 + 4.100 + 9.10 + 2.1
y 2.451,4 se representa por
2451,4 = 2.103
+ 4.102
+ 5.101
+ 1.100
+ 4.10–1
= 2.1000 + 4.100 + 5.10 + 1.1 + 4.0,1
Además del sistema decimal existen otros sistemas de numeración utilizados con frecuencia en electrónica e in-
formática (computación): el sistema hexadecimal y el sistema octal.
El sistema o código hexadecimal tiene como base 16, y 16 dígitos para su representación (0, 1, 2, 3, 4,
5, 6, 7, 8, 9, A, B, C, D, E y F), los diez dígitos decimales y las primeras letras del alfabeto que re-
presentan los dígitos de mayor peso, de valor 10, 11, 12, 13, 14 y 15.
El sistema o código octal tiene por base 8 y 8 dígitos (0, 1, 2, 3, 4, 5, 6 y 7).
En las computadoras, como ya se ha comentado, se utiliza el sistema binario o de base 2 con dos dígitos: 0 y 1.
En el sistema de numeración binario o digital, cada número se representa por un único patrón de dígitos 0 y 1. La
Tabla 1.6 representa los equivalentes de números en código decimal y binario.
12
En las obras del profesor Alberto Prieto, Schaum “Conceptos de Informática e Introducción a la Informática”, publicadas en McGraw-Hill,
puede encontrar una excelente referencia sobre estos conceptos y otros complementarios de este capítulo introductorio.
20 Fundamentos de programación
Tabla 1.6. Representación de números decimales y binarios
Representación decimal Representación binaria
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0
1
10
11
100
101
110
111
1000
1001
1010
1011
1100
1101
1110
1111
Así, un número cualquiera se representará por potencias de base 2, tal como:
54 en decimal (54) equivale a 00110110
54 = 00110110 = 0.27
+ 0.26
+ 1.25
+ 1.24
+ 0.23
+ 1.22
+ 1.21
+ 0.20
= 0 + 0 + 32 + 16 + 0 + 4 + 2 + 0 = 54
La Tabla 1.7 representa notaciones equivalentes de los cuatro sistemas de numeración comentados anteriormente.
Tabla 1.7. Equivalencias de códigos decimal, binario, octal y hexadecimal
Decimal Binario Octal Hexadecimal
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0
1
10
11
100
101
110
111
1000
1001
1010
1011
1100
1101
1110
1111
10000
10001
10010
10011
10100
0
1
2
3
4
5
6
7
10
11
12
13
14
15
16
17
20
21
22
23
24
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
10
11
12
13
14
Introducción a las computadoras y los lenguajes de programación 21
1.5. DISPOSITIVOS DE ALMACENAMIENTO SECUNDARIO
(ALMACENAMENTO MASIVO)
La memoria secundaria, mediante los dispositivos de almacenamiento secundario, proporciona capacidad de almace-
namiento fuera de la UCP y del almacenamiento o memoria principal. El almacenamiento secundario es no volátil y
mantiene los datos y programas, incluso cuando se apaga la computadora. Las unidades (drives, en inglés), periféricos
o dispositivos de almacenamiento secundario son dispositivos periféricos que actúan como medio de soporte para
almacenar datos —temporal o permanentemente— que ha de manipular la UCP durante el proceso en curso y que no
puede contener la memoria principal.
Las tecnologías de almacenamiento secundario más importantes son discos magnéticos, discos ópticos y cintas
magnéticas. El dispositivo de almacenamiento secundario más común es la unidad de disco o disquetera, que sirve
para alojar los discos. En ella se almacenan y recuperan datos y programas de un disco, transfiriendo los datos entre
la memoria secundaria y la memoria principal.
La información almacenada en la memoria central es volátil (desaparece cuando se apaga la computadora) y la
información almacenada en la memoria auxiliar es permanente. Esta información contenida en la memoria secunda-
ria se conserva en unidades de almacenamiento denominadas archivos (ficheros, files en inglés) que pueden ser tan
grandes como se desee. Un programa, por ejemplo, se almacena en un archivo y se copia en memoria principal cuan-
do se ejecuta el programa. Se puede almacenar desde un programa, hasta un capítulo de un libro, un inventario de
un almacén o un listado de clientes o cualquier otra unidad de información como música, archivos MP3, DivX, un
correo electrónico, etc. Los resultados de los programas se pueden guardar como archivos de datos y los programas
que se escriben se guardan como archivos de programas, ambos en la memoria auxiliar. Cualquier tipo de archivo se
puede transferir fácilmente desde la memoria auxiliar hasta la central para su proceso posterior.
1.5.1. Discos magnéticos
Los discos son dispositivos formados por componentes electromagnéticos que permiten un acceso rápido a bloques
físicos de datos. La información se registra en la superficie del disco y se accede a ella por medio de cabezas de
lectura/escritura que se mueven sobre la superficie. Los discos magnéticos se clasifican en disquetes (flopy disk), ya
prácticamente en desuso, y discos duros (hard disk).
Los primeros disquetes, antes del advenimiento del PC eran de 8 pulgadas; posteriormente aparecieron del tama-
ño de 5 1/4" de 360 KB de capacidad que llegaron a alcanzar 1,2 MB (ya prácticamente en desuso) y los que se
fabrican en la actualidad de 3,5" y capacidad de 1,44 Megabytes (2,8 MB, en algunos casos). Los disquetes han sido
muy populares, pero hoy día cada vez se utilizan menos, su gran ventaja era su tamaño y que eran transportables de
una computadora a otra, además, era relativamente fácil grabar y borrar su información. Los discos duros también
llamados discos fijos (hard disk) se caracterizan por su gran capacidad de almacenamiento (del orden de decenas,
centenas y millares de GB, TB, etc.) y porque normalmente se encuentran empotrados en la unidad física de la com-
putadora. Las computadoras grandes utilizan múltiples discos duros ya que ellos requieren gran capacidad de alma-
cenamiento que se mide en Gigabytes o en Terabytes. Es posible ampliar el tamaño de los discos duros de una
computadora, bien cambiándolos físicamente por otros de capacidad mayor o bien añadiendo otros a los existentes.
Un disco debe ser formateado antes de ser utilizado. La operación de formateado escribe información en el disco
de modo que los datos se pueden escribir y recuperar eficientemente. El proceso de formatear un disquete es análo-
go al proceso de dibujar líneas en un aparcamiento y la numeración de las correspondientes plazas. Permite que la
información se sitúe (plaza de aparcamiento o “parqueo”) y se recupere (encontrar su automóvil de modo rápido y
seguro). Esto explica por qué un disco tiene menos espacio en el mismo después de que ha sido formateado (al igual
que un aparcamiento, ya que las líneas y la numeración ocupan un espacio determinado).
Hoy día se comercializan numerosos discos duros transportables (removibles) que se conectan fácilmente median-
te los controladores USB que se verán posteriormente y que se comercializan con tamaños de centenares de MB
hasta 1 y 2 TB.
1.5.2. Discos ópticos: CD-ROM y DVD
Los discos ópticos difieren de los tradicionales discos duros o discos magnéticos en que los primeros utilizan un haz
de láser para grabar la información. Son dispositivos de almacenamiento que utilizan la misma tecnología que los
dispositivos compactos de audio para almacenar información digital. Por esta razón suelen tener las mismas caracte-
22 Fundamentos de programación
rísticas que los discos de música: muy resistentes al paso del tiempo y con gran capacidad de almacenamiento. Estos
discos se suelen utilizar para almacenar información histórica (no va a sufrir modificaciones frecuentes), archivos
gráficos complejos, imágenes digitales, etc. Al igual que los disquetes, son transportables y compatibles entre com-
putadoras. Los dos grandes modelos existentes en la actualidad son los discos compactos (CD) y los discos versátiles
digitales (DVD).
El CD-ROM (el cederrón)13
(Compact Disk-Read Only Memory,
Disco compacto - Memoria de solo lectura)
Estos discos son el medio ideal para almacenar información de forma masiva que no necesita ser actualizada con
frecuencia (dibujos, fotografías, enciclopedias...). La llegada de estos discos al mercado hizo posible el desarrollo de
la multimedia, es decir, la capacidad de integrar medios de todo tipo (texto, sonido e imágenes). Permiten almacenar
650 o 700 Megabytes de información. En la actualidad son muy económicos, alrededor de medio euro (medio dólar).
Estos discos son de sólo lectura, por lo que sólo se pueden grabar una vez. Estos discos conocidos como CD-R o
CD+R son cada día más populares y han sustituido a los disquetes de 3,5".
Existen discos CD que permiten grabación de datos, además de lectura y se conocen como discos CD-RW (CD-
Recordable y ReWritable). Desde hace años es posible encontrar en el mercado estos discos ópticos CD en los que
se puede leer y escribir información por parte del usuario cuantas veces se deseen. Es el modelo regrabable, por
excelencia. Este modelo se suele utilizar para realizar copias de seguridad del disco duro o de la información más
sensible, al poder actualizarse continuamente. Aunque nació para emplearse en servidores, estaciones de trabajo, etc.,
hoy día, es un disco que suele utilizarse en computadoras personales de grandes prestaciones. Las unidades lectoras
y grabadoras de discos14
de este tipo, tiene ya precios asequibles y son muchos los usuarios, incluso, domésticos, que
incorporan estas unidades a sus equipos informáticos.
DVD (Digital Versatile Disc): Videodisco digital (DVD-+RW, DVD
de alta capacidad de almacenamiento: HD DVD y Blu-ray)
Este disco óptico nació en 1995, gracias a un acuerdo entre los grandes fabricantes de electrónica de consumo, estu-
dios de cine y de música (Toshiba, Philips, Hitachi, JVC, etc.). Son dispositivos de alta capacidad de almacenamien-
to, interactivos y con total compatibilidad con los medios existentes. Tiene además una gran ventaja: su formato
sirve tanto para las computadoras como para los dispositivos de electrónica de consumo. El DVD es capaz de alma-
cenar hasta 26 CD con una calidad muy alta y con una capacidad que varía, desde los 4,7 GB del tipo de una cara y
una capa hasta los 17 GB del de dos caras y dos capas, o lo que es igual, el equivalente a la capacidad de 7 a 26 CD
convencionales. Estas cifras significan que se pueden almacenar en uno de estos discos una película completa en
diferentes idiomas e incluso subtítulos.
En la actualidad se pueden encontrar tres formatos de DVD grabables: DVD-R (se puede grabar una sola vez);
DVD-RAM (reescribible pero con un funcionamiento similar al disco duro); DVD-RW (lectura y escritura, regraba-
ble). Al igual que en el caso de los discos compactos, requieren de unas unidades especiales de lectura y reproducción,
así como grabadoras/regrabadoras. Estas últimas se encuentran ya en el mercado, a precios muy asequibles. La ma-
yoría de las computadoras que se comercializan en cualquier gran almacén incluyen de serie una unidad lectora de
DVD y grabadora de CD-RW o de DVD, que permiten grabar una y otra vez en los discos de formato RW. Comien-
za a ser también frecuente encontrar PCs con unidades de grabación de todos los formatos DVD, tales como DVD-R,
DVD+R, DVD-RW y DVD+RW y, ya son una realidad, los nuevos DVD de alta definición de Toshiba y Blu-ray de
Sony de alta capacidad de almacenamiento (15 GB a 50 GB). En abril de 2006 se presentaron los 16 nuevos lectores
de DVD de gran capacidad de almacenamiento de Toshiba (HD DVD, de 15 GB a 30 GB) y Blu-ray de Sony (de
25 GB a 50 GB), y a finales del primer semestre de 2007, Toshiba presentó su nuevo HD_DVD de 3 capas con lo
que llegó a 51 GB y así competir directamente con Sony también en capacidad (Figura 1.6).
Discos duros virtuales
Es un nuevo dispositivo de almacenamiento de información que no reside en la computadora del usuario sino en un
espacio virtual residente en un sitio Web de Internet (de tu propia empresa, o de cualquiera otra que ofrezca el servicio).
13
La última edición (22.ª, 2001) del Diccionario de la Lengua Española (DRAE) ha incorporado el término cederrón.
14
En Hispanoamérica se conoce también a estas unidades como unidades “quemadoras” de disco, traducción fiel del término anglosajón.
Introducción a las computadoras y los lenguajes de programación 23
Es una buena opción para el usuario (estudiantes, particulares, profesionales, empresas...) de tipo medio y empresas
que utilizan grandes volúmenes de información y que necesitan más espacio y no lo tienen disponible en sus equipos.
Este almacenamiento o alojamiento puede ser gratuito o de pago, pero en cualquier forma no deja de ser una intere-
sante oferta para el programador que encuentra un lugar donde situar aplicaciones, archivos, etc., que no puede alma-
cenar en su computadora.
El inconveniente de esta solución es el riesgo que se ha de asumir al depositar información en lugares no contro-
lados por uno mismo. Esta situación plantea la necesidad de un estudio de la privacidad y seguridad que van a tener
los datos que deposite en estos discos virtuales. La Tabla 1.8 muestra algunas direcciones de almacenamiento virtual
en Internet que en algunos casos son gratuitos.
Tabla 1.8. Algunas direcciones de sitios Web para almacenamiento virtual de datos
Nombre de la empresa Dirección de Internet
Xdrive www.xdrive.com
FreeDrive (propiedad de Xdrive) www.freedrive.com
FreeMailGuide www.freemailguide.com
Yahoo¡ Briefcase (necesita registro previo) briefcase.yahoo.com
Hoy, además de sitios como los referenciados en la tabla anterior, la mayoría de los buscadores de Internet ofre-
cen una gran capacidad de almacenamiento gratuito, donde se pueden almacenar gran cantidad de datos además de
los correos electrónicos, y totalmente gratuitos, y con un programa adecuado se puede también convertir este espacio
de correo electrónico en espacio para un disco duro virtual. Los servicios de correo electrónico (webmail) ofrecen
capacidad de almacenamiento creciente que pueden ser muy bien utilizados por el internauta15
.
15
La tendencia en 2008, es aumentar el almacenamiento gratuito que ofrecen los grandes buscadores. Gmail, ofrece en febrero de 2008, la
cantidad de 6389 MB, o sea más de 6,2 GB, de almacenamiento gratuito a sus clientes de correo electrónico. Yahoo! ofrece almacenamiento ili-
mitado y Windows Live Hotmail más de 5 GB.
Figura 1.6. Unidad de disco USB (arriba izquierda), unidad de DVD regrabable (arriba derecha),
lector de Blu-ray (abajo).
24 Fundamentos de programación
1.5.3. Discos y memorias Flash USB
Los chips de memoria flash, similares a los chips de RAM, son unos chips con una tecnología especial, flash, en los
que se puede escribir y borrar rápida y repetidamente, pero al contrario que las memorias RAM, las memorias flash
no son volátiles y se puede mantener su contenido sin alimentación eléctrica.
Cámaras digitales, teléfonos celulares (móviles), computadoras portátiles, PDA, y otros dispositivos digitales
utilizan memoria flash para almacenar datos que necesitan modificarse en el transcurso del tiempo.
Las memorias flash siguen siendo muy caras aunque el proceso de abaratamiento se ha iniciado en estos últimos
años y pronto reemplazarán a discos y chips de memoria tradicionales. Hoy día, finales de 2007, es relativamente
fácil encontrar tarjetas de memorias flash o lápices USB (pen drives) de 1 GB a 8 GB por precios muy asequibles
(15 a 30 €) y la tendencia es aumentar la cantidad de memoria que almacena y reducción del precio.
Asimismo los discos duros externos con conexiones mediante USB se comercializan con tamaños de memoria
de cientos de GB hasta Terabytes (1 y 2 TB son capacidades de unidades de disco externo USB que se encuentran
fácilmente en grandes almacenes y tiendas especializadas y también con precios asequibles en torno a 100 y 200 €).
Una memoria flash, también comercializada como un disco es un pequeño almacén de memoria móvil de un ta-
maño algo mayor que un mechero o llavero (por esta razón a veces se les llama llaveros flash) y por consiguiente se
puede transportar en el bolsillo de una prenda de vestir. Este disco o memoria se puede conectar a cualquier PC de
escritorio o portátil que disponga de una conexión USB (véase apartado 1.4.2). Se comercializa por muchos fabri-
cantes16
y se han convertido en el medio más económico y práctico para llevar archivos de cualquier tipo e incluso
hasta programas como copias de seguridad. Los discos duros USB al ser regrabables y de fácil instalación (sólo ne-
cesitan enchufarse en un puerto USB) se están constituyendo en el medio idóneo para almacenamiento de información
personal y como dispositivo de copia de seguridad.
Figura 1.7. Tarjeta compact flash (izquierda), memoria flash USB (centro) y disco duro (derecha).
1.5.4. Otros dispositivos de Entrada y Salida (E/S)
Los dispositivos de entrada y de salida permiten la comunicación entre las personas y la UCP. Un dispositivo de
entrada es cualquier dispositivo que permite que una persona envíe información a la computadora. Los dispositivos
de entrada, por excelencia, son un teclado y un ratón. Entre otras cosas un ratón se utiliza para apuntar, moverse por
la pantalla y elegir una lista de opciones visualizadas en la pantalla. El dispositivo fue bautizado como ratón (mouse
en inglés, jerga muy utilizada también en Latinoamérica) porque se conecta a la computadora por un largo cable y
el conjunto se asemeja a un ratón. El ratón típico tiene dos o tres botones, e incluso una pequeña ruedecita que per-
mite desplazarse por menús y similares en la pantalla. El puntero en la pantalla se conoce como cursor o sprite.
Moviéndose con el ratón de modo que el cursor apunte a una región específica de la pantalla (por ejemplo, un menú
de una aplicación) y haciendo clic en el botón del ratón, se puede señalar a la computadora para que realice la orden
indicada en la opción del menú. El uso del ratón y de menús facilita dar órdenes a la computadora y es mucho más
sencillo que las tediosas órdenes de tecleado que siempre se deben memorizar. Algunos dispositivos de entrada, no
tan típicos pero cada vez más usuales en las configuraciones de sistemas informáticos son: escáner, lápiz óptico, mi-
crófono y reconocedor de voz.
16
En febrero de 2006.
Introducción a las computadoras y los lenguajes de programación 25
Un dispositivo de salida es cualquier dispositivo que permite a una computadora pasar información al usuario.
El dispositivo de salida por excelencia es la pantalla de presentación, también llamada monitor o terminal. Otro dis-
positivo de salida muy usual es la impresora para producir salidas impresas en papel. Al teclado y la pantalla inte-
grados se les suele conocer también como terminal o VDT (video display terminal).
El monitor, conocido también como CRT (cathode ray tube) funciona igual que un aparato de televisión. El mo-
nitor está controlado por un dispositivo de salida denominado tarjeta gráfica. Las tarjetas gráficas envían los datos
para ser visualizados en el monitor con un formato que el monitor puede manipular. Las características más importan-
tes del monitor y la tarjeta gráfica son la velocidad de refresco, la resolución y el número de colores soportados. La
velocidad de refresco es la velocidad a la cual la tarjeta gráfica actualiza la imagen en la pantalla. Una tasa de refres-
co baja tal como 60 KHz, puede producir fatiga en los ojos ya que la imagen puede parpadear imperceptiblemente.
Las tarjetas gráficas usuales presentan tasas de refresco de 70 a 100 MHz. Esta frecuencia elimina el parpadeo y la
consiguiente fatiga para los ojos. La resolución es el número de puntos por pulgada que se pueden visualizar a lo lar-
go de la pantalla. Un punto (dot) en este contexto se conoce como un píxel (picture elemental). En los monitores clá-
sicos VGA una resolución típica es 640 × 480: hay 640 pixels en el sentido horizontal de la pantalla y 480 pixels en
el vertical. La tarjeta gráfica almacena la información en la pantalla para cada píxel en su propia memoria. Las tarjetas
gráficas que pueden visualizar a resoluciones más altas requieren más memoria. Por ejemplo muchas tarjetas soportan
resoluciones que corren desde 800 × 640 hasta 12.180 × 1.024. Tales tarjetas requieren 1 a 4 Mb de memoria. Rela-
cionado directamente con la cantidad de memoria y la resolución es el número de colores que se pueden visualizar.
La tarjeta gráfica debe almacenar la información del color para visualizar cada píxel en la pantalla. Para visualizar 256
(28
) colores, se necesita 1 byte por cada píxel.
Dado que las personas y las computadoras utilizan lenguajes diferentes se requiere algún proceso de traducción.
Las interacciones con un teclado, la pantalla o la impresora tienen lugar en el idioma español, el inglés o cualquier
otro como el catalán. Eso significa que en la jerga informática cuando se pulsa la letra C (de Carchelejo) en un te-
clado se produce que una letra C vaya a la pantalla del monitor, o a una impresora y allí se visualice o se imprima
como una letra C. Existen diversos códigos de uso frecuente. El código más usual entre computadoras es el ASCII
(acrónimo de American Standard Code for Information Interchange) que es un código de siete bits que soporta letras
mayúsculas y minúsculas del alfabeto, signos numéricos y de puntuación, y caracteres de control. Cada dispositivo
tiene su propio conjunto de códigos pero los códigos construidos para un dispositivo no son necesariamente los mis-
mos códigos construidos para otros dispositivos. Algunos caracteres, especialmente caracteres tales como tabulacio-
nes, avances de línea o de página y retornos de carro son manipulados de modo diferente por dispositivos diferentes
e incluso por piezas diferentes de sistemas software que corren sobre el mismo dispositivo. Desde la aparición del
lenguaje Java y su extensión para aplicaciones en Internet se está haciendo muy popular el código Unicode que fa-
cilita la integración de alfabetos de lenguajes muy diversos no sólo los occidentales, sino orientales, árabes, etc.
Nuevos dispositivos de E/S móviles
Los sistemas de transmisión de datos que envían señales a través del aire o del espacio sin ninguna atadura física se
han vuelto una alternativa fiable a los canales cableados tradicionales tales como el cable de cobre, cable coaxial o
de fibra óptica. Hoy en programación se utilizan como dispositivos de E/S, teléfonos inteligentes (smartphones),
asistentes digitales personales, PDA y redes de datos móviles.
Los teléfonos móviles (celulares) son dispositivos que transmiten voz o datos (últimamente también imágenes y
sonidos) que utilizan ondas radio para comunicarse con antenas de radios situados en celdas (áreas geográficas adyacen-
tes) que a su vez se comunican con otras celdas hasta llegar a su destino, donde se transmiten al teléfono receptor o
al servidor de la computadora al que está conectado. Los nuevos modelos de teléfonos digitales pueden manejar co-
rreo voz, correo electrónico y faxes, almacenan direcciones, acceden a redes privadas corporativas y a información
de Internet. Los teléfonos inteligentes vienen equipados con software de navegación Web que permite a estos dispo-
sitivos acceder a páginas Web cuyos formatos han sido adaptados al tamaño de sus pantallas.
Los asistentes personales digitales (PDA) son pequeñas computadoras de mano capaces de realizar transmi-
siones de comunicaciones digitales. Pueden incorporar17
telecomunicaciones inalámbricas y software de organi-
zación del trabajo de oficina o para ayuda al estudio. Nokia, Palm, HP, Microsoft son algunos de los fabricantes
que construyen este tipo de dispositivos. Los teléfonos móviles o celulares y los PDAs pueden venir incorporados
con tecnologías GPRS o tecnología UMTS/CDMA. Las tecnologías GPRS conocidas como generación 2.5 per-
17
Este es el caso del PDA del fabricante español Airis que comercializa a un coste asequible, un teléfono/PDA.
26 Fundamentos de programación
miten velocidades de transmisión de 50 a 100 Kbps, similar y un poco mayor a la velocidad de la red de telefo-
nía básica, RTB. Los teléfonos UMTS/CDMA que ya se comercializan en Europa18
y también en América y Asia,
se conocen como teléfonos de 3.ª generación (3G), y permiten velocidades de transmisión hasta 1 o 2 Mbps, igual
cantidad que las telefonías digitales ADSL.
Figura 1.8. Blackberry (izquierda), Palm Treo (centro) y HP iPAQ hw6500 (derecha).
1.6. CONECTORES DE DISPOSITIVOS DE E/S
Los dispositivos de E/S no se pueden conectar directamente a la UCP y la memoria, dada su diferente naturaleza.
Los dispositivos de E/S son dispositivos electromecánicos, magnéticos u ópticos que además funcionan a diferentes
velocidades, la UCP y la memoria son dispositivos electrónicos. Por otra parte los dispositivos de E/S operan a una
velocidad mucho más lenta que la UCP/memoria. Se requiere por consiguiente de un dispositivo intermediario o
adaptador denominado interfaz o controlador. Existe un controlador específico para cada dispositivo de entrada/sa-
lida que puede ser de software o de hardware. Los controladores de hardware más utilizados presentan al exterior
conectores donde se enchufan o conectan los diferentes dispositivos. Cada computadora tiene un número determina-
do de conectores estándar incorporados y que se localizan fácilmente en el exterior de su chasis. Los sistemas ope-
rativos modernos como Windows XP reconocen automáticamente los dispositivos de E/S tan pronto se conectan a la
computadora. Si no es así necesitará cargar en memoria un programa de software denominado controlador del dis-
positivo correspondiente con el objetivo de que el sistema operativo reconozca al citado dispositivo. Los conectores
más comunes son: puertos serie y paralelo, buses USB y firewire.
1.6.1. Puertos serie y paralelo
El PC está equipado con puertos serie y paralelo. El puerto serie (como mínimo suele tener dos) es un conector ma-
cho de la parte trasera o lateral del PC con 9 o 25 clavijas, aunque sólo suelen utilizarse 3 o 4 para la transmisión en
serie. El puerto paralelo también se denomina puerto de impresora, ya que es donde solía conectarse la impresora
18
Ya comienza a extenderse, al menos en el ámbito empresarial, las tarjetas digitales del tipo PCMCIA, 2.5G/3G que son tarjetas módem
2G/3G con una memoria SIM y número teléfono móvil (celular) incorporado y que enchufadas a una computadora portátil permiten conexiones
a Internet a velocidad UMTS y en aquellas zonas geográficas donde no exista cobertura, automáticamente se conecta a velocidad 2.5 G (GPRS)
que tiene mayor cobertura en el resto del territorio. En España desde el mes de julio de 2004, tanto Vodafone como Telefónica Móviles ofrecen
estas soluciones.
Introducción a las computadoras y los lenguajes de programación 27
hasta que aparecieron los conectores USB. El conector de la impresora de la parte trasera del PC es un conector
hembra de 25 clavijas. Los puertos se llaman también COM1, COM2 y LPT conocidos por nombres de dispositivos
lógicos que el programa de inicio del PC automáticamente asigna a estos dispositivos durante el inicio, por ejemplo
A:, C:, E:, CON, PRN y KBD son nombres lógicos.
1.6.2. USB
USB son las siglas de Universal Serial Bus (Bus serie universal) y corresponden a un bus estándar de E/S que desa-
rrollaron originalmente varias empresas, entre ellas Compaq, Digital, IBM, Intel, Microsoft, NEC y Northern Tele-
com19
. La importancia del bus USB es que es un bus de E/S serie de precio asequible con una especificación prácti-
ca, lo que significa que cualquiera puede producir productos USB sin tener que pagar ninguna licencia. Sin duda, el
bus USB es la innovación más importante y de éxito del mundo PC en muchos años. Es un bus de expansión que
permite conectar una gran cantidad de equipamiento al PC.
El objetivo del USB conseguido es reunir las diferentes conexiones del teclado, el ratón, el escáner, el joystick,
la cámara digital, impresora, disco duro, etc., en un bus compartido conectado a través de un tipo de conector común.
Otra gran ventaja es también su compatibilidad con computadoras Macintosh. Existen dos versiones: USB 1.1 cuya
velocidad de transferencia está limitada a un máximo de 12 Mbps; USB 2.0 puede transmitir hasta 40 Mbps y se
utiliza en todos los PC modernos. La versión 2.0 es compatible descendente; es decir, un dispositivo con un conector
USB 2.0 es compatible con los conectores 1.1 y no siempre sucede igual al revés. Otra gran ventaja es que ya se
fabrican distribuidores (hubs) que permiten conectar numerosos dispositivos USB a un único bus USB. Con indepen-
dencia de la conexión de distribuidores USB, ya es frecuente que tanto los PC de escritorio como los portátiles ven-
gan de fábrica con un número variable de 2 a 8 e incluso 10 puertos USB, normalmente el estándar 2.0.
1.6.3. Bus IEEE Firewire – 1394
El bus IEEE 1394 (firewire) es una nueva interfaz SCSI (un bus antiguo pero avanzado utilizado para discos duros,
unidades de CD-ROM, escáneres y unidades de cinta). Es un bus serie de alta velocidad con una velocidad de trans-
ferencia máxima de 400 Mbps patentado por Apple. Es una interfaz estándar de bus serie para computadoras perso-
nales (y vídeo/audio digital). IEEE 1394 ha sido adoptado como la interfaz de conexiones estándar HANA (High
Definition Audio-Video Network Alliance) para comunicación y control de componentes audiovisuales. Firewire está
también disponible en versiones inalámbricas (wireless), fibra óptica y cable coaxial. Las computadoras Apple y Sony
suelen venir con puertos firewire, y ya comienza a ser usual que los PC incluyan al menos un puerto firewire. Las
actuales videocámaras digitales y otros dispositivos de audio e imagen suelen incorporar conectores firewire.
Figura 1.9. Conectores USB (izquierda) y conector Firewire (derecha).
19
En el sitio www.usb.org y en el forum “USB Implementers Forum” puede encontrar historia y características del bus USB.
28 Fundamentos de programación
1.7. REDES, WEB Y WEB 2.0
Hoy día las computadoras autónomas (standalone) prácticamente no se utilizan (excepción hecha del hogar) y están
siendo reemplazadas hasta en los hogares y en las pequeñas empresas, por redes de computadoras. Una red es un
conjunto de computadoras conectadas entre sí para compartir recursos. Al contrario que una gran computadora que
es una única computadora compartida por muchos usuarios, una red (network) consta de muchas computadoras que
comparten recursos.
Las computadoras modernas necesitan comunicarse con otras computadoras. Si la computadora se conecta con
una tarjeta de red se puede conectar a una red de datos locales (red de área local). De este modo se puede acceder
y compartir a cada una de las memorias de disco y otros dispositivos de entrada y salida. Si la computadora tiene un
módem, se puede comunicar con computadoras distantes. Se pueden conectar a una red de datos o enviar correo
electrónico a través de las redes corporativas Intranet/Extranet o la propia red Internet. También es posible enviar y
recibir mensajes de fax.
El uso de múltiples computadoras enlazadas por una red de comunicaciones para distribuir el proceso se deno-
mina proceso distribuido en contraste con el proceso centralizado en el cual todo el proceso se realiza por una com-
putadora central. De esta forma los sistemas de computadoras también se clasifican en sistemas distribuidos y sis-
temas centralizados.
Las redes se pueden clasificar en varias categorías siendo las más conocidas las redes de área local (LAN, Local
Area Network) y las redes área amplia o ancha WAN (Wide Area Network). Una Red de Área Local permite a mu-
chas computadoras acceder a recursos compartidos de una computadora más potente denominada servidor. Una WAN
es una red que enlaza muchas computadoras personales y redes de área local en una zona geográfica amplia. La red
WAN más conocida y popular en la actualidad es la red Internet que está soportada por la World Wide Web.
Una de las posibilidades más interesantes de las computadoras es la comunicación entre ellas cuando se encuen-
tran en sitios separados físicamente y se encuentran enlazadas por vía telefónica. Estas computadoras se conectan en
redes LAN (Red de Área Local) y WAN (Red de Área Ancha), aunque hoy día las redes más implantadas son las
redes que se conectan con tecnología Internet y por tanto conexión a la Red Internet. Estas redes son Intranet y Ex-
tranet y se conocen como redes corporativas ya que enlazan computadoras de los empleados de las empresas. Las
instalaciones de las comunicaciones requieren de líneas telefónicas analógicas o digitales y de modems.
Los sistemas distribuidos realizan el proceso de sus operaciones de varias formas siendo las más conocidas clien-
te-servidor e igual-a-igual (peer-to-peer, P2P).
Compartición de recursos
Uno de los usos más extendidos de la red es permitir a diferentes computadoras compartir recursos tales como sis-
temas de archivos, impresoras, escáneres o discos DVD. Estas computadoras normalmente se conectan en una relación
denominada cliente-servidor (Figura 1.10). El servidor posee los recursos que se quieren compartir. Los clientes
conectados vía un concentrador (hub) o una conexión ethernet comparten el uso de estos recursos. El usuario de una
CLIENTE SERVIDOR
CLIENTE
CLIENTE
CLIENTE
CLIENTE
SERVIDOR
Petición de servicio
Servicio solicitado
Figura 1.10. Sistema de computadoras Cliente/Servidor.
Introducción a las computadoras y los lenguajes de programación 29
máquina cliente puede imprimir documentos o acceder a archivos como si los dispositivos realmente estuvieran físi-
camente conectados a la máquina local. Esto puede dar la ilusión de que realmente se tienen más recursos de los que
realmente existen, así como un entorno de programación uniforme, independiente de la máquina que realmente se
utilice.
El sistema cliente-servidor es el más popular en computación. El sistema divide el procesamiento de las tareas
entre las computadoras “cliente” y las computadoras “servidor” que a su vez están conectadas en red. A cada máqui-
na se le asignan funciones adecuadas a sus características. El cliente es el usuario final o punto de entrada a la red
y normalmente en una computadora personal de escritorio o portátil, o una estación de trabajo. El usuario, normal-
mente interactúa directamente sólo con la parte cliente del sistema, normalmente, para entrada o recuperación de
información y uso de aplicaciones para análisis y cálculos posteriores.
El servidor proporciona recursos y servicios a otras computadoras de la red (los clientes). El servidor puede ser
desde una gran computadora a otra computadora de escritorio pero especializada para esta finalidad y mucho más
potente. Los servidores almacenan y procesan los datos compartidos y también realizan las funciones no visibles, de
segundo plano (back-end), a los usuarios, tales como actividades de gestión de red, implementación de bases de da-
tos, etc. La Figura 1.10 muestra un sistema cliente/servidor. La red Internet es el sistema cliente/servidor más po-
pular.
1.7.1. Redes P2P, igual-a-igual (peer-to-peer, P2P)
Otra forma de sistema distribuido es la computación P2P20
(peer-to-peer) que es un sistema que enlaza las compu-
tadoras vía Internet o redes privadas de modo que pueden compartir tareas de proceso. El modelo P2P se diferencia
del modelo de red cliente/servidor en que la potencia de proceso reside sólo en las computadoras individuales de
modo que trabajan juntos colaborando entre sí, pero sin un servidor o cualquier otra computadora que los controle.
Los sistemas P2P utilizan espacio de disco o potencia de proceso del PC no utilizado por los sistemas en red. Estos
sistemas P2P se utilizan hoy con gran profusión en ambientes científicos y de investigación, así como para descargas
de música por Internet.
1.7.2. Aplicaciones de las redes de comunicaciones
En el interior de la computadora los diferentes componentes de hardware se comunican entre sí utilizando el bus
interno. Hoy día es práctica común que las computadoras se comuniquen unas con otras compartiendo recursos e
información. Esta actividad es posible a través del uso de redes, con cables físicos (normalmente teléfonos alámbri-
cos), junto con transmisiones electrónicas, sin cables (inalámbricas) mediante teléfonos móviles o celulares, redes
inalámbricas o tecnologías Bluetooth.
Existen muchos tipos de redes. Una red de área local (LAN, local area network) normalmente une decenas y a
veces centenares de computadoras en una pequeña empresa u organismo público. Una red global, tal como Internet,
que se expande a distancias mucho mayores y conecta centenares o millares de máquinas que, a su vez, se unen a
redes más pequeñas a través de computadoras pasarela (gateway). Una computadora pasarela (gateway) es un puen-
te entre una red tal como Internet en un lado y una red de área local en el otro lado. La computadora también suele
actuar como un cortafuegos (firewall) cuyo propósito es mantener las transmisiones ilegales, no deseadas o peligro-
sas fuera del entorno local. Estas redes se suelen conocer normalmente como redes Intranet y en realidad son redes
corporativas o institucionales que utilizan tecnología Internet y que por consiguiente pueden enlazarse con otras redes
de compañías socias, clientes, amigas, etc., y todo tipo de posibles clientes personales e institucionales sin necesidad
de que estos a su vez formen una red.
Otro uso típico de redes es la comunicación. El correo electrónico (e-mail) se ha convertido en un medio muy
popular para enviar cartas y documentos de todo tipo así como archivos a amigos, clientes, socios, etc. La World
Wide Web está proporcionando nuevas oportunidades comerciales y profesionales tanto a usuarios aislados como a
usuarios pertenecientes a entidades y empresas. Las redes han cambiado también los conceptos y hábitos de los lu-
gares de trabajo y el trabajo en sí mismo. Muchos estudiantes y profesionales utilizan las transmisiones de las redes
entre el hogar y la oficina o entre dos oficinas de modo que puedan acceder a la información que necesiten siempre
20
Los sistemas P2P se hicieron muy populares y llegaron al gran público cuando un estudiante estadounidense, Shawn Fanning, inventó el
sistema Napster, un sistema que permite descargas de música entre computadoras personales sin intervención de ningún servidor central.
30 Fundamentos de programación
que lo necesiten, y de hecho desde el lugar que ellos decidan siempre que exista una línea telefónica o un teléfono
móvil (celular).
Otro concepto importante es la informática distribuida. Las redes se utilizan también para permitir que las com-
putadoras se comuniquen entre sí. La complejidad de muchos problemas actuales requiere el uso de reservas de
computación. Esto se puede conseguir por sincronización de los esfuerzos de múltiples computadoras, trabajando
todas en paralelo en componentes independientes de un problema. Un sistema distribuido grande puede hacer uso de
centenares de computadoras.
1.7.3. Módem
El módem es un dispositivo periférico que permite intercambiar información entre computadoras a través de una línea
telefónica. El módem es un acrónimo de Modulador-Demodulador, y es un dispositivo que transforma las señales
digitales de la computadora en señales eléctricas analógicas telefónicas y viceversa, con lo que es posible transmitir
y recibir información a través de la línea telefónica.
El módem convierte una señal analógica en señal digital, y viceversa.
Los modems permiten además de las conexiones entre computadoras, envío y recepción de faxes, acceso a In-
ternet, etc. Una de las características importantes de un módem es su velocidad; cifras usuales son 56 kilobaudios
(1 baudio es 1 bit por segundo, bps; 1Kbps son 1.000 baudios).
Los modems pueden ser de tres tipos: Interno (es una tarjeta que se conecta a la placa base internamente); Ex-
terno (es un dispositivo que se conecta externamente a la computadora a través de puertos COM, USB, etc.);
PC-Card, son modems del tipo tarjeta de crédito, que sirven para la conexión a las computadoras portátiles.
Además de los modems analógicos es posible la conexión con Internet y las redes corporativas de las compañías
mediante la Red Digital de Sistemas Integrados (RDSI, IDSN, en inglés) que permite la conexión a 128 Kbps, dis-
poniendo de dos líneas telefónicas, cada una de ellas a 64 Kbps (hoy día ya es poco utilizada). En la actualidad se
está implantando a gran velocidad la tecnología digital ADSL que permite la conexión a Internet a velocidad superior
a la red RDSI, 256 Kbps a 1 a 8 Mbps; son velocidades típicas según sea para “subir” datos a la Red o para “bajar”,
respectivamente. Estas cifras suelen darse para accesos personales, ya que en accesos profesionales se pueden alcan-
zan velocidades de hasta 20-40 Mbps, e incluso superior.
1.7.4. Internet y la World Wide Web
Internet, conocida también como la Red de Redes, se basa en la tecnología Cliente/Servidor. Las personas que utili-
zan la Red controlan sus tareas mediante aplicaciones Web tal como software de navegador. Todos los datos inclu-
yendo mensajes de correo-e y las páginas Web se almacenan en servidores. Un cliente (usuario) utiliza Internet para
solicitar información de un servidor Web determinado situado en una computadora lejana; el servidor envía la infor-
mación solicitada al cliente vía la red Internet.
Las plataformas cliente incluyen PC y otras computadoras pero también un amplio conjunto de dispositivos elec-
trónicos de mano (handheld) tales como PDA, teléfonos móviles, consolas de juegos, etc., que acceden a Internet de
modo inalámbrico (sin cables) a través de señales radio.
La World Wide Web (WWW) o simplemente la Web fue creada en 1989 por Bernards Lee en el CERN (European
Laboratory for Particles Physics) aunque su difusión masiva comenzó en 1993 como medio de comunicación universal.
La Web es un sistema de estándares aceptados universalmente para almacenamiento, recuperación, formateado y visua-
lización de información, utilizando una arquitectura cliente/servidor. Se puede utilizar la Web para enviar, visualizar, re-
cuperar y buscar información o crear una página Web. La Web combina texto, hipermedia, sonidos y gráficos, utilizando
interfaces gráficas de usuario para una visualización fácil.
Para acceder a la Web se necesita un programa denominado navegador Web (browser). Un navegador21
es una
interfaz gráfica de usuario que permite “navegar” a través de la Web. Se utiliza el navegador para visualizar textos,
21
El navegador más utilizado en la actualidad es Explorer de Microsoft, aunque Firefox alcanzaba ya un 10% del mercado. En su día fueron
muy populares Netscape y Mosaic.
Introducción a las computadoras y los lenguajes de programación 31
gráficos y sonidos de un documento Web y activar los enlaces (links) o conexiones a otros documentos. Cuando se
hace clic (con el ratón) en un enlace a otro documento se produce la transferencia de ese documento situado en otra
computadora a su propia computadora.
La World Wide Web está constituida por millones de documentos enlazados entre sí, denominados páginas Web.
Una página Web, normalmente, está construida por texto, imágenes, audio y vídeo, al estilo de la página de un libro.
Una colección de páginas relacionadas, almacenadas en la misma computadora, se denomina sitio Web (Web site).
Un sitio Web está organizado alrededor de una página inicial (home page) que sirve como página de entrada y pun-
to de enlace a otras páginas del sitio. En el párrafo siguiente se describe cómo se construye una página Web. Cada
página Web tiene una dirección única, conocida como URL (Uniform Resource Locator). Por ejemplo, la URL de la
página inicial de este libro es: www.mhe.es/joyanes.
La Web se basa en un lenguaje estándar de hipertexto denominado HTML (Hypertext Markup Language) que da
formatos a documentos e incorpora enlaces dinámicos a otros documentos almacenados en la misma computadora o en
computadoras remotas. El navegador Web está programado de acuerdo al estándar citado. Los documentos HTML, cuan-
do, ya se han situado en Internet, se conocen como páginas Web y el conjunto de páginas Web pertenecientes a una mis-
ma entidad (empresa, departamento, usuario individual) se conoce como sitio Web (Website). En los últimos años ha
aparecido un nuevo lenguaje de marcación para formatos, heredero de HTML, y que se está convirtiendo en estándar
universal, es el lenguaje XML.
Otros servicios que proporciona la Web y ya muy populares para su uso en el mundo de la programación son: el
correo electrónico y la mensajería instantánea. El correo electrónico (e-mail) utiliza protocolos específicos para el
intercambio de mensajes: SMTP (Simple Mail Transfer Protocol), POP (Post Office Protocol) e IMAP (Internet
Message Action Protocol). La mensajería instantánea o chat que permite el diálogo en línea simultánea entre dos o
más personas, y cuya organización y estructura han sido trasladadas a los teléfonos celulares donde también se pue-
de realizar este tipo de comunicaciones con mensajes conocidos como “cortos” SMS (short message) o MMS (mul-
timedia message).
Web 2.0
Este término, ya muy popular, alude a una nueva versión o generación de la Web basada en tecnologías tales como
el lenguaje AJAX, los agregadores de noticias RSS, blogs, podcasting, redes sociales, interfaces de programación de
aplicaciones Web (APIs), etc. En esencia, la Web 2.0, cuyo nombre data de 2004, fue empleado por primera vez por
Tim O’Reilly, editor de la editorial O’Reilly, ha dado lugar a una Web más participativa y colaborativa, donde el
usuario ha dejado de ser un actor pasivo para convertirse en un actor activo y participativo en el uso y desarrollo de
aplicaciones Web.
Figura 1.11. Elementos de la siguiente generación de la web. (Fuente: http://web2.wsj2.com.)
32 Fundamentos de programación
1.8. EL SOFTWARE (LOS PROGRAMAS)
El software de una computadora es un conjunto de instrucciones de programa detalladas que controlan y coordinan
los componentes hardware de una computadora y controlan las operaciones de un sistema informático. El auge de
las computadoras el siglo pasado y en el actual siglo xxi, se debe esencialmente al desarrollo de sucesivas genera-
ciones de software potentes y cada vez más amistosas (“fáciles de utilizar”).
Las operaciones que debe realizar el hardware son especificadas por una lista de instrucciones, llamadas progra-
mas, o software. Un programa de software es un conjunto de sentencias o instrucciones a la computadora. El pro-
ceso de escritura o codificación de un programa se denomina programación y las personas que se especializan en
esta actividad se denominan programadores. Existen dos tipos importantes de software: software del sistema y soft-
ware de aplicaciones. Cada tipo realiza una función diferente.
El software del sistema es un conjunto generalizado de programas que gestiona los recursos de la computadora,
tal como el procesador central, enlaces de comunicaciones y dispositivos periféricos. Los programadores que escriben
software del sistema se llaman programadores de sistemas. El software de aplicaciones es el conjunto de programas
escritos por empresas o usuarios individuales o en equipo y que instruyen a la computadora para que ejecute una tarea
específica. Los programadores que escriben software de aplicaciones se llaman programadores de aplicaciones.
Los dos tipos de software están relacionados entre sí, de modo que los usuarios y los programadores pueden ha-
cer así un uso eficiente de la computadora. En la Figura 1.12 se muestra una vista organizacional de una computa-
dora donde se ven los diferentes tipos de software a modo de capas de la computadora desde su interior (el hardware)
hasta su exterior (usuario). Las diferentes capas funcionan gracias a las instrucciones específicas (instrucciones má-
quina) que forman parte del software del sistema y llegan al software de aplicación, programado por los programa-
dores de aplicaciones, que es utilizado por el usuario que no requiere ser un especialista.
Programas del sistema
Programas de la aplicación
Hardware
Usuario
Figura 1.12. Relación entre programas de aplicación y programas del sistema.
1.8.1. Software del sistema
El software del sistema coordina las diferentes partes de un sistema de computadora y conecta e interactúa entre el
software de aplicación y el hardware de la computadora. Otro tipo de software del sistema que gestiona, controla las
actividades de la computadora y realiza tareas de proceso comunes, se denomina utility o utilidades (en algunas
partes de Latinoamérica, utilerías). El software del sistema que gestiona y controla las actividades de la computado-
ra se denomina sistema operativo. Otro software del sistema son los programas traductores o de traducción de
lenguajes de computadora que convierten los lenguajes de programación, entendibles por los programadores, en len-
guaje máquina que entienden las computadoras.
Introducción a las computadoras y los lenguajes de programación 33
El software del sistema es el conjunto de programas indispensables para que la máquina funcione; se denominan
también programas del sistema. Estos programas son, básicamente, el sistema operativo, los editores de texto, los
compiladores/intérpretes (lenguajes de programación) y los programas de utilidad.
1.8.2. Software de aplicación
El software de aplicación tiene como función principal asistir y ayudar a un usuario de una computadora para eje-
cutar tareas específicas. Los programas de aplicación se pueden desarrollar con diferentes lenguajes y herramientas
de software. Por ejemplo, una aplicación de procesamiento de textos (word processing) tal como Word o Word Per-
fect que ayuda a crear documentos, una hoja de cálculo tal como Lotus 1-2-3 o Excel que ayudan a automatizar
tareas tediosas o repetitivas de cálculos matemáticos o estadísticos, a generar diagramas o gráficos, presentaciones
visuales como PowerPoint, o a crear bases de datos como Access u Oracle que ayudan a crear archivos y registros
de datos.
Los usuarios, normalmente, compran el software de aplicaciones en discos CD o DVD (antiguamente en disque-
tes) o los descargan (bajan) de la Red Internet y han de instalar el software copiando los programas correspondientes
de los discos en el disco duro de la computadora. Cuando compre estos programas asegúrese de que son compatibles
con su computadora y con su sistema operativo. Existe una gran diversidad de programas de aplicación para todo
tipo de actividades tanto de modo personal, como de negocios, navegación y manipulación en Internet, gráficos y
presentaciones visuales, etc.
Los lenguajes de programación sirven para escribir programas que permitan la comunicación usuario/máqui-
na. Unos programas especiales llamados traductores (compiladores o intérpretes) convierten las instrucciones
escritas en lenguajes de programación en instrucciones escritas en lenguajes máquina (0 y 1, bits) que ésta pueda
entender.
Los programas de utilidad22
facilitan el uso de la computadora. Un buen ejemplo es un editor de textos que per-
mite la escritura y edición de documentos. Este libro ha sido escrito en un editor de textos o procesador de palabras
(“word procesor”).
Los programas que realizan tareas concretas, nóminas, contabilidad, análisis estadístico, etc., es decir, los progra-
mas que podrá escribir en C, se denominan programas de aplicación. A lo largo del libro se verán pequeños progra-
mas de aplicación que muestran los principios de una buena programación de computadora.
Se debe diferenciar entre el acto de crear un programa y la acción de la computadora cuando ejecuta las instruc-
ciones del programa. La creación de un programa se hace inicialmente en papel y a continuación se introduce en la
computadora y se convierte en lenguaje entendible por la computadora. La ejecución de un programa requiere una
aplicación de una entrada (datos) al programa y la obtención de una salida (resultados). La entrada puede tener una
variedad de formas, tales como números o caracteres alfabéticos. La salida puede también tener formas, tales como
datos numéricos o caracteres, señales para controlar equipos o robots, etc. (Figura 1.13).
Memoria externa
UCP
Programa
Sistema
operativo
Programa
Figura 1.13. Ejecución de un programa.
22
Utility: programa de utilidad o utilitería.
34 Fundamentos de programación
1.8.3. Sistema operativo
Un sistema operativo SO (Operating System, OS) es tal vez la parte más importante del software del sistema y es
el software que controla y gestiona los recursos de la computadora. En la práctica el sistema operativo es la colección
de programas de computadora que controla la interacción del usuario y el hardware de la computadora. El sistema
operativo es el administrador principal de la computadora, y por ello a veces se la compara con el director de una
orquesta ya que este software es el responsable de dirigir todas las operaciones de la computadora y gestionar todos
sus recursos.
El sistema operativo asigna recursos, planifica el uso de recursos y tareas de la computadora, y monitoriza las
actividades del sistema informático. Estos recursos incluyen memoria, dispositivos de E/S (Entrada/Salida), y la UCP
(Unidad Central de Proceso). El sistema operativo proporciona servicios tales como asignar memoria a un programa
y manipulación del control de los dispositivos de E/S tales como el monitor, el teclado o las unidades de disco. La
Tabla 1.9 muestra algunos de los sistemas operativos más populares utilizados en enseñanza y en informática profe-
sional.
Tabla 1.9. Sistemas operativos más utilizados en educación y en la empresa
Sistema operativo Características
Windows Vista Nuevo sistema operativo de Microsoft presentado a comienzos del año 2007.
Windows XP Sistema operativo más utilizado en la actualidad, tanto en el campo de la enseñanza, como en
la industria y negocios. Su fabricante es Microsoft.
Windows 98/ME/2000 Versiones anteriores de Windows pero que todavía hoy son muy utilizados.
UNIX Sistema operativo abierto, escrito en C y todavía muy utilizado en el campo profesional.
Linux Sistema operativo de software abierto, gratuito y de libre distribución, similar a UNIX, y una
gran alternativa a Windows. Muy utilizado actualmente en servidores de aplicaciones para
Internet.
Mac OS Sistema operativo de las computadoras Apple Macintosh.
DOS y OS/2 Sistemas operativos creados por Microsoft e IBM respectivamente, ya poco utilizados pero
que han sido la base de los actuales sistemas operativos.
CP/M Sistema operativo de 8 bits para las primeras microcomputadoras nacidas en la década de los
setenta.
Symbian Sistema operativo para teléfonos móviles apoyado fundamentalmente por el fabricante de
teléfonos celulares Nokia.
PalmOS Sistema operativo para agendas digitales, PDA; del fabricante Palm.
Windows Mobile, CE Sistema operativo para teléfonos móviles con arquitectura y apariencias similares a
Windows XP. Las últimas versiones son: 5.0 y 6.0.
Cuando un usuario interactúa con una computadora, la interacción está controlada por el sistema operativo. Un
usuario se comunica con un sistema operativo a través de una interfaz de usuario de ese sistema operativo. Los sis-
temas operativos modernos utilizan una interfaz gráfica de usuario, IGU (Graphical User Interface, GUI) que hace
uso masivo de iconos, botones, barras y cuadros de diálogo para realizar tareas que se controlan por el teclado o el
ratón (mouse), entre otros dispositivos.
Normalmente el sistema operativo se almacena de modo permanente en un chip de memoria de sólo lectura
(ROM), de modo que esté disponible tan pronto la computadora se pone en marcha (“se enciende” o “se prende”).
Otra parte del sistema operativo puede residir en disco, que se almacena en memoria RAM en la inicialización del
sistema por primera vez en una operación que se llama carga del sistema (booting).
El sistema operativo dirige las operaciones globales de la computadora, instruye a la computadora para ejecu-
tar otros programas y controla el almacenamiento y recuperación de archivos (programas y datos) de cintas y
discos. Gracias al sistema operativo es posible que el programador pueda introducir y grabar nuevos programas,
así como instruir a la computadora para que los ejecute. Los sistemas operativos pueden ser: monousuarios (un
solo usuario) y multiusuarios, o tiempo compartido (diferentes usuarios), atendiendo al número de usuarios y mo-
nocarga (una sola tarea) o multitarea (múltiples tareas) según las tareas (procesos) que puede realizar simultánea-
mente.
Introducción a las computadoras y los lenguajes de programación 35
Windows Vista
El 30 de enero de 2007, Microsoft presentó a nivel mundial su nuevo sistema operativo Windows Vista. Esta nueva
versión en la que Microsoft llevaba trabajando desde hacía cinco años, en que presentó su hasta ahora, última versión,
Windows XP, es un avance significativo en la nueva generación de sistemas operativos que se utilizarán en la próxi-
ma década.
Windows Vista contiene numerosas características nuevas y muchas otras actualizadas, algunas de las cuales son:
una interfaz gráfica de usuario muy amigable, herramientas de creación de multimedia, potentes herramientas de
comunicación entre computadoras, etc. También ha incluido programas que hasta el momento de su lanzamiento se
comercializaban independientemente tales como programas de reproducción de música, vídeo, accesos a Internet, etc.
Es de destacar que Vista ha mejorado notablemente la seguridad en el sistema operativo, ya que Windows XP y sus
predecesores han sido muy vulnerables a virus, malware, y otros ataques a la seguridad del sistema y del usuario.
Existen cinco versiones comerciales: Home Basic, Home Premium, Business, Ultimate y Enterprise. Los requi-
sitos que debe tener su computadora dependerá de la versión elegida y variará desde la más básica, recomendada para
usuarios domésticos (512 MB de RAM mínima, procesador de 32 bits (x86) o de 64 bits (x64) a 1 GHz, 15 GB de
espacio disponible en el disco duro, etc.) a Ultimate que incorpora todas las funcionalidades y ventajas contenidas
en las demás versiones (ya se requiere al menos 1 GB de memoria, mayor capacidad de disco duro, etc.). A nivel de
empresas y grandes corporaciones se recomienda Enterprise, diseñada para reducir los riesgos de seguridad y los
enormes costes de este tipo de infraestructuras.
Tipos de sistemas operativos
Las diferentes características especializadas del sistema operativo permiten a las computadoras manejar muchas tareas
diferentes, así como múltiples usuarios de modo simultáneo o en paralelo, bien de modo secuencial. En función de
sus características específicas los sistemas operativos se pueden clasificar en varios grupos.
1.8.3.1. Multiprogramación/Multitarea
La multiprogramación permite a múltiples programas compartir recursos de un sistema de computadora en cualquier
momento a través del uso concurrente una UCP. Sólo un programa utiliza realmente la UCP en cualquier momento
dado, sin embargo las necesidades de entrada/salida pueden ser atendidas en el mismo momento. Dos o más progra-
mas están activos al mismo tiempo, pero no utilizan los recursos de la computadora simultáneamente. Con multipro-
gramación, un grupo de programas se ejecutan alternativamente y se alternan en el uso del procesador. Cuando se
utiliza un sistema operativo de un único usuario, la multiprogramación toma el nombre de multitarea.
Multiprogramación
Método de ejecución de dos o más programas concurrentemente utilizando la misma computadora. La UCP eje-
cuta sólo un programa pero puede atender los servicios de entrada/salida de los otros al mismo tiempo.
1.8.3.2. Tiempo compartido (múltiples usuarios, time sharing)
Un sistema operativo multiusuario es un sistema operativo que tiene la capacidad de permitir que muchos usuarios
compartan simultáneamente los recursos de proceso de la computadora. Centenas o millares de usuarios se pueden
conectar a la computadora que asigna un tiempo de computador a cada usuario, de modo que a medida que se libera
la tarea de un usuario, se realiza la tarea del siguiente, y así sucesivamente. Dada la alta velocidad de transferencia
de las operaciones, la sensación es de que todos los usuarios están conectados simultáneamente a la UCP con cada
usuario recibiendo únicamente un tiempo de máquina.
1.8.3.3. Multiproceso
Un sistema operativo trabaja en multiproceso cuando puede enlazar dos o más UCP para trabajar en paralelo en un
único sistema de computadora. El sistema operativo puede asignar múltiples UCP para ejecutar diferentes instrucciones
del mismo programa o de programas diferentes simultáneamente, dividiendo el trabajo entre las diferentes UCP.
36 Fundamentos de programación
La multiprogramación utiliza proceso concurrente con una UCP; el multiproceso utiliza proceso simultáneo con
múltiples UCP.
1.9. LENGUAJES DE PROGRAMACIÓN
Como se ha visto en el apartado anterior, para que un procesador realice un proceso se le debe suministrar en primer
lugar un algoritmo adecuado. El procesador debe ser capaz de interpretar el algoritmo, lo que significa:
• comprender las instrucciones de cada paso,
• realizar las operaciones correspondientes.
Cuando el procesador es una computadora, el algoritmo se ha de expresar en un formato que se denomina pro-
grama, ya que el pseudocódigo o el diagrama de flujo no son comprensibles por la computadora, aunque pueda en-
tenderlos cualquier programador. Un programa se escribe en un lenguaje de programación y las operaciones que
conducen a expresar un algoritmo en forma de programa se llaman programación. Así pues, los lenguajes utilizados
para escribir programas de computadoras son los lenguajes de programación y programadores son los escritores y
diseñadores de programas. El proceso de traducir un algoritmo en pseudocódigo a un lenguaje de programación se
denomina codificación, y el algoritmo escrito en un lenguaje de programación se denomina código fuente.
En la realidad la computadora no entiende directamente los lenguajes de programación sino que se requiere un
programa que traduzca el código fuente a otro lenguaje que sí entiende la máquina directamente, pero muy comple-
jo para las personas; este lenguaje se conoce como lenguaje máquina y el código correspondiente código máquina.
Los programas que traducen el código fuente escrito en un lenguaje de programación —tal como C++— a código
máquina se denominan traductores. El proceso de conversión de un algoritmo escrito en pseudocódigo hasta un
programa ejecutable comprensible por la máquina, se muestra en la Figura 1.14.
Algoritmo en
pseudocódigo
(o diagrama
de flujo)
Algoritmo
en C++
Código fuente
en C++
Código máquina
(programa
ejecutable)
Problema
Escritura
en C++
Resultado
Traducción
y ejecución
(traductor/
compilador)
Edición
(editory EID)
Figura 1.14. Proceso de transformación de un algoritmo en pseudocódigo en un programa ejecutable.
Hoy en día, la mayoría de los programadores emplean lenguajes de programación como C++, C, C#, Java, Visual
Basic, XML, HTML, Perl, PHP, JavaScript..., aunque todavía se utilizan, sobre todo profesionalmente, los clásicos
COBOL, FORTRAN, Pascal o el mítico BASIC. Estos lenguajes se denominan lenguajes de alto nivel y permiten a
los profesionales resolver problemas convirtiendo sus algoritmos en programas escritos en alguno de estos lenguajes
de programación.
Los lenguajes de programación se utilizan para escribir programas. Los programas de las computadoras mo-
dernas constan de secuencias de instrucciones que se codifican como secuencias de dígitos numéricos que podrán
entender dichas computadoras. El sistema de codificación se conoce como lenguaje máquina que es el lenguaje
nativo de una computadora. Desgraciadamente la escritura de programas en lenguaje máquina es una tarea tediosa
y difícil ya que sus instrucciones son secuencias de 0 y 1 (patrones de bit, tales como 11110000, 01110011...) que
son muy difíciles de recordar y manipular por las personas. En consecuencia, se necesitan lenguajes de progra-
mación “amigables con el programador” que permitan escribir los programas para poder “charlar” con facilidad
Introducción a las computadoras y los lenguajes de programación 37
con las computadoras. Sin embargo, las computadoras sólo entienden las instrucciones en lenguaje máquina, por
lo que será preciso traducir los programas resultantes a lenguajes de máquina antes de que puedan ser ejecutadas
por ellas.
Cada lenguaje de programación tiene un conjunto o “juego” de instrucciones (acciones u operaciones que debe
realizar la máquina) que la computadora podrá entender directamente en su código máquina o bien se traducirán a
dicho código máquina. Las instrucciones básicas y comunes en casi todos los lenguajes de programación son:
• Instrucciones de entrada/salida. Instrucciones de transferencia de información entre dispositivos periféricos y
la memoria central, tales como "leer de..." o bien "escribir en...".
• Instrucciones de cálculo. Instrucciones para que la computadora pueda realizar operaciones aritméticas.
• Instrucciones de control. Instrucciones que modifican la secuencia de la ejecución del programa.
Además de estas instrucciones y dependiendo del procesador y del lenguaje de programación existirán otras que
conformarán el conjunto de instrucciones y junto con las reglas de sintaxis permitirán escribir los programas de las
computadoras. Los principales tipos de lenguajes de programación son:
• Lenguajes máquina.
• Lenguajes de bajo nivel (ensambladores).
• Lenguajes de alto nivel.
Figura 1.15. Diferentes sistemas operativos: Windows Vista (izquierda) y Red Hat Enterprise Linux 4.
1.9.1. Traductores de lenguaje: el proceso de traducción de un programa
El proceso de traducción de un programa fuente escrito en un lenguaje de alto nivel a un lenguaje máquina compren-
sible por la computadora, se realiza mediante programas llamados “traductores”. Los traductores de lenguaje son
programas que traducen a su vez los programas fuente escritos en lenguajes de alto nivel a código máquina. Los
traductores se dividen en compiladores e intérpretes.
Intérpretes
Un intérprete es un traductor que toma un programa fuente, lo traduce y, a continuación, lo ejecuta. Los programas
intérpretes clásicos como BASIC, prácticamente ya no se utilizan, más que en circunstancias especiales. Sin embar-
go, está muy extendida la versión interpretada del lenguaje Smalltalk, un lenguaje orientado a objetos puro. El siste-
ma de traducción consiste en: traducir la primera sentencia del programa a lenguaje máquina, se detiene la traducción,
se ejecuta la sentencia; a continuación, se traduce la siguiente sentencia, se detiene la traducción, se ejecuta la sen-
tencia y así sucesivamente hasta terminar el programa (Figura 1.16).
38 Fundamentos de programación
Compiladores
Un compilador es un programa que traduce los programas fuente escritos en lenguaje de alto nivel a lenguaje má-
quina. La traducción del programa completo se realiza en una sola operación denominada compilación del programa;
es decir, se traducen todas las instrucciones del programa en un solo bloque. El programa compilado y depurado
(eliminados los errores del código fuente) se denomina programa ejecutable porque ya se puede ejecutar directamen-
te y cuantas veces se desee; sólo deberá volver a compilarse de nuevo en el caso de que se modifique alguna instruc-
ción del programa. De este modo el programa ejecutable no necesita del compilador para su ejecución. Los traduc-
tores de lenguajes típicos más utilizados son: C, C++, Java, C#, Pascal, FORTRAN y COBOL (Figura 1.17).
1.9.2. La compilación y sus fases
La compilación es el proceso de traducción de programas fuente a programas objeto. El programa objeto obtenido
de la compilación ha sido traducido normalmente a código máquina.
Para conseguir el programa máquina real se debe utilizar un programa llamado montador o enlazador (linker).
El proceso de montaje conduce a un programa en lenguaje máquina directamente ejecutable (Figura 1.18).
Compilador
(traductor)
Programa ejecutable
(en lenguaje máquina)
Enlazador (linker)
Programa objeto
Programa fuente
Figura 1.18. Fases de la compilación.
El proceso de ejecución de un programa escrito en un lenguaje de programación y mediante un compilador sue-
le tener los siguientes pasos:
1. Escritura del programa fuente con un editor (programa que permite a una computadora actuar de modo simi-
lar a una máquina de escribir electrónica) y guardarlo en un dispositivo de almacenamiento (por ejemplo, un
disco).
2. Introducir el programa fuente en memoria.
Programa fuente
Compilador
Programa objeto
Figura 1.17. La compilación de programas.
Programa fuente
Traducción y ejecución
línea a línea
Intérprete
Figura 1.16. Intérprete.
Introducción a las computadoras y los lenguajes de programación 39
3. Compilar el programa con el compilador seleccionado.
4. Verificar y corregir errores de compilación (listado de errores).
5. Obtención del programa objeto.
6. El enlazador (linker) obtiene el programa ejecutable.
7. Se ejecuta el programa y, si no existen errores, se tendrá la salida del programa.
El proceso de ejecución se muestra en las Figuras 1.19 y 1.20.
1.9.3. Evolución de los lenguajes de programación
En la década de los cuarenta cuando nacían las primeras computadoras digitales el lenguaje que se utilizaba para
programar era el lenguaje máquina que traducía directamente el código máquina (código binario) comprensible para
las computadoras. Las instrucciones en lenguaje máquina dependían de cada computadora y debido a la dificultad de
su escritura, los investigadores de la época simplificaron el proceso de programación desarrollando sistemas de no-
tación en los cuales las instrucciones se representaban en formatos nemónicos (nemotécnicos) en vez de en formatos
numéricos que eran más difíciles de recordar. Por ejemplo, mientras la instrucción
Mover el contenido del registro 4 al registro 8
se podía expresar en lenguaje máquina como
4048 o bien 0010 0000 0010 1000
en código nemotécnico podía aparecer como
MOV R5, R6
Para convertir los programas escritos en código nemotécnico a lenguaje máquina, se desarrollaron programas
ensambladores (assemblers). Es decir, los ensambladores son programas que traducen otros programas escritos en
código nemotécnico en instrucciones numéricas en lenguaje máquina que son compatibles y legibles por la máquina.
Estos programas de traducción se llaman ensambladores porque su tarea es ensamblar las instrucciones reales de la
Programa fuente
Compilador
Existen
errores en la
compilación
no
Montador
Modificación
programa
Programa
Programa ejecutable
Ejecución
Figura 1.20. Fases de ejecución de un programa.
Datos
programa
ejecutable
Computadora
Programa
Resultados
Figura 1.19. Ejecución de un programa.
40 Fundamentos de programación
máquina con los nemotécnicos e identificadores que representan las instrucciones escritas en ensamblador. A estos
lenguajes se les denominó de segunda generación, reservando el nombre de primera generación para los lenguajes de
máquina.
En la década de los cincuenta y sesenta comenzaron a desarrollarse lenguajes de programación de tercera ge-
neración que diferían de las generaciones anteriores en que sus instrucciones o primitivas eran de alto nivel (com-
prensibles por el programador, como si fueran lenguajes naturales) e independientes de la máquina. Estos lengua-
jes se llamaron lenguajes de alto nivel. Los ejemplos más conocidos son FORTRAN (FORmula TRANslator) que
fue desarrollado para aplicaciones científicas y de ingeniería, y COBOL (COmmon Business-Oriented Language),
que fue desarrollado por la U.S. Navy de Estados Unidos, para aplicaciones de gestión o administración. Con el
paso de los años aparecieron nuevos lenguajes tales como Pascal, BASIC, C, C++, Ada, Java, C#, HTML,
XML...
Los lenguajes de programación de alto nivel se componen de un conjunto de instrucciones o primitivas más fá-
ciles de escribir y recordar su función que los lenguajes máquina y ensamblador. Sin embargo, los programas escri-
tos en un lenguaje de alto nivel, como C o Java necesitan ser traducidos a código máquina; para ello se requiere un
programa denominado traductor. Estos programas de traducción se denominaron técnicamente, compiladores. De
este modo existen compiladores de C, FORTRAN, Pascal, Java, etc.
También surgió una alternativa a los traductores compiladores como medio de implementación de lenguajes de
tercera generación que se denominaron intérpretes23
. Estos programas eran similares a los traductores excepto que
ellos ejecutaban las instrucciones a medida que se traducían, en lugar de guardar la versión completa traducida para
su uso posterior. Es decir, en vez de producir una copia de un programa en lenguaje máquina que se ejecuta más
tarde (este es el caso de la mayoría de los lenguajes, C, C++, Pascal, Java...), un intérprete ejecuta realmente un pro-
grama desde su formato de alto nivel, instrucción a instrucción. Cada tipo de traductor tiene sus ventajas e inconve-
nientes, aunque hoy día prácticamente los traductores utilizados son casi todos compiladores por su mayor eficiencia
y rendimiento.
Sin embargo, en el aprendizaje de programación se suele comenzar también con el uso de los lenguajes algorít-
micos, similares a los lenguajes naturales, mediante instrucciones escritas en pseudocódigo (o seudocógido) que son
palabras o abreviaturas de palabras escritas en inglés, español, portugués, etc. Posteriormente se realiza la conversión
al lenguaje de alto nivel que se vaya a utilizar realmente en la computadora, tal como C, C++ o Java. Esta técnica
facilita la escritura de algoritmos como paso previo a la programación.
1.9.4. Paradigmas de programación
La evolución de los lenguajes de programación ha ido paralela a la idea de paradigma de programación: enfoques
alternativos a los procesos de programación. En realidad un paradigma de programación representa fundamental-
mente enfoques diferentes para la construcción de soluciones a problemas y por consiguiente afectan al proceso
completo de desarrollo de software. Los paradigmas de programación clásicos son: procedimental (o imperativo),
funcional, declarativo y orientado a objetos. En la Figura 1.21 se muestra la evolución de los paradigmas de progra-
mación y los lenguajes asociados a cada paradigma [BROOKSHEAR 04]24
.
Lenguajes imperativos (procedimentales)
El paradigma imperativo o procedimental representa el enfoque o método tradicional de programación. Un len-
guaje imperativo es un conjunto de instrucciones que se ejecutan una por una, de principio a fin, de modo secuencial
excepto cuando intervienen instrucciones de salto de secuencia o control. Este paradigma define el proceso de pro-
gramación como el desarrollo de una secuencia de órdenes (comandos) que manipulan los datos para producir los
resultados deseados. Por consiguiente, el paradigma imperativo señala un enfoque del proceso de programación me-
diante la realización de un algoritmo que resuelve de modo manual el problema y a continuación expresa ese algo-
ritmo como una secuencia de órdenes. En un lenguaje procedimental cada instrucción es una orden u órdenes para
que la computadora realice alguna tarea específica.
23
Uno de los intérpretes más populares en las décadas de los setenta y ochenta, fue BASIC.
24
J. Glenn Brookshear, Computer Science: An overview, Eigth edition, Boston (EE.UU.): Pearson/Addison Wesley, 2005, p. 230. Obra clá-
sica y excelente para la introducción a la informática y a las ciencias de la computación en todos sus campos fundamentales. Esta obra se reco-
mienda a todos los lectores que deseen profundizar en los diferentes temas tratados en este capítulo y ayudará considerablemente al lector como
libro de consulta en su aprendizaje en programación.
Introducción a las computadoras y los lenguajes de programación 41
Los lenguajes de programación procedimentales, por excelencia, son FORTRAN, COBOL, Pascal, BASIC,
ALGOL, C y Ada (aunque sus últimas versiones ya tienen un carácter completamente orientado a objetos).
Lenguajes declarativos
En contraste con el paradigma imperativo el paradigma declarativo solicita al programador que describa el proble-
ma en lugar de encontrar una solución algorítmica al problema; es decir, un lenguaje declarativo utiliza el principio
del razonamiento lógico para responder a las preguntas o cuestiones consultadas. Se basa en la lógica formal y en el
cálculo de predicados de primer orden. El razonamiento lógico se basa en la deducción. El lenguaje declarativo por
excelencia es Prolog.
Figura 1.21. Paradigmas de programación (evolución de lenguajes).
Lenguajes orientados a objetos
El paradigma orientado a objetos se asocia con el proceso de programación llamado programación orientada a
objetos (POO)25
consistente en un enfoque totalmente distinto al proceso procedimental. El enfoque orientado a
objetos guarda analogía con la vida real. El desarrollo de software OO se basa en el diseño y construcción de objetos
que se componen a su vez de datos y operaciones que manipulan esos datos. El programador define en primer lugar
los objetos del problema y a continuación los datos y operaciones que actuarán sobre esos datos. Las ventajas de la
programación orientada a objetos se derivan esencialmente de la estructura modular existente en la vida real y el
modo de respuesta de estos módulos u objetos a mensajes o eventos que se producen en cualquier instante.
Los orígenes de la POO se remontan a los Tipos Abstractos de Datos como parte constitutiva de una estructura
de datos. En este libro se dedicará un capítulo completo al estudio del TAD como origen del concepto de programa-
ción denominado objeto.
C++ lenguaje orientado a objetos, por excelencia, es una extensión del lenguaje C y contiene las tres propiedades
más importantes: encapsulamiento, herencia y polimorfismo. Smalltalk es otro lenguaje orientado a objetos muy
potente y de gran impacto en el desarrollo del software orientado a objetos que se ha realizado en las últimas dé-
cadas.
Hoy día Java y C# son herederos directos de C++ y C, y constituyen los lenguajes orientados a objetos más uti-
lizados en la industria del software del siglo XXI. Visual Basic y VB.Net son otros lenguajes orientados a objetos,
no tan potentes como los anteriores pero extremadamente sencillos y fáciles de aprender.
25
Si desea profundizar en este tipo de programación existen numerosos y excelentes libros que puede consultar en la Bibliografía.
42 Fundamentos de programación
1.10. BREVE HISTORIA DE LOS LENGUAJES DE PROGRAMACIÓN
La historia de la computación ha estado asociada indisolublemente a la aparición y a la historia de lenguajes de pro-
gramación de computadoras26
. La Biblia de los lenguajes ha sido una constante en el desarrollo de la industria del
software y en los avances científicos y tecnológicos. Desde el año 1642 en que Blaise Pascal, inventó La Pascalina,
una máquina que ayudaba a contar mediante unos dispositivos de ruedas, se han sucedido numerosos inventos que
han ido evolucionando, a medida que se programaban mediante códigos de máquina, lenguajes ensambladores, has-
ta llegar a los lenguajes de programación de alto nivel en los que ya no se dependía del hardware de la máquina sino
de la capacidad de abstracción del programador y de la sintaxis, semántica y potencia del lenguaje.
En la década de los cincuenta, IBM diseñó el primer lenguaje de programación comercial de alto nivel y conce-
bido para resolver problemas científicos y de ingeniería (FORTRAN, 1954). Todavía hoy, muchos científicos e inge-
nieros siguen utilizando FORTRAN en sus versiones más recientes FORTRAN 77 y FORTRAN 90. En 1959, la
doctora y almirante, Grace Hopper, lideró el equipo que desarrolló COBOL, el lenguaje por excelencia del mundo
de la gestión y de los negocios hasta hace muy poco tiempo; aunque todavía el mercado sigue demandando progra-
madores de COBOL ya que numerosas aplicaciones comerciales siguen corriendo en este lenguaje.
Una enumeración rápida de lenguajes de programación que han sido o son populares y los años en que aparecie-
ron es la siguiente:
Década 50 Década 60 Década 70 Década 80 Década 90 Década 00
FORTRAN (1954)
ALGOL 58 (1958)
LISP (1958)
COBOL (1959)
BASIC (1964)
LOGO (1968)
Simula 67 (1967)
Smalltalk (1969)
Pascal (1970)
C (1971)
Modula 2 (1975)
Ada (1979)
C++ (1983)
Eiffel (1986)
Perl (1987)
Java (1997) C# (2000)
Programación de la Web
Si después o en paralelo de su proceso de aprendizaje en fundamentos y metodología de la programación desea prac-
ticar no sólo con un lenguaje tradicional como Pascal, C, C++, Java o C#, sino introducirse en lenguajes de progra-
mación para la Web, enumeramos a continuación los más empleados en este campo.
Los programadores pueden utilizar una amplia variedad de lenguajes de programación, incluyendo C y C++ para
escribir aplicaciones Web. Sin embargo, algunas herramientas de programación son, particularmente, útiles para de-
sarrollar aplicaciones Web:
• HTML, técnicamente es un lenguaje de descripción de páginas más que un lenguaje de programación. Es el
elemento clave para la programación en la Web.
• JavaScript, es un lenguaje interpretado de guionado (scripting) que facilita a los diseñadores de páginas Web
añadir guiones a páginas Web y modos para enlazar esas páginas.
• VBScript, la respuesta de Microsoft a JavaScript basada en VisualBasic.
• Java, lenguaje de programación, por excelencia, de la Web.
• ActiveX, lenguaje de Microsoft para simular a algunas de las características de Java.
• C#, el verdadero competidor de Java y creado por Microsoft.
• Perl, lenguaje interpretado de guionado (scripting) idóneo para escritura de texto.
• XML, lenguaje de marcación que resuelve todas las limitaciones de HTML y ha sido el creador de una nueva
forma de programar la Web. Es el otro gran lenguaje de la Web.
• AJAX, es el futuro de la Web. Es una mezcla de JavaScript y XML. Es la espina dorsal de la nueva generación
Web 2.0.
26
Si desea una breve historia pero más detallada de los lenguajes de programación más utilizados por los programadores profesionales tanto
para aprendizaje como para el desarrollo profesional puede consultarlo en la página web del libro: www.mhe.es/joyanes.
En el sitio Web de la editorial O’Reilly puede descargarse un póster (en PDF) con una magnífica y fiable Historia de los Lenguajes de Pro-
gramación: www.oreilly.com/news/graphics/prog_lang_poster.pdf
Introducción a las computadoras y los lenguajes de programación 43
Una computadora es una máquina para procesar informa-
ción y obtener resultados en función de unos datos de en-
trada.
Hardware: parte física de una computadora (dispositi-
vos electrónicos).
Software: parte lógica de una computadora (pro-
gramas).
Las computadoras se componen de:
• Dispositivos de Entrada/Salida (E/S).
• Unidad Central de Proceso (Unidad de Control y Uni-
dad Lógica y Aritmética).
• Memoria central.
• Dispositivos de almacenamiento masivo de informa-
ción (memoria auxiliar o externa).
El software del sistema comprende, entre otros, el siste-
ma operativo Windows, Linux, en computadoras personales
y los lenguajes de programación. Los lenguajes de progra-
mación de alto nivel están diseñados para hacer más fácil la
escritura de programas que los lenguajes de bajo nivel. Exis-
ten numerosos lenguajes de programación cada uno de los
cuales tiene sus propias características y funcionalidades, y
normalmente son más fáciles de transportar a máquinas di-
ferentes que los escritos en lenguajes de bajo nivel.
Los programas escritos en lenguaje de alto nivel deben
ser traducidos por un compilador antes de que se puedan
ejecutar en una máquina específica. En la mayoría de los
lenguajes de programación se require un compilador para
cada máquina en la que se desea ejecutar programas escritos
en un lenguaje específico...
Los lenguajes de programación se clasifican en:
• Alto nivel: Pascal, FORTRAN, Visual Basic, C, Ada,
Modula-2, C++, Java, Delphi, C#, etc.
• Bajo nivel: Ensamblador.
• Máquina: Código máquina.
• Diseño de Web: SMGL, HTML, XML, PHP...
Los programas traductores de lenguajes son:
• Compiladores.
• Intérpretes.
RESUMEN
Fundamentos_de_programacion_Algoritmos_e.pdf
CAPÍTULO 2
Metodología de la programación
y desarrollo de software
2.1. Fases en la resolución de problemas
2.2. Programación modular
2.3. Programación estructurada
2.4. Programación orientada a objetos
2.5. Concepto y características de algoritmos
2.6. Escritura de algoritmos
2.7. Representación gráfica de los algoritmos
RESUMEN
EJERCICIOS
Este capítulo le introduce a la metodología que hay
que seguir para la resolución de problemas con compu-
tadoras.
La resolución de un problema con una computa-
dora se hace escribiendo un programa, que exige al
menos los siguientes pasos:
1. Definición o análisis del problema.
2. Diseño del algoritmo.
3. Transformación del algoritmo en un programa.
4. Ejecución y validación del programa.
Uno de los objetivos fundamentales de este libro
es el aprendizaje y diseño de los algoritmos. Este ca-
pítulo introduce al lector en el concepto de algoritmo
y de programa, así como las herramientas que permi-
ten “dialogar” al usuario con la máquina: los lengua-
jes de programación.
INTRODUCCIÓN
46 Fundamentos de programación
2.1. FASES EN LA RESOLUCIÓN DE PROBLEMAS
El proceso de resolución de un problema con una computadora conduce a la escritura de un programa y a su ejecu-
ción en la misma. Aunque el proceso de diseñar programas es, esencialmente, un proceso creativo, se puede consi-
derar una serie de fases o pasos comunes, que generalmente deben seguir todos los programadores.
Las fases de resolución de un problema con computadora son:
• Análisis del problema.
• Diseño del algoritmo.
• Codificación.
• Compilación y ejecución.
• Verificación.
• Depuración.
• Mantenimiento.
• Documentación.
Las características más sobresalientes de la resolución de problemas son:
• Análisis. El problema se analiza teniendo presente la especificación de los requisitos dados por el cliente de la
empresa o por la persona que encarga el programa.
• Diseño. Una vez analizado el problema, se diseña una solución que conducirá a un algoritmo que resuelva el
problema.
• Codificación (implementación). La solución se escribe en la sintaxis del lenguaje de alto nivel (por ejemplo,
Pascal) y se obtiene un programa fuente que se compila a continuación.
• Ejecución, verificación y depuración. El programa se ejecuta, se comprueba rigurosamente y se eliminan todos
los errores (denominados “bugs”, en inglés) que puedan aparecer.
• Mantenimiento. El programa se actualiza y modifica, cada vez que sea necesario, de modo que se cumplan
todas las necesidades de cambio de sus usuarios.
• Documentación. Escritura de las diferentes fases del ciclo de vida del software, esencialmente el análisis, dise-
ño y codificación, unidos a manuales de usuario y de referencia, así como normas para el mantenimiento.
Las dos primeras fases conducen a un diseño detallado escrito en forma de algoritmo. Durante la tercera fase
(codificación) se implementa1
el algoritmo en un código escrito en un lenguaje de programación, reflejando las ideas
desarrolladas en las fases de análisis y diseño.
Las fases de compilación y ejecución traducen y ejecutan el programa. En las fases de verificación y depuración
el programador busca errores de las etapas anteriores y los elimina. Comprobará que mientras más tiempo se gaste
en la fase de análisis y diseño, menos se gastará en la depuración del programa. Por último, se debe realizar la do-
cumentación del programa.
Antes de conocer las tareas a realizar en cada fase, se considera el concepto y significado de la palabra algoritmo.
La palabra algoritmo se deriva de la traducción al latín de la palabra Alkhô-warîzmi2
, nombre de un matemático y
astrónomo árabe que escribió un tratado sobre manipulación de números y ecuaciones en el siglo IX. Un algoritmo
es un método para resolver un problema mediante una serie de pasos precisos, definidos y finitos.
Características de un algoritmo
• preciso (indica el orden de realización en cada paso),
• definido (si se sigue dos veces, obtiene el mismo resultado cada vez),
• finito (tiene fin; un número determinado de pasos).
1
En la última edición (21.ª) del DRAE (Diccionario de la Real Academia Española) se ha aceptado el término implementar: (Informática)
“Poner en funcionamiento, aplicar métodos, medidas, etc. para llevar algo a cabo”.
2
Escribió un tratado matemático famoso sobre manipulación de números y ecuaciones titulado Kitab al-jabr w’almugabala. La palabra ál-
gebra se derivó, por su semejanza sonora, de al-jabr.
Metodología de la programación y desarrollo de software 47
Un algoritmo debe producir un resultado en un tiempo finito. Los métodos que utilizan algoritmos se denominan
métodos algorítmicos, en oposición a los métodos que implican algún juicio o interpretación que se denominan mé-
todos heurísticos. Los métodos algorítmicos se pueden implementar en computadoras; sin embargo, los procesos
heurísticos no han sido convertidos fácilmente en las computadoras. En los últimos años las técnicas de inteligencia
artificial han hecho posible la implementación del proceso heurístico en computadoras.
Ejemplos de algoritmos son: instrucciones para montar en una bicicleta, hacer una receta de cocina, obtener el
máximo común divisor de dos números, etc. Los algoritmos se pueden expresar por fórmulas, diagramas de flujo o
N-S y pseudocódigos. Esta última representación es la más utilizada para su uso con lenguajes estructurados como
Pascal.
2.1.1. Análisis del problema
La primera fase de la resolución de un problema con computadora es el análisis del problema. Esta fase requiere una
clara definición, donde se contemple exactamente lo que debe hacer el programa y el resultado o solución deseada.
Dado que se busca una solución por computadora, se precisan especificaciones detalladas de entrada y salida. La
Figura 2.1 muestra los requisitos que se deben definir en el análisis.
Análisis
del
problema
Resolución
de un
problema
Diseño
del
algoritmo
Resolución del
problema con
computadora
Figura 2.1. Análisis del problema.
Para poder identificar y definir bien un problema es conveniente responder a las siguientes preguntas:
• ¿Qué entradas se requieren? (tipo de datos con los cuales se trabaja y cantidad).
• ¿Cuál es la salida deseada? (tipo de datos de los resultados y cantidad).
• ¿Qué método produce la salida deseada?
• Requisitos o requerimientos adicionales y restricciones a la solución.
PROBLEMA 2.1
Se desea obtener una tabla con las depreciaciones acumuladas y los valores reales de cada año, de un automóvil
comprado por 20.000 euros en el año 2005, durante los seis años siguientes suponiendo un valor de recuperación o
rescate de 2.000. Realizar el análisis del problema, conociendo la fórmula de la depreciación anual constante D
para cada año de vida útil.
D =
coste – valor de recuperación
vida útil
D =
20.000 – 2.000
6
=
18.000
6
= 3.000
coste original
Entrada
{vida útil
valor de recuperación
48 Fundamentos de programación
depreciación anual por año
Salida
{depreciación acumulada en cada año
valor del automóvil en cada año
depreciación acumulada
Proceso
{cálculo de la depreciación acumulada cada año
cálculo del valor del automóvil en cada año
La tabla siguiente muestra la salida solicitada
Año Depreciación Depreciación acumulada Valor anual
1 (2006) 3.000 3.000 17.000
2 (2007) 3.000 6.000 14.000
3 (2008) 3.000 9.000 11.000
4 (2009) 3.000 12.000 8.000
5 (2010) 3.000 15.000 5.000
6 (2011) 3.000 18.000 2.000
2.1.2. Diseño del algoritmo
En la etapa de análisis del proceso de programación se determina qué hace el programa. En la etapa de diseño se de-
termina cómo hace el programa la tarea solicitada. Los métodos más eficaces para el proceso de diseño se basan en el
conocido divide y vencerás. Es decir, la resolución de un problema complejo se realiza dividiendo el problema en
subproblemas y a continuación dividiendo estos subproblemas en otros de nivel más bajo, hasta que pueda ser imple-
mentada una solución en la computadora. Este método se conoce técnicamente como diseño descendente (top-down)
o modular. El proceso de romper el problema en cada etapa y expresar cada paso en forma más detallada se denomi-
na refinamiento sucesivo.
Cada subprograma es resuelto mediante un módulo (subprograma) que tiene un solo punto de entrada y un solo
punto de salida.
Cualquier programa bien diseñado consta de un programa principal (el módulo de nivel más alto) que llama a
subprogramas (módulos de nivel más bajo) que a su vez pueden llamar a otros subprogramas. Los programas estruc-
turados de esta forma se dice que tienen un diseño modular y el método de romper el programa en módulos más
pequeños se llama programación modular. Los módulos pueden ser planeados, codificados, comprobados y depura-
dos independientemente (incluso por diferentes programadores) y a continuación combinarlos entre sí. El proceso
implica la ejecución de los siguientes pasos hasta que el programa se termina:
1. Programar un módulo.
2. Comprobar el módulo.
3. Si es necesario, depurar el módulo.
4. Combinar el módulo con los módulos anteriores.
El proceso que convierte los resultados del análisis del problema en un diseño modular con refinamientos sucesivos
que permitan una posterior traducción a un lenguaje se denomina diseño del algoritmo.
El diseño del algoritmo es independiente del lenguaje de programación en el que se vaya a codificar posterior-
mente.
2.1.3. Herramientas de programación
Las dos herramientas más utilizadas comúnmente para diseñar algoritmos son: diagramas de flujo y pseudocódigos.
Un diagrama de flujo (flowchart) es una representación gráfica de un algoritmo. Los símbolos utilizados han sido
normalizados por el Instituto Norteamericano de Normalización (ANSI), y los más frecuentemente empleados se muestran
en la Figura 2.2, junto con una plantilla utilizada para el dibujo de los diagramas de flujo (Figura 2.3). En la Figura 2.4
se representa el diagrama de flujo que resuelve el Problema 2.1.
Metodología de la programación y desarrollo de software 49
Terminal Subprograma
Entrada/
Salida
Proceso
Decisión
No
Sí
Conectores
Figura 2.2. Símbolos más utilizados en los diagramas de flujo.
Figura 2.3. Plantilla para dibujo de diagramas de flujo.
El pseudocódigo es una herramienta de programación en la que las instrucciones se escriben en palabras simila-
res al inglés o español, que facilitan tanto la escritura como la lectura de programas. En esencia, el pseudocódigo se
puede definir como un lenguaje de especificaciones de algoritmos.
Aunque no existen reglas para escritura del pseudocódigo en español, se ha recogido una notación estándar que
se utilizará en el libro y que ya es muy empleada en los libros de programación en español3
. Las palabras reserva-
das básicas se representarán en letras negritas minúsculas. Estas palabras son traducción libre de palabras reservadas
de lenguajes como C, Pascal, etc. Más adelante se indicarán los pseudocódigos fundamentales para utilizar en esta
obra.
El pseudocódigo que resuelve el Problema 2.1 es:
Previsiones de depreciacion
Introducir coste
vida util
valor final de rescate (recuperacion)
imprimir cabeceras
Establecer el valor inicial del año
Calcular depreciacion
3
Para mayor ampliación sobre el pseudocódigo, puede consultar, entre otras, algunas de estas obras: Fundamentos de programación, Luis
Joyanes, 2.ª edición, 1997; Metodología de la programación, Luis Joyanes, 1986; Problemas de Metodología de la programación, Luis Joyanes,
1991 (todas ellas publicadas en McGraw-Hill, Madrid), así como Introducción a la programación, de Clavel y Biondi. Barcelona: Masson, 1987,
o bien Introducción a la programación y a las estructuras de datos, de Braunstein y Groia. Buenos Aires: Editorial Eudeba, 1986. Para una for-
mación práctica puede consultar: Fundamentos de programación: Libro de problemas de Luis Joyanes, Luis Rodríguez y Matilde Fernández, en
McGraw-Hill (Madrid, 1998).
50 Fundamentos de programación
mientras valor año =< vida util hacer
calcular depreciacion acumulada
calcular valor actual
imprimir una linea en la tabla
incrementar el valor del año
fin de mientras
EJEMPLO 2.1
Calcular la paga neta de un trabajador conociendo el número de horas trabajadas, la tarifa horaria y la tasa de
impuestos.
Algoritmo
1. Leer Horas, Tarifa, Tasa
2. Calcular PagaBruta = Horas * Tarifa
3. Calcular Impuestos = PagaBruta * Tasa
4. Calcular PagaNeta = PagaBruta - Impuestos
5. Visualizar PagaBruta, Impuestos, PagaNeta
Valor actual ← Coste
Depreciación ← (Coste-ValorRescate)/VidaÚtil
Acumulada ← 0
Año < Vida_Útil
Leer
Coste, Vida
útil, ValorRescate
Inicio
Leer Año
Acumulada ← Acumulada + Depreciación
Valor actual ← Valor actual + Depreciación
Año ← Año + 1
Fin
No
Sí
Figura 2.4. Diagrama de flujo (Problema 2.1).
Metodología de la programación y desarrollo de software 51
EJEMPLO 2.2
Calcular el valor de la suma 1+2+3+...+100.
algoritmo
Se utiliza una variable Contador como un contador que genere los sucesivos números enteros, y Suma para alma-
cenar las sumas parciales 1, 1+2, 1+2+3…
1. Establecer Contador a 1
2. Establecer Suma a 0
3. mientras Contador <= 100 hacer
Sumar Contador a Suma
Incrementar Contador en 1
fin_mientras
4. Visualizar Suma
2.1.4. Codificación de un programa
La codificación es la escritura en un lenguaje de programación de la representación del algoritmo desarrollada en las
etapas precedentes. Dado que el diseño de un algoritmo es independiente del lenguaje de programación utilizado para
su implementación, el código puede ser escrito con igual facilidad en un lenguaje o en otro.
Para realizar la conversión del algoritmo en programa se deben sustituir las palabras reservadas en español por
sus homónimos en inglés, y las operaciones/instrucciones indicadas en lenguaje natural por el lenguaje de programa-
ción correspondiente.
{Este programa obtiene una tabla de depreciaciones
acumuladas y valores reales de cada año de un
determinado producto}
algoritmo primero
Real: Coste, Depreciacion,
Valor_Recuperacion
Valor_Actual,
Acumulado
Valor_Anual;
entero: Año, Vida_Util;
inicio
escribir('introduzca coste, valor recuperación y vida útil')
leer(Coste, Valor_Recuperacion, Vida_Util)
escribir('Introduzca año actual')
leer(Año)
Valor_Actual ← Coste;
Depreciacion ← (Coste-Valor_Recuperacion)/Vida_Util
Acumulado ← 0
escribir('Año Depreciación Dep. Acumulada')
mientras (Año < Vida_Util)
Acumulado ← Acumulado + Depreciacion
Valor_Actual ← Valor_Actual – Depreciacion
escribir('Año, Depreciacion, Acumulado')
Año ← Año + 1;
fin mientras
fin
52 Fundamentos de programación
Documentación interna
Como se verá más tarde, la documentación de un programa se clasifica en interna y externa. La documentación in-
terna es la que se incluye dentro del código del programa fuente mediante comentarios que ayudan a la comprensión
del código. Todas las líneas de programas que comiencen con un símbolo / * son comentarios. El programa no los
necesita y la computadora los ignora. Estas líneas de comentarios sólo sirven para hacer los programas más fáciles
de comprender. El objetivo del programador debe ser escribir códigos sencillos y limpios.
Debido a que las máquinas actuales soportan grandes memorias (512 Mb o 1.024 Mb de memoria central mínima
en computadoras personales) no es necesario recurrir a técnicas de ahorro de memoria, por lo que es recomendable
que se incluya el mayor número de comentarios posibles, pero eso sí, que sean significativos.
2.1.5. Compilación y ejecución de un programa
Una vez que el algoritmo se ha convertido en un programa fuente, es preciso introducirlo en memoria mediante el
teclado y almacenarlo posteriormente en un disco. Esta operación se realiza con un programa editor. Posteriormente
el programa fuente se convierte en un archivo de programa que se guarda (graba) en disco.
El programa fuente debe ser traducido a lenguaje máquina, este proceso se realiza con el compilador y el siste-
ma operativo que se encarga prácticamente de la compilación.
Si tras la compilación se presentan errores (errores de compilación) en el programa fuente, es preciso volver a
editar el programa, corregir los errores y compilar de nuevo. Este proceso se repite hasta que no se producen errores,
obteniéndose el programa objeto que todavía no es ejecutable directamente. Suponiendo que no existen errores en
el programa fuente, se debe instruir al sistema operativo para que realice la fase de montaje o enlace (link), carga,
del programa objeto con las bibliotecas del programa del compilador. El proceso de montaje produce un programa
ejecutable. La Figura 2.5 describe el proceso completo de compilación/ejecución de un programa.
Una vez que el programa ejecutable se ha creado, ya se puede ejecutar (correr o rodar) desde el sistema operati-
vo con sólo teclear su nombre (en el caso de DOS). Suponiendo que no existen errores durante la ejecución (llama-
dos errores en tiempo de ejecución), se obtendrá la salida de resultados del programa.
Las instrucciones u órdenes para compilar y ejecutar un programa en C, C++,... o cualquier otro lenguaje depen-
derá de su entorno de programación y del sistema operativo en que se ejecute Windows, Linux, Unix, etc.
2.1.6. Verificación y depuración de un programa
La verificación o compilación de un programa es el proceso de ejecución del programa con una amplia variedad de
datos de entrada, llamados datos de test o prueba, que determinarán si el programa tiene o no errores (“bugs”). Para
realizar la verificación se debe desarrollar una amplia gama de datos de test: valores normales de entrada, valores
extremos de entrada que comprueben los límites del programa y valores de entrada que comprueben aspectos espe-
ciales del programa.
La depuración es el proceso de encontrar los errores del programa y corregir o eliminar dichos errores.
Cuando se ejecuta un programa, se pueden producir tres tipos de errores:
1. Errores de compilación. Se producen normalmente por un uso incorrecto de las reglas del lenguaje de pro-
gramación y suelen ser errores de sintaxis. Si existe un error de sintaxis, la computadora no puede compren-
der la instrucción, no se obtendrá el programa objeto y el compilador imprimirá una lista de todos los errores
encontrados durante la compilación.
2. Errores de ejecución. Estos errores se producen por instrucciones que la computadora puede comprender pero
no ejecutar. Ejemplos típicos son: división por cero y raíces cuadradas de números negativos. En estos casos
se detiene la ejecución del programa y se imprime un mensaje de error.
3. Errores lógicos. Se producen en la lógica del programa y la fuente del error suele ser el diseño del algoritmo.
Estos errores son los más difíciles de detectar, ya que el programa puede funcionar y no producir errores de
compilación ni de ejecución, y sólo puede advertirse el error por la obtención de resultados incorrectos. En
este caso se debe volver a la fase de diseño del algoritmo, modificar el algoritmo, cambiar el programa fuen-
te y compilar y ejecutar una vez más.
Metodología de la programación y desarrollo de software 53
2.1.7. Documentación y mantenimiento
La documentación de un problema consta de las descripciones de los pasos a dar en el proceso de resolución de dicho
problema. La importancia de la documentación debe ser destacada por su decisiva influencia en el producto final.
Programas pobremente documentados son difíciles de leer, más difíciles de depurar y casi imposibles de mantener y
modificar.
La documentación de un programa puede ser interna y externa. La documentación interna es la contenida en
líneas de comentarios. La documentación externa incluye análisis, diagramas de flujo y/o pseudocódigos, manuales
de usuario con instrucciones para ejecutar el programa y para interpretar los resultados.
La documentación es vital cuando se desea corregir posibles errores futuros o bien cambiar el programa. Tales
cambios se denominan mantenimiento del programa. Después de cada cambio la documentación debe ser actualiza-
da para facilitar cambios posteriores. Es práctica frecuente numerar las sucesivas versiones de los programas 1.0, 1.1,
2.0, 2.1, etc. (Si los cambios introducidos son importantes, se varía el primer dígito [1.0, 2.0,...]; en caso de pequeños
cambios sólo se varía el segundo dígito [2.0, 2.1…].)
Memoria
externa
UCP
Compilador
Programa
editor
Programa
objeto
b)
a)
UCP
EIDCIDE
Editor
de textos
Teclado
Programa
editor
UCP
Enlace del
programa
c)
Programa
de carga
Memoria
externa
Memoria
externa
Programa
objeto
Figura 2.5. Fases de la compilación/ejecución de un programa:
a) edición; b) compilación; c) montaje o enlace.
54 Fundamentos de programación
2.2. PROGRAMACIÓN MODULAR
La programación modular es uno de los métodos de diseño más flexible y potente para mejorar la productividad de
un programa. En programación modular el programa se divide en módulos (partes independientes), cada uno de los
cuales ejecuta una única actividad o tarea y se codifican independientemente de otros módulos. Cada uno de estos
módulos se analiza, codifica y pone a punto por separado. Cada programa contiene un módulo denominado progra-
ma principal que controla todo lo que sucede; se transfiere el control a submódulos (posteriormente se denominarán
subprogramas), de modo que ellos puedan ejecutar sus funciones; sin embargo, cada submódulo devuelve el control
al módulo principal cuando se haya completado su tarea. Si la tarea asignada a cada submódulo es demasiado com-
pleja, éste deberá romperse en otros módulos más pequeños. El proceso sucesivo de subdivisión de módulos continúa
hasta que cada módulo tenga solamente una tarea específica que ejecutar. Esta tarea puede ser entrada, salida, ma-
nipulación de datos, control de otros módulos o alguna combinación de éstos. Un módulo puede transferir temporal-
mente (bifurcar) el control a otro módulo; sin embargo, cada módulo debe eventualmente devolver el control al
módulo del cual se recibe originalmente el control.
Los módulos son independientes en el sentido en que ningún módulo puede tener acceso directo a cualquier otro
módulo excepto el módulo al que llama y sus propios submódulos. Sin embargo, los resultados producidos por un
módulo pueden ser utilizados por cualquier otro módulo cuando se transfiera a ellos el control.
Raíz
Módulo 1 Módulo 2 Módulo 4
Módulo 41 Módulo 42
Módulo 3
Módulo 31
Módulo 21 Módulo 22
Módulo 221 Módulo 222
Módulo 11 Módulo 12
Figura 2.6. Programación modular.
Dado que los módulos son independientes, diferentes programadores pueden trabajar simultáneamente en dife-
rentes partes del mismo programa. Esto reducirá el tiempo del diseño del algoritmo y posterior codificación del pro-
grama. Además, un módulo se puede modificar radicalmente sin afectar a otros módulos, incluso sin alterar su función
principal.
La descomposición de un programa en módulos independientes más simples se conoce también como el método
de divide y vencerás (divide and conquer). Cada módulo se diseña con independencia de los demás, y siguiendo un
método ascendente o descendente se llegará hasta la descomposición final del problema en módulos en forma jerár-
quica.
2.3. PROGRAMACIÓN ESTRUCTURADA
C, Pascal, FORTRAN, y lenguajes similares, se conocen como lenguajes procedimentales (por procedimientos).
Es decir, cada sentencia o instrucción señala al compilador para que realice alguna tarea: obtener una entrada,
producir una salida, sumar tres números, dividir por cinco, etc. En resumen, un programa en un lenguaje procedi-
mental es un conjunto de instrucciones o sentencias. En el caso de pequeños programas, estos principios de orga-
nización (denominados paradigma) se demuestran eficientes. El programador sólo tiene que crear esta lista de
Metodología de la programación y desarrollo de software 55
instrucciones en un lenguaje de programación, compilar en la computadora y ésta, a su vez, ejecuta estas instruc-
ciones.
Cuando los programas se vuelven más grandes, cosa que lógicamente sucede cuando aumenta la complejidad
del problema a resolver, la lista de instrucciones aumenta considerablemente, de modo tal que el programador
tiene muchas dificultades para controlar ese gran número de instrucciones. Los programadores pueden controlar,
de modo normal, unos centenares de líneas de instrucciones. Para resolver este problema los programas se des-
compusieron en unidades más pequeñas que adoptaron el nombre de funciones (procedimientos, subprogramas o
subrutinas en otros lenguajes de programación). De este modo en un programa orientado a procedimientos se di-
vide en funciones, de modo que cada función tiene un propósito bien definido y resuelve una tarea concreta, y se
diseña una interfaz claramente definida (el prototipo o cabecera de la función) para su comunicación con otras
funciones.
Con el paso de los años, la idea de romper el programa en funciones fue evolucionando y se llegó al agrupamien-
to de las funciones en otras unidades más grandes llamadas módulos (normalmente, en el caso de C, denominadas
archivos o ficheros); sin embargo, el principio seguía siendo el mismo: agrupar componentes que ejecutan listas de
instrucciones (sentencias). Esta característica hace que a medida que los programas se hacen más grandes y comple-
jos, el paradigma estructurado comienza a dar señales de debilidad y resultando muy difícil terminar los programas
de un modo eficiente. Existen varias razones de la debilidad de los programas estructurados para resolver problemas
complejos. Tal vez las dos razones más evidentes son éstas. Primero, las funciones tienen acceso ilimitado a los da-
tos globales. Segundo, las funciones inconexas y datos, fundamentos del paradigma procedimental proporcionan un
modelo pobre del mundo real.
2.3.1. Datos locales y datos globales
En un programa procedimental, por ejemplo escrito en C, existen dos tipos de datos. Datos locales que están ocultos
en el interior de la función y son utilizados, exclusivamente, por la función. Estos datos locales están estrechamente
relacionados con sus funciones y están protegidos de modificaciones por otras funciones.
Otro tipo de datos son los datos globales a los cuales se puede acceder desde cualquier función del programa.
Es decir, dos o más funciones pueden acceder a los mismos datos siempre que estos datos sean globales. En la Fi-
gura 2.7 se muestra la disposición de variables locales y globales en un programa procedimental.
Accesible sólo por función B
Accesibles, por cualquier función
Accesible sólo por función A
Función A
Variables locales
Función B
Variables locales
Variables globales
Figura 2.7. Datos locales y globales.
Un programa grande (Figura 2.8) se compone de numerosas funciones y datos globales y ello conlleva una mul-
titud de conexiones entre funciones y datos que dificulta su comprensión y lectura.
Todas estas conexiones múltiples originan diferentes problemas. En primer lugar, hacen difícil conceptuar la es-
tructura del programa. En segundo lugar, el programa es difícil de modificar ya que cambios en datos globales pue-
den necesitar la reescritura de todas las funciones que acceden a los mismos. También puede suceder que estas mo-
dificaciones de los datos globales pueden no ser aceptadas por todas o algunas de las funciones.
56 Fundamentos de programación
2.3.2. Modelado del mundo real
Un segundo problema importante de la programación estructurada reside en el hecho de que la disposición separada
de datos y funciones no se corresponden con los modelos de las cosas del mundo real. En el mundo físico se trata
con objetos físicos tales como personas, autos o aviones. Estos objetos no son como los datos ni como las funciones.
Los objetos complejos o no del mundo real tienen atributos y comportamiento.
Los atributos o características de los objetos son, por ejemplo: en las personas, su edad, su profesión, su domi-
cilio, etc.; en un auto, la potencia, el número de matrícula, el precio, número de puertas, etc; en una casa, la super-
ficie, el precio, el año de construcción, la dirección, etc. En realidad, los atributos del mundo real tienen su equiva-
lente en los datos de un programa; tienen un valor específico, tal como 200 metros cuadrados, 20.000 dólares, cinco
puertas, etc.
El comportamiento es una acción que ejecutan los objetos del mundo real como respuesta a un determinado
estímulo. Si usted pisa los frenos en un auto, el coche (carro) se detiene; si acelera, el auto aumenta su velocidad,
etcétera. El comportamiento, en esencia, es como una función: se llama a una función para hacer algo (visualizar la
nómina de los empleados de una empresa).
Por estas razones, ni los datos ni las funciones, por sí mismas, modelan los objetos del mundo real de un modo
eficiente.
La programación estructurada mejora la claridad, fiabilidad y facilidad de mantenimiento de los programas; sin
embargo, para programas grandes o a gran escala, presentan retos de difícil solución.
2.4. PROGRAMACIÓN ORIENTADA A OBJETOS
La programación orientada a objetos, tal vez el paradigma de programación más utilizado en el mundo del desarrollo
de software y de la ingeniería de software del siglo XXI, trae un nuevo enfoque a los retos que se plantean en la pro-
gramación estructurada cuando los problemas a resolver son complejos. Al contrario que la programación procedi-
mental que enfatiza en los algoritmos, la POO enfatiza en los datos. En lugar de intentar ajustar un problema al en-
foque procedimental de un lenguaje, POO intenta ajustar el lenguaje al problema. La idea es diseñar formatos de
datos que se correspondan con las características esenciales de un problema.
La idea fundamental de los lenguajes orientados a objetos es combinar en una única unidad o módulo, tanto los
datos como las funciones que operan sobre esos datos. Tal unidad se llama un objeto.
Las funciones de un objeto se llaman funciones miembro en C++ o métodos (éste es el caso de Smalltalk, uno de
los primeros lenguajes orientados a objetos), y son el único medio para acceder a sus datos. Los datos de un objeto,
se conocen también como atributos o variables de instancia. Si se desea leer datos de un objeto, se llama a una fun-
ción miembro del objeto. Se accede a los datos y se devuelve un valor. No se puede acceder a los datos directamen-
te. Los datos están ocultos, de modo que están protegidos de alteraciones accidentales. Los datos y las funciones se
dice que están encapsulados en una única entidad. El encapsulamiento de datos y la ocultación de los datos son
términos clave en la descripción de lenguajes orientados a objetos.
Si se desea modificar los datos de un objeto, se conoce exactamente cuáles son las funciones que interactúan
con miembros del objeto. Ninguna otra función puede acceder a los datos. Esto simplifica la escritura, depuración
Función
Función Función
Función Función
Función Función
Función
Datos
globales
Datos
globales
Datos
globales
Figura 2.8. Un programa procedimental.
Metodología de la programación y desarrollo de software 57
y mantenimiento del programa. Un programa C++ se compone normalmente de un número de objetos que se co-
munican unos con otros mediante la llamada a otras funciones miembro. La organización de un programa en C++
se muestra en la Figura 2.9. La llamada a una función miembro de un objeto se denomina enviar un mensaje a otro
objeto.
Objeto
Función miembro
(método)
Función miembro
(método)
Datos
Objeto
Función miembro
(método)
Función miembro
(método)
Datos
Objeto
Función miembro
(método)
Función miembro
(método)
Datos
Figura 2.9. Organización típica de un programa orientado a objetos.
En el paradigma orientado a objetos, el programa se organiza como un conjunto finito de objetos que contiene
datos y operaciones (funciones miembro o métodos) que llaman a esos datos y que se comunican entre sí me-
diante mensajes.
2.4.1. Propiedades fundamentales de la orientación a objetos
Existen diversas características ligadas a la orientación a objetos. Todas las propiedades que se suelen considerar no
son exclusivas de este paradigma, ya que pueden existir en otros paradigmas, pero en su conjunto definen claramen-
te los lenguajes orientados a objetos. Estas propiedades son:
• Abstracción (tipos abstractos de datos y clases).
• Encapsulado de datos.
• Ocultación de datos.
• Herencia.
• Polimorfismo.
2.4.2. Abstracción
La abstracción es la propiedad de los objetos que consiste en tener en cuenta sólo los aspectos más importantes des-
de un punto de vista determinado y no tener en cuenta los restantes aspectos. El término abstracción que se suele
58 Fundamentos de programación
utilizar en programación se refiere al hecho de diferenciar entre las propiedades externas de una entidad y los detalles
de la composición interna de dicha entidad. Es la abstracción la que permite ignorar los detalles internos de un dis-
positivo complejo tal como una computadora, un automóvil, una lavadora o un horno de microondas, etc., y usarlo
como una única unidad comprensible. Mediante la abstracción se diseñan y fabrican estos sistemas complejos en
primer lugar y, posteriormente, los componentes más pequeños de los cuales están compuestos. Cada componente
representa un nivel de abstracción en el cual el uso del componente se aísla de los detalles de la composición interna
del componente. La abstracción posee diversos grados denominados niveles de abstracción.
En consecuencia, la abstracción posee diversos grados de complejidad que se denominan niveles de abstracción
que ayudan a estructurar la complejidad intrínseca que poseen los sistemas del mundo real. En el modelado orien-
tado a objetos de un sistema esto significa centrarse en qué es y qué hace un objeto y no en cómo debe implemen-
tarse. Durante el proceso de abstracción es cuando se decide qué características y comportamiento debe tener el
modelo.
Aplicando la abstracción se es capaz de construir, analizar y gestionar sistemas de computadoras complejos y
grandes que no se podrían diseñar si se tratara de modelar a un nivel detallado. En cada nivel de abstracción se vi-
sualiza el sistema en términos de componentes, denominados herramientas abstractas, cuya composición interna
se ignora. Esto nos permite concentrarnos en cómo cada componente interactúa con otros componentes y centrarnos
en la parte del sistema que es más relevante para la tarea a realizar en lugar de perderse a nivel de detalles menos
significativos.
En estructuras o registros, las propiedades individuales de los objetos se pueden almacenar en los miembros. Para
los objetos, no sólo es de interés cómo están organizados, sino también qué se puede hacer con ellos; es decir, las
operaciones que forman la interfaz de un objeto son también importantes. El primer concepto en el mundo de la
orientación a objetos nació con los tipos abstractos de datos (TAD). Un tipo abstracto de datos describe no sólo los
atributos de un objeto, sino también su comportamiento (las operaciones). Esto puede incluir también una descripción
de los estados que puede alcanzar un objeto.
Un medio de reducir la complejidad es la abstracción. Las características y los procesos se reducen a las propie-
dades esenciales, son resumidas o combinadas entre sí. De este modo, las características complejas se hacen más
manejables.
EJEMPLO 2.3
Diferentes modelos de abstracción del término coche (carro).
• Un coche (carro) es la combinación (o composición) de diferentes partes, tales como motor, carrocería,
cuatro ruedas, cinco puertas, etc.
• Un coche (carro) es un concepto común para diferentes tipos de coches. Pueden clasificarse por el nombre
del fabricante (Audi, BMW, SEAT, Toyota, Chrisler...), por su categoría (turismo, deportivo, todoterreno...), por
el carburante que utilizan (gasolina, gasoil, gas, híbrido...).
La abstracción coche se utilizará siempre que la marca, la categoría o el carburante no sean significativos. Así,
un carro (coche) se utilizará para transportar personas o ir de Carchelejo a Cazorla.
2.4.3. Encapsulación y ocultación de datos
El encapsulado o encapsulación de datos es el proceso de agrupar datos y operaciones relacionadas bajo la misma
unidad de programación. En el caso de los objetos que poseen las mismas características y comportamiento se
agrupan en clases, que no son más que unidades o módulos de programación que encapsulan datos y opera-
ciones.
La ocultación de datos permite separar el aspecto de un componente, definido por su interfaz con el exterior, de
sus detalles internos de implementación. Los términos ocultación de la información (information hiding) y encapsu-
lación de datos (data encapsulation) se suelen utilizar como sinónimos, pero no siempre es así, y muy al contrario,
son términos similares pero distintos. Normalmente, los datos internos están protegidos del exterior y no se puede
acceder a ellos más que desde su propio interior y por tanto, no están ocultos. El acceso al objeto está restringido
sólo a través de una interfaz bien definida.
Metodología de la programación y desarrollo de software 59
El diseño de un programa orientado a objetos contiene, al menos, los siguientes pasos:
1. Identificar los objetos del sistema.
2. Agrupar en clases a todos objetos que tengan características y comportamiento comunes.
3. Identificar los datos y operaciones de cada una de las clases.
4. Identificar las relaciones que pueden existir entre las clases.
Un objeto es un elemento individual con su propia identidad; por ejemplo, un libro, un automóvil... Una clase
puede describir las propiedades genéricas de un ejecutivo de una empresa (nombre, título, salario, cargo...) mientras
que un objeto representará a un ejecutivo específico (Luis Mackoy, director general). En general, una clase define
qué datos se utilizan para representar un objeto y las operaciones que se pueden ejecutar sobre esos datos.
Cada clase tiene sus propias características y comportamiento; en general, una clase define los datos que se uti-
lizan y las operaciones que se pueden ejecutar sobre esos datos. Una clase describe un objeto. En el sentido estricto
de programación, una clase es un tipo de datos. Diferentes variables se pueden crear de este tipo. En programación
orientada a objetos, éstas se llaman instancias. Las instancias son, por consiguiente, la realización de los objetos
descritos en una clase. Estas instancias constan de datos o atributos descritos en la clase y se pueden manipular con
las operaciones definidas dentro de ellas.
Los términos objeto e instancia se utilizan frecuentemente como sinónimos (especialmente en C++). Si una va-
riable de tipo Carro se declara, se crea un objeto Carro (una instancia de la clase Carro).
Las operaciones definidas en los objetos se llaman métodos. Cada operación llamada por un objeto se interpreta
como un mensaje al objeto, que utiliza un método específico para procesar la operación.
En el diseño de programas orientados a objetos se realiza en primer lugar el diseño de las clases que representan
con precisión aquellas cosas que trata el programa. Por ejemplo, un programa de dibujo, puede definir clases que
representan rectángulos, líneas, pinceles, colores, etc. Las definiciones de clases incluyen una descripción de opera-
ciones permisibles para cada clase, tales como desplazamiento de un círculo o rotación de una línea. A continuación
se prosigue el diseño de un programa utilizando objetos de las clases.
El diseño de clases fiables y útiles puede ser una tarea difícil. Afortunadamente, los lenguajes POO facilitan la
tarea ya que incorporan clases existentes en su propia programación. Los fabricantes de software proporcionan nu-
merosas bibliotecas de clases, incluyendo bibliotecas de clases diseñadas para simplificar la creación de programas
para entornos tales como Windows, Linux, Macintosh o Unix. Uno de los beneficios reales de C++ es que permite
la reutilización y adaptación de códigos existentes y ya bien probados y depurados.
2.4.4. Objetos
El objeto es el centro de la programación orientada a objetos. Un objeto es algo que se visualiza, se utiliza y juega
un rol o papel. Si se programa con enfoque orientado a objetos, se intentan descubrir e implementar los objetos que
juegan un rol en el dominio del problema y en consecuencia programa. La estructura interna y el comportamiento
de un objeto, en una primera fase, no tiene prioridad. Es importante que un objeto tal como un carro o una casa jue-
gan un rol.
Dependiendo del problema, diferentes aspectos de un aspecto son relevantes. Un carro puede ser ensamblado
de partes tales como un motor, una carrocería, unas puertas o puede ser descrito utilizando propiedades tales como
su velocidad, su kilometraje o su fabricante. Estos atributos indican el objeto. De modo similar, una persona también
se puede ver como un objeto, del cual se disponen de diferentes atributos. Dependiendo de la definición del proble-
ma, esos atributos pueden ser el nombre, apellido, dirección, número de teléfono, color del cabello, altura, peso,
profesión, etc.
Un objeto no necesariamente ha de realizar algo concreto o tangible. Puede ser totalmente abstracto y también
puede describir un proceso. Por ejemplo, un partido de baloncesto o de rugby puede ser descrito como un objeto.
Los atributos de este objeto pueden ser los jugadores, el entrenador, la puntuación y el tiempo transcurrido de par-
tido.
Cuando se trata de resolver un problema con orientación a objetos, dicho problema no se descompone en funcio-
nes como en programación estructurada tradicional, caso de C, sino en objetos. El pensar en términos de objetos
tiene una gran ventaja: se asocian los objetos del problema a los objetos del mundo real.
¿Qué tipos de cosas son objetos en los programas orientados a objetos? La respuesta está limitada por su imagi-
nación aunque se pueden agrupar en categorías típicas que facilitarán su búsqueda en la definición del problema de
un modo más rápido y sencillo.
60 Fundamentos de programación
• Recursos Humanos:
— Empleados.
— Estudiantes.
— Clientes.
— Vendedores.
— Socios.
• Colecciones de datos:
— Arrays (arreglos).
— Listas.
— Pilas.
— Árboles.
— Árboles binarios.
— Grafos.
• Tipos de datos definidos por usuarios:
— Hora.
— Números complejos.
— Puntos del plano.
— Puntos del espacio.
— Ángulos.
— Lados.
• Elementos de computadoras:
— Menús.
— Ventanas.
— Objetos gráficos (rectángulos, círculos, rectas, puntos...).
— Ratón (mouse).
— Teclado.
— Impresora.
— USB.
— Tarjetas de memoria de cámaras fotográficas.
• Objetos físicos:
— Carros.
— Aviones.
— Trenes.
— Barcos.
— Motocicletas.
— Casas.
• Componentes de videojuegos:
— Consola.
— Mandos.
— Volante.
— Conectores.
— Memoria.
— Acceso a Internet.
La correspondencia entre objetos de programación y objetos del mundo real es el resultado eficiente de combinar
datos y funciones que manipulan esos datos. Los objetos resultantes ofrecen una mejor solución al diseño del pro-
grama que en el caso de los lenguajes orientados a procedimientos.
Un objeto se puede definir desde el punto de vista conceptual como una entidad individual de un sistema y que
se caracteriza por un estado y un comportamiento. Desde el punto de vista de implementación un objeto es una en-
tidad que posee un conjunto de datos y un conjunto de operaciones (funciones o métodos).
Metodología de la programación y desarrollo de software 61
El estado de un objeto viene determinado por los valores que toman sus datos, cuyos valores pueden tener las
restricciones impuestas en la definición del problema. Los datos se denominan también atributos y componen la es-
tructura del objeto y las operaciones —también llamadas métodos— representan los servicios que proporciona el
objeto.
La representación gráfica de un objeto en UML se muestra en la Figura 2.10.
c) Un objeto Toyota de la clase Carro d) Un objeto Mackoy de la clase Persona
Un objeto: Clase X
Toyota: Carro Mackoy: Persona
Un objeto: Clase X
a) Notación completa de un objeto b) Notación reducida de un objeto
Figura 2.10. Representación de objetos en UML (Lenguaje Unificado de Modelado).
2.4.5. Clases
En POO los objetos son miembros de clases. En esencia, una clase es un tipo de datos al igual que cualquier otro
tipo de dato definido en un lenguaje de programación. La diferencia reside en que la clase es un tipo de dato que
contiene datos y funciones. Una clase contiene muchos objetos y es preciso definirla, aunque su definición no impli-
ca creación de objetos.
Una clase es, por consiguiente, una descripción de un número de objetos similares. Madonna, Sting, Prince, Jua-
nes, Carlos Vives o Juan Luis Guerra son miembros u objetos de la clase "músicos de rock". Un objeto
concreto, Juanes o Carlos Vives, son instancias de la clase "músicos de rock".
Una clase es una descripción general de un conjunto de objetos similares. Por definición todos los objetos de una
clase comparten los mismos atributos (datos) y las mismas operaciones (métodos). Una clase encapsula las abstrac-
ciones de datos y operaciones necesarias para describir una entidad u objeto del mundo real.
Una clase se representa en UML mediante un rectángulo que contiene en una banda con el nombre de la clase y
opcionalmente otras dos bandas con el nombre de sus atributos y de sus operaciones o métodos (Figuras 2.11
y 2.12).
2.4.6. Generalización y especialización: herencia
La generalización es la propiedad que permite compartir información entre dos entidades evitando la redundancia.
En el comportamiento de objetos existen con frecuencia propiedades que son comunes en diferentes objetos y esta
propiedad se denomina generalización.
Por ejemplo, máquinas lavadoras, frigoríficos, hornos de microondas, tostadoras, lavavajillas, etc., son todos elec-
trodomésticos (aparatos del hogar). En el mundo de la orientación a objetos, cada uno de estos aparatos es una sub-
clase de la clase Electrodoméstico y a su vez Electrodoméstico es una superclase de todas las otras
clases (máquinas lavadoras, frigoríficos, hornos de microondas, tostadoras, lavavaji-
llas...). El proceso inverso de la generalización por el cual se definen nuevas clases a partir de otras ya existentes
se denomina especialización
En orientación a objetos, el mecanismo que implementa la propiedad de generalización se denomina herencia.
La herencia permite definir nuevas clases a partir de otras clases ya existentes, de modo que presentan las mismas
características y comportamiento de éstas, así como otras adicionales.
62 Fundamentos de programación
La idea de clases conduce a la idea de herencia. Clases diferentes se pueden conectar unas con otras de modo
jerárquico. Como ya se ha comentado anteriormente con las relaciones de generalización y especialización, en nues-
tras vidas diarias se utiliza el concepto de clases divididas en subclases. La clase animal se divide en anfibios,
mamíferos, insectos, pájaros, etc., y la clase vehículo en carros, motos, camiones, buses, etc.
El principio de la división o clasificación es que cada subclase comparte características comunes con la clase de
la que procede o se deriva. Los carros, motos, camiones y buses tiene ruedas, motores y carrocerías; son las caracte-
rísticas que definen a un vehículo. Además de las características comunes con los otros miembros de la clase, cada
subclase tiene sus propias características. Por ejemplo los camiones tienen una cabina independiente de la caja que
transporta la carga; los buses tienen un gran número de asientos independientes para los viajeros que ha de transpor-
tar, etc. En la Figura 2.13 se muestran clases pertenecientes a una jerarquía o herencia de clases.
De modo similar una clase se puede convertir en padre o raíz de otras subclases. En C++ la clase original se de-
nomina clase base y las clases que se derivan de ella se denominan clases derivadas y siempre son una especializa-
ción o concreción de su clase base. A la inversa, la clase base es la generalización de la clase derivada. Esto signifi-
ca que todas las propiedades (atributos y operaciones) de la clase base se heredan por la clase derivada,
normalmente suplementada con propiedades adicionales.
c) Clase Carro d) Clases Persona, Carro y Avión
a) Notación completa de un objeto b) Notación abreviada de una clase
Nombre de la clase
Persona
Nombre de la clase
Atributos
Métodos
Excepciones, etc.
Carro
Marca
Modelo
Año de matrícula
Potencia
Acelerar ( )
Frenar ( )
Girar ( )
Carro
Avión
Figura 2.11. Representación de clases en UML.
Perro
Nombre
Edad
Peso
Altura
Correr ( )
Dormir ( )
Jugador de Baloncesto
Lanzar ( )
Saltar ( )
…
Nombre
Altura
Peso
Edad
Figura 2.12. Representación de clases en UML con atributos y métodos.
Metodología de la programación y desarrollo de software 63
2.4.7 Reusabilidad
Una vez que una clase ha sido escrita, creada y depurada, se puede distribuir a otros programadores para utilizar en
sus propios programas. Esta propiedad se llama reusabilidad4
o reutilización. Su concepto es similar a las funciones
incluidas en las bibliotecas de funciones de un lenguaje procedimental como C que se pueden incorporar en diferen-
tes programas.
En C++, el concepto de herencia proporciona una extensión o ampliación al concepto de reusabilidad. Un pro-
gramador puede considerar una clase existente y sin modificarla, añadir competencias y propiedades adicionales a
ella. Esto se consigue derivando una nueva clase de una ya existente. La nueva clase heredará las características de
la clase antigua, pero es libre de añadir nuevas características propias.
La facilidad de reutilizar o reusar el software existente es uno de los grandes beneficios de la POO: muchas em-
presas consiguen con la reutilización de clase en nuevos proyectos la reducción de los costes de inversión en sus
presupuestos de programación. ¿En esencia cuáles son las ventajas de la herencia? Primero, se utiliza para consisten-
cia y reducir código. Las propiedades comunes de varias clases sólo necesitan ser implementadas una vez y sólo
necesitan modificarse una vez si es necesario. La otra ventaja es que el concepto de abstracción de la funcionalidad
común está soportada.
2.4.8. Polimorfismo
Además de las ventajas de consistencia y reducción de código, la herencia, aporta también otra gran ventaja: facilitar
el polimorfismo. Polimorfismo es la propiedad de que un operador o una función actúen de modo diferente en función
del objeto sobre el que se aplican. En la practica, el polimorfismo significa la capacidad de una operación de ser
interpretada sólo por el propio objeto que lo invoca. Desde un punto de vista práctico de ejecución del programa, el
polimorfismo se realiza en tiempo de ejecución ya que durante la compilación no se conoce qué tipo de objeto y por
consiguiente qué operación ha sido llamada. En el Capítulo 14 se describirá en profundidad la propiedad de polimor-
fismo y los diferentes modos de implementación del polimorfismo.
La propiedad de polimorfismo es aquella en que una operación tiene el mismo nombre en diferentes clases, pero
se ejecuta de diferentes formas en cada clase. Así, por ejemplo, la operación de abrir se puede dar en diferentes cla-
ses: abrir una puerta, abrir una ventana, abrir un periódico, abrir un archivo, abrir una cuenta corriente en un banco,
abrir un libro, etc. En cada caso se ejecuta una operación diferente aunque tiene el mismo nombre en todos ellos
“abrir”. El polimorfismo es la propiedad de una operación de ser interpretada sólo por el objeto al que pertenece.
Existen diferentes formas de implementar el polimorfismo y variará dependiendo del lenguaje de programación.
Veamos el concepto con ejemplos de la vida diaria.
En un taller de reparaciones de automóviles existen numerosos carros, de marcas diferentes, de modelos diferen-
tes, de tipos diferentes, potencias diferentes, etc. Constituyen una clase o colección heterogénea de carros (coches).
Supongamos que se ha de realizar una operación común “cambiar los frenos del carro”. La operación a realizar es la
4
El término proviene del concepto ingles reusability. La traducción no ha sido aprobada por la RAE, pero se incorpora al texto por su gran
uso y difusión entre los profesionales de la informática.
Animal
Mamífero
Reptil Anfibio
Rana
Caballo
Serpiente
Figura 2.13. Herencia de clases en UML.
64 Fundamentos de programación
misma, incluye los mismos principios, sin embargo, dependiendo del coche, en particular, la operación será muy
diferente, incluirá diferentes acciones en cada caso. Otro ejemplo a considerar y relativo a los operadores “+” y “*”
aplicados a números enteros o números complejos; aunque ambos son números, en un caso la suma y multiplicación
son operaciones simples, mientras que en el caso de los números complejos al componerse de parte real y parte ima-
ginaria, será necesario seguir un método específico para tratar ambas partes y obtener un resultado que también será
un número complejo.
El uso de operadores o funciones de forma diferente, dependiendo de los objetos sobre los que están actuando se
llama polimorfismo (una cosa con diferentes formas). Sin embargo, cuando un operador existente, tal como + o =,
se le permite la posibilidad de operar sobre nuevos tipos de datos, se dice entonces que el operador está sobrecarga-
do. La sobrecarga es un tipo de polimorfismo y una característica importante de la POO. En el Capítulo 10 se am-
pliará, también en profundidad, este nuevo concepto.
2.5. CONCEPTO Y CARACTERÍSTICAS DE ALGORITMOS
El objetivo fundamental de este texto es enseñar a resolver problemas mediante una computadora. El programador
de computadora es antes que nada una persona que resuelve problemas, por lo que para llegar a ser un programador
eficaz se necesita aprender a resolver problemas de un modo riguroso y sistemático. A lo largo de todo este libro nos
referiremos a la metodología necesaria para resolver problemas mediante programas, concepto que se denomina
metodología de la programación. El eje central de esta metodología es el concepto, ya tratado, de algoritmo.
Un algoritmo es un método para resolver un problema. Aunque la popularización del término ha llegado con el
advenimiento de la era informática, algoritmo proviene —como se comentó anteriormente— de Mohammed al-
KhoWârizmi, matemático persa que vivió durante el siglo IX y alcanzó gran reputación por el enunciado de las reglas
paso a paso para sumar, restar, multiplicar y dividir números decimales; la traducción al latín del apellido en la pa-
labra algorismus derivó posteriormente en algoritmo. Euclides, el gran matemático griego (del siglo IV a. C.) que
inventó un método para encontrar el máximo común divisor de dos números, se considera con Al-Khowârizmi el otro
gran padre de la algoritmia (ciencia que trata de los algoritmos).
El profesor Niklaus Wirth —inventor de Pascal, Modula-2 y Oberon— tituló uno de sus más famosos libros, Al-
goritmos + Estructuras de datos = Programas, significándonos que sólo se puede llegar a realizar un buen programa
con el diseño de un algoritmo y una correcta estructura de datos. Esta ecuación será una de las hipótesis fundamen-
tales consideradas en esta obra.
La resolución de un problema exige el diseño de un algoritmo que resuelva el problema propuesto.
Problema
Diseño
de algoritmo
Programa
de computadora
Figura 2.14. Resolución de un problema.
Los pasos para la resolución de un problema son:
1. Diseño del algoritmo, que describe la secuencia ordenada de pasos —sin ambigüedades— que conducen a la
solución de un problema dado. (Análisis del problema y desarrollo del algoritmo.)
2. Expresar el algoritmo como un programa en un lenguaje de programación adecuado. (Fase de codifica-
ción.)
3. Ejecución y validación del programa por la computadora.
Para llegar a la realización de un programa es necesario el diseño previo de un algoritmo, de modo que sin algo-
ritmo no puede existir un programa.
Los algoritmos son independientes tanto del lenguaje de programación en que se expresan como de la computa-
dora que los ejecuta. En cada problema el algoritmo se puede expresar en un lenguaje diferente de programación y
ejecutarse en una computadora distinta; sin embargo, el algoritmo será siempre el mismo. Así, por ejemplo, en una
analogía con la vida diaria, una receta de un plato de cocina se puede expresar en español, inglés o francés, pero
cualquiera que sea el lenguaje, los pasos para la elaboración del plato se realizarán sin importar el idioma del coci-
nero.
Metodología de la programación y desarrollo de software 65
En la ciencia de la computación y en la programación, los algoritmos son más importantes que los lenguajes de
programación o las computadoras. Un lenguaje de programación es tan sólo un medio para expresar un algoritmo y
una computadora es sólo un procesador para ejecutarlo. Tanto el lenguaje de programación como la computadora son
los medios para obtener un fin: conseguir que el algoritmo se ejecute y se efectúe el proceso correspondiente.
Dada la importancia del algoritmo en la ciencia de la computación, un aspecto muy importante será el diseño de
algoritmos. A la enseñanza y práctica de esta tarea se dedica gran parte de este libro.
El diseño de la mayoría de los algoritmos requiere creatividad y conocimientos profundos de la técnica de la
programación. En esencia, la solución de un problema se puede expresar mediante un algoritmo.
2.5.1. Características de los algoritmos
Las características fundamentales que debe cumplir todo algoritmo son:
• Un algoritmo debe ser preciso e indicar el orden de realización de cada paso.
• Un algoritmo debe estar bien definido. Si se sigue un algoritmo dos veces, se debe obtener el mismo resultado
cada vez.
• Un algoritmo debe ser finito. Si se sigue un algoritmo, se debe terminar en algún momento; o sea, debe tener
un número finito de pasos.
La definición de un algoritmo debe describir tres partes: Entrada, Proceso y Salida. En el algoritmo de receta de
cocina citado anteriormente se tendrá:
Entrada: Ingredientes y utensilios empleados.
Proceso: Elaboración de la receta en la cocina.
Salida: Terminación del plato (por ejemplo, cordero).
EJEMPLO 2.4
Un cliente ejecuta un pedido a una fábrica. La fábrica examina en su banco de datos la ficha del cliente, si el clien-
te es solvente entonces la empresa acepta el pedido; en caso contrario, rechazará el pedido. Redactar el algoritmo
correspondiente.
Los pasos del algoritmo son:
1. Inicio.
2. Leer el pedido.
3. Examinar la ficha del cliente.
4. Si el cliente es solvente, aceptar pedido;
en caso contrario, rechazar pedido.
5. Fin.
EJEMPLO 2.5
Se desea diseñar un algoritmo para saber si un número es primo o no.
Un número es primo si sólo puede dividirse por sí mismo y por la unidad (es decir, no tiene más divisores que
él mismo y la unidad). Por ejemplo, 9, 8, 6, 4, 12, 16, 20, etc., no son primos, ya que son divisibles por números
distintos a ellos mismos y a la unidad. Así, 9 es divisible por 3, 8 lo es por 2, etc. El algoritmo de resolución del
problema pasa por dividir sucesivamente el número por 2, 3, 4..., etc.
1. Inicio.
2. Poner X igual a 2 (X ← 2, X variable que representa a los divisores
del número que se busca N).
66 Fundamentos de programación
3. Dividir N por X (N/X).
4. Si el resultado de N/X es entero, entonces N no es un número primo y
bifurcar al punto 7; en caso contrario, continuar el proceso.
5. Suma 1 a X (X ← X + 1).
6. Si X es igual a N, entonces N es un número primo; en caso contrario,
bifurcar al punto 3.
7. Fin.
Por ejemplo, si N es 131, los pasos anteriores serían:
1. Inicio.
2. X = 2.
3. 131/X. Como el resultado no es entero, se continúa el proceso.
5. X ← 2 + 1, luego X = 3.
6. Como X no es 131, se continúa el proceso.
3. 131/X resultado no es entero.
5. X ← 3 + 1, X = 4.
6. Como X no es 131 se continúa el proceso.
3. 131/X..., etc.
7. Fin.
EJEMPLO 2.6
Realizar la suma de todos los números pares entre 2 y 1.000.
El problema consiste en sumar 2 + 4 + 6 + 8 ... + 1.000. Utilizaremos las palabras SUMA y NÚMERO (variables,
serán denominadas más tarde) para representar las sumas sucesivas (2+4), (2+4+6), (2+4+6+8), etc. La solución se
puede escribir con el siguiente algoritmo:
1. Inicio.
2. Establecer SUMA a 0.
3. Establecer NÚMERO a 2.
4. Sumar NÚMERO a SUMA. El resultado será el nuevo valor de la suma (SUMA).
5. Incrementar NÚMERO en 2 unidades.
6. Si NÚMERO =< 1.000 bifurcar al paso 4; en caso contrario, escribir el
último valor de SUMA y terminar el proceso.
7. Fin.
2.5.2. Diseño del algoritmo
Una computadora no tiene capacidad para solucionar problemas más que cuando se le proporcionan los sucesivos
pasos a realizar. Estos pasos sucesivos que indican las instrucciones a ejecutar por la máquina constituyen, como ya
conocemos, el algoritmo.
La información proporcionada al algoritmo constituye su entrada y la información producida por el algoritmo
constituye su salida.
Los problemas complejos se pueden resolver más eficazmente con la computadora cuando se rompen en subpro-
blemas que sean más fáciles de solucionar que el original. Es el método de divide y vencerás (divide and conquer),
mencionado anteriormente, y que consiste en dividir un problema complejo en otros más simples. Así, el problema
de encontrar la superficie y la longitud de un círculo se puede dividir en tres problemas más simples o subproblemas
(Figura 2.15).
La descomposición del problema original en subproblemas más simples y a continuación la división de estos
subproblemas en otros más simples que pueden ser implementados para su solución en la computadora se denomina
diseño descendente (top-down design). Normalmente, los pasos diseñados en el primer esbozo del algoritmo son
incompletos e indicarán sólo unos pocos pasos (un máximo de doce aproximadamente). Tras esta primera descripción,
éstos se amplían en una descripción más detallada con más pasos específicos. Este proceso se denomina refinamien-
Metodología de la programación y desarrollo de software 67
to del algoritmo (stepwise refinement). Para problemas complejos se necesitan con frecuencia diferentes niveles de
refinamiento antes de que se pueda obtener un algoritmo claro, preciso y completo.
El problema de cálculo de la circunferencia y superficie de un círculo se puede descomponer en subproblemas
más simples: 1) leer datos de entrada; 2) calcular superficie y longitud de circunferencia, y 3) escribir resultados
(datos de salida).
Subproblema Refinamiento
leer radio leer radio
calcular superficie superficie = 3.141592 * radio ^ 2
calcular circunferencia circunferencia = 2 * 3.141592 * radio
escribir resultados escribir radio, circunferencia, superficie
Las ventajas más importantes del diseño descendente son:
• El problema se comprende más fácilmente al dividirse en partes más simples denominadas módulos.
• Las modificaciones en los módulos son más fáciles.
• La comprobación del problema se puede verificar fácilmente.
Tras los pasos anteriores (diseño descendente y refinamiento por pasos) es preciso representar el algoritmo me-
diante una determinada herramienta de programación: diagrama de flujo, pseudocódigo o diagrama N-S.
Así pues, el diseño del algoritmo se descompone en las fases recogidas en la Figura 2.16.
Diseño
de un
algoritmo
Diseño
descendente
(1)
Refinamiento
por casos
(2)
Herramienta de
programación (3)
— diagrama de flujo
— pseudocódigo
— diagrama N-S
Figura 2.16. Fases del diseño de un algoritmo.
Superficie
y longitud de
circunferencia
Entrada
de
datos
Cálculo
de superficie
(S)
Cálculo
de longitud
(L)
Salida
resultados
Entrada
radio (R) S = PI* R2 L = 2* PI * R
Salida
R
Salida
S
Salida
L
Figura 2.15. Refinamiento de un algoritmo.
68 Fundamentos de programación
2.6. ESCRITURA DE ALGORITMOS
Como ya se ha comentado anteriormente, el sistema para describir (“escribir”) un algoritmo consiste en realizar una
descripción paso a paso con un lenguaje natural del citado algoritmo. Recordemos que un algoritmo es un método o
conjunto de reglas para solucionar un problema. En cálculos elementales estas reglas tienen las siguientes propie-
dades:
• deben ir seguidas de alguna secuencia definida de pasos hasta que se obtenga un resultado coherente,
• sólo puede ejecutarse una operación a la vez.
El flujo de control usual de un algoritmo es secuencial; consideremos el algoritmo que responde a la pregunta:
¿Qué hacer para ver la película de Harry Potter?
La respuesta es muy sencilla y puede ser descrita en forma de algoritmo general de modo similar a:
ir al cine
comprar una entrada (billete o ticket)
ver la película
regresar a casa
El algoritmo consta de cuatro acciones básicas, cada una de las cuales debe ser ejecutada antes de realizar la si-
guiente. En términos de computadora, cada acción se codificará en una o varias sentencias que ejecutan una tarea
particular.
El algoritmo descrito es muy sencillo; sin embargo, como ya se ha indicado en párrafos anteriores, el algoritmo
general se descompondrá en pasos más simples en un procedimiento denominado refinamiento sucesivo, ya que cada
acción puede descomponerse a su vez en otras acciones simples. Así, por ejemplo, un primer refinamiento del algo-
ritmo ir al cine se puede describir de la forma siguiente:
1. inicio
2. ver la cartelera de cines en el periódico
3. si no proyectan "Harry Potter" entonces
3.1. decidir otra actividad
3.2. bifurcar al paso 7
si_no
3.3. ir al cine
fin_si
4. si hay cola entonces
4.1. ponerse en ella
4.2. mientras haya personas delante hacer
4.2.1. avanzar en la cola
fin_mientras
fin_si
5. si hay localidades entonces
5.1. comprar una entrada
5.2. pasar a la sala
5.3. localizar la(s) butaca(s)
5.4. mientras proyectan la película hacer
5.4.1. ver la película
fin_mientras
5.5. abandonar el cine
si_no
5.6. refunfuñar
fin_si
6. volver a casa
7. fin
Metodología de la programación y desarrollo de software 69
En el algoritmo anterior existen diferentes aspectos a considerar. En primer lugar, ciertas palabras reservadas se
han escrito deliberadamente en negrita (mientras, si_no; etc.). Estas palabras describen las estructuras de control
fundamentales y procesos de toma de decisión en el algoritmo. Éstas incluyen los conceptos importantes de selección
(expresadas por si-entonces-si_no, if-then-else) y de repetición (expresadas con mientras-hacer o a veces
repetir-hasta e iterar-fin_iterar, en inglés, while-do y repeat-until) que se encuentran en casi todos los
algoritmos, especialmente en los de proceso de datos. La capacidad de decisión permite seleccionar alternativas de
acciones a seguir o bien la repetición una y otra vez de operaciones básicas.
si proyectan la película seleccionada ir al cine
si_no ver la televisión, ir al fútbol o leer el periódico
mientras haya personas en la cola, ir avanzando repetidamente
hasta llegar a la taquilla
Otro aspecto a considerar es el método elegido para describir los algoritmos: empleo de indentación (sangrado o
justificación) en escritura de algoritmos. En la actualidad es tan importante la escritura de programa como su poste-
rior lectura. Ello se facilita con la indentación de las acciones interiores a las estructuras fundamentales citadas: se-
lectivas y repetitivas. A lo largo de todo el libro la indentación o sangrado de los algoritmos será norma constante.
Para terminar estas consideraciones iniciales sobre algoritmos, describiremos las acciones necesarias para refinar
el algoritmo objeto de nuestro estudio; para ello analicemos la acción:
Localizar la(s) butaca(s).
Si los números de los asientos están impresos en la entrada, la acción compuesta se resuelve con el siguiente
algoritmo:
1. inicio //algoritmo para encontrar la butaca del espectador
2. caminar hasta llegar a la primera fila de butacas
3. repetir
compara número de fila con número impreso en billete
si son iguales entonces pasar a la siguiente fila fin_si
hasta_que se localice la fila correcta
4. mientras número de butaca no coincida con número de billete
hacer avanzar a través de la fila a la siguiente butaca
fin_mientras
5. sentarse en la butaca
6. fin
En este algoritmo la repetición se ha mostrado de dos modos, utilizando ambas notaciones, repetir... has-
ta_que y mientras... fin_mientras. Se ha considerado también, como ocurre normalmente, que el número del
asiento y fila coincide con el número y fila rotulado en el billete.
2.7. REPRESENTACIÓN GRÁFICA DE LOS ALGORITMOS
Para representar un algoritmo se debe utilizar algún método que permita independizar dicho algoritmo del lenguaje
de programación elegido. Ello permitirá que un algoritmo pueda ser codificado indistintamente en cualquier lengua-
je. Para conseguir este objetivo se precisa que el algoritmo sea representado gráfica o numéricamente, de modo que
las sucesivas acciones no dependan de la sintaxis de ningún lenguaje de programación, sino que la descripción pue-
da servir fácilmente para su transformación en un programa, es decir, su codificación.
Los métodos usuales para representar un algoritmo son:
1. diagrama de flujo,
2. diagrama N-S (Nassi-Schneiderman),
3. lenguaje de especificación de algoritmos: pseudocódigo,
4. lenguaje español, inglés…
5. fórmulas.
70 Fundamentos de programación
Los métodos 4 y 5 no suelen ser fáciles de transformar en programas. Una descripción en español narrativo no
es satisfactoria, ya que es demasiado prolija y generalmente ambigua. Una fórmula, sin embargo, es un buen siste-
ma de representación. Por ejemplo, las fórmulas para la solución de una ecuación cuadrática (de segundo grado)
son un medio sucinto de expresar el procedimiento algorítmico que se debe ejecutar para obtener las raíces de dicha
ecuación.
xl = (–b + √––
b2
– 4ac)/2a x2 = (–b – √––
b2
– 4ac)/2a
y significa lo siguiente:
1. Elevar al cuadrado b.
2. Tomar a; multiplicar por c; multiplicar por 4.
3. Restar el resultado obtenido de 2 del resultado de 1, etc.
Sin embargo, no es frecuente que un algoritmo pueda ser expresado por medio de una simple fórmula.
2.7.1. Pseudocódigo
El pseudocódigo es un lenguaje de especificación (descripción) de algoritmos. El uso de tal lenguaje hace el paso
de codificación final (esto es, la traducción a un lenguaje de programación) relativamente fácil. Los lenguajes APL
Pascal y Ada se utilizan a veces como lenguajes de especificación de algoritmos.
El pseudocódigo nació como un lenguaje similar al inglés y era un medio de representar básicamente las estruc-
turas de control de programación estructurada que se verán en capítulos posteriores. Se considera un primer borrador,
dado que el pseudocódigo tiene que traducirse posteriormente a un lenguaje de programación. El pseudocódigo no
puede ser ejecutado por una computadora. La ventaja del pseudocódigo es que en su uso, en la planificación de un
programa, el programador se puede concentrar en la lógica y en las estructuras de control y no preocuparse de las
reglas de un lenguaje específico. Es también fácil modificar el pseudocódigo si se descubren errores o anomalías en
la lógica del programa, mientras que en muchas ocasiones suele ser difícil el cambio en la lógica, una vez que está
codificado en un lenguaje de programación. Otra ventaja del pseudocódigo es que puede ser traducido fácilmente a
lenguajes estructurados como Pascal, C, FORTRAN 77/90, C++, Java, C#, etc.
El pseudocódigo original utiliza para representar las acciones sucesivas palabras reservadas en inglés —similares
a sus homónimas en los lenguajes de programación—, tales como start, end, stop, if-then-else, while-end,
repeat-until, etc. La escritura de pseudocódigo exige normalmente la indentación (sangría en el margen izquier-
do) de diferentes líneas.
Una representación en pseudocódigo —en inglés— de un problema de cálculo del salario neto de un trabajador
es la siguiente:
start
//cálculo de impuesto y salarios
read nombre, horas, precio
salario ← horas * precio
tasas ← 0,25 * salario
salario_neto ← salario – tasas
write nombre, salario, tasas, salario
end
El algoritmo comienza con la palabra start y finaliza con la palabra end, en inglés (en español,
inicio, fin). Entre estas palabras, sólo se escribe una instrucción o acción por línea.
La línea precedida por // se denomina comentario. Es una información al lector del programa y no realiza nin-
guna instrucción ejecutable, sólo tiene efecto de documentación interna del programa. Algunos autores suelen utilizar
corchetes o llaves.
No es recomendable el uso de apóstrofos o simples comillas como representan en algunos lenguajes primitivos
los comentarios, ya que este carácter es representativo de apertura o cierre de cadenas de caracteres en lenguajes
como Pascal o FORTRAN, y daría lugar a confusión.
Metodología de la programación y desarrollo de software 71
Otro ejemplo aclaratorio en el uso del pseudocódigo podría ser un sencillo algoritmo del arranque matinal de un
coche.
inicio
//arranque matinal de un coche
introducir la llave de contacto
girar la llave de contacto
pisar el acelerador
oir el ruido del motor
pisar de nuevo el acelerador
esperar unos instantes a que se caliente el motor
fin
Por fortuna, aunque el pseudocódigo nació como un sustituto del lenguaje de programación y, por consiguiente,
sus palabras reservadas se conservaron o fueron muy similares a las del idioma inglés, el uso del pseudocódigo se ha
extendido en la comunidad hispana con términos en español como inicio, fin, parada, leer, escribir, si-en-
tonces-si_no, mientras, fin_mientras, repetir, hasta_que, etc. Sin duda, el uso de la terminología del
pseudocódigo en español ha facilitado y facilitará considerablemente el aprendizaje y uso diario de la programación.
En esta obra, al igual que en otras nuestras, utilizaremos el pseudocódigo en español y daremos en su momento las
estructuras equivalentes en inglés, al objeto de facilitar la traducción del pseudocódigo al lenguaje de programación
seleccionado.
Así pues, en los pseudocódigos citados anteriormente deberían ser sustituidas las palabras start, end, read,
write, por inicio, fin, leer, escribir, respectivamente.
inicio start leer read
.
.
.
.
.
fin end escribir write
2.7.2. Diagramas de flujo
Un diagrama de flujo (flowchart) es una de las técnicas de representación de algoritmos más antigua y a la vez más
utilizada, aunque su empleo ha disminuido considerablemente, sobro todo, desde la aparición de lenguajes de pro-
gramación estructurados. Un diagrama de flujo es un diagrama que utiliza los símbolos (cajas) estándar mostrados
en la Tabla 2.1 y que tiene los pasos de algoritmo escritos en esas cajas unidas por flechas, denominadas líneas de
flujo, que indican la secuencia en que se debe ejecutar.
La Figura 2.17 es un diagrama de flujo básico. Este diagrama representa la resolución de un programa que de-
duce el salario neto de un trabajador a partir de la lectura del nombre, horas trabajadas, precio de la hora, y sabiendo
que los impuestos aplicados son el 25 por 100 sobre el salario bruto.
Los símbolos estándar normalizados por ANSI (abreviatura de American National Standars Institute) son muy
variados. En la Figura 2.18 se representa una plantilla de dibujo típica donde se contemplan la mayoría de los sím-
bolos utilizados en el diagrama; sin embargo, los símbolos más utilizados representan:
• proceso • decisión • conectores
• fin • entrada/salida • dirección del flujo
El diagrama de flujo de la Figura 2.17 resume sus características:
• existe una caja etiquetada “inicio”, que es de tipo elíptico,
• existe una caja etiquetada “fin” de igual forma que la anterior,
• si existen otras cajas, normalmente son rectangulares, tipo rombo o paralelogramo (el resto de las figuras se
utilizan sólo en diagramas de flujo generales o de detalle y no siempre son imprescindibles).
72 Fundamentos de programación
Tabla 2.1. Símbolos de diagrama de flujo
Símbolos
principales Función
Terminal (representa el comienzo, “inicio”, y el final, “fin” de un programa. Puede representar también
una parada o interrupción programada que sea necesario realizar en un programa.
Entrada/Salida (cualquier tipo de introducción de datos en la memoria desde los periféricos, “entrada”,
o registro de la información procesada en un periférico, “salida”.
Proceso (cualquier tipo de operación que pueda originar cambio de valor, formato o posición de la
información almacenada en memoria, operaciones aritméticas, de transferencia, etc.).
NO
SÍ
Decisión (indica operaciones lógicas o de comparación entre datos —normalmente dos— y en función
del resultado de la misma determina cuál de los distintos caminos alternativos del programa se debe
seguir; normalmente tiene dos salidas —respuestas SÍ o NO— pero puede tener tres o más, según los
casos).
Decisión múltiple (en función del resultado de la comparación se seguirá uno de los diferentes caminos
de acuerdo con dicho resultado).
Conector (sirve para enlazar dos partes cualesquiera de un ordinograma a través de un conector en la salida
y otro conector en la entrada. Se refiere a la conexión en la misma página del diagrama.
Indicador de dirección o línea de flujo (indica el sentido de ejecución de las operaciones).
Línea conectora (sirve de unión entre dos símbolos).
Conector (conexión entre dos puntos del organigrama situado en páginas diferentes).
Llamada a subrutina o a un proceso predeterminado (una subrutina es un módulo independientemente
del programa principal, que recibe una entrada procedente de dicho programa, realiza una tarea
determinada y regresa, al terminar, al programa principal).
Pantalla (se utiliza en ocasiones en lugar del símbolo de E/S).
Impresora (se utiliza en ocasiones en lugar del símbolo de E/S).
Teclado (se utiliza en ocasiones en lugar del símbolo de E/S).
Comentarios (se utiliza para añadir comentarios clasificadores a otros símbolos del diagrama de flujo. Se
pueden dibujar a cualquier lado del símbolo).
Metodología de la programación y desarrollo de software 73
Se puede escribir más de un paso del algoritmo en una sola caja rectangular. El uso de flechas significa que la
caja no necesita ser escrita debajo de su predecesora. Sin embargo, abusar demasiado de esta flexibilidad conduce a
diagramas de flujo complicados e ininteligibles.
EJEMPLO 2.7
Calcular la media de una serie de números positivos, suponiendo que los datos se leen desde un terminal. Un valor
de cero —como entrada— indicará que se ha alcanzado el final de la serie de números positivos.
inicio
leer nombre,
horas,
precio
bruto ←
horas * precio
tasas ←
0,25 * bruto
neto ←
bruto – tasas
escribir nombre,
bruto, tasas,
neto
fin
Figura 2.17. Diagrama de flujo.
Entrada/
Salida
Terminal Decisión
no
sí
Subprograma
Proceso
Figura 2.18. Plantilla típica para diagramas de flujo.
Problema:
Calcular el salario bruto y el salario neto de
un trabajador “por horas” conociendo el
nombre, número de horas trabajadas, im-
puestos a pagar y salario neto.
74 Fundamentos de programación
El primer paso a dar en el desarrollo del algoritmo es descomponer el problema en una serie de pasos secuencia-
les. Para calcular una media se necesita sumar y contar los valores. Por consiguiente, nuestro algoritmo en forma
descriptiva sería:
1. Inicializar contador de números C y variable suma S.
2. Leer un número.
3. Si el número leído es cero:
• calcular la media;
• imprimir la media;
• fin del proceso.
Si el número leído no es cero:
• calcular la suma;
• incrementar en uno el contador de números;
• ir al paso 2.
4. Fin.
El refinamiento del algoritmo conduce a los pasos sucesivos necesarios para realizar las operaciones de lectura,
verificación del último dato, suma y media de los datos.
Si el primer dato leído es 0, la división S/C produciría un error si el algoritmo se ejecutara en una computadora,
ya que en ella no está permitida la división por cero.
Terminal
C - contador de números
S - sumador de números
C 0
S 0
leer dato
dato <> 0
C C + 1
S S + dato
media S/C
Imprimir
media
Fin
Si el primer dato leído es 0, la
división s/c producirá un error si
el algoritmo se ejecutara en una
computadora, ya que en ella no
está permitida la división por cero.
entero: dato, C
Real: Media, S
C ← 0
S ← 0
escribir('Datos numéricos;
para finalizar se introduce 0')
repetir
leer(dato)
si dato <> = 0 entonces
C ← C + 1
S ← S + dato
fin_si
hasta dato = 0
{Calcula la media y la escribe}
si (C > 0) entonces
Media ← S/C
escribir (Media)
fin_si
Pseudocódigo
Diagrama de flujo
Metodología de la programación y desarrollo de software 75
EJEMPLO 2.8
Suma de los números pares comprendidos entre 2 y 100.
Diagrama de flujo Pseudocódigo
SUMA 2
NÚMERO 4
Inicio
SUMA
SUMA + NÚMERO
NÚMERO
NÚMERO + 2
NÚMERO = < 100
Escribir
SUMA
Fin
entero: numero,Suma
Suma ← 2
numero ← 4
mientras (numero <= 100) hacer
suma ← suma + numero
numero ← numero + 2
fin mientras
escribe ('Suma pares entre 2 y 100 =', suma)
EJEMPLO 2.9
Se desea realizar el algoritmo que resuelva el siguiente problema: Cálculo de los salarios mensuales de los emplea-
dos de una empresa, sabiendo que éstos se calculan en base a las horas semanales trabajadas y de acuerdo a un
precio especificado por horas. Si se pasan de cuarenta horas semanales, las horas extraordinarias se pagarán a
razón de 1,5 veces la hora ordinaria.
Los cálculos son:
1. Leer datos del archivo de la empresa, hasta que se encuentre la ficha
final del archivo (HORAS, PRECIO_HORA, NOMBRE).
2. Si HORAS <= 40, entonces SALARIO es el producto de horas por PRECIO_HORA.
3. Si HORAS > 40, entonces SALARIO es la suma de 40 veces PRECIO_HORA más
1.5 veces PRECIO_HORA por (HORAS-40).
76 Fundamentos de programación
El diagrama de flujo completo del algoritmo y la codificación en pseudocódigo se indican a continuación:
Diagrama de flujo Pseudocódigo
Inicio
HORAS < = 40
Leer
HORAS, PRECIO HORA
NOMBRE
SALARIO =
HORAS*
PRECIO HORA
SALARIO =
40* PRECIO HORA +
1,5* PRECIO HORA
(HORAS – 40)
más datos
SALARIO
Fin
sí no
sí
no
Escribir
real: horas, precioHora, salario
cadena: nombre
caracter: masDatos
inicio
escribir('Introducir horas, precio hora
y nombre')
repetir
escribir ('Nombre')
leer (Nombre)
escribir ('Horas trabajadas')
leer (horas)
escribir ('Precio hora')
leer (precio Hora)
si (horas <= 40) entonces
Salario ← horas * precioHora
sino
Salario ← 40 * precioHora +
1.5 * (horas - 40) *
preciohora
fin si
escribir ('Salario de', nombre, salario)
escribir ('Mas trabajadores S/N')
leer (masDatos)
hasta masDatos = 'N'
fin
Metodología de la programación y desarrollo de software 77
Una variante también válida del diagrama de flujo anterior es:
Diagrama de flujo Pseudocódigo
Inicio
HORAS < = 40
Leer
HORAS, PRECIO_HORA
NOMBRE
SALARIO =
HORAS*
PRECIO HORA
SALARIO =
40* PRECIO HORA +
1,5* PRECIO HORA
(HORAS – 40)
¿más datos?
SALARIO
Fin
sí
sí no
no
Escribir
real: horas, precioHora, salario
cadena: nombre
caracter: masDatos
inicio
masDatos ← 'S';
escribir ('Introducir horas, precio hora y
nombre')
mientras (masDatos = 'S' o masDatos = 's')
hacer
escribir ('Nombre')
leer (nombre)
escribir ('Horas trabajadas')
leer (horas)
escribir ('Precio hora')
leer (PrecioHora)
si horas <= 40 entonces
salario ← horas * precioHora
sino
salario ← 40 * precioHora + 1.5 *
(horas – 40) * precioHora
fin si
escribir ('Salario de', nombre, salario)
escribir ('Mas trabajadores (S/N)')
leer (masDatos)
fin mientras
fin
EJEMPLO 2.10
La escritura de algoritmos para realizar operaciones sencillas de conteo es una de las primeras cosas que una com-
putadora puede aprender.
Supongamos que se proporciona una secuencia de números, tales como
5 3 0 2 4 4 0 0 2 3 6 0 2
y desea contar e imprimir el número de ceros de la secuencia.
El algoritmo es muy sencillo, ya que sólo basta leer los números de izquierda a derecha, mientras se cuentan los
ceros. Utiliza como variable la palabra NUMERO para los números que se examinan y TOTAL para el número de ce-
ros encontrados. Los pasos a seguir son:
1. Establecer TOTAL a cero.
2. ¿Quedan más numeros a examinar?
3. Si no quedan numeros, imprimir el valor de TOTAL y fin.
78 Fundamentos de programación
4. Si existen mas numeros, ejecutar los pasos 5 a 8.
5. Leer el siguiente numero y dar su valor a la variable NUMERO.
6. Si NUMERO = 0, incrementar TOTAL en 1.
7. Si NUMERO <> 0, no modificar TOTAL.
8. Retornar al paso 2.
El diagrama de flujo y la codificación en pseudocódigo correspondiente es:
Diagrama de flujo Pseudocódigo
Total 0
Inicio
TOTAL
TOTAL + 1
NÚMERO = 0
Escribir
TOTAL
Fin
Leer
NÚMERO
¿más números?
no
sí
no
sí
entero: numero, total
caracter: mas Datos;
inicio
escribir ('Cuenta de ceros leidos del teclado')
mas Datos ← 'S';
total ← 0
mientras (mas Datos = 'S') o (mas Datos = 's') hacer
leer (numero)
si (numero = 0)
total ← total + 1
fin si
escribir ('Mas números 'S/N'')
leer (mas Datos)
fin mientras
escribir ('total de ceros =', total)
fin
Metodología de la programación y desarrollo de software 79
EJEMPLO 2.11
Dados tres números, determinar si la suma de cualquier pareja de ellos es igual al tercer número. Si se cumple esta
condición, escribir “Iguales” y, en caso contrario, escribir “Distintas”.
En el caso de que los números sean: 3 9 6
la respuesta es "Iguales", ya que 3 + 6 = 9. Sin embargo, si los números fueran:
2 3 4
el resultado sería "Distintas".
Para resolver este problema, se puede comparar la suma de cada pareja con el tercer número. Con tres números
solamente existen tres parejas distintas y el algoritmo de resolución del problema será fácil.
1. Leer los tres valores, A, B y C.
2. Si A + B = C escribir "Iguales" y parar.
3. Si A + C = B escribir "Iguales" y parar.
4. Si B + C = A escribir "Iguales" y parar.
5. Escribir "Distintas" y parar.
El diagrama de flujo y la codificación en pseudocódigo correspondiente es la Figura 2.19.
Diagrama de flujo Pseudocódigo
Inicio
Fin
A + B = C
Leer
A, B, C
A + C = B
B + C = A
escribir
“distintas”
escribir
“iguales”
sí
sí
sí
no
no
no
entero: a, b, c
inicio
escribir ('test con tres números:')
leer (a, b, c)
si (a + b = c) entonces
escribir ('Son iguales', a,'+',b,'=',c)
sino si (a + c = b) entonces
escribir ('Son iguales', a,'+',c,'=',b)
sino si (b + c = a) entonces
escribir ('Son iguales', b,'+',c,'=',a)
sino
escribir ('Son distintas')
fin si
fin si
fin si
fin
Figura 2.19. Diagrama de flujo y codificación en pseudocódigo (Ejemplo 2.11).
80 Fundamentos de programación
2.7.3. Diagramas de Nassi-Schneiderman (N-S)
El diagrama N-S de Nassi Schneiderman —también conocido como diagrama de Chapin— es como un diagrama de
flujo en el que se omiten las flechas de unión y las cajas son contiguas. Las acciones sucesivas se escriben en cajas
sucesivas y, como en los diagramas de flujo, se pueden escribir diferentes acciones en una caja.
Un algoritmo se representa con un rectángulo en el que cada banda es una acción a realizar.
EJEMPLO
Escribir un algoritmo que lea el nombre de un empleado, las horas trabajadas, el precio por hora y calcule los im-
puestos a pagar (tasa = 25%) y el salario neto.
leer
nombre, horas, precio
calcular
salario ← horas * precio
calcular
impuestos ← 0.25 * salario
calcular
neto ← salario impuestos
escribir
nombre, salario, impuestos, neto
nombre del algoritmo
<accion 1>
<accion 2>
<accion 3>
...
fin
Figura 2.20. Representación gráfica N-S de un algoritmo.
Otro ejemplo es la representación de la estructura condicional (Figura 2.21).
¿condición?
acción 1 acción 2
¿condición?
<acciones> <acciones>
a) b)
sí no
Figura 2.21. Estructura condicional o selectiva: a) diagrama de flujo: b) diagrama N-S.
Metodología de la programación y desarrollo de software 81
EJEMPLO 2.12
Se desea calcular el salario neto semanal de un trabajador (en dólares o en euros) en función del número de horas
trabajadas y la tasa de impuestos:
• las primeras 35 horas se pagan a tarifa normal,
• las horas que pasen de 35 se pagan a 1,5 veces la tarifa normal,
• las tasas de impuestos son:
a) los primeros 1.000 dólares son libres de impuestos,
b) los siguientes 400 dólares tienen un 25 por 100 de impuestos,
c) los restantes, un 45 por 100 de impuestos,
• la tarifa horaria es 15 dólares.
También se desea escribir el nombre, salario bruto, tasas y salario neto (este ejemplo se deja como ejercicio para
el alumno).
Un método general para la resolución de un problema con
computadora tiene las siguientes fases:
1. Análisis del programa.
2. Diseño del algoritmo.
3. Codificación.
4. Compilación y ejecución.
5. Verificación.
6. Documentación y mantenimiento.
El sistema más idóneo para resolver un problema es
descomponerlo en módulos más sencillos y luego, median-
te diseños descendentes y refinamiento sucesivo, llegar a
módulos fácilmente codificables. Estos módulos se deben
codificar con las estructuras de control de programación
estructurada.
1. Secuenciales: las instrucciones se ejecutan sucesi-
vamente una después de otra.
2. Repetitivas: una serie de instrucciones se repiten una
y otra vez hasta que se cumple una cierta condición.
3. Selectivas: permite elegir entre dos alternativas (dos
conjuntos de instrucciones) dependiendo de una con-
dición determinada).
RESUMEN
2.1. Diseñar una solución para resolver cada uno de los
siguientes problemas y tratar de refinar sus soluciones
mediante algoritmos adecuados:
a) Realizar una llamada telefónica desde un teléfono
público.
b) Cocinar una tortilla.
c) Arreglar un pinchazo de una bicicleta.
d) Freír un huevo.
2.2. Escribir un algoritmo para:
a) Sumar dos números enteros.
b) Restar dos números enteros.
c) Multiplicar dos números enteros.
d) Dividir un número entero por otro.
2.3. Escribir un algoritmo para determinar el máximo co-
mún divisor de dos números enteros (MCD) por el
algoritmo de Euclides:
• Dividir el mayor de los dos enteros positivos por el
más pequeño.
• A continuación dividir el divisor por el resto.
• Continuar el proceso de dividir el último divisor por
el último resto hasta que la división sea exacta.
• El último divisor es el mcd.
2.4. Diseñar un algoritmo que lea y visualice una serie de
números distintos de cero. El algoritmo debe terminar
con un valor cero que no se debe visualizar. Visualizar
el número de valores leídos.
EJERCICIOS
82 Fundamentos de programación
2.5. Diseñar un algoritmo que visualice y sume la serie de
números 3, 6, 9, 12…, 99.
2.6. Escribir un algoritmo que lea cuatro números y a con-
tinuación visualice el mayor de los cuatro.
2.7. Diseñar un algoritmo que lea tres números y descubra
si uno de ellos es la suma de los otros dos.
2.8. Diseñar un algoritmo para calcular la velocidad (en
m/s) de los corredores de la carrera de 1.500 metros.
La entrada consistirá en parejas de números (minutos,
segundos) que dan el tiempo del corredor; por cada
corredor, el algoritmo debe visualizar el tiempo en
minutos y segundos, así como la velocidad media.
Ejemplo de entrada de datos: (3,53) (3,40) (3,46)
(3,52) (4,0) (0,0); el último par de datos se utilizará
como fin de entrada de datos.
2.9. Diseñar un algoritmo para determinar los números
primos iguales o menores que N (leído del teclado).
(Un número primo sólo puede ser divisible por él mis-
mo y por la unidad.)
2.10. Escribir un algoritmo que calcule la superficie de un
triángulo en función de la base y la altura (S = 1/2
Base × Altura).
2.11. Calcular y visualizar la longitud de la circunferencia
y el área de un círculo de radio dado.
2.12. Escribir un algoritmo que encuentre el salario sema-
nal de un trabajador, dada la tarifa horaria y el núme-
ro de horas trabajadas diariamente.
2.13. Escribir un algoritmo que indique si una palabra leída
del teclado es un palíndromo. Un palíndromo (capi-
cúa) es una palabra que se lee igual en ambos sentidos
como “radar”.
2.14. Escribir un algoritmo que cuente el número de ocu-
rrencias de cada letra en una palabra leída como en-
trada. Por ejemplo, "Mortimer" contiene dos "m",
una "o", dos "r", una "i", una "t" y una "e".
2.15. Muchos bancos y cajas de ahorro calculan los inte-
reses de las cantidades depositadas por los clientes
diariamente según las premisas siguientes. Un capital
de 1.000 euros, con una tasa de interés del 6 por 100,
renta un interés en un día de 0,06 multiplicado
por 1.000 y dividido por 365. Esta operación pro-
ducirá 0,16 euros de interés y el capital acumulado
será 1.000,16. El interés para el segundo día se cal-
culará multiplicando 0,06 por 1.000 y dividiendo el
resultado por 365. Diseñar un algoritmo que reciba
tres entradas: el capital a depositar, la tasa de interés
y la duración del depósito en semanas, y calcular el
capital total acumulado al final del período de tiempo
especificado.
CAPÍTULO 3
Estructura general de un programa
3.1. Concepto de programa
3.2. Partes constitutivas de un programa
3.3. Instrucciones y tipos de instrucciones
3.4. Elementos básicos de un programa
3.5. Datos, tipos de datos y operaciones primi-
tivas
3.6. Constantes y variables
3.7. Expresiones
3.8. Funciones internas
3.9. La operación de asignación
3.10. Entrada y salida de información
3.11. Escritura de algoritmos/programas
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
CONCEPTOS CLAVE
RESUMEN
EJERCICIOS
En los capítulos anteriores se ha visto la forma de di-
señar algoritmos para resolver problemas con compu-
tadora. En este capítulo se introduce al proceso de la
programación que se manifiesta esencialmente en los
programas.
El concepto de programa como un conjunto de
instrucciones y sus tipos constituye la parte funda-
mental del capítulo. La descripción de los elementos
básicos de programación, que se encontrarán en casi
todos los programas: interruptores, contadores, tota-
lizadores, etc., junto con las normas elementales para
la escritura de algoritmos y programas, conforman el
resto del capítulo.
En el capítulo se examinan los importantes con-
ceptos de datos, constantes y variables, expresiones,
operaciones de asignación y la manipulación de las
entradas y salidas de información, así como la rea-
lización de las funciones internas como elemento
clave en el manejo de datos. Por último se descri-
ben reglas de escritura y de estilo para la realización
de algoritmos y su posterior conversión en pro-
gramas.
INTRODUCCIÓN
84 Fundamentos de programación
3.1. CONCEPTO DE PROGRAMA
Un programa de computadora es un conjunto de instrucciones —órdenes dadas a la máquina— que producirán la
ejecución de una determinada tarea. En esencia, un programa es un medio para conseguir un fin. El fin será proba-
blemente definido como la información necesaria para solucionar un problema.
El proceso de programación es, por consiguiente, un proceso de solución de problemas —como ya se vio en el
Capítulo 2— y el desarrollo de un programa requiere las siguientes fases:
1. definición y análisis del problema;
2. diseño de algoritmos:
• diagrama de flujo,
• diagrama N-S,
• pseudocódigo;
3. codificación del programa;
4. depuración y verificación del programa;
5. documentación;
6. mantenimiento.
Definición
del problema
Diseño
del algoritmo
Codificación
del programa
Depuración
y verificación
D
O
C
U
M
E
N
T
A
C
I
Ó
N
M
A
N
T
E
N
I
M
I
E
N
T
O
Figura 3.1. El proceso de la programación.
Las fases 1 y 2 ya han sido analizadas en los capítulos anteriores y son el objetivo fundamental de este libro; sin
embargo, dedicaremos atención, a lo largo del libro (véase Capítulo 13) y en los apéndices, a las fases 3, 4, 5 y 6,
aunque éstas son propias de libros específicos sobre lenguajes de programación.
3.2. PARTES CONSTITUTIVAS DE UN PROGRAMA
Tras la decisión de desarrollar un programa, el programador debe establecer el conjunto de especificaciones que debe
contener el programa: entrada, salida y algoritmos de resolución, que incluirán las técnicas para obtener las salidas
a partir de las entradas.
Conceptualmente un programa puede ser considerado como una caja negra, como se muestra en la Figura 3.2. La
caja negra o el algoritmo de resolución, en realidad, es el conjunto de códigos que transforman las entradas del pro-
grama (datos) en salidas (resultados).
El programador debe establecer de dónde provienen las entradas al programa. Las entradas, en cualquier caso,
procederán de un dispositivo de entrada —teclado, disco...—. El proceso de introducir la información de entrada
—datos— en la memoria de la computadora se denomina entrada de datos, operación de lectura o acción de
leer.
Las salidas de datos se deben presentar en dispositivos periféricos de salida: pantalla, impresoras, discos, etc. La
operación de salida de datos se conoce también como escritura o acción de escribir.
Estructura general de un programa 85
3.3. INSTRUCCIONES Y TIPOS DE INSTRUCCIONES
El proceso de diseño del algoritmo o posteriormente de codificación del programa consiste en definir las acciones o
instrucciones que resolverán el problema.
Las acciones o instrucciones se deben escribir y posteriormente almacenar en memoria en el mismo orden en que
han de ejecutarse, es decir, en secuencia.
Un programa puede ser lineal o no lineal. Un programa es lineal si las instrucciones se ejecutan secuencialmen-
te, sin bifurcaciones, decisión ni comparaciones.
instrucción 1
instrucción 2
.
.
.
instrucción n
En el caso del algoritmo las instrucciones se suelen conocer como acciones, y se tendría:
acción 1
acción 2
.
.
.
acción n
Un programa es no lineal cuando se interrumpe la secuencia mediante instrucciones de bifurcación.
acción 1
acción 2
.
.
.
acción x
acción n
.
acción n + i
3.3.1. Tipos de instrucciones
Las instrucciones disponibles en un lenguaje de programación dependen del tipo de lenguaje. Por ello, en este apar-
tado estudiaremos las instrucciones —acciones— básicas que se pueden implementar de modo general en un algo-
ritmo y que esencialmente soportan todos los lenguajes. Dicho de otro modo, las instrucciones básicas son indepen-
dientes del lenguaje. La clasificación más usual, desde el punto de vista anterior, es:
Entrada
Programa
(algoritmo de
resolución)
Salida
Figura 3.2. Bloques de un programa.
86 Fundamentos de programación
1. instrucciones de inicio/fin,
2. instrucciones de asignación,
3. instrucciones de lectura,
4. instrucciones de escritura,
5. instrucciones de bifurcación.
Algunas de estas instrucciones se recogen en la Tabla 3.1.
Tabla 3.1. Instrucciones/acciones básicas
Tipo de instrucción Pseudocódigo inglés Pseudocódigo español
comienzo de proceso begin inicio
fin de proceso end fin
entrada (lectura) read leer
salida (escritura) write escribir
asignación A ← 5 B ← 7
3.3.2. Instrucciones de asignación
Como ya son conocidas del lector, repasaremos su funcionamiento con ejemplos:
a) A ← 80 la variable A toma el valor de 80.
b) ¿Cuál será el valor que tomará la variable C tras la ejecución de las siguientes instrucciones?
A ← 12
B ← A
C ← B
A contiene 12, B contiene 12 y C contiene 12.
Nota
Antes de la ejecución de las tres instrucciones, el valor de A, B y C es indeterminado. Si se desea darles un valor
inicial, habrá que hacerlo explícitamente, incluso cuando este valor sea 0. Es decir, habrá que definir e inicializar
las instrucciones.
A ← 0
B ← 0
C ← 0
c) ¿Cuál es el valor de la variable AUX al ejecutarse la instrucción 5?
1. A ← 10
2. B ← 20
3. AUX ← A
4. A ← B
5. B ← AUX
• en la instrucción 1, A toma el valor 10
• en la instrucción 2, B toma el valor 20
• en la instrucción 3, AUX toma el valor anterior de A, o sea 10
• en la instrucción 4, A toma el valor anterior de B, o sea 20
• en la instrucción 5, B toma el valor anterior de AUX, o sea 10
• tras la instrucción 5, AUX sigue valiendo 10.
Estructura general de un programa 87
d) ¿Cuál es el significado de N ← N + 5 si N tiene el valor actual de 2?
N ← N + 5
Se realiza el cálculo de la expresión N + 5 y su resultado 2 + 5 = 7 se asigna a la variable situada a la iz-
quierda, es decir, N tomará un nuevo valor 7.
Se debe pensar en la variable como en una posición de memoria, cuyo contenido puede variar mediante instruc-
ciones de asignación (un símil suele ser un buzón de correos, donde el número de cartas depositadas en él variará
según el movimiento diario del cartero de introducción de cartas o del dueño del buzón de extracción de dichas
cartas).
3.3.3. Instrucciones de lectura de datos (entrada)
Esta instrucción lee datos de un dispositivo de entrada. ¿Cuál será el significado de las instrucciones siguientes?
a) leer (NÚMERO, HORAS, TASA)
Leer del terminal los valores NÚMERO, HORAS y TASAS, archivándolos en la memoria; si los tres números se teclean
en respuesta a la instrucción son 12325, 32, 1200, significaría que se han asignado a las variables esos valores y
equivaldría a la ejecución de las instrucciones.
NÚMERO ← 12325
HORAS ← 32
TASA ← 1200
b) leer (A, B, C)
Si se leen del terminal 100, 200, 300, se asignarían a las variables los siguientes valores:
A = 100
B = 200
C = 300
3.3.4. Instrucciones de escritura de resultados (salida)
Estas instrucciones se escriben en un dispositivo de salida. Explicar el resultado de la ejecución de las siguientes
instrucciones:
A ← 100
B ← 200
C ← 300
escribir (A, B, C)
Se visualizarían en la pantalla o imprimirían en la impresora los valores 100, 200 y 300 que contienen las varia-
bles A, B y C.
3.3.5. Instrucciones de bifurcación
El desarrollo lineal de un programa se interrumpe cuando se ejecuta una bifurcación. Las bifurcaciones pueden ser,
según el punto del programa a donde se bifurca, hacia adelante o hacia atrás.
88 Fundamentos de programación
Bifurcación adelante
(positivo)
Bifurcación atrás
(negativo)
instrucción 1
instrucción 2
instrucción 3
.
.
.
instrucción 8
.
.
última instrucción
instrucción 1
instrucción 2
instrucción 3
.
.
.
instrucción 12
.
.
última instrucción
Las bifurcaciones en el flujo de un programa se realizarán de modo condicional en función del resultado de la
evaluación de la condición.
Bifurcación incondicional: la bifurcación se realiza siempre que el flujo del programa pase por la instrucción sin
necesidad del cumplimiento de ninguna condición (véase Figura 3.3).
Programa
fuente
Compilador
Existen
errores en la
compilación
Programa
Programa
ejecutable
Ejecución
Montador
Modificación
programa
fuente
Datos
programa
ejecutable
Computadora
Programa
Resultados
sí
no
Figura 3.3. Fases de la ejecución de un programa.
Estructura general de un programa 89
Bifurcación condicional: la bifurcación depende del cumplimiento de una determinada condición. Si se cumple
la condición, el flujo sigue ejecutando la acción F2. Si no se cumple, se ejecuta la acción F1 (véase Figura 3.4).
acción F1
¿condición?
acción F2
no sí
Figura 3.4. Bifurcación condicional.
3.4. ELEMENTOS BÁSICOS DE UN PROGRAMA
En programación se debe separar la diferencia entre el diseño del algoritmo y su implementación en un lenguaje
específico. Por ello, se debe distinguir claramente entre los conceptos de programación y el medio en que ellos se
implementan en un lenguaje específico. Sin embargo, una vez que se comprendan cómo utilizar los conceptos de
programación y, la enseñanza de un nuevo lenguaje es relativamente fácil.
Los lenguajes de programación —como los restantes lenguajes— tienen elementos básicos que se utilizan como
bloques constructivos, así como reglas para las que esos elementos se combinan. Estas reglas se denominan sintaxis
del lenguaje. Solamente las instrucciones sintácticamente correctas pueden ser interpretadas por la computadora y los
programas que contengan errores de sintaxis son rechazados por la máquina. Los elementos básicos constitutivos de
un programa o algoritmo son:
• palabras reservadas (inicio, fin, si-entonces..., etc.),
• identificadores (nombres de variables esencialmente, procedimientos, funciones, nombre del programa, etc.),
• caracteres especiales (coma, apóstrofo, etc.),
• constantes,
• variables,
• expresiones,
• instrucciones.
Además de estos elementos básicos, existen otros elementos que forman parte de los programas, cuya compren-
sión y funcionamiento será vital para el correcto diseño de un algoritmo y naturalmente la codificación del programa.
Estos elementos son:
• bucles,
• contadores,
• acumuladores,
• interruptores,
• estructuras:
1. secuenciales,
2. selectivas,
3. repetitivas.
El amplio conocimiento de todos los elementos de programación y el modo de su integración en los programas
constituyen las técnicas de programación que todo buen programador debe conocer.
3.5. DATOS, TIPOS DE DATOS Y OPERACIONES PRIMITIVAS
El primer objetivo de toda computadora es el manejo de la información o datos. Estos datos pueden ser las cifras de
ventas de un supermercado o las calificaciones de una clase. Un dato es la expresión general que describe los objetos
90 Fundamentos de programación
con los cuales opera una computadora. La mayoría de las computadoras pueden trabajar con varios tipos (modos) de
datos. Los algoritmos y los programas correspondientes operan sobre esos tipos de datos.
La acción de las instrucciones ejecutables de las computadoras se refleja en cambios en los valores de las partidas
de datos. Los datos de entrada se transforman por el programa, después de las etapas intermedias, en datos de sali-
da.
En el proceso de resolución de problemas el diseño de la estructura de datos es tan importante como el diseño
del algoritmo y del programa que se basa en el mismo.
Un programa de computadora opera sobre datos (almacenados internamente en la memoria almacenados en me-
dios externos como discos, memorias USB, memorias de teléfonos celulares, etc., o bien introducidos desde un dis-
positivo como un teclado, un escáner o un sensor eléctrico). En los lenguajes de programación los datos deben de ser
de un tipo de dato específico. El tipo de datos determina cómo se representan los datos en la computadora y los di-
ferentes procesos que dicha computadora realiza con ellos.
Tipo de datos
Conjunto específico de valores de los datos y un conjunto de operaciones que actúan sobre esos datos.
Existen dos tipos de datos: básicos, incorporados o integrados (estándar) que se incluyen en los lenguajes de
programación; definidos por el programador o por el usuario.
Además de los datos básicos o simples, se pueden construir otros datos a partir de éstos, y se obtienen los datos
compuestos o datos agregados, tales como estructuras, uniones, enumeraciones (subrango, como caso particular
de las enumeraciones, al igual de lo que sucede en Pascal), vectores o matrices/tablas y cadenas “arrays o arre-
glos”; también existen otros datos especiales en lenguajes como C y C++, denominados punteros (apuntadores) y
referencias.
Existen dos tipos de datos: simples (sin estructura) y compuestos (estructurados). Los datos estructurados se es-
tudian a partir del Capítulo 6 y son conjuntos de partidas de datos simples con relaciones definidas entre ellos.
Los distintos tipos de datos se representan en diferentes formas en la computadora. A nivel de máquina, un dato
es un conjunto o secuencia de bits (dígitos 0 o 1). Los lenguajes de alto nivel permiten basarse en abstracciones e
ignorar los detalles de la representación interna. Aparece el concepto de tipo de datos, así como su representación.
Los tipos de datos básicos son los siguientes:
numéricos (entero, real)
lógicos (boolean)
carácter (caracter, cadena)
Existen algunos lenguajes de programación —FORTRAN esencialmente— que admiten otros tipos de datos:
complejos, que permiten tratar los números complejos, y otros lenguajes —Pascal— que también permiten declarar
y definir sus propios tipos de datos: enumerados (enumerated) y subrango (subrange).
3.5.1. Datos numéricos
El tipo numérico es el conjunto de los valores numéricos. Estos pueden representarse en dos formas distintas:
• tipo numérico entero (integer).
• tipo numérico real (real).
Enteros: el tipo entero es un subconjunto finito de los números enteros. Los enteros son números completos, no
tienen componentes fraccionarios o decimales y pueden ser negativos o positivos. Ejemplos de números enteros son:
5 6
–15 4
20 17
1340 26
Estructura general de un programa 91
Los números enteros se pueden representar en 8, 16 o 32 bits, e incluso 64 bits, y eso da origen a una escala de
enteros cuyos rangos dependen de cada máquina
Enteros –32.768 a 32.767
Enteros cortos –128 a 127
Enteros largos –2147483648 a 2147483647
Además de los modificadores corto y largo, se pueden considerar sin signo (unsigned) y con signo
(signed).
sin signo: 0 .. 65.5350
0 .. 4294967296
Los enteros se denominan en ocasiones números de punto o coma fija. Los números enteros máximos y mínimos
de una computadora1
suelen ser –32.768 a +32.767. Los números enteros fuera de este rango no se suelen representar
como enteros, sino como reales, aunque existen excepciones en los lenguajes de programación modernos como C,
C++ y Java.
Reales: el tipo real consiste en un subconjunto de los números reales. Los números reales siempre tienen un pun-
to decimal y pueden ser positivos o negativos. Un número real consta de un entero y una parte decimal. Los siguien-
tes ejemplos son números reales:
0.08 3739.41
3.7452 –52.321
–8.12 3.0
En aplicaciones científicas se requiere una representación especial para manejar números muy grandes, como la
masa de la Tierra, o muy pequeños, como la masa de un electrón. Una computadora sólo puede representar un nú-
mero fijo de dígitos. Este número puede variar de una máquina a otra, siendo ocho dígitos un número típico. Este
límite provocará problemas para representar y almacenar números muy grandes o muy pequeños como son los ya
citados o los siguientes:
4867213432 0.00000000387
Existe un tipo de representación denominado notación exponencial o científica y que se utiliza para números muy
grandes o muy pequeños. Así,
367520100000000000000
se representa en notación científica descomponiéndolo en grupos de tres dígitos
367 520 100 000 000 000 000
y posteriormente en forma de potencias de 10
3.675201 x 1020
y de modo similar
.0000000000302579
se representa como
3.02579 x 10–11
1
En computadoras de 16 bits como IBM PC o compatibles.
92 Fundamentos de programación
La representación en coma flotante es una generalización de notación científica. Obsérvese que las siguientes
expresiones son equivalentes:
3.675201 x 1019
= .3675207 x 1020
= .03675201 x 1021
= ...
= 36.75201 x 1018
= 367.5201 x 1017
= ...
En estas expresiones se considera la mantisa (parte decimal) al número real y el exponente (parte potencial) el
de la potencia de diez.
36.75201 mantisa 18 exponente
Los tipos de datos reales se representan en coma o punto flotante y suelen ser de simple precisión, doble precisión
o cuádruple precisión y suelen requerir 4 bytes, 8 bytes o 10-12 bytes, respectivamente. La Tabla 3.2 muestra los
datos reales típicos en compiladores C/C++.
Tabla 3.2. Tipos de datos reales (coma flotante) en el lenguaje C/C++
Tipo Rango de valores
real (float) -3.4 x 1038
.. 3.4 x 1038
doble (double) -1.7 x 10-308
.. 1.7 x 10308
3.5.2. Datos lógicos (booleanos)
El tipo lógico —también denominado booleano— es aquel dato que sólo puede tomar uno de dos valores:
cierto o verdadero (true) y falso (false).
Este tipo de datos se utiliza para representar las alternativas (sí/no) a determinadas condiciones. Por ejemplo,
cuando se pide si un valor entero es par, la respuesta será verdadera o falsa, según sea par o impar.
C++ y Java soportan el tipo de dato bool.
3.5.3. Datos tipo carácter y tipo cadena
El tipo carácter es el conjunto finito y ordenado de caracteres que la computadora reconoce. Un dato tipo carácter
contiene un solo carácter. Los caracteres que reconocen las diferentes computadoras no son estándar; sin embargo,
la mayoría reconoce los siguientes caracteres alfabéticos y numéricos:
• caracteres alfabéticos (A, B, C, ..., Z) (a, b, c, ..., z),
• caracteres numéricos (1, 2, ..., 9, 0),
• caracteres especiales (+, -, *, /, ^, ., ;, <, >, $, ...).
Una cadena (string) de caracteres es una sucesión de caracteres que se encuentran delimitados por una comilla
(apóstrofo) o dobles comillas, según el tipo de lenguaje de programación. La longitud de una cadena de caracteres es
el número de ellos comprendidos entre los separadores o limitadores. Algunos lenguajes tienen datos tipo cadena.
'Hola Mortimer'
'12 de octubre de 1492'
'Sr. McKoy'
3.6. CONSTANTES Y VARIABLES
Los programas de computadora contienen ciertos valores que no deben cambiar durante la ejecución del programa.
Tales valores se llaman constantes. De igual forma, existen otros valores que cambiarán durante la ejecución del
Estructura general de un programa 93
programa; a estos valores se les llama variables. Una constante es un dato que permanece sin cambios durante todo
el desarrollo del algoritmo o durante la ejecución del programa.
Constantes reales válidas Constantes reales no válidas
1.234 1,752.63 (comas no permitidas)
–0.1436 82 (normalmente contienen un punto decimal, aunque exis-
ten lenguajes que lo admiten sin punto)
+ 54437324
Constantes reales en notación científica
3.374562E equivale a 3.374562 × 102
Una constante tipo carácter o constante de caracteres consiste en un carácter válido encerrado dentro de após-
trofos; por ejemplo,
'B' '+' '4' ';'
Si se desea incluir el apóstrofo en la cadena, entonces debe aparecer como un par de apóstrofos, encerrados den-
tro de simples comillas.
""
Una secuencia de caracteres se denomina normalmente una cadena y una constante tipo cadena es una cadena
encerrada entre apóstrofos. Por consiguiente,
'Juan Minguez'
y
'Pepe Luis Garcia'
son constantes de cadena válidas. Nuevamente, si un apóstrofo es uno de los caracteres en una constante de cadena,
debe aparecer como un par de apóstrofos
'John"s'
Constantes lógicas (boolean)
Sólo existen dos constantes lógicas o boolean:
verdadero falso
La mayoría de los lenguajes de programación permiten diferentes tipos de constantes: enteras, reales, caracteres
y boolean o lógicas, y representan datos de esos tipos.
Una variable es un objeto o tipo de datos cuyo valor puede cambiar durante el desarrollo del algoritmo o ejecu-
ción del programa. Dependiendo del lenguaje, hay diferentes tipos de variables, tales como enteras, reales, carácter,
lógicas y de cadena. Una variable que es de un cierto tipo puede tomar únicamente valores de ese tipo. Una variable
de carácter, por ejemplo, puede tomar como valor sólo caracteres, mientras que una variable entera puede tomar sólo
valores enteros.
Si se intenta asignar un valor de un tipo a una variable de otro tipo se producirá un error de tipo.
Una variable se identifica por los siguientes atributos: nombre que lo asigna y tipo que describe el uso de la va-
riable.
Los nombres de las variables, a veces conocidos como identificadores, suelen constar de varios caracteres al-
fanuméricos, de los cuales el primero normalmente es una letra. No se deben utilizar —aunque lo permita el lengua-
94 Fundamentos de programación
je, caso de FORTRAN— como nombres de identificadores palabras reservadas del lenguaje de programación. Nom-
bres válidos de variables son:
A510
NOMBRES Letra SalarioMes
NOTAS Horas SegundoApellido
NOMBRE_APELLIDOS2
Salario Ciudad
Los nombres de las variables elegidas para el algoritmo o el programa deben ser significativos y tener relación
con el objeto que representan, como pueden ser los casos siguientes:
NOMBRE para representar nombres de personas
PRECIOS para representar los precios de diferentes artículos
NOTAS para representar las notas de una clase
Existen lenguajes —Pascal— en los que es posible darles nombre a determinadas constantes típicas utilizadas en
cálculos matemáticos, financieros, etc. Por ejemplo, las constantes π = 3.141592... y e = 2.718228 (base de los loga-
ritmos naturales) se les pueden dar los nombres PI y E.
PI = 3.141592
E = 2.718228
3.6.1. Declaración de constants y variables
Normalmente los identificadores de las variables y de las constantes con nombre deben ser declaradas en los progra-
mas antes de ser utilizadas. La sintaxis de la declaración de una variable suele ser:
<tipo_de_dato> <nombre_variable> [=<expresión>]
EJEMPLO
car letra, abreviatura
ent numAlumnos = 25
real salario = 23.000
Si se desea dar un nombre (identificador) y un valor a una constante de modo que su valor no se pueda modificar
posteriormente, su sintaxis puede ser así:
const <tipo_de_dato> <nombre_constante> =<expresión>
EJEMPLO
const doble PI = 3.141592
const cad nombre = 'Mackoy'
const car letra = 'c'
3.7. EXPRESIONES
Las expresiones son combinaciones de constantes, variables, símbolos de operación, paréntesis y nombres de funcio-
nes especiales. Las mismas ideas son utilizadas en notación matemática tradicional; por ejemplo,
a + (b + 3) + √
c
2
Algunos lenguajes de programación admiten como válido el carácter subrayado en los identificadores.
Estructura general de un programa 95
Aquí los paréntesis indican el orden de cálculo y √
 representa la función raíz cuadrada.
Cada expresión toma un valor que se determina tomando los valores de las variables y constantes implicadas y
la ejecución de las operaciones indicadas. Una expresión consta de operandos y operadores. Según sea el tipo de
objetos que manipulan, las expresiones se clasifican en:
• aritméticas,
• relacionales,
• lógicas,
• carácter.
El resultado de la expresión aritmética es de tipo numérico; el resultado de la expresión relacional y de una ex-
presión lógica es de tipo lógico; el resultado de una expresión carácter es de tipo carácter.
3.7.1. Expresiones aritméticas
Las expresiones aritméticas son análogas a las fórmulas matemáticas. Las variables y constantes son numéricas (real
o entera) y las operaciones son las aritméticas.
+ suma
- resta
* multiplicación
/ división
↑, **, ^ exponenciación
div, / división entera
mod, % módulo (resto)
Los símbolos +, –, *, ^ (↑ o **) y las palabras clave div y mod se conocen como operadores aritméticos. En la
expresión
5 + 3
los valores 5 y 3 se denominan operandos. El valor de la expresión 5 + 3 se conoce como resultado de la expre-
sión.
Los operadores se utilizan de igual forma que en matemáticas. Por consiguiente, A ∙ B se escribe en un algo-
ritmo como A * B y 1/4 ∙ C como C/4. Al igual que en matemáticas el signo menos juega un doble papel, como
resta en A – B y como negación en –A.
Todos los operadores aritméticos no existen en todos los lenguajes de programación; por ejemplo, en FORTRAN
no existe div y mod. El operador exponenciación es diferente según sea el tipo de lenguaje de programación
elegido (^, ↑ en BASIC, ** en FORTRAN).
Los cálculos que implican tipos de datos reales y enteros suelen dar normalmente resultados del mismo tipo si
los operandos lo son también. Por ejemplo, el producto de operandos reales produce un real (véase Tabla 3.3).
EJEMPLO
5 x 7 se representa por 5 * 7
6
4
se representa por 6/4
37
se representa por 3^7
96 Fundamentos de programación
Tabla 3.3. Operadores aritméticos
Operador Significado Tipos de operandos Tipo de resultado
+ Signo positivo Entero o real Entero o real
– Signo negativo Entero o real Entero o real
* Multiplicación Entero o real Entero o real
/ División Real Real
div, / División entera Entero Entero
mod, % Módulo (resto) Entero Entero
++ Incremento Entero Entero
–– Decremento Entero Entero
Operadores DIV (/) y MOD (%)
El símbolo / se utiliza para la división real y la división entera (el operador div —en algunos lenguajes, por ejemplo
BASIC, se suele utilizar el símbolo — representa la división entera). El operador mod representa el resto de la divi-
sión entera, y la mayoría de lenguajes utilizan el símbolo %.
A div B
Sólo se puede utilizar si A y B son expresiones enteras y obtiene la parte entera de A/B. Por consiguiente,
19 div 6 19/6
toma el valor 3. Otro ejemplo puede ser la división 15/6
15 |6
3 2 cociente
|
resto
En forma de operadores resultará la operación anterior
15 div 6 = 2 15 mod 6 = 3
Otros ejemplos son:
19 div 3 equivale a 6
19 mod 6 equivale a 1
EJEMPLO 3.1
Los siguientes ejemplos muestran resultados de expresiones aritméticas:
expresión resultado expresión resultado
10.5/3.0 3.5 10/3 3
1/4 0.25 18/2 9
2.0/4.0 0.5 30/30 1
6/1 6.0 6/8 0
30/30 1.0 10%3 1
6/8 0.75 10%2 0
Estructura general de un programa 97
Operadores de incremento y decremento
Los lenguajes de programación C/C++, Java y C# soportan los operadores unitarios (unarios) de incremento, ++, y
decremento, --. El operador de incremento (++) aumenta el valor de su operando en una unidad, y el operador de
decremento (--) disminuye también en una unidad. El valor resultante dependerá de que el operador se emplee como
prefijo o como sufijo (antes o después de la variable). Si actúa como prefijo, el operador cambia el valor de la varia-
ble y devuelve este nuevo valor; en caso contrario, si actúa como sufijo, el resultado de la expresión es el valor de la
variable, y después se modifica esta variable.
++i Incrementa i en 1 y después utiliza el valor de i en la correspondiente expresión.
i++ Utiliza el valor de i en la expresión en que se encuentra y después se incrementa en 1.
--i Decrementa i en 1 y después utiliza el nuevo valor de i en la correspondiente expresión.
i-i-- Utiliza el valor de i en la expresión en que se encuentra y después se incrementa en 1.
EJEMPLO:
n = 5
escribir n
escribir n++
escribir n
n = 5
escribir n
escribir ++n
escribir n
Al ejecutarse el algoritmo se obtendría:
5
5
6
5
6
6
3.7.2. Reglas de prioridad
Las expresiones que tienen dos o más operandos requieren unas reglas matemáticas que permitan determinar el orden
de las operaciones, se denominan reglas de prioridad o precedencia y son:
1. Las operaciones que están encerradas entre paréntesis se evalúan primero. Si existen diferentes paréntesis
anidados (interiores unos a otros), las expresiones más internas se evalúan primero.
2. Las operaciones aritméticas dentro de una expresión suelen seguir el siguiente orden de prioridad:
• operador ( )
• operadores ++, – – + y – unitarios,
• operadores *, /, % (producto, división, módulo)
• operadores +, – (suma y resta).
En los lenguajes que soportan la operación de exponenciación, este operador tiene la mayor prioridad.
En caso de coincidir varios operadores de igual prioridad en una expresión o subexpresión encerrada entre parén-
tesis, el orden de prioridad en este caso es de izquierda a derecha, y a esta propiedad se denomina asociatividad.
98 Fundamentos de programación
EJEMPLO 3.2
¿Cuál es el resultado de las siguientes expresiones?
a) 3 + 6 * 14 b) 8 + 7 * 3 + 4 * 6
Solución
a) 3 + 6 * 14 b) 8 + 7 * 3 + 4 * 6
{
{
{
3 + 84 8 + 21 24
{
{
87 29 + 24
{
53
EJEMPLO 3.3
Obtener los resultados de las expresiones:
–4 * 7 + 2 ^ 3 / 4 – 5
Solución
–4 * 7 + 2 ^ 3 / 4 – 5
resulta
–4 * 7 + 8 / 4 – 5
–28 + 8 / 4 – 5
–28 + 2 - 5
–26 - 5
–31
EJEMPLO 3.4
Convertir en expresiones aritméticas algorítmicas las siguientes expresiones algebraicas:
5 ∙ (x + y) a2
+ b2
x + y
u +
w
a
x
y
· (z + w)
Los resultados serán:
5 ∗ (x + y)
a ^2 + b ^2
(x + y) / (u + w/a)
x / y ∗ (z + w)
EJEMPLO 3.5
Los paréntesis tienen prioridad sobre el resto de las operaciones:
A * (B + 3) la constante 3 se suma primero al valor de B, después este resultado se multipli-
ca por el valor de A.
Estructura general de un programa 99
(A * B) + 3 A y B se multiplican primero y a continuación se suma 3.
A + (B + C) + D esta expresión equivale a A + B + C + D
(A + B/C) + D equivale a A + B/C + D
A * B/C * D equivale a ((A * B)/C) * D y no a (A * B)/(C * D).
EJEMPLO 3.6
Evaluar la expresión 12 + 3 * 7 + 5 * 4.
En este ejemplo existen dos operadores de igual prioridad, * (multiplicación); por ello los pasos sucesivos son:
12 + 3 * 7 + 5 * 4
{
21
12 + 21 + 5 * 4
{
20
12 + 21 + 20 = 53
3.7.3. Expresiones lógicas (booleanas)
Un segundo tipo de expresiones es la expresión lógica o booleana, cuyo valor es siempre verdadero o falso. Recuer-
de que existen dos constantes lógicas, verdadera (true) y falsa (false) y que las variables lógicas pueden tomar sólo
estos dos valores. En esencia, una expresión lógica es una expresión que sólo puede tomar estos dos valores, verda-
dero y falso. Se denominan también expresiones booleanas en honor del matemático británico George Boole, que
desarrolló el Álgebra lógica de Boole.
Las expresiones lógicas se forman combinando constantes lógicas, variables lógicas y otras expresiones lógicas,
utilizando los operadores lógicos not, and y or y los operadores relacionales (de relación o comparación) =, ,
, =, =, .
Operadores de relación
Los operadores relacionales o de relación permiten realizar comparaciones de valores de tipo numérico o carácter.
Los operadores de relación sirven para expresar las condiciones en los algoritmos. Los operadores de relación se
recogen en la Tabla 3.4. El formato general para las comparaciones es
expresión1 operador de relación expresión2
y el resultado de la operación será verdadero o falso. Así, por ejemplo, si A = 4 y B = 3, entonces
A  B es verdadero
Tabla 3.4. Operadores de relación
Operador Significado
 menor que
 mayor que
=, == igual que
= menor o igual que
= mayor o igual que
, != distinto de
100 Fundamentos de programación
mientras que
(A – 2)  (B – 4) es falso.
Los operadores de relación se pueden aplicar a cualquiera de los cuatro tipos de datos estándar: enteros, real,
lógico, carácter. La aplicación a valores numéricos es evidente. Los ejemplos siguientes son significativos:
N1 N2 Expresión lógica Resultado
3 6 3  6 verdadero
0 1 0  1 falso
4 2 4 = 2 falso
8 5 8 = 5 falso
9 9 9 = 9 verdadero
5 5 5  5 falso
Para realizar comparaciones de datos tipo carácter, se requiere una secuencia de ordenación de los caracteres
similar al orden creciente o decreciente. Esta ordenación suele ser alfabética, tanto mayúsculas como minúsculas, y
numérica, considerándolas de modo independiente. Pero si se consideran caracteres mixtos, se debe recurrir a un
código normalizado como es el ASCII (véase Apéndice A). Aunque no todas las computadoras siguen el código nor-
malizado en su juego completo de caracteres, sí son prácticamente estándar los códigos de los caracteres alfanumé-
ricos más usuales. Estos códigos normalizados son:
• Los caracteres especiales #, %, $, (, ), +, –, /, ..., exigen la consulta del código de ordenación.
• Los valores de los caracteres que representan a los dígitos están en su orden natural. Esto es, '0''1',
'1''2', ..., '8''9'.
• Las letras mayúsculas A a Z siguen el orden alfabético ('A''B', 'C''F', etc.).
• Si existen letras minúsculas, éstas siguen el mismo criterio alfabético ('a''b', 'c''h', etc.).
En general, los cuatro grupos anteriores están situados en el código ASCII en orden creciente. Así, '1''A' y
'B''C'. Sin embargo, para tener completa seguridad será preciso consultar el código de caracteres de su compu-
tadora (normalmente, el ASCII, American Standar Code for Information Interchange o bien el ambiguo código
EBCDIC, Extended Binary-Coded Decimal Interchange Code, utilizado en computadoras IBM diferentes a los mo-
delos PC y PS/2).
Cuando se utilizan los operadores de relación, con valores lógicos, la constante false (falsa) es menor que la
constante true (verdadera).
false  true
true  false
Si se utilizan los operadores relacionales = y  para comparar cantidades numéricas, es importante recordar que
la mayoría de los valores reales no pueden ser almacenados exactamente. En consecuencia, las expresiones lógicas
formales con comparación de cantidades reales con (=), a veces se evalúan como falsas, incluso aunque estas canti-
dades sean algebraicamente iguales. Así,
(1.0 / 3.0) * 3.0 = 1.0
teóricamente es verdadera y, sin embargo, al realizar el cálculo en una computadora se puede obtener .999999...
y, en consecuencia, el resultado es falso; esto es debido a la precisión limitada de la aritmética real en las computa-
doras. Por consiguiente, a veces deberá excluir las comparaciones con datos de tipo real.
Estructura general de un programa 101
Operadores lógicos
Los operadores lógicos o booleanos básicos son not (no), and (y) y or (o). La Tabla 3.5 recoge el funciona-
miento de dichos operadores.
Tabla 3.5. Operadores lógicos
Operador lógico Expresión lógica Significado
no (not), ! no p (not p) negación de p
y (and),  p y q (p and q) conjunción de p y q
o (o), || p o q (p o q) disyunción de p y q
Las definiciones de las operaciones no, y, o se resumen en unas tablas conocidas como tablas de verdad.
a no a
verdadero
falso
falso
verdadero
no (610) es verdadera
ya que (610) es falsa.
a b a y b
verdadero
verdadero
falso
falso
verdadero
falso
verdadero
falso
verdadero
falso
falso
falso
a y b es verdadera sólo
si a y b son verdaderas.
a b a o b
verdadero
verdadero
falso
falso
verdadero
falso
verdadero
falso
verdadero
verdadero
verdadero
falso
a o b es verdadera cuando
a, b o ambas son verdaderas.
En las expresiones lógicas se pueden mezclar operadores de relación y lógicos. Así, por ejemplo,
(1  5) y (5  10) es verdadera
(5  10) o ('A'  'B') es verdadera, ya que 'A'  'B'
EJEMPLO 3.7
La Tabla 3.6 resume una serie de aplicaciones de expresiones lógicas.
Tabla 3.6. Aplicaciones de expresiones lógicas
Expresión lógica Resultado Observaciones
(1  0) y (3 = 3) verdadero
no PRUEBA verdadero ∙PRUEBA es un valor lógico falso.
(0  5) o (0  5) verdadero
(5 = 7) y (2  4) falso
no (5  5) verdadero
(numero = 1) o (7 = 4) verdadero ∙numero es una variable entera de valor 5.
102 Fundamentos de programación
Prioridad de los operadores lógicos
Los operadores aritméticos seguían un orden específico de prioridad cuando existía más de un operador en las expre-
siones. De modo similar, los operadores lógicos y relaciones tienen un orden de prioridad.
Tabla 3.7. Prioridad de operadores (lenguaje Pascal)
Operador Prioridad
no (not) más alta (primera ejecutada).
/, *, div, mod, y (and)
+, -, o (or)
, , =, =, =,  más baja (última ejecutada).
Tabla 3.8. Prioridad de operadores (lenguajes C, C++, C# y Java)
Operador Prioridad
++ y -- (incremento y decremento en 1), +, –, ! más alta
*, /, % (módulo de la división entera)
+, - (suma, resta)
, =, , =
== (igual a), != (no igual a)
 (y lógica, AND)
|| (o lógica, or)
=, +=, -=, *=, /=, %= (operadores de asignación) más baja
Al igual que en las expresiones aritméticas, los paréntesis se pueden utilizar y tendrán prioridad sobre cualquier
operación.
EJEMPLO 3.8
no 4  6 produce un error, ya que el operador no se aplica a 4
no (4  14) produce un valor verdadero
(1.0  x) y (x  z + 7.0) si x vale 7 y z vale 4, se obtiene un valor verdadero
3.8. FUNCIONES INTERNAS
Las operaciones que se requieren en los programas exigen en numerosas ocasiones, además de las operaciones de las
operaciones aritméticas básicas, ya tratadas, un número determinado de operadores especiales que se denominan
funciones internas, incorporadas o estándar. Por ejemplo, la función ln se puede utilizar para determinar el logaritmo
neperiano de un número y la función raiz2 (sqrt) calcula la raíz cuadrada de un número positivo. Existen otras
funciones que se utilizan para determinar las funciones trigonométricas.
La Tabla 3.9 recoge las funciones internas más usuales, siendo x el argumento de la función.
Tabla 3.9. Funciones internas
Función Descripción Tipo de argumento Resultado
abs(x) valor absoluto de x entero o real igual que argumento
arctan(x) arco tangente de x entero o real real
cos(x) coseno de x entero o real real
Estructura general de un programa 103
EJEMPLO 3.9
Las funciones aceptan argumentos reales o enteros y sus resultados dependen de la tarea que realice la función:
Expresión Resultado
raiz2 (25) 5
redondeo (6.5) 7
redondeo (3.1) 3
redondeo (–3.2) –3
trunc (5.6) 5
trunc (3.1) 3
trunc (–3.8) –3
cuadrado (4) 16
abs (9) 9
abs (-12) 12
EJEMPLO 3.10
Utilizar las funciones internas para obtener la solución de la ecuación cuadrática ax2
+ bx + c = 0. Las raíces de
la ecuación son:
x
b b ac
a
=
− ± −
2
4
2
o lo que es igual:
x
b b ac
a
x
b b ac
a
1
4
2
2
4
2
2 2
=
− −
=
− − −
+
Las expresiones se escriben como
x1 = (-b + raiz2 (cuadrado(b) - 4 * a * c)) / (2 * a)
x2 = (-b - raiz2 (cuadrado(b) - 4 * a * c)) / (2 * a)
Función Descripción Tipo de argumento Resultado
exp(x) exponencial de x entero o real real
ln(x) logaritmo neperiano de x entero o real real
log10(x) logaritmo decimal de x entero o real real
redondeo(x) redondeo de x real entero
(round(x))*
seno(x) seno de x entero o real real
(sin(x))*
cuadrado(x) cuadrado de x entero o real igual que argumento
(sqr(x))*
raiz2(x) raíz cuadrada de x entero o real real
(sqrt(x))*
trunc(x) truncamiento de x real entero
* Terminología en inglés.
Tabla 3.9. Funciones internas (continuación)
104 Fundamentos de programación
Si el valor de la expresión
raiz2 (cuadrado(b) - 4 * a * c)
es negativo se producirá un error, ya que la raíz cuadrada de un número negativo no está definida.
3.9. LA OPERACIÓN DE ASIGNACIÓN
La operación de asignación es el modo de almacenar valores a una variable. La operación de asignación se represen-
ta con el símbolo u operador ← (en la mayoría de los lenguajes de programación, como C, C++, Java, el signo de la
operación asignación es =). La operación de asignación se conoce como instrucción o sentencia de asignación cuan-
do se refiere a un lenguaje de programación. El formato general de una operación de asignación es
nombre de la variable ← expresión
expresión es igual a expresión, variable o constante
La flecha (operador de asignación) se sustituye en otros lenguajes por = (Visual Basic, FORTRAN), := (Pascal)
o = (Java, C++, C#). Sin embargo, es preferible el uso de la flecha en la redacción del algoritmo para evitar ambi-
güedades, dejando el uso del símbolo = exclusivamente para el operador de igualdad.
La operación de asignación:
A ← 5
significa que a la variable A se le ha asignado el valor 5.
La acción de asignar es destructiva, ya que el valor que tuviera la variable antes de la asignación se pierde y se
reemplaza por el nuevo valor. Así, en la secuencia de operaciones
A ← 25
A ← 134
A ← 5
cuando éstas se ejecutan, el valor último que toma A será 5 (los valores 25 y 134 han desaparecido).
La computadora ejecuta la sentencia de asignación en dos pasos. En el primero de ellos, el valor de la expresión
al lado derecho del operador se calcula, obteniéndose un valor de un tipo específico. En el segundo caso, este valor
se almacena en la variable cuyo nombre aparece a la izquierda del operador de asignación, sustituyendo al valor que
tenía anteriormente.
X ← Y + 2
el valor de la expresión Y + 2 se asigna a la variable X.
Es posible utilizar el mismo nombre de variable en ambos lados del operador de asignación. Por ello, acciones
como
N ← N + 1
tienen sentido; se determina el valor actual de la variable N, se incrementa en 1 y a continuación el resultado se
asigna a la misma variable N. Sin embargo, desde el punto de vista matemático no tiene sentido N ← N + 1.
Las acciones de asignación se clasifican según sea el tipo de expresiones en: aritméticas, lógicas y de ca-
racteres.
Estructura general de un programa 105
3.9.1. Asignación aritmética
Las expresiones en las operaciones de asignación son aritméticas:
AMN ← 3 + 14 + 8 se evalúa la expresión 3 + 14 + 8 y se asigna a la variable AMN, es decir,
25 será el valor que toma AMN
TER1 ← 14.5 + 8
TER2 ← 0.75 * 3.4
COCIENTE ← TER1/TER2
Se evalúan las expresiones 14.5 + 8 y 0.75 * 3.4 y en la tercera acción se dividen los resultados de cada ex-
presión y se asigna a la variable COCIENTE, es decir, las tres operaciones equivalen a COCIENTE ← (14.5 + 8)/
(0.75 * 3.4).
Otro ejemplo donde se pueden comprender las modificaciones de los valores almacenados en una variable es el
siguiente:
A ← 0 la variable A toma el valor 0
N ← 0 la variable N toma el valor 0
A ← N + 1 la variable A toma el valor 0 + 1, es decir 1.
El ejemplo anterior se puede modificar para considerar la misma variable en ambos lados del operador de asig-
nación:
N ← 2
N ← N + 1
En la primera acción N toma el valor 2 y en la segunda se evalúa la expresión N + 1, que tomará el valor 2 +
1 = 3 y se asignará nuevamente a N, que tomará el valor 3.
3.9.2. Asignación lógica
La expresión que se evalúa en la operación de asignación es lógica. Supóngase que M, N y P son variables de tipo
lógico.
M ← 8  5
N ← M o (7 = 12)
P ← 7  6
Tras evaluar las operaciones anteriores, las variables M, N y P tomarán los valores falso, verdadero, verdadero.
3.9.3. Asignación de cadenas de caracteres
La expresión que se evalúa es de tipo cadena:
x ← '12 de octubre de 1942'
La acción de asignación anterior asigna la cadena de caracteres '12 de octubre de 1942' a la variable tipo
cadena x.
3.9.4. Asignación múltiple
Todos los lenguajes modernos admiten asignaciones múltiples y con combinaciones de operadores, además de la
asignación única con el operador ← . Así se puede usar el operador de asignación (←) precedido por cualquiera de
los siguientes operadores aritméticos: +, –, *, /, %. La sintaxis es la siguiente:
nombre_variable ← variable operador expresión
106 Fundamentos de programación
y es equivalente a:
variable operador ← expresión
EJEMPLO
c ← c + 5 equivale a c +← 5
a ← a * (b + c) equivale a a *← b + c
o si lo prefiere utilizando el signo de asignación (=) de C, C++, Java o C#.
Caso especial
Los lenguajes C, C++, Java y C# permiten realizar múltiples asignaciones en una sola sentencia
a = b = c = d = e = n +35;
Tabla 3.10. Operadores aritméticos de asignación múltiple
Operador de asignación Ejemplo Operación Resultado
Entero a = 3, b= 5, c = 4, d = 6, e = 10
*= a += 8 a = a+8 a = 11
-= b -= 5 b = b-5 b = 0
*= c *= 4 c = c*4 c = 16
/= d /= 3 d = d/3 d = 2
%= e %= 9 e = e%9 e = 1
3.9.5. Conversión de tipo
En las asignaciones no se pueden asignar valores a una variable de un tipo incompatible al suyo. Se presentará un
error si se trata de asignar valores de tipo carácter a una variable numérica o un valor numérico a una variable tipo
carácter.
EJEMPLO 3.11
¿Cuáles son los valores de A, B y C después de la ejecución de las siguientes operaciones?
A ← 3
B ← 4
C ← A + 2 * B
C ← C + B
B ← C - A
A ← B * C
En las dos primeras acciones A y B toman los valores 3 y 4.
C ← A + 2 * B la expresión A + 2 * B tomará el valor 3 + 2 * 4 = 3 + 8 = 11
C ← 11
La siguiente acción
C ← C + B
Estructura general de un programa 107
producirá un valor de 11 + 4 = 15
C ← 15
En la acción B ← C – A se obtiene para B el valor 15 – 3 = 12 y por último:
A ← B * C
A tomará el valor B * C, es decir, 12 * 15 = 180; por consiguiente, el último valor que toma A será 180.
EJEMPLO 3.12
¿Cuál es el valor de x después de las siguientes operaciones?
x ← 2
x ← cuadrado(x + x)
x ← raiz2(x + raiz2(x) + 5)
Los resultados de cada expresión son:
x ← 2 x toma el valor 2
x ← cuadrado(2 + 2) x toma el valor 4 al cuadrado; es decir 16
x ← raiz2(16 + raiz2(16) + 5)
en esta expresión se evalúa primero raiz2(16), que produce 4 y, por último, raiz2(16+4+5) proporciona
raiz2(25), es decir, 5. Los resultados de las expresiones sucesivas anteriores son:
x ← 2
x ← 16
x ← 5
3.10. ENTRADA Y SALIDA DE INFORMACIÓN
Los cálculos que realizan las computadoras requieren para ser útiles la entrada de los datos necesarios para ejecutar
las operaciones que posteriormente se convertirán en resultados, es decir, salida.
Las operaciones de entrada permiten leer determinados valores y asignarlos a determinadas variables. Esta entra-
da se conoce como operación de lectura (read). Los datos de entrada se introducen al procesador mediante disposi-
tivos de entrada (teclado, tarjetas perforadas, unidades de disco, etc.). La salida puede aparecer en un dispositivo de
salida (pantalla, impresora, etc.). La operación de salida se denomina escritura (write).
En la escritura de algoritmos las acciones de lectura y escritura se representan por los formatos siguientes:
leer (lista de variables de entrada)
escribir (lista de variables de salida)
Así, por ejemplo:
leer (A, B, C)
representa la lectura de tres valores de entrada que se asignan a las variables A, B y C.
escribir ('hola Vargas')
visualiza en la pantalla —o escribe en el dispositivo de salida— el mensaje 'hola Vargas'.
108 Fundamentos de programación
Nota 1
Si se utilizaran las palabras reservadas en inglés, como suele ocurrir en los lenguajes de programación, se de-
berá sustituir
leer escribir
por
read write o bien print
Nota 2
Si no se especifica el tipo de dispositivo del cual se leen o escriben datos, los dispositivos de E/S por defecto
son el teclado y la pantalla.
3.11. ESCRITURA DE ALGORITMOS/PROGRAMAS
La escritura de un algoritmo mediante una herramienta de programación debe ser lo más clara posible y estructurada,
de modo que su lectura facilite considerablemente el entendimiento del algoritmo y su posterior codificación en un
lenguaje de programación.
Los algoritmos deben ser escritos en lenguajes similares a los programas. En nuestro libro utilizaremos esencial-
mente el lenguaje algorítmico, basado en pseudocódigo, y la estructura del algoritmo requerirá la lógica de los pro-
gramas escritos en el lenguaje de programación estructurado; por ejemplo, Pascal.
Un algoritmo constará de dos componentes: una cabecera de programa y un bloque algoritmo. La cabecera de
programa es una acción simple que comienza con la palabra algoritmo. Esta palabra estará seguida por el nombre
asignado al programa completo. El bloque algoritmo es el resto del programa y consta de dos componentes o sec-
ciones: las acciones de declaración y las acciones ejecutables.
Las declaraciones definen o declaran las variables y constantes que tengan nombres. Las acciones ejecutables
son las acciones que posteriormente deberá realizar la computación cuando el algoritmo convertido en programa se
ejecute.
algoritmo
cabecera del programa
sección de declaración
sección de acciones
3.11.1. Cabecera del programa o algoritmo
Todos los algoritmos y programas deben comenzar con una cabecera en la que se exprese el identificador o nombre
correspondiente con la palabra reservada que señale el lenguaje. En los lenguajes de programación, la palabra reser-
vada suele ser program. En Algorítmica se denomina algoritmo.
algoritmo DEMO1
3.11.2. Declaración de variables
En esta sección se declaran o describen todas las variables utilizadas en el algoritmo, listándose sus nombres y espe-
cificando sus tipos. Esta sección comienza con la palabra reservada var (abreviatura de variable) y tiene el formato
Estructura general de un programa 109
var
tipo-1 : lista de variables-1
tipo-2 : lista de variables-2
.
.
tipo-n : lista de variables-n
donde cada lista de variables es una variable simple o una lista de variables separadas por comas y cada tipo es uno
de los tipos de datos básicos (entero, real, char o boolean). Por ejemplo, la sección de declaración de va-
riables
var
entera : Numero_Empleado
real : Horas
real : Impuesto
real : Salario
o de modo equivalente
var
entera : Numero_Empleado
real : Horas, Impuesto, Salario
declara que sólo las tres variables Hora, Impuesto y Salario son de tipo real.
Es una buena práctica de programación utilizar nombres de variables significativos que sugieran lo que ellas re-
presentan, ya que eso hará más fácil y legible el programa.
También es buena práctica incluir breves comentarios que indiquen cómo se utiliza la variable.
var
entera : Numero_Empleado // número de empleado
real : Horas, // horas trabajadas
Impuesto, // impuesto a pagar
Salario // cantidad ganada
3.11.3. Declaración de constantes numéricas
En esta sección se declaran todas las constantes que tengan nombre. Su formato es
const
pi = 3.141592
tamaño = 43
horas = 6.50
Los valores de estas constantes ya no pueden variar en el transcurso del algoritmo.
3.11.4. Declaración de constantes y variables carácter
Las constantes de carácter simple y cadenas de caracteres pueden ser declaradas en la sección del programa const,
al igual que las constantes numéricas.
const
estrella = '*'
frase = '12 de octubre'
mensaje = 'Hola mi nene'
110 Fundamentos de programación
Las variables de caracteres se declaran de dos modos:
1. Almacenar un solo carácter.
var carácter : nombre, inicial, nota, letra
Se declaran nombre, inicial, nota y letra, que almacenarán sólo un carácter.
2. Almacenar múltiples caracteres (cadenas). El almacenamiento de caracteres múltiples dependerá del lengua-
je de programación. Así, en los lenguajes
VB 6.0/VB .NET (VB, Visual Basic)
Dim var1 As String
Var1 = Pepe Luis García Rodriguez
Pascal formato tipo array o arreglo (véase Capítulo 8).
Existen algunas versiones de Pascal, como es el caso de Turbo Pascal, que tienen implementados un tipo de
datos denominados string (cadena) que permite declarar variables de caracteres o de cadena que almacenan
palabras compuestas de diferentes caracteres.
var nombre : string[20]; en Turbo Pascal
var cadena : nombre[20]; en pseudocódigo
3.11.5. Comentarios
La documentación de un programa es el conjunto de información interna externa al programa, que facilitará su pos-
terior mantenimiento y puesta a punto. La documentación puede ser interna y externa.
La documentación externa es aquella que se realiza externamente al programa y con fines de mantenimiento y
actualización; es muy importante en las fases posteriores a la puesta en marcha inicial de un programa. La documen-
tación interna es la que se acompaña en el código o programa fuente y se realiza a base de comentarios significativos.
Estos comentarios se representan con diferentes notaciones, según el tipo de lenguaje de programación.
Visual Basic 6 / VB .NET
1. Los comentarios utilizan un apóstrofe simple y el compilador ignora todo lo que viene después de ese ca-
rácter
'Este es un comentario de una sola línea
Dim Mes As String 'comentario después de una línea de código
...............
2. También se admite por guardar compatibilidad con versiones antiguas de BASIC y Visual Basic la palabra
reservada Rem
Rem esto es un comentario
C/C++ y C#
Existen dos formatos de comentarios en los lenguajes C y C++:
1. Comentarios de una línea (comienzan con el carácter //)
// Programa 5.0 realizado por el Señor Mackoy
// en Carchelejo (Jaén)en las Fiestas de Agosto
// de Moros y Cristiano
Estructura general de un programa 111
2. Comentarios multilínea (comienzan con los caracteres /* y terminan con los caracteres */, todo lo encerrado
entre ambos juegos de caracteres son comentarios)
/* El maestro Mackoy estudió el Bachiller en el mismo Instituto donde dio clase
Don Antonio Machado, el poeta */
Java
1. Comentarios de una línea
// comentarios sobre la Ley de Protección de Datos
2. Comentarios multilíneas
/* El pueblo de Mr. Mackoy está en Sierra Mágina, y produce uno
de los mejores aceites de oliva del mundo mundial */
3. Documentación de clases
/**
Documentación de la clase
*/
Pascal
Los comentarios se encierran entre los símbolos
(* *)
o bien
{ }
(* autor J.R. Mackoy *)
{subrutina ordenacion}
Modula-2
Los comentarios se encierran entre los símbolos
(* *)
Nota
A lo largo del libro utilizaremos preferentemente para representar nuestros comentarios los símbolos // y /*. Sin
embargo, algunos autores de algoritmos, a fin de independizar la simbología del lenguaje, suelen representar los
comentarios con corchetes ([ ]).
3.11.6. Estilo de escritura de algoritmos/programas
El método que seguiremos normalmente a lo largo del libro para escribir algoritmos será el descrito al comienzo del
Apartado 3.11.
algoritmo identificador //cabecera
// seccion de declaraciones
112 Fundamentos de programación
var tipo de datos : lista de identificadores
const lista de identificadores = valor
inicio
sentencia S1
sentencia S2 // cuerpo del algoritmo
.
.
.
sentencia Sn
fin
Notas
1. En ocasiones, la declaración de constantes y variables las omitiremos o se describirán en una tabla de varia-
bles que hace sus mismas funciones.
2. Las cadenas de caracteres se encerrarán entre comillas simples.
3. Utilizar siempre sangrías en los bucles o en aquellas instrucciones que proporcionen legibilidad al programa,
como inicio y fin.
MODELO PROPUESTO DE ALGORITMO
algoritmo raices
// resuelve una ecuación de 2.º grado
var
real : a, b, c
inicio
leer(a, b, c)
d ← b ^ 2 - 4 * a * c
si d  0 entonces
escribir('raices complejas')
si_no
si d = 0 entonces
escribir (-b / (2 * a)
si_no
escribir ((-b - raiz2(d)) / (2 * a)
escribir ((-b + raiz2(d)) / (2 * a)
fin_si
fin_si
fin
Estructura general de un programa 113
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
3.1. Diseñar un algoritmo para cambiar una rueda de un coche.
Solución
algoritmo pinchazo
inicio
si gato del coche está averiado
entonces llamar a la estación de servicio
si_no levantar el coche con el gato
repetir
aflojar y sacar los tornillos de las ruedas
hasta_que todos los tornillos estén flojos y quitados
quitar la rueda
poner la rueda de repuesto
repetir
poner los tornillos y apretarlos
hasta_que estén puestos todos los tornillos
bajar el gato
fin_sí
fin
3.2. Encontrar el valor de la variable VALOR después de la ejecución de las siguientes operaciones:
(A) VALOR ← 4.0 * 5
(B) X ← 3.0
Y ← 2.0
VALOR ← X ^ Y - Y
(C) VALOR ← 5
X ← 3
VALOR ← VALOR * X
Solución
(A) VALOR = 20.0
(B) X = 3.0
Y = 2.0
VALOR = 3 ^ 2 - 2 = 9 - 2 = 7 VALOR = 7
(C) VALOR = 5
X = 3
VALOR = VALOR * X = 5 * 3 = 15 VALOR = 15
3.3. Deducir el resultado que se produce con las siguientes instrucciones:
var Entero : X, Y
X ← 1
Y ← 5
escribir (X, Y)
Solución
X e Y toman los valores 1 y 5. La instrucción de salida (escribir) presentará en el dispositivo de salida 1 y 5, con los
formatos específicos del lenguaje de programación; por ejemplo,
1 5
3.4. Deducir el valor de las expresiones siguientes:
X ← A + B + C
X ← A + B * C
114 Fundamentos de programación
X ← A + B / C
X ← A + B  C
X ← A + B mod C
X ← (A + B)  C
X ← A + (B / C)
Siendo A = 5 B = 25 C = 10
Solución
Expresión X
A + B + C = 5 + 25 + 10 40
A + B * C = 5 + 25 * 10 225
A + B / C = 5 + 25 / 10 7.5
A + B  C = 5 + 25  10 = 5 + 2 7
A + B mod C = 5 + 25 mod 10 = 5 + 5 10
(A + B) / C = (5 + 25) / 10 = 30 / 10 3
A + (B / C) = 5 + (25 / 10) = 5 + 2.5 7.5
3.5. Escribir las siguientes expresiones en forma de expresiones algorítmicas:
a)
M
N
+ P d)
m + n
p – q
b) M +
N
P – Q
e)
m +
n
p
q –
r
5
c)
seno(x) + cos(x)
tan(x)
f)
–b + √b2
– 4ac
2a
Solución
a) M / N + P
b) M + N / (P - Q)
c) (SEN(X) + COS(X) / TAN (X)
d) (M + N) / (P - Q)
e) (M + N / P) / (Q - R / 5)
f) (-B + raiz2 (B ^ 2 - 4 * A * C)) / (2 * A)
3.6. Calcúlese el valor de las siguientes expresiones:
a) 8 + 7 * 3 + 4 * 6
b) –2 ^ 3
c) (33 + 3 * 4) / 5
d) 2 ^ 2 * 3
e) 3 + 2 * (18 – 4 ^ 2)
f) 16 * 6 – 3 * 2
Solución
a) 8 + 7 * 3 + 4 * 6
{
{
8 + 21 + 24
{
29 + 24
{
53
Estructura general de un programa 115
b) -2 ^ 3
{
-8
c) (33 + 3 * 4) / 5
{
33 + 12 / 5
{
45 / 5
{
9
d) 2 ^ 2 * 3
{
4 * 3
{
12
f) 16 * 6 - 3 * 2
{
{
96 - 6
{
90
3.7. Se tienen tres variables A, B y C. Escribir las instrucciones necesarias para intercambiar entre sí sus valores del modo
siguiente:
• B toma el valor de A
• C toma el valor de B
• A toma el valor de C
Nota: Sólo se debe utilizar una variable auxiliar.
Solución
Utilizaremos una variable auxiliar AUX.
Las instrucciones que resuelven el problema de intercambio son:
AUX ← A
A ← C
C ← B
B ← AUX
Comprobémoslo con los valores de A, B y C: 5, 10 y 15.
Instrucción A B C AUX Observaciones
(1) A ← 5 5 -- -- --
(2) B ← 10 -- 10 -- --
(3) C ← 15 -- -- 15 --
AUX ← A 5 10 15 5
A ← C 15 10 15 5
C ← B 15 10 10 5
B ← AUX 15 5 10 5
Obsérvese que al igual que en el ejercicio de intercambio de valores entre dos variables, la variable AUX no modifica su
valor.
116 Fundamentos de programación
3.8. Cómo se intercambian los valores de dos variables, A y B.
Solución
Con el ejercicio se ha visto cómo se pueden intercambiar los valores de una variable mediante las instrucciones:
A ← B
B ← A
El procedimiento para conseguir intercambiar los valores de dos variables entre sí debe recurrir a una variable AUX y a
las instrucciones de asignación siguientes:
AUX ← A
A ← B
B ← AUX
Veámoslo con un ejemplo:
a ← 10
B ← 5
Instrucción A B AUX Observaciones
A ← 10 10 -- --
B ← 5 10 5 --
AUX ← A 10 5 10 La variable AUX toma el valor de A
A ← B 5 5 10 A toma el valor de B, 5
B ← AUX 5 10 10 B toma el valor inicial de A, 10
Ahora A = 5 y B = 10.
3.9. Deducir el valor que toma la variable tras la ejecución de las instrucciones:
A ← 4
B ← A
B ← A + 3
Solución
Mediante una tabla se da un método eficaz para obtener los sucesivos valores:
A B
(1) A ← A 4 --
(2) B ← A 4 4
(3) B ← A + 3 4 7
Después de la instrucción (1) la variable A contiene el valor 4.
La variable B no ha tomado todavía ningún valor y se representa esa situación con un guión.
La instrucción (2) asigna el valor actual de A (4) a la variable B. La instrucción (3) efectúa el cálculo de la expre-
sión A + 3, lo que produce un resultado de 7 (4 + 3) y este valor se asigna a la variable B, cuyo último valor (4) se des-
truye.
Por consiguiente, los valores finales que tienen las variables A y B son:
A = 4 B = 7
3.10. ¿Qué se obtiene en las variables A y B, después de la ejecución de las siguientes instrucciones?
A ← 5
B ← A + 6
A ← A + 1
B ← A - 5
Estructura general de un programa 117
Solución
Siguiendo las directrices del ejercicio anterior:
Instrucción A B Observaciones
(1) A ← 5 5 — B no toma ningún valor
(2) B ← A + 6 5 11 Se evalúa A + 6(5 + 6) y se asigna a B
(3) A ← A + 1 6 11 Se evalúa A + 1(5 + 1) y se asigna a A, borrándose el valor
que tenía (5) y tomando el nuevo valor (6)
(4) B ← A - 5 6 1 Se evalúa A – 5(6 – 1) y se asigna a B
Los valores últimos de A y B son: A = 6, B = 1.
3.11. ¿Qué se obtiene en las variables A, B y C después de ejecutar las instrucciones siguientes?
A ← 3
B ← 20
C ← A + B
B ← A + B
A ← B - C
Solución
Instrucción A B C Observaciones
(1) A ← 3 3 -- -- B y C no toman ningún valor
(2) B ← 20 3 20 -- C sigue sin valor
(3) C ← A + B 3 20 23 Se evalúa A + B(20 + 3) y se asigna a C
(4) B ← A + B 3 23 23 Se evalúa A + B(20 + 3) y se asigna a B; destruye
el valor antiguo (20)
(5) A ← B - C 0 23 23 Se evalúa B – C(23 – 23) y se asigna a A
Los valores finales de las variables son:
A = 0 B = 23 C = 23
3.12. ¿Qué se obtiene en A y B tras la ejecución de
A ← 10
B ← 5
A ← B
B ← A
Solución
Instrucción A B Observaciones
(1) A ← 10 10 -- B no toma valor
(2) B ← 5 10 5 B recibe el valor inicial 5
(3) A ← B 5 5 A toma el valor de B (5)
(4) B ← A 5 5 B toma el valor actual de A (5)
Los valores finales de A y B son 5. En este caso se podría decir que la instrucción (4) B ← A es redundante respecto a
las anteriores, ya que su ejecución no afecta al valor de las variables.
118 Fundamentos de programación
3.13. Determinar el mayor de tres números enteros.
Solución
Los pasos a seguir son:
1. Comparar el primero y el segundo entero, deduciendo cuál es el mayor.
2. Comparar el mayor anterior con el tercero y deducir cuál es el mayor. Este será el resultado.
Los pasos anteriores se pueden descomponer en otros pasos más simples en lo que se denomina refinamiento del algo-
ritmo:
1. Obtener el primer número (entrada), denominarlo NUM1.
2. Obtener el segundo número (entrada), denominarlo NUM2.
3. Comparar NUM1 con NUM2 y seleccionar el mayor; si los dos enteros son iguales, seleccionar NUM1. Llamar a este
número MAYOR.
4. Obtener el tercer número (entrada) y denominarlo NUM3.
5. Comparar MAYOR con NUM3 y seleccionar el mayor; si los dos enteros son iguales, seleccionar el MAYOR. Denominar
a este número MAYOR.
6. Presentar el valor de MAYOR (salida).
7. Fin.
3.14. Determinar la cantidad total a pagar por una llamada telefónica, teniendo en cuenta lo siguiente:
• toda llamada que dure menos de tres minutos (cinco pasos) tiene un coste de 10 céntimos,
• cada minuto adicional a partir de los tres primeros es un paso de contador y cuesta 5 céntimos.
Solución
Análisis
El algoritmo de resolución del problema entraña los siguientes pasos:
1. Inicio.
2. Leer el número se pasos (npasos) hablados por teléfono.
3. Comprobar que el número de pasos es mayor que cero, ya que realmente se ha realizado la
llamada si el número de pasos es distinto de cero (positivo). Si el número de pasos es
menor a cero, se producirá un error.
4. Calcular el precio de la conferencia de acuerdo con los siguientes conceptos:
• si el número de pasos es menor que 5, el precio es de 10 céntimos,
• si el número de pasos es mayor que 5, es preciso calcular los pasos que exceden de 5,
ya que éstos importan 5 céntimos cada uno; al producto de los pasos sobrantes por cin-
co céntimos se le suman 10 pesetas y se obtendrá el precio total.
Variables
NPASOS Número de pasos de la llamada
N Número de pasos que exceden a 5
FACT Importe o precio de la llamada.
Estructura general de un programa 119
Diagrama de flujo
inicio
leer
NPASOS
NPASOS = 0
N  0
escribir
NPASOS
FACT
fin
escribir
ERROR
1
1
sí
no
hacer
FACT ← 10
N ← NPASOS-5
hacer
FACT ← FACT + N * 5
sí
3.15. Calcular la suma de los cincuenta primeros números enteros.
Solución
Análisis
El algoritmo expresado en lenguaje natural o en secuencia de pasos es el siguiente:
1. Inicio.
2. Hacer el primer número 1 igual a una variable X que actuará de contador de 1 a 50 y S
igual a 0.
3. Hacer S = S+X para realizar las sumas parciales.
4. Hacer X = X+1 para generar los números enteros.
5. Repetir los pasos 3 y 4 hasta que X = 50, en cuyo caso se debe visualizar la suma.
6. Fin.
120 Fundamentos de programación
Diagrama de flujo
escribir
S
X = 50 fin
sí
inicio
X ← 1
no
S ← 0
S ← S + X
X ← X + 1
3.16. Escribir un algoritmo que calcule el producto de los n primeros números naturales.
Solución
Análisis
El problema puede calcular el producto N * (N – 1 * (n – 2) * ... * 3 * 2 * 1, que en términos matemáti-
cos se le conoce con el nombre de FACTORIAL de N. El algoritmo que resuelve el problema será el siguiente:
1. Leer N.
2. Caso de que N = 0, visualizar «Factorial de 0 igual 1».
3. Comprobar que N  0 (los números negativos no se consideran).
4. Hacer la variable P que va a contener el productor igual a 1.
5. Realizar el producto P = P * N.
Disminuir en una unidad sucesivamente hasta llegar a N = 1, y de modo simultáneo los
productos P * N.
6. Visualizar P.
7. Fin.
Estructura general de un programa 121
Diagrama de flujo
sí
no
leer
N
N = 0
N = 1
fin
N  0
P ← 1
P ← P * N
N ← N – 1
escribir
'Prueba con
positivos'
escribir
'Factorial ='
P
escribir
'Número negativo'
escribir
'Factorial de 0
igual a 1'
inicio
no
sí
Pseudocódigo
algoritmo Factorial
var
entero : N
real : P
inicio
leer(N)
si N = 0 entonces
escribir('Factorial de 0 igual a 1')
122 Fundamentos de programación
si_no
si N  0 entonces
P ← 1
(1) P ← P * N
N ← N - 1
si N = 1 entonces
escribir('Factorial =', P)
si_no
ir_a (1)
fin_si
si_no
escribir('Numero negativo')
escribir('Pruebe con positivos')
fin_si
fin_si
fin
3.17. Diseñar un algoritmo para resolver una ecuación de segundo grado Ax2
+ Bx + C = 0.
Solución
Análisis
La ecuación de segundo grado es Ax2
+ Bx + C = 0 y las soluciones o raíces de la ecuación son:
X1 =
–B + √B2
– 4AC
2A
X2 =
–B – √B2
– 4AC
2A
Para que la ecuación de segundo grado tenga solución es preciso que el discriminante sea mayor o igual que 0.
El discriminante de una ecuación de segundo grado es
D = B ^ 2 - 4AC
Por consiguiente, si
D = 0 X1 = -B / 2A X2 = -B / 2A
D  0 X1 y X2
no tienen solución real.
En consecuencia, el algoritmo que resolverá el problema es el siguiente:
1. Inicio.
2. Introducir los coeficientes A, B y C.
3. Cálculo del discriminante D = B ^ 2 - 4AC
4. Comprobar el valor de D.
• si D es menor que 0, visualizar un mensaje de error,
• si D es igual a 0, se obtienen dos raíces iguales X1 = X2 = -B / 2A.
• si D es mayor que 0, se calculan las dos raíces X1 y X2.
5. Fin del algoritmo.
Estructura general de un programa 123
Diagrama de flujo
leer
A, B, C
D  0
fin
sí
sí
D = 0
hacer
D = B2
– 4AC
no
inicio
X1 = (–B + D)/2A
X2 = (–B – D)/2A
mensaje
de error
escribir
–B/2A
no
3.18. Escribir un algoritmo que acepte tres números enteros e imprima el mayor de ellos.
Solución
Análisis
El diseño del algoritmo requiere de una serie de comparaciones sucesivas. Las operaciones sucesivas son las siguientes:
1. Inicio.
2. Introducir los tres números A, B, C.
3. Comparar A y B:
• si A es menor que B:
– comparar B y C:
• si B es mayor que C, el mayor es B,
• si B es menor que C, el mayor es C.
• si A es mayor que B:
– comparar A y C:
• si A es menor que C, el mayor es C,
• si A es mayor que C, el mayor es A.
124 Fundamentos de programación
Diagrama de flujo
leer
A, B, C
fin
sí
sí
no
inicio
no
A  C
A  B B  C
escribir
C
no
sí
1
1
1
escribir
B
escribir
A
CONCEPTOS CLAVE
• Algoritmo.
• Asignación.
• Caracteres especiales.
• Constantes.
• Datos.
• Declaraciones.
• Escritura de resultados.
• Expresiones.
• Función interna.
• Identificador.
• Instrucción.
• Lectura de datos.
• Operaciones primitivas.
• Operadores.
• Palabras reservadas.
• Programa.
• Pseudocódigo.
• Tipos de datos.
• Variables.
RESUMEN
Un programa es un conjunto de instrucciones que se pro-
porciona a una computadora para realizar una tarea de-
terminada. El proceso de programación requiere las si-
guientes fases o etapas fundamentales: definición y análisis
del problema, diseño del algoritmo, codificación del pro-
grama, depuración y verificación, documentación y man-
tenimiento.
En la práctica un programa es una caja negra —un al-
goritmo de resolución del problema— que tiene una entra-
da de datos y una salida de resultados. La entrada de datos
se realiza a través del teclado, ratón, escáner, discos... y la
salida se representa en impresora, pantalla, etc.
Existen diferentes tipos de instrucciones básicas: inicio,
fin, asignación, lectura, escritura y bifurcación.
Estructura general de un programa 125
Los elementos básicos constitutivos de un programa
son: palabras reservadas, identificadores, caracteres espe-
ciales, constantes, variables, expresiones, instrucciones a
los cuales se unen para tareas de ejecución de operaciones
otros elementos primitivos de un programa, tales como: bu-
cles, contadores, acumuladores, interruptores y estructuras.
Todos estos elementos manipulan datos o información de
diferentes tipos como numéricos, lógicos o carácter. Los
valores de estos datos se almacenan para su tratamiento en
constantes y variables. Las combinaciones de constantes,
variables, símbolos de operaciones, nombres de funciones,
etc., constituyen las expresiones que a su vez se clasifican
en función del tipo de objetos que manipulan en: aritméti-
cas, relacionales, lógicas y carácter.
Otro concepto importante a considerar en la iniciación
a la programación es el concepto y tipos de operadores que
sirven para la resolución de expresiones y constituyen ele-
mentos clave en las sentencias de flujo de control que se
estudiarán en los capítulos posteriores.
La operación de asignación es un sistema de almacena-
miento de valores en una variable. Existen diferentes tipos
de asignaciones en función de los tipos de datos cuyos de-
seos se desean almacenar. La conversión de tipos en opera-
ciones de asignaciones es una tarea importante y su com-
prensión es vital para evitar errores en el proceso de
depuración de un programa.
La última característica importante a considerar en el
capítulo es la escritura de algoritmos y programas, para lo
que se necesitan unas reglas claras y precisas que faciliten
su legibilidad y su posterior codificación en un lenguaje de
programación.
EJERCICIOS
3.1. Diseñar los algoritmos que resuelvan los siguientes
problemas:
a) Ir al cine.
b) Comprar una entrada para los toros.
c) Colocar la mesa para comer.
d) Cocer un huevo.
e) Hacer una taza de té.
f) Fregar los platos del almuerzo.
g) Buscar el número de teléfono de un alumno.
h) Reparar un pinchazo de una bicicleta.
i) Pagar una multa de tráfico.
j) Cambiar un neumático pinchado (se dispone de
herramientas y gato).
k) Hacer palomitas de maíz en una olla puesta al
fuego con aceite, sal y maíz.
l) Cambiar el cristal roto de una ventana.
m) Hacer una llamada telefónica. Considerar los ca-
sos: a) manual, con operadora; b) automático;
c) cobro revertido.
n) Quitar una bombilla quemada de un techo.
o) Encontrar la media de una lista indeterminada de
números positivos terminada con un número ne-
gativo.
3.2. ¿Cuáles de los siguientes identificadores no son vá-
lidos?
a) XRayo b) X_Rayo
c) R2D2 d) X
e) 45 f) N14
g) ZZZZ h) 3μ
3.3. ¿Cuáles de las siguientes constantes no son válidas?
a) 234 b) –8.975
c) 12E – 5 d) 0
e) 32,767 f) 1/2
g) 3.6E + 7 h) –7E12
i) 3.5 x 10 j) 0,456
k) 0.000001 l) 224E1
3.4. Evaluar la siguiente expresión para A = 2 y B = 5:
3 * A - 4 * B / A ^ 2
3.5. Evaluar la expresión
4 / 2 * 3 / 6 + 6 / 2 / 1 / 5 ^ 2 / 4 * 2
3.6. Escribir las siguientes expresiones algebraicas como
expresiones algorítmicas:
a) √
b2
– 4ac b)
x2
+ y2
z2
c)
3x + 2y
2z
d)
a + b
c – d
e) 4x2
– 2x + 7 f)
x + y
x
–
3x
5
g)
a
bc
h) xyz
i)
y2 – y1
x2 – x1
j) 2πr
k)
4
3
πr3
h) (x2 – x1)2
+ (y2 – y1)2
3.7. Escribir las siguientes expresiones algorítmicas como
expresiones algebraicas:
a) b ^ 2 – 4 * a * c
b) 3 * X ^ 4 – 5 * X ^ 3 + X 12 – 17
c) (b + d) / (c + 4)
d) (x ^ 2 + y ^ 2) ^ (1 / 2)
126 Fundamentos de programación
3.8. Si el valor de A es 4, el valor de B es 5 y el valor
de C es 1, evaluar las siguientes expresiones:
a) B * A – B ^ 2 / 4 * C
b) (A * B) / 3 ^ 2
c) (((B + C) / 2 * A + 10) * 3 * B) – 6
3.9. Si el valor de A es 2, B es 3 y C es 2, evaluar la ex-
presión:
A ^ B ^ C
3.10. Obtener el valor de cada una de las siguientes expre-
siones aritméticas:
a) 7 div 2
b) 7 mod 2
c) 12 div 3
d) 12 mod 3
e) 0 mod 5
f) 15 mod 5
g) 7 * 10 – 50 mod 3 * 4 + 9
h) (7 * (10 – 5) mod 3) * 4 + 9
Nota: Considérese la prioridad de Pascal: más alta:
*, /, div, mod; más baja: +, –.
3.11. Encontrar el valor de cada una de las siguientes ex-
presiones o decir si no es una expresión válida:
a) 9 – 5 – 3
b) 2 div 3 + 3 / 5
c) 9 div 2 / 5
d) 7 mod 5 mod 3
e) 7 mod (5 mod 3)
f) (7 mod 5) mod 3
g) (7 mod 5 mod 3)
h) ((12 + 3) div 2) / (8 – (5 + 1))
i) 12 / 2 * 3
j) raiz2 (cuadrado(4)
k) cuadrado (raiz2(4))
l) trunc(815) + redondeo(815)
Considérese la prioridad del Ejercicio 3.10.
3.12. Se desea calcular independiente la suma de los nú-
meros pares e impares comprendidos entre 1 y 200.
3.13. Leer una serie de números distintos de cero (el últi-
mo número de la serie es –99) y obtener el número
mayor. Como resultado se debe visualizar el número
mayor y un mensaje de indicación de número ne-
gativo, caso de que se haya leído un número nega-
tivo.
3.14. Calcular y visualizar la suma y el producto de los
números pares comprendidos entre 20 y 400, ambos
inclusive.
3.15. Leer 500 números enteros y obtener cuántos son po-
sitivos.
3.16. Se trata de escribir el algoritmo que permita emitir
la factura correspondiente a una compra de un
artículo determinado, del que se adquieren una o
varias unidades. El IVA a aplicar es del 15 por 100
y si el precio bruto (precio venta más IVA) es mayor
de 1.000 euros, se debe realizar un descuento del 5
por 100.
3.17. Calcular la suma de los cuadrados de los cien prime-
ros números naturales.
3.18. Sumar los números pares del 2 al 100 e imprimir su
valor.
3.19. Sumar diez números introducidos por teclado.
3.20. Calcular la media de cincuenta números e imprimir
su resultado.
3.21. Calcular los N primeros múltiplos de 4 (4 inclusive),
donde N es un valor introducido por teclado.
3.22. Diseñar un diagrama que permita realizar un conta-
dor e imprimir los cien primeros números enteros.
3.23. Dados diez números enteros, visualizar la suma de
los números pares de la lista, cuántos números pares
existen y cuál es la media aritmética de los números
impares.
3.24. Calcular la nota media de los alumnos de una clase
considerando n-número de alumnos y c-número de
notas de cada alumno.
3.25. Escribir la suma de los diez primeros números
pares.
3.26. Escribir un algoritmo que lea los datos de entrada de
un archivo que sólo contiene números y sume los
números positivos.
3.27. Desarrollar un algoritmo que determine en un con-
junto de cien números naturales:
• ¿Cuántos son menores de 15?
• ¿Cuántos son mayores de 50?
• ¿Cuántos están comprendidos entre 25 y 45?
CAPÍTULO 4
Flujo de control I:
Estructuras selectivas
4.1. El flujo de control de un programa
4.2. Estructura secuencial
4.3. Estructuras selectivas
4.4. Alternativa simple (si-entonces/if-then)
4.5. Alternativa múltiple (según_sea, caso de/
case)
4.6. Estructuras de decisión anidadas (en esca-
lera)
4.7. La sentencia ir-a (goto)
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
CONCEPTOS CLAVE
RESUMEN
EJERCICIOS
En la actualidad, dado el tamaño considerable de las
memorias centrales y las altas velocidades de los pro-
cesadores —Intel Core 2 Duo, AMD Athlon 64, AMD
Turion 64, etc.—, el estilo de escritura de los progra-
mas se vuelve una de las características más sobresa-
lientes en las técnicas de programación. La legibilidad
de los algoritmos y posteriormente de los programas
exige que su diseño sea fácil de comprender y su flu-
jo lógico fácil de seguir. La programación modular
enseña la descomposición de un programa en módu-
los más simples de programar, y la programación es-
tructurada permite la escritura de programas fáciles
de leer y modificar. En un programa estructurado el
flujo lógico se gobierna por las estructuras de control
básicas:
1. Secuenciales.
2. Repetitivas.
3. Selectivas.
En este capítulo se introducen las estructuras selec-
tivas que se utilizan para controlar el orden en que se
ejecutan las sentencias de un programa. Las sentencias
si (en inglés, “if”) y sus variantes, si-entonces,
si-entonces-sino y la sentencia según-sea (en
inglés, “switch”) se describen como parte fundamen-
tal de un programa. Las sentencias si anidadas y las
sentencias de multibifurcación pueden ayudar a resol-
ver importantes problemas de cálculo. Asimismo se
describe la “tristemente famosa” sentencia ir-a (en
inglés “goto”), cuyo uso se debe evitar en la mayoría
de las situaciones, pero cuyo significado debe ser muy
bien entendido por el lector, precisamente para evitar
su uso, aunque puede haber una situación específica
en que no quede otro remedio que recurrir a ella.
El estudio de las estructuras de control se realiza
basado en las herramientas de programación ya estu-
diadas: diagramas de flujo, diagramas N-S y pseudo-
códigos.
INTRODUCCIÓN
128 Fundamentos de programación
4.1. EL FLUJO DE CONTROL DE UN PROGRAMA
Muchos avances han ocurrido en los fundamentos teóricos de programación desde la aparición de los lenguajes de
alto nivel a finales de la década de los cincuenta. Uno de los más importantes avances fue el reconocimiento a fina-
les de los sesenta de que cualquier algoritmo, no importaba su complejidad, podía ser construido utilizando combi-
naciones de tres estructuras de control de flujo estandarizadas (secuencial, selección, repetitiva o iterativa) y una
cuarta denominada, invocación o salto (“jump”). Las sentencias de selección son: si (if) y según-sea (switch);
las sentencias de repetición o iterativas son: desde (for), mientras (while), hacer-mientras (do-while) o
repetir-hasta que (repeat-until); las sentencias de salto o bifurcación incluyen romper (break), conti-
nuar (continue), ir-a (goto), volver (return) y lanzar (throw).
El término flujo de control se refiere al orden en que se ejecutan las sentencias del programa. Otros términos
utilizados son secuenciación y control del flujo. A menos que se especifique expresamente, el flujo normal de control
de todos los programas es el secuencial. Este término significa que las sentencias se ejecutan en secuencia, una des-
pués de otra, en el orden en que se sitúan dentro del programa. Las estructuras de selección, repetición e invocación
permiten que el flujo secuencial del programa sea modificado en un modo preciso y definido con anterioridad. Como
se puede deducir fácilmente, las estructuras de selección se utilizan para seleccionar cuáles sentencias se han de eje-
cutar a continuación y las estructuras de repetición (repetitivas o iterativas) se utilizan para repetir un conjunto de
sentencias.
Hasta este momento, todas las sentencias se ejecutaban secuencialmente en el orden en que estaban escritas en
el código fuente. Esta ejecución, como ya se ha comentado, se denomina ejecución secuencial. Un programa basado
en ejecución secuencial, siempre ejecutará exactamente las mismas acciones; es incapaz de reaccionar en respuesta
a condiciones actuales. Sin embargo, la vida real no es tan simple. Normalmente, los programas necesitan alterar o
modificar el flujo de control en un programa. Así, en la solución de muchos problemas se deben tomar acciones di-
ferentes dependiendo del valor de los datos. Ejemplos de situaciones simples son: cálculo de una superficie sólo si
las medidas de los lados son positivas; la ejecución de una división se realiza, sólo si el divisor no es cero; la visua-
lización de mensajes diferentes depende del valor de una nota recibida, etc.
Una bifurcación (“branch”, en inglés) es un segmento de programa construida con una sentencia o un grupo de
sentencias. Una sentencia de bifurcación se utiliza para ejecutar una sentencia de entre varias o bien bloques de sen-
tencias. La elección se realiza dependiendo de una condición dada. Las sentencias de bifurcación se llaman también
sentencias de selección o sentencias de alternación o alternativas.
4.2. ESTRUCTURA SECUENCIAL
Una estructura secuencial es aquella en la que una acción (instrucción) sigue a otra en secuencia. Las tareas se su-
ceden de tal modo que la salida de una es la entrada de la siguiente y así sucesivamente hasta el final del proceso.
La estructura secuencial tiene una entrada y una salida. Su representación gráfica se muestra en las Figuras 4.1, 4.2
y 4.3.
acción 1
acción 2
acción n
Figura 4.1. Estructura
secuencial.
acción 1
acción 2
.
.
.
.
.
.
.
acción n
Figura 4.2. Diagrama N-S
de una estructura secuencial.
inicio
acción 1
acción 2
fin
Figura 4.3. Pseudocódigo de una
estructura secuencial.
Flujo de control I: Estructuras selectivas 129
EJEMPLO 4.1
Cálculo de la suma y producto de dos números.
La suma S de dos números es S = A+B y el producto P es P = A*B. El pseudocódigo y el diagrama de flujo co-
rrespondientes se muestran a continuación:
Pseudocódigo
inicio
leer(A)
leer(B)
S ← A + B
P ← A * B
escribir(S, P)
fin
Diagrama de flujo
inicio
fin
leer
A
leer
B
S ← A + B
P ← A * B
escribir
S, P
EJEMPLO 4.2
Se trata de calcular el salario neto de un trabajador en función del número de horas trabajadas, precio de la hora
de trabajo y, considerando unos descuentos fijos, el sueldo bruto en concepto de impuestos (20 por 100).
Pseudocódigo
inicio
// cálculo salario neto
leer(nombre, horas, precio_hora)
salario_bruto ← horas * precio_hora
impuestos ← 0.20 * salario_bruto
salario_neto ← salario_bruto - impuestos
escribir(nombre, salario_bruto, salario_neto)
fin
130 Fundamentos de programación
Diagrama de flujo
inicio
fin
SALARIO_NETO ←
SALARIO_BRUTO –
IMPUESTOS
IMPUESTOS ←
0.20 * SALARIO_BRUTO
SALARIO_BRUTO ←
HORAS * PRECIO_HORA
leer
NOMBRE, HORAS
PRECIO_HORA
escribir
NOMBRE, SALARIO BRUTO,
SALARIO_NETO
Diagrama N-S
leer
nombre, horas, precio
salario_bruto ← horas * precio
impuestos ← 0.20 * salario_bruto
salario_neto ← salario_bruto - impuestos
escribir
nombre, salario_bruto, salario_neto
4.3. ESTRUCTURAS SELECTIVAS
La especificación formal de algoritmos tiene realmente utilidad cuando el algoritmo requiere una descripción más
complicada que una lista sencilla de instrucciones. Este es el caso cuando existen un número de posibles alternativas
resultantes de la evaluación de una determinada condición. Las estructuras selectivas se utilizan para tomar decisiones
lógicas; de ahí que se suelan denominar también estructuras de decisión o alternativas.
En las estructuras selectivas se evalúa una condición y en función del resultado de la misma se realiza una opción
u otra. Las condiciones se especifican usando expresiones lógicas. La representación de una estructura selectiva se
hace con palabras en pseudocódigo (if, then, else o bien en español si, entonces, si_no), con una figura
geométrica en forma de rombo o bien con un triángulo en el interior de una caja rectangular. Las estructuras selec-
tivas o alternativas pueden ser:
• simples,
• dobles,
• múltiples.
Flujo de control I: Estructuras selectivas 131
La estructura simple es si (if) con dos formatos: Formato Pascal, si-entonces (if-then) y formato C, si
(if). La estructura selectiva doble es igual que la estructura simple si a la cual se le añade la cláusula si-no
(else). La estructura selectiva múltiple es según_sea (switch en lenguaje C, case en Pascal).
4.4. ALTERNATIVA SIMPLE (SI-ENTONCES/IF-THEN)
La estructura alternativa simple si-entonces (en inglés if-then) ejecuta una determinada acción cuando se cum-
ple una determinada condición. La selección si-entonces evalúa la condición y
• si la condición es verdadera, entonces ejecuta la acción S1 (o acciones caso de ser S1 una acción compuesta y
constar de varias acciones),
• si la condición es falsa, entonces no hacer nada.
Las representaciones gráficas de la estructura condicional simple se muestran en la Figura 4.4.
a)
acciones
condición
falsa
verdadera
b) Pseudocódigo en español
si condición entonces
acción S1
fin _ si
Pseudocódigo en inglés
if condición then
acción S1
endif
c)
¿condición?
verdadera falsa
acción
Pseudocódigo en español
//S1 accion compuesta
si condición entonces
acción S11
acción S12
.
.
.
acción S1n
fin _ si
Figura 4.4. Estructuras alternativas simples: a) Diagrama de flujo; b) Pseudocódigo; c) Diagrama N-S.
Obsérvese que las palabras del pseudocódigo si y fin_si se alinean verticalmente indentando (sangrando) la
acción o bloque de acciones.
Diagrama de sintaxis
Sentencia if_simple::=
1. si (expresión_lógica) 2. si expresión lógica entonces
inicio
sentencia Sentencia_compuesta
fin fin-si
Sentencia_compuesta ::=
inicio
Sentencias
fin
132 Fundamentos de programación
Sintaxis en lenguajes de programación
Pseudocódigo Pascal C/C++
si (condición) entonces
acciones
fin-si
if (condición) then
begin
sentencias
end
if (condición)
{
sentencias
}
4.4.1. Alternativa doble (si-entonces-sino/if-then-else)
La estructura anterior es muy limitada y normalmente se necesitará una estructura que permita elegir entre dos op-
ciones o alternativas posibles, en función del cumplimiento o no de una determinada condición. Si la condición C es
verdadera, se ejecuta la acción S1 y, si es falsa, se ejecuta la acción S2 (véase Figura 4.5).
Pseudocódigo en español
si condicion entonces
accion S1
si _ no
accion S2
fin _ si
Pseudocódigo en inglés
if condicion then
accion S1
else
accion S2
endif
Pseudocódigo en español
//S1 accion compuesta
si condicion entonces
accion S11
accion S12
.
.
.
acción S1n
si _ no
accion S21
accion S22
.
.
.
acción S2n
fin _ si
a)
acción S1 acción S2
¿condición?
b)
c)
¿condición?
verdadera falsa
acción S1 acción S2
Figura 4.5. Estructura alternativa doble: a) diagrama de flujo; b) pseudocódigo; c) diagrama N-S.
Obsérvese que en el pseudocódigo las acciones que dependen de entonces y si_no están indentadas en relación
con las palabras si y fin_si; este procedimiento aumenta la legibilidad de la estructura y es el medio más idóneo
para representar algoritmos.
Flujo de control I: Estructuras selectivas 133
EJEMPLO 4.3
Resolución de una ecuación de primer grado.
Si la ecuación es ax + b = 0, a y b son los datos, y las posibles soluciones son:
• a  0 x = -b/a
• a = 0 b  0 entonces solución imposible
• a = 0 b = 0 entonces solución indeterminada
El algoritmo correspondiente será
algoritmo RESOL1
var
real : a, b, x
inicio
leer (a, b)
si a  0 entonces
x ← –b/a
escribir(x)
si_no
si b  0 entonces
escribir ('solución imposible')
si_no
escribir ('solución indeterminada')
fin_si
fin_si
fin
EJEMPLO 4.4
Calcular la media aritmética de una serie de números positivos.
La media aritmética de n números es
x1 + x2 + x3 + ... + xn
n
En el problema se supondrá la entrada de datos por el teclado hasta que se introduzca el último número, en nues-
tro caso -99. Para calcular la media aritmética se necesita saber cuántos números se han introducido hasta llegar a
-99; para ello se utilizará un contador n que llevará la cuenta del número de datos introducidos.
Tabla de variables
real: s (suma)
entera: n (contador de números)
real: m (media)
algoritmo media
var
real: s, m
entera: n
134 Fundamentos de programación
inicio
s ← 0 // inicialización de variables : s y n
n ← 0
datos:
leer (x) // el primer número ha de ser mayor que cero
si x  0 entonces
ir_a(media)
si_no
n ← n + 1
s ← s + x
ir_a(datos)
fin_si
media:
m ← s/n // media de los números positivos
escribir (m)
fin
En este ejemplo se observa una bifurcación hacia un punto referenciado por una etiqueta alfanumérica denomi-
nada media y otro punto referenciado por datos.
Trate el alumno de simplificar este algoritmo de modo que sólo contenga un punto de bifurcación.
EJEMPLO 4.5
Se desea obtener la nómina semanal —salario neto— de los empleados de una empresa cuyo trabajo se paga por
horas y del modo siguiente:
• las horas inferiores o iguales a 35 horas (normales) se pagan a una tarifa determinada que se debe introducir
por teclado al igual que el número de horas y el nombre del trabajador,
• las horas superiores a 35 se pagarán como extras a un promedio de 1,5 horas normales,
• los impuestos a deducir a los trabajadores varían en función de su sueldo mensual:
— sueldo = 2.000, libre de impuestos,
— las siguientes 220 euros al 20 por 100,
— el resto, al 30 por 100.
Análisis
Las operaciones a realizar serán:
1. Inicio.
2. Leer nombre, horas trabajadas, tarifa horaria.
3. Verificar si horas trabajadas = 35, en cuyo caso
salario_bruto = horas * tarifa; en caso contrario,
salario_bruto = 35 * tarifa + (horas - 35) * tarifa.
4. Cálculo de impuestos
si salario_bruto = 2.000, entonces impuestos = 0
si salario_bruto = 2.220 entonces
impuestos = (salario_bruto - 2.000) * 0.20
si salario_bruto  2.220 entonces
impuestos = (salario_bruto - 2.220) * 0.30 + (220 * 0.20)
5. Cálculo del salario_neto
salario_neto = salario_bruto - impuestos.
6. Fin.
Flujo de control I: Estructuras selectivas 135
Representación del algoritmo en pseudocódigo
algoritmo Nómina
var
cadena : nombre
real : horas, impuestos, sbruto, sneto
inicio
leer(nombre, horas, tarifa)
si horas = 35 entonces
sbruto ← horas * tarifa
si_no
sbruto ← 35 * tarifa + (horas - 35) * 1.5 * tarifa
fin_si
si sbruto = 2.000 entonces
impuestos ← 0
si_no
si (sbruto  2.000) y (sbruto = 2.220) entonces
impuestos ← (sbruto - 2.000) * 0.20
si_no
impuestos ← (220 * 0.20) + (sbruto - 2.220)
fin_si
fin_si
sneto ← sbruto - impuestos
escribir(nombre, sbruto, impuestos, neto)
fin
Representación del algoritmo en diagrama N-S
inicio
leer nombre, horas, tarifas
horas  = 35
sí no
sbruto ← horas * tarifa
sbruto ← 35 * tarifa + (horas-35)*
15 * tarifa
sbruto  = 2.000
sí no
sí no
sbruto  2.000 y
sbruto  = 2.220
impuestos ←
(sbruto-2.000) * 0.20
impuestos ←
220 * 0.20 +
(sbruto-2.220) * 0.30
sneto ← sbruto - impuestos
escribir nombre, sbruto, impuestos, sneto
fin
impuestos ← 0
136 Fundamentos de programación
Representación del algoritmo en diagrama de flujo
inicio
HORAS = 35
SBRUTO = 2.000
leer
NOMBRE, HORAS, TARIFA
SBRUTO = 2.220
SBRUTO ← HORAS * TARIFA
SBRUTO ← 35 * TARIFA +
(HORAS-35) * 1.5 * TARIFA
IMPUESTOS ← 0
SNETO ← SBRUTO-IMPUESTOS)
IMPUESTOS ← 220 * 0.20 +
(SBRUTO – 2.220) * 0.30
IMPUESTOS ←
(SBRUTO – 2.000) * 0,20
escribir
NOMBRE, SBRUTO,
IMPUESTOS, SNETO
fin
sí no
sí no
sí no
EJEMPLOS 4.6
Empleo de estructura selectiva para detectar si un número tiene o no parte fraccionaria.
algoritmo Parte_fraccionaria
var
real : n
inicio
escribir('Deme numero ')
leer(n)
si n = trunc(n) entonces
escribir('El numero no tiene parte fraccionaria')
si_no
escribir('Numero con parte fraccionaria')
fin_si
fin
EJEMPLOS 4.7
Estructura selectiva para averiguar si un año leído de teclado es o no bisiesto.
algoritmo Bisiesto
var
Flujo de control I: Estructuras selectivas 137
entero : año
inicio
leer(año)
si (año MOD 4 = 0) y (año MOD 100  0) 0 (año MOD 400 = 0) entonces
escribir('El año ', año, ' es bisiesto')
si_no
escribir('El año ', año, ' no bisiesto')
fin_si
fin
EJEMPLOS 4.8
Algoritmo que nos calcule el área de un triángulo conociendo sus lados. La estructura selectiva se utiliza para el
control de la entrada de datos en el programa.
Nota: Area = √p.(p – a) ∙ (p – b) ∙ (p – c) p = (a + b + c)/2
algoritmo Area_triangulo
var
real : a,b,c,p,area
inicio
escribir('Deme los lados ')
leer(a,b,c)
p ← (a + b + c) / 2
si (p  a) y (p  b) y (p  c) entonces
area ← raiz2(p * (p - a) * (p - b) * (p - c))
escribir(area)
si_no
escribir('No es un triangulo')
fin_si
fin
4.5. ALTERNATIVA MÚLTIPLE (según_sea, caso de/case)
Con frecuencia —en la práctica— es necesario que existan más de dos elecciones posibles (por ejemplo, en la reso-
lución de la ecuación de segundo grado existen tres posibles alternativas o caminos a seguir, según que el discrimi-
nante sea negativo, nulo o positivo). Este problema, como se verá más adelante, se podría resolver por estructuras
alternativas simples o dobles, anidadas o en cascada; sin embargo, este método si el número de alternativas es gran-
de puede plantear serios problemas de escritura del algoritmo y naturalmente de legibilidad.
La estructura de decisión múltiple evaluará una expresión que podrá tomar n valores distintos, 1, 2, 3, 4, ..., n.
Según que elija uno de estos valores en la condición, se realizará una de las n acciones, o lo que es igual, el flujo del
algoritmo seguirá un determinado camino entre los n posibles.
Los diferentes modelos de pseudocódigo de la estructura de decisión múltiple se representan en las Figuras 4.6
y 4.7.
Sentencia switch (C , C++, Java, C#)
switch (expresión)
{
case valor1:
sentencia1;
sentencia2;
sentencia3;
138 Fundamentos de programación
Modelo 1:
según_sea expresion (E) hacer
e1: accion S11
accion S12
.
.
accion S1a
e2: accion S21
accion S22
.
.
accion S2b
.
.
en: accion S31
accion S32
.
.
accion S3p
si-no
accion Sx
fin_según
Modelo 2 (simplificado):
según E hacer
.
.
.
fin_según
Modelo 3 (simplificado):
opción E de
.
.
fin_opción
Modelo 4 (simplificado):
caso_de E hacer
.
.
.
fin_caso
Modelo 5 (simplificado):
si E es n hacer
.
.
.
fin_si
Figura 4.6. Estructuras de decisión múltiple.
Modelo 6:
según_sea (expresión) hacer
caso expresión constante :
[Sentencia
sentencia
...
sentencia de ruptura | sentencia ir_a ]
caso expresión constante :
[Sentencia
sentencia
...
sentencia de ruptura | sentencia ir_a ]
caso expresión constante :
[Sentencia
...
sentencia
sentencia de ruptura | sentencia ir_a ]
[otros:
[Sentencia
...
sentencia
sentencia de ruptura | sentencia ir_a ]
fin_según
Figura 4.7. Sintaxis de sentencia según_sea.
Flujo de control I: Estructuras selectivas 139
Diagrama de flujo
acción
S1
acción
S2
acción
S3
acción
S4
.......... acción
Sn
condición
1
2
3 4 n
Diagrama N-S
condición
otros
n
n = 1 2 3
S2 S3
S1 Sn Sx
condición
S2 S3
S1 Sn Sx
Modelo 2
Modelo 1
Pseudocódigo
En inglés la estructura de decisión múltiple se representa:
case expresión of case expresión of
[e1]: acción S1 [e1]: acción S1
.
.
break;
case valor2:
sentencia1;
sentencia2;
sentencia3;
.
.
break;
.
.
default:
sentencia1;
sentencia2;
sentencia3;
.
.
} // fin de la sentencia compuesta
140 Fundamentos de programación
[e2]: acción S2 [e2]: acción S2
.
.
[en]: acción Sn [en]: acción Sn
otherwise else
acción Sx acción Sx
end_case end_case
Como se ha visto, la estructura de decisión múltiple en pseudocódigo se puede representar de diversas formas,
pudiendo ser las acciones S1, S2, etc., simples como en el caso anterior o compuestas y su funcionalidad varía algo
de unos lenguajes a otros.
Notas
1. Obsérvese que para cada valor de la expresión (e) se pueden ejecutar una o varias acciones. Algunos
lenguajes como Pascal a estas instrucciones les denominan compuestas y las delimitan con las palabras
reservadas begin-end (inicio-fin); es decir, en pseudocódigo.
según_sea E hacer
e1: acción S1
e2: acción S2
.
.
en: acción Sn
otros: acción Sx
fin_según
o bien en el caso de instrucciones compuestas
según_sea E hacer
e1: inicio
acción S11
acción S12
.
.
acción S1a
fin
e2: inicio
acción S21
.
.
.
fin
en: inicio
.
.
.
fin
si-no
acción Sx
fin_según
2. Los valores que toman las expresiones (E) no tienen por qué ser consecutivos ni únicos; se pueden con-
siderar rangos de constantes numéricas o de caracteres como valores de la expresión E.
caso_de E hacer
2, 4, 6, 8, 10: escribir ('números pares')
1, 3, 5, 7, 9: escribir ('números impares')
fin_caso
Flujo de control I: Estructuras selectivas 141
¿Cuál de los modelos expuestos se puede considerar representativo? En realidad, como el pseudocódigo es un
lenguaje algorítmico universal, cualquiera de los modelos se podría ajustar a su presentación; sin embargo, nosotros
consideramos como más estándar los modelos 1, 2 y 4. En esta obra seguiremos normalmente el modelo 1, aunque
en ocasiones, y para familiarizar al lector en su uso, podremos utilizar los modelos citados 2 y 4.
Los lenguajes como C y sus derivados C++, Java o C# utilizan como sentencia selectiva múltiple la sentencia
switch, cuyo formato es muy parecido al modelo 6.
EJEMPLO 4.9
Se desea diseñar un algoritmo que escriba los nombres de los días de la semana en función del valor de una varia-
ble DIA introducida por teclado.
Los días de la semana son 7; por consiguiente, el rango de valores de DIA será 1 .. 7, y caso de que DIA tome
un valor fuera de este rango se deberá producir un mensaje de error advirtiendo la situación anómala.
algoritmo DiasSemana
var
entero: DIA
inicio
leer(DIA)
según_sea DIA hacer
1: escribir('LUNES')
2: escribir('MARTES')
3: escribir('MIERCOLES')
4: escribir('JUEVES')
5: escribir('VIERNES')
6: escribir('SABADO')
7: escribir('DOMINGO')
sí-no
escribir('ERROR')
fin_según
fin
EJEMPLO 4.10
Se desea convertir las calificaciones alfabéticas A, B, C, D, E y F a calificaciones numéricas 4, 5, 6, 7, 8 y 9 res-
pectivamente.
Los valores de A, B, C, D, E y F se representarán por la variable LETRA, el algoritmo de resolución del proble-
ma es:
algoritmo Calificaciones
var
carácter: LETRA
entero: calificación
inicio
leer(LETRA)
según_sea LETRA hacer
'A': calificación ← 4
'B': calificación ← 5
'C': calificación ← 6
'D': calificación ← 7
'E': calificación ← 8
'F': calificación ← 9
142 Fundamentos de programación
otros:
escribir ('ERROR')
fin_según
fin
Como se ve en el pseudocódigo, no se contemplan otras posibles calificaciones —por ejemplo, 0, resto notas
numéricas—; si así fuese, habría que modificarlo en el siguiente sentido:
según_sea LETRA hacer
'A': calificación ← 4
'B': calificación ← 5
'C': calificación ← 6
'D': calificación ← 7
'E': calificación ← 8
'F': calificación ← 9
otros: calificación ← 0
fin_según
EJEMPLO 4.11
Se desea leer por teclado un número comprendido entre 1 y 10 (inclusive) y se desea visualizar si el número es par
o impar.
En primer lugar, se deberá detectar si el número está comprendido en el rango válido (1 a 10) y a continuación
si el número es 1, 3, 5, 7, 9, escribir un mensaje de “impar”; si es 2, 4, 6, 8, 10, escribir un mensaje de “par”.
algoritmo PAR_IMPAR
var entero: numero
inicio
leer(numero)
si numero = 1 y numero = 10 entonces
según_sea numero hacer
1, 3, 5, 7, 9: escribir ('impar')
2, 4, 6, 8, 10: escribir ('par')
fin_según
fin_si
fin
EJEMPLO 4.12
Leída una fecha, decir el día de la semana, suponiendo que el día 1 de dicho mes fue lunes.
algoritmo Día_semana
var
entero : dia
inicio
escribir('Diga el día ')
leer(dia)
según_sea dia MOD 7 hacer
1:
escribir('Lunes')
2:
escribir('Martes')
Flujo de control I: Estructuras selectivas 143
3:
escribir('Miercoles')
4:
escribir('Jueves')
5:
escribir('Viernes')
6:
escribir('Sabado')
0:
escribir('Domingo')
fin_según
fin
EJEMPLO 4.13
Preguntar qué día de la semana fue el día 1 del mes actual y calcular que día de la semana es hoy.
algoritmo Dia_semana_modificado
var
entero : dia,d1
carácter : dia1
inicio
escribir('El dia 1 fue (L,M,X,J,V,S,D) ')
leer( dia1)
según_sea dia1 hacer
'L':
d1← 0
'M':
d1← 1
'X':
d1← 2
'J':
d1← 3
'V':
d1← 4
'S':
d1← 5
'D':
d1← 6
si_no
d1← -40
fin_según
escribir('Diga el dia ')
leer( dia)
dia ← dia + d1
según_sea dia MOD 7 hacer
1:
escribir('Lunes')
2:
escribir('Martes')
3:
escribir('Miercoles')
144 Fundamentos de programación
4:
escribir('Jueves')
5:
escribir('Viernes')
6:
escribir('Sabado')
0:
escribir('Domingo')
fin_según
fin
EJEMPLO 4.14
Algoritmo que nos indique si un número entero, leído de teclado, tiene 1, 2, 3 o más de 3 dígitos. Considerar los
negativos.
Se puede observar que la estructura según_sea expresion hacer son varios si expr.logica en-
tonces ... anidados en la rama si_no. Si se cumple el primero ya no pasa por los demás.
algoritmo Digitos
var
entero : n
inicio
leer(n)
según_sea n hacer
-9 .. 9:
escribir('Tiene 1 digito')
-99 .. 99:
escribir('Tiene 2')
-999 .. 999:
escribir('Tiene tres')
si_no
escribir('Tiene mas de tres')
fin_según
fin
4.6. ESTRUCTURAS DE DECISIÓN ANIDADAS (EN ESCALERA)
Las estructuras de selección si-entonces y si-entonces-si_no implican la selección de una de dos alternativas.
Es posible también utilizar la instrucción si para diseñar estructuras de selección que contengan más de dos alterna-
tivas. Por ejemplo, una estructura si-entonces puede contener otra estructura si-entonces, y esta estructura si-
entonces puede contener otra, y así sucesivamente cualquier número de veces; a su vez, dentro de cada estructura
pueden existir diferentes acciones.
si condicion1 entonces
escribir 'hola Mortimer'
. . .
si condicion2 entonces
Flujo de control I: Estructuras selectivas 145
Las estructuras si interiores a otras estructuras si se denominan anidadas o encajadas:
si condicion1 entonces
si condicion2 entonces
.
.
.
acciones
fin_si
fin_si
Una estructura de selección de n alternativas o de decisión múltiple puede ser construida utilizando una estruc-
tura si con este formato:
si condicion1 entonces
acciones
si_no
si condicion2 entonces
acciones
si_no
si condicion3 entonces
acciones
si_no
.
.
.
fin_si
fin_si
fin_si
Una estructura selectiva múltiple constará de una serie de estructuras si, unas interiores a otras. Como las es-
tructuras si pueden volverse bastante complejas para que el algoritmo sea claro, será preciso utilizar indentación
(sangría o sangrado), de modo que exista una correspondencia entre las palabras reservadas si y fin_si, por un
lado, y entonces y si_no, por otro.
La escritura de las estructuras puede variar de unos lenguajes a otros, por ejemplo, una estructura si admite tam-
bién los siguientes formatos:
si expresion booleana1 entonces
acciones
si_no
si expresion booleana2 entonces
acciones
si_no
si expresion booleana3 entonces
acciones
si_no
acciones
fin_si
fin_si
fin_si
o bien
si expresion booleana1 entonces
acciones
146 Fundamentos de programación
si_no si expresion booleana2 entonces
acciones
fin_si
.
.
.
fin_si
EJEMPLO 4.15
Diseñar un algoritmo que lea tres números A, B, C y visualice en pantalla el valor del más grande. Se supone que
los tres valores son diferentes.
Los tres números son A, B y C; para calcular el más grande se realizarán comparaciones sucesivas por parejas.
algoritmo Mayor
var
real: A, B, C, Mayor
inicio
leer(A, B, C)
si A  B entonces
si A  C entonces
Mayor ← A //A  B, A  C
si_no
Mayor ← C //C = A  B
fin_si
si_no
si B  C entonces
Mayor ← B //B = A, B  C
si_no
Mayor ← C //C = B = A
fin_si
fin_si
escribir('Mayor:', Mayor)
fin
EJEMPLO 4.16
El siguiente algoritmo lee tres números diferentes, A, B, C, e imprime los valores máximo y mínimo. El procedimien-
to consistirá en comparaciones sucesivas de parejas de números.
algoritmo Ordenar
var
real : a,b,c
inicio
escribir('Deme 3 numeros')
leer(a, b, c)
si a  b entonces // consideramos los dos primeros (a, b)
// y los ordenamos
si b  c entonces // tomo el 3o
(c) y lo comparo con el menor
// (a o b)
escribir(a, b, c)
si-no // si el 3o
es mayor que el menor averiguo si
si c  a entonces // va delante o detras del mayor
escribir(c, a, b)
Flujo de control I: Estructuras selectivas 147
si_no
escribir(a, c, b)
fin_si
fin_si
si_no
si a  c entonces
escribir(b, a, c)
si_no
si c  b entonces
escribir(c, b, a)
si_no
escribir(b, c, a)
fin_si
fin_si
fin_si
fin
EJEMPLO 4.17
Pseudocódigo que nos permita calcular las soluciones de una ecuación de segundo grado, incluyendo los valores
imaginarios.
algoritmo Soluciones_ecuacion
var
real : a,b,c,d,x1,x2,r,i
inicio
escribir('Deme los coeficientes')
leer(a, b, c)
si a = 0 entonces
escribir('No es ecuacion de segundo grado')
si_no
d ← b * b - 4 * a * c
si d = 0 entonces
x1 ← -b / (2 * a)
x2 ← x1
escribir(x1, x2)
si_no
si d  0 entonces
x1 ← (-b + raiz2(d)) / (2 * a)
x2 ← (-b - raiz2(d)) / (2 * a)
escribir(x1, x2)
si_no
r ← (-b) / (2 * a)
i ← raiz2(abs(d)) / (2 * a)
escribir(r, '+', i, 'i')
escribir(r, '-', i, 'i')
fin_si
fin_si
fin_si
fin
148 Fundamentos de programación
EJEMPLO 4.18
Algoritmo al que le damos la hora HH, MM, SS y nos calcule la hora dentro de un segundo. Leeremos las horas mi-
nutos y segundos como números enteros.
algoritmo Hora_segundo_siguiente
var
entero : hh, mm, ss
inicio
escribir('Deme hh,mm,ss')
leer(hh, mm, ss)
si (hh  24) y (mm  60) y (ss  60) entonces
ss ← ss + 1
si ss = 60 entonces
ss ← 0
mm ← mm + 1
si mm = 60 entonces
mm ← 0
hh ← hh + 1
si hh = 24 entonces
hh ← 0
fin_si
fin_si
fin_si
escribir(hh, ':', mm, ':', ss)
fin_si
fin
4.7. LA SENTENCIA ir-a (goto)
El flujo de control de un algoritmo es siempre secuencial, excepto cuando las estructuras de control estudiadas ante-
riormente realizan transferencias de control no secuenciales.
La programación estructurada permite realizar programas fáciles y legibles utilizando las tres estructuras ya co-
nocidas: secuenciales, selectivas y repetitivas. Sin embargo, en ocasiones es necesario realizar bifurcaciones incon-
dicionales; para ello se recurre a la instrucción ir_a (goto). Esta instrucción siempre ha sido problemática y pres-
tigiosos informáticos, como Dijkstra, han tachado la instrucción goto como nefasta y perjudicial para los
programadores y recomiendan no utilizarla en sus algoritmos y programas. Por ello, la mayoría de los lenguajes de
programación, desde el mítico Pascal —padre de la programación estructurada— pasando por los lenguajes más uti-
lizados en los últimos años y en la actualidad como C, C++, Java o C#, huyen de esta instrucción y prácticamente
no la utilizan nunca, aunque eso sí, mantienen en su juego de sentencias esta “dañina” sentencia por si en situaciones
excepcionales es necesario recurrir a ella.
La sentencia ir_a (goto) es la forma de control más primitiva en los programas de computadoras y correspon-
de a una bifurcación incondicional en código máquina. Aunque lenguajes modernos como VB .NET (Visual
Basic .NET) y C# están en su juego de instrucciones, prácticamente no se utiliza. Otros lenguajes modernos
como Java no contienen la sentencia goto, aunque sí es una palabra reservada.
Aunque la instrucción ir_a (goto) la tienen todos los lenguajes de programación en su juego de instrucciones,
existen algunos que dependen más de ellas que otros, como BASIC y FORTRAN. En general, no existe ninguna
necesidad de utilizar instrucciones ir_a. Cualquier algoritmo o programa que se escriba con instrucciones ir_a se
puede reescribir para hacer lo mismo y no incluir ninguna instrucción ir_a. Un programa que utiliza muchas ins-
trucciones ir_a es más difícil de leer que un programa bien escrito que utiliza pocas o ninguna instrucción ir_a.
Flujo de control I: Estructuras selectivas 149
En muy pocas situaciones las instrucciones ir_a son útiles; tal vez, las únicas razonables son diferentes tipos de
situaciones de salida de bucles. Cuando un error u otra condición de terminación se encuentra, una instrucción ir_a
puede ser utilizada para saltar directamente al final de un bucle, subprograma o un procedimiento completo.
Las bifurcaciones o saltos producidos por una instrucción ir_a deben realizarse a instrucciones que estén nume-
radas o posean una etiqueta que sirva de punto de referencia para el salto. Por ejemplo, un programa puede ser dise-
ñado para terminar con una detección de un error.
algoritmo error
.
.
.
si condicion error entonces
ir_a(100)
fin_si
100: fin
La sentencia ir-a (goto) o sentencia de invocación directa transfiere el control del programa a una posición
especificada por el programador. En consecuencia, interfiere con la ejecución secuencial de un programa. La senten-
cia ir-a tiene una historia muy controvertida y a la que se ha hecho merecedora por las malas prácticas de enseñan-
za que ha producido. Uno de los primeros lenguajes que incluyó esta construcción del lenguaje en sus primeras
versiones fue FORTRAN. Sin embargo, en la década de los sesenta y setenta, y posteriormente con la aparición de
unos lenguajes más sencillos y populares por aquella época, BASIC, la historia negra siguió corriendo, aunque lle-
garon a existir teorías a favor y en contra de su uso y fue tema de debate en foros científicos, de investigación y
profesionales. La historia ha demostrado que no se debe utilizar, ya que produce un código no claro y produce mu-
chos errores de programación que a su vez produce programas poco legibles y muy difíciles de mantener.
Sin embargo, la historia continúa y uno de los lenguajes más jovenes, de propósito general, como C# creado por
Microsoft en el año 2000 incluye esta sentencia entre su diccionario de sentencias y palabras reservadas. Como regla
general es un elemento superfluo del lenguaje y sólo en muy contadas ocasiones, precisamente con la sentencia
switch en algunas aplicaciones muy concretas podría tener alguna utilidad práctica.
Como regla general, es interesante que sepa cómo funciona esta sentencia, pero no la utilice nunca a menos que
le sirva en un momento determinado para resolver una situación no prevista y que un salto prefijado le ayude en esa
resolución. La sintaxis de la sentencia ir_a tiene tres variantes:
ir_a etiqueta (goto etiqueta)
ir_a caso (goto case, en la sentencia switch)
ir_a otros (goto default, en la sentencia switch)
La construcción ir_a etiqueta consta de una sentencia ir_a y una sentencia asociada con una etiqueta. Cuando
se ejecuta una sentencia ir_a, se transfiere el control del programa a la etiqueta asociada, como se ilustra en el si-
guiente recuadro.
…
inicio
…
ir_a etiqueta1
…
fin
…
etiqueta1:
… // el flujo del programa salta a la sentencia siguiente
// a la rotulada por etiqueta1
150 Fundamentos de programación
Normalmente, en el caso de soportar la sentencia ir_a como es el caso del lenguaje C#, la sentencia ir_a (goto)
transfiere el control fuera de un ámbito anidado, no dentro de un ámbito anidado. Por consiguiente, la sentencia si-
guiente no es válida.
inicio
ir_a etiquetaC
…
inicio
….
etiquetaC
…
fin
…
fin
No válido: transferencia de control dentro
de un ámbito anidado
Sin embargo, sí se suele aceptar por el compilador (en concreto C#) el siguiente código:
inicio
…
inicio
….
ir_a etiquetaC
…
fin
etiquetaC
…
fin
La sentencia ir_a pertenece a un grupo de sentencias conocidas como sentencias de salto (jump). Las sentencias
de salto hacen que el flujo de control salte a otra parte del programa. Otras sentencias de salto o bifurcación que se
encuentran en los lenguajes de programación, tanto tradicionales como nuevos (Pascal, C, C++, C#, Java...) son
interrumpir (break), continuar (continue), volver (return) y lanzar (throw). Las tres primeras se sue-
len utilizar con sentencias de control y como retorno de ejecución de funciones o métodos. La sentencia throw se
suele utilizar en los lenguajes de programación que poseen mecanismos de manipulación de excepciones, como sue-
len ser los casos de los lenguajes orientados a objetos tales como C++, Java y C#.
Flujo de control I: Estructuras selectivas 151
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
4.1. Leer dos números y deducir si están en orden creciente.
Solución
Dos números a y b están en orden creciente si a = b.
algoritmo comparacion1
var
real : a, b
inicio
escribir('dar dos numeros')
leer(a, b)
si a = b entonces
escribir('orden creciente')
si_no
escribir('orden decreciente')
fin_si
fin
4.2. Determinar el precio del billete de ida y vuelta en avión, conociendo la distancia a recorrer y sabiendo que si
el número de días de estancia es superior a 7 y la distancia superior a 800 km el billete tiene una reducción del 30
por 100. El precio por km es de 2,5 euros.
Solución
Análisis
Las operaciones secuenciales a realizar son:
1. Leer distancia, duración de la estancia y precio del kilómetro.
2. Comprobar si distancia  800 km. y duración  7 días.
3. Cálculo del precio total del billete:
precio total = distancia * 2.5
• si distancia  800 km. y duración  7 días
precio total = (distancia*2.5) - 30/100 * (precio total).
Pseudocódigo
algoritmo billete
var
entero : E
real : D, PT
inicio
leer(E)
PT ← 2.5*D
si (D  800) y (E  7) entonces
PT ← PT - PT * 30/100
fin_si
escribir('Precio del billete', PT)
fin
4.3. Los empleados de una fábrica trabajan en dos turnos: diurno y nocturno. Se desea calcular el jornal diario de acuer-
do con los siguientes puntos:
1. la tarifa de las horas diurnas es de 5 euros,
2. la tarifa de las horas nocturnas es de 8 euros,
3. caso de ser domingo, la tarifa se incrementará en 2 euros el turno diurno y 3 euros el turno nocturno.
152 Fundamentos de programación
Solución
Análisis
El procedimiento a seguir es:
1. Leer nombre del turno, horas trabajadas (HT) y día de la semana.
2. Si el turno es nocturno, aplicar la fórmula JORNAL = 8*HT.
3. Si el turno es diurno, aplicar la fórmula JORNAL = 5*HT.
4. Si el día es domingo:
• turno diurno JORNAL = (5 + 2)* ht,
• turno nocturno JORNAL = (8 + 3)* HT.
Pseudocódigo
algoritmo jornal
var
cadena : Dia, Turno
real : HT, Jornal
inicio
leer(HT, Dia, Turno)
si Dia   'Domingo' entonces
si Turno = 'diurno' entonces
Jornal ← 5 * HT
si_no
Jornal ← 8 * HT
fin_si
si_no
si Turno = 'diurno' entonces
Jornal ← 7 * HT
si_no
Jornal ← 11 * HT
fin_si
fin_si
escribir(Jornal)
fin
4.4. Construir un algoritmo que escriba los nombres de los días de la semana, en función de la entrada correspondiente
a la variable DIA.
Solución
Análisis
El método a seguir consistirá en clasificar cada día de la semana con un número de orden:
1. LUNES
2. MARTES
3. MIERCOLES
4. JUEVES
5. VIERNES
6. SABADO
7. DOMINGO
si Dia  7 y  1 error de entrada. rango (1 a 7).
si el lenguaje de programación soporta sólo la estructura si-entonces-si_no (if-then-else), se codifica con el
método 1; caso de soportar la estructura según_sea (case), la codificación será el método 2.
Flujo de control I: Estructuras selectivas 153
Pseudocódigo
Método 1
algoritmo Dias_semana1
var
entero : Dia
inicio
leer(Dia)
si Dia = 1 entonces
escribir('LUNES')
si_no
si Dia = 2 entonces
escribir('MARTES')
si_no
si Dia = 3 entonces
escribir('MIERCOLES')
si_no
si Dia = 4 entonces
escribir('JUEVES')
si_no
si Dia = 5 entonces
escribir('VIERNES')
si_no
si Dia = 6 entonces
escribir('SABADO')
si_no
si Dia = 7 entonces
escribir('DOMINGO')
si_no
escribir('error')
escribir('rango 1-7')
fin_si
fin_si
fin_si
fin_si
fin_si
fin_si
fin_si
fin
Método 2
algoritmo Dias_semana2
var
entero : Dia
inicio
leer(Dia)
segun_sea Dia hacer
1: escribir('LUNES')
2: escribir('MARTES')
3: escribir('MIERCOLES')
4: escribir('JUEVES')
5: escribir('VIERNES')
6: escribir('SABADO')
7: escribir('DOMINGO')
en_otro_caso escribir('error de entrada, rango 1-7')
fin_según
fin
154 Fundamentos de programación
CONCEPTOS CLAVE
• Ámbito.
• Claúsula else.
• Condición.
• Condición falsa.
• Condición verdadera.
• Expresión booleana.
• Expresión lógica.
• Operador de comparación.
• Operador de relación.
• Operador lógico.
• Sentencia compuesta.
• Sentencia if, switch.
• Sentencia según-sea.
• Sentencia si-entonces.
• Sentencia si-entonces-sino.
• Si anidada.
• Si en escalera.
RESUMEN
Las estructuras de selección si y según_sea son sentencias
de bifurcación que se ejecutan en función de sus elementos
relacionados en las expresiones o condiciones correspondien-
tes que se forman con operadores lógicos y de comparación.
Estas sentencias permiten escribir algoritmos que realizan to-
mas de decisiones y reaccionan de modos diferentes a datos
diferentes.
1. Una sentencia de bifurcación es una construcción
del lenguaje que utiliza una condición dada (ex-
presión booleana) para decidir entre dos o más
direcciones alternativas (ramas o bifurcaciones) a
seguir en un algoritmo.
2. Un programa sin ninguna sentencia de bifurcación
o iteración se ejecuta secuencialmente, en el orden
en que están escritas las sentencias en el código
fuente o algoritmo. Estas sentencias se denominan
secuenciales.
3. La sentencia si es la sentencia de decisión o selec-
tiva fundamental. Contiene una expresión booleana
que controla si se ejecuta una sentencia (simple o
compuesta).
4. Combinando una sentencia si con una cláusula
sino, el algoritmo puede elegir entre la ejecución
de una o dos acciones alternativas (simple o com-
puesta).
5. Las expresiones relacionales, también denominadas
condiciones simples, se utilizan para comparar ope-
randos. Si una expresión relacional es verdadera, el
valor de la expresión se considera en los lenguajes
de programación el entero 1. Si la expresión rela-
cional es falsa, entonces toma el valor entero de 0.
6. Se pueden construir condiciones complejas utili-
zando expresiones relacionales mediante los ope-
radores lógicos, Y, O, NO.
7. Una sentencia si-entonces se utiliza para selec-
cionar entre dos sentencias alternativas basadas en
el valor de una expresión. Aunque las expresiones
relacionales se utilizan normalmente para la ex-
presión a comprobar, se puede utilizar cualquier
expresión válida. Si la expresión (condición) es
verdadera se ejecuta la sentencia1 y en caso con-
trario se ejecuta la sentencia2
si (expresión) entonces
sentencia1
sino
sentencia2
fin_si
8. Una sentencia compuesta consta de cualquier nú-
mero de sentencias individuales encerradas dentro
de las palabras reservadas inicio y fin (en
el caso de lenguajes de programación como C
y C++, entre una pareja de llaves “{ y }”). Las
sentencias compuestas se tratan como si fuesen
una única unidad y se pueden utilizar en cualquier
parte en que se utilice una sentencia simple.
9. Anidando sentencias si, unas dentro de otras, se
pueden diseñar construcciones que pueden elegir
entre ejecutar cualquier número de acciones (sen-
tencias) diferentes (simples o compuestas).
10. La sentencia según_sea es una sentencia de se-
lección múltiple. El formato general de una sen-
tencia según_sea (switch, en inglés) es
según_sea E hacer
e1: inicio
acción S11
acción S12
.
.
acción S1a
fin
e2: inicio
acción S21
.
.
.
fin
en: inicio
.
.
.
fin
otros: acción Sx
fin_según
Flujo de control I: Estructuras selectivas 155
El valor de la expresión entera se compara
con cada una de las constantes enteras (también
pueden ser carácter o expresiones constantes). La
ejecución del programa se transfiere a la prime-
ra sentencia compuesta cuya etiqueta precedente
(valor e1, e2,--) coincida con el valor de esa
expresión y continúa su ejecución hasta la última
sentencia de ese bloque, y a continuación termina
la sentencia según_sea. En caso de que el valor
de la expresión no coincida con ningún valor de
la lista, entonces se realizan las sentencias que
vienen a continuación de la cláusula otros.
11. La sentencia ir_a (goto) transfiere el control
(salta) a otra parte del programa y, por consiguien-
te, pertenece al grupo de sentencias denominadas
de salto o bifurcación. Es una sentencia muy
controvertida y propensa a errores, por lo que su
uso es muy reducido, por no decir nunca, y sólo
se recomienda en una sentencia según_sea para
salir del correspondiente bloque de sentencias.
12. La sentencia según_sea (switch) es una sen-
tencia construida a medida de los requisitos del
programador para seleccionar múltiples sentencias
(simples o compuestas) y es similar a múltiples
sentencias si-entonces anidadas pero con un
rango de aplicaciones más restringido. Normal-
mente, es más recomendable usar sentencias se-
gún_sea que sentencias si-entonces anidadas
porque ofrecen un código más simple, más claro
y más eficiente.
EJERCICIOS
4.1. Escribir las sentencias si apropiadas para cada una
de las siguientes condiciones:
a) Si un ángulo es igual a 90 grados, imprimir el
mensaje El ángulo es un ángulo recto
sino imprimir el mensaje El ángulo no es
un ángulo recto.
b) Si la temperatura es superior a 100 grados, visua-
lizar el mensaje “por encima del punto de ebulli-
ción del agua” sino visualizar el mensaje “por
debajo del punto de ebullición del agua”.
c) Si el número es positivo, sumar el número a total
de positivos, sino sumar al total de negativos.
d) Si x es mayor que y, y z es menor que 20, leer
un valor para p.
e) Si distancia es mayor que 20 y menos que 35,
leer un valor para tiempo.
4.2. Escribir un programa que solicite al usuario introducir
dos números. Si el primer número introducido es ma-
yor que el segundo número, el programa debe impri-
mir el mensaje El primer número es el mayor,
en caso contrario el programa debe imprimir el men-
saje El primer número es el más pequeño.
Considerar el caso de que ambos números sean igua-
les e imprimir el correspondiente mensaje.
4.3. Dados tres números deducir cuál es el central.
4.4. Calcular la raíz cuadrada de un número y escribir su
resultado. Considerando el caso en que el número sea
negativo.
4.5. Escribir los diferentes métodos para deducir si una
variable o expresión numérica es par.
4.6. Diseñar un programa en el que a partir de una fecha
introducida por teclado con el formato DIA, MES,
AÑO se obtenga la fecha del día siguiente.
4.7. Se desea realizar una estadística de los pesos de los
alumnos de un colegio de acuerdo a la siguiente tabla:
Alumnos de menos de 40 kg.
Alumnos entre 40 y 50 kg.
Alumnos de más de 50 kg y menos de 60 kg.
Alumnos de más o igual a 60 kg.
4.8. Realizar un algoritmo que averigüe si dados dos núme-
ros introducidos por teclado uno es divisor del otro.
4.9. Un ángulo se considera agudo si es menor de 90
grados, obtuso si es mayor de 90 grados y recto si
es igual a 90 grados. Utilizando esta información,
escribir un algoritmo que acepte un ángulo en grados
y visualice el tipo de ángulo correspondiente a los
grados introducidos.
4.10. El sistema de calificación americano (de Estados
Unidos) se suele calcular de acuerdo al siguiente
cuadro:
Grado numérico Grado
en letra
Grado mayor o igual a 90
Menor de 90 pero mayor o igual a 80
Menor de 80 pero mayor o igual a 70
Menor de 70 pero mayor o igual a 69
Menor de 69
A
B
C
D
F
156 Fundamentos de programación
Utilizando esta información, escribir un algo-
ritmo que acepte una calificación numérica del es-
tudiante (0-100), convierta esta calificación a su
equivalente en letra y visualice la calificación corres-
pondiente en letra.
4.11. Escribir un programa que seleccione la operación
aritmética a ejecutar entre dos números dependiendo
del valor de una variable denominada selec-
cionOp.
4.12. Escribir un programa que acepte dos números reales
de un usuario y un código de selección. Si el código
introducido de selección es 1, entonces el programa
suma los dos números introducidos previamente y se
visualiza el resultado; si el código de selección es 2,
los números deben ser multiplicados y visualizado
el resultado; y si el código seleccionado es 3, el pri-
mer número se debe dividir por el segundo número
y visualizarse el resultado.
4.13. Escribir un algoritmo que visualice el siguiente do-
ble mensaje
Introduzca un mes (1 para Enero, 2 para
Febrero,…)
Introduzca un día del mes
El algoritmo acepta y almacena un número en la
variable mes en respuesta a la primera pregunta y
acepta y almacena un número en la variable dia en
respuesta a la segunda pregunta. Si el mes introducido
no está entre 1 y 12 inclusive, se debe visualizar un
mensaje de información al usuario advirtiéndole de
que el número introducido no es válido como mes; de
igual forma se procede con el número que representa
el día del mes si no está en el rango entre 1 y 31.
Modifique el algoritmo para prever que el usua-
rio introduzca números con decimales.
Nota: como los años bisiestos, febrero tiene 29
días, modifique el programa de modo que advierta al
usuario si introduce un día de mes que no existe (por
ejemplo, 30 o 31). Considere también el hecho de que
hay meses de 30 días y otros meses de 31 días, de
modo que nunca se produzca error de introducción
de datos o que en su defecto se visualice un mensaje
al usuario advirtiéndole del error cometido.
4.14. Escriba un programa que simule el funcionamiento
normal de un ascensor (elevador) moderno con 25
pisos (niveles) y que posee dos botones de SUBIR y
BAJAR, excepto en el piso (nivel) inferior, que sólo
existe botón de llamada para SUBIR y en el último
piso (nivel) que sólo existe botón de BAJAR.
CAPÍTULO 5
Flujo de control II:
Estructuras repetitivas
5.1. Estructuras repetitivas
5.2. Estructura mientras (while)
5.3. Estructura hacer-mientras (do-while)
5.4. Diferencias entre mientras (while) y hacer-
mientras (do-while): una aplicación en
C++
5.5. Estructura repetir (repeat)
5.6. Estructura desde/para (for)
5.7. Salidas internas de los bucles
5.8. Sentencias de salto interrumpir (break) y
continuar (continue)
5.9. Comparación de bucles while, for y do-
while: una aplicación en C++
5.10. Diseño de bucles (lazos)
5.11. Estructuras repetitivas anidadas
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
CONCEPTOS CLAVE
RESUMEN
EJERCICIOS
REFERENCIAS BIBLIOGRÁFICAS
Los programas utilizados hasta este momento han
examinado conceptos de programación, tales como
entradas, salidas, asignaciones, expresiones y opera-
ciones, sentencias secuenciales y de selección. Sin
embargo, muchos problemas requieren de caracterís-
ticas de repetición, en las que algunos cálculos o se-
cuencia de instrucciones se repiten una y otra vez,
utilizando diferentes conjuntos de datos. Ejemplos de
tales tareas repetitivas incluyen verificaciones (che-
queos) de entradas de datos de usuarios hasta que
se introduce una entrada aceptable, tal como una
contraseña válida; conteo y acumulación de totales
parciales; aceptación constante de entradas de datos
y recálculos de valores de salida, cuyo proceso sólo se
detiene cuando se introduce o se presenta un valor
centinela.
Este capítulo examina los diferentes métodos que
tilizan los programadores para construir secciones de
código repetitivas. Se describe y analiza el concepto
de bucle como la sección de código que se repite y
que se denomina así ya que cuando termina la ejecu-
ción de la última sentencia el flujo de control vuelve
a la primera sentencia y comienza otra repetición de
las sentencias del código. Cada repetición se conoce
como iteración o pasada a través del bucle.
Se estudian los bucles más típicos, tales como
mientras, hacer-mientras, repetir-hasta
que y desde (o para).
INTRODUCCIÓN
158 Fundamentos de programación
5.1. ESTRUCTURAS REPETITIVAS
Las computadoras están especialmente diseñadas para todas aquellas aplicaciones en las cuales una operación o con-
junto de ellas deben repetirse muchas veces. Un tipo muy importante de estructura es el algoritmo necesario para
repetir una o varias acciones un número determinado de veces. Un programa que lee una lista de números puede
repetir la misma secuencia de mensajes al usuario e instrucciones de lectura hasta que todos los números de un fi-
chero se lean.
Las estructuras que repiten una secuencia de instrucciones un número determinado de veces se denominan bucles y
se denomina iteración al hecho de repetir la ejecución de una secuencia de acciones. Un ejemplo aclarará la cuestión.
Supongamos que se desea sumar una lista de números escritos desde teclado —por ejemplo, calificaciones de los
alumnos de una clase—. El medio conocido hasta ahora es leer los números y añadir sus valores a una variable SUMA
que contenga las sucesivas sumas parciales. La variable SUMA se hace igual a cero y a continuación se incrementa en
el valor del número cada vez que uno de ellos se lea. El algoritmo que resuelve este problema es:
algoritmo suma
var
entero : SUMA, NUMERO
inicio
SUMA ← 0
leer(numero)
SUMA ← SUMA + numero
leer(numero)
SUMA ← SUMA + numero
leer(numero)
fin
y así sucesivamente para cada número de la lista. En otras palabras, el algoritmo repite muchas veces las acciones.
leer(numero)
SUMA ← SUMA + numero
Tales opciones repetidas se denominan bucles o lazos. La acción (o acciones) que se repite en un bucle se deno-
mina iteración. Las dos principales preguntas a realizarse en el diseño de un bucle son ¿qué contiene el bucle? y
¿cuántas veces se debe repetir?
Cuando se utiliza un bucle para sumar una lista de números, se necesita saber cuántos números se han de sumar.
Para ello necesitaremos conocer algún medio para detener el bucle. En el ejemplo anterior usaremos la técnica de
solicitar al usuario el número que desea, por ejemplo, N. Existen dos procedimientos para contar el número de iteracio-
nes, usar una variable TOTAL que se inicializa a la cantidad de números que se desea y a continuación se decrementa
en uno cada vez que el bucle se repite (este procedimiento añade una acción más al cuerpo del bucle: TOTAL ← TO-
TAL - 1), o bien inicializar la variable TOTAL en 0 o en 1 e ir incrementando en uno a cada iteración hasta llegar al
número deseado.
algoritmo suma_numero
var
entero : N, TOTAL
real : NUMERO, SUMA
inicio
leer(N)
TOTAL ← N
SUMA ← 0
mientras TOTAL  0 hacer
leer(NUMERO)
SUMA ← SUMA + NUMERO
TOTAL ← TOTAL - 1
fin_mientras
escribir('La suma de los', N, 'números es', SUMA)
fin
Flujo de control II: Estructuras repetitivas 159
El bucle podrá también haberse terminado poniendo cualquiera de estas condiciones:
• hasta_que TOTAL sea cero
• desde 1 hasta N
Para detener la ejecución de los bucles se utiliza una condición de parada. El pseudocódigo de una estructura
repetitiva tendrá siempre este formato:
inicio
//inicialización de variables
repetir
acciones S1, S2, ...
salir según condición
acciones Sn, Sn+1, ...
fin_repetir
Aunque la condición de salida se indica en el formato anterior en el interior del bucle —y existen lenguajes que
así la contienen expresamente1
—, lo normal es que la condición se indique al final o al principio del bucle, y así se
consideran tres tipos de instrucciones o estructuras repetitivas o iterativas generales y una particular que denomina-
remos iterar, que contiene la salida en el interior del bucle.
iterar (loop)
mientras (while)
hacer-mientras (do-while)
repetir (repeat)
desde (for)
El algoritmo de suma anterior podría expresarse en pseudocódigo estándar así:
algoritmo SUMA_numeros
var
entero : N, TOTAL
real : NUMERO, SUMA
inicio
leer(N)
TOTAL ← N
SUMA ← 0
repetir
leer(NUMERO)
SUMA ← SUMA + NUMERO
TOTAL ← TOTAL - 1
hasta_que TOTAL = 0
escribir('La suma es', SUMA)
fin
Los tres casos generales de estructuras repetitivas dependen de la situación y modo de la condición. La condición
se evalúa tan pronto se encuentra en el algoritmo y su resultado producirá los tres tipos de estructuras citadas.
1. La condición de salida del bucle se realiza al principio del bucle (estructura mientras).
algoritmo SUMA1
inicio
1
Modula-2 entre otros.
160 Fundamentos de programación
//Inicializar K, S a cero
K ← 0
S ← 0
leer(n)
mientras K  n hacer
K ← K + 1
S ← S + K
fin_mientras
escribir (S)
fin
Se ejecuta el bucle mientras se verifica una condición (K  n).
2. La condición de salida se origina al final del bucle; el bucle se ejecuta hasta que se verifica una cierta con-
dición.
repetir
K ← K + 1
S ← S + K
hasta_que K  n
3. La condición de salida se realiza con un contador que cuenta el número de iteraciones.
desde i = vi hasta vf hacer
S ← S + i
fin_desde
i es un contador que cuenta desde el valor inicial (vi) hasta el valor final (vf) con los incrementos que se
consideren; si no se indica nada, el incremento es 1.
5.2. ESTRUCTURA mientras (while)
La estructura repetitiva mientras (en inglés while o dowhile: hacer mientras) es aquella en que el cuerpo del
bucle se repite mientras se cumple una determinada condición. Cuando se ejecuta la instrucción mientras, la pri-
mera cosa que sucede es que se evalúa la condición (una expresión booleana). Si se evalúa falsa, no se toma ningu-
na acción y el programa prosigue en la siguiente instrucción del bucle. Si la expresión booleana es verdadera, en-
tonces se ejecuta el cuerpo del bucle, después de lo cual se evalúa de nuevo la expresión booleana. Este proceso se
repite una y otra vez mientras la expresión booleana (condición) sea verdadera. El ejemplo anterior quedaría así y
sus representaciones gráficas como las mostradas en la Figura 5.1.
EJEMPLO 5.1
Leer por teclado un número que represente una cantidad de números que a su vez se leerán también por teclado.
Calcular la suma de todos esos números.
algoritmo suma_numeros
var
entero : N, TOTAL
real : numero, SUMA
inicio
leer(N)
{leer numero total N}
TOTAL ← N
SUMA ← 0
Flujo de control II: Estructuras repetitivas 161
mientras TOTAL  0 hacer
leer(numero)
SUMA ← SUMA + numero
TOTAL ← TOTAL - 1
fin_mientras
escribir('La suma de los', N, 'numeros es', SUMA)
fin
En el caso anterior, como la variable TOTAL se va decrementando y su valor inicial era N, cuando tome el valor 0,
significará que se han realizado N iteraciones, o, lo que es igual, se han sumado N números y el bucle se debe parar
o terminar.
EJEMPLO 5.2
Contar los números enteros positivos introducidos por teclado. Se consideran dos variables enteras numero y con-
tador (contará el número de enteros positivos). Se supone que se leen números positivos y se detiene el bucle cuan-
do se lee un número negativo o cero.
algoritmo cuenta_enteros
var
entero : numero, contador
inicio
contador ← 0
leer(numero)
mientras numero  0 hacer
leer(numero)
contador ← contador + 1
fin_mientras
escribir('El numero de enteros positivos es', contador)
fin
Pseudocódigo en español
mientras condicion hacer
accion S1
accion S2
.
.
acción Sn
fin _ mientras
Pseudocódigo en inglés
while condicion do
acciones
.
.
endwhile
o bien
dowhile condicion
acciones
.
.
enddo
a)
b)
c)
acciones
condición
no
sí
mientras
acciones
condición
Figura 5.1. Estructura mientras: a) diagrama de flujo; b) pseudocódigo; c) diagrama N-S.
162 Fundamentos de programación
inicio
contador ← 0
leer numero
mientras numero  0
leer numero
contador ← contador + 1
escribir 'numeros enteros', contador
fin
La secuencia de las acciones de este algoritmo se puede reflejar en el siguiente pseudocódigo:
Paso Pseudocódigo Significado
1 contador ← 0 inicializar contador a 0
2 leer(numero) leer primer número
3 mientras numero  0 hacer comprobar si numero  0. Si es así, continuar con el paso
4. Si no, continuar con el paso 7
4 sumar 1 a contador incrementar contador
5 leer(numero) leer siguiente numero
6 regresar al paso 3 evaluar y comprobar la expresión booleana
7 escribir(contador) visualizar resultados
Obsérvese que los pasos 3 a 6 se ejecutarán mientras los números de entrada sean positivos. Cuando se lea –15
(después de 4 pasos), la expresión numero  0 produce un resultado falso y se transfiere el control a la acción es-
cribir y el valor del contador será 4.
5.2.1. Ejecución de un bucle cero veces
Obsérvese que en una estructura mientras la primera cosa que sucede es la evaluación de la expresión booleana;
si se evalúa falsa en ese punto, entonces del cuerpo del bucle nunca se ejecuta. Puede parecer inútil ejecutar el
cuerpo del bucle cero veces, ya que no tendrá efecto en ningún valor o salida. Sin embargo, a veces es la acción
deseada.
inicio
n ← 5
s ← 0
mientras n = 4 hacer
leer(x)
s ← s + x
fin_mientras
fin
En el ejemplo anterior se aprecia que nunca se cumplirá la condición (expresión booleana n = 4), por lo cual
se ejecutará la acción fin y no se ejecutará ninguna acción del bucle.
Flujo de control II: Estructuras repetitivas 163
EJEMPLO 5.3
El siguiente bucle no se ejecutará si el primer número leído es negativo o cero.
C ← 0
leer(numero)
mientras numero  0 hacer
C ← C + 1
leer(numero)
fin_mientras
5.2.2. Bucles infinitos
Algunos bucles no exigen fin y otros no encuentran el fin por error en su diseño. Por ejemplo, un sistema de reservas
de líneas aéreas puede repetir un bucle que permita al usuario añadir o borrar reservas. El programa y el bucle corren
siempre, o al menos hasta que la computadora se apaga. En otras ocasiones un bucle no se termina nunca porque
nunca se cumple la condición.
Un bucle que nunca se termina se denomina bucle infinito o sin fin. Los bucles sin fin no intencionados son per-
judiciales para la programación y se deben evitar siempre.
Consideremos el siguiente bucle que visualiza el interés producido por un capital a las tasas de interés compren-
didos en el rango desde 10 a 20 por 100.
leer(capital)
tasa ← 10
mientras tasa  20 hacer
interes ← tasa*0.01*capital // tasa*capital/100=tasa*0.01*capital
escribir('interes producido', interes)
tasa ← tasa + 2
fin_mientras
escribir('continuacion')
Los sucesivos valores de la tasa serán 10, 12, 14, 16, 18, 20, de modo que al tomar tasa el valor 20 se detendrá
el bucle y se escribirá el mensaje 'continuación'. Supongamos que se cambia la línea última del bucle por
tasa ← tasa + 3
El problema es que el valor de la tasa salta ahora de 19 a 22 y nunca será igual a 20 (10, 13, 16, 19, 22,...). El
bucle sería infinito, la expresión booleana para terminar el bucle será:
tasa  20 o bien tasa = 20
Regla práctica
Las pruebas o test en las expresiones booleanas es conveniente que sean mayor o menor que en lugar de prue-
bas de igualdad o desigualdad. En el caso de la codificación en un lenguaje de programación, esta regla debe
seguirse rígidamente en el caso de comparación de números reales, ya que como esos valores se almacenan
en cantidades aproximadas las comparaciones de igualdad de valores reales normalmente plantean problemas.
Siempre que realice comparaciones de números reales use las relaciones , =,  o =.
5.2.3. Terminación de bucles con datos de entrada
Si su algoritmo o programa está leyendo una lista de valores con un bucle mientras, se debe incluir algún tipo de
mecanismo para terminar el bucle. Existen cuatro métodos típicos para terminar un bucle de entrada:
164 Fundamentos de programación
1. preguntar antes de la iteración,
2. encabezar la lista de datos con su tamaño,
3. finalizar la lista con su valor de entrada,
4. agotar los datos de entrada.
Examinémoslos por orden. El primer método simplemente solicita con un mensaje al usuario si existen más en-
tradas.
Suma ← 0
escribir('Existen mas numeros en la lista s/n')
leer(Resp) //variable Resp, tipo carácter
mientras(Resp = 'S') o (Resp = 's') hacer
escribir('numero')
leer(N)
Suma ← Suma + N
escribir('Existen mas numeros (s/n)')
leer(Resp)
fin_mientras
Este método a veces es aceptable y es muy útil en ciertas ocasiones, pero suele ser tedioso para listas grandes;
en este caso, es preferible incluir una señal de parada. El método de conocer en la cabecera del bucle el tamaño o el
número de iteraciones ya ha sido visto en ejemplos anteriores.
Tal vez el método más correcto para terminar un bucle que lee una lista de valores es con un centinela. Un valor
centinela es un valor especial usado para indicar el final de una lista de datos. Por ejemplo, supongamos que se tienen
unas calificaciones de unos tests (cada calificación comprendida entre 0 y 100); un valor centinela en esta lista pue-
de ser –999, ya que nunca será una calificación válida y cuando aparezca este valor se terminará el bucle. Si la lista
de datos son números positivos, un valor centinela puede ser un número negativo que indique el final de la lista. El
siguiente ejemplo realiza la suma de todos los números positivos introducidos desde el terminal.
suma ← 0
leer(numero)
mientras numero = 0 hacer
suma ← suma+numero
leer(numero)
fin_mientras
Obsérvese que el último número leído de la lista no se añade a la suma si es negativo, ya que se sale fuera del
bucle. Si se desea sumar los números 1, 2, 3, 4 y 5 con el bucle anterior, el usuario debe introducir, por ejemplo:
1 2 3 4 5 -1
el valor final –1 se lee, pero no se añade a la suma. Nótese también que cuando se usa un valor centinela se invierte
el orden de las instrucciones de lectura y suma con un valor centinela, éste debe leerse al final del bucle y se debe
tener la instrucción leer al final del mismo.
El último método de agotamiento de datos de entrada es comprobar simplemente que no existen más datos de
entrada. Este sistema suele depender del tipo de lenguaje; por ejemplo, Pascal puede detectar el final de una línea;
en los archivos secuenciales se puede detectar el final físico del archivo (eof, end of file).
EJEMPLO 5.4
Considere los siguientes algoritmos. ¿Qué visualizará y cuántas veces se ejecuta el bucle?
1. i ← 0
mientras i  6 hacer
escribir(i)
i ← i + 1
fin_mientras
Flujo de control II: Estructuras repetitivas 165
La salida es el valor de la variable de control i al principio de cada ejecución del cuerpo del bucle: 0, 1, 2,
3, 4 y 5. El bucle se ejecuta seis veces.
2. i ← 0
mientras i  6 hacer
i ← i + 1
escribir(i)
fin_mientras
La salida será entonces 1, 2, 3, 4, 5 y 6. El cuerpo del bucle se ejecuta también seis veces. Obsérvese que
cuando i = 5, la expresión booleana es verdadera y el cuerpo del bucle se ejecuta; con i = 6 la sentencia
escribir se ejecuta, pero a continuación se evalúa la expresión booleana y se termina el bucle.
EJEMPLO 5.5
Calcular la media de un conjunto de notas de alumnos. Pondremos un valor centinela de –99 que detecte el fin del
bucle.
inicio
total ← 0
n ← 0 //numero de alumnos
leer(nota) //la primera nota debe ser distinta de -99
mientras nota  -99 hacer
total ← total + nota
n ← n + 1
leer (nota)
fin_mientras
media ← total / n
escribir('La media es', media)
fin
Obsérvese que total y n se inicializan a cero antes de la instrucción mientras. Cuando el bucle termina, la
variable total contiene la suma de todas las notas y, por consiguiente, total/n, siendo n el número de alumnos,
será la media de la clase.
5.3. ESTRUCTURA hacer-mientras (do-while)
El bucle mientras al igual que el bucle desde que se verá con posterioridad evalúan la expresión al comienzo del
bucle de repetición; siempre se utilizan para crear bucle pre-test. Los bucles pre-test se denominan también bucles
controlados por la entrada. En numerosas ocasiones se necesita que el conjunto de sentencias que componen el cuer-
po del bucle se ejecuten al menos una vez sea cual sea el valor de la expresión o condición de evaluación. Estos
bucles se denominan bucles post-test o bucles controlados por la salida. Un caso típico es el bucle hacer-mientras
(do-while) existente en lenguajes como C/C++, Java o C#.
El bucle hacer-mientras es análogo al bucle mientras y el cuerpo del bucle se ejecuta una y otra vez mien-
tras la condición (expresión booleana) sea verdadera. Existe, sin embargo, una gran diferencia y es que el cuerpo del
bucle está encerrado entre las palabras reservadas hacer y mientras, de modo que las sentencias de dicho cuerpo se
ejecutan, al menos una vez, antes de que se evalúe la expresión booleana. En otras palabras, el cuerpo del bucle
siempre se ejecuta, al menos una vez, incluso aunque la expresión booleana sea falsa.
Regla
El bucle hacer-mientras se termina de ejecutar cuando el valor de la condición es falsa. La elección entre un
bucle mientras y un bucle hacer-mientras depende del problema de cómputo a resolver. En la mayoría de
los casos, la condición de entrada del bucle mientras es la elección correcta. Por ejemplo, si el bucle se utiliza
para recorrer una lista de números (o una lista de cualquier tipo de objetos), la lista puede estar vacía, en cuyo
caso las sentencias del bucle nunca se ejecutarán. Si se aplica un bucle hacer-mientras nos conduce a un
código de errores.
166 Fundamentos de programación
Al igual que en el caso del bucle mientras la sentencia en el interior del bucle puede ser simple o compuesta.
Todas las sentencias en el interior del bucle se ejecutan al menos una vez antes de que la expresión o condición se
evalúe. Entonces, si la expresión es verdadera (un valor distinto de cero, en C/C++) las sentencias del cuerpo del
bucle se ejecutan una vez más. El proceso continúa hasta que la expresión evaluada toma el valor falso (valor cero
en C/C++). El diagrama de control del flujo se ilustra en la Figura 5.2, donde se muestra el funcionamiento de la
sentencia hacer-mientras. La Figura 5.3 representa un diagrama de sintaxis con notación BNF de la sentencia
hacer-mientras.
Sentencia hacer-mientras::=
hacer
cuerpo del bucle
mientras (condición_del_bucle)
donde
cuerpo del bucle::= sentencia
::= sentencia_compuesta
condición del bucle::= expresión booleana
Nota: el cuerpo del bucle se repite mientras condición del bucle sea verdadero.
Figura 5.3. Diagrama de sintaxis de la sentencia hacer-mientras.
EJEMPLO 5.6
Obtener un algoritmo que lea un número (por ejemplo, 198) y obtenga el número inverso (por ejemplo, 891).
algoritmo invertirnummero
var
entero: num, digitoSig
inicio
num ← 198
escribir ('Número: ← ', num)
escribir ('Número en orden inverso: ')
hacer
digitoSig = num MOD 10
a) Diagrama de flujo de una sentencia
hacer-mientras
b) Pseudocódigo de una sentencia
hacer-mientras
acciones
condición
verdadera
falsa hacer
acciones
mientras (expresión)
Figura 5.2. Estructura hacer-mientras: a) diagrama de flujo; b) pseudocódigo.
Flujo de control II: Estructuras repetitivas 167
escribir(digitoSig)
num = num DIV 10
mientras num  0
fin
La salida de este programa se muestra a continuación:
Número: 198
Número en orden inverso: 891
Análisis del ejemplo anterior
Con cada iteración se obtiene el dígito más a la derecha, ya que es el resto de la división entera del valor del núme-
ro (num) por 10. Así en la primera iteración digitoSig vale 8 ya que es el resto de la división entera de 198 entre
10 (cociente 19 y resto 8). Se visualiza el valor 8. A continuación se divide 198 entre 10 y se toma el cociente ente-
ro 19, que se asigna a la variable num.
En la siguiente iteración se divide 19 por 10 (cociente entero 1, resto 9) y se visualiza, por consiguiente, el valor del
resto, digitoSig, es decir el dígito 9; a continuación se divide 19 por 10 y se toma el cociente entero, es decir, 1.
En la tercera y última iteración se divide 1 por 10 y se toma el resto (digitoSig) que es el dígito 1. Se visua-
liza el dígito 1 a continuación de 89 y como resultado final aparece 891. A continuación se efectúa la división de
nuevo por 10 y entonces el cociente entero es 0 que se asigna a num que al no ser ya mayor que cero hace que se
termine el bucle y el algoritmo correspondiente.
5.4. DIFERENCIAS ENTRE mientras (while) Y hacer-mientras (do-while):
UNA APLICACIÓN EN C++
Una sentencia do-while es similar a una sentencia while, excepto que el cuerpo del bucle se ejecuta siempre al
menos una vez.
Sintaxis
sentencia compuesta
while (Expresion_lógica) do
{ {
sentencia_1; sentencia_1;
sentencia_2; sentencia_2;
... ...
sentencia_n; sentencia_n;
} } while (expresion_lógica)
while (Expresión_lógica) do
sentencia sentencia
while (expresión_lógica)
sentencia simple
Ejemplo 1
// cuenta a 10
int x = 0;
168 Fundamentos de programación
do
cout  X:  x++;
while (x  10)
Ejemplo 2
// imprimir letras minúsculas del alfabeto
char car = 'a';
do
{
cout  car  '';
car++;
}while (car = 'z');
EJEMPLO 5.7
Visualizar las potencias de dos cuerpos cuyos valores estén en el rango 1 a 1.000.
// ejercicio con while // ejercicio con do-while
potencia = 1; potencia = 1;
while (potencia  1000) do
{ {
cout  potencia  endl; cout  potencia  endl;
potencia *= 2 potencia *= 2;
} // fin de while } while (potencia  1000);
5.5. ESTRUCTURA repetir (repeat)
Existen muchas situaciones en las que se desea que un bucle se ejecute al menos una vez antes de comprobar la
condición de repetición. En la estructura mientras si el valor de la expresión booleana es inicialmente falso, el
cuerpo del bucle no se ejecutará; por ello, se necesitan otros tipos de estructuras repetitivas.
La estructura repetir (repeat) se ejecuta hasta que se cumpla una condición determinada que se comprueba
al final del bucle (Figura 5.4).
El bucle repetir-hasta_que se repite mientras el valor de la expresión booleana de la condición sea falsa,
justo la opuesta de la sentencia mientras.
algoritmo repetir
var
real : numero
entero: contador
inicio
contador ← 1
repetir
leer(numero)
contador ← contador + 1
hasta_que contador  30
escribir('Numeros leidos 30')
fin
En el ejemplo anterior el bucle se repite hasta que el valor de la variable contador exceda a 30, lo que sucede-
rá después de 30 ejecuciones del cuerpo del bucle.
Flujo de control II: Estructuras repetitivas 169
EJEMPLO 5.8
Desarrollar el algoritmo necesario para calcular el factorial de un número N que responda a la fórmula:
N! = N * (N – 1) * (N – 2), ..., 3 * 2 * 1
El algoritmo correspondiente es:
algoritmo factorial
var
entero : I, N
real : Factorial
inicio
leer(N) // N  = 1
Factorial ← 1
I ← 1
repetir
Factorial ← Factorial * I
I ← I + 1
hasta_que I = N + 1
escribir('El factorial del numero', N, 'es', Factorial)
fin
Con una estructura repetir el cuerpo del bucle se ejecuta siempre al menos una vez. Cuando una instrucción
repetir se ejecuta, lo primero que sucede es la ejecución del bucle y, a continuación, se evalúa la expresión boolea-
na resultante de la condición. Si se evalúa como falsa, el cuerpo del bucle se repite y la expresión booleana se evalúa
una vez. Después de cada iteración del cuerpo del bucle, la expresión booleana se evalúa; si es verdadera, el bucle
termina y el programa sigue en la siguiente instrucción a hasta_que.
Diagrama de flujo
acciones
condición
falsa
verdadera
Diagrama N-S
repetir condiciones
acciones
a) Español
Pseudocódigo
repetir
acciones
.
.
hasta _ que condicion
b) Inglés
b)
c)
repeat
acciones
.
.
until condicion
Figura 5.4. Estructura repetir: pseudocódigo, diagrama de flujo, diagrama N-S.
170 Fundamentos de programación
Diferencias de las estructuras mientras y repetir
• La estructura mientras termina cuando la condición es falsa, mientras que repetir termina cuando la con-
dición es verdadera.
• En la estructura repetir el cuerpo del bucle se ejecuta siempre al menos una vez; por el contrario, mientras
es más general y permite la posibilidad de que el bucle pueda no ser ejecutado. Para usar la estructura re-
petir debe estar seguro de que el cuerpo del bucle —bajo cualquier circunstancia— se repetirá al menos
una vez.
EJEMPLO 5.9
Encontrar el entero positivo más pequeño (num) para el cual la suma 1+2+3+...+num es menor o igual que lí-
mite.
1. Introducir limite.
2. Inicializar num y suma a 0.
3. Repetir las acciones siguientes hasta que suma  limite
• incrementar num en 1,
• añadir num a suma.
4. Visualizar num y suma.
El pseudocódigo de este algoritmo es:
algoritmo mas_pequeño
var
entero : num, limite, suma
inicio
leer(limite)
num ← 0
suma ← 0
repetir
num ← num + 1
suma ← suma + num
hasta_que suma  limite
escribir(num, suma)
fin
EJEMPLO 5.10
Escribir los números 1 a 100.
algoritmo uno_cien
var
entero : num
inicio
num ← 1
repetir
escribir(num)
num ← num + 1
hasta_que num  100
fin
Flujo de control II: Estructuras repetitivas 171
EJEMPLO 5.11
Es muy frecuente tener que realizar validación de entrada de datos en la mayoría de las aplicaciones. Este ejemplo
detecta cualquier entrada comprendida entre 1 y 12, rechazando las restantes, ya que se trata de leer los números
correspondientes a los meses del año.
algoritmo validar_mes
var
entero : mes
inicio
escribir('Introducir numero de mes')
repetir
leer(mes)
si (mes  1) o (mes  12) entonces
escribir('Valor entre 1 y 12')
fin_si
hasta_que (mes =1) y (mes = 12)
fin
Este sistema es conocido como interactivo por entablar un «diálogo imaginario» entre la computadora y el pro-
gramador que se produce «en tiempo real» entre ambas partes, es decir, «interactivo» con el usuario.
5.6. ESTRUCTURA desde/para (for)
En muchas ocasiones se conoce de antemano el número de veces que se desean ejecutar las acciones de un bucle.
En estos casos, en el que el número de iteraciones es fijo, se debe usar la estructura desde o para (for, en inglés).
La estructura desde ejecuta las acciones del cuerpo del bucle un número especificado de veces y de modo automá-
tico controla el número de iteraciones o pasos a través del cuerpo del bucle. Las herramientas de programación de la
estructura desde o para se muestran en la página siguiente junto a la Figura 5.5.
5.6.1. Otras representaciones de estructuras repetitivas desde/para (for)
Un bucle desde (for) se representa con los símbolos de proceso y de decisión mediante un contador. Así, por ejem-
plo, en el caso de un bucle de lectura de cincuenta números para tratar de calcular su suma:
I ← 1 I ← 1
I = 50
Proceso
I ← I + 1
no
sí
no
sí
proceso o acciones
del bucle
I  50
inicialización
del contador
I ← I + 1
172 Fundamentos de programación
Pseudocódigo estructura desde
desde v ← vi hasta vf [incremento incr] hacer
acciones
.
.
.
fin_desde
v: variable indice
vi, vf: valores inicial y final de la variable
a) Modelo 1
para v ← vi hasta vf [incremento incr] hacer
acciones
.
.
.
fin_para
b) Modelo 2
Diagrama N-S, estructura desde
desde v = vi hasta vf [incremento incr] hacer
acciones
fin_desde
b) Modelo 3
Diagrama de flujo, estructura, desde
variable
índice  valor
final
verdadero
falso
acciones
calcular
valor inicial
y valor final
fijar la
variable índice
al valor inicial
incrementar
variable índice
cuerpo del bucle
c) Modelo 4
Figura 5.5. Estructura desde (for): a) pseudocódigo, b) diagrama N-S, c) diagrama de flujo.
Flujo de control II: Estructuras repetitivas 173
Es posible representar el bucle con símbolos propios
no
sí
acciones
i  vf
no
sí
acciones
i  vf
i ← vi
i ← vi + X
i ← vi
i ← vi + X
o bien mediante este otro símbolo
m1 = contador inicial
m2 = contador final
m3 = incremento de paso
proceso
repetir
variable =
m1, m2, m3
Como aplicación, calcular la suma de los N primeros enteros.
i  vf
i ← vi
i ← vi + X
no
sí
fin
escribir
'Suma =', S
S ← S + 1
equivale a
algoritmo suma
var
entero : I, N, S
inicio
S ← 0
desde I ← 1 hasta N hacer
S ← S + I
fin_desde
escribir('Suma =', S)
fin
leer (N)
,
174 Fundamentos de programación
La estructura desde comienza con un valor inicial de la variable índice y las acciones especificadas se ejecutan,
a menos que el valor inicial sea mayor que el valor final. La variable índice se incrementa en uno y si este nuevo valor
no excede al final, se ejecutan de nuevo las acciones. Por consiguiente, las acciones específicas en el bucle se ejecutan
para cada valor de la variable índice desde el valor inicial hasta el valor final con el incremento de uno en uno.
El incremento de la variable índice siempre es 1 si no se indica expresamente lo contrario. Dependiendo del tipo
de lenguaje, es posible que el incremento sea distinto de uno, positivo o negativo. Así, por ejemplo, FORTRAN ad-
mite diferentes valores positivos o negativos del incremento, y Pascal sólo admite incrementos cuyo tamaño es la
unidad: bien positivos, bien negativos. La variable índice o de control normalmente será de tipo entero y es normal
emplear como nombres las letras I, J, K.
El formato de la estructura desde varía si se desea un incremento distinto a 1, bien positivo, bien negativo (de-
cremento).
desde v ← vi hasta vf inc paso hacer {inc, incremento}
dec {dec, decremento}
acciones
.
.
.
fin_desde
Si el valor inicial de la variable índice es menor que el valor final, los incrementos deben ser positivos, ya que
en caso contrario la secuencia de acciones no se ejecutaría. De igual modo, si el valor inicial es mayor que el valor
final, el incremento debe ser en este caso negativo, es decir, decremento. Al incremento se le suele denominar también
paso (“step”, en inglés). Es decir,
desde i ← 20 hasta 10 hacer
acciones
fin_desde
no se ejecutaría, ya que el valor inicial es 20 y el valor final 10, y como se supone un incremento positivo, de valor 1,
se produciría un error. El pseudocódigo correcto debería ser
desde i ← 20 hasta 10 decremento 1 hacer
acciones
fin_desde
5.6.2. Realización de una estructura desde con estructura mientras
Es posible, como ya se ha mencionado en apartados anteriores, sustituir una estructura desde por una mientras;
en las líneas siguientes se indican dos formas para ello:
1. Estructura desde con incrementos de la variable índice positivos.
v ← vi
mientras v = vf hacer
acciones
v ← v + incremento
fin_mientras
2. Estructura desde con incrementos de la variable índice negativos.
v ← vi
mientras v = vf hacer
acciones
v ← v - decremento
fin_mientras
Flujo de control II: Estructuras repetitivas 175
La estructura desde puede realizarse con algoritmos basados en estructura mientras y repetir, por lo que
pueden ser intercambiables cuando así lo desee. Las estructuras equivalentes a desde son las siguientes:
a) inicio b) inicio
i ← n i ← 1
mientras i  0 hacer mientras i = n hacer
acciones acciones
i ← i – 1 i ← i + 1
fin_mientras fin_mientras
fin fin
c) inicio d) inicio
i ← 0 i ← 1
repetir repetir
acciones acciones
i ← i+1 i ← i+1
hasta_que i = n hasta_que i  n
fin fin
e) inicio f) inicio
i ← n + 1 i ← n
repetir repetir
acciones acciones
i ← i - 1 i ← i - 1
hasta_que i = 1 hasta_que i  1
fin fin
5.7. SALIDAS INTERNAS DE LOS BUCLES
Aunque no se incluye dentro de las estructuras básicas de la programación estructurada, en ocasiones es necesario
disponer de una estructura repetitiva que permita la salida en un punto intermedio del bucle cuando se cumpla una
condición. Esta nueva estructura sólo está disponible en algunos lenguajes de programación específicos; la denomi-
naremos iterar para diferenciarlo de repetir_hasta ya conocida. Las salidas de bucles suelen ser válidas en
estructuras mientras, repetir y desde.
El formato de la estructura es
iterar
acciones
si condicion entonces
salir_bucle
fin_si
acciones
fin_iterar
En general, la instrucción iterar no produce un programa legible y comprensible como lo hacen mientras y
repetir. La razón para esta ausencia de claridad es que la salida de un bucle ocurre en el medio del bucle, mientras
que normalmente la salida del bucle es al principio o al final del mismo. Le recomendamos no recurra a esta opción
—aunque la tenga su lenguaje— más que cuando no exista otra alternativa o disponga de la estructura iterar
(loop).
EJEMPLO 5.12
Una aplicación de un posible uso de la instrucción salir se puede dar cuando se incluyen mensajes de petición en
el algoritmo para la introducción sucesiva de informaciones.
176 Fundamentos de programación
Algoritmo 1 Algoritmo 2
leer(informacion) leer(informacion)
repetir mientras_no fin_de_lectura
procesar (informacion) procesar (informacion)
leer(informacion) leer(informacion)
hasta_que fin_de_lectura fin_mientras
En los algoritmos anteriores cada entrada (lectura) de información va acompañada de su correspondiente proceso,
pero la primera lectura está fuera del bucle. Se pueden incluir en el interior del bucle todas las lecturas de información
si se posee una estructura salir (exit). Un ejemplo de ello es la estructura siguiente:
iterar
leer(informacion)
si fin_de_lectura entonces
salir_bucle
fin_si
procesar (informacion)
fin_iterar
5.8. SENTENCIAS DE SALTO interrumpir (break) y continuar (continue)
Las secciones siguientes examinan las sentencias de salto (jump) que se utilizan para influir en el flujo de ejecución
durante la ejecución de una sentencia de bucle.
5.8.1. Sentencia interrumpir (break)
En ocasiones, los programadores desean terminar un bucle en un lugar determinado del cuerpo del bucle en vez de
esperar que el bucle termine de modo natural por su entrada o por su salida. Un método de conseguir esta acción
—siempre utilizada con precaución y con un control completo del bucle— es mediante la sentencia interrumpir
(break) que se suele utilizar en la sentencia según_sea (switch).
La sentencia interrumpir se puede utilizar para terminar una sentencia de iteración y cuando se ejecuta produ-
ce que el flujo de control salte fuera a la siguiente sentencia inmediatamente a continuación de la sentencia de itera-
ción. La sentencia interrumpir se puede colocar en el interior del cuerpo del bucle para implementar este efecto.
Sintaxis
interrumpir
sentencia_interrumpir::= interrumpir
EJEMPLO 5.13
hacer
escribir ('Introduzca un número de identificiación')
leer (numId)
si (numId  1000 o numId  1999)entonces
escribir ('Número no válido ')
escribir ('Por favor, introduzca otro número')
si-no
interrumpir
fin_si
mientras (expresión cuyo valor sea siempre verdadero)
Flujo de control II: Estructuras repetitivas 177
EJEMPLO 5.14
var entero: t
desde t ← 0 hasta t  100 incremento 1 hacer
escribir (t)
si (t = 1d) entonces
interrumpir
fin_si
fin_desde
Regla
La sentencia interrumpir (break) se utiliza frecuentemente junto con una sentencia si (if) actuando como
una condición interna del bucle.
5.8.2. Sentencia continuar (continue)
La sentencia continuar (continue) hace que el flujo de ejecución salte el resto de un cuerpo del bucle para con-
tinuar con el siguiente bucle o iteración. Esta característica suele ser útil en algunas circunstancias.
Sintaxis
continuar
Sentencia_continuar::= continuar
La sentencia continuar sólo se puede utilizar dentro de una iteración de un bucle. La sentencia continuar no
interfiere con el número de veces que se repite el cuerpo del bucle como sucede con interrumpir, sino que simple-
mente influye en el flujo de control en cualquier iteración específica.
EJEMPLO 5.15
i = 0
desde i = 0 hasta 20 inc 1 hacer
si (i mod 4 = 0) entonces
continuar
fin_si
escribir (i, ', ')
fin_desde
Al ejecutar el bucle anterior se producen estos resultados
1, 2, 3, 5, 6, 7, 9, 10, 11, 13, 14, 15, 17, 18, 19
Un análisis del algoritmo nos proporciona la razón de los resultados anteriores:
1. La variable i se declara igual a cero, como valor inicial.
2. El bucle i se incrementa en cada iteración en 1 hasta llegar a 21, momento en que se termina la ejecución
del bucle.
3. Siempre que i es múltiplo de 4 (i mod 4) se ejecuta la sentencia continuar y salta el flujo del programa
sobre el resto del cuerpo del bucle, se termina la iteración en curso y comienza una nueva iteración (en ese
178 Fundamentos de programación
caso no se escribe el valor de i). En consecuencia, no se visualiza el valor de i correspondiente (múltiplo
de 4).
4. Como resultado final, se visualizan todos los números comprendidos entre 0 y 20, excepto los múltiplos de 4;
es decir, 4, 8, 12, 16 y 20.
5.9. COMPARACIÓN DE BUCLES while, for Y do-while: UNA APLICACIÓN EN C++
C++ proporciona tres sentencias para el control de bucles: while, for y do-while. El bucle while se repite mientras
su condición de repetición del bucle es verdadera; el bucle for se utiliza normalmente cuando el conteo esté impli-
cado, o bien el control del bucle for, en donde el número de iteraciones requeridas se puede determinar al principio
de la ejecución del bucle, o simplemente cuando existe una necesidad de seguir el número de veces que un suceso
particular tiene lugar. El bucle do-while se ejecuta de un modo similar a while excepto que las sentencias del
cuerpo del bucle se ejecutan siempre al menos una vez.
La Tabla 5.1 describe cuándo se usa cada uno de los tres bucles. En C++, el bucle for es el más frecuentemente
utilizado de los tres. Es relativamente fácil reescribir un bucle do-while como un bucle while, insertando una asig-
nación inicial de la variable condicional. Sin embargo, no todos los bucles while se pueden expresar de modo ade-
cuado como bucles do-while, ya que un bucle do-while se ejecutará siempre al menos una vez y el bucle while
puede no ejecutarse. Por esta razón, un bucle while suele preferirse a un bucle do-while, a menos que esté claro
que se debe ejecutar una iteración como mínimo.
Tabla 5.1. Formatos de los bucles en C++
while El uso más frecuente es cuando la repetición no está controlada por contador; el test de condición precede
a cada repetición del bucle; el cuerpo del bucle puede no ser ejecutado. Se debe utilizar cuando se desea
saltar el bucle si la condición es falsa.
for Bucle de conteo cuando el número de repeticiones se conoce por anticipado y puede ser controlado por un
contador; también es adecuado para bucles que implican control no contable del bucle con simples etapas de
inicialización y de actualización; el test de la condición precede a la ejecución del cuerpo del bucle.
do-while Es adecuada cuando se debe asegurar que al menos se ejecuta el bucle una vez.
Comparación de tres bucles
cuenta = valor_inicial;
while (cuenta  valor_parada)
{
...
cuenta++;
} // fin de while
for(cuenta=valor_inicial; cuentavalor_parada; cuenta++)
{
...
} // fin de for
cuenta = valor_inicial;
if (valor_inicial  valor_parada)
do
{
...
cuenta++;
} while (cuenta  valor_parada);
Flujo de control II: Estructuras repetitivas 179
5.10. DISEÑO DE BUCLES (LAZOS)
El diseño de un bucle requiere tres partes:
1. El cuerpo del bucle.
2. Las sentencias de inicialización.
3. Las condiciones para la terminación del bucle.
5.10.1. Bucles para diseño de sumas y productos
Muchas tareas frecuentes implican la lectura de una lista de números y calculan su suma. Si se conoce cuántos nú-
meros habrá, tal tarea se puede ejecutar fácilmente por el siguiente pseudocódigo. El valor de la variable total es
el número de números que se suman. La suma se acumula en la variable suma.
suma ← 0;
repetir lo siguiente total veces:
cin  siguiente;
suma ← suma + siguiente;
fin_bucle
Este código se implementa fácilmente con un bucle for en C++.
int suma = 0;
for (int cuenta = 1; cuenta = total; cuenta++)
{
cin  siguiente;
suma = suma + siguiente;
}
Obsérvese que la variable suma se espera tome un valor cuando se ejecuta la siguiente sentencia
suma = suma + siguiente;
Dado que suma debe tener un valor la primera vez que la sentencia se ejecuta, suma debe estar inicializada a
algún valor antes de que se ejecute el bucle. Con el objeto de determinar el valor correcto de inicialización de suma
se debe pensar sobre qué sucede después de una iteración del bucle. Después de añadir el primer número, el valor
de suma debe ser ese número. Esto es, la primera vez que se ejecute el bucle, el valor de suma + siguiente sea
igual a siguiente. Para hacer esta operación true (verdadero), el valor de suma debe ser inicializado a 0.
Si en lugar de suma, se desea realizar productos de una lista de números, la técnica a utilizar es:
int producto = 1;
for (int cuenta = 1; cuenta = total; cuenta++)
{
cin  siguiente;
producto = producto * siguiente;
}
La variable producto debe tener un valor inicial. No se debe suponer que todas las variables se deben inicializar
a cero. Si producto se inicializara a cero, seguiría siendo cero después de que el bucle anterior se terminara.
5.10.2. Fin de un bucle
Existen cuatro métodos utilizados normalmente para terminar un bucle de entrada. Estos cuatro métodos son2
:
2
Estos métodos son descritos en Savitch, Walter, Problem Solving with C++, The Object of Programming, 2.ª edición, Reading, Massa-
chussetts, Addison-Wesley, 1999.
180 Fundamentos de programación
1. Lista encabezada por tamaño.
2. Preguntar antes de la iteración.
3. Lista terminada con un valor centinela.
4. Agotamiento de la entrada.
Lista encabezada por el tamaño
Si su programa puede determinar el tamaño de una lista de entrada por anticipado, bien preguntando al usuario o por
algún otro método, se puede utilizar un bucle “repetir n veces” para leer la entrada exactamente n veces, en
donde n es el tamaño de la lista.
Preguntar antes de la iteración
El segundo método para la terminación de un bucle de entrada es preguntar, simplemente, al usuario, después de cada
iteración del bucle, si el bucle debe ser o no iterado de nuevo. Por ejemplo:
suma = 0;
cout  ¿Existen números en la lista?:n
 teclee S para Sí, N para No y Final, Intro):;
char resp;
cin  resp;
while ((resp == 'S')|| (resp == 's'))
{
cout  Introduzca un número: ;
cin  número;
suma = suma + numero;
cout  ¿Existen más números?:n;
 S para Sí, N para No. Final con Intro:;
cin  resp;
}
Este método es muy tedioso para listas grandes de números. Cuando se lea una lista larga es preferible incluir
una única señal de parada, como se incluye en el método siguiente.
Valor centinela
El método más práctico y eficiente para terminar un bucle que lee una lista de valores del teclado es mediante un
valor centinela. Un valor centinela es aquél que es totalmente distinto de todos los valores posibles de la lista que
se está leyendo y de este modo sirve para indicar el final de la lista. Un ejemplo típico se presenta cuando se lee una
lista de números positivos; un número negativo se puede utilizar como un valor centinela para indicar el final de la
lista.
// ejemplo de valor centinela (número negativo)
...
cout  Introduzca una lista de enteros positivos  endl;
 Termine la lista con un número negativo  endl;
suma = 0;
cin  numero;
while (numero = 0)
{
suma = suma + numero;
cin  numero;
}
cout  La suma es:   suma;
Flujo de control II: Estructuras repetitivas 181
Si al ejecutar el segmento de programa anterior se introduce la lista
4 8 15 -99
el valor de la suma será 27. Es decir, -99, último número de la entrada de datos no se añade a suma. –99 es el
último dato de la lista que actúa como centinela y no forma parte de la lista de entrada de números.
Agotamiento de la entrada
Cuando se leen entradas de un archivo, se puede utilizar un valor centinela. Aunque el método más frecuente es
comprobar simplemente si todas las entradas del archivo se han leído y se alcanza el final del bucle cuando no hay
más entradas a leer. Éste es el método usual en la lectura de archivos, que suele utilizar una marca al final de archi-
vo, eof. En el capítulo de archivos se dedicará una atención especial a la lectura de archivos con una marca de final
de archivo.
5.11. ESTRUCTURAS REPETITIVAS ANIDADAS
De igual forma que se pueden anidar o encajar estructuras de selección, es posible insertar un bucle dentro de otro.
Las reglas para construir estructuras repetitivas anidadas son iguales en ambos casos: la estructura interna debe estar
incluida totalmente dentro de la externa y no puede existir solapamiento. La representación gráfica se indica en la
Figura 5.6.
a) b) c) d)
Figura 5.6. Bucles anidados: a) y b), correctos; c) y d), incorrectos.
Las variables índices o de control de los bucles toman valores de modo tal que por cada valor de la variable ín-
dice del ciclo externo se debe ejecutar totalmente el bucle interno. Es posible anidar cualquier tipo de estructura re-
petitiva con tal que cumpla las condiciones de la Figura 5.5.
EJEMPLO 5.16
Se conoce la población de cada una de las veinticinco ciudades más grandes de las ocho provincias de Andalucía y
se desea identificar y visualizar la población de la ciudad más grande de cada provincia.
El problema consistirá, en primer lugar, en la obtención de la población mayor de cada provincia y realizar esta
operación ocho veces, una para cada provincia.
182 Fundamentos de programación
1. Encontrar y visualizar la ciudad mayor de una provincia.
2. Repetir el paso 1 para cada una de las ocho provincias andaluzas.
El procedimiento para deducir la ciudad más grande de entre las veinticinco de una provincia se consigue crean-
do una variable auxiliar MAYOR —inicialmente de valor 0— que se va comparando sucesivamente con los veinticin-
co valores de cada ciudad, de modo tal que, según el resultado de comparación, se intercambian valores de la ciudad
por el de la variable MAYOR. El algoritmo correspondiente sería:
algoritmo CIUDADMAYOR
var
entero : i //contador de provincias
entero : j //contador de ciudades
entero : MAYOR //ciudad de mayor población
entero : CIUDAD //población de la ciudad
inicio
i ← 1
mientras i = 8 hacer
MAYOR ← 0
j ← 1
mientras j = 25 hacer
leer(CIUDAD)
si CIUDAD  MAYOR entonces
MAYOR ← CIUDAD
fin_si
j ← j + 1
fin_mientras
escribir('La ciudad mayor es', MAYOR)
i ← i + 1
fin_mientras
fin
EJEMPLO 5.17
Calcular el factorial de n números leídos del terminal.
El problema consistirá en realizar una estructura repetitiva de n iteraciones del algoritmo del problema ya cono-
cido del cálculo del factorial de un entero.
algoritmo factorial2
var
entero : i, NUMERO, n
real : FACTORIAL
inicio
{lectura de la cantidad de números}
leer(n)
desde i ← 1 hasta n hacer
leer(NUMERO)
FACTORIAL ← 1
desde j ← 1 hasta NUMERO hacer
FACTORIAL ← FACTORIAL * j
fin_desde
escribir('El factorial del numero', NUMERO, 'es', FACTORIAL)
fin_desde
fin
Flujo de control II: Estructuras repetitivas 183
EJEMPLO 5.18
Imprimir todos los número primos entre 2 y 100 inclusive.
algoritmo Primos
var entero : i, divisor
logico : primo
inicio
desde i ← hasta 100 hacer
primo ← verdad
divisor ← 2
mientras (divisor = raiz2(i)) y primo hacer
si i mod divisor = 0 entonces
primo ← falso
si_no
divisor ← divisor + 1
fin_si
fin_mientras
si primo entonces
escribir(i,' ')
fin_si
fin_desde
fin
5.11.1. Bucles (lazos) anidados: una aplicación en C++
Es posible anidar bucles. Los bucles anidados constan de un bucle externo con uno o más bucles internos. Cada vez
que se repite el bucle externo, los bucles internos se repiten, se reevalúan los componentes de control y se ejecutan
todas las iteraciones requeridas.
EJEMPLO 5.19
El segmento de programa siguiente visualiza una tabla de multiplicación por cálculo y visualización de productos
de la forma x * y para cada x en el rango de 1 a Xultimo y desde cada y en el rango 1 a Yultimo (donde
Xultimo, e Yultimo son enteros prefijados). La tabla que se desea obtener es
1 * 1 = 1
1 * 2 = 2
1 * 3 = 3
1 * 4 = 4
1 * 5 = 5
2 * 1 = 2
2 * 2 = 4
2 * 3 = 6
2 * 4 = 8
2 * 5 = 10
...
El bucle que tiene x como variable de control se denomina bucle externo y el bucle que tiene y como variable de
control se denomina bucle interno.
for (int x = 1; x = Xultimo; x++)
for (int y = 1; y = Yultimo; y++)
{
producto = x * y;
cout  setw(2)  x   * 
 setw(2)  y   = 
 setw(3)  producto  endl;
}
bucle externo bucle interno
184 Fundamentos de programación
EJEMPLO 5.20
// Aplicación de bucles anidados
#include iostream
#include iomanip.h // necesario para cin y cout
using namespace std; // necesario para setw
void main()
{
// cabecera de impresión
cout  setw(12)   i   setw(6)   j   endl;
for (int i = 0; i  4; i++)
{
cout  Externo   setw(7)  i  endl;
for (int j = 0; j  i; j++)
cout  Interno   setw(10)  j  endl;
} // fin del bucle externo
}
La salida del programa es
i j
Externo 0
Externo 1
Interno 0
Externo 2
Interno 0
Interno 1
Externo 3
Interno 0
Interno 1
Interno 2
EJERCICIO 5.1
Escribir un programa que visualice un triángulo isósceles.
*
* * *
* * * * *
* * * * * * *
* * * * * * * * *
El triángulo isósceles se realiza mediante un bucle externo y dos bucles internos. Cada vez que se repite el bucle
externo se ejecutan los dos bucles internos. El bucle externo se repite cinco veces (cinco filas); el número de repeticiones
realizadas por los bucles internos se basan en el valor de la variable fila. El primer bucle interno visualiza los espacios
en blanco no significativos; el segundo bucle interno visualiza uno o más asteriscos.
// archivo triángulo.cpp
#include iostream
using namespace std;
Flujo de control II: Estructuras repetitivas 185
void main()
{
// datos locales...
const int num_lineas = 5;
const char blanco = '';
const char asterisco = '*';
// comienzo de una nueva línea
cout  endl;
// dibujar cada línea: bucle externo
for (int fila = 1; fila = num_lineas; fila++)
{
// imprimir espacios en blanco: primer bucle interno
for (int blancos = num_lineas –fila; blancos  0;
blancos--)
cout  blanco;
for (int cuenta_as = 1; cuenta_as  2 * fila;
cuenta_as ++)
cout  asterisco;
// terminar línea
cout  endl;
} // fin del bucle externo
}
El bucle externo se repite cinco veces, uno por línea o fila; el número de repeticiones ejecutadas por los bucles
internos se basa en el valor de fila. La primera fila consta de un asterisco y cuatro blancos, la fila 2 consta de tres
blancos y tres asteriscos, y así sucesivamente; la fila 5 tendrá 9 asteriscos (2 × 5 – 1).
EJERCICIO 5.2
Ejecutar y visualizar el programa siguiente que imprime una tabla de m filas por n columnas y un carácter
prefijado.
1: //Listado
2: //ilustra bucles for anidados
3:
4: int main()
5: {
6: int filas, columnas;
7: char elCar;
8: cout  ¿Cuántas filas?;
9: cin  filas;
10: cout  ¿Cuántas columnas?;
11: cin  columnas;
12: cout  ¿Qué carácter?;
13: cin  elCar;
14: for (int i = 0; i  filas; i++)
15: {
16: for (int j = 0; j  columnas; j++)
17: cout  elCar;
18: cout  n;
19: }
20: return 0;
21: }
186 Fundamentos de programación
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
5.1. Calcular el factorial de un número N utilizando la estructura desde.
Solución
Recordemos que factorial de N responde a la fórmula
N! = N · (N – 1) · (N – 2) · (N – 3) · ... · 3 · 2 · 1
El algoritmo desde supone conocer el número de iteraciones:
var
entero : I, N
real : FACTORIAL
inicio
leer(N)
FACTORIAL ← 1
desde I ← 1 hasta N hacer
FACTORIAL ← FACTORIAL * I
fin_desde
escribir('El factorial de', N, 'es', FACTORIAL)
fin
5.2. Imprimir las treinta primeras potencias de 4, es decir, 4 elevado a 1, 4 elevado a 2, etc.
Solución
algoritmo potencias4
var
entero : n
inicio
desde n ← 1 hasta 30 hacer
escribir(4 ^ n)
fin_desde
fin
5.3. Calcular la suma de los n primeros números enteros utilizando la estructura desde.
Solución
S = 1 + 2 + 3 + ... + n
El pseudocódigo correspondiente es
algoritmo sumaNenteros
var
entero : i, n
real : suma
inicio
leer(n)
suma ← 0
desde i ← 1 hasta n hacer
suma ← suma + 1
fin_desde
{escribir el resultado de suma}
escribir(suma)
fin
Flujo de control II: Estructuras repetitivas 187
5.4. Diseñar el algoritmo para imprimir la suma de los números impares menores o iguales que n.
Solución
Los números impares son 1, 3, 5, 7, ..., n. El pseudocódigo es
algoritmo sumaimparesmenores
var
entero : i, n
real : S
inicio
S ← 0
leer(n)
desde i ← 1 hasta n inc 2 hacer
S ← S + i
fin_desde
escribir(S)
fin
5.5. Dados dos números enteros, realizar el algoritmo que calcule su cociente y su resto.
Solución
Sean los números M y N. El método para obtener el cociente y el resto es por restas sucesivas; el método sería restar suce-
sivamente el divisor del dividendo hasta obtener un resultado menor que el divisor, que será el resto de la división; el nú-
mero de restas efectuadas será el cociente
50 |13 50 – 13 = 37 C = 1
11 3 37 – 13 = 24 C = 2
24 – 13 = 11 C = 3
Como 11 es menor que el divisor 13, se terminarán las restas sucesivas y entonces 11 será el resto y 3 (número de restas)
el cociente. Por consiguiente, el algoritmo será el siguiente:
algoritmo cociente
var
entero : M, N, Q, R
inicio
leer(M, N) {M, dividendo / N, divisor}
R ← M
Q ← 0
repetir
R ← R - N
Q ← Q + 1
hasta_que R  N
escribir('dividendo',M, 'divisor',N, 'cociente',Q, 'resto',R)
fin
5.6. Realizar el algoritmo para obtener la suma de los números pares hasta 1.000 inclusive.
Solución
Método 1
S = 2 + 4 + 6 + 8 + ... + 1.000
algoritmo sumapares
var
real : NUMERO, SUMA
188 Fundamentos de programación
inicio
SUMA ← 2
NUMERO ← 4
mientras NUMERO = 1.000 hacer
SUMA ← SUMA + NUMERO
NUMERO ← NUMERO + 2
fin_mientras
fin
Método 2
{idéntica cabecera y declaraciones}
inicio
SUMA ← 2
NUMERO ← 4
repetir
SUMA ← SUMA + NUMERO
NUMERO ← NUMERO + 2
hasta_que NUMERO  1000
fin
5.7. Buscar y escribir la primera vocal leída del teclado. (Se supone que se leen, uno a uno, caracteres desde el te-
clado.)
Solución
algoritmo buscar_vocal
var
carácter: p
inicio
repetir
leer(p)
hasta_que p = 'a' o p = 'e' o p = 'i' o p = 'o' o p = 'u'
escribir('Primero', p)
fin
5.8. Se desea leer de una consola a una serie de números hasta obtener un número inferior a 100.
Solución
algoritmo menor_100
var
real : numero
inicio
repetir
escribir('Teclear un numero')
leer(numero)
hasta_que numero  100
escribir('El numero es', numero)
fin
5.9. Escribir un algoritmo que permita escribir en una pantalla la frase ‘¿Desea continuar? S/N’ hasta que la respuesta
sea 'S' o 'N'.
Solución
algoritmo SN
var
carácter : respuesta
Flujo de control II: Estructuras repetitivas 189
inicio
repetir
escribir('Desea continuar S/N')
leer(respuesta)
hasta_que(respuesta = 'S') o (respuesta = 'N')
fin
5.10. Leer sucesivamente números del teclado hasta que aparezca un número comprendido entre 1 y 5.
Solución
algoritmo numero1_5
var
entero : numero
inicio
repetir
escribir('Numero comprendido entre 1 y 5')
leer(numero)
hasta_que(numero = 1) y (numero = 5)
escribir('Numero encontrado', numero)
fin
5.11. Calcular el factorial de un número n con métodos diferentes al Ejercicio 5.1.
Solución
n! = n × (n – 1) × (n – 2) × ... × 3 × 2 × 1
es decir,
5! = 5 × 4 × 3 × 2 × 1 = 120
4! = 4 × 3 × 2 × 1 = 24
3! = 3 × 2 × 1 = 6
2! = 2 × 1 = 2
1! = 1 = 1
Para codificar estas operaciones basta pensar que
(n + 1)! = (n + 1) × n × (n – 1) × (n – 2) × ... × 3 × 2 × 1
{
n!
(n + 1)! = (n + 1) × n!
Por consiguiente, para calcular el factorial FACTORIAL de un número, necesitaremos un contador i que cuente de uno en
uno y aplicar la fórmula
FACTORIAL = FACTORIAL * i
inicializando los valores de FACTORIAL e i a 1 y realizando un bucle en el que i se incremente en 1 a cada iteración, es
decir,
Algoritmo 1 de Factorial de n
FACTORIAL ← 1
i ← 1
repetir
FACTORIAL ← FACTORIAL * i
i ← i + 1
hasta_que i = n + 1
190 Fundamentos de programación
Algoritmo 2 de Factorial de n
FACTORIAL ← 1
i ← 1
repetir
FACTORIAL ← FACTORIAL * (i + 1)
i ← i + 1
hasta_que i = n
Algoritmo 3 de Factorial de n
FACTORIAL ← 1
i ← 1
repetir
FACTORIAL ← FACTORIAL * (i + 1)
i ← i + 1
hasta_que i  n - 1
Algoritmo 4 de factorial de n
FACTORIAL ← 1
i ← 1
desde i ← 1 hasta n - 1 hacer
FACTORIAL ← FACTORIAL * (i + 1)
fin_desde
Un algoritmo completo con lectura del número n por teclado podría ser el siguiente:
algoritmo factorial
var
entero : i, n
real : f
inicio
f ← 1
i ← 1
leer(n)
repetir
f ← f * i
i ← i + 1
hasta_que i = n + 1
escribir('Factorial de', n, 'es', f)
fin
5.12. Calcular el valor máximo de una serie de 100 números.
Solución
Para resolver este problema necesitaremos un contador que cuente de 1 a 100 para contabilizar los sucesivos números. El
algoritmo que calcula el valor máximo será repetido y partiremos considerando que el primer número leído es el valor
máximo, por lo cual se realizará una primera asignación del número 1 a la variable máximo.
La siguiente acción del algoritmo será realizar comparaciones sucesivas:
• leer un nuevo número
• compararlo con el valor máximo
• si es inferior, implica que el valor máximo es el antiguo;
• si es superior, implica que el valor máximo es el recientemente leído, por lo que éste se convertirá en máximo me-
diante una asignación;
• repetir las acciones anteriores hasta que n = 100.
Flujo de control II: Estructuras repetitivas 191
algoritmo maximo
var
entero : n, numero, maximo
inicio
leer(numero)
n ← 1
maximo ← numero
repetir
n ← n+1
leer(numero)
si numero  maximo entonces
maximo ← numero
fin_si
hasta_que n = 100
escribir('Numero mayor o maximo', maximo)
fin
Otras soluciones
1. algoritmo otromaximo
var
entero : n, numero, maximo
inicio
leer(numero)
maximo ← numero
n ← 2
repetir
n ← n + 1
leer(numero)
si numero  maximo entonces
maximo ← numero
fin_si
hasta_que n  100
escribir('Numero mayor o maximo', maximo)
fin
2. algoritmo otromaximo
var
entero : n, numero, maximo
inicio
leer(numero)
maximo ← numero
para n = 2 hasta 100 hacer //pseudocódigo sustituto de desde
leer(numero)
si numero  maximo entonces
maximo ← numero
fin_si
fin_para
escribir('Maximo,', maximo)
fin
NOTA: Los programas anteriores suponen que los números pueden ser positivos o negativos; si se desea comparar sólo
números positivos, los programas correspondientes serían:
1. algoritmo otromaximo
var
entero : n, numero, maximo
inicio
n ← 0
maximo ← 0
192 Fundamentos de programación
repetir
leer(numero)
n = n + 1
si numero  maximo entonces
maximo ← numero
fin_si
hasta_que n = 100
escribir('Maximo numero', maximo)
fin
2. algoritmo otromaximo
var
entero : n, numero, maximo
inicio
n ← 0
maximo ← 0
para N ← 1 hasta 100 hacer
leer(numero)
si numero  maximo entonces
maximo ← numero
fin_si
fin_para
escribir('Maximo numero =', maximo)
fin
5.13. Bucles anidados. Las estructuras de control tipo bucles pueden anidarse internamente, es decir, se puede situar un
bucle en el interior de otro bucle.
Solución
La anidación puede ser:
• bucles repetir dentro de bucles repetir,
• bucles para (desde) dentro de bucles repetir,
• etc.
Ejemplo 1. Bucle para en el interior de un bucle repetir-hasta_que
repetir
leer(n)
para i ← 1 hasta hacer 5
escribir(n * n)
fin_para
hasta_que n = 0
escribir('Fin')
Si ejecutamos estas instrucciones, se obtendrá para:
n = 5 resultados 25
25
25
25
25
n = 2 resultados 4
4
4
4
4
Flujo de control II: Estructuras repetitivas 193
n = 0 resultados 0
0
0
0
0
fin
Ejemplo 2. Bucles anidados para (desde)
para i ← 1 hasta 3 hacer
para j ← 1 hasta 10 hacer
escribir(i, 'por', j, '=', i*j)
fin_para
fin_para
Los valores sucesivos de i, j, i*j, serán
i = 1 j = 1 i * j = 1 x 1 = 1
j = 2 i * j = 1 x 2 = 2
j = 3 i * j = 1 x 3 = 3
j = 4 i * j = 1 x 4 = 4
..................................
j = 10 i * j = 1 x 10 = 10
i = 2 j = 1 i * j = 2 x 1 = 2
j = 2 i * j = 2 x 2 = 4
j = 3 i * j = 2 x 3 = 6
j = 4 i * j = 2 x 4 = 8
..................................
j = 10 i * j = 2 x 10 = 20
i = 3 j = 1 i * j = 3 x 1 = 3
j = 2 i * j = 3 x 2 = 6
j = 3 i * j = 3 x 3 = 9
j = 4 i * j = 3 x 4 = 12
..................................
j = 10 i * j = 3 x 10 = 30
Es decir, se obtendrá la tabla de multiplicar de 1, 2 y 3.
Ejemplo 3. La codificación completa para obtener la popular tabla de multiplicar de los escolares sería la siguiente:
algoritmo Tabla_de_multiplicar
var
entero : i, j, producto
inicio
para ← 1 hasta 9 hacer
escribir('Tabla del', i)
para j ← 1 hasta 10 hacer
producto ← i * j
escribir(i, 'por', j, '=', producto)
fin_para
fin_para
fin
5.14. Se dispone de una lista de N números. Se desea calcular el valor del número mayor.
Solución
algoritmo
var
entero : I
194 Fundamentos de programación
real : NUM, MAX
entero : N
inicio
leer(N)
leer(NUM)
MAX ← NUM
desde I ← 2 hasta 100 hacer
leer(NUM)
si NUM  MAX entonces
MAX ← NUM
fin_si
fin_desde
fin
5.15. Determinar simultáneamente los valores máximo y mínimo de una lista de 100 números.
Solución
algoritmo max_min
var
entero : I
real : MAX, MIN, NUMERO
inicio
leer(NUMERO)
MAX ← NUMERO
MIN ← NUMERO
desde I ← 2 hasta 100 hacer
leer(NUMERO)
si NUMERO  MAX entonces
MAX ← NUMERO
si_no
si NUMERO  MIN entonces
MIN ← NUMERO
fin_si
fin_si
fin_desde
escribir('Maximo', MAX, 'Minimo', MIN)
fin
5.16. Se dispone de un cierto número de valores de los cuales el último es el 999 y se desea determinar el valor máximo
de las medias correspondientes a parejas de valores sucesivos.
Solución
algoritmo media_parejas
var
entero : N1, N2
real : M, MAX
inicio
leer(N1, N2)
MAX ← (N1 + N2)/ 2
mientras (N2  999) o (N1  999) hacer
leer(N1, N2)
M ← (N1 + N2)/2
si M  MAX entonces
MAX ← M
fin_si
fin_mientras
escribir('Media maxima =' MAX)
fin
Flujo de control II: Estructuras repetitivas 195
5.17. Detección de entradas numéricas —enteros— erróneas.
Solución
Análisis
Este algoritmo es una aplicación sencilla de «interruptor». Se sitúa el valor inicial del interruptor (SW = 0) antes de re-
cibir la entrada de datos.
La detección de números no enteros se realizará con una estructura repetitiva mientras que se realizará si SW = 0.
La instrucción que detecta si un número leído desde el dispositivo de entradas es entero:
leer(N)
Realizará la comparación de N y parte entera de N:
• si son iguales, N es entero,
• si son diferentes, N no es entero.
Un método para calcular la parte entera es utilizar la función estándar ent (int) existente en muchos lenguajes de
programación.
Pseudocódigo
algoritmo error
var
entero : SW
real : N
inicio
SW ← 0
mientras SW = 0 hacer
leer(N)
si N  ent(N) entonces
escribir('Dato no valido')
escribir('Ejecute nuevamente')
SW ← 1
si_no
escribir('Correcto', N, 'es entero')
fin_si
fin_mientras
fin
5.18. Calcular el factorial de un número dado (otro nuevo método).
Solución
Análisis
El factorial de un número N (N!) es el conjunto de productos sucesivos siguientes:
N! = N * (N – 1) * (N – 2) * (N – 3) * ... * 3 * 2 * 1
Los factoriales de los primeros números son:
1! = 1
2! = 2 * 1 = 2 * 1!
3! = 3 * 2 * 1 = 3 * 2!
4! = 4 * 3 * 2 * 1 = 4 * 3!
.
.
.
N! = N * (N – 1) * (N – 2) * ... * 2 * 1 = N * (N – 1)!
196 Fundamentos de programación
Los cálculos anteriores significan que el factorial de un número se obtiene con el producto del número N por el factorial
de (N – 1)!
Como comienzan los productos en 1, un sistema de cálculo puede ser asignar a la variable factorial el valor 1. Se ne-
cesita otra variable I que tome los valores sucesivos de 1 a N para poder ir efectuando los productos sucesivos. Dado que
en los números negativos no se puede definir el factorial, se deberá incluir en el algoritmo una condición para verificación
de error, caso de que se introduzcan números negativos desde el terminal de entrada (N  0).
La solución del problema se realiza por dos métodos:
1. Con la estructura repetir (repeat).
2. Con la estructura desde (for).
Pseudocódigo
Método 1 (estructura repetir)
algoritmo FACTORIAL
var
entero : I, N
real : factorial
inicio
repetir
leer(N)
hasta_que N  0
factorial ← 1
I ← 1
repetir
factorial ← factorial * I
I ← I + 1
hasta_que I = N + 1
escribir(factorial)
fin
Método 2 (estructura desde)
algoritmo FACTORIAL
var
entero : K, N
real : factorial
inicio
leer(N)
si n  0 entonces
escribir('El numero sera positivo')
si_no
factorial ← 1
si N  1 entonces
desde K ← 2 hasta N hacer
factorial ← factorial * K
fin_desde
fin_si
escribir('Factorial de', N, '=', factorial)
fin_si
fin
Flujo de control II: Estructuras repetitivas 197
5.19. Se tienen las calificaciones de los alumnos de un curso de informática correspondiente a las asignaturas BASIC,
Pascal, FORTRAN. Diseñar un algoritmo que calcule la media de cada alumno.
Solución
Análisis
Asignaturas: C
Pascal
FORTRAN
Media: (C + Pascal + FORTRAN)
______________________________
3
Se desconoce el número de alumnos N de la clase; por consiguiente, se utilizará una marca final del archivo ALUMNOS. La
marca final es ‘***’ y se asignará a la variable nombre.
Pseudocódigo
algoritmo media
var
cadena : nombre
real : media
real : BASIC, Pascal, FORTRAN
inicio
{entrada datos de alumnos}
leer(nombre)
mientras nombre  '***' hacer
leer(BASIC, Pascal, FORTRAN)
media ← (BASIC + Pascal + FORTRAN) / 3
escribir(nombre, media)
leer(nombre)
fin_mientras
fin
CONCEPTOS CLAVE
• bucle.
• bucle anidado.
• bucle infinito.
• bucle sin fin.
• centinela.
• iteración.
• pasada.
• programación estructurada.
• sentencia continuar.
• sentencia ir_a.
• sentencia interrumpir.
• sentencia de repetición.
• sentencia desde.
• sentencia hacer-mientras.
• sentencia mientras.
• sentencia nula.
• sentencia repetir-hasta_
que.
Este capítulo examina los aspectos fundamentales de la ite-
ración y el modo de implementar esta herramienta de pro-
gramación esencial utilizando los cuatro tipos fundamentales
de sentencias de iteración: mientras, hacer-mien-
tras, repetir-hasta_que y desde (para).
1. Una sección de código repetitivo se conoce como
bucle. El bucle se controla por una sentencia de
repetición que comprueba una condición para de-
terminar si el código se ejecutará. Cada pasada a
través del bucle se conoce como una iteración o
repetición. Si la condición se evalúa como falsa en
la primera iteración, el bucle se termina y se habrán
ejecutado las sentencias del cuerpo del bucle una
sola vez. Si la condición se evalúa como verdadera
la primera vez que se ejecuta el bucle, será necesa-
RESUMEN
198 Fundamentos de programación
rio que se modifiquen alguna/s sentencias del inte-
rior del bucle para que se altere la condición co-
rrespondiente.
2. Existen cuatro tipos básicos de bucles: mientras,
hacer-mientras, repetir-hasta_que y des-
de. Los bucles mientras y desde son bucles contro-
lados por la entrada o pretest. En este tipo de bu-
cles, la condición comprobada se evalúa al principio
del bucle, que requiere que la condición sea com-
probada explícitamente antes de la entrada al bucle.
Si la condición es verdadera, las repeticiones del
bucle comienzan; en caso contrario, no se introdu-
ce al bucle. Las iteraciones continúan mientras que
la condición permanece verdadera. En la mayoría
de los lenguajes, estas sentencias se construyen uti-
lizando, respectivamente, las sentencias while y
for. Los bucles hacer-mientras y repetir-
hasta_que son bucles controlados por salida o
posttest, en los que la condición a evaluar se com-
prueba al final del bucle. El cuerpo del bucle se
ejecuta siempre al menos una vez. El bucle hacer-
mientras se ejecuta siempre que la condición sea
verdadera y se termina cuando la condición se hace
falsa; por el contrario, el bucle repetir-hasta_que se
realiza siempre que la condición es falsa y se ter-
mina cuando la condición se hace verdadera.
3. Los bucles también se clasifican en función de la
condición probada. En un bucle de conteo fijo, la
condición sirve para fijar cuantas iteraciones se rea-
lizarán. En un bucle con condición variable (mien-
tras, hacer-mientras y repetir-hasta_
que), la condición comprobada está basada en que
una variable puede cambiar interactivamente con
cada iteración a través del bucle.
4. Un bucle mientras es un bucle con condición de
entrada, de modo que puede darse el caso de que
su cuerpo de sentencias no se ejecute nunca si la
condición es falsa en el momento de entrar al bucle.
Por el contrario, los bucles hacer-mientras y repe-
tir-hasta_que son bucles de salida y, por consi-
guiente, las sentencias del cuerpo del bucle al me-
nos se ejecutarán una vez.
5. La sintaxis de la sentencia mientras es:
mientras cuenta = 1
sentencias mientras (cuenta = 10) hacer
cuenta = cuenta + 1
fin_mientras fin_mientras
6. La sentencia desde (for) realiza las mismas fun-
ciones que la sentencia mientras pero utiliza un
formato diferente. En muchas situaciones, especial-
mente aquellas que utilizan una condición de con-
teo fijo, la sentencia desde es más fácil de utilizar
que la sentencia mientras equivalente.
desde v ← vi hasta of [inc/dec] hacer
sentencias
fin_desde
7. La sentencia hacer_mientras se utiliza para
crear bucles posttest, ya que comprueba su expre-
sión al final del bucle. Esta característica asegura
que el cuerpo de un bucle hacer se ejecuta al menos
una vez. Dentro de un bucle hacer debe haber al
menos una sentencia que modifique el valor de la
expresión comprobada.
8. La programación estructurada utiliza las sentencias
explicadas en este capítulo. Esta programación se
centra en el modo de escribir las partes detalladas
de programas de una computadora como módulos
independientes. Su filosofía básica es muy simple:
«Utilice sólo construcciones que tengan un punto
de entrada y un punto de salida». Esta regla básica
se puede romper fácilmente si se utiliza la sentencia
de salto ir_a, por lo que no es recomendable su
uso, excepto en situaciones excepcionales.
EJERCICIOS
5.1. Determinar la media de una lista indefinida de núme-
ros positivos, terminados con un número negativo.
5.2. Dado el nombre de un mes y si el año es o no bisies-
to, deducir el número de días del mes.
5.3. Sumar los números enteros de 1 a 100 mediante: a)
estructura repetir; b) estructura mientras; c) es-
tructura desde.
5.4. Determinar la media de una lista de números positivos
terminada con un número no positivo después del úl-
timo número válido.
5.5. Imprimir todos los números primos entre 2 y 1.000
inclusive.
5.6. Se desea leer las calificaciones de una clase de infor-
mática y contar el número total de aprobados (5 o
mayor que 5).
Flujo de control II: Estructuras repetitivas 199
5.7. Leer las notas de una clase de informática y deducir
todas aquellas que son NOTABLES (= 7 y  9).
5.8. Leer 100 números. Determinar la media de los nú-
meros positivos y la media de los números negati-
vos.
5.9. Un comercio dispone de dos tipos de artículos en
fichas correspondientes a diversas sucursales con los
siguientes campos:
• código del artículo A o B,
• precio unitario del artículo,
• número de artículos.
La última ficha del archivo de artículos tiene un
código de artículo, una letra X. Se pide:
• el número de artículos existentes de cada catego-
ría,
• el importe total de los artículos de cada catego-
ría.
5.10. Una estación climática proporciona un par de tem-
peraturas diarias (máxima, mínima) (no es posible
que alguna o ambas temperaturas sea 9 grados). La
pareja fin de temperaturas es 0,0. Se pide determinar
el número de días, cuyas temperaturas se han pro-
porcionado, las medias máxima y mínima, el núme-
ro de errores —temperaturas de 9°— y el porcenta-
je que representaban.
5.11. Calcular:
E(x) = 1 + x =
x2
2!
+ ... +
nn
n!
a) Para N que es un entero leído por teclado.
b) Hasta que N sea tal que xn
/n  E (por ejemplo,
E = 10–4
).
5.12. Calcular el enésimo término de la serie de Fibonac-
ci definida por:
A1 = 1 A2 = 2 A3 = 1 + 2 = A1 + A2
An = An – 1 + An – 2 (n = 3)
5.13. Se pretende leer todos los empleados de una empre-
sa —situados en un archivo EMPRESA— y a la ter-
minación de la lectura del archivo se debe visualizar
un mensaje «existen trabajadores mayores de 65
años en un número de ...» y el número de trabajado-
res mayores de 65 años.
5.14. Un capital C está situado a un tipo de interés R. ¿Al
término de cuántos años se doblará?
5.15. Se desea conocer una serie de datos de una empresa
con 50 empleados: a) ¿Cuántos empleados ganan
más de 300.000 pesetas al mes (salarios altos); b)
entre 100.000 y 300.000 pesetas (salarios medios);
y c) menos de 100.000 pesetas (salarios bajos y em-
pleados a tiempo parcial)?
5.16. Imprimir una tabla de multiplicar como
1 2 3 4 ... 15
** ** ** ** ** ... **
1* 1 2 3 4 ... 15
2* 2 4 6 8 ... 30
3* 3 6 9 12 ... 45
4* 4 8 12 16 ... 60
.
.
.
15* 15 30 45 60 ... 225
5.17. Dado un entero positivo n ( 1), comprobar si es
primo o compuesto.
REFERENCIAS BIBLIOGRÁFICAS
DIJKSTRA, E. W.: «Goto Statement Considered Harmful», Communications of the ACM, vol. 11, núm. 3, marzo 1968,
147-148, 538, 541.
KNUTH, D. E.: «Structured Programming with goto Statements», Computing Surveys, vol. 6, núm. 4, diciembre 1974,
261.
Fundamentos_de_programacion_Algoritmos_e.pdf
CAPÍTULO 6
Subprogramas (subalgoritmos):
Funciones
6.1. Introducción a los subalgoritmos o subpro-
gramas
6.2. Funciones
6.3. Procedimientos (subrutinas)
6.4. Ámbito: variables locales y globales
6.5. Comunicación con subprogramas: paso de
parámetros
6.6. Funciones y procedimientos como paráme-
tros
6.7. Los efectos laterales
6.8. Recursión (recursividad)
6.9. Funciones en C/C++ , Java y C#
6.10. Ámbito (alcance) y almacenamiento en
C/C++ y Java
6.11. Sobrecarga de funciones en C++ y Java
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
CONCEPTOS CLAVE
RESUMEN
EJERCICIOS
La resolución de problemas complejos se facilita consi-
derablemente si se dividen en problemas más peque-
ños (subproblemas). La solución de estos subproblemas
se realiza con subalgoritmos. El uso de subalgoritmos
permite al programador desarrollar programas de pro-
blemas complejos utilizando el método descendente
introducido en los capítulos anteriores. Los subalgorit-
mos (subprogramas) pueden ser de dos tipos: funcio-
nes y procedimientos o subrutinas. Los subalgoritmos
son unidades de programa o módulos que están dise-
ñados para ejecutar alguna tarea específica. Estas fun-
ciones y procedimientos se escriben solamente una
vez, pero pueden ser referenciados en diferentes pun-
tos de un programa, de modo que se puede evitar la
duplicación innecesaria del código.
Las unidades de programas en el estilo de progra-
mación modular son independientes; el programador
puede escribir cada módulo y verificarlo sin preocu-
parse de los detalles de otros módulos. Esto facilita
considerablemente la localización de un error cuando
se produce. Los programas desarrollados de este
modo son normalmente también más fáciles de com-
prender, ya que la estructura de cada unidad de pro-
grama puede ser estudiada independientemente de
las otras unidades de programa. En este capítulo se
describen las funciones y procedimientos, junto con
los conceptos de variables locales y globales, así como
parámetros. Se introduce también el concepto de re-
cursividad como una nueva herramienta de resolución
de problemas.
INTRODUCCIÓN
202 Fundamentos de programación
6.1. INTRODUCCIÓN A LOS SUBALGORITMOS O SUBPROGRAMAS
Un método ya citado para solucionar un problema complejo es dividirlo en subproblemas —problemas más senci-
llos— y a continuación dividir estos subproblemas en otros más simples, hasta que los problemas más pequeños sean
fáciles de resolver. Esta técnica de dividir el problema principal en subproblemas se suele denominar “divide y ven-
cerás” (divide and conquer). Este método de diseñar la solución de un problema principal obteniendo las soluciones
de sus subproblemas se conoce como diseño descendente (top-down design). Se denomina descendente, ya que se
inicia en la parte superior con un problema general y el diseño específico de las soluciones de los subproblemas.
Normalmente las partes en que se divide un programa deben poder desarrollarse independientemente entre sí.
Las soluciones de un diseño descendente pueden implementarse fácilmente en lenguajes de programación de alto
nivel, como C/C++, Pascal o FORTRAN. Estas partes independientes se denominan subprogramas o subalgoritmos
si se emplean desde el concepto algorítmico.
La correspondencia entre el diseño descendente y la solución por computadora en términos de programa principal
y sus subprogramas se analizará a lo largo de este capítulo.
Consideremos el problema del cálculo de la superficie (área) de un rectángulo. Este problema se puede dividir
en tres subproblemas:
subproblema 1: entrada de datos de altura y base.
subproblema 2: cálculo de la superficie.
subproblema 3: salida de resultados.
El algoritmo correspondiente que resuelve los tres subproblemas es:
leer (altura, base) //entrada de datos
area ← base * altura //cálculo de la superficie
escribir(base, altura, area) //salida de resultados
El método descendente se muestra en la Figura 6.1.
Problema
principal
Algoritmo
principal
Subproblema
1
Subproblema
2
Subproblema
3
Subalgoritmo
1
Subalgoritmo
2
Subalgoritmo
3
Figura 6.1. Diseño descendente.
El problema principal se soluciona por el correspondiente programa o algoritmo principal —también denomi-
nado controlador o conductor (driver)— y la solución de los subproblemas mediante subprogramas, conocidos como
procedimientos (subrutinas) o funciones. Los subprogramas, cuando se tratan en lenguaje algorítmico, se denomi-
nan también subalgoritmos.
Un subprograma puede realizar las mismas acciones que un programa: 1) aceptar datos, 2) realizar algunos
cálculos y 3) devolver resultados. Un subprograma, sin embargo, se utiliza por el programa para un propósito espe-
cífico. El subprograma recibe datos desde el programa y le devuelve resultados. Haciendo un símil con una oficina,
el problema es como el jefe que da instrucciones a sus subordinados —subprogramas—; cuando la tarea se termina,
el subordinado devuelve sus resultados al jefe. Se dice que el programa principal llama o invoca al subprograma. El
subprograma ejecuta una tarea, a continuación devuelve el control al programa. Esto puede suceder en diferentes
Subprogramas (subalgoritmos): Funciones 203
lugares del programa. Cada vez que el subprograma es llamado, el control retorna al lugar desde donde fue hecha la
llamada (Figura 6.2). Un subprograma puede llamar a su vez a sus propios subprogramas (Figura 6.3). Existen —como
ya se ha comentado— dos tipos importantes de subprogramas: funciones y procedimientos o subrutinas.
Programa
Algoritmo
Subprograma
Subalgoritmo
Retorno 2
Llamada 2
Llamada 1
Retorno 1
Figura 6.2. Un programa con un subprograma: función y procedimiento o subrutina, según la terminología específica
del lenguaje: subrutina en BASIC y FORTRAN, función en C, C++, método en Java o C#, procedimiento o función en Pascal.
Subprograma 1 Subprograma 1.1
Subprograma 2
Programa
Figura 6.3. Un programa con diferentes niveles de subprogramas.
6.2. FUNCIONES
Matemáticamente una función es una operación que toma uno o más valores llamados argumentos y produce un va-
lor denominado resultado —valor de la función para los argumentos dados—. Todos los lenguajes de programación
tienen funciones incorporadas, intrínsecas o internas —en el Capítulo 3 se vieron algunos ejemplos—, y funciones
definidas por el usuario. Así, por ejemplo
f(x) =
x
1 + x2
donde f es el nombre de la función y x es el argumento. Obsérvese que ningún valor específico se asocia con x; es
un parámetro formal utilizado en la definición de la función. Para evaluar f debemos darle un valor real o actual a x;
con este valor se puede calcular el resultado. Con x = 3 se obtiene el valor 0.3 que se expresa escribiendo
f(3) = 0.3
f(3) =
3
1 + 9
=
3
10
= 0.3
Una función puede tener varios argumentos. Por consiguiente,
f(x, y) =
x – y
√
x + √
y
es una función con dos argumentos. Sin embargo, solamente un único valor se asocia con la función para cualquier
par de valores dados a los argumentos.
204 Fundamentos de programación
Cada lenguaje de programación tiene sus propias funciones incorporadas, que se utilizan escribiendo sus nombres
con los argumentos adecuados en expresiones tales como
raiz2(A+cos(x))
Cuando la expresión se evalúa, el valor de x se da primero al subprograma (función) coseno y se calcula cos(x).
El valor de A+cos(x) se utiliza entonces como argumento de la función raiz2 (raíz cuadrada), que evalúa el resultado
final.
Cada función se evoca utilizando su nombre en una expresión con los argumentos actuales o reales encerrados
entre paréntesis.
Las funciones incorporadas al sistema se denominan funciones internas o intrínsecas y las funciones definidas
por el usuario, funciones externas. Cuando las funciones estándares o internas no permiten realizar el tipo de cálcu-
lo deseado es necesario recurrir a las funciones externas que pueden ser definidas por el usuario mediante una decla-
ración de función.
A una función no se le llama explícitamente, sino que se le invoca o referencia mediante un nombre y una lista
de parámetros actuales. El algoritmo o programa llama o invoca a la función con el nombre de esta última en una
expresión seguida de una lista de argumentos que deben coincidir en cantidad, tipo y orden con los de la función que
fue definida. La función devuelve un único valor.
Las funciones son diseñadas para realizar tareas específicas: toman una lista de valores —llamados argumen-
tos— y devolver un único valor.
6.2.1. Declaración de funciones
La declaración de una función requiere una serie de pasos que la definen. Una función como tal subalgoritmo o
subprograma tiene una constitución similar a los algoritmos, por consiguiente, constará de una cabecera que comen-
zará con el tipo del valor devuelto por la función, seguido de la palabra función y del nombre y argumentos de
dicha función. A continuación irá el cuerpo de la función, que será una serie de acciones o instrucciones cuya ejecu-
ción hará que se asigne un valor al nombre de la función. Esto determina el valor particular del resultado que ha de
devolverse al programa llamador.
La declaración de la función será;
tipo_de_resultado funcion nombre_fun (lista de parametros)
[declaraciones locales]
inicio
acciones //cuerpo de la funcion
devolver (expresion)
fin_función
lista de parámetros lista de parámetros formales o argumentos, con uno o más argumentos de la siguien-
te forma:
({E|S|E/S} tipo_de_datoA: parámetro 1[, parámetro 2]...;
{E|S|E/S} tipo_de_datoB: parámetro x[, parámetro y]...)
nombre_func nombre asociado con la función, que será un nombre de identificador válido
acciones instrucciones que constituyen la definición de la funcion y que debe contener una
única instrucción: devolver (expresion); expresión sólo existe si la función
se ha declarado con valor de retorno y expresión es el valor devuelto por la fun-
ción
tipo_de_resultado tipo del resultado que devuelve la función
Subprogramas (subalgoritmos): Funciones 205
Sentencia devolver (return)
La sentencia devolver (return, volver) se utiliza para regresar de una función (un método en programación orien-
tada a objetos); devolver hace que el control del programa se transfiera al llamador de la función (método). Esta
sentencia se puede utilizar para hacer que la ejecución regrese de nuevo al llamador de la función.
Regla
La sentencia devolver termina inmediatamente la función en la cual se ejecuta.
Por ejemplo, la función:
f(x) =
x
1 + x2
se definirá como:
real función F(E real:x)
inicio
devolver (x/(1+x*x))
fin_función
Otro ejemplo puede ser la definición de la función trigonométrica, cuyo valor es
tan(x) =
sen(x)
cos(x)
donde sen(x) y cos(x) son las funciones seno y coseno —normalmente funciones internas—. La declaración de la
función es
real función tan (E real:x)
//funcion tan igual a sen(x)/cos(x), angulo x en radianes
inicio
devolver (sen(x)/cos(x))
fin_función
Observe que se incluye un comentario para describir la función. Es buena práctica incluir documentación que
describa brevemente lo que hace la función, lo que representan sus parámetros o cualquier otra información que
explique la definición de la función. En aquellos lenguajes de programación —como Pascal— que exigen sección
de declaraciones, éstas se situarán al principio de la función.
Para que las acciones descritas en un subprograma función sean ejecutadas, se necesita que éste sea invocado
desde un programa principal o desde otros subprogramas a fin de proporcionarle los argumentos de entrada necesarios
para realizar esas acciones.
Los argumentos de la declaración de la función se denominan parámetros formales, ficticios o mudos (“dummy”);
son nombres de variables, de otras funciones o procedimientos y que sólo se utilizan dentro del cuerpo de la función.
Los argumentos utilizados en llamada a la función se denominan parámetros actuales, que a su vez pueden ser cons-
tantes, variables, expresiones, valores de funciones o nombres de funciones o procedimientos.
6.2.2. Invocación a las funciones
Una función puede ser llamada de la forma siguiente:
nombre_función (lista de parametros actuales)
206 Fundamentos de programación
nombre_función función que llama
lista de parametros actuales constantes, variables, expresiones, valores de funciones. nom-
bres de funciones o procedimientos
Cada vez que se llama a una función desde el algoritmo principal se establece automáticamente una correspon-
dencia entre los parámetros formales y los parámetros actuales. Debe haber exactamente el mismo número de pará-
metros actuales que de parámetros formales en la declaración de la función y se presupone una correspondencia uno
a uno de izquierda a derecha entre los parámetros formales y los actuales.
Una llamada a la función implica los siguientes pasos:
1. A cada parámetro formal se le asigna el valor real de su correspondiente parámetro actual.
2. Se ejecuta el cuerpo de acciones de la función.
3. Se devuelve el valor de la función y se retorna al punto de llamada.
EJEMPLO 6.1
Definición de la función: y = xn
(potencia n de x)
real : función potencia(E real:x;E entero:n)
var
entero: i, y
inicio
y ← 1
desde i ← 1 hasta abs(n) hacer
y ← y*x
fin_desde
si n  0 entonces
y ← 1/y
fin_si
devolver (y)
fin_función
abs(n) es la función valor absoluto de n a fin de considerar exponentes positivos o negativos.
Invocación de la función
z ← potencia (2.5, –3)
{
parámetros actuales
Transferencia de información
x = 2.5 n = –3
z = 0.064
EJEMPLO 6.2
Función potencia para el cálculo de N elevado a A. El número N deberá ser positivo, aunque podrá tener parte frac-
cionaria, A es un real.
algoritmo Elevar_a_potencia
var
real : a, n
Subprogramas (subalgoritmos): Funciones 207
inicio
escribir('Deme numero positivo ')
leer(n)
escribir('Deme exponente ')
leer(a)
escribir('N elevado a =', potencia(n, a))
fin
real función potencia (E real: n, a)
inicio
devolver(EXP(a * LN(n)))
fin_función
EJEMPLO 6.3
Diseñar un algoritmo que contenga un subprograma de cálculo del factorial de un número y una llamada al
mismo.
Como ya es conocido por el lector el algoritmo factorial, lo indicaremos expresamente.
entero función factorial(E entero:n)
var
entero: i,f
//advertencia, segun el resultado, f puede ser real
inicio
f ← 1
desde i ← 1 hasta n hacer
f ← f * i
fin_desde
devolver (f)
fin_función
y el algoritmo que contiene un subprograma de cálculo del factorial de un número y una llamada al mismo:
algoritmo función_factorial
var entero: x, y, numero
inicio
escribir ('Deme un numero entero y positivo')
leer(numero)
x ← factorial(numero)
y ← factorial(5)
escribir(x, y)
fin
En este caso los parámetros actuales son: una variable (número) y una constante (5).
EJEMPLO 6.4
Realizar el diseño de la función y = x3
(cálculo del cubo de un número).
algoritmo prueba
var
entero: N
208 Fundamentos de programación
inicio //Programa principal
N ← cubo(2)
escribir ('2 al cubo es', N)
escribir ('3 al cubo es', cubo(3))
fin
entero función cubo(E entero: x)
inicio
devolver(x*x*x)
fin_función
La salida del algoritmo sería:
2 al cubo es 8
3 al cubo es 27
Las funciones pueden tener muchos argumentos, pero solamente un resultado: el valor de la función. Esto limita
su uso, aunque se encuentran con frecuencia en cálculos científicos. Un concepto más potente es el proporcionado
por el subprograma procedimiento que se examina en el siguiente apartado.
EJEMPLO 6.5
Algoritmo que contiene y utiliza unas funciones (seno y coseno) a las que les podemos pasar el ángulo en grados.
algoritmo Sen_cos_en_grados
var real : g
inicio
escribir('Deme ángulo en grados')
leer(g)
escribir(seno(g))
escribir(coseno(g))
fin
real función coseno (E real : g)
inicio
devolver(COS(g*2*3.141592/360))
fin_función
real: función seno (E real g)
inicio
devolver( SEN(g*2*3.141592/360))
fin_función
EJEMPLO 6.6
Algoritmo que simplifique un quebrado, dividiendo numerador y denominador por su máximo común divisor.
algoritmo Simplificar_quebrado
var
entero : n, d
inicio
escribir('Deme numerador')
leer(n)
Subprogramas (subalgoritmos): Funciones 209
escribir('Deme denominador')
leer(d)
escribir(n, '/', d, '=', n div mcd(n, d),'/', d div mcd(n, d))
fin
entero función mcd (E entero: n, d)
var
entero : r
inicio
r ← n MOD d
mientras r  0 hacer
n ← d
d ← r
r ← n MOD d
fin_mientras
devolver(d)
fin_función
EJEMPLO 6.7
Supuesto que nuestro compilador no tiene la función seno. Podríamos calcular el seno de x mediante la siguiente
serie:
sen(x) = x –
x3
3!
+
x5
5!
–
x7
7!
+ ... (hasta 17 términos)
x (ángulo en radianes).
El programa nos tiene que permitir el cálculo del seno de ángulos en grados mediante el diseño de una función
seno(x), que utilizará, a su vez, las funciones potencia(x,n) y factorial(n), que también deberán ser imple-
mentadas en el algoritmo.
Se terminará cuando respondamos N (no) a la petición de otro ángulo.
algoritmo Calcular_seno
var real : gr
carácter : resp
inicio
repetir
escribir('Deme ángulo en grados')
leer(gr)
escribir('Seno(', gr, ')=', seno(gr))
escribir('¿Otro ángulo?')
leer(resp)
hasta_que resp = 'N'
fin
real función factorial (E entero:n)
var
real : f
entero : i
inicio
f ← 1
desde i ← 1 hasta n hacer
f ← f * i
fin_desde
devolver(f)
fin_función
210 Fundamentos de programación
real función potencia (E real:x; E entero:n)
var real : pot
entero : i
inicio
pot ← 1
desde i ← 1 hasta n hacer
pot ← pot * x
fin_desde
devolver(pot)
fin_función
real función seno (E real:gr)
var real : x, s
entero : i, n
inicio
x ← gr * 3.141592 / 180
s ← x
desde i ← 2 hasta 17 hacer
n ← 2 * i – 1
si i MOD 2  0 entonces
s ← s – potencia(x, n) / factorial(n)
si_no
s ← s + potencia(x, n) / factorial(n)
fin_si
fin_desde
devolver(s)
fin_función
6.3. PROCEDIMIENTOS (SUBRUTINAS)
Aunque las funciones son herramientas de programación muy útiles para la resolución de problemas, su alcance está
muy limitado. Con frecuencia se requieren subprogramas que calculen varios resultados en vez de uno solo, o que
realicen la ordenación de una serie de números, etc. En estas situaciones la función no es apropiada y se necesita
disponer del otro tipo de subprograma: el procedimiento o subrutina.
Un procedimiento o subrutina1
es un subprograma que ejecuta un proceso específico. Ningún valor está asociado
con el nombre del procedimiento; por consiguiente, no puede ocurrir en una expresión. Un procedimiento se llama
escribiendo su nombre, por ejemplo, SORT, para indicar que un procedimiento denominado SORT (ORDENAR) se va
a usar. Cuando se invoca el procedimiento, los pasos que lo definen se ejecutan y a continuación se devuelve el con-
trol al programa que le llamó.
Procedimiento versus función
Los procedimientos y funciones son subprogramas cuyo diseño y misión son similares; sin embargo, existen unas
diferencias esenciales entre ellos.
1. Un procedimiento es llamado desde el algoritmo o programa principal mediante su nombre y una lista de
parámetros actuales, o bien con la instrucción llamar_a (call). Al llamar al procedimiento se detiene
momentáneamente el programa que se estuviera realizando y el control pasa al procedimiento llamado.
Después que las acciones del procedimiento se ejecutan, se regresa a la acción inmediatamente siguien-
te a la que se llamó.
2. Las funciones devuelven un valor, los procedimientos pueden devolver 0,1 o n valores y en forma de lis-
ta de parámetros.
3. El procedimiento se declara igual que la función, pero su nombre no está asociado a ninguno de los re-
sultados que obtiene.
1
En FORTRAN, la subrutina representa el mismo concepto que procedimiento. No obstante, en la mayor parte de los lenguajes el término
general para definir un subprograma es procedimiento o simplemente subprograma.
Subprogramas (subalgoritmos): Funciones 211
La declaración de un procedimiento es similar a la de funciones.
procedimiento nombre [(lista de parámetros formales)]
acciones
fin_procedimiento
Los parámetros formales tienen el mismo significado que en las funciones; los parámetros variables —en aquellos
lenguajes que los soportan, por ejemplo, Pascal— están precedidos cada uno de ellos por la palabra var para desig-
nar que ellos obtendrán resultados del procedimiento en lugar de los valores actuales asociados a ellos.
El procedimiento se llama mediante la instrucción
[llamar_a] nombre [(lista de parámetros actuales)]
La palabra llamar_a (call) es opcional y su existencia depende del lenguaje de programación.
El ejemplo siguiente ilustra la definición y uso de un procedimiento para realizar la división de dos números y
obtener el cociente y el resto.
Variables enteras: Dividendo
Divisor
Cociente
Resto
Procedimiento
procedimiento division (E entero:Dividendo,Divisor; S entero: Cociente, Resto)
inicio
Cociente ← Dividendo DIV Divisor
Resto ← Dividendo - Cociente * Divisor
fin_procedimiento
Algoritmo principal
algoritmo aritmética
var
entero: M, N, P, Q, S, T
inicio
leer(M, N)
llamar_a division (M, N, P, Q)
escribir(P, Q)
llamar_a division (M * N – 4, N + 1, S, T)
escribir(S, T)
fin
6.3.1. Sustitución de argumentos/parámetros
La lista de parámetros, bien formales en el procedimiento o actuales (reales) en la llamada se conoce como lista de
parámetros.
212 Fundamentos de programación
procedimiento demo
.
.
.
fin_procedimiento
o bien
procedimiento demo (lista de parametros formales)
y la instrucción llamadora
llamar_a demo (lista de parametros actuales)
Cuando se llama al procedimiento, cada parámetro formal toma como valor inicial el valor del correspondiente
parámetro actual. En el ejemplo siguiente se indican la sustitución de parámetros y el orden correcto.
algoritmo demo
//definición del procedimiento
entero: años
real: numeros, tasa
inicio
...
llamar_a calculo(numero, años, tasa)
...
fin
procedimiento calculo(S real: p1; E entero: p2; E real: p3)
inicio
p3 ... p1 ... p2
fin_procedimiento
Las acciones sucesivas a realizar son las siguientes:
1. Los parámetros reales sustituyen a los parámetros formales.
2. El cuerpo de la declaración del procedimiento se sustituye por la llamada del procedimiento.
3. Por último, se ejecutan las acciones escritas por el código resultante.
EJEMPLO 6.8 (DE PROCEDIMIENTO)
Algoritmo que transforma un número introducido por teclado en notación decimal a romana. El número será entero
y positivo y no excederá de 3.000.
Sin utilizar programación modular
algoritmo romanos
var entero : n,digito,r,j
inicio
repetir
escribir('Deme número')
leer(n)
hasta_que (n = 0) Y (n = 3000)
r ← n
digito ← r DIV 1000
Subprogramas (subalgoritmos): Funciones 213
r ← r MOD 1000
desde j ← 1 hasta digito hacer
escribir('M')
fin_desde
digito ← r DIV 100
r ← r MOD 100
si digito = 9 entonces
escribir('C', 'M')
si_no
si digito  4 entonces
escribir('D')
desde j ← 1 hasta digito – 5 hacer
escribir('C')
fin_desde
si_no
si digito = 4 entonces
escribir('C','D')
si_no
desde j ← 1 hasta digito hacer
escribir('C')
fin_desde
fin_si
fin_si
fin_si
digito ← r DIV 10
r ← r MOD 10
si digito = 9 entonces
escribir('X', 'C')
si_no
si digito  4 entonces
escribir('L')
desde j ← 1 hasta digito – 5 hacer
escribir('X')
fin_desde
si_no
si digito = 4 entonces
escribir('X','L')
si_no
desde j ← 1 hasta digito hacer
escribir('X')
fin_desde
fin_si
fin_si
fin_si
digito ← r
si digito = 9 entonces
escribir('I', 'X')
si_no
si digito  4 entonces
escribir('V')
desde j ← 1 hasta digito – 5 hacer
escribir('I')
fin_desde
si_no
si digito = 4 entonces
escribir('I','V')
214 Fundamentos de programación
si_no
desde j ← 1 hasta digito hacer
escribir('I')
fin_desde
fin_si
fin_si
fin_si
fin
Mediante programación modular
algoritmo Romanos
var entero : n, r, digito
inicio
repetir
escribir('Deme número')
leer(n)
hasta_que (n = 0) Y (n = 3000)
r ← n
digito ← r Div 1000
r ← r MOD 1000
calccifrarom(digito, 'M', ' ',' ')
digito ← r Div 100
r ← r MOD 100
calccifrarom(digito, 'C', 'D', 'M')
digito ← r Div 10
r ← r MOD 10
calccifrarom(digito, 'X', 'L', 'C')
digito ← r
calccifrarom(digito, 'I', 'V', 'X')
fin
procedimiento calccifrarom(E entero: digito; E caracter: v1, v2, v3)
var entero: j
inicio
si digito = 9 entonces
escribir( v1, v3)
si_no
si digito  4 entonces
escribir(v2)
desde j ← 1 hasta digito – 5 hacer
escribir(v1)
fin_desde
si_no
si digito = 4 entonces
escribir(v1, v2)
si_no
desde j ← 1 hasta digito hacer
escribir(v1)
fin_desde
fin_si
fin_si
fin_si
fin_procedimiento
Subprogramas (subalgoritmos): Funciones 215
6.4. ÁMBITO: VARIABLES LOCALES Y GLOBALES
Las variables utilizadas en los programas principales y subprogramas se clasifican en dos tipos:
• variables locales;
• variables globales.
Una variable local es aquella que está declarada y definida dentro de un subprograma, en el sentido de que está
dentro de ese subprograma y es distinta de las variables con el mismo nombre declaradas en cualquier parte del
programa principal. El significado de una variable se confina al procedimiento en el que está declarada. Cuando otro
subprograma utiliza el mismo nombre se refiere a una posición diferente en memoria. Se dice que tales variables son
locales al subprograma en el que están declaradas.
Una variable global es aquella que está declarada para el programa o algoritmo principal, del que dependen todos
los subprogramas.
La parte del programa/algoritmo en que una variable se define se conoce como ámbito o alcance (scope, en inglés).
El uso de variables locales tiene muchas ventajas. En particular, hace a los subprogramas independientes, con la
comunicación entre el programa principal y los subprogramas manipulados estructuralmente a través de la lista de
parámetros. Para utilizar un procedimiento sólo necesitamos conocer lo que hace y no tenemos que estar preocupados
por su diseño, es decir, cómo están programados.
Esta característica hace posible dividir grandes proyectos en piezas más pequeñas independientes. Cuando dife-
rentes programadores están implicados, ellos pueden trabajar independientemente.
A pesar del hecho importante de los subprogramas independientes y las variables locales, la mayoría de los len-
guajes proporcionan algún método para tratar ambos tipos de variables. (Véase Figura 6.4).
Una variable local a un subprograma no tiene ningún significado en otros subprogramas. Si un subprograma
asigna un valor a una de sus variables locales, este valor no es accesible a otros programas, es decir, no pueden uti-
lizar este valor. A veces, también es necesario que una variable tenga el mismo nombre en diferentes subprogramas.
Por el contrario, las variables globales tienen la ventaja de compartir información de diferentes subprogramas sin
una correspondiente entrada en la lista de parámetros.
En un programa sencillo con un subprograma, cada variable u otro identificador es o bien local al procedimiento
o global al programa completo. Sin embargo, si el programa incluye procedimientos que engloban a otros procedi-
mientos —procedimientos anidados—, entonces la noción de global/local es algo más complicado de entender.
Programa DEMO
tipo X, X1, ...
Ámbito de X
Ámbito de Y
.
. Procedimiento A
tipo Y, Y1, ...
Procedimiento B
tipo Z, Z1, ...
Procedimiento C
tipo W, W1, ...
.
.
.
.
.
. Ámbito de Z
Ámbito de W
.
r
.
.
.
Figura 6.4. Ambito de identificadores.
216 Fundamentos de programación
El ámbito de un identificador (variables, constantes, procedimientos) es la parte del programa donde se conoce
el identificador. Si un procedimiento está definido localmente a otro procedimiento, tendrá significado sólo dentro
del ámbito de ese procedimiento. A las variables les sucede lo mismo; si están definidas localmente dentro de un
procedimiento, su significado o uso se confina a cualquier función o procedimiento que pertenezca a esa defini-
ción.
La Figura 6.5 muestra un esquema de un programa con diferentes procedimientos, algunas variables son locales
y otras globales. En la citada figura se muestra el ámbito de cada definición.
C
B
E
D
F
G
A
Variables
definidas en
Accesibles desde
A A, B, C, D, E, F, G
B B, C
C C
D D, E, F, G
E E, F, G
F F
G G
Figura 6.5. Ámbito de definición de variables.
Los lenguajes que admiten variables locales y globales suelen tener la posibilidad explícita de definir dichas
variables como tales en el cuerpo del programa, o, lo que es lo mismo, definir su ámbito de actuación, para ello se
utilizan las cabeceras de programas y subprogramas, con lo que se definen los ámbitos.
Las variables definidas en un ámbito son accesibles en el mismo, es decir, en todos los procedimientos interiores.
EJEMPLO 6.9
La función (signo) realiza la siguiente tarea: dado un número real x, si x es 0, entonces se devuelve un 0; si x es
positivo, se devuelve 1, y si x es negativo, se devuelve un valor –1.
La declaración de la función es
entero función signo(E real: x)
var entero:s
inicio
//valores de signo: +1,0,–1
si x = 0 entonces s ← 0
si x  0 entonces s ← 1
si x  0 entonces s ← –1
devolver (s)
fin_función
Antes de llamar a la función, la variable (S), como se declara dentro del subprograma, es local al subprograma
y sólo se conoce dentro del mismo. Veamos ahora un pequeño algoritmo donde se invoque la función.
algoritmo SIGNOS
var
entero: a, b, c
real: x, y, z
Subprogramas (subalgoritmos): Funciones 217
inicio
x ← 5.4
a ← signo(x)
y ← 0
b ← signo(y)
z ← 7.8975
c ← signo(z – 9)
escribir('Las respuestas son', a, ' ', b, ' ', c)
fin
Si se ejecuta este algoritmo, se obtienen los siguientes valores:
x = 5.4
a = signo(5.4)
y = 0
b = signo(0)
z = 7.8975
c = signo(7.8975–9)
x es el parámetro actual de la primera llamada a signo(x)
a toma el valor 1
b toma el valor de 0
c toma el valor –1
La línea escrita al final será:
Las respuestas son 1 0 –1
EJEMPLO 6.10
algoritmo DEMOX
var entero: A, X, Y
inicio
x ← 5
A ← 10
y ← F(x)
escribir (x, A, y)
fin
entero función F(E entero: N)
var
entero: X
inicio
A ← 5
X ← 12
devolver(N + A)
fin_función
A la variable global A se puede acceder desde el algoritmo y desde la función. Sin embargo, X identifica a dos
variables distintas: una local al algoritmo y sólo se puede acceder desde él y otra local a la función.
Al ejecutar el algoritmo se obtendrían los siguientes resultados:
X = 5
A = 10
Y = F(5)
A = 5
X = 12
F = 5+5 = 10
Y = 10
invocación a la función F(N) se realiza un paso del parámetro actual X al parámetro
formal N
se modifica el valor de A en el algoritmo principal por ser A global
no se modifica el valor de X en el algoritmo principal porque X es local
se pasa el valor del argumento X(5) a través del parámetro N
218 Fundamentos de programación
se escribirá la línea
5 5 10
ya que X es el valor de la variable local X en el algoritmo; A, el valor de A en la función, ya que se pasa este valor al
algoritmo; Y es el valor de la función F(X).
6.5. COMUNICACIÓN CON SUBPROGRAMAS: PASO DE PARÁMETROS
Cuando un programa llama a un subprograma, la información se comunica a través de la lista de parámetros y se
establece una correspondencia automática entre los parámetros formales y actuales. Los parámetros actuales son
“sustituidos” o “utilizados” en lugar de los parámetros formales.
La declaración del subprograma se hace con
procedimiento nombre (clase tipo_de_dato: F1;
clase tipo_de_dato: F2;
......................
clase tipo_de_dato :Fn)
.
.
.
fin_procedimiento
y la llamada al subprograma con
llamar_a nombre (A1, A2, ..., An)
donde F1, F2, ..., Fn son los parámetros formales y A1, A2, ..., An los parámetros actuales o reales.
Las clases de parámetros podrían ser:
(E) Entrada
(S) Salida
(E/S) Entrada/Salida
Existen dos métodos para establecer la correspondencia de parámetros:
1. Correspondencia posicional. La correspondencia se establece aparejando los parámetros reales y formales
según su posición en las listas: así, Fi se corresponde con Ai, donde i = 1, 2, ..., n. Este método
tiene algunas desventajas de legibilidad cuando el número de parámetros es grande.
2. Correspondencia por el nombre explícito, también llamado método de paso de parámetros por nombre. En
este método, en las llamadas se indica explícitamente la correspondencia entre los parámetros reales y forma-
les. Este método se utiliza en Ada. Un ejemplo sería:
SUB(Y = B, X = 30);
que hace corresponder el parámetro actual B con el formal Y, y el parámetro actual 30 con el formal X duran-
te la llamada de SUB.
Por lo general, la mayoría de los lenguajes usan exclusivamente la correspondencia posicional y ese será el mé-
todo empleado en este libro.
Las cantidades de información que pueden pasarse como parámetros son datos de tipos simples, estructurados
—en los lenguajes que admiten su declaración— y subprogramas.
Subprogramas (subalgoritmos): Funciones 219
6.5.1. Paso de parámetros
Existen diferentes métodos para la transmisión o el paso de parámetros a subprogramas. Es preciso conocer el mé-
todo adoptado por cada lenguaje, ya que la elección puede afectar a la semántica del lenguaje. Dicho de otro modo,
un mismo programa puede producir diferentes resultados bajo diferentes sistemas de paso de parámetros.
Los parámetros pueden ser clasificados como:
entradas: las entradas proporcionan valores desde el programa que llama y que se utilizan dentro
de un procedimiento. En los subprogramas función, las entradas son los argumentos en
el sentido tradicional;
salidas: las salidas producen los resultados del subprograma; de nuevo si se utiliza el caso de
una función, éste devuelve un valor calculado por dicha función, mientras que con pro-
cedimientos pueden calcularse cero, una o varias salidas;
entradas/salidas: un solo parámetro se utiliza para mandar argumentos a un programa y para devolver
resultados.
Desgraciadamente, el conocimiento del tipo de parámetros no es suficiente para caracterizar su funcionamiento;
por ello, examinaremos los diferentes métodos que se utilizan para pasar o transmitir parámetros.
Los métodos más empleados para realizar el paso de parámetros son:
• paso por valor (también conocido por parámetro valor),
• paso por referencia o dirección (también conocido por parámetro variable),
• paso por nombre,
• paso por resultado.
6.5.2. Paso por valor
El paso por valor se utiliza en muchos lenguajes de programación; por ejemplo, C, Modula-2, Pascal, Algol y Snobol.
La razón de su popularidad es la analogía con los argumentos de una función, donde los valores se proporcionan en
el orden de cálculo de resultados. Los parámetros se tratan como variables locales y los valores iniciales se propor-
cionan copiando los valores de los correspondientes argumentos.
Los parámetros formales —locales a la función— reciben como valores iniciales los valores de los parámetros
actuales y con ello se ejecutan las acciones descritas en el subprograma.
No se hace diferencia entre un argumento que es variable, constante o expresión, ya que sólo importa el valor del
argumento. La Figura 6.6 muestra el mecanismo de paso por valor de un procedimiento con tres parámetros.
A ← 5
B ← 7
llamar _ a PROC1 (A, 18, B * 3 + 4)
5 18 25
procedimiento PROC1 (E entero: X, Y, Z)
Figura 6.6. Paso por valor.
El mecanismo de paso se resume así:
Valor primer parámetro: A = 5.
Valor segundo parámetro: constante = 18.
Valor tercer parámetro: expresión B * 3 + 4 = 25.
Los valores 5, 18 y 25 se transforman en los parámetros X, Y, Z respectivamente cuando se ejecuta el procedi-
miento.
220 Fundamentos de programación
Aunque el paso por valor es sencillo, tiene una limitación acusada: no existe ninguna otra conexión con los pa-
rámetros actuales, y entonces los cambios que se produzcan por efecto del subprograma no producen cambios en los
argumentos originales y, por consiguiente, no se pueden pasar valores de retorno al punto de llamada: es decir, todos
los parámetros son sólo de entrada. El parámetro actual no puede modificarse por el subprograma. Cualquier cambio
realizado en los valores de los parámetros formales durante la ejecución del subprograma se destruye cuando se ter-
mina el subprograma.
La llamada por valor no devuelve información al programa que llama.
Existe una variante de la llamada por valor y es la llamada por valor resultado. Las variables indicadas por los
parámetros formales se inicializan en la llamada al subprograma por valor tras la ejecución del subprograma; los
resultados (valores de los parámetros formales) se transfieren a los actuales. Este método se utiliza en algunas ver-
siones de FORTRAN.
6.5.3. Paso por referencia
En numerosas ocasiones se requiere que ciertos parámetros sirvan como parámetros de salida, es decir, se devuelvan
los resultados a la unidad o programas que llama. Este método se denomina paso por referencia o también de llama-
da por dirección o variable. La unidad que llama pasa a la unidad llamada la dirección del parámetro actual (que
está en el ámbito de la unidad llamante). Una referencia al correspondiente parámetro formal se trata como una re-
ferencia a la posición de memoria, cuya dirección se ha pasado. Entonces una variable pasada como parámetro real
es compartida, es decir, se puede modificar directamente por el subprograma.
Este método existe en FORTRAN, COBOL, Modula-2, Pascal, PL/1 y Algol 68. La característica de este método
se debe a su simplicidad y su analogía directa con la idea de que las variables tienen una posición de memoria asig-
nada desde la cual se pueden obtener o actualizar sus valores.
El área de almacenamiento (direcciones de memoria) se utiliza para pasar información de entrada y/o salida; en
ambas direcciones.
En este método los parámetros son de entrada/salida y los parámetros se denominan parámetros variables.
Los parámetros valor y parámetros variable se suelen definir en la cabecera del subprograma. En el caso de len-
guajes como Pascal, los parámetros variables deben ir precedidos por la palabra clave var;
program muestra;
//parametros actuales a, c, b y d paso por referencia
procedure prueba(var x,y:integer);
begin //procedimiento
//proceso de los valores de x e y
end;
begin
.
.
.
1. prueba(a, c);
.
.
.
2. prueba(b, d);
.
.
.
end.
La primera llamada en (1) produce que los parámetros a y c sean sustituidos por x e y si los valores de x e y se
modifican dentro de a o c en el algoritmo principal. De igual modo, b y d son sustituidos por x e y, y cualquier mo-
dificación de x o y en el procedimiento afectará también al programa principal.
La llamada por referencia es muy útil para programas donde se necesita la comunicación del valor en ambas
direcciones.
Subprogramas (subalgoritmos): Funciones 221
Notas
Ambos métodos de paso de parámetros se aplican tanto a la llamada de funciones como a las de procedi-
mientos:
• Una función tiene la posibilidad de devolver los valores al programa principal de dos formas: a) como valor
de la función, b) por medio de argumentos gobernados por la llamada de referencia en la correspondencia
parámetro actual-parámetro formal.
• Un procedimiento sólo puede devolver valores por el método de devolución de resultados.
El lenguaje Pascal permite que el programador especifique el tipo de paso de parámetros y, en un mismo subpro-
grama, unos parámetros se pueden especificar por valor y otros por referencia.
procedure Q(i:integer; var j:integer);
begin
i := i+10;
j := j+10;
write(i, j)
end;
Los parámetros formales son i, j, donde i se pasa por valor y j por referencia.
6.5.4. Comparaciones de los métodos de paso de parámetros
Para examinar de modo práctico los diferentes métodos, consideremos un ejemplo único y veamos los diferentes
valores que toman los parámetros. El algoritmo correspondiente con un procedimiento SUBR:
algoritmo DEMO
var
entero: A,B,C
inicio //DEMO
A ← 3
B ← 5
C ← 17
llamar_a SUBR(A, A, A + B, C)
escribir(C)
fin //DEMO
procedimiento SUBR (Modo entero: x, y;
E entero:z; Modo entero: v)
inicio
x ← x+1
v ← y+z
fin_procedimiento
Modo por valor
a) sólo por valor
no se transmite ningún resultado, por consiguiente
C no varía C = 17
b) valor_resultado
x = A = 3
A = 3 y = A = 3
B = 5 pasa al procedimiento z = A + B = 8
C = 17 v = C = 17
222 Fundamentos de programación
al ejecutar el procedimiento quedará
x = x + 1 = 3 + 1 = 4
v = y + z = 3 + 8 = 11
el parámetro llamado v pasa el valor del resultado v a su parámetro actual correspondiente, C.
Por tanto, C = 11.
Modo por referencia
Posiciones de la
memoria del
Programa llamador
Posiciones de la
memoria del
Subprograma llamado
C recibirá el valor 12.
Utilizando variables globales
algoritmo DEMO
var entero: A,B,C
inicio
A ← 3
B ← 5
c ← 17
llamar_a SUBR
escribir (c)
fin
procedimiento SUBR
inicio
a ← a + 1
c ← a + a + b
fin_procedimiento
Es decir, el valor de C será 13.
La llamada por referencia es el sistema estándar utilizado por FORTRAN para pasar parámetros. La llamada por
nombre es estándar en Algol 60. Simula 67 proporciona llamadas por valor, referencia y nombre.
Pascal permite pasar bien por valor bien por referencia
procedure demo(y:integer; var z:real);
especifica que y se pasa por valor mientras que z se pasa por referencia —indicado por la palabra reservada var—.
La elección entre un sistema u otro puede venir determinado por diversas consideraciones, como evitar efectos late-
rales no deseados provocados por modificaciones inadvertidas de parámetros formales (véase Apartado 6.7).
Subprogramas (subalgoritmos): Funciones 223
6.5.5. Síntesis de la transmisión de parámetros
Los métodos de transmisión de parámetros más utilizados son por valor y por referencia.
El paso de un parámetro por valor significa que el valor del argumento —parámetro actual o real— se asigna al
parámetro formal. En otras palabras, antes de que el subprograma comience a ejecutarse, el argumento se evalúa a
un valor específico (por ejemplo, 8 o 12). Este valor se copia entonces en el correspondiente parámetro formal den-
tro del subprograma.
Evaluación
Programa principal
Parámetro formal
Parámetro actual
(variable, constante
o expresión)
No permite la
comunicación
en este sentido
Subprograma .................
.................
Figura 6.7. Paso de un parámetro por valor.
Una vez que el procedimiento arranca, cualquier cambio del valor de tal parámetro formal no se refleja en un
cambio en el correspondiente argumento. Esto es, cuando el subprograma se termine, el argumento actual tendrá
exactamente el mismo valor que cuando el subprograma comenzó, con independencia de lo que haya sucedido al
parámetro formal. Este método es el método por defecto en Pascal si no se indica explícitamente otro. Estos paráme-
tros de entrada se denominan parámetros valor. En los algoritmos indicaremos como  modo  E (entrada). El paso
de un parámetro por referencia o dirección se llama parámetro variable, en oposición al parámetro por valor. En este
caso, la posición o dirección (no el valor) del argumento o parámetro actual se envía al subprograma. Si a un pará-
metro formal se le da el atributo de parámetro variable —en Pascal con la palabra reservada var— y si el parámetro
actual es una variable, entonces un cambio en el parámetro formal se refleja en un cambio en el correspondiente
parámetro actual, ya que ambos tienen la misma posición de memoria.
Programa principal
Parámetro formal
(parámetro var)
Parámetro actual
(debe ser una variable)
Subprograma
Una posición
de almacenamiento
Figura 6.8. Paso de un parámetro por referencia.
Para indicar que deseamos transmitir un parámetro por dirección, lo indicaremos con la palabra parámetro variable
—en Pascal se indica con la palabra reservada var— y especificaremos como modo E/S (entrada/salida) o S (salida).
EJEMPLO 6.11
Se trata de realizar el cálculo del área de un círculo y la longitud de la circunferencia en función del valor del radio
leído desde el teclado.
224 Fundamentos de programación
Recordemos las fórmulas del área del círculo y de la longitud de la circunferencia:
A = pi.r2
= pi.r.r
C = 2.pi.r = 2.pi.r donde pi = 3.141592
Los parámetros de entrada: radio
Los parámetros de salida: área, longitud
El procedimiento círculo calcula los valores pedidos.
procedimiento circulo(E real: radio; S real: area, longitud)
//parametros valor: radio
//parametros variable: area, longitud
var
real: pi
inicio
pi ← 3.141592
area ← pi * radio * radio
longitud ← 2 * pi * radio
fin_procedimiento
Los parámetros formales son: radio, area, longitud, de los cuales son de tipo valor (radio) y de tipo
variable (area, longitud).
Invoquemos el procedimiento círculo utilizando la instrucción
llamar_a circulo(6, A, C)
//{programa principal
inicio
//llamada al procedimiento
llamar_a circulo(6, A, C)
.
.
.
fin
procedimiento circulo(E real: radio; S real: area, longitud)
//parametros valor:radio
//parametros variable: area, longitud
inicio
pi ← 3.141592
area ← pi * radio * radio
longitud ← 2 * pi * radio
fin_procedimiento
EJEMPLO 6.12
Consideremos un subprograma M con dos parámetros formales: i, transmitido por valor, y j, por variable.
algoritmo M
//variables A, B enteras
var
entero: A, B
Subprogramas (subalgoritmos): Funciones 225
inicio
A ← 2
B ← 3
llamar_a N(A,B)
escribir(A, B)
fin //algoritmo M
procedimiento N(E entero: i; E/S entero: j)
//parametros valor i
//parametros variable j
inicio
i ← i + 10
j ← j + 10
escribir(i, j)
fin_procedimiento
Si se ejecuta el procedimiento N, veamos qué resultados se escribirán:
A y B son parámetros actuales.
i y j son parámetros formales.
Como i es por valor, se transmite el valor de A a i, es decir, i = A = 2. Cuando i se modifica por efecto de
i ← i+10 a 12, A no cambia y, por consiguiente, a la terminación de N,A sigue valiendo 2.
El parámetro B se transmite por referencia, es decir, j es un parámetro variable. Al comenzar la ejecución de N,
B se almacena como el valor j y cuando se suma 10 al valor de j,i en sí mismo no cambia. El valor del parámetro
B se cambia a 13. Cuando los valores i,j se escriben en N, los resultados son:
12 y 13
pero cuando retornan a M y al imprimir los valores de A y B, sólo ha cambiado el valor B. El valor de i = 12 se
pierde en N cuando éste ya termina. El valor de j también se pierde, pero éste es la dirección, no el valor 13.
Se escribirá como resultado final de la instrucción escribir(A, B):
2 13
6.6. FUNCIONES Y PROCEDIMIENTOS COMO PARÁMETROS
Hasta ahora los subprogramas que hemos considerado implicaban dos tipos de parámetros formales: parámetros va-
lor y parámetros variable. Sin embargo, en ocasiones se requiere que un procedimiento o función dado invoque a
otro procedimiento o función que ha sido definido fuera del ámbito de ese procedimiento o función. Por ejemplo, se
puede necesitar que un procedimiento P invoque la función F que puede estar o no definida en el procedimiento P;
esto puede conseguirse transfiriendo como parámetro el procedimiento o función externa (F) o procedimiento o
función dado (por ejemplo, el P). En resumen, algunos lenguajes de programación —entre ellos Pascal— admiten
parámetros procedimiento y parámetros función.
EJEMPLOS
procedimiento P(E func: F1; E real: x, y)
real función F(E func: F1, F2; E entero:x, y)
Los parámetros formales del procedimiento P son la función F1 y las variables x e y, y los parámetros formales
de la función F son las funciones F1 y F2, y las variables x e y.
226 Fundamentos de programación
Procedimientos función
Para ilustrar el uso de los parámetros función, consideremos la función integral para calcular el área bajo una curva
f(x) para un intervalo a = x = b.
La técnica conocida para el cálculo del área es subdividir la región en rectángulos, como se muestra en la Figu-
ra 6.9, y sumar las áreas de los rectángulos. Estos rectángulos se construyen subdividiendo el intervalo [a, b] en m
subintervalos iguales y formando rectángulos con estos subintervalos como bases y alturas dadas por los valores de
f en los puntos medios de los subintervalos.
a b x
y
y = f(x)
Figura 6.9. Cálculo del área bajo la curva f(x).
La función integral debe tener los parámetros formales a, b y n, que son parámetros valor ordinarios actuales de
tipo real; se asocian con los parámetros formales a y b; un parámetro actual de tipo entero —las subdivisiones— se
asocia con el parámetro formal n y una función actual se asocia con el parámetro formal f.
Los parámetros función se designan como tales con una cabecera de función dentro de la lista de parámetros
formales. La función integral podrá definirse por
real función integral(E func: f; E real: a,b; E entero: n)
el tipo func-tipo real func función (E real: x)
aquí la función f(x: real): real especifica que f es una función parámetro que denota una función cuyo pará-
metro formal y valor son de tipo real. El correspondiente parámetro función actual debe ser una función que tiene un
parámetro formal real y un valor real. Por ejemplo, si Integrando es una función de valor real con un parámetro y
tipo real función (E real:x):func
Area ← Integral(Integrando, 0, 1.5, 20)
es una referencia válida a función.
Diseñar un algoritmo que utilice la función Integral para calcular el área bajo el gráfico de las funciones f1 (x) =
x3
– 6x3
+ 10x y f2(x) = x2
+3x+2 para 0 = x = 4.
algoritmo Area_bajo_curvas
tipo
real función(E real : x) : func
var
real : a,b
entero : n
inicio
escribir('¿Entre qué límites?')
leer(a, b)
escribir('¿Subintervalos?')
leer(n)
Subprogramas (subalgoritmos): Funciones 227
escribir(integral(f1, a, b, n))
escribir(integral(f2, a, b, n))
fin
real FUNCIÓN f1 (E real : x)
inicio
devolver( x * x * x – 6 * x * x + 10 * x)
fin_funcion
real FUNCIÓN f2 (E real : x)
inicio
devolver( x * x + 3 * x + 2 )
fin_función
real FUNCIÓN integral (E func : f; E real : a, b; E entero : n)
var
real : baserectangulo,altura,x,s
entero : i
inicio
baserectangulo ← (b – a) / n
x ← a + baserectangulo/2
s ← 0
desde i ← 1 hasta n hacer
altura ← f(x)
s ← s + baserectangulo * altura
x ← x + baserectangulo
fin_desde
devolver(s)
fin_función
6.7. LOS EFECTOS LATERALES
Las modificaciones que se produzcan mediante una función o procedimiento en los elementos situados fuera del
subprograma (función o procedimiento) se denominan efectos laterales. Aunque en algunos casos los efectos latera-
les pueden ser beneficiosos en la programación, es conveniente no recurrir a ellos de modo general. Consideramos a
continuación los efectos laterales en funciones y en procedimientos.
6.7.1. En procedimientos
La comunicación del procedimiento con el resto del programa se debe realizar normalmente a través de parámetros.
Cualquier otra comunicación entre el procedimiento y el resto del programa se conoce como efectos laterales. Como
ya se ha comentado, los efectos laterales son perjudiciales en la mayoría de los casos, como se indica en la Figu-
ra 6.10.
Si un procedimiento modifica una variable global (distinta de un parámetro actual), éste es un efecto lateral. Por
ello, excepto en contadas ocasiones, no debe aparecer en la declaración del procedimiento. Si se necesita una varia-
ble temporal en un procedimiento, utilice una variable local, no una variable global. Si se desea que el programa
modifique el valor de una variable global, utilice un parámetro formal variable en la declaración del procedimiento
y a continuación utilice la variable global como el parámetro actual en una llamada al procedimiento.
En general, se debe seguir la regla de “ninguna variable global en procedimientos”, aunque esta prohibición no
significa que los procedimientos no puedan manipular variables globales. De hecho, el cambio de variables globales
se deben pasar al procedimiento como parámetros actuales. Las variables globales no se deben utilizar directamente
en las instrucciones en el cuerpo de un procedimiento; en su lugar, utilice un parámetro formal o variable local.
228 Fundamentos de programación
Efectos
laterales
Programa
principal y otros
procedimientos
Procedimiento
Lista de
parámetros
actuales
Figura 6.10. Efectos laterales en procedimientos.
En aquellos lenguajes en que es posible declarar constantes —como Pascal— se pueden utilizar constantes glo-
bales en una declaración de procedimiento; la razón reside en el hecho de que las constantes no pueden ser modifi-
cadas por el procedimiento y, por consiguiente, no existe peligro de que se puedan modificar inadvertidamente.
6.7.2. En funciones
Una función toma los valores de los argumentos y devuelve un único valor. Sin embargo, al igual que los procedi-
mientos, una función —en algunos lenguajes de programación— puede hacer cosas similares a un procedimiento o
subrutina. Una función puede tener parámetros variables además de parámetros valor en la lista de parámetros for-
males. Una función puede cambiar el contenido de una variable global y ejecutar instrucciones de entrada/salida
(escribir un mensaje en la pantalla, leer un valor del teclado, etc.). Estas operaciones se conocen como parámetros
laterales y se deben evitar.
Función
Argumentos
(parámetros
valor)
Valor
devuelto por
la función
Efectos
laterales
Programa principal
procedimiento y
otras funciones
Figura 6.11. Efectos laterales en una función.
Los efectos laterales están considerados —normalmente— como una mala técnica de programación, pues hacen
más difícil de entender los programas.
Toda la información que se transfiere entre procedimientos y funciones debe realizarse a través de la lista de pará-
metros y no a través de variables globales. Esto convertirá al procedimiento o función en módulos independientes que
pueden ser comprobados y depurados por sí solos, lo que evitará preocuparnos por el resto de las partes del programa.
Subprogramas (subalgoritmos): Funciones 229
6.8. RECURSIÓN (RECURSIVIDAD)
Como ya se conoce, un subprograma puede llamar a cualquier otro subprograma y éste a otro, y así sucesivamente;
dicho de otro modo, los subprogramas se pueden anidar. Se puede tener
A llamar_a B, B llamar_a C, C llamar_a D
Cuando se produce el retorno de los subprogramas a la terminación de cada uno de ellos el proceso resultante será
D retornar_a C, C retornar_a B, B retornar_a A
¿Qué sucedería si dos subprogramas de una secuencia son los mismos?
A llamar_a A
o bien
A llamar_a B, B llamar_a A
En primera instancia, parece incorrecta. Sin embargo, existen lenguajes de programación —Pascal, C, entre
otros— en que un subprograma puede llamarse a sí mismo.
Una función o procedimiento que se puede llamar a sí mismo se llama recursivo. La recursión (recursividad) es
una herramienta muy potente en algunas aplicaciones, sobre todo de cálculo. La recursión puede ser utilizada como
una alternativa a la repetición o estructura repetitiva. El uso de la recursión es particularmente idóneo para la solución
de aquellos problemas que pueden definirse de modo natural en términos recursivos.
La escritura de un procedimiento o función recursiva es similar a sus homónimos no recursivos; sin embargo,
para evitar que la recursión continúe indefinidamente es preciso incluir una condición de terminación.
La razón de que existan lenguajes que admiten la recursividad se debe a la existencia de estructuras específicas
tipo pilas (stack, en inglés) para este tipo de procesos y memorias dinámicas. Las direcciones de retorno y el estado
de cada subprograma se guardan en estructuras tipo pilas (véase Capítulo 11). En el Capítulo 11 se profundizará en
el tema de las pilas; ahora nos centraremos sólo en el concepto de recursividad y en su comprensión con ejemplos
básicos.
EJEMPLO 6.13
Muchas funciones matemáticas se definen recursivamente. Un ejemplo de ello es el factorial de un número entero n.
La función factorial se define como
n! =
{
1 si n = 0 0! = 1
nx(n–1)x(n–2)x ... x3x2x1 si n  0 n. (n–1) . (n–2)....3.2.1
Si se observa la fórmula anterior cuando n  0, es fácil definir n! en función de (n–1)! Por ejemplo, 5!
5! = 5x4x3x2x1 = 120
4! = 4x3x2x1 = 24
3! = 3x2x1 = 6
2! = 2x1 = 2
1! = 1x1 = 1
0! = 1 = 1
230 Fundamentos de programación
Se pueden transformar las expresiones anteriores en
5! = 5x4!
4! = 4x3!
3! = 3x2!
2! = 2x1!
1! = 1x0!
En términos generales sería:
n! =
{
1
n(n–1)!
si
si
n = 0
n  0
La función FACTORIAL de N expresada en términos recursivos sería:
FACTORIAL ← N * FACTORIAL(N – 1)
La definición de la función sería:
entero: función factorial(E entero: n)
//calculo recursivo del factorial
inicio
si n = 0 entonces
devolver (1)
si_no devolver (n * factorial(n – 1))
fin_si
fin_función
Para demostrar cómo esta versión recursiva de FACTORIAL calcula el valor de n!, consideremos el caso de n = 3.
Un proceso gráfico se representa en la Figura 6.12.
FACT FACTORIAL (3)
N es 3
FACTORIAL ← 3 * FACTORIAL (2)
Retorno
N es 2
FACTORIAL ← 2 * FACTORIAL (1)
Retorno
N es 1
FACTORIAL ← 1 * FACTORIAL (0)
Retorno
N es 0
FACTORIAL ← 1
Retorno
Figura 6.12. Cálculo recursivo de FACTORIAL de 3.
Subprogramas (subalgoritmos): Funciones 231
EJEMPLO 6.14
Otro ejemplo típico de una función recursiva es la serie Fibonacci. Esta serie fue concebida originalmente como
modelo para el crecimiento de una granja de conejos (multiplicación de conejos) por el matemático italiano del si-
glo XVI, Fibonacci.
La serie es la siguiente:
1, 1, 2, 3, 5, 8, 13, 21, 34 ...
Esta serie crece muy rápidamente; como ejemplo, el término 15 es 610.
La serie de Fibonacci (fib) se expresa así
fib(1) = 1
fib(2) = 1
fib(n) = fib(n – 1) + fib(n – 2) para n  2
Una función recursiva que calcula el elemento enésimo de la serie de Fibonacci es
entero: función fibonacci(E entero: n)
//calculo del elemento n–ésimo
inicio
si (n = 1) o (n = 2) entonces
devolver (1)
si_no
devolver (fibonacci(n – 2) + fibonacci(n – 1))
fin_si
fin_función
Aunque es fácil de escribir la función de Fibonacci, no es muy eficaz definida de esta forma, ya que cada paso
recursivo genera otras dos llamadas a la misma función.
6.9. FUNCIONES EN C/C++ , JAVA Y C#
La sintaxis básica y estructura de una función en C, C++, Java y C# son realmente idénticas
valor_retorno nombre_funcion (tipo1 arg1, tipo2 arg2 …)
{ // equivalente a la palabra reservada en pseudocódigo inicio
// cuerpo de la función
} // equivalente a la palabra reservada en pseudocódigo fin
En Java, todas las funciones deben estar asociadas con alguna clase y se denominan métodos. En C++, las fun-
ciones asociadas con una clase se llaman funciones miembro. Las funciones C tradicionales y las funciones no
asociadas con ninguna clase en C++, se denominan simplemente funciones no miembro.
El nombre de la función y su lista de argumentos constituyen la signatura. La lista de parámetros formales es la
interfaz de la función con el mundo exterior, dado que es el punto de entrada para parámetros entrantes.
La descripción de una función se realiza en dos partes: declaración de la función y definición de la función. La
declaración de una función, denominada también prototipo de la función, describe cómo se llama (invoca) a la
función. Existen dos métodos para declarar una función:
1. Escribir la función completa antes de ser utilizada.
2. Definir el prototipo de la función que proporciona al compilador información suficiente para llamar a la fun-
ción. El prototipo de una función es similar a la primera línea de la función, pero el prototipo no tiene
cuerpo.
232 Fundamentos de programación
Prototipo de función
Definición función
cabecera
cuerpo
double precio_total (int numero, double precio);
double precio_total (int numero, double precio)
{
const double IVA = 0.06; // impuesto 6%
double subtotal;
subtotal = numero * precio;
return (subtotal + IVA * subtotal):
}
Paso de parámetros
El paso de parámetros varía ligeramente entre Java y C++. Desde el enfoque de Java:
• No existen punteros como en C y C++;
• Los tipos integrados o incorporados (built-in, denominados también tipos primitivos de datos) se pasan siempre
por valor;
• Tipos objeto (similares a las clases que son parte de los paquetes estándar de java) se pasan siempre por refe-
rencia
Las variables de Java que representan tipos objeto se llaman variables de referencia y aquellas que representan
tipos integrados se llaman variables de no referencia.
EJEMPLO 6.15. FUNCIÓN EN C++
La función triángulo calcula el área de un triángulo en C++
// Función en C++
// Triángulo, cálculo del área o superficie
// Parámetros
// anchura – anchura del triángulo
// altura - altura del triángulo
// retorno (devuelve)
// Área del triángulo
float triangulo(float anchura, float altura)
{
float area
assert (anchura = 0.0);
assert (altura = 0.0);
return (area)
}
...
// Llamada por valor a la función area
Superficie = triangulo (2.5, 4.6); // paso de parámetros por valor
La llamada por valor ejecuta la función triangulo, calcula la fórmula del área del triángulo y su valor 11.50 se
asigna a la variable superficie.
EJEMPLO. 6.16. FUNCIÓN EN JAVA
import java.awt.Point; // se importa la clase
// Point parte del paquete
// estándar Java AWT
// paso por valor
public class DemoPasoParametros {
Subprogramas (subalgoritmos): Funciones 233
public static void intercambio_por_valor (int x, int y){
int aux;
aux = x;
x = y;
Y = aunx;
}
}
public static void intercambio_por_referencia (Punto p){ '
int aux = p.x;
p.x = p.y;
p.y = aux;
// …
}
// llamadas a la función
int m = 50;
int n = 75;
// …
intercambio_porvalor (m, n);
// …
punto unPunto= new Punto (-10, 50);
intercambio_porreferencia (unPunto)
// ...
En las líneas de código anteriores, m y n son variables integradas de tipo int. Para intercambiar los valores de
las dos variables se pasan en el método intercambio_porvalor. Una copia de los valores m y n se pasan a la
función intercambio_porvalor cuando se llama a la función.
En el caso de la llamada por referencia se ha instanciado e inicializado un objeto, unPunto (de la clase Point
definido en el paquete Java.awt.Point) a los valores 50, 75. Cuando unPunto se pasa en un método llamado
intecambio_porreferencia, el método intercambia el contenido de las coordenadas x e y del argumento. Es
preciso observar que una variable referencia es realmente una dirección al objeto y no el objeto en sí mismo. Al pa-
sar unPunto, en realidad se pasa la dirección del objeto y no una copia —como en el paso por valor— del objeto.
Esta característica de Java es equivalente semánticamente al modo en que funcionan las variables referencia y
variables puntero en C++. En resumen, las variables referencia en Java son muy similares a las referencias C++.
6.10. ÁMBITO (ALCANCE) Y ALMACENAMIENTO EN C/C++ Y JAVA
Cada identificador (nombre de una entidad) debe referirse a una única identidad (tal como una variable, función, tipo,
etc.). A pesar de este requisito, los nombres se pueden utilizar más de una vez en un programa. Un nombre se puede
reutilizar mientras se utilice en diferentes contextos, a partir de los cuales los diferentes significados del nombre
pueden ser empleados. El contexto utilizado para distinguir los significados de los nombres es su alcance o ámbito
(scope). Un ámbito o alcance es una región del código de programa, donde se permite hacer referencia (uso) a un
identificador.
Un nombre (identificador) se puede referir a diferentes entidades en diferentes ámbitos.
Los alcances están separados por los separadores inicio-fin (o llaves en los lenguajes C, C++, Java, etc.).
Los nombres son visibles desde su punto de declaración hasta el final del alcance en el que aparece la declaración.
Los identificadores definidos fuera de cualquier función tienen ámbito global; son accesibles desde cualquier
parte del programa. Los identificadores definidos en el cuerpo de una función se dicen que tienen ámbito local.
La clase de almacenamiento de una variable puede ser o bien permanente o temporal. Las variables globales son
siempre permanentes; se crean e inicializan antes de que el programa arranque y permanecen hasta que se termina.
Las variables temporales se asignan desde una sección de memoria llamada la pila (stack) en el principio del bloque.
234 Fundamentos de programación
Si se intentan asignar muchas variables temporales se puede obtener un error de desbordamiento de la pila. El espa-
cio utilizado por las variables temporales se devuelve (se libera) a la pila al final del bloque. Cada vez que se entra
al bloque, se inicializan las variables temporales.
Las variables locales son temporales a menos que sean declaradas estáticas static en C++.
Definición y declaración de variables
El ámbito (alcance) de una variable es el área (bloque) del programa donde es válida la variable. En general, las de-
finiciones o declaraciones de variables se pueden situar en cualquier parte de un programa donde esté permitida una
sentencia. Una variable debe ser declarada o definida antes de que sea utilizada.
Regla
Es una buena idea definir un objeto cerca del punto en el cual se va a utilizar la primera vez.
Las variables pueden ser globales o locales. Una variable global es de alcance global y es válida desde el punto
en que se declara hasta el final del programa. Su duración es la del programa, hasta que se acaba su ejecución. Una
variable local es aquella que está definida en el interior del cuerpo de una función y es accesible sólo dentro de dicha
función. El ámbito de una variable local se limita al bloque donde está declarada y no puede ser accedida (leída o
asignada un valor) fuera de ese bloque.
En el cuerpo o bloque de una función se pueden definir variables locales que son “locales” a dicha función y sus
nombres sólo son visibles en el ámbito de la función. Las variables locales sólo existen mientras la función se está
ejecutando.
Un bloque es una sección de código encerrada entre inicio y fin (en el caso de C/C++ o Java/C#, encerrado en-
tre llaves, { }).
Los nombres de las variables locales a una función son visibles sólo en el ámbito de la función y existen sólo
mientras la función se está ejecutando. La ejecución se termina cuando se encuentra una sentencia devolver (re-
turn) y produce como resultado el valor especificado en dicha sentencia. Es posible declarar una variable local con
el mismo nombre que una variable global, pero en el bloque donde está definida la variable local tiene prioridad so-
bre la variable global y se dice que esta variable se encuentra oculta. Si una variable local oculta a una global para
que tenga el mismo nombre entonces, se dice, que la variable global no es posible.
Una variable global es aquella que se define fuera del cuerpo de las funciones y están disponibles en todas
las partes del programa, incluso en otros archivos como en lenguajes C++ donde un programa puede estar en dos
archivos. En el caso de que un programa esté compuesto por dos archivos, en el primero se define la variable
global y se declara en el segundo archivo donde se puede utilizar.
EJEMPLO 6.17. VARIABLES LOCALES Y GLOBALES EN C++
alcance
int cuenta; // variable global
int main ( ) // función principal
{
int local: // variable local
cuenta = 100:
local = 500;
Subprogramas (subalgoritmos): Funciones 235
global local
alcance
local_uno
{
int local_uno;
local_uno = cuenta + local;
}
// no se puede utilizar local_uno
}
Si en el segmento de código siguiente se declara una nueva variable local cuenta, ésta se oculta a la variable
global cuenta inicializada a 100 en el cuerpo de la función.
int total;
int cuenta;
int main( )
{
total = 0;
cuenta = 100;
int cuenta;
cuenta = 0;
while (true) {
if (cuenta  10)
break;
total += cuenta;
++cuenta;
}
}
++cuenta;
return (0);
}
6.11. SOBRECARGA DE FUNCIONES EN C++ Y JAVA
Algunos lenguajes de programación como C++ o Java permiten la sobrecarga de funciones (funciones miembro en
C++, métodos en Java). La sobrecarga de funciones, que aparecen en el mismo ámbito, significa que se pueden
definir múltiples funciones con el mismo nombre pero con listas de parámetros diferentes.
Sobrecarga de una función es usar el mismo nombre para diferentes funciones, distintas unas de otras por sus
listas de parámetros.
En realidad, la sobrecarga de funciones es una propiedad que facilita la tarea al programador cuando se desean
diseñar funciones que realizan la misma tarea general pero que se aplican a tipos de parámetros diferentes. Estas
funciones se pueden llamar sin preocuparse sobre cuál función se invoca ya que el compilador detecta el tipo de dato
de los parámetros y ejecuta la función asociada a ellos.
Por ejemplo, se trata de ejecutar una función que imprima los valores de determinadas variables de diferentes
tipos de datos: car, entero, real, lógico, etc. Así algunas funciones que realizan estas tareas serían:
nada ImprimirEnteros (entero n)
inicio
escribir ('Visualizar')
escribirn('El valor es', n)
fin
236 Fundamentos de programación
nada ImprimirCar(car c)
inicio
escribir ('Visualizar')
escribirn('El valor es', c)
fin
nada ImprimirReal(real r)
inicio
escribir ('Visualizar')
escribirn('El valor es', r)
fin
nada ImprimirLogico (lógico l)
inicio
escribir ('Visualizar')
escribirn('El valor es', l)
fin
Se necesitan cuatro funciones diferentes con cuatro nombres diferentes; si se utilizan funciones sobrecargadas,
en lugar de utilizar un nombre para cada tipo de impresión de datos, se puede utilizar una función sobrecargada con
el mismo nombre Imprimir y con distintos parámetros.
nada Imprimir (entero n)
inicio
escribir ('Visualizar')
escribirn('El valor es', n)
fin
nada Imprimir (car c)
inicio
escribir ('Visualizar')
escribirn('El valor es', c)
fin
nada Imprimir (real r)
inicio
escribir ('Visualizar')
escribirn('El valor es', r)
fin
nada Imprimir (logico l)
inicio
escribir ('Visualizar')
escribirn('El valor es', l)
fin
El código que llama a estas funciones podría ser:
Imprimir (entero1)
Imprimir (car1)
Imprimir (real1)
Imprimir (logico1)
De este modo, el nombre de la función tiene cuatro definiciones diferentes ya que el nombre Imprimir está
sobrecargado.
La sobrecarga es una característica muy notable ya que hace a un programa más fácil de leer. Cuando se invoca
a una función sobrecargada el compilador comprueba el número y tipo de argumentos en dicha llamada.
Subprogramas (subalgoritmos): Funciones 237
EJERCICIO
Sobrecarga de la función media (media aritmética de dos o tres números reales).
real media (real n1, real n2)
inicio
devolver ((n1 + n2)/ 2.0)
fin
real media (real n1, real n2, real n3)
inicio
devolver ((n1 + n2 + n3)/ 3.0)
fin
Algunas llamadas a la función son:
media (4.5, 7.5)
media (3.5, 5.5, 10.5)
C , Pascal y FORTRAN no soportan sobrecarga de funciones. C++ y Java soportan sobrecarga de funciones
miembro y métodos.
EJEMPLO
Función cuadrado que eleva al cuadrado el valor del argumento.
entero cuadrado (entero n) entero cuadrado (real n)
inicio inicio
devolver (n*n) devolver (n * n)
fin fin
Sobrecarga en C++
Las funciones anteriores escritas en C++
int cuadrado (int n) float cuadrado (float n)
{ {
return (n * n); return (n * n);
} }
Sobrecarga en Java
En Java se pueden diseñar en una clase métodos con el mismo nombre, e incluso en la biblioteca de clases de Java,
la misma situación. Dos características diferencian los métodos con igual nombre:
• El número de argumentos que aceptan.
• El tipo de dato u objetos de cada argumento.
Estas dos características constituyen la signatura de un método. El uso de varios métodos con el mismo nombre
y signaturas diferentes se denomina sobrecarga. La sobrecarga de métodos puede eliminar la necesidad de escribir
métodos diferentes que realizan la misma acción. La sobrecarga facilita que existan métodos que se comportan de
modo diferente basado en los argumentos que reciben.
Cuando se llama a un método de un objeto, en Java, hace corresponder el nombre del método y los argumentos
para seleccionar cuál es la definición a ejecutar.
Para crear un método sobrecargado, se crean diferentes definiciones de métodos en una clase, cada uno con el
mismo nombre pero diferente lista de argumentos. La diferencia puede ser el número, el tipo de argumentos o ambos.
Java permite la sobrecarga de métodos pero cada lista de argumentos es única para el mismo nombre del método.
238 Fundamentos de programación
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
6.1. Realización del factorial de un número entero.
entero: función factorial(E entero: n)
var entero: f, i
inicio
si n = 0 entonces
devolver (1)
si_no
desde i ← 1 hasta n hacer
f ← f*i
fin_desde
devolver (f)
fin_si
fin_función
6.2. Diseñar un algoritmo que calcule el máximo común divisor de dos números mediante el algoritmo de Euclides.
Sean los dos números A y B. El método para hallar el máximo común divisor (mcd) de dos números A y B por el método
de Euclides es:
1. Dividir el número mayor (A) por el menor (B). Si el resto de la división es cero, el número B es el máximo común
divisor.
2. Si la división no es exacta, se divide el número menor (B) por el resto de la división anterior.
3. Se siguen los pasos anteriores hasta obtener un resto cero. El último divisor es el mcd buscado.
Algoritmo
entero función mcd(E entero: a, b)
inicio
mientras a  b hacer
si a  b entonces
a ← a – b
si_no
b ← b – a
fin_si
fin_mientras
devolver(a)
fin_funcion
6.3. Para calcular el máximo común divisor (mcd) de dos números se recurre a una función específica definida con un
subprograma. Se desea calcular la salida del programa principal con dos números A y B, cuyos valores son 10 y 25,
es decir, el mcd (A, B) y comprobar el método de paso de parámetros por valor.
algoritmo maxcomdiv
var
entero: N, X, Y
inicio //programa principal
x ← 10
y ← 25
n ← mcd(x, y)
escribir(x, y, n)
fin
entero función mcd(E entero: a,b)
inicio
mientras a  b hacer
si a  b entonces
a ← a – b
Subprogramas (subalgoritmos): Funciones 239
si_no
b ← b – a
fin_si
fin_mientras
devolver (a)
fin_función
Los parámetros formales son a y b y recibirán los valores de x e y.
a = 10
b = 25
Las variables locales a la función son A y B y no modificarán los valores de las variables x e y del algoritmo prin-
cipal.
Variables del Variables de
programa principal la función
x y N a b mcd(a, b)
10 25 10 25
Las operaciones del algoritmo son:
a = 10 b = 25
1. b  a realizará la operación b ← b – a
y por consiguiente b tomará el valor 25–10 = 15
y a sigue valiendo 10
2. a = 10 b = 15
se realiza la misma operación anterior
b ← b – a, es decir, b = 5
a permanece inalterable
3. a = 10 b = 5
como a  b entonces se realiza a ← a – b, es decir, a = 5
Por consiguiente, los valores finales serían:
a = 5 b = 5 mcd(a, b) = 5
Como los valores a y b no se pasan al algoritmo principal, el resultado de su ejecución será:
10 25 5
6.4. Realizar un algoritmo que permita ordenar tres números mediante un procedimiento de intercambio en dos variables
(paso de parámetros por referencia).
El algoritmo que permite realizar el intercambio de los valores de variables numéricas es el siguiente:
AUXI ← A
A ← B
B ← AUXI
y la definición del procedimiento será:
PROCEDIMIENTO intercambio (E/S real: a, b)
var real : auxi
inicio
auxi ← a
a ← b
b ← auxi
fin_procedimiento
240 Fundamentos de programación
El algoritmo de ordenación se realizará mediante llamadas al procedimiento intercambio.
algoritmo Ordenar_3_numeros
var real : x,y,z
inicio
escribir('Deme 3 números reales')
leer(x, y, z)
si x  y entonces
intercambio (x, y)
fin_si
si y  z entonces
intercambio (y, z)
fin_si
si x  y entonces
intercambio (x, y)
fin_si
escribir( x, y, z)
fin
Paso de parámetros por referencia
Los tres números X, Y, Z que se van a ordenar son
132 45 15
Los pasos sucesivos al ejecutarse el algoritmo o programa principal son:
1. Lectura X, Y, Z parámetros actuales
X = 132
Y = 45
Z = 15
2. Primera llamada al procedimiento intercambio(a, b) x  y.
La correspondencia entre parámetros será la siguiente:
parámetros actuales parámetros formales
X A
Y B
Al ejecutarse el procedimiento se intercambiarán los valores de A y B que se devolverán a las variables X e Y;
luego valdrán
X = 45
Y = 132
3. Segunda llamada al procedimiento intercambio con Y  Z (ya que Y = 132 y Z = 15)
parámetros actuales parámetros formales
Y A
Z B
Antes llamada al procedimiento Y = 132, Z = 15.
Después terminación del procedimiento Z = 132, Y = 15, ya que A y B han intercambiado los valores reci-
bidos, 132 y 15.
Subprogramas (subalgoritmos): Funciones 241
4. Los valores actuales de X, Y, Z son 45, 15, 132; por consiguiente, X  Y y habrá que hacer otra nueva llamada al
procedimiento intercambio.
parámetros actuales parámetros formales
X(45) A(45)
Y(15) B(15)
Después de la ejecución del procedimiento A y B intercambiarán sus valores y valdrán A = 15, B = 45, por
lo que se pasan al algoritmo principal X = 15, Y = 45. Por consiguiente, el valor final de las tres variables será:
X = 15 Y = 45 Z = 132
ya ordenados de modo creciente.
6.5. Diseñar un algoritmo que llame a la función signo(X) y calcule: a) el signo de un número, b) el signo de la función
coseno.
Variables de entrada: P (real)
Variables de salida: Y-signo del valor P-(entero) Z-signo del coseno de P-(entero);
Pseudocódigo
algoritmo signos
var entero: y, z
real: P
inicio
leer(P)
Y ← signo(p)
Z ← signo(cos (p))
escribir(Y, Z)
fin
entero función signo(E real: x)
inicio
si x  0 entonces
devolver (1)
si_no
si x  0 entonces
devolver (–1)
si_no
devolver (0)
fin_si
fin_si
fin_función
Notas de ejecución
Parámetro actual Parámetro formal
P x
El parámetro formal x se sustituye por el parámetro actual. Así, por ejemplo, si el parámetro P vale –1.45. Los valores
devueltos por la función Signo que se asignará a las variables Y, Z son:
Y ← Signo(–1.45)
Z ← Signo(Cos (–1.45))
resultando
Y = –1
Z = 1
242 Fundamentos de programación
CONCEPTOS CLAVE
• alcance.
• ámbito.
• ámbito global.
• ámbito local.
• argumento.
• argumento actual.
• argumentos formales.
• argumentos reales.
• biblioteca estándar.
• cabecera de función.
• clase de almacenamiento.
• cuerpo de la función.
• función.
• función invocada.
• función llamada.
• función llamadora.
• función recursiva.
• módulo.
• parámetro.
• parámetro actual.
• parámetros formales.
• parámetros reales.
• paso por referencia.
• paso por valor.
• procedimiento.
• prototipo de función.
• sentencia devolver (return).
• subprograma.
• rango.
• variable global.
• variable local.
Aunque los conceptos son similares, las unidades de pro-
gramas definidas por el usuario se conocen generalmente
por el término de subprogramas para representar los mó-
dulos correspondientes; sin embargo, se denominan con
nombres diferentes en los distintos lenguajes de programa-
ción. Así en los lenguajes C y C++ los subprogramas se
denominan funciones; en los lenguajes de programación
orientada a objetos (C++, Java y C#) y siempre que se
definen dentro de las clases, se les suele también denomi-
nar métodos o funciones miembro; en Pascal, son proce-
dimientos y funciones; en Módula-2 los nombres son
PROCEDIMIENTOS (procedures, incluso aunque algunos
de ellos son realmente funciones); en COBOL se conocen
como párrafos y en los “viejos” FORTRAN y BASIC se
les conoce como subrutinas y funciones. Los conceptos
más importantes sobre funciones y procedimientos son los
siguientes:
1. Las funciones y procedimientos se pueden utilizar
para romper un programa en módulos de menor com-
plejidad. De esta forma un trabajo complejo se puede
descomponer en otras unidades más pequeñas que
interactúan unas con otras de un modo controlado.
Estos módulos tienen las siguientes propiedades:
a) El propósito de cada función o procedimiento
debe estar claro y ser simple.
b) Una función o procedimiento debe ser lo bas-
tante corta como para ser comprendida en toda
su entidad.
c) Todas sus acciones deben estar interconectadas
y trabajar al mismo nivel de detalle.
d) El tamaño y la complejidad de un subprograma
se pueden reducir llamando a otros subprogra-
mas para que hagan subtareas.
2. Las funciones definidas por el usuario son subruti-
nas que realizan una operación y devuelven un va-
lor al entorno o módulo que le llamó. Los argumen-
tos pasados a las funciones se manipulan por la
rutina para producir un valor de retorno. Algunas
funciones calculan y devuelven valores, otras fun-
ciones no. Una función que no devuelve ningún
valor, se denomina función void en el caso del len-
guaje C.
3. Los procedimientos no devuelven ningún valor al
módulo que le invocó. En realidad, los procedi-
mientos ya se conservan sólo en algunos lenguajes
procedimentales como Pascal. En el resto de los
lenguajes sólo se implementan funciones y los pro-
cedimientos son equivalentes a funciones que no
devuelven valor.
4. Una llamada a una función que devuelve un valor,
se encuentra normalmente en una sentencia de asig-
nación, una expresión o una sentencia de salida.
5. Los componentes básicos de una función son la
cabecera de la función y el cuerpo de la función.
6. Los argumentos son el medio por el cual un pro-
grama llamador comunica o envía los datos a una
función. Los parámetros son el medio por el cual
una función recibe los datos enviados o comunica-
dos. Cuando una función se llama, los argumentos
reales en la llamada a la función se pasan a dicha
función y sus valores se sustituyen en los paráme-
tros formales de la misma.
7. Después de pasar los valores de los parámetros, el
control se pasa a la función. El cálculo comienza
en la parte superior de la función y prosigue hasta
que se termina, en cuyo momento el resultado se
devuelve al programa llamador.
8. Cada variable utilizada en un programa tiene un
ámbito (rango o alcance) que determina en qué par-
te del programa se puede utilizar. El ámbito de una
variable es local o global y se determina por la
posición donde se sitúa la variable. Una variable
local se define dentro de una función y sólo se pue-
de utilizar dentro de la definición de dicha función
o bloque. Una variable global está definida fuera
de una función y se puede utilizar en cualquier fun-
RESUMEN
Subprogramas (subalgoritmos): Funciones 243
ción a continuación de la definición de la variable.
Todas las variables globales que no son iniciali-
zadas por el usuario, normalmente se inicializan
a cero por la computadora.
9. Una solución recursiva es una en que la solución
se puede expresar en términos de una versión más
simple de sí misma. Es decir, una función recur-
siva se puede llamar a sí misma.
10. Si una solución de un problema se puede expresar
repetitivamente o recursivamente con igual facili-
dad, la solución repetitiva es preferible, ya que se
ejecuta más rápidamente y utiliza menos memo-
ria. Sin embargo, en muchas aplicaciones avanza-
das la recursión es más simple de visualizar y el
único medio práctico de implementar una solu-
ción.
EJERCICIOS
6.1. Diseñar una función que calcule la media de tres nú-
meros leídos del teclado y poner un ejemplo de su
aplicación.
6.2. Diseñar la función FACTORIAL que calcule el factorial
de un número entero en el rango 100 a 1.000.000.
6.3. Diseñar un algoritmo para calcular el máximo común
divisor de cuatro números basado en un subalgorit-
mo función mcd (máximo común divisor de dos nú-
meros).
6.4. Diseñar una función que encuentre el mayor de dos
números enteros.
6.5. Diseñar una función que calcule xn
para x, variable
real y n variable entera.
6.6. Diseñar un procedimiento que acepte un número de
mes, un número de día y un número de año y los vi-
sualice en el formato
dd/mm/aa
Por ejemplo, los valores 19,09,1987 se visualizarían
como
19/9/87
y para los valores 3, 9 y 1905
3/9/05
6.7. Realizar un procedimiento que realice la conversión
de coordenadas polares (r, θ) a coordenadas cartesia-
nas (x, y)
x = r.cos (θ)
y = r.sen(θ)
6.8. Escribir una función Salario que calcule los salarios
de un trabajador para un número dado de horas traba-
jadas y un salario hora. Las horas que superen las 40
horas semanales se pagarán como extras con un sala-
rio hora 1,5 veces el salario ordinario.
6.9. Escribir una función booleana Digito que determine
si un carácter es uno de los dígitos 0 al 9.
6.10. Diseñar una función que permita devolver el valor ab-
soluto de un número.
6.11. Realizar un procedimiento que obtenga la división en-
tera y el resto de la misma utilizando únicamente los
operadores suma y resta.
6.12. Escribir una función que permita deducir si una fecha
leída del teclado es válida.
6.13. Diseñar un algoritmo que transforme un número in-
troducido por teclado en notación decimal a notación
romana. El número será entero positivo y no excederá
de 3.000.
6.14. Escribir el algoritmo de una función recursiva que: a)
calcule el factorial de un número entero positivo, b) la
potencia de un número entero positivo.
Fundamentos_de_programacion_Algoritmos_e.pdf
245 Fundamentos de programación
PARTE II
ESTRUCTURA DE DATOS
CONTENIDO
Capítulo 7. Estructuras de datos I (arrays y estructuras)
Capítulo 8. Las cadenas de caracteres
Capítulo 9. Archivos (ficheros)
Capítulo 10. Ordenación, búsqueda e intercalación
Capítulo 11. Ordenación, búsqueda y fusión externa (archivos)
Capítulo 12. Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas)
Capítulo 13. Estructuras de datos no lineales (árboles y grafos).
Capítulo 14. Recursividad.
Fundamentos_de_programacion_Algoritmos_e.pdf
CAPÍTULO 7
Estructuras de datos I
(arrays y estructuras)1
7.1. Introducción a las estructuras de datos
7.2. Arrays (arreglos) unidimensionales: los vec-
tores
7.3. Operaciones con vectores
7.4. Arrays de varias dimensiones
7.5. Arrays multidimensionales
7.6. Almacenamiento de arrays en memoria
7.7. Estructuras versus registros
7.8. Arrays de estructuras
7.9. Uniones
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
CONCEPTOS CLAVE
RESUMEN
EJERCICIOS
En los capítulos anteriores se ha introducido el con-
cepto de datos de tipo simple que representan valores
de tipo simple, como un número entero, real o un
carácter. En muchas situaciones se necesita, sin em-
bargo, procesar una colección de valores que están
relacionados entre sí por algún método, por ejemplo,
una lista de calificaciones, una serie de temperaturas
medidas a lo largo de un mes, etc. El procesamiento
de tales conjuntos de datos, utilizando datos simples,
puede ser extremadamente difícil y por ello la mayoría
de los lenguajes de programación incluyen caracterís-
ticas de estructuras de datos. Las estructuras de datos
básicas que soportan la mayoría de los lenguajes de
programación son los “arrays” —concepto matemá-
tico de “vector” y “matriz”—.
Un array, o arreglo en Latinoamérica, es una se-
cuencia de posiciones de la memoria central a las que
se puede acceder directamente, que contiene datos del
mismo tipo y pueden ser seleccionados individualmen-
te mediante el uso de subíndices. Este capítulo estudia
el concepto de arrays unidimensionales y multidimen-
sionales, así como el procesamiento de los mismos.
INTRODUCCIÓN
l
El término array se conserva en inglés por su amplia aceptación en la comunidad de ingeniería informática y de sistemas. Sin embargo, es
preciso constatar que en prácticamente toda Latinoamérica (al menos en muchos de los numerosos países que conocemos y con los que tenemos
relaciones académicas y personales) el término empleado como traducción es arreglo. El DRAE (última edición, 22.ª, Madrid 2001) no conside-
ra ninguno de los dos términos como válidos, aunque la acepción 2 de la definición de arreglo pudiera ser ilustrativa del porqué de la adopción
del término por la comunidad latinoamericana: “Regla, orden, coordinación”.
248 Fundamentos de programación
7.1. INTRODUCCIÓN A LAS ESTRUCTURAS DE DATOS
Una estructura de datos es una colección de datos que pueden ser caracterizados por su organización y las operacio-
nes que se definen en ella.
Las estructuras de datos son muy importantes en los sistemas de computadora. Los tipos de datos más frecuentes
utilizados en los diferentes lenguajes de programación son:
datos simples estándar entero (integer)
real (real)
carácter (char)
lógico (boolean)
definido por el programador subrango (subrange)
(no estándar) enumerativo (enumerated)
datos estructurados estáticos arrays (vectores/matrices)
registros (record)
ficheros (archivos)
conjuntos (set)
cadenas (string)
dinámicos listas (pilas/colas)
listas enlazadas
árboles
grafos
Los tipos de datos simples o primitivos significan que no están compuestos de otras estructuras de datos; los más
frecuentes y utilizados por casi todos los lenguajes son: enteros, reales y carácter (char), siendo los tipos lógicos,
subrango y enumerativos propios de lenguajes estructurados como Pascal. Los tipos de datos compuestos están
construidos basados en tipos de datos primitivos; el ejemplo más representativo es la cadena (string) de caracteres.
Los tipos de datos simples pueden ser organizados en diferentes estructuras de datos: estáticas y dinámicas. Las
estructuras de datos estáticas son aquellas en las que el tamaño ocupado en memoria se define antes de que el
programa se ejecute y no puede modificarse dicho tamaño durante la ejecución del programa. Estas estructuras están
implementadas en casi todos los lenguajes: array (vectores/tablas-matrices), registros, ficheros o archivos (los con-
juntos son específicos del lenguaje Pascal). Las estructuras de datos dinámicas no tienen las limitaciones o restric-
ciones en el tamaño de memoria ocupada que son propias de las estructuras estáticas. Mediante el uso de un tipo de
datos específico, denominado puntero, es posible construir estructuras de datos dinámicas que son soportadas por la
mayoría de los lenguajes que ofrecen soluciones eficaces y efectivas en la solución de problemas complejos —Pascal
es el lenguaje tipo por excelencia con posibilidad de estructuras de datos dinámicos—. Las estructuras dinámicas por
excelencia son las listas —enlazadas, pilas, colas—, árboles —binarios, árbol-b, búsqueda binaria— y grafos.
La elección del tipo de estructura de datos idónea a cada aplicación dependerá esencialmente del tipo de aplica-
ción y, en menor medida, del lenguaje, ya que en aquellos en que no está implementada una estructura —por ejemplo,
las listas y árboles no los soporta COBOL— deberá ser simulada con el algoritmo adecuado, dependiendo del propio
algoritmo y de las características del lenguaje su fácil o difícil solución.
Una característica importante que diferencia a los tipos de datos es la siguiente: los tipos de datos simples tienen
como característica común que cada variable representa a un elemento; los tipos de datos estructurados tienen como
característica común que un identificador (nombre) puede representar múltiples datos individuales, pudiendo cada
uno de éstos ser referenciado independientemente.
7.2. ARRAYS (ARREGLOS) UNIDIMENSIONALES: LOS VECTORES
Un array o arreglo (matriz o vector) es un conjunto finito y ordenado de elementos homogéneos. La propiedad “or-
denado” significa que el elemento primero, segundo, tercero, ..., enésimo de un array puede ser identificado. Los
Estructuras de datos I (arrays y estructuras) 249
elementos de un array son homogéneos, es decir, del mismo tipo de datos. Un array puede estar compuesto de todos
sus elementos de tipo cadena, otro puede tener todos sus elementos de tipo entero, etc. Los arrays se conocen también
como matrices —en matemáticas— y tablas —en cálculos financieros—.
El tipo más simple de array es el array unidimensional o vector (matriz de una dimensión). Un vector de una
dimensión denominado NOTAS que consta de n elementos se puede representar por la Figura 7.1.
NOTAS(1) NOTAS(2) ..... NOTAS(I) ..... NOTAS(N)
Figura 7.1. Vector.
El subíndice o índice de un elemento (1, 2, ..., i, n) designa su posición en la ordenación del vector. Otras posibles
notaciones del vector son:
a1, a2, ..., ai, ..., an
A(1), A(2), ..., A(i), ..., A(n)
A[1], A[2], ..., A[i], ..., A[n]
en matemáticas y algunos lenguajes (VB 6.0 y VB.Net)
en programación (Pascal y C)
Obsérvese que sólo el vector global tiene nombre (NOTAS). Los elementos del vector se referencian por su sub-
índice o índice (“subscript”), es decir, su posición relativa en el valor.
En algunos libros y tratados de programación, además de las notaciones anteriores, se suele utilizar esta otra:
A(L:U) = {A(I)}
para I = L, L+1, ..., U-1, U donde cada elemento A(I) es de tipo de datos T
que significa: A, vector unidimensional con elementos de datos tipo T, cuyos subíndices varían en el rango de L a U,
lo cual significa que el índice no tiene por qué comenzar necesariamente en 0 o en 1.
Como ejemplo de un vector o array unidimensional, se puede considerar el vector TEMPERATURA que contiene
las temperaturas horarias registradas en una ciudad durante las veinticuatro horas del día. Este vector constará de
veinticuatro elementos de tipo real, ya que las temperaturas normalmente no serán enteras siempre.
El valor mínimo permitido de un vector se denomina límite inferior del vector (L) y el valor máximo permitido
se denomina límite superior (U). En el ejemplo del vector TEMPERATURAS el límite inferior es 1 y el superior 24.
TEMPERATURAS(I) donde 1 = I = 24
El número de elementos de un vector se denomina rango del vector. El rango del vector A(L:U) es U-L+1. El
rango del vector B(1:n) es n.
Los vectores, como ya se ha comentado, pueden contener datos no numéricos, es decir, tipo “carácter”. Por ejem-
plo, un vector que representa las frutas que se venden en un supermercado:
FRUTAS(1)
FRUTAS(2)
.
.
.
FRUTAS(I)
.
.
.
.
FRUTAS(N)
uvas
manzanas
.
.
.
papayas
.
.
.
.
melocotones
250 Fundamentos de programación
Otro ejemplo de un vector pueden ser los nombres de los alumnos de una clase. El vector se denomina ALUMNOS
y tiene treinta elementos de rango.
ALUMNOS
1 Luis Francisco
2 Jose
3 Victoria
.
i Martin
.
30 Graciela
Los vectores se almacenan en la memoria central de la computadora en un orden adyacente. Así, un vector de
cincuenta números denominado NUMEROS se representa gráficamente por cincuenta posiciones de memoria sucesivas.
Memoria
NUMEROS[1] Dirección X
NUMEROS[2] Dirección X+1
NUMEROS[3] Dirección X+2
NUMEROS[50] Dirección X+49
Cada elemento de un vector se puede procesar como si fuese una variable simple al ocupar una posición de me-
moria. Así,
NUMEROS[25] ← 72
almacena el valor entero o real 72 en la posición 25.ª del vector NUMEROS y la instrucción de salida
escribir (NUMEROS[25])
visualiza el valor almacenado en la posición 25.ª, en este caso 72.
Esta propiedad significa que cada elemento de un vector —y posteriormente una tabla o matriz— es accesible
directamente y es una de las ventajas más importantes de usar un vector: almacenar un conjunto de datos.
Consideremos un vector X de ocho elementos
X[1] X[2] X[3] X[4] X[5] X[6] X[7] X[8]
14.0 12.0 8.0 7.0 6.41 5.23 6.15 7.25
Elemento 1.º Elemento 2.º Elemento 8.º
Estructuras de datos I (arrays y estructuras) 251
Algunas instrucciones que manipulan este vector se representan en la Tabla 7.1.
Tabla 7.1. Operaciones básicas con vectores
Acciones Resultados
escribir(X[1]) Visualiza el valor de X[1] o 14.0.
X[4] ← 45 Almacena el valor 45 en X[4].
SUMA ← X[1]+X[3] Almacena la suma de X[1] y x[3] o bien 22.0 en la variable SUMA.
SUMA ← SUMA+X[4] Añade en la variable SUMA el valor de X[4], es decir, SUMA = 67.0.
X[5] ← x[5]+3,5 Suma 3.5 a X[5]; el nuevo valor de X[5] será 9.91.
X[6] ← X[1]+X[2] Almacena la suma de X[1] y X[2] en X[6]; el nuevo valor de X[6] será 26.5.
Antes de pasar a tratar las diversas operaciones que se pueden efectuar con vectores, consideremos la notación
de los diferentes elementos.
Supongamos un vector V de ocho elementos.
V[1] V[2] V[3] V[4] V[5] V[6] V[7] V[8]
12 5 –7 14.5 20 1.5 2.5 -10
Los subíndices de un vector pueden ser enteros, variables o expresiones enteras. Así, por ejemplo, si
I ← 4
V[I+1]
V[I+2]
V[I-2]
V[I+3]
representa el elemento V(5) de valor 20
representa el elemento V(6) de valor 1.5
representa el elemento V(2) de valor 5
representa el elemento V(7) de valor 2.5
Los arrays unidimensionales, al igual que posteriormente se verán los arrays multidimensionales, necesitan ser
dimensionados previamente a su uso dentro de un programa.
7.3. OPERACIONES CON VECTORES
Un vector, como ya se ha mencionado, es una secuencia ordenada de elementos como
X[1], X[2], ..., X[n]
El límite inferior no tiene por qué empezar en uno. El vector L
L[0], L[1], L[2], L[3], L[4], L[5]
contiene seis elementos, en el que el primer elemento comienza en cero. El vector P, cuyo rango es 7 y sus límites
inferior y superior son –3 y 3, es
P[-3], P[-2], P[-1], P[0], P[1], P[2], P[3]
Las operaciones que se pueden realizar con vectores durante el proceso de resolución de un problema son:
• asignación,
• lectura/escritura,
252 Fundamentos de programación
• recorrido (acceso secuencial),
• actualizar (añadir, borrar, insertar),
• ordenación,
• búsqueda.
En general, las operaciones con vectores implican el procesamiento o tratamiento de los elementos individuales
del vector.
Las notaciones algorítmicas que utilizaremos en este libro son:
tipo
array [liminf .. limsup] de tipo : nombre_array
nombre_array nombre válido del array
liminf..limsup límites inferior y superior del rango del array
tipo tipo de datos de los elementos del array: entero, real, carácter
tipo
array[1..10] de carácter : NOMBRES
var
NOMBRES : N
significa que NOMBRES es un array (vector) unidimensional de diez elementos (1 a 10) de tipo carácter.
tipo
array['A'..'Z'] de real : LISTA
var
LISTA : L
representa un vector cuyos subíndices son A, B, ... y cuyos elementos son de tipo real.
tipo
array[0..100] de entero : NUMERO
var
NUMERO:NU
NUMERO es un vector cuyos subíndices van de 0 a 100 y de tipo entero.
Las operaciones que analizaremos en esta sección serán: asignación, lectura/escritura, recorrido y actualización,
dejando por su especial relevancia como tema exclusivo de un capítulo la ordenación o clasificación y búsqueda.
7.3.1. Asignación
La asignación de valores a un elemento del vector se realizará con la instrucción de asignación:
A[29] ← 5 asigna el valor 5 al elemento 20 del vector A
Si se desea asignar valores a todos los elementos de un vector, se debe recurrir a estructuras repetitivas (desde,
mientras o repetir) e incluso selectivas (si-entonces, segun).
leer(A[i])
Si se introducen los valores 5, 7, 8, 14 y 12 mediante asignaciones
A[1] ← 5
A[2] ← 7
Estructuras de datos I (arrays y estructuras) 253
A[3] ← 8
A[4] ← 14
A[5] ← 12
El ejemplo anterior ha asignado diferentes valores a cada elemento del vector A; si se desea dar el mismo valor
a todos los elementos, la notación algorítmica se simplifica con el formato.
desde i = 1 hasta 5 hacer
A[i] ← 8
fin_desde
donde A[i] tomará los valores numéricos
A[1] = 8, A[2] = 8, ..., A[5] = 8
Se puede utilizar también la notación
A ← 8
para indicar la asignación de un mismo valor a cada elemento de un vector A. Esta notación se considerará con mu-
cho cuidado para evitar confusión con posibles variables simples numéricas de igual nombre (A).
7.3.2. Lectura/escritura de datos
La lectura/escritura de datos en arrays u operaciones de entrada/salida normalmente se realizan con estructuras re-
petitivas, aunque puede también hacerse con estructuras selectivas. Las instrucciones simples de lectura/escritura se
representarán como
leer(V[5]) leer el elemento V[5] del vector V
7.3.3. Acceso secuencial al vector (recorrido)
Se puede acceder a los elementos de un vector para introducir datos (escribir) en él o bien para visualizar su conte-
nido (leer). A la operación de efectuar una acción general sobre todos los elementos de un vector se la denomina
recorrido del vector. Estas operaciones se realizan utilizando estructuras repetitivas, cuyas variables de control (por
ejemplo, I) se utilizan como subíndices del vector (por ejemplo, S[I]). El incremento del contador del bucle pro-
ducirá el tratamiento sucesivo de los elementos del vector.
EJEMPLO 7.1
Lectura de veinte valores enteros de un vector denominado F.
Procedimiento 1
algoritmo leer_vector
tipo
array[1..20] de entero : FINAL
var
FINAL : F
inicio
desde i ← 1 hasta 20 hacer
leer(F[i])
fin_desde
fin
254 Fundamentos de programación
La lectura de veinte valores sucesivos desde el teclado rellenará de valores el vector F, comenzando con el ele-
mento F[1] y terminando en F[20]. Si se cambian los límites inferior y superior (por ejemplo, 5 y 10), el bucle de
lectura sería
desde i ← 5 hasta 10 hacer
leer(F[i])
fin_desde
Procedimiento 2
Los elementos del vector se pueden leer también con bucles mientras o repetir.
i ← 1
mientras i = 20 hacer
leer(F[i])
i ← i + 1
fin_mientras
o bien
i ← 1
repetir
leer (F[i])
i ← i + 1
hasta_que i  20
La salida o escritura de vectores se representa de un modo similar. La estructura
desde i ← 1 hasta i ← 20 hacer
escribir(F[i])
fin_desde
visualiza todo el vector completo (un elemento en cada línea independiente).
EJEMPLO 7.2
Este ejemplo procesa un array PUNTOS, realizando las siguientes operaciones; a) lectura del array, b) cálculo de la
suma de los valores del array, c) cálculo de la media de los valores.
El array lo denominaremos PUNTOS; el límite superior del rango lo introduciremos por teclado y el límite inferior
lo consideraremos 1.
algoritmo media_puntos
const
LIMITE = 40
tipo
array[1..LIMITE] de real : PUNTUACION
var
PUNTUACION : PUNTOS
real : suma, media
entero : i
inicio
suma ← 0
escribir('Datos del array')
desde i ← 1 hasta LIMITE hacer
leer(PUNTOS[i])
suma ← suma + PUNTOS[i]
fin_desde
media ← suma / LIMITE
escribir('La media es', media)
fin
Estructuras de datos I (arrays y estructuras) 255
Se podría ampliar el ejemplo, en el sentido de visualizar los elementos del array, cuyo valor es superior a la me-
dia. Mediante una estructura desde se podría realizar la operación, añadiéndole al algoritmo anterior.
escribir('Elementos del array superior a la media')
desde i ← 1 hasta LIMITE hacer
si PUNTOS[i]  media entonces
escribir(PUNTOS[i])
fin_si
fin_desde
EJEMPLO 7.3
Calcular la media de las estaturas de una clase. Deducir cuántos son más altos que la media y cuántos son más
bajos que dicha media (véase Figura 7.2).
Solución
Tabla de variables
n
H[1]...H[n]
i
MEDIA
ALTOS
BAJOS
SUMA
número de estudiantes de la clase
estatura de los n alumnos
contador de alumnos
media de estaturas
alumnos de estatura mayor que la media
alumnos de estatura menor que la media
totalizador de estaturas
: entera
: real
: entera
: real
: entera
: entera
: real
7.3.4. Actualización de un vector
La operación de actualizar un vector puede constar a su vez de tres operaciones elementales:
añadir elementos
insertar elementos
borrar elementos
Se denomina añadir datos a un vector la operación de añadir un nuevo elemento al final del vector. La única
condición necesaria para esta operación consistirá en la comprobación de espacio de memoria suficiente para el nue-
vo vector; dicho de otro modo, que el vector no contenga todos los elementos con que fue definido al principio del
programa.
EJEMPLO 7.4
Un array TOTAL se ha dimensionado a seis elementos, pero sólo se le han asignado cuatro valores a los elementos
TOTAL[1], TOTAL[2], TOTAL[3] y TOTAL[4]. Se podrán añadir dos elementos más con una simple acción de
asignación.
TOTAL[5] ← 14
TOTAL[6] ← 12
La operación de insertar un elemento consiste en introducir dicho elemento en el interior del vector. En este caso
se necesita un desplazamiento previo hacia abajo para colocar el elemento nuevo en su posición relativa.
256 Fundamentos de programación
EJEMPLO 7.5
Se tiene un array Coches2
de nueve elementos de contiene siete marcas de automóviles en orden alfabético y se de-
sea insertar dos nuevas marcas: Opel y Citroën.
Como Opel está comprendido entre Lancia y Renault, se deberán desplazar hacia abajo los elementos 5 y 6,
que pasarán a ocupar la posición relativa 6 y 7. Posteriormente debe realizarse la operación con Citroën, que ocu-
pará la posición 2.
El algoritmo que realiza esta operación para un vector de n elementos es el siguiente, suponiendo que haya es-
pacio suficiente en el vector.
2
En Latinoamérica, su término equivalente es CARRO o AUTO.
sí
sí
no
inicio
i ← i + 1
SUMA ← SUMA+H[i]
MEDIA ← SUMA/n
BAJOS ← 0
ALTOS ← 0
I ← 0
i ← i + 1
H[i]  MEDIA
ALTOS ← ALTOS + 1
escribir
n, MEDIA
BAJOS, ALTOS
sí
sí
no
no
leer n
leer H[i]
i = n
i = n?
fin
H[i]  media?
BAJOS ← BAJOS + 1
Figura 7.2. Diagrama de flujo para el cálculo de la estatura media de una clase.
Estructuras de datos I (arrays y estructuras) 257
1. //Calcular la posición ocupada por el elemento a insertar (por ejemplo, P)
2. //Inicializar contador de inserciones i ← n
3. mientras i = P hacer
//transferir el elemento actual i-ésimo hacia abajo, a la posición i+1
COCHES[i + 1] ← COCHES[i]
//decrementar contador
i ← i - 1
fin_mientras
4. //insertar el elemento en la posición P
COCHES[P] ← 'nuevo elemento'
5. //actualizar el contador de elementos del vector
6. n ← n + 1
7. fin
a) ALUMNOS b) Insertar OPEL c) Insertar CITROËN
1 Alfa Romeo 1 Alfa Romeo 1 Alfa Romeo
2 Fiat 2 Fiat 2 Citroën
3 Ford 3 Ford 3 Fiat
4 Lancia 4 Lancia 4 Ford
5 Renault 5 Opel 5 Lancia
6 Seat 6 Renault 6 Opel
7 7 Seat 7 Renault
8 8 8 Seat
9 9 9
Si se deseara realizar más inserciones, habría que incluir una estructura de decisión si-entonces para pregun-
tar si se van a realizar más inserciones.
La operación de borrar un elemento al final del vector no presenta ningún problema; el borrado de un elemen-
to del interior del vector provoca el movimiento hacia arriba de los elementos inferiores a él para reorganizar el
vector.
El algoritmo de borrado del elemento j-ésimo del vector COCHES es el siguiente:
algoritmo borrado
inicio
//se utilizará una variable auxiliar —AUX— que contendrá el valor
//del elemento que se desea borrar
AUX ← COCHES[j]
desde i ← j hasta N-1 hacer
//llevar elemento j + 1 hacia arriba
COCHES[i] ← COCHES[i + 1]
fin_desde
//actualizar contador de elementos
//ahora tendrá un elemento menos, N - 1
N ← N - 1
fin
258 Fundamentos de programación
7.4. ARRAYS DE VARIAS DIMENSIONES
Los vectores examinados hasta ahora se denominan arrays unidimensionales y en ellos cada elemento se define o
referencia por un índice o subíndice. Estos vectores son elementos de datos escritos en una secuencia. Sin embargo,
existen grupos de datos que son representados mejor en forma de tabla o matriz con dos o más subíndices. Ejemplos
típicos de tablas o matrices son: tablas de distancias kilométricas entre ciudades, cuadros horarios de trenes o aviones,
informes de ventas periódicas (mes/unidades vendidas o bien mes/ventas totales), etc. Se pueden definir tablas o
matrices como arrays multidimensionales, cuyos elementos se pueden referenciar por dos, tres o más subíndices. Los
arrays no unidimensionales los dividiremos en dos grandes grupos:
arrays bidimensionales (2 dimensiones)
arrays multidimensionales (3 o más dimensiones)
7.4.1. Arrays bidimensionales (tablas/matrices)
El array bidimensional se puede considerar como un vector de vectores. Es, por consiguiente, un conjunto de ele-
mentos, todos del mismo tipo, en el cual el orden de los componentes es significativo y en el que se necesita espe-
cificar dos subíndices para poder identificar cada elemento del array.
Si se visualiza un array unidimensional, se puede considerar como una columna de datos; un array bidimensio-
nal es un grupo de columnas, como se ilustra en la Figura 7.3.
El diagrama representa una tabla o matriz de treinta elementos (5 × 6) con 5 filas y 6 columnas. Como en un
vector de treinta elementos, cada uno de ellos tiene el mismo nombre. Sin embargo, un subíndice no es suficiente
para especificar un elemento de un array bidimensional; por ejemplo, si el nombre del array es M, no se puede indi-
car M[3], ya que no sabemos si es el tercer elemento de la primera fila o de la primera columna. Para evitar la am-
bigüedad, los elementos de un array bidimensional se referencian con dos subíndices: el primer subíndice se refiere
a la fila y el segundo subíndice se refiere a la columna. Por consiguiente, M[2, 3] se refiere al elemento de la se-
gunda fila, tercera columna. En nuestra tabla ejemplo M[2, 3] contiene el valor 18.
Fila 1
Fila 2
Fila 3
Fila 4
Fila 5
Columna 6
Columna 5
Columna 4
Columna 3
Columna 2
Columna 1
Figura 7.3. Array bidimensional.
Un array bidimensional M, también denominado matriz (términos matemáticos) o tabla (términos financieros), se
considera que tiene dos dimensiones (una dimensión por cada subíndice) y necesita un valor para cada subíndice para
poder identificar un elemento individual. En notación estándar, normalmente el primer subíndice se refiere a la fila
del array, mientras que el segundo subíndice se refiere a la columna del array. Es decir, B[I, J] es el elemento de
B que ocupa la Iª fila y la Jª columna, como se indica en la Figura 7.4.
El elemento B[I, J] también se puede representar por BI, J. Más formalmente en notación algorítmica, el array
B con elementos del tipo T (numéricos, alfanuméricos, etc.) con subíndices fila que varían en el rango de 1 a M y
subíndices columna en el rango de 1 a N es
Estructuras de datos I (arrays y estructuras) 259
1
2
...
I
...
M
1 2 3 4 ... J ... N
B[I, J]
Figura 7.4. Elemento B[I, J] del array B.
B(1:M, 1:N) = {B[I, J]}
donde I = 1, ..., M
J = 1, ..., N
o bien 1 = I = M
1 = J = N
cada elemento B[I, J] es de tipo T.
El array B se dice que tiene M por N elementos. Existen N elementos en cada fila y M elementos en cada columna
(M*N).
Los arrays de dos dimensiones son muy frecuentes: las calificaciones de los estudiantes de una clase se almace-
nan en una tabla NOTAS de dimensiones NOTAS[20, 5], donde 20 es el número de alumnos y 5 el número de asig-
naturas. El valor del subíndice I debe estar entre 1 y 20, y el de J entre 1 y 5. Los subíndices pueden ser variables
o expresiones numéricas, NOTAS(M, 4) y en ellos el subíndice de filas irá de 1 a M y el de columnas de 1 a N.
En general, se considera que un array bidimensional comienza sus subíndices en 0 o en 1 (según el lenguaje de
programación, 0 en el lenguaje C, 1 en FORTRAN), pero pueden tener límites seleccionados por el usuario durante
la codificación del algoritmo. En general, el array bidimensional B con su primer subíndice, variando desde un lími-
te inferior L (inferior, low) a un límite superior U (superior, up). En notación algorítmica
B(L1:U1, L2:U2) = {B[I, J]}
donde L1 = I = U1
L2 = J = U2
cada elemento B[I, J] es de tipo T.
El número de elementos de una fila de B es U2–L2+1 y el número de elementos en una columna de B es U1–L1+1.
Por consiguiente, el número total de elementos del array B es (U2–L2+1)*(U1–L1+1).
EJEMPLO 7.6
La matriz T representa una tabla de notaciones de saltos de altura (primer salto), donde las filas representan el
nombre del atleta y las columnas las diferentes alturas saltadas por el atleta. Los símbolos almacenados en la tabla
son: x, salto válido; 0, salto nulo o no intentado.
Columna T
Fila
2.00 2.10 2.20 2.30 2.35 2.40
García x 0 x x x 0
Pérez 0 x x 0 x 0
Gil 0 0 0 0 0 0
Mortimer 0 0 0 x x x
260 Fundamentos de programación
EJEMPLO 7.7
Un ejemplo típico de un array bidimensional es un tablero de ajedrez. Se puede representar cada posición o casilla
del tablero mediante un array, en el que cada elemento es una casilla y en el que su valor será un código represen-
tativo de cada figura del juego.
Figura 7.5. Array típico, “tablero de ajedrez”.
Los diferentes elementos serán
elemento[i, j] = 0
elemento[i, j] = 1
elemento[i, j] = 2
elemento[i, j] = 3
elemento[i, j] = 4
elemento[i, j] = 5
elemento[i, j] = 6
si no hay nada en la casilla [i, j]
si el cuadro (casilla) contiene un peón blanco
un caballo blanco
un alfil blanco
una torre blanca
una reina blanca
un rey blanco
y los correspondientes números, negativos para las piezas negras.
EJEMPLO 7.8
Supongamos que se dispone de un mapa de ferrocarriles y los nombres de las estaciones (ciudades) están en un
vector denominado “ciudad”. El array f puede tener los siguientes valores:
f[i, j] = 1
f[i, j] = 0
si existe enlace entre las ciudades i y j, ciudad[i] y ciudad[j]
no existe enlace
Nota
El array f resume la información de la estructura de la red de enlaces.
7.5. ARRAYS MULTIDIMENSIONALES
Un array puede ser definido de tres dimensiones, cuatro dimensiones, hasta de n-dimensiones. Los conceptos de
rango de subíndices y número de elementos se pueden ampliar directamente desde arrays de una y dos dimensiones
a estos arrays de orden más alto. En general, un array de n-dimensiones requiere que los valores de los n subíndices
Estructuras de datos I (arrays y estructuras) 261
puedan ser especificados a fin de identificar un elemento individual del array. Si cada componente de un array tiene
n subíndices, el array se dice que es sólo de n-dimensiones. El array A de n-dimensiones se puede identificar como
A(L1:U1, L2:U2, ... Ln:Un)
y un elemento individual del array se puede especificar por
A(I1, I2, ..., In)
donde cada subíndice Ik está dentro de los límites adecuados
Lk = Ik = Uk donde k = 1, 2, ..., n
El número total de elementos de un array A es
n
Π
k = 1
(Uk–Lk+1) Π (símbolo del producto)
que se puede escribir alternativamente como
(U1–L1+1)*(U2–L2+1)*...*(UN–LN+1)
Si los límites inferiores comenzasen en 1, el array se representaría por
A(K1, K2, ..., Kn) o bien Ak1, k2, ..., kn
donde
1 = K1 = S1
1 = K2 = S2
.
.
1 = Kn = Sn
EJEMPLO 7.9
Un array de tres dimensiones puede ser uno que contenga los datos relativos al número de estudiantes de la univer-
sidad ALFA de acuerdo a los siguientes criterios:
• cursos (primero a quinto),
• sexo (varón/hembra),
• diez facultades.
El array ALFA puede ser de dimensiones 5 por 2 por 10 (alternativamente 10 × 5 × 2 o 10 × 2 × 5, 2 × 5 × 10,
etcétera). La Figura 7.6 representa el array ALFA.
El valor de elemento ALFA[I, J, K] es el número de estudiantes del curso I de sexo J de la facultad K. Para
ser válido I debe ser 1, 2, 3, 4 o 5; J debe ser 1 o 2; K debe estar comprendida entre 1 y 10 inclusive.
Sexo
Curso
Facultad
Figura 7.6. Array de tres dimensiones.
262 Fundamentos de programación
EJEMPLO 7.10
Otro array de tres dimensiones puede ser PASAJE que representa el estado actual del sistema de reserva de una
línea aérea, donde
i = 1, 2, ..., 10 representa el número de vuelo
j = 1, 2, ..., 60 representa la fila del avión
k = 1, 2, ..., 12 representa el asiento dentro de la fila
Entonces
pasaje[i, j, k] = 0 asiento libre
pasaje[i, j, k] = 1 asiento ocupado
7.6. ALMACENAMIENTO DE ARRAYS EN MEMORIA
Las representaciones gráficas de los diferentes arrays se recogen en la Figura 7.7. Debido a la importancia de los
arrays, casi todos los lenguajes de programación de alto nivel proporcionan medios eficaces para almacenar y acce-
der a los elementos de los arrays, de modo que el programador no tenga que preocuparse sobre los detalles especí-
ficos de almacenamiento. Sin embargo, el almacenamiento en la computadora está dispuesto fundamentalmente en
secuencia contigua, de modo que cada acceso a una matriz o tabla la máquina debe realizar la tarea de convertir la
posición dentro del array en una posición perteneciente a una línea.
A[1]
A[2]
.
.
.
A[ i
]
.
.
.
A[n]
a)
A[1, 1]
A[2, 1]
A[3, 1]
b)
A[1, 2]
A[2, 2]
A[3, 2]
A[1, 3]
A[2, 3]
A[3, 3]
A[1, 4]
A[2, 4]
A[3, 4]
Figura 7.7. Arrays de una y dos dimensiones.
7.6.1. Almacenamiento de un vector
El almacenamiento de un vector en memoria se realiza en celdas o posiciones secuenciales. Así, en el caso de un
vector A con un subíndice de rango 1 a n,
Posición B A[1]
Posición B+1 A[2]
.
.
. A[3]
.
.
.
A[i]
.
.
.
Posición B+n–1 A[n]
Estructuras de datos I (arrays y estructuras) 263
Si cada elemento del array ocupa S bytes (1 byte = 8 bits) y B es la dirección inicial de la memoria central de la
computadora —posición o dirección base—, la dirección inicial del elemento i-ésimo sería:
B+(I-1)*S
Nota
Si el límite inferior no es igual a 1, considérese el array declarado como N(4:10); la dirección inicial de N(6) es
B+(6–4)*S.
En general, el elemento N(I) de un array definido como N(L:U) tiene la dirección inicial
B+(I-L)*S
7.6.2. Almacenamiento de arrays multidimensionales
Debido a que la memoria de la computadora es lineal, un array multidimensional debe estar linealizado para su dis-
posición en el almacenamiento. Los lenguajes de programación pueden almacenar los arrays en memoria de dos
formas: orden de fila mayor y orden de columna mayor.
El medio más natural en que se leen y almacenan los arrays en la mayoría de los compiladores es el denomina-
do orden de fila mayor (véase Figura 7.8). Por ejemplo, si un array es B[1:2, 1:3], el orden de los elementos en
la memoria es:
B[1, 1] B[1, 2] B[1, 3] B[2, 1] B[2, 2] B[2, 3]
Fila 1 Fila 2
Figura 7.8. Orden de fila mayor.
C, COBOL y Pascal almacenan los elementos por filas.
FORTRAN emplea el orden de columna mayor en el que las entradas de la primera columna vienen primero.
B[1, 1] B[2, 1] B[1, 2] B[2, 2] B[1, 3] B[2, 3]
Columna 1 Columna 2 Columna 3
Figura 7.9. Orden de columna mayor.
De modo general, el compilador del lenguaje de alto nivel debe ser capaz de calcular con un índice [i, j] la po-
sición del elemento correspondiente.
En un array en orden de fila mayor, cuyos subíndices máximos sean m y n (m, filas; n, columnas), la posición p
del elemento [i, j] con relación al primer elemento es
p = n(i–1)+j
Para calcular la dirección real del elemento [i, j] se añade p a la posición del primer elemento y se resta 1. La
representación gráfica del almacenamiento de una tabla o matriz B[2, 4] y C[2, 4]. (Véase Figura 7.10.)
En el caso de un array de tres dimensiones, supongamos un array tridimensional A[1:2, 1:4, 1:3]. La Figu-
ra 7.11 representa el array A y su almacenamiento en memoria.
264 Fundamentos de programación
B[1, 2]
B[1, 1]
B[1, 3]
B[1, 4]
B[2, 1]
B[2, 2]
B[2, 3]
B[2, 4]
a)
B[2, 1]
B[1, 1]
B[1, 2]
B[2, 2]
B[1, 3]
B[2, 3]
B[1, 4]
B[2, 4]
b)
B[2, 1] B[2, 2] B[2, 3] B[2, 4]
B[1, 1] B[1, 2] B[1, 3] B[1, 4]
B[2, 1] B[2, 2] B[2, 3] B[2, 4]
B[1, 1] B[1, 2] B[1, 3] B[1, 4]
b)
a)
Figura 7.10. Almacenamiento de una matriz: a) por filas, b) por columnas.
A[2, 1, 3] A[2, 2, 3] A[2, 3, 3] A[2, 4, 3]
A[1, 1, 3] A[1, 2, 3] A[1, 3, 3] A[1, 4, 3]
A[2, 2, 2] A[2, 3, 2] A[2, 4, 2]
A[1, 1, 2] A[1, 2, 2] A[1, 3, 2] A[1, 4, 2]
A[2, 1, 2]
A[2, 1, 1] A[2, 2, 1] A[2, 3, 1] A[2, 4, 1]
A[1, 1, 1] A[1, 2, 1] A[1, 3, 1] A[1, 4, 1]
Figura 7.11. Almacenamiento de una matriz A[2,4,3] por columnas.
En orden a determinar si es más ventajoso almacenar un array en orden de columna mayor o en orden de fila
mayor, es necesario conocer en qué orden se referencian los elementos del array. De hecho, los lenguajes de progra-
mación no le dan opción al programador para que elija una técnica de almacenamiento.
Consideremos un ejemplo del cálculo del valor medio de los elementos de un array A de 50 por 300 elementos,
A[50, 300]. Los algoritmos de almacenamiento respectivos serán:
Almacenamiento por columna mayor
total ← 0
desde j ← 1 hasta 300 hacer
desde i ← 1 hasta 50 hacer
total ← total + a[i, j]
fin_desde
fin_desde
media ← total / (300*50)
Almacenamiento por fila mayor
total ← 0
desde i ← 1 hasta 50 hacer
desde j ← 1 hasta 300 hacer
Estructuras de datos I (arrays y estructuras) 265
total ← total + a[i, j]
fin_desde
fin_desde
media ← total / (300*50)
7.7. ESTRUCTURAS VERSUS REGISTROS
Un array permite el acceso a una lista o una tabla de datos del mismo tipo de datos utilizando un único nombre de
variable. En ocasiones, sin embargo, se desea almacenar información de diferentes tipos, tales como un nombre de
cadena, un número de código entero y un precio de tipo real (coma flotante) juntos en una única estructura. Una
estructura que almacena diferentes tipos de datos bajo una misma variable se denomina registro.
En POO3
el almacenamiento de información de diferentes tipos con un único nombre suele efectuarse en clases.
No obstante, las clases son tipos referencia, esto significa que a los objetos de la clase se accede mediante una refe-
rencia. Sin embargo, en muchas ocasiones se requiere el uso de tipos valor. Las variables de un tipo valor contienen
directamente los datos, mientras que las variables de tipos referencia almacenan una referencia al lugar donde se
encuentran almacenados sus datos. El acceso a los objetos a través de referencia añade tareas y tiempos suplementa-
rios y también consume espacio. En el caso de pequeños objetos este espacio extra puede ser significativo. Algunos
lenguajes de programación como C y los orientados a objetos como C++, C#, ofrecen el tipo estructura para resolver
estos inconvenientes. Una estructura es similar a una clase en orientación a objetos e igual a un registro en lenguajes
estructurados como C pero es un tipo valor en lugar de un tipo referencia.
7.7.1. Registros
Un registro en Pascal es similar a una estructura en C y aunque en otros lenguajes como C# y C++ las clases pueden
actuar como estructuras, en este capítulo restringiremos su definición al puro registro contenedor de diferentes tipos
de datos. Un registro se declara con la palabra reservada estructura (struct, en inglés) o registro y se decla-
ra utilizando los mismos pasos necesarios para utilizar cualquier variable. Primero, se debe declarar el registro y a
continuación se asignan valores a los miembros o elementos individuales del registro o estructura.
Sintaxis
estructura: nombre_clase
tipo_1: campo1
tipo_2: campo2
...
fin_estructura
registro: nombre_tipo
tipo_1: campo1
tipo_2: campo2
...
fin_registro
Ejemplo
estructura: fechaNacimiento
entero: mes // mes de nacimiento
entero: dia // día de nacimiento
entero: año // año de nacimiento
Fin_estructura
La declaración anterior reserva almacenamiento para los elementos de datos individuales denominados campos
o miembros de la estructura. En el caso de fecha, la estructura consta de tres campos día, mes y año relativos a una
fecha de nacimiento o a una fecha en sentido general. El acceso a los miembros de la estructura se realiza con el
operador punto y con la siguiente sintaxis
Nombre_estructura.miembro
Así fechaNacimiento.mes se refiere al miembro mes de la estructura fecha, y fechaNacimiento.dia se
refiere al día de nacimiento de una persona. Un tipo de dato estructura más general podría ser Fecha y que sirviera
3
Programación orientada a objetos.
266 Fundamentos de programación
para cualquier dato aplicable a cualquier aplicación (fecha de nacimiento, fecha de un examen, fecha de comienzo
de clases, etc.).
estructura: Fecha
entero: mes
entero: dia
entero: año
fin_estructura
Declaración de tipos estructura
Una vez definido un tipo estructura se pueden declarar variables de ese tipo al igual que se hace con cualquier otro
tipo de datos. Por ejemplo, la sentencia de definición
Fecha: Cumpleaños, delDia
reserva almacenamiento para dos variables llamadas Cumpleaños y delDia, respectivamente. Cada una de estas
estructuras individuales tiene el mismo formato que el declarado en la clase Fecha.
Los miembros de una estructura no están restringidos a tipos de datos enteros sino que pueden ser cualquier tipo
de dato válido del lenguaje. Por ejemplo, consideremos un registro de un empleado de una empresa que constase de
los siguientes miembros:
estructura Empleado
Cadena: nombre
entero: idNumero
real: Salario
Fecha: FechaNacimiento
entero: Antigüedad
fin_estructura
Obsérvese que en la declaración de la estructura Empleado, el miembro Fecha es un nombre de un tipo estruc-
tura previamente definido. El acceso individual a los miembros individuales del tipo estructura de la clase Emplea-
do se realiza mediante dos operadores punto, de la forma siguiente:
Empleado.Fecha.Dia
y se refiere a la variable Dia de la estructura Fecha de la estructura Empleado.
Estructuras de datos homogéneas y heterogéneas
Los registros (estructuras) y los arrays son tipos de datos estructurados. La diferencia entre estos dos tipos de
estructuras de datos son los tipos de elementos que ellos contienen. Un array es una estructura de datos ho-
mogénea, que significa que cada uno de sus componentes deben ser del mismo tipo. Un registro es una es-
tructura de datos heterogénea, que significa que cada uno de sus componentes pueden ser de tipos de datos
diferentes. Por consiguiente, un array de registros es una estructura de datos cuyos elementos son de los mis-
mos tipos heterogéneos.
7.8. ARRAYS DE ESTRUCTURAS
La potencia real de una estructura o registro se manifiesta en toda su expresión cuando la misma estructura se utiliza
para listas de datos. Por ejemplo, supongamos que se deben procesar los datos de la tabla de la Figura 7.12.
Un sistema podría ser el siguiente: Almacenar los números de empleado en un array de enteros, los nombres en
un array de cadenas de caracteres y los salarios en un array de números reales. Al organizar los datos de esta forma,
Estructuras de datos I (arrays y estructuras) 267
cada columna de la Figura 7.13 se considera como una lista independiente que se almacena en su propio array. La
correspondencia entre elementos de cada empleado individual se mantiene almacenan los datos de un empleado en
la misma posición de cada array.
La separación de cada lista completa en tres arrays individuales no es muy eficiente, ya que todos los datos rela-
tivos a un empleado se organizan juntos en un registro como se muestra en la Figura 7.13. Utilizando una estructura,
se mantiene la integridad de los datos de la organización y bastará un programa que maneje los registros para poder
ser manipulados con eficacia. La declaración de un array de estructuras es similar a la declaración de un array de
cualquier otro tipo de variable. En consecuencia, en el caso del archivo de empleados de la empresa se puede decla-
rar el array de empleado con el nombre Empleado y el registro o estructura lo denominamos RegistroNomina
estructura: RegistroNomina
entero: NumEmpleado
cadena[30]: Nombre
real: Salario
fin_estructura
Se puede declarar un array de estructuras RegistroNomina que permite representar toda la tabla anterior
array [1..10] de RegistroNomina : Empleado
La sentencia anterior construye un array de diez elementos Empleado, cada uno de los cuales es una estructura
de datos de tipo RegistroNomina que representa a un empleado de la empresa Aguas de Sierra Mágina. Obsérvese
que la creación de un array de diez estructuras tiene el mismo formato que cualquier otro array. Por ejemplo, la crea-
ción de un array de diez enteros denominado Empleado requiere la declaración:
array [1..10] de entero : Empleado
En realidad la lista de datos de empleado se ha representado mediante una lista de registros como se mostraba en
la Figura 7.13.
Número de empleado Nombre del empleado Salario
97005
95758
87124
67005
20001
20020
99002
20012
21001
97005
Mackoy, José Luis
Mortimer, Juan
Rodríguez, Manuel
Carrigan, Luis José
Mackena, Luis Miguel
García de la Cruz, Heraclio
Mackoy, María Victoria
González, Yiceth
Verástegui, Rina
Collado, Concha
1.500
1.768
2.456
3.125
2.156
1.990
2.450
4.780
3.590
3.574
Figura 7.13. Lista de registros.
Número de empleado Nombre del empleado Salario
97005
95758
87124
67005
20001
20020
99002
20012
21001
97005
Mackoy, José Luis
Mortimer, Juan
Rodríguez, Manuel
Carrigan, Luis José
Mackena, Luis Miguel
García de la Cruz, Heraclio
Mackoy, María Victoria
González, Yiceth
Gonzáles, Rina
Rodríguez, Concha
1.500
1.768
2.456
3.125
2.156
1.990
2.450
4.780
3.590
3.574
Figura 7.12. Lista de datos.
268 Fundamentos de programación
7.9. UNIONES
Una unión es un tipo de dato derivado (estructurado) que contiene sólo uno de sus miembros a la vez durante la
ejecución del programa. Estos miembros comparten el mismo espacio de almacenamiento; es decir, una unión
comparte el espacio en lugar de desperdiciar espacio en variables que no se están utilizando. Los miembros de una
unión pueden ser de cualquier tipo, y pueden contener dos o más tipos de datos. La sintaxis para declarar un tipo
union es idéntica a la utilizada para definir un tipo estructura, excepto que la palabra union sustituye a es-
tructura:
Sintaxis
union nombre
tipo_dato1 identificador1
tipo_dato2 identificador2
…
fin_union
El número de bytes utilizado para almacenar una unión debe ser suficiente para almacenar el miembro más gran-
de. Sólo se puede hacer referencia a un miembro a la vez y, por consiguiente, a un tipo de dato a la vez. En tiempo
de ejecución, el espacio asignado a la variable de tipo union no incluye espacio de memoria más que para un
miembro de la unión.
Ejemplo
union TipoPeso
entero Toneladas
real Kilos
real Gramos
fin_union
TipoPeso peso // Declaración de una variable tipo unión
En tiempo de ejecución, el espacio de memoria asignado a la variable peso no incluye espacio para tres compo-
nentes distintos; en cambio, peso puede contener uno de los siguientes valores: entero o real.
El acceso a un miembro de la unión se realiza con el operador de acceso a miembros (punto, .)
peso.Toneladas = 325
Una unión es similar a una estructura con la diferencia de que sólo se puede almacenar en memoria de modo
simultáneo un único miembro o campo, al contrario que la estructura que almacena espacio de memoria para
todos sus miembros.
7.9.1. Unión versus estructura
Una estructura se utiliza para definir un tipo de dato con diferentes miembros. Cada miembro ocupa una posición
independiente de memoria
estructura rectángulo
inicio
entero: anchura
entero: altura
fin_estructura
Estructuras de datos I (arrays y estructuras) 269
La estructura rectángulo se puede representar en memoria en la Figura 7.14.
anchura estructura rectangulo
altura
rectángulo
valor_e / valor_r unión valor
valor
Figura 7.14. Estructura versus unión.
Una unión es similar a una estructura, sin embargo, sólo se define una única posición que puede ser ocupada por
diferentes miembros con nombres diferentes:
union valor
entero valor_e
real valor_r
fin_union
Los miembros valor_e y valor_r comparten el mismo espacio gráficamente; se puede pensar que una estruc-
tura es una caja con diferentes compartimentos, cada uno con su propio nombre (miembro), mientras que una unión
es una caja sin compartimentos donde se pueden colocar diferentes etiquetas en su interior.
En una estructura, los miembros no interactúan; el cambio de un miembro no modifica a los restantes. En una
unión todos los miembros ocupan el mismo espacio, de modo que sólo uno puede estar activo en un momento
dado.
EJERCICIO 7.1.
Se desea almacenar información sobre una figura geométrica estándar (círculo, rectángulo o triángulo). La infor-
mación necesaria para dibujar un círculo es diferente de los datos que se necesitan para dibujar un rectángulo, de
modo que se necesitan diferentes estructuras para cada figura:
estructura circulo
entero: radio
fin_estructura
estructura rectángulo
entero: altura, anchura
fin_estructura
estructura triangulo
entero: base
entero: altura
fin_estructura
El ejercicio consiste en definir una estructura que pueda contener una figura genérica. El primer código es un
número que indica el tipo de figura y el segundo es una unión que contiene la información de la figura.
estructura figura
entero: tipo //tipo=0, circulo; tipo=1, rectángulo; tipo=2, triángulo
union figura_genérica
circulo: datos_circulo
rectabgulo: datos_rectangulo
triangulo: datos_triangulo
fin_union: datos
fin_estructura
270 Fundamentos de programación
De este modo se puede acceder a miembros de la unión, estructura específica o estructura general con el operador
punto. Así el tipo de dato básico figura se puede definir y acceder a sus miembros de la forma siguiente:
figura: una_figura
// ...
una_figura.tipo ← 0
una_figura.datos.datos_circulo.radio ← 125
7.10. ENUMERACIONES
Una de las características importantes de la mayoría de los lenguajes de programación modernos es la posibilidad de
definir nuevos tipos de datos. Entre estos tipos definidos por el usuario se encuentran los tipos enumerados o enu-
meraciones.
Un tipo enumerado o de enumeración es un tipo cuyos valores están definidos por una lista de constantes de tipo
entero. En un tipo de enumeración las constantes se representan por identificadores separados por comas y encerrados
entre llaves. Los valores de un tipo enumerado comienzan con 0, a menos que se especifique lo contrario y se incre-
mente en 2. La sintaxis es:
enum nombre_tipo {identificador1, identificador2, ...]
identificador debe ser válido (1ª, 'B', '24x' no son identificadores válidos).
EJEMPLO
enum Dias {LUN, MAR, MIE, JUE, VIE, SAB, DOM}
enum Meses {ENE, FEB, MAR, ABR, MAY, JUN, JUL, AGO, SEP, OCT, NOV DIC}
El tipo Dias toma 7 valores, 0 a 6, y Meses toma 12 valores de 0 a 11. Estas declaraciones crean un nuevo tipo
de datos, Dias y Meses; los valores comienzan en 0, a menos que se indique lo contrario.
enum MESES {ENE←1, FEB, MAR, ABR, MAY, JUN, JUL, AGO←8, SEP, OCT, NOV, DIC)
Con la declaración anterior los meses se enumeran de 1 a 12.
El valor de cada constante de enumeración se puede establecer explícitamente en la definición, asignándole un
valor al identificador, que puede ser el mismo o distinto entero. También se puede representar el tipo de dato con esta
sintaxis:
enum Mes
{
ENE ← 31, FEB ← 28, MAR ← 31, ABR ← 30, MAY ← 31, JUN ← 30, JUL ← 31, AGO ← 31,
SEP ← 30, OCT ← 31, NOV ← 30, DIC ← 31
}
Si no se especifica ningún valor numérico, los identificadores en una definición de un tipo de enumeración se les
asignan valores consecutivos que comienzan por cero.
EJEMPLO
enum Direccion { NORTE ← 0, SUR ← 1, ESTE ← 2, OESTE ← 3}
es equivalente a
enum Direccion { NORTE, SUR, ESTE, OESTE}
Estructuras de datos I (arrays y estructuras) 271
Sintaxis
enum nombre {enumerador1, enumerador2,…}
enumerador identificador = expresión constante
Las variables de tipo enumeración se pueden utilizar en diferentes tipos de operaciones.
Creación de variables
enum Semaforo {verde, rojo, amarillo}
se pueden asignar variables de tipo Semaforo:
var
Semaforo Calle, Carretera, Plaza
Se crean las variables Calle, Carretera y Plaza de tipo Semaforo.
Asignación
La sentencia de asignación
Calle ← Rojo
no asigna a Calle la cadena de caracteres Rojo ni el contenido de una variable de nombre Rojo sino que asigna el
valor Rojo que es de uno de los valores del dominio del tipo de datos Semaforo.
Sentencias de selección caso_de (switch), si-entonces (if-then)
Algoritmo
enum Mes { ENE, FEB, MAR, ... }
algoritmo DemoEnum
var Mes MesVacaciones
inicio
MesVacaciones ← ENE
si (MesVacaciones ← ENE)
Escribir ('El mes de vacaciones es Enero')
fin_si
fin
Algoritmo
Se pueden usar valores de enumeración en una sentencia según_sea (switch):
tipo
enum Animales {Raton, Gato, Perro, Paloma, Reptil, Canario}
var
Animales: ADomesticos
según_sea: ADomesticos
Raton: escribir '...'
Gato : escribir '...'
fin_segun_sea
272 Fundamentos de programación
Sentencias repetitivas
Las variables de enumeración se pueden utilizar en bucles desde, mientras, ...:
algoritmo demoEnum2
tipo
enum meses { ENE=1, FEB, MAR, ABR, MAY, JUN, JUL. AGO, SEP, OCT, NOV, DIC}
var
enum meses: mes
inicio
desde mes ← ENE hasta mes = DIC
...
fin_desde
fin
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
7.1. Escribir un algoritmo que permita calcular el cuadrado de los cien primeros números enteros y a continuación es-
cribir una tabla que contenga dichos cien números cuadrados.
Solución
El problema consta de dos partes:
1. Cálculo de los cien primeros números enteros y sus cuadrados.
2. Diseño de una tabla T, T(1), T(2), ..., T(100) que contiene los siguientes valores:
T(1) = 1*1 = 1
T(2) = 2*2 = 4
T(3) = 3*3 = 9
...
El algoritmo se puede construir con estructuras de decisión o alternativas, o bien con estructuras repetitivas. En nuestro
caso utilizaremos una estructura repetitiva desde.
algoritmo cuadrados
tipo
array[1..100] de entero : tabla
var
tabla : T
entero : I, C
inicio
desde I ← 1 hasta 100 hacer
C ← I * I
escribir(I, C)
fin_desde
desde I ← 1 hasta 100 hacer
T[I] ← I * I
escribir(T[I])
fin_desde
fin
7.2. Se tienen N temperaturas. Se desea calcular su media y determinar entre todas ellas cuáles son superiores o iguales
a esa media.
Solución
Análisis
En un primer momento se leen los datos y se almacenan en un vector (array unidimensional) TEMP(1:N).
A continuación se van realizando las sumas sucesivas a fin de obtener la media.
Estructuras de datos I (arrays y estructuras) 273
Por último, con un bucle de lectura de la tabla se va comparando cada elemento de la misma con la media y luego,
mediante un contador, se calcula el número de temperaturas igual o superior a la media.
Tabla de variables
N
TEMP
SUMA
MEDIA
C
Número de elementos del vector o tabla.
Vector o tabla de temperatura.
Sumas sucesivas de las temperaturas.
Media de la tabla.
Contador de temperaturas = MEDIA.
Pseudocódigo
algoritmo temperaturas
const
N = 100
tipo
array[1..N] de real : temperatura
var
temperatura: Temp
entero : I, C
real : suma, media
inicio
suma ← 0
media ← 0
C ← 0
desde I ← 1 hasta N hacer
leer(Temp[I])
suma ← suma+Temp[I]
fin_desde
media ← suma/N
para I ← 1 hasta N hacer
si Temp[I] = media entonces
C ← C+1
escribir(Temp[I])
fin_si
fin_para
escribir('La media es:', media)
escribir('El total de temperaturas =', media, 'es:', C)
fin
7.3. Escribir el algoritmo que permita sumar el número de elementos positivos y el de negativos de una tabla T.
Solución
Sea una tabla T de dimensiones M, N leídas desde el teclado.
Tabla de variables
I, J, M, N:
SP:
SN:
entero
real
real
Pseudocódigo
algoritmo suma_resta
const
M = 50
N = 20
274 Fundamentos de programación
tipo
array[1..M, 1..N] de real : Tabla
var
Tabla : T
entero : I, J
real : SP, SN
inicio
SP ← 0
SN ← 0
desde I ← 1 hasta M hacer
desde J ← 1 hasta N hacer
si T[I, J]  0 entonces
SP ← SP + T[I, J]
si_no
SN ← SN + T[I, J]
fin_si
fin_desde
fin_desde
escribir('Suma de positivos', SP, 'de negativos', SN)
fin
7.4. Inicializar una matriz de dos dimensiones con un valor constante dado K.
Solución
Análisis
El algoritmo debe tratar de asignar la constante K a todos los elementos de la matriz A[M, N].
A[1, 1] = K A[1, 2] = K ... A[1, N] = K
.
.
A[M, 1] = K A[M, 2] = K ... A[M, N] = K
Dado que es una matriz de dos dimensiones, se necesitan dos bucles anidados para la lectura.
Pseudocódigo
algoritmo inicializa_matriz
inicio
desde I ← 1 hasta M hacer
desde J ← 1 hasta N hacer
A[I, J] ← K
fin_desde
fin_desde
fin
7.5. Realizar la suma de dos matrices bidimensionales.
Solución
Análisis
Las matrices A[I, J], B[I, J] para que se puedan sumar deben tener las mismas dimensiones. La matriz suma S[I, J]
tendrá iguales dimensiones y cada elemento será la suma de las correspondientes matrices A y B. Es decir,
S[I, J] = A[I, J] + B[I, J]
Dado que se trata de matrices de dos dimensiones, el proceso se realizará con dos bucles anidados.
Estructuras de datos I (arrays y estructuras) 275
Pseudocódigo
algoritmo suma_matrices
inicio
desde I ← 1 hasta N hacer
desde J ← 1 hasta M hacer
S[I, J] ← A[I, J] + B[I, J]
fin_desde
fin_desde
fin
7.6. Se dispone de una tabla T de dos dimensiones. Calcular la suma de sus elementos.
Solución
Supongamos las dimensiones de T, M y A y que se compone de números reales.
Tabla de variables
I
J
M
N
T
S
I, J, M, N
T, S
Contador de filas.
Contador de columnas.
Número de filas de la tabla T.
Número de columnas de la tabla T.
Tabla.
Suma de los elementos de la tabla.
Enteros.
Reales.
Pseudocódigo
algoritmo suma_elementos
const
M = 50
N = 20
tipo
array[1..M, 1..N] de real : Tabla
var
entero : I, J
Tabla : T
real : S
inicio
desde I ← 1 hasta M hacer
desde J ← 1 hasta N hacer
leer(T[I, J])
fin_desde
fin_desde
S ← 0 {inicialización de la suma S}
desde I ← 1 hasta M hacer
desde J ← 1 hasta N hacer
S ← S + T[I, J]
fin_desde
fin_desde
escribir('La suma de los elementos de la matriz =', S)
fin
7.7. Realizar la búsqueda de un determinado nombre en una lista de nombres, de modo que el algoritmo imprima los
siguientes mensajes según el resultado:
'Nombre encontrado' si el nombre está en la lista
'Nombre no existe' si el nombre no está en la lista
276 Fundamentos de programación
Solución
Se recurrirá en este ejercicio a utilizar un interruptor SW, de modo que si SW = falso el nombre no existe en la lista y si
SW = verdadero el nombre existe en la lista (o bien caso de no existir la posibilidad de variables lógicas, definir SW como
SW = 0 si es falso y SW = 1 si es verdadero o cierto).
Método 1
algoritmo búsqueda
const
N = 50
tipo
array[1..N] de cadena : Listas
var
Listas : l
lógico : SW
cadena : nombre
entero : I
inicio
SW ← falso
leer(nombre)
desde I ← 1 hasta N hacer
si l[I] = nombre entonces
SW ← verdadero
fin_si
fin_desde
si SW entonces
escribir('Encontrado')
si_no
escribir('No existe', nombre)
fin_si
fin
Método 2
algoritmo búsqueda
const
N = 50
tipo
array[1..N] de cadena : Listas
var
Listas : l
lógico : SW
cadena : nombre
entero : I
inicio
SW ← 0
leer(nombre)
desde I ← 1 hasta N hacer
si l[I] = nombre entonces
SW ← 1
fin_si
fin_desde
si SW = 1 entonces
escribir('Encontrado')
si_no
escribir('No existe', nombre)
fin_si
fin
Estructuras de datos I (arrays y estructuras) 277
7.8. Se desea permutar las filas I y J de una matriz (array) de dos dimensiones (M*N):M filas, N columnas.
Solución
Análisis
La tabla T(M*N) se puede representar por:
T[1, 1] T[1, 2] T[1, 3] ... T[1, N]
T[2, 1] T[2, 2] T[2, 3] ... T[2, N]
.
.
T[M, 1] T[M, 2] T[M, 3] ... T[M, N]
El sistema para permutar globalmente toda la fila I con la fila J se debe realizar permutando uno a uno el contenido de
los elementos T[I, K] y T[J, K].
Para intercambiar entre sí los valores de dos variables, recordemos que se necesitaba una variable auxiliar AUX. Así,
para el caso de las variables A y B
AUX ← A
A ← B
B ← AUX
En el caso de nuestro ejercicio, para intercambiar los valores T[I, K] y T[J, K] se debe utilizar el algoritmo:
AUX ← T[I, K]
T[I, K] ← T[J, K]
T[J, K] ← T[I, K]
Tabla de variables
I, J, K, M, N
AUX
Array
Enteras
Real
Real
Pseudocódigo
algoritmo intercambio
const
M = 50
N = 30
tipo
array[1..M, 1.. N] de entero : Tabla
var
Tabla : T
entero : AUX, I, J, K
inicio
{En este ejercicio y dado que ya se han realizado muchos ejemplos de
lectura de arrays con dos bucles desde, la operación de lectura completa del array se
representará con la instrucción de leerArr(T)}
leerArr(T)
//Deducir I, J a intercambiar
leer(I, J)
desde K ← I hasta N hacer
AUX ← T[I, K]
T[I, K] ← T[J, K]
T[J, K] ← AUX
fin_desde
//Escritura del nuevo array
escribirArr(T)
fin
278 Fundamentos de programación
7.9. Algoritmo que nos permita calcular la desviación estándar (SIGMA) de una lista de N números (N = 15).
Sabiendo que
DESVIACIÓN = √
n
Σ
i = 1
(xi – m)2
n – 1
algoritmo Calcular_desviación
tipo
array[1..15] de real : arr
var
arr : x
entero : n
inicio
llamar_a leer_array(x, n)
escribir('La desviación estándar es ',desviacion(x, n))
fin
procedimiento leer_array(S arr:x S entero:n)
var
entero : i
inicio
repetir
escribir('Diga número de elementos de la lista ')
leer(n)
hasta_que n = 15
escribir('Deme los elementos:')
desde i ← 1 hasta n hacer
leer(x[i])
fin_desde
fin_procedimiento
real función desviacion(E arr : x E entero : n)
var
real : suma, xm, sigma
entero : i
inicio
suma ← 0
desde i ← 1 hasta n hacer
suma ← suma + x[i]
fin_desde
xm ← suma / n
sigma ← 0
desde i ← 1 hasta n hacer
sigma ← sigma + cuadrado (x[i] - xm)
fin_desde
devolver(raiz2 (sigma / (n-1)))
fin_función
7.10. Utilizando arrays, escribir un algoritmo que visualice un cuadrado mágico de orden impar n, comprendido entre 3
y 11. El usuario debe elegir el valor de n.
Un cuadrado mágico se compone de números enteros comprendidos entre 1 y n. La suma de los números que figu-
ran en cada fila, columna y diagonal son iguales.
Ejemplo 8
3
4
1
5
9
6
7
2
Estructuras de datos I (arrays y estructuras) 279
Un método de generación consiste en situar el número 1 en el centro de la primera fila, el número siguiente en la casilla
situada por encima y a la derecha y así sucesivamente. El cuadrado es cíclico, la línea encima de la primera es de hecho
la última y la columna a la derecha de la última es la primera. En el caso de que el número generado caiga en una casilla
ocupada, se elige la casilla que se encuentre debajo del número que acaba de ser situado.
algoritmo Cuadrado_magico
var entero : n
inicio
repetir
escribir('Dame las dimensiones del cuadrado (3 a 11) ')
leer(n)
hasta_que (n mod 2 0) Y (n = 11) Y (n = 3)
dibujarcuadrado(n)
fin
procedimiento dibujarcuadrado(E entero:n)
var array[1..11,1..11] de entero : a
entero : i,j,c
inicio
i ← 2
j ← n div 2
desde c ← 1 hasta n*n hacer
i ← i - 1
j ← j + 1
si j  n entonces
j ← 1
fin_si
si i  1 entonces
i ← n
fin_si
a[i,j] ← c
si c mod n = 0 entonces
j ← j - 1
i ← i + 2
fin_si
fin_desde
desde i ← 1 hasta n hacer
desde j ← 1 hasta n hacer
escribir(a[i,j])
{al codificar esta instrucción en un lenguaje será conveniente utilizar el
parámetro correspondiente de no avance de línea en la salida en pantalla o
impresora}
fin_desde
escribir(NL)
//NL representa Nueva Línea, es decir, avance de línea
fin_desde
fin_procedimiento
7.11. Obtener un algoritmo que efectúe la multiplicación de dos matrices A, B.
A € Mm,p elementos
B € Mp,n elementos
Matriz producto: C € Mm,n elementos, tal que
Ci, j
=
p
Σ
i = 1
ai, k
* bk, j
280 Fundamentos de programación
algoritmo Multiplicar_matrices
tipo array[1..10,1..10] de real : arr
var entero : m, n, p
arr : a ,b, c
inicio
repetir
escribir('Dimensiones de la 1ª matriz (filas columnas)')
leer(m,p)
escribir('Columnas de la 2ª matriz ')
leer(n)
hasta_que (n = 10) Y (m = 10) Y (p = 10)
escribir ('Deme elementos de la 1ª matriz')
llamar_a leer_matriz(a,m,p)
escribir ('Deme elementos de la 2ª matriz')
llamar_a leer_matriz(b,p,n)
llamar_a calcescrproducto(a, b, c, m, p, n)
fin
procedimiento leer_matriz(S arr:matriz;E entero:filas,columnas)
var entero : i, j
inicio
desde i ← 1 hasta filas hacer
escribir('Fila ',i,':')
desde j ← 1 hasta columnas hacer
leer(matriz[i,j])
fin_desde
fin_desde
fin_procedimiento
procedimiento calcescrproducto(E arr: a, b, c; E entero: m,p,n)
var entero : i, j, k
inicio
desde i ← 1 hasta m hacer
desde j ← 1 hasta n hacer
c[i,j] ← 0
desde k ← 1 hasta p hacer
c[i,j] ← c[i,j] + a[i,k] * b[k,j]
fin_desde
escribir (c[i,j]) //no avanzar línea
fin_desde
escribir ( NL ) //avanzar línea, nueva línea
Fin_desde
Fin_procedimiento
7.12. Algoritmo que triangule una matriz cuadrada y halle su determinante. En las matrices cuadradas el valor del de-
terminante coincide con el producto de los elementos de la diagonal de la matriz triangulada, multiplicado por –1
tantas veces como hayamos intercambiado filas al triangular la matriz.
Proceso de triangulación de una matriz para todo i desde 1 hasta n – 1 hacer:
a) Si el elemento de lugar (i,i) es nulo, intercambiar filas hasta que dicho elemento sea no nulo o agotar los
posibles intercambios.
b) A continuación se busca el primer elemento no nulo de la fila i-ésima y, en el caso de existir, se usa para
hacer ceros en la columna de abajo.
Estructuras de datos I (arrays y estructuras) 281
Sea dicho elemento matriz[i,r]
Multiplicar fila i por matriz[i+1,r]/matriz[i,r] y restarlo a la i+1
Multiplicar fila i por matriz[i+2,r]/matriz[i,r] y restarlo a la i+2
............................................................................................................
Multiplicar fila i por matriz[m,r]/matriz[i,r] y restarlo a la m
algoritmo Triangulacion_matriz
Const m = expresion
n = expresion
tipo array[1..m, 1..n] de real : arr
var arr : matriz
real : dt
inicio
llamar_a leer_matriz(matriz)
llamar_a triangula(matriz, dt)
escribir('Determinante= ', dt)
fin
procedimiento leer_matriz (S arr : matriz)
var entero: i,j
inicio
escribir('Deme los valores para la matriz')
desde i ← 1 hasta m hacer
desde j ← 1 hasta n hacer
leer( matriz[i, j])
fin_desde
fin_desde
fin_procedimiento
procedimiento escribir_matriz (E arr : matriz)
var entero : i, j
caracter : c
inicio
escribir('Matriz triangulada')
desde i ← 1 hasta m hacer
desde j ← 1 hasta n hacer
escribir( matriz[i, j]) //no avanzar línea
fin_desde
escribir(NL) //avanzar línea, nueva línea
fin_desde
escribir('Pulse tecla para continuar')
leer(c)
fin_procedimiento
procedimiento interc(E/S real: a,b)
var real : auxi
inicio
auxi ← a
a ← b
b ← auxi
fin_procedimiento
procedimiento triangula (E arr : matriz; S real dt)
var entero: signo
entero: t, r, i, j
real : cs
282 Fundamentos de programación
inicio
signo ← 1
desde i ← 1 hasta m - 1 hacer
t ← 1
si matriz[i, i] = 0 entonces
repetir
si matriz[i + t, i]  0 entonces
signo ← signo * (-1)
desde j ← 1 hasta n hacer
llamar_a interc(matriz[i,j],matriz[i + t,j])
fin_desde
llamar_a escribir_matriz(matriz)
fin_si
t ← t + 1
hasta_que (matriz[i, i]  0) O (t = m - i + 1)
fin_si
r ← i - 1
repetir
r ← r + 1
hasta_que (matriz[i, r]  0) O (r = n)
si matriz[i, r]  0 entonces
desde t ← i + 1 hasta m hacer
si matriz[t, r]  0 entonces
cs ← matriz[t, r]
desde j ← r hasta n hacer
matriz[t, j] ← matriz[t, j] - matriz[i, j] * (cs / matriz[i, r])
fin_desde
llamar_a escribir_matriz(matriz)
fin_si
fin_desde
fin_si
fin_desde
dt ← signo
desde i ← 1 hasta m hacer
dt ← dt * matriz[i, i]
fin_desde
fin_procedimiento
CONCEPTOS CLAVE
• Array bidimensional.
• Array de una dimensión.
• Array multidimensional.
• Arrays como parámetros.
• Arreglo.
• Datos estructurados.
• Estructura.
• Índice.
• Lista.
• Longitud de un array.
• Subíndice.
• Tabla.
• Tamaño de un array.
• Variable indexada.
• Vector.
Un array (vector, lista o tabla) es una estructura de datos que
almacena un conjunto de valores, todos del mismo tipo de
datos. Un array de una dimensión, también conocido como
array unidimensional o vector, es una lista de elementos del
mismo tipo de datos que se almacenan utilizando un único
nombre. En esencia, un array es una colección de variables
RESUMEN
Estructuras de datos I (arrays y estructuras) 283
que se almacenan en orden en posiciones consecutivas en la
memoria de la computadora. Dependiendo del lenguaje de
programación el índice del array comienza en 0 (lenguaje C)
o bien en 1 (lenguaje FORTRAN); este elemento se alma-
cena en la posición con la dirección más baja.
1. Un array unidimensional (vector o lista) es una
estructura de datos que se puede utilizar para al-
macenar una lista de valores del mismo tipo de
datos. Tales arrays se pueden declarar dando el
tipo de datos de los valores que se van a almacenar
y el tamaño del array. Por ejemplo, en C/C++ la
declaración
int num[100]
crea un array de 100 elementos, el primer elemento
es num[0] y el último elemento es num[99].
2. Los elementos del array se almacenan en posiciones
contiguas en memoria y se referencian utilizando
el nombre del array y un subíndice; por ejemplo,
num[25]. Cualquier expresión de valor entero no
negativo se puede utilizar como subíndice y el subín-
dice 0 (en el caso de C) o 1 (caso de FORTRAN)
siempre se refieren al primer elemento del array.
3. Se utilizan arrays para almacenar grandes coleccio-
nes de datos del mismo tipo. Esencialmente en los
casos siguientes:
• Cuando los elementos individuales de datos se
deben utilizar en un orden aleatorio, como es el
caso de los elementos de una lista o los datos de
una tabla.
• Cuando cada elemento representa una parte de
un dato compuesto, tal como un vector, que se
utilizará repetidamente en los cálculos.
• Cuando los datos se deben procesar en fases in-
dependientes, como puede ser el cálculo de una
media aritmética o varianza.
4. Un array de dos dimensiones (tabla) se declara
listando el tamaño de las filas y de las columnas
junto con el nombre del array y el tipo de datos que
contiene. Por ejemplo, las declaraciones en C de
int tabla1[5][10]
crean un array bidimensional de cinco filas y 10
columnas de tipo entero.
5. Arrays paralelos. Una tabla multicolumna se puede
representar como un conjunto de arrays paralelos,
un array por columna, de modo que todos tengan
la misma longitud y se accede utilizando la misma
variable de subíndice.
6. Los arrays pueden ser, de modo completo o por
elementos, pasados como parámetros a funciones
y a su vez ser argumentos de funciones.
7. La longitud de un array se fija en su declaración y
no puede ser modificada sin una nueva declaración.
Esta característica los hace a veces poco adecuados
para aplicaciones que requieren de tamaños o lon-
gitudes variables.
7.1. Determinar los valores de I, J, después de la ejecución
de las instrucciones siguientes:
var
entero : I, J
array[1..10] de entero : A
inicio
I ← 1
J ← 2
A[I] ← J
A[J] ← I
A[J+I] ← I + J
I ← A[I] + A[J]
A[3] ← 5
J ← A[I] - A[J]
fin
7.2. Escribir el algoritmo que permita obtener el número
de elementos positivos de una tabla.
7.3. Rellenar una matriz identidad de 4 por 4.
7.4. Leer una matriz de 3 por 3 elementos y calcular la
suma de cada una de sus filas y columnas, dejando
dichos resultados en dos vectores, uno de la suma de
las filas y otro de las columnas.
7.5. Cálculo de la suma de todos los elementos de un vec-
tor, así como la media aritmética.
7.6. Calcular el número de elementos negativos, cero y
positivos de un vector dado de sesenta elementos.
7.7. Calcular la suma de los elementos de la diagonal prin-
cipal de una matriz cuatro por cuatro (4 × 4).
7.8. Se dispone de una tabla T de cincuenta números reales
distintos de cero. Crear una nueva tabla en la que todos
sus elementos resulten de dividir los elementos de la
tabla T por el elemento T[K], siendo K un valor dado.
7.9. Se dispone de una lista (vector) de N elementos. Se
desea diseñar un algoritmo que permita insertar el
valor x en el lugar k-ésimo de la mencionada lista.
EJERCICIOS
284 Fundamentos de programación
7.10. Se desea realizar un algoritmo que permita controlar
las reservas de plazas de un vuelo MADRID-CARA-
CAS, de acuerdo con las siguientes normas de la
compañía aérea:
Número de plazas del avión: 300.
Plazas numeradas de 1 a 100: fumadores.
Plazas numeradas de 101 a 300: no fumadores.
Se debe realizar la reserva a petición del pasaje-
ro y cerrar la reserva cuando no haya plazas libres o
el avión esté próximo a despegar. Como ampliación
de este algoritmo, considere la opción de anulacio-
nes imprevistas de reservas.
7.11. Cada alumno de una clase de licenciatura en Cien-
cias de la Computación tiene notas correspondientes
a ocho asignaturas diferentes, pudiendo no tener
calificación en alguna asignatura. A cada asignatura
le corresponde un determinado coeficiente. Escribir
un algoritmo que permita calcular la media de cada
alumno.
Modificar el algoritmo para obtener las siguien-
tes medias:
• general de la clase
• de la clase en cada asignatura
• porcenaje de faltas (no presentado a examen)
7.12. Escribir un algoritmo que permita calcular el cuadra-
do de los 100 primeros números enteros y a conti-
nuación escribir una tabla que contenga dichos cua-
drados.
7.13. Se dispone de N temperaturas almacenadas en un
array. Se desea calcular su media y obtener el núme-
ro de temperaturas mayores o iguales que la media.
7.14. Calcular la suma de todos los elementos de un vector
de dimensión 100, así como su media aritmética.
7.15. Diseñar un algoritmo que calcule el mayor valor de
una lista L de N elementos.
7.16. Dada una lista L de N elementos, diseñar un algorit-
mo que calcule de forma independiente la suma de
los números pares y la suma de los números impares.
7.17. Escribir el algoritmo que permita escribir el conte-
nido de una tabla de dos dimensiones (3 × 4).
7.18. Leer una matriz de 3 × 3.
7.19. Escribir un algoritmo que permita sumar el número
de elementos positivos y el de negativos de una tabla
T de n filas y m columnas.
7.20. Se dispone de las notas de cuarenta alumnos. Cada
uno de ellos puede tener una o varias notas. Escribir
un algoritmo que permita obtener la media de cada
alumno y la media de la clase a partir de la entrada
de las notas desde el terminal.
7.21. Una empresa tiene diez almacenes y necesita crear
un algoritmo que lea las ventas mensuales de los diez
almacenes, calcular la media de ventas y obtener un
listado de los almacenes cuyas ventas mensuales son
superiores a la media.
7.22. Se dispone de una lista de cien números enteros. Cal-
cular su valor máximo y el orden que ocupa en la tabla.
7.23. Un avión dispone de ciento ochenta plazas, de las
cuales sesenta son de “no fumador” y numeradas de
1 a 60 y ciento veinte plazas numeradas de 61 a 180
de “fumador”. Diseñar un algoritmo que permita ha-
cer la reserva de plazas del avión y se detenga media
hora antes de la salida del avión, en cuyo momento
se abrirá la lista de espera.
7.24. Calcular las medias de las estaturas de una clase.
Deducir cuántos son más altos que la media y cuán-
tos más bajos que dicha media.
7.25. Las notas de un colegio se tienen en una matriz de
30 × 5 elementos (30, número de alumnos; 5, número
de asignaturas). Se desea listar las notas de cada alum-
no y su media. Cada alumno tiene como mínimo dos
asignaturas y máximo cinco, aunque los alumnos no
necesariamente todos tienen que tener cinco materias.
7.26. Dado el nombre de una serie de estudiantes y las
calificaciones obtenidas en un examen, calcular e
imprimir la calificación media, así como cada cali-
ficación y la diferencia con la media.
7.27. Se introducen una serie de valores numéricos desde
el teclado, siendo el valor final de entrada de datos
o centinela –99. Se desea calcular e imprimir el nú-
mero de valores leídos, la suma y media de los va-
lores y una tabla que muestre cada valor leído y sus
desviaciones de la media.
7.28. Se dispone de una lista de N nombres de alumnos.
Escribir un algoritmo que solicite el nombre de un
alumno y busque en la lista (array) si el nombre está
en la lista.
CAPÍTULO 8
Las cadenas de caracteres
8.1. Introducción
8.2. El juego de caracteres
8.3. Cadena de caracteres
8.4. Datos tipo carácter
8.5. Operaciones con cadenas
8.6. Otras funciones de cadenas
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
CONCEPTOS CLAVE
RESUMEN
EJERCICIOS
Las computadoras normalmente sugieren operaciones
aritméticas ejecutadas sobre datos numéricos. Sin em-
bargo, ese concepto no es estadísticamente cierto, sino
que, al contrario, hoy día es cada vez más frecuente el
uso de las computadoras para procesar problemas de
tipo esencialmente alfanuméricos o de tipo texto. En
el Capítulo 3 se estudió el concepto de tipo de datos
carácter (char) y se definió un carácter como un sím-
bolo del juego de caracteres de la computadora. Una
constante carácter se definió como cualquier carácter
encerrado entre separadores (apóstrofos o dobles co-
millas). Una secuencia finita de caracteres se denomina
normalmente una cadena (string), y una constante
tipo cadena consiste en una cadena encerrada entre
apóstrofos o dobles comillas. El procesamiento de ca-
denas es el objetivo fundamental de este capítulo.
INTRODUCCIÓN
286 Fundamentos de programación
8.1. INTRODUCCIÓN
Las computadoras nacieron para resolver problemas numéricos en cálculos científicos y matemáticos. Sin embargo,
el paso de los años ha cambiado las aplicaciones y hoy día las computadoras no sólo se utilizan en cálculos numéri-
cos, sino también para procesar datos de caracteres. En aplicaciones de gestión, la generación y actualización de
listas de dirección, inventarios, etc., la información alfabética es fundamental. La edición de textos, traductores de
lenguajes y base de datos son otras aplicaciones donde las cadenas de caracteres tienen gran utilidad.
En este capítulo se tratará el concepto de cadena de caracteres y su procesamiento, utilizando para ello una no-
tación algorítmica similar a la utilizada hasta ahora. Una cadena de caracteres es una secuencia de cero o más sím-
bolos, que incluyen letras del alfabeto, dígitos y caracteres especiales.
8.2. EL JUEGO DE CARACTERES
Los lenguajes de programación utilizan juegos de caracteres “alfabeto” para comunicarse con las computadoras. Las
primeras computadoras sólo utilizaban informaciones numéricas digitales mediante el código o alfabeto digital, y los
primeros programas se escribieron en ese tipo de código, denominado código máquina —basado en dos dígitos, 0
y 1—, por ser inteligible directamente por la máquina (computadora). La enojosa tarea de programar en código má-
quina hizo que el alfabeto evolucionase y los lenguajes de programación comenzaran a utilizar códigos o juegos de
caracteres similares al utilizado en los lenguajes humanos. Así, hoy día la mayoría de las computadoras trabajan con
diferentes tipos de juegos de caracteres de los que se destacan el código ASCII y el EBCDIC.
De este modo, una computadora a través de los diferentes lenguajes de programación utiliza un juego o código
de caracteres que serán fácilmente interpretados por la computadora y que pueden ser programados por el usuario.
Tres son los códigos más utilizados actualmente en computadoras, ASCII (American Standard Code for Information
Interchange), EBCDIC (Extended Binary Coded Decimal Interchange Code) y Unicode.
El código ASCII básico utiliza 7 bits (dígitos binarios, 0, 1) para cada carácter a representar, lo que supone un
total de 27
(128) caracteres distintos. El código ASCII ampliado utiliza 8 bits y, en ese caso, consta de 256 caracteres.
Este código ASCII ha adquirido una gran popularidad, ya que es el estándar en todas las familias de computadoras
personales.
El código EBCDIC utiliza 8 bits por carácter y, por consiguiente, consta de 256 caracteres distintos. Su notorie-
dad reside en ser el utilizado por la firma IBM (sin embargo, en las computadoras personales PC, XT, AT y PS/2
IBM ha seguido el código ASCII).
El código universal Unicode para aplicación en Internet y en gran número de alfabetos internacionales.
En general, un carácter ocupará un byte de almacenamiento de memoria.
8.2.1. Código ASCII
El código ASCII se compone de los siguientes tipos de caracteres:
• Alfabéticos (a, b, ..., z/A, B, ..., Z).
• Numéricos (0, 1, 2, 3, ..., 8, 9).
• Especiales (+, –, *, /, {, }, , , etc.).
• De control son caracteres no imprimibles y que realizan una serie de funciones relacionadas con la escritura,
transmisión de datos, separador de archivos, etc., en realidad con los dispositivos de entrada/salida. Destacamos
entre ellos:
DEL eliminar o borrar
STX inicio de texto
LF avance de línea
FF avance de página
CR retorno de carro
Los caracteres del 128 al 255, pertenecientes en exclusiva al código ASCII ampliado, no suelen ser estándar y
normalmente cada fabricante los utiliza para situar en ellos caracteres específicos de su máquina o de otros alfabetos,
caracteres gráficos, etc. En la Figura 8.2 se muestra el código ASCII de la familia de computadoras IBM PC y com-
patibles, donde se puede apreciar tanto el ASCII básico estándar como el ampliado.
Las cadenas de caracteres 287
8.2.2. Código EBCDIC
Este código es muy similar al ASCII, incluyendo también, además de los caracteres alfanuméricos y especiales, ca-
racteres de control. Es propio de computadoras de IBM, con la excepción de los modelos PC, XT, AT y PS/2.
8.2.3. Código universal Unicode para Internet
Aunque ASCII es un código ampliamente utilizado para textos en inglés, es muy limitado, ya que un código de un
byte sólo puede representar 256 caracteres diferentes (28
= 256). El lenguaje Java comenzó a utilizar la representación
internacional Unicode más moderna y más amplia en juego de caracteres, ya que es un código de dos bytes (16 bits),
que permiten hasta 65.536 caracteres diferentes (216
= 65.536).
El código estándar Unicode es un estándar internacional que define la representación de caracteres de una amplia
gama de alfabetos. Tradicionalmente, como ya se ha comentado, los lenguajes de programación utilizaban el código
ASCII cuyo juego de caracteres era 127 (o 256 para el código ASCII ampliado) que se almacenaban en 7 (o en 8)
bits y que básicamente incluían aquellos caracteres que aparecían en el teclado estándar (QWERTY). Para los pro-
gramadores que escriben en inglés estos caracteres son más o menos suficientes. Sin embargo, la aparición de Java
y posteriormente C# como lenguajes universales requieren que éstos puedan ser utilizados en lenguajes internacio-
nales, como español, alemán, francés, chino, etc. Esta característica requiere de más de 256 caracteres diferentes. La
representación Unicode que admite hasta 65.536 resuelve estos problemas.
Valor ASCII Carácter Valor ASCII Carácter Valor ASCII Carácter Valor ASCII Carácter
000
001
002
003
004
005
006
007
008
009
010
011
012
013
014
015
016
017
018
019
020
021
022
023
024
025
026
027
028
029
030
031
NUL
SOH
STX
ETX
EOT
ENQ
ACK
BEL
BS
HT
LF
VT
FF
CR
SO
SI
DLE
DC1
DC2
DC3
DC4
NAK
SYN
ETB
CAN
EM
SUB
ESC
FS
GS
RS
US
032
033
034
035
036
037
038
039
040
041
042
043
044
045
046
047
048
049
050
051
052
053
054
055
056
057
058
059
060
061
062
063
espacio
!

#
$
%

'
(
)
*
+
,
-
.
/
0
1
2
3
4
5
6
7
8
9
:
;

=

?
064
065
066
067
068
069
070
071
072
073
074
075
076
077
078
079
080
081
082
083
084
085
086
087
088
089
090
091
092
093
094
095
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
[

]
↑
_
096
097
098
099
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
'
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
DEL
NOTA: Los 32 primeros caracteres y el último son caracteres de control; no son imprimibles.
Figura 8.1. Código ASCII básico.
288 Fundamentos de programación
D C D C D C D C D C D C D C D C
0
1
2
3
4
5
6
7
10
11
12
13
14
15
16
17
18
19
20
NUL
SOH
STX
ETX
PF
HT
LC
DEL
SMM
VT
FF
CR
SO
SI
DLE
DC1
DC2
DC3
RES
21
22
23
24
25
26
27
28
29
30
31
32
33
34
36
37
38
39
40
NL
BS
IL
CAN
EM
CC
CU1
IFS
IGS
IRS
IUS
DS
SOS
FS
BYP
LF
ETB
ESC
SM
43
45
46
47
50
52
53
54
55
59
60
61
63
64
74
75
76
77
78
CU2
ENQ
ACK
BEL
SYN
PN
RS
UC
EOT
CU3
DC4
NAK
SUB
SP
c
.

(
+
79
80
90
91
92
93
94
95
96
97
106
107
108
109
110
111
121
122
123
,

!
$
*
)
;
¬
–
/
ñ
,
%
_

?
`
:
#
124
125
126
127
129
130
131
132
133
134
135
136
137
139
145
146
147
148
149
@
´
=

a
b
c
d
e
f
g
h
i
{
j
k
l
m
n
150
151
152
153
155
161
162
163
164
165
166
167
168
169
173
189
192
193
194
o
p
q
r
}
~
s
t
u
v
w
x
y
z
[
]
{
A
B
195
196
197
198
199
200
201
208
209
210
211
212
213
214
215
216
217
224
226
C
D
E
F
G
H
I
}
J
K
L
M
N
O
P
Q
R

S
227
228
229
230
231
232
233
240
241
242
243
244
245
246
247
248
249
250
T
U
V
W
X
Y
Z
0
1
2
3
4
5
6
7
8
9
|
D: Código decimal.
P: Escritura del carácter correspondiente al código en la pantalla.
Figura 8.3. Código EBCDIC.
D P D P D P D P D P D P D P D P
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
J
♥
♦
♣
♠
•
8
○
■
;

=

?
@
A
↕
!!
¶
§
i
↕
↑
↓
→
←
I
↔
▲
▼
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
!

#
$
%

´
(
)
*
+
,
-
.
/
0
1
2
3
4
5
6
7
8
9
:
;

=

?
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
[

]
^
_
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
K
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
Ç
ü
é
â
ä
à
å
ç
ê
ë
è
ï
î
ì
Ä
Å
É
æ
Æ
ô
ö
ò
û
ù
Ÿ
Ô
Ü
¢
£
¥
Pt
f
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
á
í
ó
ú
ñ
Ñ
ª
º
¿
h
W
L
M
¡
«
»
´
´
|
R
}
~
¡
¢
S
T
U
V
£
¤
W
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
X
Y
Z
[
z
]
¥
^
_
`
a
b
|
d
§
¨
©
ª
«
¬
−
®
¯
°
g
h
´
u
μ
μ
u
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
α
β
Γ
π
Σ
σ
μ
γ
φ
θ
Ω
δ
ὸ
∅
∈
∩
≡
±
≥
≤
∫
∫
÷
≈
°
•
∙
√
n
2
´
D: Código decimal.
P: Escritura del carácter correspondiente al código en la pantalla.
Figura 8.2. Código ASCII de la computadora IBM PC.
Las cadenas de caracteres 289
En consecuencia, los identificadores en Java y C# deben comenzar con una letra Java o C#, que es cualquier ca-
rácter Unicode que no represente un dígito o un carácter de puntuación.
Las letras en inglés, así como los dígitos decimales y los signos de puntuación en inglés, se asignan a los códigos
que son los mismos que en el código ASCII. Puede consultar los caracteres Unicode en el sitio Web oficial del con-
sorcio Unicode:
http://www.unicode.org
8.2.4. Secuencias de escape
Una secuencia de escape es un medio de representar caracteres que no se pueden escribir desde el teclado y,
por consiguiente, utilizarlos directamente en un editor. Una secuencia de escape consta de dos partes: el carácter
escape y un valor de traducción. El carácter escape es un símbolo que indica al compilador Java o C (por ejemplo)
que ha de traducir el siguiente carácter de un modo especial. En Java, como en lenguaje C, este carácter de escape
especial es la barra inclinada inversa ().
Si la barra inclinada marca el principio de una secuencia de escape, ¿qué se puede utilizar para el valor de la
traducción? La parte de la secuencia de escape que sigue al carácter escape y, tal vez, el valor de traducción más
fácil para utilizar es un código de carácter Unicode. Los valores Unicode deben estar especificados como un número
hexadecimal de cuatro dígitos precedido por una letra u. Los literales de caracteres Java o C# se deben encerrar en-
tre comillas simples
Sintaxis 'uxxxx'
Ejemplos 'u0344' 'u2122'
En programas escritos en cualquier lenguaje (en particular en Java o en C#) se pueden utilizar las secuencias de
escape Unicode en cualquier parte donde algún tipo de carácter pueda aparecer: en literales “carácter”, en literales
“cadenas” o incluso en identificadores.
Todos los lenguajes de programación (C, C++, Java, etc.) permiten especificar el carácter de escape para especi-
ficar otros tipos de caracteres especiales. Estos caracteres incluyen algunos de los “caracteres invisibles” que se han
utilizado tradicionalmente para controlar operaciones de computadora (a veces se les conoce también como “carac-
teres de control”) así como simples comillas, dobles comillas y el propio carácter de escape. Así, para escribir una
comilla simple como un literal carácter, se escribe '. La Tabla 8.1 proporciona las secuencias de escape que el len-
guaje Java reconoce.
Tabla 8.1. Secuencias de escape en Java
Secuencia Significado
b Retroceso (u0008)
t Tabulación (U0009)
n Nueva línea (u000A)
f Avance de página (u000C)
r Retorno de carro (u000D)
 Dobles comillas (u0022)
' Comillas simples (u0027)
 Barra inclinada inversa (u005C)
ddd Cualquier carácter especificado por dígitos octales ddd
8.3. CADENA DE CARACTERES
Una cadena (string) de caracteres es un conjunto de caracteres —incluido el blanco— que se almacenan en un área
contigua de la memoria. Pueden ser entradas o salidas a/desde un terminal.
290 Fundamentos de programación
La longitud de una cadena es el número de caracteres que contiene. La cadena que no contiene ningún carácter
se le denomina cadena vacía o nula, y su longitud es cero; no se debe confundir con una cadena compuesta sólo de
blancos —espacios en blanco—, ya que ésta tendrá como longitud el número de blancos de la misma.
La representación de las cadenas suele ser con comillas simples o dobles. En nuestro libro utilizaremos las co-
millas simples por ser esa notación la más antigua utilizada en diversos lenguajes como Pascal, FORTRAN, etc.,
aunque hoy día los lenguajes modernos, tales como C, C++, Java y C#, utilizan las dobles comillas.
Notaciones de cadenas
Pascal, FORTRAN, UPSAM 'Cartagena de Indias'
C, C++, Java, C# Cartagena de Indias
EJEMPLO 8.1
'12 de octubre de 1492'
'Por fin llegaste'
' '
'AMERICA ES GRANDE'
Las cadenas pueden contener cualquier carácter válido del código aceptado por el lenguaje y la computadora; el
blanco es uno de los caracteres más utilizado; si se le quiere representar de modo especial en la escritura en papel,
se emplea alguno de los siguientes símbolos:
_ b □ ∪
Por nuestra parte utilizaremos _, dejando libertad al lector para usar el que mejor convenga a su estilo de progra-
mación. Las cadenas anteriores tienen longitudes respectivas de 21, 16, 3 y 17.
Una subcadena es una cadena de caracteres que ha sido extraída de otra de mayor longitud.
'12 de' es una subcadena de '12 de octubre'
'Java' es una subcadena de 'lenguaje Java'
'CHE' es una subcadena de 'CARCHELEJO'
Reglas de sintaxis en lenguajes de programación
C++ …. Una cadena es un array de caracteres terminado con el carácter nulo, cuya representación es la se-
cuencia de escape '0' y su nombre es NULL (nulo).
C# …. Las cadenas son objetos del tipo incorporado String. En realidad, String es una clase que proporcio-
na funcionalidades de manipulación de cadenas y en particular construcción de cadenas.
Java… Las cadenas son objetos del tipo String. String es una clase en Java y una vez que los objetos
cadena se crean, el contenido no se puede modificar, aunque pueden ser construidas todas las cade-
nas que se deseen.
EJEMPLO 8.2
Cadena 'Carchelejo' representada en lenguaje C++
C A R C H E L E J O 0
Las cadenas de caracteres 291
8.4. DATOS TIPO CARÁCTER
En el Capítulo 3 se analizaron los diferentes tipos de datos y entre ellos existía el dato tipo carácter (char) que se
incorpora en diferentes lenguajes de programación, bien con este nombre o bien como datos tipo cadena. Así pues,
en esta sección trataremos las constantes y las variables tipo carácter o cadena.
8.4.1. Constantes
Una constante tipo carácter es un carácter encerrado entre comillas y una constante de tipo cadena es un conjunto de
caracteres válidos encerrados entre comillas —apóstrofos— para evitar confundirlos con nombres de variables, ope-
radores, enteros, etc. Si se desea escribir un carácter comilla, se debe escribir duplicado. Como se ha comentado
anteriormente, existen lenguajes —BASIC, C, C++, Java, etc., por ejemplo— que encierran las cadenas entre dobles
comillas. Nuestros algoritmos sólo tendrán una, por seguir razones históricas y por compatibilidad con versiones
anteriores del lenguaje UP SAM.
'Carchelejo es un pueblo de Jaen'
es una constante de tipo cadena, de una longitud fija igual a 31.
'¿'
es una constante de tipo carácter.
8.4.2. Variables
Una variable de cadena o tipo carácter es una variable cuyo valor es una cadena de caracteres.
Las variables de tipo carácter o cadena se deben declarar en el algoritmo y según el lenguaje tendrán una notación
u otra. Nosotros, al igual que muchos lenguajes, las declararemos en la tabla o bloque de declaración de variables.
var
caracter : A, B
cadena : NOMBRE, DIRECCION
Atendiendo a la declaración de la longitud, las variables se dividen en estáticas, semiestáticas y dinámicas.
Variables estáticas son aquellas en las que su longitud se define antes de ejecutar el programa y ésta no puede
cambiarse a lo largo de éste.
FORTRAN: CHARACTER A1 * 10, A2 * 15
las variables A1 y A2 se declaran con longitudes 10 y 15, respectivamente.
Pascal: var NOMBRE: PACKED ARRAY [1..30] OF CHAR
Turbo Pascal: var NOMBRE: array[1..30] of char o bien
var NOMBRE:STRING[30]
En Pascal, una variable de tipo carácter —char— sólo puede almacenar un carácter y, por consiguiente, una
cadena de caracteres debe representarse mediante un array de caracteres. En el ejemplo, NOMBRE se declara como
una cadena de 30 caracteres (en este caso, NOMBRE[1] será el primer carácter de la cadena, NOMBRE[2] será el se-
gundo carácter de la cadena, etc.).
Turbo Pascal admite también tratamiento de cadenas semiestáticas (STRING) como dato.
Variables semiestáticas son aquellas cuya longitud puede variar durante la ejecución del programa, pero sin so-
brepasar un límite máximo declarado al principio.
Variables dinámicas son aquellas cuya longitud puede variar sin limitación dentro del programa. El lenguaje
SNOBOL es típico de variables dinámicas.
292 Fundamentos de programación
La representación de las diferentes variables de cadena en memoria utiliza un método de almacenamiento dife-
rente.
Cadenas de longitud fija
Se consideran vectores de la longitud declarada, con blancos a izquierda o derecha si la cadena no tiene la longitud
declarada. Así, la cadena siguiente
E S T A C A S A E S U N A R U I N A
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
se declaró con una dimensión de 24 caracteres y los dos últimos se rellenan con blancos.
Cadenas de longitud variable con un máximo
Se considera un puntero (en el Capítulo 12 ampliaremos este concepto) con dos campos que contienen la longitud
máxima y la longitud actual.
Longitud
máxima Longitud actual
20 17 E S T A C A S A E S G U A Y
Cadenas de longitud indefinida
Se representan mediante listas enlazadas, que son listas que se unen mediante puntero
longitud actual
6 M A D O N A
Estas listas contienen elementos con caracteres empaquetados —2/elemento— y enlazados cada uno con el si-
guiente por un puntero (la cadena de caracteres es 'MADONA').
8.4.3. Instrucciones básicas con cadenas
Las instrucciones básicas: asignar y entrada/salida (leer/escribir) se realizan de un modo similar al tratamiento de
dichas instrucciones con datos numéricos.
Asignación
Si la variable NOMBRE se ha declarado como tipo cadena
var cadena : NOMBRE
la instrucción de asignación debe contener en el lado derecho de la asignación una constante tipo cadena o bien otra
variable del mismo tipo. Así,
NOMBRE ←'Luis Hermenegildo'
significa que la variable NOMBRE toma por valor la cadena 'Luis Hermenegildo'.
Las cadenas de caracteres 293
Entrada/Salida
La entrada/salida desde un terminal se puede realizar en modo carácter; para ello bastará asignar —a través del co-
rrespondiente dispositivo— una cadena de caracteres a una variable tipo cadena. Así, por ejemplo, si A, B, C y D se
han declarado como variables tipo cadena
var cadena : A, B, C, D
las instrucciones
leer(A, B)
escribir(C, D)
asignarán a A y B las cadenas introducidas por el teclado y visualizarán o imprimirán en el dispositivo de salida las
cadenas que representan las variables C y D.
8.5. OPERACIONES CON CADENAS
El tratamiento de cadenas es un tema importante, debido esencialmente a la gran cantidad de información que se
almacena en ellas. Según el tipo de lenguaje de programación elegido se tendrá mayor o menor facilidad para la
realización de operaciones. Así, por ejemplo, C tiene grandes posibilidades, FORTRAN sólo operaciones elementa-
les y Pascal, dependiendo del compilador, soporta procedimientos y funciones predefinidas o es preciso definirlos
por el usuario con la natural complejidad que suponga el diseño del algoritmo correspondiente. Todos los lenguajes
orientados a objetos como C++, C# y Java, merced a la clase String soportan una gran gama de funciones de mani-
pulación de cadenas. En cualquier caso, las operaciones con cadena más usuales son:
• Cálculo de la longitud.
• Comparación.
• Concatenación.
• Extracción de subcadenas.
• Búsqueda de información.
8.5.1. Cálculo de la longitud de una cadena
La longitud de una cadena, como ya se ha comentado, es el número de caracteres de la cadena. Así,
'Don Quijote de la Mancha'
tiene veinticuatro caracteres.
La operación de determinación de la longitud de una cadena se representará por la función longitud, cuyo for-
mato es:
longitud (cadena)
La función longitud tiene como argumento una cadena, pero su resultado es un valor numérico entero:
longitud('Don Quijote de la Mancha')
longitud('□□□')
longitud('□□□Mortadelo')
proporciona 24
cadena de tres blancos proporciona 3
cadena 'Mortadelo' rellenada de blancos a la izquierda
para tener longitud 12
En consecuencia, la función longitud se puede considerar un dato tipo entero y, por consiguiente, puede ser un
operando dentro de expresiones aritméticas.
4 + 5 + longitud('DEMO') = 4+5+4 = 13
294 Fundamentos de programación
8.5.2. Comparación
La comparación de cadenas (igualdad y desigualdad) es una operación muy importante, sobre todo en la clasificación
de datos tipo carácter que se utiliza con mucha frecuencia en aplicaciones de proceso de datos (clasificaciones de
listas, tratamiento de textos, etc.).
Los criterios de comparación se basan en el orden numérico del código o juego de caracteres que admite la com-
putadora o el propio lenguaje de programación. En nuestro lenguaje algorítmico utilizaremos el código ASCII como
código numérico de referencia. Así,
• El carácter 'A' será  el carácter 'C'
(código 65) (código 67)
• El carácter '8' será  el carácter 'i'
(código 56) (código 105)
En la comparación de cadenas se pueden considerar dos operaciones más elementales: igualdad y desigualdad.
Igualdad
Dos cadenas a y b de longitudes m y n son iguales si:
• El número de caracteres de a y b son los mismos (m = n).
• Cada carácter de a es igual a su correspondiente de b si a = a1a2...an y b = b1b2...bn se debe verificar que ai = bi
para todo i en el rango 1 = i = n.
Así: 'EMILIO' = 'EMILIO' es una expresión verdadera
'EMILIO' = 'EMILIA' es una expresión falsa
'EMILIO' = 'EMILIO ' es una expresión falsa; contiene un blanco final y, por consiguiente, las
longitudes no son iguales.
Desigualdad
Los criterios para comprobar la desigualdad de cadena son utilizados por los operadores de relación , =, =,  
y se ajustan a una comparación sucesiva de caracteres correspondientes en ambas cadenas hasta conseguir dos carac-
teres diferentes. De este modo, se pueden conseguir clasificaciones alfanuméricas
'GARCIA'  'GOMEZ'
ya que las comparaciones sucesivas de caracteres es:
G-A-R-C-I-A G = G, A  O, ...
G-O-M-E-Z
una vez que se encuentra una desigualdad, no es preciso continuar; como se observa, las cadenas no tienen por qué
tener la misma longitud para ser comparadas.
EJEMPLO 8.3
En las sucesivas comparaciones se puede apreciar una amplia gama de posibles casos.
'LUIS'
'ANA'
'TOMAS'
'BARTOLO'
'CARMONA'
'LUIS '



=


'LUISITO'
'MARTA'
'LUIS'
'BARTOLOME'
'MADRID'
'LUIS'
verdadera
verdadera
falsa
verdadera
falsa
verdadera
Se puede observar de los casos anteriores que la presencia de cualquier carácter —incluso el blanco—, se consi-
dera mayor siempre que la ausencia. Por eso, 'LUIS ' es mayor que 'LUIS'.
Las cadenas de caracteres 295
8.5.3. Concatenación
La concatenación es la operación de reunir varias cadenas de caracteres en una sola, pero conservando el orden de
los caracteres de cada una de ellas.
El símbolo que representa la concatenación varía de unos lenguajes a otros. Los más utilizados son:
+ //  o
En nuestro libro utilizaremos  y en ocasiones +. El símbolo  evita confusiones con el operador suma. Las ca-
denas para concatenarse pueden ser constantes o variables.
'MIGUEL''DE''CERVANTES' == 'MIGUELDECERVANTES'
Puede comprobar que las cadenas, en realidad, se “pegan” unas al lado de las otras; por ello, si al concatenar
frases desea dejar blancos entre ellas, deberá indicarlos expresamente en alguna de las cadenas. Así, las operaciones
'MIGUEL ''DE ''CERVANTES
'MIGUEL'' DE'' CERVANTES
producen el mismo resultado
'MIGUEL DE CERVANTES'
lo que significa que la propiedad asociativa se cumple en la operación de concatenación.
El operador de concatenación (+, ) actúa como un operador aritmético.
EJEMPLO 8.4
Es posible concatenar variables de cadena.
var cadena : A, B, C
ABC equivale a A(BC)
La asignación de constantes tipo cadena a variables tipo cadena puede también realizarse con expresiones con-
catenadas.
EJEMPLO 8.5
Las variables A, B son de tipo cadena.
var cadena : A, B
A ← 'FUNDAMENTOS'
B ← 'DE PROGRAMACION'
La variable C puede recibir como valor
C ← A+' '+B
que produce un resultado de
C = 'FUNDAMENTOS DE PROGRAMACION'
296 Fundamentos de programación
Concatenación en Java:
El lenguaje Java soporta la concatenación de cadenas mediante el operador + que actúa sobrecargado. Así,
suponiendo que la cadena c1 contiene “Fiestas de moros” y la cadena c2 contiene “y cristianos”, la cadena c1 + c2
almacenará “Fiestas de moros y cristianos”.
8.5.4. Subcadenas
Otra operación —función— importante de las cadenas es aquella que permite la extracción de una parte específica
de una cadena: subcadena. La operación subcadena se representa en dos formatos por:
subcadena (cadena, inicio, longitud)
• Cadena es la cadena de la que debe extraerse una subcadena.
• Inicio es un número o expresión numérica entera que corresponde a la posición inicial de la subcadena.
• Longitud es la longitud de la subcadena.
subcadena (cadena, inicio)
En este caso, la subcadena comienza en inicio y termina en el final de la cadena.
EJEMPLOS
subcadena ('abcdef', 2, 4) equivale a 'bcde'
subcadena ('abcdef', 6, 1) equivale a 'f'
subcadena ('abcdef', 3) equivale a 'cdef'
subcadena ('abcdef', 3, 4) equivale a 'cdef'
longitud = 5 caracteres
{
subcadena ('12 DE OCTUBRE', 4, 5) = DE OC
posición 4
Es posible realizar operaciones de concatenación con subcadenas.
subcadena ('PATO DONALD',1,4)+ subcadena ('ESTA TIERRA',5,4)
equivale a la cadena 'PATO TIE'.
La aplicación de la función a una subcadena,
subcadena (cadena, inicio, fin)
puede producir los siguientes resultados:
1. Si fin no existe, entonces la subcadena comienza en el mismo carácter inicio y termina con el último carácter.
2. Si fin = 0, el resultado es una cadena vacía.
3. Si inicio  longitud (cadena), la subcadena resultante será vacía.
subcadena ('MORTIMER', 9, 2)
produce una cadena vacía.
4. Si inicio = 0, el resultado es también una cadena vacía.
subcadena ('valdez', 0, 4) y subcadena ('valdez', 8)
proporcionan cadenas nulas.
Las cadenas de caracteres 297
8.5.5. Búsqueda
Una operación frecuente a realizar con cadenas es localizar si una determinada cadena forma parte de otra cadena
más grande o buscar la posición en que aparece un determinado carácter o secuencia de caracteres de un texto.
Estos problemas pueden resolverse con las funciones de cadena estudiadas hasta ahora, pero será necesario dise-
ñar los algoritmos correspondientes. Esta función suele ser interna en algunos lenguajes y la definiremos por indi-
ce o posicion, y su formato es
indice (cadena, subcadena)
o bien
posicion (cadena, subcadena)
donde subcadena es el texto que se trata de localizar.
El resultado de la función es un valor entero:
• Igual a P = 1, donde P indica la posición del primer carácter de la primera coincidencia de subcadena en
cadena.
• Igual a cero, si subcadena es una cadena vacía o no aparece en la cadena.
Así, suponiendo la cadena C = 'LA CAPITAL ES MADRID'
indice (C, 'CAP') toma un valor 4
indice (C, ' ES ') toma un valor 11
indice (C, 'PADRID') toma un valor 0
La función indice en su forma más general realiza la operación que se denomina coincidencia de patro-
nes (patter-matching). Esta operación busca una cadena patrón o modelo dentro de una cadena de texto.
cursor
Texto A B B A B A B A A A B C C C
Patrón B A A B A
Esta operación utiliza un cursor o puntero en la cadena de texto original y va comprobando los sucesivos valores
de ambas cadenas: si son distintos, produce un 0, y si no proporciona la posición del primer carácter coincidente.
indice ('ABCDE', 'F') produce 0
indice ('ABXYZCDEF', 'XYZ') produce 3
La función indice (posicion) al tomar también un valor numérico entero se puede utilizar en expresiones
aritméticas o en instrucciones de asignación a variables numéricas.
P ← indice (C, 'F')
8.6. OTRAS FUNCIONES DE CADENAS
Existen otras funciones de cadena internas al lenguaje o definidas por el usuario, que suelen ser de utilidad en pro-
gramación y cuyo conocimiento es importante que conozca el lector:
• Insertar cadenas.
• Borrar cadenas.
298 Fundamentos de programación
• Cambiar cadenas.
• Convertir cadenas en números y viceversa.
8.6.1. Insertar
Si se desea insertar una cadena C dentro de un texto o cadena más grande, se debe indicar la posición. El formato de
la función insertar es
insertar (t, p, s)
• t texto o cadena donde se va a insertar.
• p posición a partir de la cual se va a insertar.
• s subcadena que se va a insertar.
insertar ('ABCDEFGHI', 4, 'XXX') = 'ABCXXXDEFGHI'
insertar ('MARIA O', 7, 'DE LA ') = 'MARIA DE LA O'
Algoritmo de inserción
Si su lenguaje no posee definida esta función, se puede implementar con el siguiente algoritmo:
inicio
insertar(t,p,s) = subcadena(t,1,p–1) S 
subcadena(t,p,longitud(t)–p+1)
fin
Veámoslo con un ejemplo: insertar ('ABCDEFGHI' 4, 'XXX')
donde t = 'ABCDEFGHI' y S = 'XXX' p = 4
subcadena (t,1,p–1) = subcadena (t,1,3) = ABC
subcadena (t,p,longitud(t)–p+1) = subcadena (t,4,9–4+1) =
subcadena (t,4,6) = DEFGHI
por consiguiente,
insertar ('ABCDEFGHI',4'XXX')= 'ABC'+'XXX'+'DEFGHI'='ABCXXXDEFGHI'
8.6.2. Borrar
Si se desea eliminar una subcadena que comienza en la posición p y tiene una longitud l se tiene la función
borrar.
borrar (t, p, 1)
• t texto o cadena de donde se va a eliminar una subcadena,
• p posición a partir de la cual se va a borrar (eliminar),
• l longitud de la subcadena a eliminar,
borrar ('supercalifragilístico', 6, 4) = 'superfragilístico'
borrar ('supercalifragilístico', 3, 10) = 'sugilístico'
Las cadenas de caracteres 299
Algoritmo borrar
Si no se posee la función estándar borrar, será preciso definirla. Ello se consigue con el algoritmo,
inicio
borrar (t,p,1) = subcadena (t,1,p–1) 
subcadena (t,p+1,longitud(t)–p–l+1)
fin
8.6.3. Cambiar
La operación insertar trata de sustituir en un texto t la primera ocurrencia de una subcadena S1 por otra S2. Este es
el caso frecuente en los programas de tratamiento de textos, donde a veces es necesario sustituir una palabra cual-
quiera por otra (... en el archivo DEMO sustituir la palabra “ordenador” por “computadora”), acomodando las posi-
bles longitudes diferentes. La función que realiza la operación de insertar tiene el formato
cambiar (t, S1, S2)
• t texto donde se realizarán los cambios.
• S1 subcadena a sustituir.
• S2 subcadena nueva.
cambiar ('ABCDEFGHIJ', 'DE', 'XXX') = 'ABCXXXFGHIJ'
Si la subcadena S1 no coincide exactamente con una subcadena de t, no se produce ningún cambio y el texto o
cadena original no se modifica
cambiar ('ABCDEFGHIJK', 'ZY', 'XXX') = 'ABCDEFGHIJK'
Algoritmo cambio
Si no se dispone de esta función como estándar, es posible definir un algoritmo haciendo uso de las funciones ana-
lizadas.
cambiar (t, S1, S2)
El algoritmo se realiza llamando a las funciones indice, borrar e insertar.
procedimiento cambiar(t, S1, S2)
inicio
j ← indice(t, S1)
t ← borrar(t, j, longitud(S1))
insertar(t, j, S2)
fin
La primera instrucción, j ← indice(s, S1), calcula la posición donde se debe comenzar la inserción, que es,
a su vez, el primer elemento de la subcadena S1.
La segunda instrucción
t ← borrar(t, j, longitud(S1))
borra la subcadena S1 y la nueva cadena se asigna a la variable de cadena t.
La tercera instrucción inserta en la nueva cadena t —original sin la cadena S1— la subcadena S2 a partir del
carácter de posición j, como se había previsto.
300 Fundamentos de programación
8.6.4. Conversión de cadenas/números
Existen funciones o procedimientos en los lenguajes de programación (val y str en BASIC, val y str en Turbo
Pascal) que permiten convertir un número en una cadena y viceversa.
En nuestro algoritmo los denotaremos por valor y cad.
valor (cadena) convierte la cadena en un número; siempre que la cadena fuese de dígitos numéricos
cad (valor) convierte un valor numérico en una cadena
EJEMPLOS
valor ('12345') = 12345
cad (12345) = '12345'
Otras funciones importantes relacionadas con la conversión de caracteres en números y de números en caracte-
res son
código (un_caracter) devuelve el código ASCII de un carácter
car (un_codigo) Devuelve el carácter asociado en un código ASCII
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
8.1. Se desea eliminar los blancos de una frase dada terminada en un punto. Se supone que es posible leer los caracteres
de la frase de uno en uno.
Solución
Análisis
Para poder efectuar la lectura de la frase, almacena ésta en un array de caracteres (F) —esto es posible en lenguajes como
Pascal; en BASIC sería preciso recurrir a enojosas tareas de operaciones con funciones de cadenas MID$, LEFT$ o RIG-
HT$—, de modo que F[i] contiene el carácter i-ésimo de la frase dada. Construiremos una nueva frase sin blancos en otro
array G.
Algoritmo
Los pasos a dar para la realización del algoritmo son:
• Inicializar contador de letras de la nueva frase G.
• Leer el primer carácter.
• Repetir.
Si el primer carácter no es en blanco, entonces
escribir en el lugar siguiente del array G,
leer carácter siguiente de la frase dada.
Hasta que el último carácter se encuentre.
• Escribir la nueva frase —G— ya sin blancos.
Las cadenas de caracteres 301
Tabla de variables:
F array de caracteres de la frase dada.
G array de caracteres de la nueva frase.
I contador del array F.
J contador del array G.
Pseudocódigo:
algoritmo blanco
inicio
I ← 1
J ← 0
F[i] ← leercar() {leercar es una función que permite la lectura de un carácter}
repetir
si F[I]  ' ' entonces
J ← J+1
G[I] ← F[I]
fin_si
I ← I+1
F[i] ← leercar()
hasta_que F[I] = '.'
//escritura de la nueva frase G
desde I ← 1 hasta J hacer
escribir(G[I]) //no avanzar linea
fin_desde
fin
8.2. Leer un carácter y deducir si está situado antes o después de la letra “m” en orden alfabético.
Solución
Análisis
La comparación de datos de tipo carácter se realiza mediante los códigos numéricos ASCII, de modo que una letra estará
situada antes o después de ésta si su código ASCII es menor o mayor. La propia computadora se encarga de realizar la
comparación de datos tipo carácter de acuerdo al código ASCII, siempre que los datos a comparar sean de tipo carácter.
Por ello se deben declarar de tipo carácter las variables que representan las comparaciones.
Variables C: caracter
Pseudocódigo
algoritmo caracter
var
carácter : C
inicio
leer(C)
si C  'M' entonces
escribir(C, 'esta antes que M en orden alfabético')
si_no
escribir(C, 'esta despues que M en orden alfabético')
fin_si
fin
8.3. Leer los caracteres y deducir si están en orden alfabético.
Solución
Tabla de variables
CAR1, CAR2: caracter
302 Fundamentos de programación
Pseudocódigo
algoritmo comparacion
var
carácter : CAR1, CAR2
inicio
leer(CAR1, CAR2)
si CAR1 = CAR2 entonces
escribir('en orden')
si_no
escribir('desordenados')
fin_si
fin
8.4. Leer una letra de un texto. Deducir si está o no comprendida entre las letras mayúsculas I-M inclusive.
Solución
Variables
LETRA: caracter.
Pseudocódigo
algoritmo
var
carácter : LETRA
inicio
leer(LETRA)
si (LETRA  = 'I') y (LETRA = 'M') entonces
escribir('esta comprendida')
si_no
escribir('no esta comprendida')
fin_si
fin
8.5. Contar el número de letras “i” de una frase terminada en un punto. Se supone que las letras pueden leerse indepen-
dientemente.
Solución
En este algoritmo el contador de letras sólo se incrementa cuando se encuentran las letras “i” buscadas.
Pseudocódigo
algoritmo letras_i
var
entero : N
carácter : LETRA
inicio
N ← 0
repetir
LETRA ← leercar()
si LETRA = 'i' entonces
N ← N+1
fin_si
hasta_que LETRA = '.'
escribir('La frase tiene', N, 'letras i')
fin
Las cadenas de caracteres 303
8.6. Contar el número de vocales de una frase terminada en un punto.
Solución
Pseudocódigo
algoritmo vocales
var
entero : NUMVOCALES
carácter : C
inicio
repetir
C ← leercar() {la función leercar permite la lectura de caracteres independientes}
si C = 'a' o C = 'e' o C = 'i' o C = 'o' o C = 'u' entonces
NUMVOCALES ← NUMVOCALES+1
fin_si
hasta_que C = '.'
escribir('El numero de vocales es =', NUMVOCALES)
fin
8.7. Se desea contar el número de letras “a” y el número de letras “b” de una frase terminada en un punto. Se supone
que es posible leer los caracteres independientemente.
Solución
Método 1
algoritmo letras_a_b
var
entero : NA, NB
carácter : C
inicio
NA ← 0
NB ← 0
repetir
C ← leercar()
si C = 'a' entonces
NA ← NA+1
fin_si
si C = 'b' entonces
NB ← NB+1
fin_si
hasta_que C = '.'
escribir('Letras a =', NA, 'Letras b=', NB)
fin
Método 2
algoritmo letras_a_b
var
entero : NA, NB
carácter : C
inicio
NA ← 0
NB ← 0
repetir
C ← leercar()
si C = 'a' entonces
NA ← NA+1
304 Fundamentos de programación
si_no
si C = 'b' entonces
NB ← NB+1
fin_si
fin_si
hasta_que C = '.'
fin
Método 3
algoritmo letras_a_b
var
entero : NA, NB
carácter : C
inicio
NA ← 0
NB ← 0
repetir
C ← leercar()
según_sea C hacer
'a': NA ← NA+1
'b': NB ← NB+1
fin_según
hasta_que C = '.'
fin
8.8. Leer cien caracteres de un texto y contar el número de letras “b”.
Solución
Tabla de variables
entero : I, NE
caracter : C
Pseudocódigo
algoritmo letras_b
var
entero : I, NE
carácter : C
inicio
NE ← 0
desde I ← 1 hasta 100 hacer
C ← leercar()
si C = 'b' entonces
NE ← NE+1
fin_si
fin_desde
escribir('Existen', NE, 'letras b')
fin
8.9. Escribir una función convertida (núm,b) que nos permita transformar un número entero y positivo en base 10 a la
base que le indiquemos como parámetro. Comprobar el algoritmo para las bases 2 y 16.
algoritmo Cambio_de_base
var entero: num, b
inicio
escribir('Déme número')
leer(num)
Las cadenas de caracteres 305
escribir('Indique base')
leer(b)
escribir(convertir(num,b),'es el número', num, 'en base',b)
fin
cadena función convertir(E entero: num,b)
var entero: r
carácter: c
cadena: unacadena
inicio
unacadena ← ''
si num  0 entonces
mientras num  0 hacer
r ← num MOD b
si r  9 entonces
c ← car(r+55)
si_no
c ← car(r + codigo('0'))
fin_si
unacadena ← c + unacadena
num ← num div b
fin_mientras
si_no
unacadena ← '0'
fin_si
devolver(unacadena)
fin_función
CONCEPTOS CLAVE
• Cadena.
• Cadena nula.
• Comparación de cadenas.
• Concatenación.
• Funciones de biblioteca.
• Literal de cadena.
• Longitud de la cadena.
• String.
• Variable de cadena.
RESUMEN
Cada lenguaje de computadora tiene su propio método de
manipulación de cadenas de caracteres. Algunos lenguajes,
tales como C++ y C, tienen un conjunto muy rico de fun-
ciones de manipulación de cadenas. Otros lenguajes, tales
como FORTRAN, que se utilizan predominantemente para
cálculos numéricos, incorporan características de manipu-
lación de cadenas en sus últimas versiones. También len-
guajes tales como LISP, que está concebido para manipular
aplicaciones de listas proporciona capacidades excepciona-
les de manipulación de cadenas.
En un lenguaje como C o C++, las cadenas son simple-
mente arrays de caracteres terminados en caracteres nulos
(“0”) que se pueden manipular utilizando técnicas estánda-
res de procesamiento de arrays elemento por elemento. En
esencia, las cadenas en los lenguajes de progra-
mación modernos tienen, fundamentalmente, estas caracte-
rísticas:
1. Una cadena (string) es un array de caracteres que
en algunos casos (C++) se termina con el carácter
NULO (NULL).
2. Las cadenas se pueden procesar siempre utilizando
técnicas estándares de procesamiento de arrays.
3. En la mayoría de los lenguajes de programación
existen muchas funciones de biblioteca para proce-
samiento de cadenas como una unidad completa.
Internamente estas funciones manipulan las cade-
nas carácter a carácter.
4. Algunos caracteres se escriben con un código de
escape o secuencia de escape, que consta del carác-
306 Fundamentos de programación
ter escape () seguido por un código del propio
carácter.
5. Un carácter se representa utilizando un único byte
(8 bits). Los códigos de caracteres estándar más
utilizados en los lenguajes de programación son
ASCII y Unicode.
6. El código ASCII representa 127 caracteres y el có-
digo ASCII ampliado representa 256 caracteres.
Mediante el código Unicode se llegan a representar
numerosos lenguajes internacionales, además del
inglés, como el español, francés, chino, hindi, ale-
mán, etc.
7. Las bibliotecas estándar de funciones incorporadas
a los lenguajes de programación incluyen gran can-
tidad de funciones integradas que manipulan ca-
denas y que actúan de modo similar a los algorit-
mos de las funciones explicadas en el capítulo.
Este es el caso de la biblioteca de cadenas del len-
guaje C o la biblioteca string.h de C++.
8. Algunas de la funciones de cadena típicas son: lon-
gitud de la cadena, comparar cadenas, insertar
cadena, copiar cadenas, concatenar cadenas, etc.
9. El lenguaje C++ soporta las cadenas como arrays
de caracteres terminado en el carácter nulo repre-
sentado por la secuencia de escape “0”.
10. Los lenguajes orientados a objetos Java y C# so-
portan las cadenas como objetos de la clase
String.
EJERCICIOS
8.1. Escribir un algoritmo para determinar si una cadena
especificada ocurre en una cadena dada, y si es así,
escribir un asterisco (*) en la primera posición de
cada ocurrencia.
8.2. Escribir un algoritmo para contar el número de ocu-
rrencias de cada una de las palabras 'a', 'an' y
'and' en las diferentes líneas de texto.
8.3. Contar el número de ocurrencias de una cadena espe-
cificada en diferentes líneas de texto.
8.4. Escribir un algoritmo que permita la entrada de un
nombre consistente en un nombre, un primer apellido
y un segundo apellido, en ese orden, y que imprima
a continuación el último apellido, seguido del primer
apellido y el nombre. Por ejemplo: Luis Garcia
Garcia producirá: Garcia Garcia Luis.
8.5. Escribir un algoritmo que elimine todos los espacios
finales en una cadena determinada. Por ejemplo: 'J.
R. GARCIA ' se deberá transformar en 'J. R.
GARCIA'.
8.6. Diseñar un algoritmo cuya entrada sea una cadena S
y un factor de multiplicación N, cuya función sea ge-
nerar la cadena dada N veces. Por ejemplo:
‘¡Hey!’, 3
se convertirá en
'¡Hey! ¡Hey! ¡Hey!'
8.7. Diseñar un algoritmo que elimine todas las ocurren-
cias de cada carácter en una cadena dada a partir de
otra cadena dada. Las dos cadenas son:
• CADENA1 es la cadena donde deben eliminarse
caracteres.
• LISTA es la cadena que proporciona los ca-
racteres que deben eliminarse.
CADENA = 'EL EZNZZXTX'
LISTA = 'XZ'
la cadena pedida es 'EL ENT'.
8.8. Escribir un algoritmo que convierta los números ará-
bigos en romanos y viceversa (I = 1, V = 5, X = 10,
L = 50, C = 100, D = 500 y M = 1000).
8.9. Diseñar un algoritmo que mediante una función per-
mita cambiar un número n en base 10 a la base b,
siendo b un número entre 2 y 20.
8.10. Escribir el algoritmo de una función que convierta
una cadena en mayúsculas y otra que la convierta en
minúsculas.
8.11. Diseñar una función que informe si una cadena es
un palíndromo (una cadena es un palíndromo si se
lee igual de izquierda a derecha que de derecha a
izquierda).
CAPÍTULO 9
Archivos (ficheros)
9.1. Archivos y flujos (stream): La jerarquía de
datos
9.2. Conceptos y definiciones = terminología
9.3. Soportes secuenciales y direccionables
9.4. Organización de archivos
9.5. Operaciones sobre archivos
9.6. Gestión de archivos
9.7. Flujos
9.8. Mantenimiento de archivos
9.9. Procesamiento de archivos secuenciales
(algoritmos)
9.10. Procesamiento de archivos directos (algo-
ritmos)
9.11. Procesamiento de archivos secuenciales
indexados
9.12. Tipos de archivos: consideraciones prácticas
en C/C++ y Java
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
CONCEPTOS CLAVE
RESUMEN
EJERCICIOS
Los datos que se han tratado hasta este capítulo y
procesados por un programa pueden residir simultá-
neamente en la memoria principal de la computadora.
Sin embargo, grandes cantidades de datos se alma-
cenan normalmente en dispositivos de memoria auxi-
liar. Las diferentes técnicas que han sido diseñadas
para la estructuración de estas colecciones de datos
complejas se alojaban en arrays; en este capítulo se
realiza una introducción a la organización y gestión
de datos estructurados sobre dispositivos de almace-
namiento secundario, tales como cintas y discos mag-
néticos. Estas colecciones de datos se conocen como
archivos (ficheros). Las técnicas requeridas para ges-
tionar archivos son diferentes de las técnicas de orga-
nización de datos que son efectivas en memoria prin-
cipal, aunque se construyen sobre la base de esas
técnicas. Este capítulo introductorio está concebido
para la iniciación a los archivos, lo que son y sus mi-
siones en los sistemas de información y de los proble-
mas básicos en su organización y gestión.
INTRODUCCIÓN
308 Fundamentos de programación
9.1. ARCHIVOS Y FLUJOS (STREAM): LA JERARQUÍA DE DATOS
El almacenamiento de datos en variables y arrays (arreglos) es temporal; los datos se pierden cuando una variable
sale de su ámbito o alcance de influencia, o bien cuando se termina el programa. La mayoría de las aplicaciones
requieren que la información se almacene de forma persistente, es decir que no se borre o elimine cuando se termina
la ejecución del programa. Por otra parte, en numerosas aplicaciones se requiere utilizar grandes cantidades de infor-
mación que, normalmente, no caben en la memoria principal. Debido a estas causas se requiere utilizar archivos
(ficheros) para almacenar de modo permanente grandes cantidades de datos, incluso después que los programas que
crean los datos se terminan. Estos datos almacenados en archivos se conocen como datos persistentes y permanecen
después de la duración de la ejecución del programa.
Las computadoras almacenan los archivos en dispositivos de almacenamiento secundarios, tales como discos CD,
DVD, memorias flash USB, memorias de cámaras digitales, etc. En este capítulo se explicará cómo los programas
escritos en un lenguaje de programación crean, actualizan o procesan archivos de datos.
El procesamiento de archivos es una de las características más importantes que un lenguaje de programación debe
tener para soportar aplicaciones comerciales que procesan, normalmente, cantidades masivas de datos persistentes.
La entrada de datos normalmente se realiza a través del teclado y la salida o resultados van a la pantalla. Estas ope-
raciones, conocidas como Entrada/Salida (E/S), se realizan también hacia y desde los archivos.
Los programas que se crean con C/C++, Java u otros lenguajes necesitan interactuar con diferentes fuentes de
datos. Los lenguajes antiguos como FORTRAN, Pascal o COBOL tenían integradas en el propio lenguaje las entra-
das y salidas; palabras reservadas como PRINT, READ, write, writeln, etc, son parte del vocabulario del lenguaje.
Sin embargo, los lenguajes de programación modernos como C/C++ o Java/C# tienen entradas y salidas en el len-
guaje y para acceder o almacenar información en una unidad de disco duro o en un CD o en un DVD, en páginas de
un sitio web e incluso guardar bytes en la memoria de la computadora, se necesitan técnicas que pueden ser diferen-
tes para diferente dispositivo de almacenamiento. Afortunadamente, los lenguajes citados anteriormente pueden al-
macenar y recuperar información, utilizando sistemas de comunicaciones denominados flujos que se implementan
en bibliotecas estándar de funciones de E/S (en archivos de cabecera stdio.h y cstdio.h) en C, en una biblioteca
estándar de clases (en archivos de cabecera iostream y fstream) en C++, o en el paquete Java.io en el lenguaje
Java.
Las estructuras de datos enunciadas en los capítulos anteriores se encuentran almacenadas en la memoria central
o principal. Este tipo de almacenamiento, conocido por almacenamiento principal o primario, tiene la ventaja de su
pequeño tiempo de acceso y, además, que este tiempo necesario para acceder a los datos almacenados en una posición
es el mismo que el tiempo necesario para acceder a los datos almacenados en otra posición del dispositivo —memo-
ria principal—. Sin embargo, no siempre es posible almacenar los datos en la memoria central o principal de la
computadora, debido a las limitaciones que su uso plantea:
• La cantidad de datos que puede manipular un programa no puede ser muy grande debido a la limitación de la
memoria central de la computadora1
.
• La existencia de los datos en la memoria principal está supeditada al tiempo que la computadora está encendi-
da y el programa ejecutándose (tiempo de vida efímero). Esto supone que los datos desaparecen de la memoria
principal cuando la computadora se apaga o se deja de ejecutar el programa.
Estas limitaciones dificultan:
• La manipulación de gran número de datos, ya que —en ocasiones— pueden no caber en la memoria principal
(aunque hoy día han desaparecido las limitaciones que la primera generación de PC presentaba con la limitación
de memoria a 640 KBytes, no admitiéndose información a almacenar mayor de esa cantidad en el caso de
computadoras IBM PC y compatibles).
• La transmisión de salida de resultados de un programa pueda ser tratada como entrada a otro programa.
1
En sus orígenes y en la década de los ochenta, 640 K-bytes en el caso de las computadoras personales IBM PC y compatibles. Hoy día
esas cifras han sido superadas con creces, pero aunque las memorias centrales varían, en computadoras domésticas, portátiles (laptops) y de es-
critorio, entre 1 GB y 4 GB, la temporalidad de los datos almacenados en ellas aconseja siempre el uso de archivos para datos de carácter perma-
nente.
Archivos (ficheros) 309
Para poder superar estas dificultades se necesitan dispositivos de almacenamiento secundario (memorias externas
o auxiliares) como cintas, discos magnéticos, tarjetas perforadas, etc., donde se almacenará la información o datos
que podrá ser recuperada para su tratamiento posterior. Las estructuras de datos aplicadas a colección de datos en
almacenamientos secundarios se llaman organización de archivos. La noción de archivo o fichero está relacionada
con los conceptos de:
• Almacenamiento permanente de datos.
• Fraccionamiento o partición de grandes volúmenes de información en unidades más pequeñas que puedan ser
almacenadas en memoria central y procesadas por un programa.
Un archivo o fichero es un conjunto de datos estructurados en una colección de entidades elementales o básicas
denominadas registros o artículos, que son de igual tipo y constan a su vez de diferentes entidades de nivel más bajo
denominadas campos.
9.1.1. Campos
Un campo es un item o elemento de datos elementales, tales como un nombre, número de empleados, ciudad, núme-
ro de identificación, etc.
Un campo está caracterizado por su tamaño o longitud y su tipo de datos (cadena de caracteres, entero, lógico,
etcétera.). Los campos pueden incluso variar en longitud. En la mayoría de los lenguajes de programación los campos
de longitud variable no están soportados y se suponen de longitud fija.
Campos
Nombre Dirección
Fecha
de nacimiento
Estudios Salario Trienios
Figura 9.1. Campos de un registro.
Un campo es la unidad mínima de información de un registro.
Los datos contenidos en un campo se dividen con frecuencia en subcampos; por ejemplo, el campo fecha se di-
vide en los subcampos día, mes, año.
Campo 0 7 0 7 1 9 9 5
Subcampo Día Mes Año
Los rangos numéricos de variación de los subcampos anteriores son:
1 ≤ día ≤ 31
1 ≤ mes ≤ 12
1 ≤ año ≤ 1987
9.1.2. Registros
Un registro es una colección de información, normalmente relativa a una entidad particular. Un registro es una co-
lección de campos lógicamente relacionados, que pueden ser tratados como una unidad por algún programa. Un
ejemplo de un registro puede ser la información de un determinado empleado que contiene los campos de nombre,
dirección, fecha de nacimiento, estudios, salario, trienios, etc.
Los registros pueden ser todos de longitud fija; por ejemplo, los registros de empleados pueden contener el mis-
mo número de campos, cada uno de la misma longitud para nombre, dirección, fecha, etc. También pueden ser de
longitud variables.
310 Fundamentos de programación
Los registros organizados en campos se denominan registros lógicos.
Registro de datos
N
N = longitud del registro
Figura 9.2. Registro.
Nota
El concepto de registro es similar al concepto de estructura (struct) estudiado en el Capítulo 7, ya que ambas
estructuras de datos permiten almacenar datos de tipo heterogéneo.
9.1.3. Archivos (ficheros)
Un fichero (archivo) de datos —o simplemente un archivo— es una colección de registros relacionados entre sí con
aspectos en común y organizados para un propósito específico. Por ejemplo, un fichero de una clase escolar contiene
un conjunto de registros de los estudiantes de esa clase. Otros ejemplos pueden ser el fichero de nóminas de una
empresa, inventarios, stocks, etc.
La Figura 9.3 recoge la estructura de un archivo correspondiente a los suscriptores de una revista de informá-
tica.
Registro 4
Registro 3
Registro 2
Registro 1 Nombre Profesión Dirección Teléfono Ciudad
Figura 9.3. Estructuras de un archivo “suscriptores”.
Un archivo en una computadora es una estructura diseñada para contener datos. Los datos están organizados de
tal modo que puedan ser recuperados fácilmente, actualizados o borrados y almacenados de nuevo en el archivo con
todos los campos realizados.
9.1.4. Bases de datos
Una colección de archivos a los que puede accederse por un conjunto de programas y que contienen todos ellos da-
tos relacionados constituye una base de datos. Así, una base de datos de una universidad puede contener archivos de
estudiantes, archivos de nóminas, inventarios de equipos, etc.
9.1.5. Estructura jerárquica
Los conceptos carácter, campos, registro, archivo y base de datos son conceptos lógicos que se refieren al medio en
que el usuario de computadoras ve los datos y se organizan. Las estructuras de datos se organizan de un modo jerár-
quico, de modo que el nivel más alto lo constituye la base de datos y el nivel más bajo el carácter.
Archivos (ficheros) 311
9.1.6. Jerarquía de datos
Una computadora, como ya conoce el lector (Capítulo 1), procesa todos los datos como combinaciones de ceros y
unos. Tal elemento de los datos se denomina bit (binary digit). Sin embargo, como se puede deducir fácilmente, es
difícil para los programadores trabajar con datos en estos formatos de bits de bajo nivel. En su lugar, los programa-
dores prefieren trabajar con caracteres tales como los dígitos decimales (0-9), letras (A-Z y a-z) o símbolos espe-
ciales (, *, , @, €, #,...). El conjunto de todos los caracteres utilizados para escribir los programas se denomina
conjunto o juegos de caracteres de la computadora. Cada carácter se representa como un patrón de ceros y unos. Por
ejemplo, en Java, los caracteres son caracteres Unicode (Capítulo 1) compuestos de 2 bytes.
Al igual que los caracteres se componen de bits, los campos se componen de caracteres o bytes. Un campo es
un grupo de caracteres o bytes que representan un significado. Por ejemplo, un campo puede constar de letras ma-
yúsculas y minúsculas que representan el nombre de una ciudad.
Los datos procesados por las computadoras se organizan en jerarquías de datos formando estructuras a partir de
bits, caracteres, campos, etc.
Los campos (variables de instancias en C++ y Java) se agrupan en registros que se implementan en una clase en
Java o en C++. Un registro es un grupo de campos relacionados que se implementan con tipos de datos básicos o
estructurados. En un sistema de matrícula en una universidad, un registro de un alumno o de un profesor puede cons-
tar de los siguientes campos:
• Nombre (cadena).
• Número de expediente (entero).
• Número de Documento Nacional de Identidad o Pasaporte (entero doble).
• Año de nacimiento (entero).
• Estudios (cadena).
Un archivo es un grupo de registros relacionados. Así, una universidad puede tener muchos alumnos y profesores,
y un archivo de alumnos contiene un registro para cada empleado. Un archivo de una universidad puede contener
miles de registros y millones o incluso miles de millones de caracteres de información. Las Figura 9.4 muestra la
jerarquía de datos de un archivo (byte, campo, registro, archivo).
Campos
Base de datos
Archivos
Subcampos
Caracteres
Registros
Figura 9.4. Estructuras jerárquicas de datos.
Los registros poseen una clave o llave que identifica a cada registro y que es única para diferenciarla de otros
registros. En registros de nombres es usual que el campo clave sea el pasaporte o el DNI (Documento Nacional de
Identidad).
Un conjunto de archivos relacionados se denomina base de datos. En los negocios o en la administración, los
datos se almacenan en bases de datos y en muchos archivos diferentes. Por ejemplo, las universidades pueden tener
archivos de profesores, archivos de estudiantes, archivos de planes de estudio, archivos de nóminas de profesores y
de PAS (Personal de Administración y Servicios). Otra jerarquía de datos son los sistemas de gestión de bases de
datos (SGBD o DBMS) que es un conjunto de programas diseñados para crear y administrar bases de datos.
312 Fundamentos de programación
9.2. CONCEPTOS Y DEFINICIONES = TERMINOLOGÍA
Aunque en el apartado anterior ya se han comentado algunos términos relativos a la teoría de archivos, en este apar-
tado se enunciarán todos los términos más utilizados en la gestión y diseño de archivos.
9.2.1. Clave (indicativo)
Una clave (key) o indicativo es un campo de datos que identifica el registro y lo diferencia de otros registros. Esta
clave debe ser diferente para cada registro. Claves típicas son nombres o números de identificación.
9.2.2. Registro físico o bloque
Un registro físico o bloque es la cantidad más pequeña de datos que pueden transferirse en una operación de entra-
da/salida entre la memoria central y los dispositivos periféricos o viceversa. Ejemplos de registros físicos son: una
tarjeta perforada, una línea de impresión, un sector de un disco magnético, etc.
Un bloque puede contener uno o más registros lógicos.
Un registro lógico puede ocupar menos de un registro físico, un registro físico o más de un registro físico.
9.2.3. Factor de bloqueo
Otra característica que es importante en relación con los archivos es el concepto de factor de bloqueo o blocaje. El
número de registros lógicos que puede contener un registro físico se denomina factor de bloqueo.
Se pueden dar las siguientes situaciones:
• Registro lógico  Registro físico. En un bloque se contienen varios registros físicos por bloque; se denominan
registros expandidos.
• Registro lógico = Registro físico. El factor de bloqueo es 1 y se dice que los registros no están bloqueados.
• Registro lógico  Registro físico. El factor de bloqueo es mayor que 1 y los registros están bloqueados.
Registro
Bloque
Espacio entre bloques
a) Un registro por bloque (factor = 1)
Registro1 Registro2 Registro3 Registro4
Bloque
b) N registros por bloque (factor = N)
Espacio entre bloques
Figura 9.5. Factor de bloqueo.
La importancia del factor de bloqueo se puede apreciar mejor con un ejemplo. Supongamos que se tienen dos
archivos. Uno de ellos tiene un factor de bloqueo de 1 (un registro en cada bloque). El otro archivo tiene un factor
de bloqueo de 10 (10 registros/bloque). Si cada archivo contiene un millón de registros, el segundo archivo requeri-
rá 900.000 operaciones de entrada/salida menos para leer todos los registros. En el caso de las computadoras perso-
nales con un tiempo medio de acceso de 90 milisegundos, el primer archivo emplearía alrededor de 24 horas más
para leer todos los registros del archivo.
Archivos (ficheros) 313
Un factor de bloqueo mayor que 1 siempre mejora el rendimiento; entonces, ¿por qué no incluir todos los regis-
tros en un solo bloque? La razón reside en que las operaciones de entrada/salida que se realizan por bloques se hacen
a través de un área de la memoria central denominada memoria intermedia (buffer) y entonces el aumento del bloque
implicará aumento de la memoria intermedia y, por consiguiente, se reducirá el tamaño de la memoria central.
El tamaño de una memoria intermedia de un archivo es el mismo que el del tamaño de un bloque. Como la me-
moria central es más cara que la memoria secundaria, no conviene aumentar el tamaño del bloque alegremente, sino
más bien conseguir un equilibrio entre ambos criterios.
En el caso de las computadoras personales, el registro físico puede ser un sector del disco (512 bytes).
Memoria central
Memoria intermedia
Flujo de datos
Programa
del usuario
Disco
Almacenamiento
secundario
Cinta
La Tabla 9.1 resume los conceptos lógicos y físicos de un registro.
Tabla 9.1. Unidades de datos lógicos y físicos
Organización lógica Organización físcia Descripción
Bit Un dígito binario.
Carácter Byte (octeto, 8 bits) En la mayoría de los códigos un carácter se representa aproximadamente
por un byte.
Campo Palabra Un campo es un conjunto relacionado de caracteres. Una palabra de
computadora es un número fijo de bytes.
Registro Bloque (1 página =
bloques de longitud)
Los registros pueden estar bloqueados.
Archivo Área Varios archivos se pueden almacenar en un área de almacenamiento.
Base de datos Áreas Colección de archivos de datos relacionados que se pueden organizar en
una base de datos.
Resumen de archivos
• Un archivo está siempre almacenado en un soporte externo a la memoria central.
• Existe independencia de las informaciones respecto de los programas.
• Todo programa de tratamiento intercambia información con el archivo y la unidad básica de entrada/salida es
el registro.
• La información almacenada es permanente.
• En un momento dado, los datos extraídos por el archivo son los de un registro y no los del archivo completo.
• Los archivos en memoria auxiliar permiten una gran capacidad de almacenamiento.
9.3. SOPORTES SECUENCIALES Y DIRECCIONABLES
El soporte es el medio físico donde se almacenan los datos. Los tipos de soporte utilizados en la gestión de archi-
vos son:
• Soportes secuenciales.
• Soportes direccionables.
314 Fundamentos de programación
Los soportes secuenciales son aquellos en los que los registros —informaciones— están escritos unos a conti-
nuación de otros y para acceder a un determinado registro n se necesita pasar por los n – 1 registros anteriores.
Los soportes direccionables se estructuran de modo que las informaciones registradas se pueden localizar direc-
tamente por su dirección y no se requiere pasar por los registros precedentes. En estos soportes los registros deben
poseer un campo clave que los diferencie del resto de los registros del archivo. Una dirección en un soporte direc-
cionable puede ser número de pista y número de sector en un disco.
Los soportes direccionables son los discos magnéticos, aunque pueden actuar como soporte secuencial.
9.4. ORGANIZACIÓN DE ARCHIVOS
Según las características del soporte empleado y el modo en que se han organizado los registros, se consideran dos
tipos de acceso a los registros de un archivo:
• Acceso secuencial.
• Acceso directo.
El acceso secuencial implica el acceso a un archivo según el orden de almacenamiento de sus registros, uno tras
otro.
El acceso directo implica el acceso a un registro determinado, sin que ello implique la consulta de los registros
precedentes. Este tipo de acceso sólo es posible con soportes direccionables.
La organización de un archivo define la forma en la que los registros se disponen sobre el soporte de almacena-
miento, o también se define la organización como la forma en que se estructuran los datos en un archivo. En general,
se consideran tres organizaciones fundamentales:
• Organización secuencial.
• Organización directa o aleatoria (“random”).
• Organización secuencial indexada (“indexed”).
9.4.1. Organización secuencial
Un archivo con organización secuencial es una sucesión de registros almacenados consecutivamente sobre el sopor-
te externo, de tal modo que para acceder a un registro n dado es obligatorio pasar por todos los n – 1 artículos que
le preceden.
Los registros se graban consecutivamente cuando el archivo se crea y se debe acceder consecutivamente cuando
se leen dichos registros.
Principio del archivo Registro 1
Registro 2
.
.
.
.
Registro I – 1
Registro I
Registro I + 1
.
.
.
.
Registro N – 1
Fin del archivo Registro N
Figura 9.6. Organización secuencial.
Archivos (ficheros) 315
• El orden físico en que fueron grabados (escritos) los registros es el orden de lectura de los mismos.
• Todos los tipos de dispositivos de memoria auxiliar soportan la organización secuencial.
Los archivos organizados secuencialmente contienen un registro particular —el último— que contiene una marca
fin de archivo (EOF o bien FF). Esta marca fin de archivo puede ser un carácter especial como '*'.
9.4.2. Organización directa
Un archivo está organizado en modo directo cuando el orden físico no se corresponde con el orden lógico. Los da-
tos se sitúan en el archivo y se accede a ellos directamente mediante su posición, es decir, el lugar relativo que
ocupan.
Esta organización tiene la ventaja de que se pueden leer y escribir registros en cualquier orden y posición. Son
muy rápidos de acceso a la información que contienen.
La organización directa tiene el inconveniente de que necesita programar la relación existente entre el contenido
de un registro y la posición que ocupa. El acceso a los registros en modo directo implica la posible existencia de
huecos libres dentro del soporte y, por consecuencia, pueden existir huecos libres entre registros.
La correspondencia entre clave y dirección debe poder ser programada y la determinación de la relación entre el
registro y su posición física se obtiene mediante una fórmula.
Las condiciones para que un archivo sea de organización directa son:
• Almacenado en un soporte direccionable.
• Los registros deben contener un campo específico denominado clave que identifica cada registro de modo úni-
co, es decir, dos registros distintos no pueden tener un mismo valor de clave.
• Existencia de una correspondencia entre los posibles valores de la clave y las direcciones disponibles sobre el
soporte.
Un soporte direccionable es normalmente un disco o paquete de discos. Cada posición se localiza por su dirección
absoluta, que en el caso del disco suele venir definida por dos parámetros —número de pista y número de sector— o
bien por tres parámetros —pista, sector y número de cilindro—; un cilindro i es el conjunto de pistas de número i de
cada superficie de almacenamiento de la pila.
En la práctica el programador no gestiona directamente direcciones absolutas, sino direcciones relativas respecto
al principio del archivo. La manipulación de direcciones relativas permite diseñar el programa con independencia de
la posición absoluta del archivo en el soporte.
El programador crea una relación perfectamente definida entre la clave indicativa de cada registro y su posición
física dentro del dispositivo de almacenamiento. Esta relación, en ocasiones, produce colisiones.
Consideremos a continuación el fenómeno de las colisiones mediante un ejemplo.
La clave de los registros de estudiantes de una Facultad de Ciencias es el número de expediente escolar que se
le asigna en el momento de la matriculación y que consta de ocho dígitos. Si el número de estudiantes es un número
decimal de ocho dígitos, existen 108
posibles números de estudiantes (0 a 99999999), aunque lógicamente nunca
existirán tantos estudiantes (incluso incluyendo alumnos ya graduados). El archivo de estudiantes constará a lo sumo
de decenas o centenas de miles de estudiantes. Se desea almacenar este archivo en un disco sin utilizar mucho espa-
cio. Si se desea obtener el algoritmo de direccionamiento, se necesita una función de conversión de claves o función
“hash”. Suponiendo que N es el número de posiciones disponibles para el archivo, el algoritmo de direccionamien-
to convierte cada valor de la clave en una dirección relativa d, comprendida entre 1 y N. Como la clave puede ser
numérica o alfanumérica, el algoritmo de conversión debe prever esta posibilidad y asignar a cada registro corres-
pondiente a una clave una posición física en el soporte de almacenamiento. Así mismo, el algoritmo o función de
conversión de claves debe eliminar o reducir al máximo las colisiones. Se dice que en un algoritmo de conversión de
claves se produce una colisión cuando dos registros de claves distintas producen la misma dirección física en el so-
porte. El inconveniente de una colisión radica en el hecho de tener que situar el registro en una posición diferente de
la indicada por el algoritmo de conversión y, por consiguiente, el acceso a este registro será más lento. Las colisiones
son difíciles de evitar en las organizaciones directas. Sin embargo, un tratamiento adecuado en las operaciones de
lectura/escritura disminuirá su efecto perjudicial en el archivo.
Para representar la función de transformación o conversión de claves (hash), se puede utilizar una notación
matemática. Así, si K es una clave, f(K) es la correspondiente dirección; f es la función llamada función de con-
versión.
316 Fundamentos de programación
EJEMPLO 9.1
Una compañía de empleados tiene un número determinado de vendedores y un archivo en el que cada registro co-
rresponde a un vendedor. Existen 200 vendedores, cada uno referenciado por un número de cinco dígitos. Si tuvié-
semos que asignar un archivo de 100.000 registros, cada registro se corresponderá con una posición del disco.
Para el diseño del archivo crearemos 250 registros (un 25 por 100 más que el número de registros necesarios
—25 por 100 suele ser un porcentaje habitual—) que se distribuirán de la siguiente forma:
1. Posiciones 0-199 constituyen el área principal del archivo y en ella se almacenarán todos los vendedores.
2. Posiciones 200-249 constituyen el área de desbordamiento, si K(1)  K(2), pero f(K(1)) = f(K(2)), y el re-
gistro con clave K(1) ya está almacenado en el área principal, entonces el registro con K(2) se almacena en
el área de desbordamiento.
La función f se puede definir como:
f(k) = resto cuando K se divide por 199, esto es, el módulo de 199; 199 ha sido elegido por ser el número primo
mayor y que es menor que el tamaño del área principal.
Para establecer el archivo se borran primero 250 posiciones. A continuación, para cada registro de vendedor se
calcula p = f(K). Si la posición p está vacía, se almacena el registro en ella. En caso contrario se busca secuencial-
mente a través de las posiciones 200, 201, ..., para el registro con la clave deseada.
9.4.3. Organización secuencial indexada
Un diccionario es un archivo secuencial, cuyos registros son las entradas y cuyas claves son las palabras definidas
por las entradas. Para buscar una palabra (una clave) no se busca secuencialmente desde la “a” hasta la “z”, sino que
se abre el diccionario por la letra inicial de la palabra. Si se desea buscar “índice”, se abre el índice por la letra I y
en su primera página se busca la cabecera de página hasta encontrar la página más próxima a la palabra, buscando a
continuación palabra a palabra hasta encontrar “índice”. El diccionario es un ejemplo típico de archivo secuencial
indexado con dos niveles de índices, el nivel superior para las letras iniciales y el nivel menor para las cabeceras de
página. En una organización de computadora las letras y las cabeceras de páginas se guardarán en un archivo de ín-
dice independiente de las entradas del diccionario (archivo de datos). Por consiguiente, cada archivo secuencial in-
dexado consta de un archivo índice y un archivo de datos.
Un archivo está organizado en forma secuencial indexada si:
• El tipo de sus registros contiene un campo clave identificador.
• Los registros están situados en un soporte direccionable por el orden de los valores indicados por la clave.
• Un índice para cada posición direccionable, la dirección de la posición y el valor de la clave; en esencia, el
índice contiene la clave del último registro y la dirección de acceso al primer registro del bloque.
Un archivo en organización secuencial indexada consta de las siguientes partes:
• Área de datos o primaria: contiene los registros en forma secuencial y está organizada en secuencia de claves
sin dejar huecos intercalados.
• Área de índices: es una tabla que contiene los niveles de índice, la existencia de varios índices enlazados se
denomina nivel de indexación.
• Área de desbordamiento o excedentes: utilizada, si fuese necesario, para las actualizaciones.
El área de índices es equivalente, en su función, al índice de un libro. En ella se refleja el valor de la clave iden-
tificativa más alta de cada grupo de registros del archivo y la dirección de almacenamiento del grupo.
Los archivos secuenciales indexados presentan las siguientes ventajas:
• Rápido acceso.
• El sistema de gestión de archivos se encarga de relacionar la posición de cada registro con su contenido median-
te la tabla de índices.
Archivos (ficheros) 317
Y los siguientes inconvenientes:
• Desaprovechamiento del espacio por quedar huecos intermedios cada vez que se actualiza el archivo.
• Se necesita espacio adicional para el área de índices.
Los soportes que se utilizan para esta organización son los que permiten el acceso directo —los discos magnéti-
cos—. Los soportes de acceso secuencial no pueden utilizarse, ya que no disponen de direcciones para las posiciones
de almacenamiento.
9.5. OPERACIONES SOBRE ARCHIVOS
Tras la decisión del tipo de organización que ha de tener el archivo y los métodos de acceso que se van a aplicar para
su manipulación, es preciso considerar todas las posibles operaciones que conciernen a los registros de un archivo.
Las distintas operaciones que se pueden realizar son:
• Creación.
• Consulta.
• Actualización (altas, bajas, modificación, consulta).
CLAVE DIRECCIÓN
Área de
índices
15 010
24 020
36 030
54 040
.
.
.
.
.
.
240 090
CLAVE DATOS
Área
principal
010 15
011
012
.
.
.
019
020 24
021
.
.
.
029
030 36
031
.
.
.
039
040 54
041
.
.
.
049
050
.
.
.
090 240
091
.
.
.
100
0
Figura 9.7. Organización secuencial indexada.
318 Fundamentos de programación
• Clasificación.
• Reorganización.
• Destrucción (borrado).
• Reunión, fusión.
• Rotura, estallido.
9.5.1. Creación de un archivo
Es la primera operación que sufrirá el archivo de datos. Implica la elección de un entorno descriptivo que permita un
ágil, rápido y eficaz tratamiento del archivo.
Para utilizar un archivo, éste tiene que existir, es decir, las informaciones de este archivo tienen que haber sido
almacenadas sobre un soporte y ser utilizables. La creación exige organización, estructura, localización o reserva de
espacio en el soporte de almacenamiento, transferencia del archivo del soporte antiguo al nuevo.
Un archivo puede ser creado por primera vez en un soporte, proceder de otro previamente existente en el mismo
o diferente soporte, ser el resultado de un cálculo o ambas cosas a la vez.
La Figura 9.8 muestra un organigrama de la creación de un archivo ordenado de empleados de una empresa por
el campo clave (número o código de empleado).
DATOS
CREACIÓN
de un archivo
en disco
MAESTRO
(desordenado)
Número de
empleado
Maestro
ordenado
Operación de clasificación
por número empleado
Figura 9.8. Creación de un archivo ordenado de empleados.
9.5.2. Consulta de un archivo
Es la operación que permite al usuario acceder al archivo de datos para conocer el contenido de uno, varios o todos
los registros.
Proceso
de
consulta
Figura 9.9. Consulta de un archivo.
Archivos (ficheros) 319
9.5.3. Actualización de un archivo
Es la operación que permite tener actualizado (puesto al día) el archivo, de tal modo que sea posible realizar las si-
guientes operaciones con sus registros:
• Consulta del contenido de un registro.
• Inserción de un registro nuevo en el archivo.
• Supresión de un registro existente.
• Modificación de un registro.
Un ejemplo de actualización es el de un archivo de un almacén, cuyos registros contienen las existencias de cada
artículo, precios, proveedores, etc. Las existencias, precios, etc., varían continuamente y exigen una actualización
simultánea del archivo con cada operación de consulta.
Proceso
de
actualización
Figura 9.10. Actualización de un archivo (I).
Inserción
de un registro
Fin
Localizar posición
de inserción
No
Sí
Grabar
nuevo registro
Transferir áreas
de entrada a salida
Posición
libre
Figura 9.11. Actualización de un archivo (II).
9.5.4. Clasificación de un archivo
Una operación muy importante en un archivo es la clasificación u ordenación (sort, en inglés). Esta clasificación se
realizará de acuerdo con el valor de un campo específico, pudiendo ser ascendente (creciente) o descendente (decre-
ciente): alfabética o numérica (véase Figura 9.12).
320 Fundamentos de programación
Clasificación
Copia
Clasificación
Figura 9.12. Clasificación de un archivo.
9.5.5. Reorganización de un archivo
Las operaciones sobre archivos modifican la estructura inicial o la óptima de un archivo. Los índices, enlaces (pun-
teros), zonas de sinónimos, zonas de desbordamiento, etc., se modifican con el paso del tiempo, lo que hace a la
operación de acceso al registro cada vez más lenta.
La reorganización suele consistir en la copia de un nuevo archivo a partir del archivo modificado, a fin de obtener
una nueva estructura lo más óptima posible.
9.5.6. Destrucción de un archivo
Es la operación inversa a la creación de un archivo (kill, en inglés). Cuando se destruye (anula o borra) un archivo,
éste ya no se puede utilizar y, por consiguiente, no se podrá acceder a ninguno de sus registros (Figura 9.13).
9.5.7. Reunión, fusión de un archivo
Reunión. Esta operación permite obtener un archivo a partir de otros varios (Figura 9.14).
Fusión. Se realiza una fusión cuando se reúnen varios archivos en uno solo, intercalándose unos en otros, siguien-
do unos criterios determinados.
Proceso
de
reorganización
Figura 9.13. Reorganización de un archivo.
Reunión/
fusión
Figura 9.14. Fusión de archivos.
Archivos (ficheros) 321
9.5.8. Rotura/estallido de un archivo
Es la operación de obtener varios archivos a partir de un mismo archivo inicial.
Rotura
Figura 9.15. Rotura de un archivo.
9.6. GESTIÓN DE ARCHIVOS
Las operaciones sobre archivos se realizan mediante programas y el primer paso para poder gestionar un archivo
mediante un programa es declarar un identificador lógico que se asocie al nombre externo del archivo para permitir
su manipulación. La declaración se realizará con una serie de instrucciones como las que se muestran a continuación,
cuya asociación permite establecer la organización del archivo y estructura de sus registros lógicos.
tipo
registro: tipo_registro
tipo:nombre del campo
....
fin_registro
archivo_organización de tipo_de_dato:tipo_archivo
var
tipo_registro: nombre_registro
tipo_archivo:identificador_archivo
tipo
registro: Rempleado
cadena: nombre
cadena: cod
entero: edad
real: salario
fin_registro
archivo_d de rempleado:empleado
var
Rempleado: Re
Empleado: E
Las operaciones, básicas para la gestión de archivos, que tratan con la propia estructura del archivo se conside-
ran predefinidas y son:
• Crear archivos (create). Consiste en definirlo mediante un nombre y unos atributos. Si el archivo existiera con
anterioridad lo destruiría.
322 Fundamentos de programación
• Abrir o arrancar (open) un archivo que fue creado con anterioridad a la ejecución de este programa. Esta ope-
ración establece la comunicación de la CPU con el soporte físico del archivo, de forma que los registros se
vuelven accesibles para lectura, escritura o lectura/escritura.
• Incrementar o ampliar el tamaño del archivo (append, extend).
• Cerrar el archivo después que el programa ha terminado de utilizarlo (close). Cierra la comunicación entre la
CPU y el soporte físico del archivo.
• Borrar (delete) un archivo que ya existe. Borra el archivo del soporte físico, liberando espacio.
• Transferir datos desde (leer) o a (escribir) el dispositivo diseñado por el programa. Estas operaciones copian
los registros del archivo sobre variables en memoria central y viceversa.
En cuanto a las operaciones más usuales en los registros son:
• Consulta: lectura del contenido de un registro.
• Modificación: alterar la información contenida en un registro.
• Inserción: añadir un nuevo registro al archivo.
• Borrado: suprimir un registro del archivo.
9.6.1. Crear un archivo
La creación de un archivo es la operación mediante la cual se introduce la información correspondiente al archivo en
un soporte de almacenamiento de datos.
Antes de que cualquier usuario pueda procesar un archivo es preciso que éste haya sido creado previamente. El
proceso de creación de un archivo será la primera operación a realizar. Una vez que el archivo ha sido creado, la
mayoría de los usuarios simplemente desearán acceder al archivo y a la información contenida en él.
Para crear un nuevo archivo dentro de un sistema de computadora se necesitan los siguientes datos:
• Nombre dispositivo: indica el lugar donde se situará el archivo cuando se cree.
• Nombre del archivo: identifica el archivo entre los restantes archivos de una computadora.
• Tamaño del archivo: indica el espacio necesario para la creación del archivo.
• Organización del archivo: tipo de organización del archivo.
• Tamaño del bloque o registro físico: cantidad de datos que se leen o escriben en cada operación de entrada/sali-
da (E/S).
Al ejecutar la creación de un archivo se pueden generar una serie de errores, entre los que se pueden destacar los
siguientes:
• Otro archivo con el mismo nombre ya existía en el soporte.
• El dispositivo no tiene espacio disponible para crear otro nuevo archivo.
• El dispositivo no está operacional.
• Existe un problema de hardware que hace abortar el proceso.
• Uno o más de los parámetros de entrada en la instrucción son erróneos.
La instrucción o acción en pseudocódigo que permite crear un archivo se codifica con la palabra crear.
crear(var_tipo_archivo, nombre_físico)
9.6.2. Abrir un archivo
La acción de abrir (open) un archivo es permitir al usuario localizar y acceder a los archivos que fueron creados
anteriormente.
La diferencia esencial entre una instrucción de abrir un archivo y una instrucción de crear un archivo residen en
que el archivo no existe antes de utilizar crear y se supone que debe existir antes de utilizar abrir.
Archivos (ficheros) 323
La información que un sistema de tratamiento de archivos requiere para abrir un archivo es diferente de las listas
de información requerida para crear un archivo. La razón para ello reside en el hecho que toda la información que
realmente describe el archivo se escribió en éste durante el proceso de creación del archivo. Por consiguiente, la
operación crear sólo necesita localizar y leer esta información conocida como atributos del archivo.
La instrucción de abrir un archivo consiste en la creación de un canal que comunica a un usuario a través de un
programa con el archivo correspondiente situado en un soporte.
Los parámetros que se deben incluir en una instrucción de apertura (abrir) son:
• Nombre del dispositivo.
• Nombre del usuario o canal de comunicación.
• Nombre del archivo.
Al ejecutar la instrucción abrir se pueden encontrar los siguientes errores:
• Archivo no encontrado en el dispositivo especificado (nombre de archivo o identificador de dispositivo erróneo).
• Archivo ya está en uso para alguna otra aplicación del usuario.
• Errores hardware.
El formato de la instrucción es:
Abrir (var_tipo_archivo,modo,nombre_físico)
La operación de abrir archivos se puede aplicar para operaciones de lectura (l), escritura (e), lectura/escritura (l/e).
abrir (id_archivo, l, nombre_archivo)
Directorio
Archivo
Leer entrada al directorio
Leer especificaciones del archivo
Programa usuario
Crear DEMO
.
.
Abrir DEMO
Escribir entrada
directorio
Escribir especificación
archivo
Especificaciones
del archivo
CREAR _ ARCHIVO
Nombre del camino
del archivo
ABRIR _ ARCHIVO
Figura 9.16. Abrir un archivo.
324 Fundamentos de programación
Para que un archivo pueda abrirse ha de haber sido previamente creado. Cuando un archivo se abre para lectura
colocamos un hipotético puntero en el primer registro del archivo y se permitirán únicamente operaciones de lectura
de los registros del archivo. La apertura para escritura coloca dicho hipotético puntero detrás del último registro del
archivo, y dispuesto para la adición de nuevos registros en él. Ambos modos se consideran propios de archivos se-
cuenciales. Los archivos directos se abrirán en modo lectura/escritura, permitiéndose tanto la lectura como la escri-
tura de nuevos registros.
9.6.3. Cerrar archivos
El propósito de la operación de cerrar un archivo es permitir al usuario cortar el acceso o detener el uso del archi-
vo, permitiendo a otros usuarios acceder al archivo. Para ejecutar esta función, el sistema de tratamiento de archivos
sólo necesita conocer el nombre del archivo que se debe cerrar, y que previamente debía estar abierto.
Formato: Estructura:
cerrar (var_tipo-archivo Reg1 Reg2 Reg3 EOF
9.6.4. Borrar archivos
La instrucción de borrar tiene como objetivo la supresión de un archivo del soporte o dispositivo. El espacio utili-
zado por un archivo borrado puede ser utilizado para otros archivos.
La información necesaria para eliminar un archivo es:
• Nombre del dispositivo y número del canal de comunicación.
• Nombre del archivo.
Los errores que se pueden producir son:
• El archivo no se puede encontrar bien porque el nombre no es válido o porque nunca existió.
• Otros usuarios estaban actuando sobre el archivo y estaba activo.
• Se detectó un problema de hardware.
9.7. FLUJOS
Un archivo o fichero es una colección de datos relacionados. En esencia, C++ o Java visualizan cada archivo como
un flujo (stream) secuencial de bytes. En la entrada, un programa extrae bytes de un flujo de entrada y en la salida,
un programa inserta bytes en el flujo de salida. En un programa orientado a texto, cada byte representa un carácter;
en general, los bytes pueden formar una representación binaria de datos carácter o numéricos. Los bytes de un flujo
de entrada pueden venir del teclado o de un escáner, por ejemplo, pero también pueden venir de un dispositivo de
almacenamiento, tal como un disco duro o un CD, o desde otro programa. De modo similar, en un flujo de salida,
los bytes pueden fluir a la pantalla, a una impresora, a un dispositivo de almacenamiento o a otro programa. En re-
sumen, un flujo actúa como un intermediario entre el programa y el destino o fuente del flujo.
Este enfoque permite a un programa C++, Java,... tratar la entrada desde un archivo. En realidad el lenguaje tra-
ta un archivo como una serie de bytes; muchos archivos residen en un disco, pero dispositivos tales como impresoras,
discos magnéticos y ópticos, y líneas de comunicación se consideran archivos. Con este enfoque, por ejemplo, un
programa C++ examina el flujo de bytes sin necesidad de conocer su procedencia, y puede procesar la salida de modo
independiente adonde vayan los bytes.
Un archivo es un flujo secuencial de bytes. Cada archivo termina con una marca final de archivo (EOF, end-of-
file) o en un número de byte específico grabado en el sistema. Un programa que procesa un flujo de byte recibe una
indicación del sistema cuando se alcanza el final del flujo con independencia de cómo estén representados los flujos
o archivos.
Archivos (ficheros) 325
9.7.1. Tipos de flujos
Existen dos tipos de flujos en función del sentido del canal de comunicación: flujo de entrada y flujo de salida. Un
flujo de entrada lee información como una secuencia de caracteres. Estos caracteres pueden ser tecleados en la
consola de entrada, leídos de un archivo de entrada, o leídos de zócalo de una red. Un flujo de salida es una secuen-
cia de caracteres que se almacenan como información. Estos caracteres se pueden visualizar en la consola, escribir
en un archivo de salida o en zócalos de red.
Un flujo de entrada envía datos desde una fuente a un programa. Un flujo de salida envía datos desde un pro-
grama a un destino.
Desde el punto de vista de la información que contienen, los flujos se clasifican en:
• Flujos de bytes, se utilizan para manejar bytes, enteros y otros tipos de datos simples. Un tipo muy diverso se
pueden expresar en formato bytes, incluyendo datos numéricos, programas ejecutables, comunicaciones de
Internet, bytecode (archivos de clases ejecutados por una máquina virtual Java). Cada tipo de dato se puede
expresar o bien como bytes individuales o como combinación de bytes.
• Flujos de caracteres, manipulan archivos de texto y otras fuentes de texto. Se diferencian de los flujos de bytes
en que soportan el conjunto de caracteres ASCII o Unicode. Cualquier tipo de datos que implique texto debe
utilizar flujo de caracteres, incluyendo archivos de texto, páginas web o sitios comunes de texto.
9.7.2. Flujos en C++
La gestión de la entrada, implica dos etapas:
• Asociación de un flujo con una entrada a un programa.
• Conexión del flujo a un archivo.
En otras palabras, un flujo de entrada necesita dos conexiones, una en cada extremo. La conexión fin de archivo
proporciona una fuente para el flujo y la conexión fin de programa vuelca el flujo de salida al programa (la conexión
final de archivo, pero también puede ser un dispositivo, tal como un teclado). De igual modo, la gestión de salida
implica la conexión de un flujo de salida al programa y la asociación de un destino de salida con el flujo. Al igual
que sucede en una tubería del servicio del agua corriente de su ciudad, fluyen bytes en lugar de agua.
En C++ un flujo es un tipo especial de variable conocida como un objeto. Los flujos cin y cout se utilizan en
entradas y salidas. La clase istream define el operador de extracción () para los tipos primitivos. Este operador
convierte los datos a una secuencia de caracteres y los inserta en el flujo.
Los flujos cin y cout se declaran en el lenguaje por usted, pero si desea que un flujo se conecte a un archivo, se
debe declarar justo antes de que se pueda declarar cualquier otra variable.
9.7.3. Flujos en Java
El procedimiento para utilizar bien un flujo de bytes o un flujo de caracteres en Java es, en gran medida, el mismo.
Antes de comenzar a trabajar con las clases específicas de la biblioteca de clases java.io, es útil revisar el proceso de
crear y utilizar flujos.
Para un flujo de entrada, el primer paso es crear un objeto asociado con la fuente de datos. Por ejemplo, si la
fuente es un archivo de su unidad de disco duro, un objeto FileInputStream se puede asociar con este archivo.
Después que se tiene un objeto de flujo, se puede leer la información desde el flujo utilizando uno de los métodos
del objeto FileInputStream incluye un método read que devuelve un byte leído desde el teclado.
Cuando se termina de leer la información del flujo se llama al método close( ) para indicar que se ha termi-
nado de utilizar el flujo.
En el caso de un flujo de salida, se crea un objeto asociado con el destino de los datos. Tal objeto se puede crear
de la clase BufferedWriter que representa un medio eficiente de crear archivos de texto.
326 Fundamentos de programación
El método write( ) es el medio más simple para enviar información al destino del flujo de salida. Al igual que
con los flujos de entrada, el método close( ) se llama en un flujo de salida cuando no se tiene más información
que enviar.
9.7.4. Consideraciones prácticas en Java y C#
Java y C# realizan las operaciones en archivos a través de flujos, manipulados por clases, que conectan con el me-
dio de almacenamiento. De esta forma, para crear y abrir un archivo, se requiere utilizar una clase que defina la
funcionalidad del flujo. Los flujos determinan el sentido de la comunicación (lectura, escritura, o lectura/escritura),
la posibilidad de posicionamiento directo o no en un determinado registro y la forma de leer y/o escribir en el ar-
chivo. Cerrar el archivo implica cerrar el flujo. Así la siguiente instrucción en Java crea un flujo que permite la
lectura/escritura (rw) en un archivo donde se podrá efectuar posicionamiento directo y cuyo nombre externo es em-
pleados.dat.
RandomAccessFile e = new RandomAccessFile (empleados.dat, rw);
Pueden utilizarse flujos de bytes, caracteres, cadenas o tipos primitivos. Por ejemplo, en Java la clase Fi-
leInputStream permite crear un flujo para lectura secuencial de bytes desde un archivo, mientras FileReader lo
crea para la lectura secuencial de caracteres y RandomAccessFile, como ya se ha comentado, admite posiciona-
miento directo y permite la lectura/escritura de datos tipos primitivos.
La personalización de flujos se consigue por asociación o encadenamiento de otros flujos sobre los flujos base
de apertura de archivos. Una aplicación práctica de esta propiedad en Java puede ser permitir la lectura de una cade-
na de caracteres desde un flujo de entrada
BufferedReader f = new BufferedReader (new FileReader(datos.txt));
cadena = f.readLine(); //lee una cadena del archivo
f.close(); // cierra el archivo
En C# la situación es similar y sobre los flujos base, que conectan al medio de almacenamiento, pueden encade-
narse otros para efectuar tratamientos especiales de la información.
BinaryWriter f = new BinaryWriter (new FileStream(notas.dat,
FileMode.OpenOrCreate, FileAccess.Write));
/* BinaryWriter proporciona métodos para escribir tipos de
datos primitivos en formato binario */
f.Write (5.34 * 2);
f.Close(); // Cerrar el archivo
9.8. MANTENIMIENTO DE ARCHIVOS
La operación de mantenimiento de un archivo incluye todas las operaciones que sufre un archivo durante su vida y
desde su creación hasta su eliminación o borrado.
El mantenimiento de un archivo consta de dos operaciones diferentes:
• actualización,
• consulta.
La actualización es la operación de eliminar o modificar los datos ya existentes, o bien introducir nuevos datos.
En esencia, es la puesta al día de los datos del archivo.
Archivos (ficheros) 327
Las operaciones de actualización son:
• altas,
• bajas,
• modificaciones.
Las operaciones de consulta tienen como finalidad obtener información total o parcial de los datos almacena-
dos en un archivo y presentarlos en dispositivos de salida: pantalla o impresora, bien como resultados o como lis-
tados.
Todas las operaciones de mantenimiento de archivos suelen constituir módulos independientes del programa prin-
cipal y su diseño se realiza con subprogramas (subrutinas o procedimientos específicos).
Así, los subprogramas de mantenimiento de un archivo constarán de:
Altas
Una operación de alta en un archivo consiste en la adición de un nuevo registro. En un archivo de empleados, un alta
consistirá en introducir los datos de un nuevo empleado. Para situar correctamente un alta, se deberá conocer la po-
sición donde se desea almacenar el registro correspondiente: al principio, en el interior o al final de un archivo.
El algoritmo del subprograma ALTAS debe contemplar la comprobación de que el registro a dar de alta no existe
previamente.
Bajas
Una baja es la acción de eliminar un registro de un archivo. La baja de un registro se puede presentar de dos formas
distintas: indicación del registro específico que se desea dar de baja o bien visualizar los registros del archivo para
que el usuario elija el registro a borrar.
La baja de un registro puede ser lógica o física. Una baja lógica supone el no borrado del registro en el archivo.
Esta baja lógica se manifiesta en un determinado campo del registro con una bandera, indicador o “flag” —carácter
*, $, etc.—, o bien con la escritura o rellenado con espacios en blanco de algún campo en el registro específico.
Una baja física implica el borrado y desaparición del registro, de modo que se crea un nuevo archivo que no
incluye el registro dado de baja.
Modificaciones
Una modificación en un archivo consiste en la operación de cambiar total o parcialmente el contenido de uno de sus
registros.
Esta fase es típica cuando cambia el contenido de un determinado campo de un archivo; por ejemplo, la dirección
o la edad de un empleado.
La forma práctica de modificar un registro es la visualización del contenido de sus campos; para ello se debe
elegir el registro o registros a modificar. El proceso consiste en la lectura del registro, modificación de su contenido
y escritura, total o parcial del mismo.
Consulta
La operación de consulta tiene como fin visualizar la información contenida en el archivo, bien de un modo comple-
to —bien de modo parcial—, examen de uno o más registros.
Las operaciones de consulta de archivo deben contemplar diversos aspectos que faciliten la posibilidad de con-
servación de datos. Los aspectos más interesantes a tener en cuenta son:
• opción de visualización en pantalla o listado en impresora,
• detención de la consulta a voluntad del usuario,
• listado por registros o campos individuales o bien listado total del archivo (en este caso deberá existir la posi-
bilidad de impresión de listados, con opciones de saltos de página correctos).
328 Fundamentos de programación
9.8.1. Operaciones sobre registros
Las operaciones de transferencia de datos a/desde un dispositivo a la memoria central se realizan mediante las ins-
trucciones:
leer (var_tipo_archivo, lista de entrada de datos)
escribir (var_tipo_archivo, lista de salida de datos)
organización directa
lista de entrada de datos = numero_registro, nombre_registro
lista de salida de datos = numero_registro, nombre_registro
organización secuencial
lista de entrada de datos = lista_de_variables
lista de salida de datos = lista_de_expresiones
Las operaciones de acceso a un registro y de paso de un registro a otro se realiza con las acciones leer y es-
cribir.
9.9. PROCESAMIENTO DE ARCHIVOS SECUENCIALES (ALGORITMOS)
En un archivo secuencial los registros se insertan en el archivo en orden cronológico de llegada al soporte, es decir,
un registro de datos se almacena inmediatamente a continuación del registro anterior.
Los archivos secuenciales terminan con una marca final de archivo (FDA o EOF). Cuando se tengan que añadir
registros a un archivo secuencial se añadirán al final, inmediatamente por delante de las marcas fin de archivos.
Las operaciones básicas que se permiten en un archivo secuencial son: escribir su contenido, añadir un registro
al final del archivo y consultar sus registros. Las demás operaciones exigen una programación específica.
Los archivos secuenciales son los que ocupan menos memoria y son útiles cuando se desconoce a priori el tama-
ño de los datos y se requieren registros de longitud variable. También son muy empleados para el almacenamiento
de información, cuyos contenidos sufran pocas modificaciones en el transcurso de su vida útil.
Es característico de los archivos secuenciales el no poder ser utilizados simultáneamente para lectura y escri-
tura.
9.9.1. Creación
La creación de un archivo secuencial es un proceso secuencial, ya que los registros se almacenan consecutivamente
en el mismo orden en que se introducen en el archivo.
El método de creación de un archivo consiste en la ejecución de un programa adecuado que permita la entrada
de datos al archivo desde el terminal. El sistema usual es el interactivo, en el que el programa solicita los datos al
usuario que los introduce por teclado, al terminar se introduce una marca final de archivo, que supone el final físico
del archivo.
En los archivos secuenciales, EOF o FDA es una función lógica que toma el valor cierto si se ha alcanzado el final
de archivo y falso en caso contrario.
La creación del archivo requerirá los siguientes pasos:
• abrir el archivo,
• leer datos del registro,
• grabar registro,
• cerrar archivo.
Archivos (ficheros) 329
El algoritmo de creación es el siguiente:
algoritmo crea_sec
tipo
registro: datos_personales
tipo_dato1: nombre_campo1
tipo_dato2: nombre_campo2
...........................
fin_registro
archivo_s de datos_personales: arch
var
arch :f
datos_personales :persona
inicio
crear (f,nombre_en_disco)
abrir (f,e,nombre_en_disco)
leer_reg (persona)
{ utilizamos un procedimiento para no tener que detallar la lectura}
mientras no ultimo_dato(persona) hacer
escribir_f_reg (f,persona)
//la escritura se realizará campo a campo
leer_reg(persona)
fin_mientras
cerrar(f)
fin
Se considera que se permite la lectura y escritura en el archivo de los datos tal y como se almacenan en memoria.
Un archivo de texto es un archivo secuencial en el que sólo se leen y escriben series de caracteres y no sería nece-
sario especificar en la declaración del archivo el tipo de registros que lo constituyen, pues siempre son líneas.
9.9.2. Consulta
El proceso de búsqueda o consulta de una información en un archivo de organización secuencial se debe efectuar
obligatoriamente en modo secuencial. Por ejemplo, si se desea consultar la información contenida en el registro 50,
se deberán leer previamente los 49 primeros registros que le preceden en orden secuencial. En el caso de un archivo
de personal, si se desea buscar un registro determinado correspondiente a un determinado empleado, será necesario
recorrer —leer— todo el archivo desde el principio hasta encontrar el registro que se busca o la marca final de ar-
chivos.
Así, para el caso de un archivo de n registros, el número de lecturas de registros efectuadas son:
• mínimo 1, si el registro buscado es el primero del archivo,
• máximo n, si el registro buscado es el último o no existe dentro del archivo.
Por término medio, el número de lecturas necesarias para encontrar un determinado registro es:
n + 1
—-—
2
El tiempo de acceso será influyente en las operaciones de lectura/escritura. Así, en el caso de una lista o vector
de n elementos almacenados en memoria central puede suponer tiempos de microsegundos o nanosegundos; sin em-
bargo, en el caso de un archivo de n registros los tiempos de acceso son de milisegundos o fracciones/múltiples de
segundos, lo que supone un tiempo de acceso de 1.000 a 100.000 veces más grande una búsqueda de información en
un soporte externo que en memoria central.
330 Fundamentos de programación
El algoritmo de consulta de un archivo requerirá un diseño previo de la presentación de la estructura de registros
en el dispositivo de salida, de acuerdo al número y longitud de los campos.
algoritmo consulta_sec
tipo
registro: datos_personales
tipo_dato1: nombre_campo1
tipo_dato2: nombre_campo2
............: .............
fin_registro
archivo_s de datos_personales: arch
var
arch: f
datos_personales: persona
inicio
abrir(f,l,nombre_en_disco)
mientras no fda(f)hacer
leer_f_reg(f,persona)
fin_mientras
cerrar(f)
fin
o bien:
inicio
abrir(f,l,nombre_en_disco)
leer_f_reg(f, persona)
mientras no fda(f) hacer
escribir_reg(persona)
leer_f_reg(f,persona)
fin_mientras
cerrar(f)
fin
El uso de uno u otro algoritmo depende de cómo el lenguaje de programación detecta la marca de fin de archivo.
En la mayor parte de los casos el algoritmo válido es el primero, pues la marca se detecta automáticamente con la
lectura del último registro.
En el caso de búsqueda de un determinado registro, con un campo clave x, el algoritmo de búsqueda se puede
modificar en la siguiente forma con
Consulta de un registro
Si el archivo no está ordenado:
algoritmo consultal_sec
tipo
registro: datos_personales
tipo_dato1:nombre_campo1
tipo_dato2:nombre_campo2
........... : ............
fin_registro
archivo_s de datos_personales: arch
var
arch :f
datos_personales:persona
Archivos (ficheros) 331
tipo_dato1 :clavebus
lógico :encontrado
inicio
abrir(f,l,nombre en_disco)
encontrado ← falso
leer(clavebus)
mientras no encontrado y no fda(f) hacer
leer_f_reg(f, persona)
si igual(clavebus, persona) entonces
encontrado ← verdad
fin_si
fin_mientras
si no encontrado entonces
escribir ('No existe')
si_no
escribir_reg(persona)
fin_si
cerrar(f)
fin
Si el archivo está indexado en orden creciente por el campo por el cual realizamos la búsqueda se podría acelerar
el proceso, de forma que no sea necesario recorrer todo el fichero para averiguar que un determinado registro no
está:
algoritmo consulta2_sec
tipo
registro: datos_personales
tipo_dato1: nombre_campo1
tipo_dato2: nombre_campo2
............: .............
fin_registro
archivo_s de datos_personales: arch
var
arch : f
datos_personales: persona
tipo_dato1 : clavebus
lógico : encontrado, pasado
inicio
abrir(f,l,nombre_en_disco)
encontrado ← falso
pasado ← falso
leer(clavebus)
mientras no encontrado y no pasado y no fda(f) hacer
leer_f_reg(f, persona)
si igual(clavebus, persona) entonces
encontrado ← verdad
si_no
si menor(clavebus, persona) entonces
pasado ← verdad
fin_si
fin_si
fin_mientras
si no encontrado entonces
escribir ('No existe')
332 Fundamentos de programación
si_no
escribir_reg(persona)
fin_si
cerrar(f)
fin
9.9.3. Actualización
La actualización de un archivo supone:
• añadir nuevos registros (altas),
• modificar registros ya existentes (modificaciones),
• borrar registros (bajas).
Altas
La operación de dar de alta un determinado registro es similar a la operación de añadir datos a un archivo.
algoritmo añade_sec
tipo
registro: datos_personales
tipo_dato1: nombre_campo1
tipo_dato2: nombre_campo2
...........:.............
fin_registro
archivo_s de datos_personales:arch
var
arch : f
datos_personales: persona
inicio
abrir(f, e,nombre_en_disco)
leer_reg(persona)
mientras no ultimo_dato(persona) hacer
escribir_f_reg (f,persona)
leer_reg (persona)
fin_mientras
cerrar
fin
Bajas
Existen dos métodos para dar de baja un registro:
1. Se utiliza un archivo transitorio.
2. Almacenar en un array (vector) todos los registros del archivo, señalando con un indicador o bandera (flag)
el registro que se desea dar de baja.
Método 1
Se crea un segundo archivo auxiliar, también secuencial, copia del que se trata de actualizar. Se lee el archivo com-
pleto registro a registro y en función de su lectura se decide si el registro se debe dar de baja o no.
Si el registro se va a dar de baja, se omite la escritura en el archivo auxiliar o transitorio. Si el registro no se va
a dar de baja, este registro se escribe en el archivo auxiliar.
Archivos (ficheros) 333
Tras terminar la lectura del archivo original, se tendrán dos archivos: original (o maestro) y auxiliar.
Archivo
auxiliar
Actualización
Archivo
original
El proceso de bajas del archivo concluye cambiando el nombre del archivo auxiliar por el de maestro y borrando
previamente el archivo maestro original.
algoritmo bajas_s
tipo
registro: datos_personales
tipo_dato1: nombre_campo1
tipo_dato2: nombre_campo2
............:..............
fin_registro
archivo_s de datos_peersonales:arch
var
arch :f, faux
datos_personales: persona, personaaux
lógico :encontrado
inicio
abrir(f,l, 'antiguo')
crear(faux, 'nuevo')
abrir(faux, e, 'nuevo')
leer(personaaux.nombre_campo1)
encontrado ← falso
mientras no fda (f) hacer
leer_f_reg (f, persona)
si personaaux.nombre_campo1 = persona.nombre_campo1 entonces
encontrado ← verdad
si_no
escribir_f_reg (faux, persona)
fin_si
fin_mientras
si no encontrado entonces
escribir ('no esta')
fin_si
cerrar (f, faux)
borrar ('antiguo')
renombrar ('nuevo', 'antiguo')
fin
Método 2
Este procedimiento consiste en señalar los registros que se desean dar de baja con un indicador o bandera; estos re-
gistros no se graban en el nuevo archivo secuencial que se crea sin los registros dados de baja.
Modificaciones
El proceso de modificación de un registro consiste en localizar este registro, efectuar dicha modificación y a conti-
nuación reescribir el nuevo registro en el archivo. El proceso es similar al de bajas:
334 Fundamentos de programación
algoritmo modificacion_sec
tipo
registro: datos_personales
tipo_dato1: nombre_campo1
tipo_dato2: nombre_campo2
............:.............
fin
archivo_s de datos_personales: arch
var
arch : f, faux
datos_personales: persona, personaaux
lógico : encontrado
inicio
abrir(f, l, 'antiguo')
crear(faux, 'nuevo')
abrir(faux, e, 'nuevo')
leer(personaaux.nombre_campo1)
encontrado ← falso
mientras_no fda(f) hacer
leer_f_reg (f, persona)
si personaaux.nombre_campo1=persona.nombre_campo1 entonces
encontrado ← verdad
modificar (persona)
fin_si
escribir_f_reg (faux, persona)
fin_mientras
si no encontrado entonces
escribir ('no esta')
fin_si
cerrar(f, faux)
borrar('antiguo')
renombrar ('nuevo', 'antiguo')
fin
El subprograma de modificación de su registro consta de unas pocas instrucciones en las que se debe introducir
por teclado el registro completo con indicación de todos sus campos o, por el contrario, el campo o campos que se
desea modificar. El subprograma en cuestión podría ser:
procedimiento modificar(E/S datos_personales: persona)
var carácter: opcion
entero : n
inicio
escribir('R.- registro completo)
escribir('C.- campos individuales')
escribir('elija opcion:')
leer(opcion)
según_sea opcion hacer
'R'
visualizar(persona)
leer_reg(persona)
'C'
presentar(persona)
solicitar_campo(n)
introducir_campo(n, persona)
fin_según
fin_procedimiento
Archivos (ficheros) 335
9.10. PROCESAMIENTO DE ARCHIVOS DIRECTOS (ALGORITMOS)
Se dice que un archivo es aleatorio o directo cuando cualquier registro es directamente accesible mediante la especi-
ficación de un índice, que da la posición del registro con respecto al origen del fichero. Los archivos aleatorios o
directos tienen una gran rapidez para el acceso comparados con los secuenciales; los registros son fáciles de referen-
ciar —número de orden del registro—, lo que representa una gran facilidad de mantenimiento.
La lectura/escritura de un registro es rápida, ya que se accede directamente al registro y no se necesita recorrer
los anteriores.
9.10.1. Operaciones con archivos directos
Las operaciones con archivos directos son las usuales, ya vistas anteriormente.
Creación
El proceso de creación de un archivo directo o aleatorio consiste en ir introduciendo los sucesivos registros en el
soporte que los va a contener y en la dirección obtenida, resultante del algoritmo de conversión. Si al introducir un
registro se encuentra ocupada la dirección, el nuevo registro deberá ir a la zona de sinónimos o de excedentes.
algoritmo crea_dir
tipo
registro: datos_personales
tipo_dato1 : nombre_campo1
........... : ............
tipo_datoN : nombre_campoN
........... : .............
fin_registro
archivo_d de datos_personales: arch
var
arch : f
datos_personales : persona
inicio
crear(f,nombre_en_disco)
abrir(f,l/e,nombre_en_disco)
..........................
{ las operaciones pueden variar con arreglo al modo como
pensemos trabajar posteriormente con el archivo
(posicionamiento directo en un determinado registro,
transformación de clave, indexación) }
..........................
cerrar(f)
fin
En los registros de un archivo directo se suele incluir un campo —ocupado— que pueda servir para distinguir un
registro dado de baja o modificado de un alta o de otro que nunca contuvo información.
Dentro del proceso de creación del archivo podríamos considerar una inicialización de dicho campo en cada uno
de los registros del archivo directo.
algoritmo crea_dir
const
max = valor
tipo
registro: datos_personales
tipo_dato1: cod
336 Fundamentos de programación
tipo_dato2: ocupado
........... : .............
tipo_daton: nombre_campon
........... : .............
fin_registro
archivo_d de datos_personales: arch
var
arch : f
datos_personales : persona
inicio
crear(f,nombre_en_disco)
abrir(f,l/e,nombre_en_disco)
desde i ← 1 hasta Max hacer
persona.ocupado ← ' '
escribir(f, i, persona)
fin_desde
cerrar(f)
fin
Altas
La operación de altas en un archivo directo o aleatorio consiste en ir introduciendo los sucesivos registros en una
determinada posición, especificada a través del índice. Mediante el índice nos posicionaremos directamente sobre el
byte del fichero que se encuentra en la posición (indice - 1) * tamaño_de(tipo_registros_del_ar-
chivo) y escribiremos allí nuestro registro.
Tratamiento por transformación de clave
El método de transformación de clave consiste en transformar un número de orden (clave) en direcciones de alma-
cenamiento por medio de un algoritmo de conversión.
Cuando las altas se realizan por el método de transformación de clave, la dirección donde introducir un determi-
nado registro se conseguirá por la aplicación a la clave del algoritmo de conversión (HASH). Si encontráramos que
dicha dirección ya está ocupada, el nuevo registro deberá ir a la zona de sinónimos o de excedentes.
algoritmo altas_dir_trcl
const
findatos = valor1
max = valor2
tipo
registro: datos_personales
tipo_dato1: cod
tipo_dato2: ocupado
........... : ............
tipo_daton: nombre_campon
........... : .............
fin_registro
archivo_d de datos_personales: arch
var
arch : f
datos_personales : persona, personaaux
lógico : encontradohueco
entero : posi
inicio
abrir(f,l/e,nombre_en_disco)
leer(personaaux.cod)
posi ← HASH(personaaux.cod)
Archivos (ficheros) 337
leer(f, posi, persona)
si persona.ocupado = '*' entonces
encontradohueco ← falso
posi ← findatos
mientras posi  Max y no encontradohueco hacer
posi ← posi + 1
leer(f, posi, persona)
si persona.ocupado  '*' entonces
encontradohueco ← verdad
fin_si
fin_mientras
si_no
encontradohueco ← verdad
fin_si
si encontradohueco entonces
leer_otros_campos(personaaux)
persona ← personaaux
persona.ocupado ← '*'
escribir(f, posi, persona)
si_no
escribir('no está')
fin_si
cerrar(f)
fin
Consulta
El proceso de consulta de un archivo directo o aleatorio es rápido y debe comenzar con la entrada del índice corres-
pondiente al registro que deseamos consultar.
El índice permitirá el posicionamiento directo sobre el byte del fichero que se encuentra en la posición
(indice - 1) * tamaño_de(var_de_tipo_registros_del_fichero)
algoritmo consultas_dir
const
max = valor1
tipo
registro: datos_personales
{Cuando el código coincide con el índice o posición del
registro en el archivo, no resulta necesario su
almacenamiento }
tipo_dato1: ocupado
........... : ............
tipo_daton: nombre_campon
........... : .............
fin_registro
archivo_d de datos_personales: arch
var
arch : f
datos_personales : persona
lógico : encontrado
entero : posi
inicio
abrir(f,l/e,nombre_en_disco)
leer(posi)
338 Fundamentos de programación
si (posi =1) y (posi = Max) entonces
leer(f, posi, persona)
{como al escribir los datos marcamos el campo
ocupado con * }
si persona.ocupado '*' entonces
{para tener garantías en esta operación es
por lo que debemos inicializar en todos los
registros, durante el proceso de creación, el
campo ocupado a un determinado valor,
distinto de *}
encontrado ← falso
si_no
encontrado ← verdad
fin_si
si encontrado entonces
escribir_reg(persona)
si_no
escribir('no está')
fin_si
si_no
escribir('Número de registro incorrecto')
fin_si
cerrar(f)
fin
Consulta. Por transformación de clave
Puede ocurrir que la clave o código por el que deseamos acceder a un determinado registro no coincida con la posi-
ción de dicho registro en el archivo, aunque guarden entre sí una cierta relación, pues al escribir los registros en el
archivo la posición se obtuvo aplicando a la clave un algoritmo de conversión.
En este caso es imprescindible el almacenamiento de la clave en uno de los campos del registro y las operaciones
a realizar para llevar a cabo una consulta serían:
— Definir clave del registro buscado.
— Aplicar algoritmo de conversión clave a dirección.
— Lectura del registro ubicado en la dirección obtenida.
— Comparación de las claves de los registros leído y buscado y, si son distintas, exploración secuencial del
área de excedentes.
— Si tampoco se encuentra el registro en este área es que no existe.
algoritmo consultas_dir_trcl
const
findatos = valor1
max = valor2
tipo
registro: datos_personales
tipo_dato1: cod
tipo_dato2: ocupado
........... : ............
tipo_daton: nombre_campon
........... : .............
fin_registro
archivo_d de datos_personales: arch
var
arch : f
datos_personales : persona, personaaux
Archivos (ficheros) 339
lógico : encontrado
entero : posi
inicio
abrir(f,l/e,nombre_en_disco)
leer(personaaux.cod)
posi ← HASH(personaaux.cod)
leer(f, posi, persona)
si (persona.ocupado '*') o (persona.cod  personaaux.cod) entonces
encontrado ← falso
posi ← Findatos
mientras (posi  Max ) y no encontrado hacer
posi ← posi + 1
leer(f, posi, persona)
si (persona.ocupado = '*' )y
(persona.cod = personaaux.cod) entonces
encontrado ← verdad
fin_si
fin_mientras
si_no
encontrado ← verdad
fin_si
si encontrado entonces
escribir_reg(persona)
si_no
escribir('No está')
fin_si
cerrar(f)
fin
Bajas
En el proceso de bajas se considera el contenido de un campo indicador, por ejemplo, persona.ocupado, que,
cuando existe información válida en el registro está marcado con un *. Para dar de baja al registro, es decir, consi-
derar su información como no válida, eliminaremos dicho *. Este tipo de baja es una baja lógica.
Desarrollaremos a continuación un algoritmo que realice bajas lógicas y acceda a los registros a los que se desea
dar la baja por el método de transformación de clave.
algoritmo bajas_dir_trcl
const
findatos = valor1
max = valor2
tipo
registro: datos_personales
tipo_dato1: cod
tipo_dato2: ocupado
........... : ............
tipo_daton: nombre_campon
........... : .............
fin_registro
archivo_d de datos_personales: arch
var
arch : f
datos_personales : persona, personaaux
lógico : encontrado
entero : posi
340 Fundamentos de programación
inicio
abrir(f,l/e,nombre_en_disco)
leer(personaaux.cod)
posi ← HASH(personaaux.cod)
leer(f, posi, persona)
si (persona.ocupado '*') o
(persona.cod  personaaux.cod) entonces
encontrado ← falso
posi ← findatos
mientras (posi  Max) y no encontrado hacer
posi ← posi + 1
leer(f, posi, persona)
si (persona.ocupado='*') y
(persona.cod = personaaux.cod) entonces
encontrado ← verdad
fin_si
fin_mientras
si_no
encontrado ← verdad
fin_si
si encontrado entonces
persona.ocupado ← ' '
escribir(f, posi, persona)
si_no
escribir('No está')
fin_si
cerrar(f)
fin
Modificaciones
En un archivo aleatorio se localiza el registro que se desea modificar —mediante la especificación del índice o apli-
cando el algoritmo de conversión clave a dirección y, en caso necesario, la búsqueda en la zona de colisiones— se
modifica el contenido y se reescribe.
algoritmo modificaciones_dir_trcl
const
findatos = valor1
max = valor2
tipo
registro: datos_personales
tipo_dato1: cod
tipo_dato2: ocupado
........... : ............
tipo_daton: nombre_campon
........... : .............
fin_registro
archivo_d de datos_personales: arch
var
arch : f
datos_personales : persona, personaaux
lógico : encontrado
entero : posi
inicio
abrir(f,l/e,nombre_en_disco)
leer(personaaux.cod)
Archivos (ficheros) 341
posi ← HASH(personaaux.cod)
leer(f, posi, persona)
if (persona.ocupado '*') o
(persona.cod  personaaux.cod) entonces
encontrado ← falso
posi ← findatos
mientras posi  max y no encontrado hacer
posi ← posi + 1
leer(f, posi, persona)
si (persona.ocupado = '*') y (persona.cod = personaaux.cod)
entonces
encontrado ← verdad
fin_si
fin_mientras
si_no
encontrado ← verdad
fin_si
si encontrado entonces
leer_otros_campos(personaaux)
personaaux.ocupado ← '*'
escribir(f, posi, personaaux)
si_no
escribir('no está')
fin_si
cerrar(f)
fin
9.10.2. Clave-dirección
Con respecto a las transformaciones clave-dirección deberemos realizar aún algunas consideraciones.
En un soporte direccionable —normalmente un disco—, cada posición se localiza por su dirección absoluta —núme-
ro de pista y número de sector en el disco—. Los archivos directos manipulan direcciones relativas en lugar de absolutas,
lo que hará al programa independiente de la posición absoluta del archivo en el soporte. Los algoritmos de conversión
de clave transformarán las claves en direcciones relativas. Suponiendo que existen N posiciones disponibles para el archi-
vo, los algoritmos de conversión de clave producirán una dirección relativa en el rango 1 a N por cada valor de la clave.
Existen varias técnicas para obtener direcciones relativas. En el caso en que dos registros distintos produzcan la
misma dirección, se dice que se produce una colisión o sinónimo.
9.10.3. Tratamiento de las colisiones
Las colisiones son inevitables y, como se ha comentado, se originan cuando dos registros de claves diferentes pro-
ducen la misma dirección relativa. En estos casos las colisiones se pueden tratar de dos formas diferentes.
Supongamos que un registro e1 produce una dirección d1 que ya está ocupada. ¿Dónde colocar el nuevo registro?
Existen dos métodos básicos:
• Considerar una zona de excedentes y asignar el registro a la primera posición libre en dicha zona. Fue el méto-
do aplicado en los algoritmos anteriores.
• Buscar una nueva dirección libre en la zona de datos del archivo.
9.10.4. Acceso a los archivos directos mediante indexación
La indexación es una técnica para el acceso a los registros de un archivo. En esta técnica el archivo principal de re-
gistros está suplementado por uno o más índices. Los índices pueden ser archivos independientes o un array que se
342 Fundamentos de programación
carga al comenzar en la memoria del ordenador, en ambos casos estarán formados por registros con los campos có-
digo o clave y posición o número de registro.
El almacenamiento de los índices en memoria permite encontrar los registros más rápidamente que cuando se
trabaja en disco.
Cuando se utiliza un archivo indexado se localizan los registros en el índice a través del campo clave y éste re-
torna la posición del registro en el archivo principal, directo.
Las operaciones básicas a realizar con un archivo indexado son:
— Crear las zonas de índice y datos como archivos vacíos originales.
— Cargar el archivo índice en memoria antes de utilizarlo.
— Reescribir el archivo índice desde memoria después de utilizarlo.
— Añadir registros al archivo de datos y al índice.
— Borrar registros.
— Actualizar registros en el archivo de datos.
Consulta
Como ejemplo veamos la operación de consulta de un registro
algoritmo consulta_dir_ind
const
max = valor
tipo
registro: datos_personales
tipo_dato1: cod
tipo_dato2: nombre_campo2
........... : ............
tipo_daton: nombre_campon
........... : .............
fin_registro
registro: datos_indice
tipo_dato1: cod
entero : posi
fin_registro
archivo_d de datos_personales: arch
archivo_d de datos_indice : ind
array[1..max] de datos_indice: arr
var
arch : f
ind : t
arr : a
datos_personales : persona
entero : i, n, central
tipo_dato1 : cod
lógico : encontrado
inicio
abrir(f,l/e,nombre_en_disco1)
abrir(t,l/e,nombre_en_disco2)
n ← LDA(t)/tamaño_de(datos_indice)
desde i ← 1 hasta n hacer
leer(t,i,a[i])
fin_desde
cerrar(t)
{Debido a la forma de efectuar las altas el archivo
índice siempre tiene sus registros ordenados por el campo cod }
leer(cod)
busqueda_binaria(a, n, cod, central, encontrado)
Archivos (ficheros) 343
{ el procedimiento de búsqueda_binaria en un array será
desarrollado en capítulos posteriores del libro}
si encontrado entonces
leer(f, a[central].posi, persona)
escribir_reg(persona)
si_no
escribir('no está')
fin_si
cerrar(f)
fin
Altas
El procedimiento empleado para dar las altas en el archivo anterior podría ser el siguiente:
procedimiento altas(E/S arr: a E/S entero: n)
var
reg : persona
entero : p
lógico : encontrado
entero : num
inicio
si n = max entonces
escribir('lleno')
si_no
leer_reg(persona)
encontrado ← falso
busqueda_binaria(a, n, persona.cod, p, encontrado)
si encontrado entonces
escribir('Clave duplicada')
si_no
num ← LDA(f)/tamaño_de(datos_personales) + 1
{Insertamos un nuevo registro en la tabla
sin que pierda su ordenación }
alta_indice(a, n, p, persona.cod, num)
n ← n + 1
{Escribimos el nuevo registro al final del
archivo principal }
escribir(f, num, persona)
fin_si
fin_si
{ en el programa principal, al terminar, crearemos de
nuevo el archivo índice a partir de los registros
almacenados en el array a }
fin_procedimiento
9.11. PROCESAMIENTO DE ARCHIVOS SECUENCIALES INDEXADOS
Los archivos de organización secuencial indexada contienen tres áreas: un área de datos que agrupa a los registros,
un área índice que contiene los niveles de índice y una zona de desbordamiento o excedentes para el caso de actua-
lizaciones con adición de nuevos registros.
Los registros han de ser grabados obligatoriamente en orden secuencial ascendente por el contenido del campo
clave y, simultáneamente a la grabación de los registros, el sistema crea los índices.
Una consideración adicional con respecto a este tipo de organización es que es posible usar más de una clave,
hablaríamos así de la clave primaria y de una o más secundarias. El valor de la clave primaria es la base para la po-
344 Fundamentos de programación
sición física de los registros en el archivo y debe ser única. Las claves secundarias pueden ser o no únicas y no afec-
tan al orden físico de los registros.
9.12. TIPOS DE ARCHIVOS: CONSIDERACIONES PRÁCTICAS EN C/C++ Y JAVA
Los archivos se pueden clasificar en función de determinadas características. Entre ellas las más usuales son: por el
tipo de acceso o por la estructura de la información del archivo.
Dirección del flujo de datos
Los archivos se clasifican en función del flujo de los datos o por el modo de acceso a los datos del archivo. En fun-
ción de la dirección del flujo de los datos son de:
• Entrada. Aquellos cuyos datos se leen por parte del programa (archivos de lectura).
• Salida. Archivos que escribe el programa (archivos de escritura).
• Entrada/Salida. Archivos en los que se puede leer y escribir.
La determinación del tipo de archivo se realiza en el momento de la creación del archivo.
Tipos de acceso
Los archivos se clasifican en:
• Secuenciales. El orden de acceso a los datos es secuencial; primero se accede al primer elemento, luego al
segundo y así sucesivamente.
• Directos (aleatorios). El acceso a un elemento concreto del archivo es directo. Son similares a las tablas.
Estructura de la información
Los archivos guardan información en formato binario y se distribuye en una secuencia o flujo de bytes. Teniendo en
cuenta la información almacenada los archivos se clasifican en:
• Texto. En estos archivos se guardan solamente ciertos caracteres imprimibles, tales como letras, números y
signos de puntuación, salto de línea, etc. Están permitidos ciertos rangos de valores para cada byte. En un archi-
vo de texto no está permitido el byte de final de archivo y si existe no se puede ver más allá de la posición
donde está el byte.
• Binarios. Contienen cualquier valor que se pueda almacenar en un byte.
El tipo de información almacenada en los archivos se define a la hora de abrirlos (para lectura, escritura). Con
posterioridad, cada operación leerá los bytes correspondientes al tipo de datos.
Un archivo de texto es un caso particular de archivo de organización secuencial y es una serie continua de carac-
teres que se pueden leer uno tras otro. Cada registro de un archivo de texto es del tipo de cadena de caracteres.
El tratamiento de archivos de texto es elemental y en el caso de lenguajes como Pascal es posible detectar lectu-
ras de caracteres especiales como final de archivo o final de línea.
9.12.1. Archivos de texto
Los archivos de texto también se denominan archivos ASCII y son legibles por los usuarios o programadores. Los
terminales, los teclados y las impresoras tratan con datos carácter. Así, cuando se desea escribir un número como
“1234” en la pantalla se debe convertir a cuatro caracteres (“1”, “2”, “3”, “4”) y ser escritos en el terminal.
Archivos (ficheros) 345
De modo similar cuando se lee un número de teclado, los datos se deben convertir de caracteres a enteros. En el
caso del lenguaje C++ esta operación se realiza con el operador . Las computadoras trabajan con datos binarios.
Cuando se leen números de un archivo ASCII, el programa debe procesar los datos carácter a través de una rutina de
conversión, lo que entraña grandes recursos. Los archivos binarios, por el contrario, no requieren conversión e inclu-
so ocupan menos espacio que los archivos ASCII; su gran inconveniente es que los archivos binarios no se pueden
imprimir directamente en una impresora ni visualizar en un terminal.
Los archivos ASCII son portables (en la mayoría de los casos) y se pueden mover de una computadora a otra sin
grandes problemas. Sin embargo, los archivos binarios son prácticamente no portables; a menos que sea un progra-
mador experto es casi imposible hacer portable un archivo binario.
9.12.2. Archivos binarios
Los archivos binarios contienen cualquier valor que se puede almacenar en un byte. En estos archivos el final del
archivo no se almacena como un byte concreto. Los archivos binarios se escriben copiando una imagen del conteni-
do de un segmento de la memoria al disco y por consiguiente los valores numéricos aparecen como unos caracteres
extraños que se corresponden con la codificación de dichos valores en la memoria de la computadora, aunque apa-
rentemente son prácticamente indescifrables para el programador o el usuario.
Cuando se intenta abrir un archivo binario con el editor aparecerán secuencias de caracteres tales como:
E#@%Âa^^...
¿Cuál es el archivo más recomendable para utilizar? En la mayoría de los casos, el ASCII es el mejor. Si se
tienen pequeñas a medianas cantidades de datos el tiempo de conversión no afecta seriamente a su programa. Por
otra parte los archivos ASCII también facilitan la verificación de los datos. Por el contrario, sólo cuando se utilizan
grandes cantidades de datos los problemas de espacio y rendimiento, normalmente, aconsejarán utilizar formatos
binarios.
Los archivos de texto se suelen denominar con la extensión .txt, mientras que los archivos binarios suelen tener
la extensión .dat. Los archivos de texto son muy eficientes para intercambiar datos entre aplicaciones y para pro-
porcionar datos de entrada de programas que se deban ejecutar varias veces; por el contrario, son poco eficientes para
manejar grandes volúmenes de información o bases de datos. Por otra parte, todos los archivos binarios permiten
acceso directo, lo cual es muy útil para manejar grandes archivos o bases de datos, ya que se puede ir directamente
a leer el registro n sin tener que leer antes el primero, el segundo,…, el n – 1 registros anteriores
9.12.3. Lectura y escritura de archivos
Las operaciones típicas sobre un archivo son: creación, lectura y escritura. En el caso de C++ los archivos se mani-
pulan mediante un tipo de objeto flujo. Normalmente los objetos que se usan para tratar con archivos se llaman ar-
chivos lógicos y archivos físicos son aquellos que almacenan realmente la información en disco (o dispositivos de
memoria secundaria correspondiente: disco duro, discos ópticos, memorias flash, etc.).
En el caso del lenguaje C++, para todas las operaciones con archivo se necesita utilizar la biblioteca de cabecera
fstream.h por lo que es preciso que los programas inserten la sentencia
#include fstream.h
o bien en el caso de ANSI C++ estándar
#include fstream 
using namespace std;
En general, todo tratamiento de un archivo consta de tres pasos importantes:
• Apertura del archivo. El modo de implementar la operación dependerá de si un archivo es de lectura o escritura.
• Acceso al archivo. En esta etapa se llega o imprimen los datos.
• Cierre del archivo. Actualiza el archivo y se elimina la información no significativa.
346 Fundamentos de programación
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
9.1. Escribir un algoritmo que permita la creación e introducción de los primeros datos en un archivo secuencial, PER-
SONAL, que deseamos almacene la información mediante registros de siguiente tipo.
tipo
registro: datos_personales
tipo_dato1 : nombre_campo1
tipo_dato2 : nombre_campo2
............ : .............
fin_registro
Análisis del problema
Tras la creación y apertura en modo conveniente del archivo, el algoritmo solicitará la introducción de datos por teclado y
los almacenará de forma consecutiva en el archivo.
Se utilizará una función, ultimo_dato(persona), para determinar el fin en la introducción de datos.
Diseño del algoritmo
algoritmo Ejercicio_9_1
tipo
registro: datos_personales
tipo_dato1 : nombre_campo1
tipo_dato2 : nombre_campo2
............ : .............
fin_registro
archivo_s de datos_personales: arch
var
arch : f
datos_personales : persona
inicio
crear (f, 'Personal')
abrir (f,e,'Personal')
llamar_a leer_reg (persona)
// Procedimiento para la lectura de un
// registro campo a campo
mientras no ultimo_dato(persona) hacer
llamar_a escribir_f_reg (f, persona)
// Procedimiento auxiliar, no desarrollado, para la
// escritura en el archivo del registro campo a campo
llamar_a leer_reg(persona)
fin_mientras
cerrar (f)
fin
9.2. Supuesto que deseamos añadir nueva información al archivo PERSONAL, anteriormente creado, diseñar el algoritmo
correspondiente.
Análisis del problema
Al abrir el archivo, para escritura se coloca el puntero de datos al final del mismo, permitiéndonos, con un algoritmo simi-
lar al anterior, la adición de nueva información al final del mismo.
Diseño del algoritmo
algoritmo Ejercicio_9_2
tipo
registro: datos_personales
tipo_dato1 : nombre_campo1
Archivos (ficheros) 347
tipo_dato2 : nombre_campo2
............ : .............
fin_registro
archivo_s de datos_personales: arch
var
arch : f
datos_personales : persona
inicio
abrir (f,e,'PERSONAL')
llamar_a leer_reg (persona)
mientras no ultimo_dato (persona) hacer
llamar_a escribir_f_reg (f, persona)
llamar_a leer_reg (persona)
fin_mientras
cerrar (f)
fin
9.3. Diseñar un algoritmo que muestre por pantalla el contenido de todos los registros del archivo PERSONAL.
Análisis del problema
Se debe abrir el archivo para lectura y, repetitivamente, leer los registros y mostrarlos por pantalla hasta detectar el fin de
fichero.
Se considera que la función FDA(id_arch) detecta el final de archivo con la lectura de su último registro.
Diseño del algoritmo
algoritmo Ejercicio_9_3
tipo
registro: datos_personales
tipo_dato1: nombre_campo1
tipo_dato2: nombre_campo2
............: .............
fin_registro
archivo_s de datos_personales: arch
var
arch : f
datos_personales : persona
inicio
abrir (f,l,'PERSONAL')
mientras no fda (f) hacer
llamar_a leer_f_reg (f, persona)
llamar_a escribir_reg (persona)
fin_mientras
cerrar (f)
fin
Si se considera la existencia de un registro especial que marca el fin de archivo, la función FDA(id_arch) se activaría al
leer este registro y es necesario modificar algo nuestro algoritmo.
inicio
abrir (f,l,'PERSONAL')
llamar_a leer_f_reg (f, persona)
mientras no fda (f) hacer
llamar_a escribir_reg (persona)
llamar_a leer_f_reg (f, persona)
fin_mientras
cerrar (f)
fin
348 Fundamentos de programación
9.4. Una librería almacena en un archivo secuencial la siguiente información sobre cada uno de sus libros: CODIGO, TI-
TULO, AUTOR y PRECIO.
El archivo está ordenado ascendentemente por los códigos de los libros —de tipo cadena—, que no pueden re-
petirse.
Se precisa un algoritmo con las opciones:
1. Insertar: Permitirá insertar nuevos registros en el archivo, que debe mantenerse ordenado en todo mo-
mento.
2. Consulta: Buscará registros por el campo CODIGO.
Análisis del problema
El algoritmo comenzará presentando un menú de opciones a través del cual se haga posible la selección de un procedimien-
to u otro.
Insertar: Para poder colocar el nuevo registro en el lugar adecuado, sin que se pierda la ordenación inicial, se
necesita utilizar un archivo auxiliar. En dicho auxiliar se van copiando los registros hasta llegar al punto
donde debe colocarse el nuevo, entonces se escribe y continua con la copia de los restantes registros.
Consulta: Como el archivo está ordenado y los códigos no repetidos, el proceso de consulta se puede acelerar. Se
recorre el archivo de forma secuencial hasta encontrar el código buscado, o hasta que éste sea menor
que el código del registro que se acaba de leer desde el archivo, o bien, si nada de esto ocurre, hasta el
fin del archivo.
Cuando el código buscado es menor que el código del registro que se acaba de leer desde el archivo,
se puede deducir que de ahí en adelante ese registro ya no podrá estar en el fichero, por tanto, se puede
abandonar la búsqueda.
Diseño del algoritmo
algoritmo Ejercicio_9_4
tipo
registro : reg
cadena : cod
cadena : titulo
cadena : autor
entero : precio
fin_registro
archivo_s de reg : arch
var
entero : op
inicio
repetir
escribir( 'MENU')
escribir( '1.- INSERTAR')
escribir( '2.- CONSULTA')
escribir( '3.- FIN')
escribir( 'Elija opcion ')
leer (op )
según_sea op hacer
1 : llamar_a insertar
2 : llamar_a consulta
fin_según
hasta_que op = 3
fin
procedimiento insertar
var
arch : f, f2
reg : rf,r
Archivos (ficheros) 349
lógico : escrito
carácter : resp
inicio
repetir
abrir (f,1,'Libros.dat')
crear (f2, 'Nlibros.dat')
abrir (f2,e, 'Nlibros.dat')
escribir ('Deme el codigo')
leer (r.cod)
escrito ← falso
mientras no FDA(f) hacer
llamar_a leer_arch_reg ( f, rf)
si rf.cod  r.cod y no escrito entonces
// si se lee del archivo un registro con codigo
// mayor que el nuevo y este aun no se
// ha escrito, es el momento de insertarlo
escribir( 'Deme otros campos ')
llamar_a completar ( r )
llamar_a escribir_arch_reg ( f2, r )
escrito ← verdad
// Se debe marcar que se ha escrito
// para que no siga insertandose, desde aqui
// en adelante
si_no
si rf.cod = r.cod entonces
escrito ← verdad
fin_si
fin_si
llamar_a escribir_arch_reg ( f2, rf )
// De todas formas se escribe el que
// se lee del archivo
fin_mientras
si no escrito entonces
// Si el codigo del nuevo es mayor que todos los del
// archivo inicial, se llega al final sin haberlo
// escrito
escribir ('Deme otros campos')
llamar_a completar (r)
llamar_a escribir_arch_reg ( f2, r )
fin_si
cerrar (f, f2)
borrar ( 'Libros.dat')
renombrar ('Libros.dat', 'Libros.dat')
escribir ('¿Seguir? (s/n) ')
leer ( resp )
hasta_que resp = 'n'
fin_procedimiento
procedimiento consulta
var
reg: rf, r
arch: f
carácter: resp
lógico: encontrado, pasado
inicio
resp ← 's'
mientras resp  'n' hacer
abrir (f, 1, 'Libros.dat')
escribir ('Deme el codigo a buscar ')
350 Fundamentos de programación
leer ( r.cod)
encontrado ← falso
pasado ← falso
mientras no FDA (f) y no encontrado y no pasado hacer
llamar_a leer_arch_reg (f, rf)
si r.cod = rf.cod entonces
encontrado ← verdad
llamar_a escribir_reg ( rf )
si_no
si r.cod  rf.cod entonces
pasado ← verdad
fin_si
fin_si
fin_mientras
si no encontrado entonces
escribir ( 'Ese libro no esta')
fin_si
cerrar (f)
escribir ('¿Seguir? (s/n)')
leer ( resp )
fin_mientras
fin_procedimiento
9.5. Diseñar un algoritmo que efectúe la creación de un archivo directo —PERSONAL—, cuyos registros serán del siguien-
te tipo:
tipo
registro: datos_personales
tipo_dato1 : cod // Campo clave
........... : .............
tipo_datoN : nombre_campoN
fin_registro
y en el que, posteriormente, vamos a introducir la información empleando el método de transformación de clave.
Análisis del problema
El método de transformación de claves consiste en introducir los registros, en el soporte que los va a contener, en la direc-
ción que proporciona el algoritmo de conversión. Su utilización obliga al almacenamiento del código en el propio registro
y hace conveniente la inclusión en el registro de un campo auxiliar —ocupado— en el que se marque si el registro está o
no ocupado. Durante el proceso de creación se debe realizar un recorrido de todo el archivo inicializando el campo ocupa-
do a vacío, por ejemplo, a espacio.
Diseño del algoritmo
algoritmo Ejercicio_9_5
const
Max = valor
tipo
registro: datos_personales
tipo_dato1 : cod // Podria no ser necesario
// su almacenamiento, en el caso
// de que coincidiera con el
// indice
............ : .............
tipo_daton : nombre_campon
fin_registro
archivo_d de datos_personales: arch
Archivos (ficheros) 351
var
arch : f
datos personales : persona
entero : i
inicio
crear (f, 'PERSONAL')
abrir (f,1/e, 'PERSONAL')
desde i ← 1 hasta Max hacer
persona.ocupado
escribir (f, persona, i)
fin_desde
cerrar (f)
fin
9.6. Se desea introducir información, por el método de transformación de clave, en el archivo PERSONAL creado en el
ejercicio anterior, diseñar el algoritmo correspondiente.
Análisis del problema
Como anteriormente se ha explicado, el método de transformación de claves consiste en introducir los registros, en el so-
porte que los va a contener, en la dirección que proporciona el algoritmo de conversión.
A veces, registros distintos, sometidos al algoritmo de conversión, proporcionan una misma dirección, por lo que se
debe tener previsto un espacio en el disco para el almacenamiento de los registros que han consolidado. Aunque se puede
hacer de diferentes maneras, en este caso se reserva espacio para las colisiones en el propio fichero a continuación de la
zona de datos.
Se supone que la dirección más alta capaz de proporcionar el algoritmo de conversión es Findatos y se colocan las
colisiones que se produzcan a partir de allí en posiciones consecutivas del archivo.
La inicialización a espacio del campo ocupado se realiza hasta Max, dando por supuesto que Max es mayor que Fin-
datos.
Diseño del algoritmo
algoritmo Ejercicio_9_6
const
Findatos = valor1
Max = valor2
tipo
registro: datos_peronales
tipo_dato1 : cod // Podría no ser necesario
// su almacenamiento, en el caso
// de que coincidiera con el
// indice
............ : .............
tipo_daton : nombre_campon
fin_registro
archivo_d de datos_personales: arch
var
arch : f
datos personales : persona, personaaux
lógico : encontradohueco
entero : i
inicio
abrir (f,1/e, 'PERSONAL')
leer (personaaux.cod)
posi ← HASH (personaaux.cod)
// HASH es el nombre de la funcion de transformacion de
// claves. La cual devolvera valores
// entre 1 y Findatos, ambos inclusive
352 Fundamentos de programación
leer(f, persona, posi)
si persona.ocupado ='*' entonces //El '*' indica que esta
//ocupado
encontradohueco ← falso
posi ← Findatos
mientras posi  Max y no encontradohueco hacer
posi ← posi + 1
leer(f, persona, posi)
si persona.ocupado  '*' entonces
encontradohueco ← verdad
fin_si
fin_mientras
si_no
encontradohueco ← verdad
fin_si
si encontradohueco entonces
llamar_a leer_otros_campos (personaaux)
persona ← personaaux
persona.ocupado ← '*' //Al dar un alta marcaremos
//el campo ocupado
escribir(f, persona, posi)
si_no
escribir ('No esta')
fin_si
cerrar (f)
fin
CONCEPTOS CLAVE
• Archivos de texto.
• Concepto de flujo.
• Organización de archivos.
• Organización directa
• Organización secuencial.
• Organización secuencial indexada.
• Registro físico.
• Registro lógico.
RESUMEN
Un archivo de datos es un conjunto de datos relacionados
entre sí y almacenados en un dispositivo de almacenamien-
to externo. Estos datos se encuentran estructurados en una
colección de entidades denominadas artículos o registros, de
igual tipo, y que constan a su vez de diferentes entidades de
nivel más bajo denominadas campos. Un archivo de texto
es el que está formado por líneas, constituidas a su vez por
una serie de caracteres, que podrían representar los registros
en este tipo de archivos. Por otra parte, los archivos pueden
ser binarios y almacenar no sólo caracteres sino cualquier
tipo de información tal y como se encuentra en memoria.
1. Java y C# realizan las operaciones en archivos a
través de flujos, manipulados por clases, que co-
nectan con el medio de almacenamiento. De forma
que para crear, leer o escribir un archivo se requiere
utilizar una clase que defina la funcionalidad
del flujo. Los flujos determinan el sentido de la
comunicación (lectura, escritura o lectura/escritura),
el posicionamiento directo o no en un determinado
registro y la forma de leer y/o escribir en el
archivo. Pueden utilizarse flujos de bytes cadenas
o tipos primitivos. La personalización de flujos se
consigue por asociación o encadenamiento de otros
flujos con los flujos base de apertura de archivos.
2. Registro lógico es una colección de información
relativa a una entidad particular. El concepto de
registro es similar al de estructura desde el punto
de vista de que permiten almacenar datos de tipo
heterogéneo.
Archivos (ficheros) 353
3. Registro físico es la cantidad más pequeña de
datos que pueden transferirse en una operación de
entrada/salida entre la memoria central y los dis-
positivos.
4. La organización de archivos define la forma en la
que los archivos se disponen sobre el soporte de
almacenamiento y puede ser secuencial, directa o
secuencial-indexada.
5. La organización secuencial implica que los re-
gistros se almacenan unos al lado de otros en el
orden en el que van siendo introducidos y que para
efectuar el acceso a un determinado registro es
necesario pasar por los que le preceden.
6. Los archivos de texto se consideran una clase espe-
cial de archivos secuenciales.
7. En la organización directa el orden físico de los
registros puede no corresponderse con aquel en el
que han sido introducidos y el acceso a un determi-
nado registro no obliga a pasar por los que le prece-
den. Para poder acceder a un determinado registro
de esta forma se necesita un soporte direccionable
y la longitud de los registros debe ser fija.
8. La organización secuencial-indexada requiere la
existencia de un área de datos, un área de índices,
un área de desbordamiento o colisiones y soporte
direccionable.
EJERCICIOS
9.1. Diseñar un algoritmo que permita crear un archivo
AGENDA de direcciones cuyos registros constan de los
siguientes campos:
NOMBRE
DIRECCION
CIUDAD
CODIGO POSTAL
TELEFONO
EDAD
9.2. Realizar un algoritmo que lea el archivo AGENDA e
imprima los registros de toda la agenda.
9.3. Diseñar un algoritmo que copie el archivo secuencial
AGENDA de los ejercicios anteriores en un archivo di-
recto DIRECTO_AGENDA, de modo que cada registro
mantenga su posición relativa.
9.4. Se dispone de un archivo indexado denominado DI-
RECTORIO, que contiene los datos de un conjunto de
personas y cuya clave es el número del DNI. Escribir
un algoritmo capaz de realizar una consulta de un
registro. Si no se encuentra el registro se emite el
correspondiente mensaje de ERROR.
9.5. Se dispone de un archivo STOCK correspondiente a la
existencia de artículos de un almacén y se desea se-
ñalar aquellos artículos cuyo nivel está por debajo del
mínimo y que visualicen un mensaje “hacer pedido”.
Cada artículo contiene un registro con los siguientes
campos: número del código del artículo, nivel míni-
mo, nivel actual, proveedor, precio.
9.6. El director de un colegio desea realizar un programa
que procese un archivo de registros correspondiente
a los diferentes alumnos del centro a fin de obtener
los siguientes datos:
• Nota más alta y número de identificación del alum-
no correspondiente.
• Nota media por curso.
• Nota media del colegio.
NOTA: Si existen varios alumnos con la misma nota
más alta, se deberán visualizar todos ellos.
9.7. Diseñar un algoritmo que genere un archivo secuen-
cial BIBLIOTECA, cuyos registros contienen los si-
guientes campos:
TITULO
AUTOR
EDITORIAL
AÑO DE EDICION
ISBN
NUMERO DE PAGINAS
9.8. Diseñar un algoritmo que permita modificar el con-
tenido de alguno de los registros del archivo secuen-
cial BIBLIOTECA mediante datos introducidos por
teclado.
Fundamentos_de_programacion_Algoritmos_e.pdf
CAPÍTULO 10
Ordenación, búsqueda
e intercalación
10.1. Introducción
10.2. Ordenación
10.3. Búsqueda
10.4. Intercalación
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
CONCEPTOS CLAVE
RESUMEN
EJERCICIOS
Las computadoras emplean una gran parte de su
tiempo en operaciones de búsqueda, clasificación y
mezcla de datos. Las operaciones de cálculo numérico
y sobre todo de gestión requieren normalmente ope-
raciones de clasificación de los datos: ordenar fichas
de clientes por orden alfabético, por direcciones o por
código postal. Existen dos métodos de ordenación:
ordenación interna (de arrays, arreglos) y ordena-
ción externa (archivos). Los arrays se almacenan en la
memoria interna o central, de acceso aleatorio y di-
recto, y por ello su gestión es rápida. Los archivos se
sitúan adecuadamente en dispositivos de almacena-
miento externo que son más lentos y basados en dis-
positivos mecánicos: cintas y discos magnéticos. Las
técnicas de ordenación, búsqueda y mezcla son muy
importantes y el lector deberá dedicar especial aten-
ción al conocimiento y aprendizaje de los diferentes
métodos que en este capítulo se analizan.
INTRODUCCIÓN
356 Fundamentos de programación
10.1. INTRODUCCIÓN
Ordenación, búsqueda y, en menor medida, intercalación son operaciones básicas en el campo de la documentación
y en las que, según señalan las estadísticas, las computadoras emplean la mitad de su tiempo.
Aunque su uso puede ser con vectores (arrays) y con archivos, este capítulo se referirá a vectores.
La ordenación (clasificación) es la operación de organizar un conjunto de datos en algún orden dado, tal como
creciente o decreciente en datos numéricos, o bien en orden alfabético directo o inverso. Operaciones típicas de or-
denación son: lista de números, archivos de clientes de banco, nombres de una agenda telefónica, etc. En síntesis, la
ordenación significa poner objetos en orden (orden numérico para los números y alfabético para los caracteres) as-
cendente o descendente.
Por ejemplo, las clasificaciones de los equipos de fútbol de la liga en la 1.ª división española se pueden organizar
en orden alfabético creciente/decreciente o bien por clasificación numérica ascendente/descendente.
Los nombres de los equipos y los puntos de cada equipo se almacenan en dos vectores:
equipo [1] = 'Real Madrid' puntos [1] = 10
equipo [2] = 'Barcelona' puntos [2] = 14
equipo [3] = 'Valencia' puntos [3] = 8
equipo [4] = 'Oviedo' puntos [4] = 12
equipo [5] = 'Betis' puntos [5] = 16
Si los vectores se ponen en orden decreciente de puntos de clasificación:
equipo [5] = 'Betis' puntos [5] = 16
equipo [2] = 'Barcelona' puntos [2] = 14
equipo [4] = 'Oviedo puntos [4] = 12
equipo [1] = 'Real Madrid' puntos [1] = 10
equipo [3] = 'Valencia' puntos [3] = 8
Los nombres de los equipos y los puntos conseguidos en el campeonato de Liga anterior, ordenados de modo
alfabético serían:
equipo [1] = 'Barcelona' puntos [1] = 5
equipo [2] = 'Cádiz' puntos [2] = 13
equipo [3] = 'Málaga' puntos [3] = 12
equipo [4] = 'Oviedo' puntos [4] = 8
equipo [5] = 'Real Madrid' puntos [5] = 4
equipo [6] = 'Valencia' puntos [6] = 16
o bien se pueden situar en orden numérico decreciente:
equipo [6] = 'Valencia' puntos [6] = 16
equipo [2] = 'Cádiz' puntos [2] = 13
equipo [3] = 'Málaga' puntos [3] = 12
equipo [4] = 'Oviedo' puntos [4] = 8
equipo [1] = 'Barcelona' puntos [1] = 5
equipo [5] = 'Real Madrid' puntos [5] = 4
Los vectores anteriores comienzan en orden alfabético de equipos y se reordenan en orden descendente de “pun-
tos”. El listín telefónico se clasifica en orden alfabético de abonados; un archivo de clientes de una entidad bancaria
normalmente se clasifica en orden ascendente de números de cuenta. El propósito final de la clasificación es facilitar
la manipulación de datos en un vector o en un archivo.
Algunos autores diferencian entre un conjunto o vector clasificado (sorted) y vector ordenado (ordered set). Un
conjunto ordenado es aquel en el que el orden de aparición de los elementos afecta al significado de la estructura
completa de datos: puede estar clasificado, pero no es imprescindible. Un conjunto clasificado es aquel en que los
valores de los elementos han sido utilizados para disponerlos en un orden particular: es, probablemente, un conjunto
ordenado, pero no necesariamente.
Ordenación, búsqueda e intercalación 357
Es importante estudiar la clasificación por dos razones. Una es que la clasificación de datos es tan frecuente que
todos los usuarios de computadoras deben conocer estas técnicas. La segunda es que es una aplicación que se puede
describir fácilmente, pero que es bastante difícil conseguir el diseño y escritura de buenos algoritmos.
La clasificación de los elementos numéricos del vector
7, 3, 2, 1, 9, 6, 7, 5, 4
en orden ascendente producirá
1, 2, 3, 4, 5, 6, 7, 7, 9
Obsérvese que pueden existir elementos de igual valor dentro de un vector.
Existen muchos algoritmos de clasificación, con diferentes ventajas e inconvenientes. Uno de los objetivos de este
capítulo y del Capítulo 11 es el estudio de los métodos de clasificación más usuales y de mayor aplicación.
La búsqueda de información es, al igual que la ordenación, otra operación muy frecuente en el tratamiento de
información. La búsqueda es una actividad que se realiza diariamente en cualquier aspecto de la vida: búsqueda de
palabras en un diccionario, nombres en una guía telefónica, localización de libros en una librería. A medida que la
información se almacena en una computadora, la recuperación y búsqueda de esa información se convierte en una
tarea principal de dicha computadora.
10.2. ORDENACIÓN
En un vector es necesario, con frecuencia, clasificar u ordenar sus elementos en un orden particular. Por ejemplo,
clasificar un conjunto de números en orden creciente o una lista de nombres por orden alfabético.
La clasificación es una operación tan frecuente en programas de computadora que una gran cantidad de algoritmos
se han diseñado para clasificar listas de elementos con eficacia y rapidez.
La elección de un determinado algoritmo depende del tamaño del vector o array (arreglo) a clasificar, el tipo de
datos y la cantidad de memoria disponible.
La ordenación o clasificación es el proceso de organizar datos en algún orden o secuencia específica, tal como
creciente o decreciente para datos numéricos o alfabéticamente para datos de caracteres.
Los métodos de ordenación se dividen en dos categorías:
• Ordenación de vectores, tablas (arrays o arreglos).
• Ordenación de archivos.
La ordenación de arrays se denomina también ordenación interna, ya que se almacena en la memoria interna de
la computadora de gran velocidad y acceso aleatorio. La ordenación de archivos se suele hacer casi siempre sobre
soportes de almacenamiento externo, discos, cintas, etc., y, por ello, se denomina también ordenación externa. Estos
dispositivos son más lentos en las operaciones de entrada/salida, pero, por el contrario, pueden contener mayor can-
tidad de información.
Ordenación interna: clasificación de los valores de un vector según un orden en memoria central: rápida.
Ordenación externa: clasificación de los registros de un archivo situado en un soporte externo: menos rápido.
EJEMPLO
Clasificación en orden ascendente del vector.
7, 3, 2, 1, 9, 6, 7, 5, 4
se obtendrá el nuevo vector
1, 2, 3, 4, 5, 6, 7, 7, 9
Los métodos de clasificación se explicarán aplicados a vectores (arrays unidimensionales), pero se pueden exten-
der a matrices o tablas (arrays o arreglos bidimensionales), considerando la ordenación respecto a una fila o columna.
358 Fundamentos de programación
Los métodos directos son los que se realizan en el espacio ocupado por el array. Los más populares son:
• Intercambio.
• Selección.
• Inserción.
10.2.1. Método de intercambio o de burbuja
El algoritmo de clasificación de intercambio o de la burbuja se basa en el principio de comparar pares de elementos
adyacentes e intercambiarlos entre sí hasta que estén todos ordenados.
Supongamos que se desea clasificar en orden ascendente el vector o lista
50
A[1]
15
A[2]
56
A[3]
14
A[4]
35
A[5]
1
A[6]
12
A[7]
9
A[8]
Los pasos a dar son:
1. Comparar A[1] y A[2]; si están en orden, se mantienen como están, en caso contrario se intercambian entre
sí.
2. A continuación se comparan los elementos 2 y 3; de nuevo se intercambian si es necesario.
3. El proceso continúa hasta que cada elemento del vector ha sido comparado con sus elementos adyacentes y
se han realizado los intercambios necesarios.
El método expresado en pseudocódigo en el primer diseño es:
desde I ← 1 hasta 7 hacer
si elemento[I]  elemento[I + 1] entonces
intercambiar (elemento[I], elemento [I + 1])
fin_si
fin_desde
La acción intercambiar entre sí los valores de dos elementos A[I], A[I+1] es una acción compuesta que con-
tiene las siguientes acciones, considerando una variable auxiliar AUX.
AUX ← A[I]
A[I] ← A[I+1]
A[I+1] ← AUXI
En realidad, el proceso gráfico es
A[I] A[I + 1]
AUX
El elemento cuyo valor es mayor sube posición a posición hacia el final de la lista, al igual que las burbujas de
aire en un depósito o botella de agua. Tras realizar un recorrido completo por todo el vector, el elemento menciona-
do habrá subido en la lista y ocupará la última posición. En el segundo recorrido, el segundo elemento llegará a la
penúltima, y así sucesivamente.
En el ejercicio citado anteriormente los sucesivos pasos con cada una de las operaciones se muestran en las Fi-
guras 10.1 y 10.2.
Ordenación, búsqueda e intercalación 359
vector
inicial
A[1]
A[2]
A[3]
A[4]
A[5]
A[6]
A[7]
A[8]
1.ª
comp.
50
15
56
14
35
1
12
9
2.ª
comp.
15
50
56
14
35
1
12
9
...
15
50
56
14
35
1
12
9
15
50
14
56
35
1
12
9
15
50
14
35
56
1
12
9
15
50
14
35
1
56
12
9
15
50
14
35
1
12
56
9
15
50
14
35
1
12
9
56
Figura 10.1. Método de la burbuja (paso 1).
Si se efectúa n – 1 veces la operación sobre una tabla de n valores se tiene ordenada la tabla. Cada operación
requiere n – 1 comprobaciones o test y como máximo n – 1 intercambios. La ordenación total exigirá un máximo de
(n – 1) * (n – 1) = (n – 1)2
intercambios de elementos.
Los estados sucesivos del vector se indican en la Figura 10.2:
Estado inicial Después de paso 1 Después de paso 2
50
15
56
14
35
1
12
9
15
50
14
35
1
12
9
56
15
14
35
1
12
9
50
56
Figura 10.2. Método de la burbuja (paso 2).
EJEMPLO 10.1
Describir los diferentes pasos para clasificar en orden ascendente el vector
72 64 50 23 84 18 37 99 45 8
Las sucesivas operaciones en cada uno de los pasos necesarios hasta obtener la clasificación final se muestra en
la Tabla 10.1
Tabla 10.1. Pasos necesarios de la ordenación por burbuja
Vector
desordenado Número de paso Fin de clasificación
1 2 3 4 5 6 7 8 9
72
64
50
23
84
18
37
99
45
8
64
50
23
72
18
37
84
45
8
99
50
23
64
18
37
72
45
8
84
99
23
50
18
37
64
45
8
72
84
99
23
18
37
50
45
8
64
72
84
99
18
23
37
45
8
50
64
72
84
99
18
23
37
8
45
50
64
72
84
99
18
23
8
37
45
50
64
72
84
99
18
8
23
37
45
50
64
72
84
99
8
18
23
37
45
50
64
72
84
99
360 Fundamentos de programación
Método 1
El algoritmo se describirá, como siempre, con un diagrama de flujo y un pseudocódigo.
Pseudocódigo
algoritmo burbuja1
//incluir las declaraciones precisas//
inicio
//lectura del vector//
desde i ← 1 hasta N hacer
leer(X[I])
fin_desde
//clasificación del vector
desde I ← 1 hasta N-1 hacer
desde J ← 1 hasta J ← N-1 hacer
si X[j]  X[J+1] entonces
//intercambiar
AUX ← X[J]
X[J] ← X[J+1]
X[J+1] ← AUXI
fin_si
fin_desde
fin_desde
//imprimir lista clasificada
desde J ← 1 hasta N hacer
escribir(X[J])
fin_desde
fin
Diagrama de flujo 10.1
Para clasificar el vector completo se deben
realizar las sustituciones correspondientes
(N-1) * (N-1) o bien N2
-2N+1 veces. Así,
en el caso de un vector de cien elementos
(N = 100) se deben realizar casi 10.000
iteraciones.
El algoritmo de clasificación es:
Inicio
X[J]  X[J + 1]
fin
No
I ← 1
I  N – 1
I ← I + 1
J ← 1
J  N – 1
J ← J + 1
Sí
AUX ← X[J]
X[J] ← X[J + 1]
X[J + 1] ← AUX
No
Sí
No
Ordenación, búsqueda e intercalación 361
Método 2
Se puede realizar una mejora en la velocidad de ejecución del algoritmo. Obsérvese que en el primer recorrido del
vector (cuando I = 1) el valor mayor del vector se mueve al último elemento X[N]. Por consiguiente, en el siguien-
te paso no es necesario comparar X[N – 1] y X[N]. En otras palabras, el límite superior del bucle desde puede ser
N – 2. Después de cada paso se puede decrementar en uno el límite superior del bucle desde. El algoritmo sería:
Pseudocódigo
algoritmo burbuja2
//declaraciones
inicio
//...
desde I ← 1 hasta N-1 hacer
desde J ← 1 hasta N-I hacer
si X[J]  X[J+1] entonces
AUX ← X[J]
X[J] ← X[J+1]
X[J+1] ← AUX
fin_si
fin_desde
fin_desde
fin
Diagrama de flujo 10.2
AUX ← X[J]
X[J] ← X[J + 1]
X[J + 1] ← AUX
Sí
No
Inicio
repetir
I = 1, N – 1
repetir
J = 1, N – I
X[J]  X[J + 1]
fin
362 Fundamentos de programación
Método 3 (uso de una bandera/indicador)
Mediante una bandera/indicador o centinela (switch) o bien una variable lógica, se puede detectar la presencia o
ausencia de una condición. Así, mediante la variable BANDERA se representa clasificación terminada con un valor
verdadero y clasificación no terminada con un valor falso.
Diagrama de flujo 10.3
Sí
No
Inicio
repetir
K = 1, N – 1
BANDERA = 'F'
fin
BANDERA ← 'F'
BANDERA ← 'V'
X[K]  X[K + 1]
BANDERA ← 'F'
F = falso
V = verdadero
Sí
No
inter cambio
X[K], X[K + 1]
Pseudocódigo
algoritmo burbuja 3
//declaraciones
inicio
//lectura del vector
BANDERA ← 'F' // F, falso; V, verdadero
i ← 1
mientras (BANDERA = 'F') Y (i  N ) hacer
BANDERA ← 'V'
desde K ← 1 hasta N-i hacer
si X[K]  X[K+1] entonces
intercambiar(X[K],X[K + 1])
//llamada a procedimiento intercambio
BANDERA ← 'F'
fin_si
Ordenación, búsqueda e intercalación 363
fin_desde
i ← i+1
fin_mientras
fin
10.2.2. Ordenación por inserción
Este método consiste en insertar un elemento en el vector en una parte ya ordenada de este vector y comenzar de
nuevo con los elementos restantes. Por ser utilizado generalmente por los jugadores de cartas se le conoce también
por el nombre de método de la baraja.
Así, por ejemplo, suponga que tiene la lista desordenada
5 14 24 39 43 65 84 45
Para insertar el elemento 45, habrá que insertarlo entre 43 y 65, lo que supone desplazar a la derecha todos aque-
llos números de valor superior a 45, es decir, saltar sobre 65 y 84.
5 14 24 39 43 65 84 45
El método se basa en comparaciones y desplazamientos sucesivos. El algoritmo de clasificación de un vector X
para N elementos se realiza con un recorrido de todo el vector y la inserción del elemento correspondiente en el lugar
adecuado. El recorrido se realiza desde el segundo elemento al n-ésimo.
desde i ← 2 hasta N hacer
//insertar X[i] en el lugar
//adecuado entre X[1]..X[i-1])
fin_desde
Esta acción repetitiva —insertar— se realiza más fácilmente con la inclusión de un valor centinela o bandera
(SW).
Pseudocódigo
algoritmo clas_insercion1
//declaraciones
inicio
.....
//ordenacion
desde I ← 2 hasta N hacer
AUXI ← X[I]
K ← I-1
SW ← falso
mientras no (SW) y (K = 1) hacer
si AUXI  X[K] entonces
X[K+1] ← X[K]
K ← K-1
si_no
SW ← verdadero
fin_si
fin_mientras
364 Fundamentos de programación
X[K+1] ← AUXI
fin_desde
fin
Algoritmo inserción mejorado
El algoritmo de inserción directa se mejora fácilmente. Para ello se recurre a un método de búsqueda binaria —en
lugar de una búsqueda secuencial— para encontrar más rápidamente el lugar de inserción. Este método se conoce
como inserción binaria.
algoritmo clas_insercion_binaria
//declaraciones
inicio
//...
desde I ← 2 hasta N hacer
AUX ← X[I]
P ← 1 //primero
U ← I-1 //último
mientras P = U hacer
C ← (P+U) div 2
si AUX  X[C] entonces
U ← C-1
si_no
P ← C+1
fin_si
fin_mientras
desde K ← I-1 hasta P decremento 1 hacer
X[K+1] ← X[K]
fin_desde
X[P] ← AUX
fin_desde
fin
fin
Sí
AUX ← X[I]
K ← I – 1
SW ← falso
No
NO (SW)
y
K  = 1
X[K + 1] ← AUX
SW ← verdadero
AUX  X [K]
No
Inicio
I ← 2
I ← I + 1
I  N
X[K + 1] ← X[K]
K ← K + 1
Ordenación, búsqueda e intercalación 365
Número de comparaciones
El cálculo del número de comparaciones F(n) que se realiza en el algoritmo de inserción se puede calcular fácilmente.
Consideraremos el elemento que ocupa la posición X en un vector de n elementos, en el que los X – 1 elementos
anteriores se encuentran ya ordenados ascendentemente por su clave.
Si la clave del elemento a insertar es mayor que las restantes, el algoritmo ejecuta sólo una comparación; si la
clave es inferior a las restantes, el algoritmo ejecuta X – 1 comparaciones.
El número de comparaciones tiene por media X/2.
Veamos los casos posibles.
Vector ordenado en origen
Comparaciones mínimas
(n – 1)
Vector inicialmente en orden inverso
Comparaciones máximas
n(n – 1)
2
ya que
(n – 1) + (n – 2) +...+ 3 + 2 + 1 =
(n – 1)n
2
es una progresión aritmética
Comparaciones medias
(n – 1) + (n – 1)n/2
2
=
n2
+ n – 2
4
otra forma de deducirlas sería:
Cmedias =
n – 1 + 1
2
+
n – 2 + 1
2
+ ... +
1 + 1
2
{
n – 1 veces
y la suma de los términos de una progresión aritmética es:
Cmedias = (n – 1)
(n/2) + 1
2
= (n – 1)
n + 2
4
=
n2
+ 2n – n – 2
4
=
n2
+ n – 2
4
10.2.3. Ordenación por selección
Este método se basa en buscar el elemento menor del vector y colocarlo en primera posición. Luego se busca el se-
gundo elemento más pequeño y se coloca en la segunda posición, y así sucesivamente. Los pasos sucesivos a dar son:
1. Seleccionar el elemento menor del vector de n elementos.
2. Intercambiar dicho elemento con el primero.
3. Repetir estas operaciones con los n – 1 elementos restantes, seleccionando el segundo elemento; continuar
con los n – 2 elementos restantes hasta que sólo quede el mayor.
Un ejemplo aclarará el método.
366 Fundamentos de programación
EJEMPLO 10.2
Clasificar la siguiente lista de números en orden ascendente:
320 96 16 90 120 80 200 64
El método comienza buscando el número más pequeño, 16.
320 96 16 90 120 80 200 64
La lista nueva será
16 96 320 90 120 80 200 64
A continuación se busca el siguiente número más pequeño, 64, y se realizan las operaciones 1 y 2.
La nueva lista sería
16 64 320 90 120 80 200 96
Si se siguen realizando dos iteraciones se encontrará la siguiente línea:
16 64 80 90 120 320 200 96
No se realiza ahora ningún cambio, ya que el número más pequeño del vector V[4], V[5], ..., V[8] está ya
en la posición más a la izquierda. Las sucesivas operaciones serán:
16 64 80 90 96 320 200 120
16 64 80 90 96 120 200 320
16 64 80 90 96 120 200 320
y se habrán terminado las comparaciones, ya que el último elemento debe ser el más grande y, por consiguiente,
estará en la posición correcta.
Desarrollemos ahora el algoritmo para clasificar el vector V de n componentes V[1], V[2], ..., V[n] con
este método. El algoritmo se presentará en etapas y lo desarrollaremos con un refinamiento por pasos sucesivos.
La tabla de variables que utilizaremos será:
I, J
X
AUX
N
enteras y se utilizan como índices del vector V
vector (array unidimensional)
variables auxiliar para intercambio
número de elementos del vector V
Nivel 1
inicio
desde I ← 1 hasta N-1 hacer
Buscar elemento menor de X[I], X[I+1], ..., X[N] e intercambiar con X[I]
fin_desde
fin
Nivel 2
inicio
I ← 1
repetir
Ordenación, búsqueda e intercalación 367
Buscar elemento menor de X[I], X[I+1], ..., X[N] e intercambiar con X[I]
I ← I+1
hasta_que I = N
fin
La búsqueda e intercambio se realiza N – 1 veces, ya que I se incrementa en 1 al final del bucle.
Nivel 3
Dividamos el bucle repetitivo en dos partes:
inicio
I ←1
repetir
Buscar elemento más pequeño X[I], X[I+1], ..., X[N]
//Supongamos que es X[K]
Intercambiar X[K] y X[I]
hasta_que I = N
fin
Nivel 4a
Las instrucciones buscar e intercambiar se refinan independientemente. El algoritmo con la estructura re-
petir es:
inicio
//...
I ← 1
repetir
AUXI ← X[I] //AUXI representa el valor más pequeño
K ← I //K representa la posición
J ← I
repetir
J ← J+1
si X[J]  AUXI entonces
AUXI ← X[J] //actualizar AUXI
K ← J //K, posición
fin_si
hasta_que J = N //AUXI = X[K] es ahora el más pequeño
X[K] ← X[I]
X[I] ← AUXI
I ← I+1
hasta_que I = N
fin
Nivel 4b
El algoritmo con la estructura mientras.
inicio
//...
I ← 1
mientras I  N hacer
AUXI ← X[I]
K ← I
J ← I
368 Fundamentos de programación
mientras J  N hacer
J ← J+1
si X[J]  AUXI entonces
AUXI ← X[J]
K ← J
fin_si
fin_mientras
X[K] ← X[I]
X[I] ← AUXI
I ← I + 1
fin_mientras
fin
Nivel 4c
El algoritmo de ordenación con estructura desde.
inicio
//...
desde I ← 1 hasta N–1 hacer
AUXI ← X[I]
K ← I
desde J ← I+1 hasta N hacer
si X[J]  AUXI entonces
AUXI ← X[J]
K ← J
fin_si
fin_desde
X[K] ← X[I]
X[I] ← AUXI
fin_desde
fin
10.2.4. Método de Shell
Es una mejora del método de inserción directa que se utiliza cuando el número de elementos a ordenar es grande. El
método se denomina “Shell” —en honor de su inventor Donald Shell— y también método de inserción con incre-
mentos decrecientes.
En el método de clasificación por inserción cada elemento se compara con los elementos contiguos de su izquier-
da, uno tras otro. Si el elemento a insertar es más pequeño —por ejemplo—, hay que ejecutar muchas comparaciones
antes de colocarlo en su lugar definitivamente.
Shell modificó los saltos contiguos resultantes de las comparaciones por saltos de mayor tamaño y con eso se
conseguía la clasificación más rápida. El método se basa en fijar el tamaño de los saltos constantes, pero de más de
una posición.
Supongamos un vector de elementos
4 12 16 24 36 3
en el método de inserción directa, los saltos se hacen de una posición en una posición y se necesitarán cinco compa-
raciones. En el método de Shell, si los saltos son de dos posiciones, se realizan tres comparaciones.
4 12 16 24 36 3
El método se basa en tomar como salto N/2 (siendo N el número de elementos) y luego se va reduciendo a la
mitad en cada repetición hasta que el salto o distancia vale 1.
Ordenación, búsqueda e intercalación 369
Considerando la variable salto, se tendría para el caso de un determinado vector X los siguientes recorridos:
Vector X [X[1], X[2], X[3], ..., X[N]]
Vector X1 [X[1], X[1+salto], X[2+salto], ...]
Vector XN [salto1, salto2, salto3, ...]
EJEMPLO 10.3
Deducir las secuencias parciales de clasificación por el método de Shell para ordenar en ascendente la lista o vector
6, 1, 5, 2, 3, 4, 0
Solución
Recorrido Salto Lista reordenada Intercambio
1
2
3
4
5
3
3
3
1
1
2,1,4,0,3,5,6
0,1,4,2,3,5,6
0,1,4,2,3,5,6
0,1,2,3,4,5,6
0,1,2,3,4,5,6
(6,2), (5,4), (6,0)
(2,0)
Ninguno
(4,2), (4,3)
Ninguno
Sea un vector X
X[1], X[2], X[3], ..., X[N]
y consideremos el primer salto a dar que tendrá un valor de
N
2
por lo que para redondear, se tomará la parte entera
N DIV 2
y se iguala a salto
salto = N div 2
El algoritmo resultante será:
algoritmo shell
const
n = 50
tipo
array[1..n] de entero:lista
var
lista : L
entero : k, i, j, salto
inicio
llamar_a llenar(L) // llenado de la lista
salto ← N DIV 2
mientras salto  0 hacer
desde i ← (salto + 1) hasta n hacer
j ← i – salto
370 Fundamentos de programación
mientras j  0 hacer
k ← j + salto
si L[j] = L[k] entonces
j ← 0
si_no
llamar_a intercambio L[j], L[k]
fin_si
j ← j - salto
fin_mientras
fin_desde
salto ← ent ((1 + salto)/2)
fin_mientras
fin
10.2.5. Método de ordenación rápida (quicksort)
El método de ordenación rápida (quicksort) para ordenar o clasificar un vector o lista de elementos (array) se basa
en el hecho de que es más rápido y fácil de ordenar dos listas pequeñas que una lista grande. Se denomina método
de ordenación rápida porque, en general, puede ordenar una lista de datos mucho más rápidamente que cualquiera
de los métodos de ordenación ya estudiados. Este método se debe a Hoare.
El método se basa en la estrategia típica de “divide y vencerás” (divide and conquer). La lista a clasificar alma-
cenada en un vector o array se divide (parte) en dos sublistas: una con todos los valores menores o iguales a un
cierto valor específico y otra con todos los valores mayores que ese valor. El valor elegido puede ser cualquier valor
arbitrario del vector. En ordenación rápida se llama a este valor pivote.
El primer paso es dividir la lista original en dos sublistas o subvectores y un valor de separación. Así, el vector
V se divide en tres partes:
• Subvector VI, que contiene los valores inferiores o iguales.
• El elemento de separación.
• Subvector VD, que contiene los valores superiores o iguales.
Los subvectores VI y VD no están ordenados, excepto en el caso de reducirse a un elemento.
Consideremos la lista de valores.
18 11 27 13 9 4 16
Se elige un pivote, 13. Se recorre la lista desde el extremo izquierdo y se busca un elemento mayor que 13 (se
encuentra el 18). A continuación, se busca desde el extremo derecho un valor menor que 13 (se encuentra el 4).
18 11 27 13 9 4 16
Se intercambian estos dos valores y se produce la lista
4 11 27 13 9 18 16
Se sigue recorriendo el vector por la izquierda y se localiza el 27, y a continuación otro valor bajo se encuentra
a la derecha (el 9). Intercambiar estos dos valores y se obtiene
4 11 9 13 27 18 16
Al intentar este proceso una vez más, se encuentra que las exploraciones de los dos extremos vienen juntos sin
encontrar ningún futuro valor que esté “fuera de lugar”. En este punto se conoce que todos los valores a la derecha
son mayores que todos los valores a la izquierda del pivote. Se ha realizado una partición en la lista original, que se
ha quedado dividida en dos listas más pequeñas:
4 11 9 [13] 27 18 16
Ordenación, búsqueda e intercalación 371
Ninguna de ambas listas está ordenada; sin embargo, basados en los resultados de esta primera partición, se pue-
den ordenar ahora las dos particiones independientemente. Esto es, si ordenamos la lista
4 11 9
en su posición, y la lista
27 18 16
de igual forma, la lista completa estará ordenada:
4 9 11 13 16 18 27
El procedimiento de ordenación supone, en primer lugar, una partición de la lista.
EJEMPLO 10.4
Utilizando el procedimiento de ordenación rápida, dividir la lista de enteros en dos sublistas para poder clasificar
posteriormente ambas listas.
50 30 20 80 90 70 95 85 10 15 75 25
Se elige como pivote el número 50.
Los valores 30, 20, 10, 15 y 25 son más pequeños que 50 y constituirán la primera lista, y 80, 90, 70, 95, 85
y 75 se sitúan en la segunda lista. Se recorre la lista desde la izquierda para encontrar el primer número mayor que
50 y desde la derecha el primero menor que 50.
50 30 20 80 90 70 95 85 10 15 75 25
se localizan los dos números 80 y 25 y se intercambian
50 30 20 25 90 70 95 85 10 15 75 80
A continuación se reanuda la búsqueda desde la derecha para un número menor que 50, y desde la izquierda para
un número mayor de 50.
50 30 20 25 90 70 95 85 10 15 75 80
Estos recorridos localizan los números 15 y 90, que se intercambian
50 30 20 25 15 70 95 85 10 90 75 80
Las búsquedas siguientes localizan 10 y 70.
50 30 20 25 15 70 95 85 10 90 75 80
El intercambio proporciona
50 30 20 25 15 10 95 85 70 90 75 80
372 Fundamentos de programación
Cuando se reanuda la búsqueda desde la derecha para un número menor que 50, localizamos el valor 10 que se
encontró en la búsqueda de izquierda a derecha. Se señala el final de las dos búsquedas y se intercambian 50 y 10.
10 30 20 25 15 50 95 85 70 75 80
{
{
Lista de números  50 Lista de números  50
Algoritmos
El algoritmo de ordenación rápida se basa esencialmente en un algoritmo de división o partición de una lista. El mé-
todo consiste en explorar desde cada extremo e intercambiar los valores encontrados. Un primer intento de algoritmo
de partición es:
algoritmo particion
inicio
establecer x al valor de un elemento arbitrario de la lista
mientras division no este terminada hacer
recorrer de izquierda a derecha para un valor = x
recorrer de derecha a izquierda para un valor = x
si los valores localizados no estan ordenados entonces
intercambiar los valores
fin_si
fin_mientras
fin
La lista que se desea partir es A[1], A[2], ..., A[n]. Los índices que representan los extremos izquierdo y
derecho de la lista son L y R. En el refinamiento del algoritmo se elige un valor arbitrario x, suponiendo que el valor
central de la lista es tan bueno como cualquier elemento arbitrario. Los índices i, j exploran desde los extremos.
Un refinamiento del algoritmo anterior, que incluye mayor número de detalles es el siguiente:
algoritmo particion
llenar (A)
i ← L
j ← R
x ← A ((L+R) div 2)
mientras i = j hacer
mientras A[i]  x hacer
i ← i+1
fin_mientras
mientras A[j]  x hacer
j ← j-1
fin_mientras
si i = j entonces
llamar_a intercambiar (A[i], a[j])
i ← i+1
j ← j-1
fin_si
fin_mientras
fin
En los bucles externos y la sentencia si la condición utilizada es i = j. Puede parecer que i  j funcionan
de igual modo en ambos lugares. De hecho, se puede realizar la partición con cualquiera de las condiciones. Sin
embargo, si se utiliza la condición i  j, podemos terminar la partición con dos casos distintos, los cuales pueden
diferenciarse antes de que podamos realizar divisiones futuras. Por ejemplo, la lista
1 7 7 9 9
Ordenación, búsqueda e intercalación 373
y la condición i  j terminará con i = 3, j = 2 y las dos particiones son A[L]..A[j] y A[i]..A[R]. Sin
embargo, para la lista
1 1 7 9 9
y la condición i  j terminaremos con i = 3, j = 3 y las dos particiones se solapan.
El uso de la condición i = j produce también resultados distintos para estos ejemplos. La lista
1 7 7 9 9
y la condición i = j se termina con i = 3, j = 2 como antes. Para la lista 1, 1, 7, 9, 9 y la condición i = j
se termina con i = 4, j = 2. En ambos casos las particiones que requieren ordenación posterior son A[L]..A[j]
y A[i]..A[R].
En los bucles mientras internos la igualdad se omite de las condiciones. La razón es que el valor de partición
actúe como centinela para detectar las exploraciones.
En nuestro ejemplo se ha tomado como valor de partición o pivote el elemento cuya posición inicial es el ele-
mento central. Este no es generalmente el caso. El ejemplo de la clasificación de la lista ya citado
50 30 20 80 90 70 95 85 10 15 75 25
utilizaba como pivote el primer elemento.
El algoritmo de ordenación rápida en el caso de que el elemento pivote sea el primer elemento se muestra a con-
tinuación:
algoritmo particion2
//lista a evaluar de 10 elementos
//IZQUIERDO, indice de búsqueda (recorrido) desde la izquierda
//DERECHO, indice de búsqueda desde la derecha
inicio
llenar (X)
//inicializar índice para recorridos desde la izquierda y derecha
IZQUIERDO ← ALTO //ALTO parametro que indica principio de la sublista
DERECHO ← BAJO //BAJO parametro que indica final de la sublista
A - X[1]
//realizar los recorridos
mientras IZQUIERDO = DERECHO hacer
//búsqueda o recorrido desde la izquierda
mientras (X[IZQUIERDO]  A) Y (IZQUIERDO  BAJO)
IZQUIERDO ← IZQUIERDO + 1
fin_mientras
mientras X[DERECHO]  A y (DERECHO  ALTO)
DERECHO ← DERECHO - 1
fin_mientras
//intercambiar elemento
si IZQUIERDO = DERECHO entonces
AUXI -X[IZQUIERDO]
X[IZQUIERDO] ← X[DERECHO]
X[DERECHO] ← AUXI
IZQUIERDO ← IZQUIERDO + 1
DERECHO ← DERECHO - 1
fin_si
fin_mientras
//fin busqueda; situar elemento seleccionado en su posicion
si IZQUIERDO  BAJO+1 entonces
AUXI← X [DERECHO]
X [DERECHO] ← X [1]
X [1] ← AUXI
374 Fundamentos de programación
si_no
AUXI ← X [BAJO]
X [BAJO] ← X[1]
X[1] ← AUXI
fin
fin
10.3. BÚSQUEDA
La recuperación de información, como ya se ha comentado, es una de las aplicaciones más importantes de las com-
putadoras.
La búsqueda (searching) de información está relacionada con las tablas para consultas (lookup). Estas tablas
contienen una cantidad de información que se almacena en forma de listas de parejas de datos. Por ejemplo, un dic-
cionario con una lista de palabras y definiciones; un catálogo con una lista de libros de informática; una lista de
estudiantes y sus notas; un índice con títulos y contenido de los artículos publicados en una determinada revista, etc.
En todos estos casos es necesario con frecuencia buscar un elemento en una lista.
Una vez que se encuentra el elemento, la identificación de su información correspondiente es un problema menor.
Por consiguiente, nos centraremos en el proceso de búsqueda. Supongamos que se desea buscar en el vector X[1]..
X[n], que tiene componentes numéricos, para ver si contiene o no un número dado T.
Si en vez de tratar sobre vectores se desea buscar información en un archivo, debe realizarse la búsqueda a partir
de un determinado campo de información denominado campo clave. Así, en el caso de los archivos de empleados de
una empresa, el campo clave puede ser el número de DNI o los apellidos.
La búsqueda por claves para localizar registros es, con frecuencia, una de las acciones que mayor consumo de
tiempo conlleva y, por consiguiente, el modo en que los registros están dispuestos y la elección del modo utilizado
para la búsqueda pueden redundar en una diferencia sustancial en el rendimiento del programa.
El problema de búsqueda cae naturalmente dentro de los dos casos típicos ya tratados. Si existen muchos registros,
puede ser necesario almacenarlos en archivos de disco o cinta, externo a la memoria de la computadora. En este caso
se llama búsqueda externa. En el otro caso, los registros que se buscan se almacenan por completo dentro de la me-
moria de la computadora. Este caso se denomina búsqueda interna.
En la práctica, la búsqueda se refiere a la operación de encontrar la posición de un elemento entre un conjunto
de elementos dados: lista, tabla o fichero.
Ejemplos típicos de búsqueda son localizar nombre y apellidos de un alumno, localizar números de teléfono de
una agenda, etc.
Existen diferentes algoritmos de búsqueda. El algoritmo elegido depende de la forma en que se encuentren orga-
nizados los datos.
La operación de búsqueda de un elemento N en un conjunto de elementos consiste en:
• Determinar si N pertenece al conjunto y, en ese caso, indicar su posición en él.
• Determinar si N no pertenece al conjunto.
Los métodos más usuales de búsqueda son:
• Búsqueda secuencial o lineal.
• Búsqueda binaria.
• Búsqueda por transformación de claves (hash).
10.3.1. Búsqueda secuencial
Supongamos una lista de elementos almacenados en un vector (array unidimensional). El método más sencillo de
buscar un elemento en un vector es explorar secuencialmente el vector o, dicho en otras palabras, recorrer el vector
desde el primer elemento al último. Si se encuentra el elemento buscado, visualizar un mensaje similar a 'Fin de
búsqueda'; en caso contrario, visualizar un mensaje similar a 'Elemento no existe en la lista'.
En otras palabras, la búsqueda secuencial compara cada elemento del vector con el valor deseado, hasta que éste
encuentra o termina de leer el vector completo.
Ordenación, búsqueda e intercalación 375
La búsqueda secuencial no requiere ningún registro por parte del vector y, por consiguiente, no necesita estar
ordenado. El recorrido del vector se realizará normalmente con estructuras repetitivas.
EJEMPLO 10.5
Se tiene un vector A que contiene n elementos numéricos (n) = 1(A[1], A[2], A[3], ..., A[n]) y se desea
buscar un elemento dado t. Si el elemento t se encuentra, visualizar un mensaje 'Elemento encontrado' y otro
que diga 'posición = '.
Si existen n elementos, se requerirán como media n/2 comparaciones para encontrar un determinado elemento.
En el caso más desfavorable se necesitarán n comparaciones.
Método 1
algoritmo busqueda_secuencial_1
//declaraciones
inicio
llenar (A,n)
leer(t)
//recorrido del vector
desde i ← 1 hasta n hacer
si A[i] = t entonces
escribir('Elemento encontrado')
escribir('en posicion', i)
fin_si
fin_desde
fin
Método 2
algoritmo busqueda_secuencial_2
//...
inicio
llenar (A,n)
leer(t)
i ← 1
mientras (A[i]  t) y (i = n) hacer
i ← i + 1
//este bucle se detiene bien con A[i] = t o bien con i  n
fin_mientras
si A[i] = t entonces //condición de parada
escribir('El elemento se ha encontrado en la posición', i)
si_no //recorrido del vector terminado
escribir('El numero no se encuentra en el vector')
fin_si
fin
Este método no es completamente satisfactorio, ya que si t no está en el vector A, i toma el valor n + 1 y la
comparación
A[i]  t
producirá una referencia al elemento A[n + 1], que presumiblemente no existe. Este problema se resuelve sustituyen-
do i = n por i  n en la instrucción mientras, es decir, modificando la instrucción anterior mientras por
mientras (A[i]  t) y (i  n) hacer
376 Fundamentos de programación
Método 3
algoritmo busqueda_secuencial_3
//...
inicio
llenar (A,n)
leer(t)
i ← 1
mientras (A[i]  t) y (i  n) hacer
i ← i+1
//este bucle se detiene cuando A[i] = t o i = n
fin_mientras
si A[i] = t entonces
escribir('El numero deseado esta presente y ocupa el lugar',i)
si_no
escribir(t, 'no existe en el vector')
fin_si
fin
Método 4
algoritmo busqueda_secuencial_4
//...
inicio
llamar_a llenar(A,n)
leer(t)
i ← 1
mientras i = n hacer
si t = A[i] entonces
escribir('Se encontró el elemento buscado en la posicion',i)
i ← n + 1
si_no
i ← i+1
fin_si
fin_mientras
fin
Búsqueda secuencial con centinela
Una manera muy eficaz de realizar una búsqueda secuencial consiste en modificar los algoritmos anteriores utilizan-
do un elemento centinela. Este elemento se agrega al vector al final del mismo. El valor del elemento centinela es el
del argumento. El propósito de este elemento centinela, A[n + 1], es significar que la búsqueda siempre tendrá éxi-
to. El elemento A[n + 1] sirve como centinela y se le asigna el valor de t antes de iniciar la búsqueda. En cada paso
se evita la comparación de i con N y, por consiguiente, este algoritmo será preferible a los métodos anteriores, con-
cretamente el método 4. Si el índice alcanzase el valor n + 1, supondría que el argumento no pertenece al vector
original y en consecuencia la búsqueda no tiene éxito.
Método 5
algoritmo busqueda_secuencial_5
//declaraciones
inicio
llenar(A,n)
leer(t)
Ordenación, búsqueda e intercalación 377
i ← 1
A[n + 1] ← t
mientras A[i]  t hacer
i ← i + 1
fin_mientras
si i = n + 1 entonces
escribir('No se ha encontrado elemento')
si_no
escribir('Se ha encontrado el elemento')
fin_si
fin
Una variante del método 5 es utilizar una variable lógica (interruptor o switch), que represente la existencia o no
del elemento buscado.
Localizar si el elemento t existe en una lista A[i], donde i varía desde 1 a n.
En este ejemplo se trata de utilizar una variable lógica ENCONTRADO para indicar si existe o no el elemento de la
lista.
Método 6
algoritmo busqueda_secuencia_6
//declaraciones
inicio
llenar (A,n)
leer(t)
i ← 1
ENCONTRADO ← falso
mientras (no ENCONTRADO) y (i = n) hacer
si A[i] = t entonces
ENCONTRADO ← verdadero
fin_si
i ← i + 1
fin_mientras
si ENCONTRADO entonces
escribir('El numero ocupa el lugar', i - 1)
si_no
escribir('El numero no esta en el vector')
fin_si
fin
Nota
De todas las versiones anteriores, tal vez la más adecuada sea la incluida en el método 6. Entre otras razones,
debido a que el bucle mientras engloba las acciones que permiten explorar el vector, bien hasta que t se en-
cuentre o bien cuando se alcance el final del vector.
Método 7
algoritmo busqueda_secuencia_7
//declaraciones
inicio
llenar (A,n)
leer(t)
378 Fundamentos de programación
i ← 1
ENCONTRADO ← falso
mientras i = n hacer
si A[i] = t entonces
ENCONTRADO ← verdad
escribir ('El número ocupa el lugar'; i)
fin_si
i ← i + 1
fin_mientras
si_no (ENCONTRADO) entonces
escribir('El numero no esta en el vector')
fin_si
fin
Método 8
algoritmo busqueda_secuencial_8
//declaraciones
inicio
llenar (A,n)
ENCONTRADO ← falso
i ← 0
leer(t)
repetir
i ← i+1
si A[i] = t entonces
ENCONTRADO ← verdad
fin_si
hasta_que ENCONTRADO o (i = n)
fin
Método 9
algoritmo busqueda_secuencial_9
//declaraciones
inicio
llenar (A,n)
ENCONTRADO ← falso
leer(t)
desde i ← 1 hasta i ← n hacer
si A[i] = t entonces
ENCONTRADO ← verdad
fin_si
fin_desde
si ENCONTRADO entonces
escribir('Elemento encontrado')
si_no
escribir('Elemento no encontrado')
fin_si
fin
Consideraciones sobre la búsqueda lineal
El método de búsqueda lineal tiene el inconveniente del consumo excesivo de tiempo en la localización del elemen-
to buscado. Cuando el elemento buscado no se encuentra en el vector, se verifican o comprueban sus n elementos.
Ordenación, búsqueda e intercalación 379
En los casos en que el elemento se encuentra en la lista, el número podrá ser el primero, el último o alguno com-
prendido entre ambos.
Se puede suponer que el número medio de comprobaciones o comparaciones a realizar es de (n+1)/2 (aproxima-
damente igual a la mitad de los elementos del vector).
La búsqueda secuencial o lineal no es el método más eficiente para vectores con un gran número de elementos.
En estos casos, el método más idóneo es el de búsqueda binaria, que presupone una ordenación previa en los ele-
mentos del vector. Este caso suele ser muy utilizado en numerosas facetas de la vida diaria. Un ejemplo de ello es la
búsqueda del número de un abonado en una guía telefónica; normalmente no se busca el nombre en orden secuencial,
sino que se busca en la primera o segunda mitad de la guía; una vez en esa mitad, se vuelve a tantear a una de sus
dos submitades, y así sucesivamente se repite el proceso hasta que se localiza la página correcta.
10.3.2. Búsqueda binaria
En una búsqueda secuencial se comienza con el primer elemento del vector y se busca en él hasta que se encuentra
el elemento deseado o se alcanza el final del vector. Aunque este puede ser un método adecuado para pocos datos,
se necesita una técnica más eficaz para conjuntos grandes de datos.
Si el número de elementos del vector es grande, el algoritmo de búsqueda lineal se ralentizaría en tiempo de un
modo considerable. Por ejemplo, si tuviéramos que consultar un nombre en la guía telefónica de una gran ciudad
como Madrid, con una cifra aproximada de un millón de abonados, el tiempo de búsqueda —según el nombre— se
podría eternizar. Naturalmente, las personas que viven en esa gran ciudad nunca utilizarán un método de búsqueda
secuencial, sino un método que se basa en la división sucesiva del espacio ocupado por el vector en sucesivas mita-
des, hasta encontrar el elemento buscado.
Si los datos que se buscan están clasificados en un determinado orden, el método citado anteriormente se deno-
mina búsqueda binaria.
La búsqueda binaria utiliza un método de “divide y vencerás” para localizar el valor deseado. Con este método
se examina primero el elemento central de la lista; si este es el elemento buscado, entonces la búsqueda ha termina-
do. En caso contrario se determina si el elemento buscado está en la primera o la segunda mitad de la lista y, a con-
tinuación, se repite este proceso, utilizando el elemento central de esa sublista. Supongamos la lista
1231
1473
1545
1834
1892
1898 elemento central
1983
2005
2446
2685
3200
Si está buscando el elemento 1983, se examina el número central, 1898, en la sexta posición. Ya que 1983 es
mayor que 1898, se desprecia la primera sublista y nos centramos en la segunda
1983
2005
2446 elemento central
2685
3200
El número central de esta sublista es 2446 y el elemento buscado es 1983, menor que 2446; eliminamos la se-
gunda sublista y nos queda
1983
2005
380 Fundamentos de programación
Como no hay término central, elegimos el término inmediatamente anterior al término central, 1983, que es el
buscado.
Se han necesitado tres comparaciones, mientras que la búsqueda secuencial hubiese necesitado siete.
La búsqueda binaria se utiliza en vectores ordenados y se basa en la constante división del espacio de búsqueda
(recorrido del vector). Como se ha comentado, se comienza comparando el elemento que se busca, no con el primer
elemento, sino con el elemento central. Si el elemento buscado —t— es menor que el elemento central, entonces t
deberá estar en la mitad izquierda o inferior del vector; si es mayor que el valor central, deberá estar en la mitad
derecha o superior, y si es igual al valor central, se habrá encontrado el elemento buscado.
El funcionamiento de la búsqueda binaria en un vector de enteros se ilustra en la Figura 10.3 para dos búsquedas:
con éxito (localizado el elemento) y sin éxito (no encontrado el elemento).
El proceso de búsqueda debe terminar normalmente conociendo si la búsqueda ha tenido éxito (se ha encontrado
el elemento) o bien no ha tenido éxito (no se ha encontrado el elemento) y normalmente se deberá devolver la posi-
ción del elemento buscado dentro del vector.
(a)
(b)
CENTRAL
I,S
I CENTRAL S
I (inferior) CENTRAL S (superior)
Elemento más
pequeño que
CENTRAL.
Búsqueda en
subvector izquierdo
4 6 8 10 12 14 16
4 6 8 10 12 14 16
I CENTRAL S
Elemento mayor
que CENTRAL.
Búsqueda en
subvector derecho
12 14 16
4 6 8
8
8
8
11
11
11
12
8
Figura 10.3. Ejemplo de búsqueda binaria: (a) con éxito, (b) sin éxito
EJEMPLO 10.6
Encontrar el algoritmo de búsqueda binaria para encontrar un elemento K en una lista de elementos X1, X2, ...,
Xn previamente clasificados en orden ascendente.
Ordenación, búsqueda e intercalación 381
El array o vector X se supone ordenado en orden creciente si los datos son numéricos, o alfabéticamente si son
caracteres. Las variables BAJO, CENTRAL, ALTO indican los límites inferior, central y superior del intervalo de bús-
queda.
algoritmo busqueda_binaria
//declaraciones
inicio
//llenar (X,N)
//ordenar (X,N)
leer(K)
//inicializar variables
BAJO ← 1
ALTO ← N
CENTRAL ← ent ((BAJO + ALTO) / 2)
mientras (BAJO = ALTO) y (X[CENTRAL]  K) hacer
si K  X[CENTRAL] entonces
ALTO ← CENTRAL - 1
si_no
BAJO ← CENTRAL + 1
fin_si
CENTRAL ← ent ((BAJO + ALTO) / 2)
fin_mientras
si K = X[CENTRAL] entonces
escribir('Valor encontrado en', CENTRAL)
si_no
escribir('Valor no encontrado')
fin_si
fin
EJEMPLO 10.7
Se dispone de un vector tipo carácter NOMBRE clasificado en orden ascendente y de N elementos. Realizar el algo-
ritmo que efectúe la búsqueda de un nombre introducido por el usuario.
La variable N indica cuántos elementos existen en el array.
ENCONTRADO es una variable lógica que detecta si se ha localizado el nombre buscado.
algoritmo busqueda_nombre
{inicializar todas las variables necesarias}
{NOMBRE array de caracteres
N numero de nombres del array NOMBRE
ALTO puntero al extremo superior del intervalo
BAJO puntero al extremo inferior del intervalo
CENTRAL puntero al punto central del intervalo
X nombre introducido por el usuario
ENCONTRADO bandera o centinela}
inicio
llenar (NOMBRE, N)
leer (X)
BAJO ← 1
ALTO ← N
ENCONTRADO ← falso
mientras (no ENCONTRADO) y (BAJO = ALTO) hacer
CENTRAL ← ent (BAJO+ALTO) / 2
//verificar nombre central en este intervalo
382 Fundamentos de programación
si NOMBRE[CENTRAL] = X entonces
ENCONTRADO ← verdad
si_no
si NOMBRE[CENTRAL]  X entonces
ALTO ← CENTRAL - 1
si_no
BAJO ← CENTRAL + 1
fin_si
fin_si
fin_mientras
si ENCONTRADO entonces
escribir('Nombre encontrado')
si_no
escribir('Nombre no encontrado')
fin_si
fin
Análisis de la búsqueda binaria
La búsqueda binaria es un método eficiente siempre que el vector esté ordenado. En la práctica esto suele suceder,
pero no siempre. Por esta razón la búsqueda binaria exige una ordenación previa del vector.
Para poder medir la velocidad de cálculo del algoritmo de búsqueda binaria se deberán obtener el número de
comparaciones que realiza el algoritmo.
Consideremos un vector de siete elementos (n = 7). El número 8 (N + 1 = 8) se debe dividir en tres mitades an-
tes de que se alcance 1; es decir, se necesitan tres comparaciones.
1 2 3 4 5 6 7
El medio matemático de expresar estos números es:
3 = log2 (8)
en general, para n elementos:
K = log2 (n + 1)
Recuerde que log2 (8) es el exponente al que debe elevarse 2 para obtener 8. Es decir, 3, ya que 23
= 8.
Si n + 1 es una potencia de 2, entonces log2 (n + 1) será un entero. Si n + 1 no es una potencia de 2, el valor del
logaritmo se redondea hasta el siguiente entero. Por ejemplo, si n es 12, entonces K será 4, ya que log2 (13) (que está
entre 3 y 4) se redondeará hasta 4 (24
es 16).
En general, en el mejor de los casos se realizará una comparación y, en el peor de los casos, se realizarán log2
(n + 1) comparaciones.
Como término medio, el número de comparaciones es
1 + log2(n + 1)
2
Esta fórmula se puede reducir para el caso de que n sea grande a
log2(n + 1)
2
Ordenación, búsqueda e intercalación 383
Para poder efectuar una comparación entre los métodos de búsqueda lineal y búsqueda binaria, realicemos los
cálculos correspondientes para diferentes valores de n.
n = 100 En la búsqueda secuencial se necesitarán
100 + 1
2
50 comparaciones
En la búsqueda binaria log2 (100) = 6...
log2 (100) = x donde 2x
= 100 y x = 6...:
27 = 128  100 7 comparaciones
n = 1.000.000 En la búsqueda secuencial:
1.000.000 + 1
2
500.000 comparaciones
En la búsqueda binaria log2 (1.000.000) = x
2x
= 1.000.000 donde x = 20 y 220
 1.000.000
20 comparaciones
Como se observa en los ejemplos anteriores, el tiempo de búsqueda es muy pequeño, aproximadamente siete
comparaciones para 100 elementos y veinte para 1.000.000 de elementos. (Compruebe el lector que para 1.000 ele-
mentos se requiere un máximo de diez comparaciones.)
La búsqueda binaria tiene, sin embargo, inconvenientes a resaltar:
El vector debe estar ordenado y el almacenamiento de un vector ordenado suele plantear problemas en las inser-
ciones y eliminaciones de elementos. (En estos casos será necesario utilizar listas enlazadas o árboles binarios. Véan-
se Capítulos 12 y 13.)
La Tabla 10.2 compara la eficiencia de la búsqueda lineal y búsqueda binaria para diferentes valores de n. Como
se observará en dicha tabla, la ventaja del método de búsqueda binaria aumenta a medida que n aumenta.
Tabla 10.2. Eficiencia de las búsquedas lineal y binaria
Búsqueda secuencial Búsqueda binaria
Número de comparaciones Número máximo de comparaciones
n Elemento no localizado Elemento no localizado
7
100
1.000
1.000.000
7
100
1.000
100.000
3
7
10
20
10.3.3. Búsqueda mediante transformación de claves (hashing)
La búsqueda binaria proporciona un medio para reducir el tiempo requerido para buscar en una lista. Este método,
sin embargo, exige que los datos estén ordenados. Existen otros métodos que pueden aumentar la velocidad de bús-
queda en el que los datos no necesitan estar ordenados, este método se conoce como transformación de claves (clave-
dirección) o hashing.
El método de transformación de claves consiste en convertir la clave dada (numérica o alfanumérica) en una di-
rección (índice) dentro del array. La correspondencia entre las claves y la dirección en el medio de almacenamiento
o en el array se establece por una función de conversión (función o hash).
384 Fundamentos de programación
Así, por ejemplo, en el caso de una lista de empleados (100) de una pequeña empresa. Si cada uno de los cien
empleados tiene un número de identificación (clave) del 1 al 100, evidentemente puede existir una correspondencia
directa entre la clave y la dirección definida en un vector o array de 100 elementos.
Supongamos ahora que el campo clave de estos registros o elementos es el número del DNI o de la Seguridad Social,
que contenga nueve dígitos. Si se desea mantener en un array todo el rango posible de valores, se necesitarán 10ˆ10
elementos en la tabla de almacenamiento, cantidad difícil de tener disponibles en memoria central, aproximadamente
1.000.000.000 de registros o elementos. Si el vector o archivo sólo tiene 100, 200 o 1.000 empleados, cómo hacer para
introducirlos en memoria por el campo clave DNI. Para hacer uso de la clave DNI como un índice en la tabla de bús-
queda, se necesita un medio para convertir el campo clave en una dirección o índice más pequeño. En la figura se pre-
senta un diagrama de cómo realizar la operación de conversión de una clave grande en una tabla pequeña.
345671234
Clave (DNI)
Función de
conversación
claves
Tabla de transformación de claves
Clave = 453126034
Clave = 345671234
Clave = 110000345
Clave = 467123326
.
.
.
.
.
.
[0]
[1]
[j]
[98]
[99]
Los registros o elementos del campo clave no tienen por qué estar ordenados de acuerdo con los valores del
campo clave, como estaban en la búsqueda binaria.
Por ejemplo, el registro del campo clave 345671234 estará almacenado en la tabla de transformación de claves
(array) en una posición determinada; por ejemplo, 75.
La función de transformación de clave, H(k) convierte la clave (k) en una dirección (d).
Imaginemos que las claves fueran nombres o frases de hasta dieciséis letras, que identifican a un conjunto de un
millar de personas. Existirán 26ˆ16 combinaciones posibles de claves que se deben transformar en 103 direcciones o
índices posibles. La función H es, por consiguiente, evidentemente una función de paso o conversión de múltiples
claves a direcciones. Dada una clave k, el primer paso en la operación de búsqueda es calcular su índice asociado
d ← H(k) y el segundo paso —evidentemente necesario— es verificar sí o no el elemento con la clave k es identifi-
cado verdaderamente por d en el array T; es decir, para verificar si la clave T[H(K)] = K se deben considerar dos
preguntas:
• ¿Qué clase de función H se utilizará?
• ¿Cómo resolver la situación de que H no produzca la posición del elemento asociado?
La respuesta a la segunda cuestión es que se debe utilizar algún método para producir una posición alternativa,
es decir, el índice d', y si ésta no es aún la posición del elemento deseado, se produce un tercer índice d, y así su-
cesivamente. El caso en el que una clave distinta de la deseada está en la posición identificada se denomina colisión;
la tarea de generación de índices alternativos se denomina tratamiento de colisiones.
Un ejemplo de colisiones puede ser:
clave 345123124
clave 416457234 función de conversión H → dirección 200
función de conversión H → dirección 200
Ordenación, búsqueda e intercalación 385
Dos claves distintas producen la misma dirección, es decir, colisiones. La elección de una buena función de con-
versión exige un tratamiento idóneo de colisiones, es decir, la reducción del número de colisiones.
10.3.3.1. Métodos de transformación de claves
Existen numerosos métodos de transformación de claves.
Todos ellos tienen en común la necesidad de convertir claves en direcciones. En esencia, la función de conversión
equivale a una caja negra que podríamos llamar calculador de direcciones. Cuando se desea localizar un elemento
de clave x, el indicador de direcciones indicará en qué posición del array estará situado el elemento.
.
.
.
.
1
2
h – 1
h
Calculador de
direcciones
x
Truncamiento
Ignora parte de la clave y se utiliza la parte restante directamente como índice (considerando campos no numéricos
y sus códigos numéricos). Si las claves, por ejemplo, son enteros de ocho dígitos y la tabla de transformación tiene
mil posiciones, entonces el primero, segundo y quinto dígitos desde la derecha pueden formar la función de conver-
sión. Por ejemplo, 72588495 se convierte en 895. El truncamiento es un método muy rápido, pero falla para distribuir
las claves de modo uniforme.
Plegamiento
La técnica del plegamiento consiste en la partición de la clave en diferentes partes y la combinación de las partes en
un modo conveniente (a menudo utilizando suma o multiplicación) para obtener el índice.
La clave x se divide en varias partes, x1, x2, ..., xn, donde cada parte, con la única posible excepción de la última
parte, tiene el mismo número de dígitos que la dirección más alta que podría ser utilizada.
A continuación se suman todas las partes
h(x) = x1 + x2 + ... + xn
En esta operación se desprecian los dígitos más significativos que se obtengan de arrastre o acarreo.
EJEMPLO 10.8
Un entero de ocho dígitos se puede dividir en grupos de tres, tres y dos dígitos, los grupos se suman juntos y se
truncan si es necesario para que estén en el rango adecuado de índices.
Por consiguiente, si la clave es:
62538194
y el número de direcciones es 100, la función de conversión será
625 + 381 + 94 = 1100
que se truncará a 100 y que será la dirección deseada.
386 Fundamentos de programación
EJEMPLO 10.9
Los números empleados —campo clave— de una empresa constan de cuatro dígitos y las direcciones reales son 100.
Se desea calcular las direcciones correspondientes por el método de plegamiento de los empleados.
4205 8148 3355
Solución
h(4205) = 42 + 05 = 47
h(8148) = 81 + 48 = 129 y se convierte en 29 (129 – 100), es decir, se ignora el acarreo 1
h(3355) = 33 + 55 = 88
Si se desea afinar más se podría hacer la inversa de las partes pares y luego sumarlas.
Aritmética modular
Convertir la clave a un entero, dividir por el tamaño del rango del índice y tomar el resto como resultado. La función
de conversión utilizada es mod (módulo o resto de la división entera).
h(x) = x mod m
donde m es el tamaño del array con índices de 0 a m – 1. Los valores de la función —direcciones— (el resto) irán
de 0 a m – 1, ligeramente menor que el tamaño del array. La mejor elección de los módulos son los números primos.
Por ejemplo, en un array de 1.000 elementos se puede elegir 997 o 1.009. Otros ejemplos son
18 mod 6 19 mod 6 20 mod 6
que proporcionan unos restos de 0, 1 y 2 respectivamente.
Si se desea que las direcciones vayan de 0 hasta m, la función de conversión debe ser
h(x) = x mod (m + 1)
EJEMPLO 10.10
Un vector T tiene cien posiciones, 0..100. Supongamos que las claves de búsqueda de los elementos de la tabla son
enteros positivos (por ejemplo, número del DNI).
Una función de conversión h debe tomar un número arbitrario entero positivo x y convertirlo en un entero en el
rango 0..100, esto es, h es una función tal que para un entero positivo x.
h(x) = n, donde n es entero en el rango 0..100
El método del módulo, tomando 101, será
h(x) = x mod 101
Si se tiene el DNI número 234661234, por ejemplo, se tendrá la posición 56:
234661234 mod 101 = 56
EJEMPLO 10.11
La clave de búsqueda es una cadena de caracteres —tal como un nombre—. Obtener las direcciones de conver-
sión.
El método más simple es asignar a cada carácter de la cadena un valor entero (por ejemplo, A = 1, B = 2, ...) y
sumar los valores de los caracteres en la cadena. Al resultado se le aplica entonces el módulo 101, por ejemplo.
Ordenación, búsqueda e intercalación 387
Si el nombre fuese JONAS, esta clave se convertiría en el entero
10 + 15 + 14 + 1 + 19 = 63
63 mod 101 = 63
Mitad del cuadrado
Este método consiste en calcular el cuadrado de la clave x. La función de conversión se define como
h(x) = c
donde c se obtiene eliminando dígitos a ambos extremos de x2
. Se deben utilizar las mismas posiciones de x2
para
todas las claves.
EJEMPLO 10.12
Una empresa tiene ochenta empleados y cada uno de ellos tiene un número de identificación de cuatro dígitos y el
conjunto de direcciones de memoria varía en el rango de 0 a 100. Calcular las direcciones que se obtendrán al
aplicar función de conversión por la mitad del cuadrado de los números empleados:
4205 7148 3350
Solución
x 4205 7148 3350
x2
17 682 025 51 093 904 11 122 250
Si elegimos, por ejemplo, el cuarto y quinto dígito significativo, quedaría
h(x) 82 93 22
10.3.3.2. Colisiones
La función de conversión h(x) no siempre proporciona valores distintos, puede suceder que para dos claves diferentes
x1 y x2 se obtenga la misma dirección. Esta situación se denomina colisión y se deben encontrar métodos para su
correcta resolución.
Los ejemplos vistos anteriormente de las claves DNI correspondientes al archivo de empleados, en el caso de cien
posibles direcciones. Si se considera el método del módulo en el caso de las claves, y se considera el número prime-
ro 101
123445678 123445880
proporcionarían las direcciones:
h (123445678) = 123445678 mod 101 = 44
h (123445880) = 123445880 mod 101 = 44
Es decir, se tienen dos elementos en la misma posición del vector o array, [44]. En terminología de claves se
dice que las claves 123445678 y 123445880 han colisionado.
El único medio para evitar el problema de las colisiones totalmente es tener una posición del array para cada
posible número de DNI. Si, por ejemplo, los números de DNI son las claves y el DNI se representa con nueve dígi-
tos, se necesitaría una posición del array para cada entero en el rango 000000000 a 999999999. Evidentemente, sería
necesario una gran cantidad de almacenamiento. En general, el único método para evitar colisiones totalmente es que
el array sea lo bastante grande para que cada posible valor de la clave de búsqueda pueda tener su propia posición.
Ya que esto normalmente no es práctico ni posible, se necesitará un medio para tratar o resolver las colisiones cuan-
do sucedan.
388 Fundamentos de programación
Resolución de colisiones
Consideremos el problema producido por una colisión. Supongamos que desea insertar un elemento con número
nacional de identidad DNI 12345678, en un array T. Se aplica la función de conversión del módulo y se determina
que el nuevo elemento se situará en la posición T[44]. Sin embargo, se observa que T[44] ya contiene un elemen-
to con DNI 123445779.
h(12345678)
...
...
1
2
3
...
44
...
99
100
Array T
Elemento con DNI
12345779 ya ocupa
la posición T[44]
Figura 10.4. Colisión.
La pregunta que se plantea inmediatamente es ¿qué hacer con el nuevo elemento?
Un método comúnmente utilizado para resolver una colisión es cambiar la estructura del array T de modo que
pueda alojar más de un elemento en la misma posición. Se puede, por ejemplo, modificar T de modo que cada posi-
ción T[i] sea por sí misma un array capaz de contener N elementos. El problema, evidentemente, será saber la mag-
nitud de N. Si N es muy pequeño, el problema de las colisiones aparecerá cuando aparezca N + 1 elementos.
Una solución mejor es permitir una lista enlazada o encadenada de elementos para formar a partir de cada posi-
ción del array. En este método de resolución de colisiones, conocido como encadenamiento, cada entrada T[i] es
un puntero que apunta al elemento del principio de la lista de elementos (véase Capítulo 12), de modo que la función
de transformación de clave lo convierte en la posición i.
0
2
h – 2
h – 1
1
...
...
...
...
Figura 10.5. Encadenamiento.
10.4. INTERCALACIÓN
La intercalación es el proceso de mezclar (intercalar) dos vectores ordenados y producir un nuevo vector ordenado.
Consideremos los vectores (listas de elementos) ordenados:
A: 6 23 34
B: 5 22 26 27 39
El vector clasificado es:
C: 5 6 22 23 24 26 27 39
Ordenación, búsqueda e intercalación 389
La acción requerida para solucionar el problema es muy fácil de visualizar. Un algoritmo sencillo puede ser:
1. Poner todos los valores del vector A en el vector C.
2. Poner todos los valores del vector B en el vector C.
3. Clasificar el vector C.
Es decir, todos los valores se ponen en el vector C, con todos los valores de A seguidos por todos los valores de B.
Seguidamente, se clasifica el vector C. Evidentemente es una solución correcta. Sin embargo, se ignora por comple-
to el hecho de que los vectores A y B están clasificados.
Supongamos que los vectores A y B tienen M y N elementos. El vector C tendrá M + N elementos.
El algoritmo comenzará seleccionando el más pequeño de los dos elementos A y B, situándolo en C. Para poder
realizar las comparaciones sucesivas y la creación del nuevo vector C, necesitaremos dos índices para los vectores A
y B. Por ejemplo, i y j. Entonces nos referiremos al elemento i en la lista A y al elemento j en la lista B. Los pasos
generales del algoritmo son:
si elemento i de A es menor que elemento j de B entonces
transferir elemento i de A a C
avanzar i (incrementar en 1)
si_no
transferir elemento j de B a C
avanzar j
fin_si
Se necesita un índice K que represente la posición que se va rellenando en el vector C. El proceso gráfico se
muestra en la Figura 10.6.
Comparar A[i] y B[j].
Poner el más pequeño
en C[k]. Incrementar
los índices apropiados
.
–15 0 13 15 78 90 94 96 Lista B
2 4 78 97
2 4 78 97
Lista A
i

–15 Lista C
k
j
j se ha incrementado
junto con k.
–15 0 Lista B
Lista A

–15 Lista C
0
Figura 10.6. Intercalación (B[j]  A[i], de modo que C[k] se obtiene de B[j]).
El primer refinamiento del algoritmo.
{estado inicial de los algoritmos}
i ← 1
j ← 1
k ← 0
mientras (i = M) y (j = N) hacer
//seleccionar siguiente elemento de A o B y añadir a C
k ← k + 1
//incrementar K}
390 Fundamentos de programación
si A[i]  B[j] entonces
C[k] ← A[i]
i ← i + 1
si_no
C[k] ← B[j]
j ← j + 1
fin_si
fin_mientras
Si los vectores tienen elementos diferentes, el algoritmo anterior no requiere seguir haciendo comparaciones
cuando el vector más pequeño se termine de situar en C. La operación siguiente deberá copiar en C los elementos que
restan del vector más grande. Así, por ejemplo, supongamos:
A = 6 23 24 i = 4
B = 5 22 26 27 39 j = 3
C = 5 6 22 23 24 k = 5
Todos los elementos del vector A se han relacionado y situado en el vector C. El vector B contiene los elementos
no seleccionados y que deben ser copiados, en orden, al final del vector C. En general, será necesario decidir cuál de
los vectores A o B tienen elementos no seleccionados y a continuación ejecutar la asignación necesaria.
El algoritmo de copia de los elementos restantes es:
si i = M entonces
desde r ← i hasta M hacer
k ← k + 1
C[k] ← A[r]
fin_desde
si_no
desde r ← j hasta N hacer
k ← k + 1
C[k] ← B[r]
fin_desde
fin_si
El algoritmo total resultante de la intercalación de dos vectores A y B ordenados en uno C es:
algoritmo intercalacion
inicio
leer(A, B) //A, B vectores de M y N elementos
i ← 1
j ← 1
k ← 0
mientras (i = M) y (j = N) hacer
//seleccionar siguiente elemento de A o B y añadirlo a C
k ← k+1
si A[i]  B[j] entonces
C[k] ← A[i]
i ← i + 1
si_no
C[k] ← B[j]
j ← j + 1
fin_si
fin_mientras
//copiar el vector restante
si i = M entonces
Ordenación, búsqueda e intercalación 391
desde r ← i hasta M hacer
k ← k + 1
C[k] ← A[r]
fin_desde
si_no
desde r ← j hasta N hacer
k ← k + 1
C[k] ← B[r]
fin_desde
fin_si
escribir(C) //vector clasificado
fin
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
10.1. Clasificar una serie de números X1, X2, ..., Xn en orden creciente por el método del intercambio o de la bur-
buja.
Análisis
Se utiliza un indicador (bandera) igual a 0 si la serie está bien ordenada y a 1 en caso contrario. Como a priori la serie no
está bien ordenada, se inicializa el valor de la bandera a 1 y después se repiten las siguientes acciones:
• Se fija la bandera a 0.
• A partir del primero se comparan dos elementos consecutivos de la serie; si están bien ordenados, se pasa al ele-
mento siguiente, si no se intercambian los valores de los dos elementos y se fija el valor de la bandera a 1; si después
de haber pasado revista —leído— toda la serie, la bandera permanece igual a 0, entonces la clasificación está ter-
minada.
BANDERA → 1
mientras BANDERA = 1
BANDERA = 0
no
intercambiar
X[I] y X[I + 1]
BANDERA ← 1
Algoritmo clasificación
Escribir Serie ordenada
desde I = 1 a N – 1
si
X[I]  X[I + 1]
392 Fundamentos de programación
10.2. Clasificar los números A y B.
Método 1
algoritmo clasificar
inicio
leer(A, B)
si A  B entonces
permutar (A , B)
fin_si
escribir('Mas grande', A)
escribir('Más pequeña', B)
fin
Método 2
algoritmo clasificar
inicio
leer(A)
MAX ← A
leer(B)
MIN ← B
si B  A entonces
MAX ← B
MIN ← A
fin_si
escribir('Maximo =', MAX)
escribir('Mínimo =', MIN)
fin
10.3. Se dispone de una lista de números enteros clasificados en orden creciente. Se desea conocer si un número dado
introducido desde el terminal se encuentra en la lista. En caso afirmativo, averiguar su posición, y en caso negati-
vo, se desea conocer su posición en la lista e insertarlo en su posición.
Análisis
Como ya conoce el lector, existen dos métodos fundamentales de búsqueda: lineal y binaria. Resolvemos el problema con
los dos métodos a fin de consolidar las ideas sobre ambos.
Búsqueda lineal
El método consiste en comparar el número dado en orden sucesivo con todos los elementos del conjunto de números, efec-
tuando un recorrido completo del vector que representa la lista.
El proceso termina cuando se encuentra un número igual o superior al número dado.
El método de inserción o intercalación de un elemento en el vector será el descrito en el apartado 6.3.4.
La tabla de variables es la siguiente:
N número de elementos de la lista: entero.
J posición del elemento en la lista: entero.
K contador del bucle de búsqueda: entero.
X número dado: entero.
LISTA conjunto de números enteros.
Búsqueda dicotómica
La condición para realizar este método —más rápido y eficaz— es que la lista debe estar clasificada en orden creciente o
decreciente.
Se obtiene el número de elementos de la lista y se calcula el número central de la lista.
Si el número dado es igual al número central de la lista, la búsqueda ha terminado. En caso contrario, pueden suceder
dos casos:
Ordenación, búsqueda e intercalación 393
• El número está en la sublista inferior.
• El número está en la sublista superior.
Tras localizar la sublista donde se encuentra, se consideran variables MIN y MAX que contienen los elementos menor y
mayor de cada sublista —que coincidirán con los extremos al estar ordenada la lista—, así como el término central (CEN-
TRAL), de acuerdo al siguiente esquema.
Sublista inferior L[1] L[2] ...L[CENTRAL]
Sublista superior L[CENTRAL + 1]...L[N]
Los valores de las variables INF, SUP y CENTRAL serán:
Primera búsqueda
CENTRAL =
(SUP – INF)
2
+
INF = N – 1
2
+ 1 =
N – 1
2
SUP = N
INF = 1
• Si el número X está en la sublista inferior, entonces
INF = 1
SUP = CENTRAL - 1
y se realiza una segunda búsqueda entre los elementos de orden 1 y CENTRAL.
• Si el número X está en la sublista superior, entonces
INF = CENTRAL + 1
SUP = N
y se realiza una segunda búsqueda entre los elementos de orden CENTRAL + 1 y N.
El proceso de variables es:
N número de elementos de la lista: entero.
I contador del bucle de búsqueda: entero.
SW interruptor o bandera para indicar si el número dado está en la lista: lógico.
LISTA conjunto de números enteros: entero.
X número buscado: entero.
INF posición inicial de la lista o sublista: entero.
SUP posición superior de la lista o sublista: entero.
POSICION lugar del orden ocupado por el número buscado: entero.
Pseudocódigo
Búsqueda lineal
algoritmo busqueda_1
var
entero : I, K, X, N
array[1..50] de entero : lista
//se supone dimensión de la lista a 50 elementos y que se trata de una
//lista ordenada
inicio
leer(N)
//lectura de la lista
394 Fundamentos de programación
desde I ← 1 hasta N hacer
leer(LISTA[I])
fin_desde
Ordenar (LISTA, N)
leer(X)
I ← 0
repetir
I ← I + 1
hasta_que (LISTA[I] = X) o (I = 50)
si LISTA[I] = X entonces
escribir('se encuentra en',I)
si_no
escribir('El numero dado no esta en el lista')
//insertar el elemento X en la lista
si N  50 entonces
desde K ← N hasta I decremento 1 hacer
LISTA[K + 1] ← LISTA[K]
fin_desde
LISTA[I] ← X
N ← N + 1
escribir('Insertado en',I)
fin_si
fin_si
//escritura del vector LISTA
desde I ← 1 hasta N hacer
escribir(LISTA[I])
fin_desde
fin
Búsqueda dicotómica
algoritmo busqueda_b
var
entero: I, N, X, K, INF, SUP, CENTRAL, POSICION
lógico: SW
array [1...50] de entero: LISTA
inicio
leer(N)
desde I ← 1 hasta N hacer
leer(LISTA[I]) //la lista ha de estar ordenada
fin_desde
Ordenar (LISTA, N)
leer(X)
SW ← falso
INF ← 1
SUP ← N
repetir
CENTRAL ← (SUP - INF)DIV 2 + INF
si LISTA[CENTRAL] = X entonces
escribir('Numero encontrado en la lista')
POSICION ← CENTRAL
escribir(POSICION)
SW ← verdad
si_no
si X  LISTA[CENTRAL] entonces
SUP ← CENTRAL
si_no
INF ← CENTRAL+1
Ordenación, búsqueda e intercalación 395
fin_si
si (INF = SUP) y (LISTA[INF] = X) entonces
escribir('El numero esta en la lista')
POSICION ← INF
escribir(POSICION)
SW ← verdad
fin_si
fin_si
hasta_que (INF = SUP) o SW
si no (SW) entonces
escribir('Numero no existe en la lista')
si X  lista(INF) entonces
POSICION ← INF
si_no
POSICION ← INF+1
fin_si
escribir(POSICION)
desde K ← N hasta POSICION decremento 1 hacer
LISTA[K + 1] ← LISTA[K]
fin_desde
LISTA[POSICION] ← X
N ← N + 1
fin_si
//escritura de la lista
desde I ← 1 hasta N hacer
escribir(LISTA[I])
fin_desde
fin
10.4. Ordenar de mayor a menor un vector de N elementos (N = 40), cada uno de los cuales es un registro con los
campos día, mes y año de tipo entero.
Utilice una función ESMENOR(fecha1,fecha2) que nos devuelva si una fecha es menor que otra.
algoritmo ordfechas
tipo registro: fechas
inicio
entero: dia
entero: mes
entero: año
fin_registro
array[1..40] de fechas: arr
var arr : f
entero : n
inicio
pedirfechas(f,n)
ordenarfechas(f,n)
presentarfechas(f,n)
fin
logico función esmenor(E fechas: fecha1,fecha2)
inicio
si (fecha1.añofecha2.año) o
(fecha1.año=fecha2.año) y (fecha1.mesfecha2.mes) o
(fecha1.año=fecha2.año) y (fecha1.mes=fecha2.mes) y
(fecha1.díafecha2.día) entonces
devolver(verdad)
si_no
devolver(falso)
fin_si
fin_función
396 Fundamentos de programación
procedimiento pedirfechas(S arr:f; S entero:n)
var entero:i
entero:dia
inicio
i←1
escribir (Deme la ,i,ª fecha)
escribir(Día: )
leer(dia)
mientras (dia0) y (i=40) hacer
f[i].dia ← dia
escribir(Mes:)
leer(f[i].mes)
escribir(Año:)
leer(f[i].año)
n ← i
i ← i+1
si i=40 entonces
escribir (Deme la ,i,ª fecha)
escribir (Día: )
leer(dia)
fin_si
fin_mientras
fin_procedimiento
procedimiento ordenarfechas(E/S arr:f; E entero:n)
var entero:salto
lógico:ordenada
entero:j
fechas:AUXI
inicio
salto ← n
mientras salto  1 hacer
salto ← salto div 2
repetir
ordenada ← verdad
desde j ← 1 hasta n-salto hacer
si esmenor(f[j], f[j+salto]) entonces
AUXI ← f[j]
f[j] ← f[j+salto]
f[j+salto] ← AUXI
ordenada ← falso
fin_si
fin_desde
hasta ordenada
fin_mientras
fin_procedimiento
procedimiento presentarfechas(E arr:f; E entero:n)
var entero:i
inicio
desde i←1 hasta n hacer
escribir(f[i].día,f[i].mes,f[i].año)
fin_desde
fin_procedimiento
Considere otras posibilidades, usando el mismo método de ordenación, para resolver el ejercicio.
Ordenación, búsqueda e intercalación 397
10.5. Dada la lista de fechas ordenada en orden decreciente del ejercicio anterior, diseñar los procedimientos:
1. Buscar, que nos informará sobre si una determinada fecha se encuentra o no en la lista
— si no está, indicará la posición donde correspondería insertarla,
— si está, nos dirá la posición donde la hemos encontrado o, si estuviera repetida, a partir de qué posición y
cuántas veces son las que aparece.
2. Insertar, que nos permitirá insertar una fecha en una determinada posición. Se deberá utilizar en un algoritmo
haciendo uso previo de buscar; así, cuando una fecha no se encuentre en la lista, la insertará en el lugar adecua-
do para que no se pierda la ordenación inicial.
algoritmo buscar_insertar_fechas
tipo registro: fechas
inicio
entero: dia
entero: mes
entero: año
fin_registro
array[1..40] de fechas: vector
var vector : f
entero : n
fechas : fecha
lógico : esta
entero : posic, cont
inicio
pedirfechas(f,n)
ordenarfechas(f,n)
presentarfechas(f,n)
escribir('Deme fecha a buscar (dd mm aa)')
leer(fecha.dia,fecha.mes,fecha.año)
buscar(f,n,fecha,esta,posic,cont)
si esta entonces
si cont  1 entonces
escribir('Aparece a partir de la posición: ', posic, ' ', cont, ' veces')
si_no
escribir('Está en la posición: ', posic )
fin_si
si_no
si n=40 entonces
escribir('No está. Array lleno')
si_no
insertar(f,n,fecha,posic)
presentarfechas(f,n)
fin_si
fin_si
fin
logico función esmenor(E fechas: fecha1,fecha2)
inicio
....................
fin_función
logico función esigual(E fechas: fecha1,fecha2)
inicio
si (fecha1.año=fecha2.año) y (fecha1.mes=fecha2.mes) y (fecha1.día=fecha2.día) entonces
devolver(verdad)
398 Fundamentos de programación
si_no
devolver(falso)
fin_si
fin_función
procedimiento pedirfechas(S vector: f; S entero n)
var entero: i
entero: dia
inicio
...
fin_procedimiento
procedimiento ordenarfechas(E/S vector: f; E entero: n)
var entero : salto
lógico : ordenada
entero : j
fechas : AUXIi
inicio
...
fin_procedimiento
procedimiento buscar(E vector: f; E entero:n; E fechas: fecha; S lógico:esta; S entero:
posic, cont)
var entero : primero,ultimo,central,i
lógico : encontrado
inicio
primero ← 1
ultimo ← n
esta ← falso
mientras (primero=ultimo) y (no esta) hacer
central ← (primero+ultimo) div 2
si esigual(f[central],fecha) entonces
esta ← verdad
si_no
si esmenor(f[central],fecha) entonces
ultimo ← central-1
si_no
primero ← central+1
fin_si
fin_si
fin_mientras
cont ← 0
si esta entonces
i ← central-1
encontrado ← verdad
mientras (i=1) y (encontrado) hacer
si esigual(f[i],f[central]) entonces
i ← i-1
si_no
encontrado ← falso
fin_si
fin_mientras
i ← i+1
encontrado ← verdad
posic ← i
mientras (i=40) y encontrado hacer
si esigual(f[i],f[central]) entonces
cont ← cont+1
i ← i+1
Ordenación, búsqueda e intercalación 399
si_no
encontrado ← falso
fin_si
fin_mientras
si_no
posic ← primero
fin_si
fin_procedimiento
procedimiento insertar(E/S vector: f; E/S entero: n
E fechas:fecha; E entero:posic)
var entero:i
inicio
desde i ← n hasta posic decremento 1 hacer
f[i+1] ← f[i]
fin_desde
f[posic] ← fecha
n ← n+1
fin_procedimiento
procedimiento presentarfechas(E vector:f; E entero:n)
var entero:i
inicio
...
fin_procedimiento
10.6. Escriba el procedimiento de búsqueda binaria de forma recursiva
algoritmo busqueda_binaria
tipo
array[1..10] de entero: arr
var
arr : a
entero : num, posic, i
inicio
desde i ← 1 hasta 10 hacer
leer(a[i])
fin_desde
ordenar(a)
escribir('Indique el número a buscar en el array ')
leer(num)
busqueda(a,posic,1,10,num)
si posic  0 entonces
escribir('Existe el elemento en la posición ', posic)
si_no
escribir('No existe el elemento en el array.')
fin_si
fin
procedimiento ordenar(E/S arr: a)
...
inicio
...
fin_procedimiento
procedimiento busqueda(E arr: a; S entero: posic
E entero: primero,ultimo,num)
//Este procedimiento devuelve 0 si no existe el elemento
en el array, y si existe devuelve su posición
var
entero: central
400 Fundamentos de programación
inicio
si primero  ultimo entonces
posic ← 0
si_no
central ← (primero+ultimo) div 2
si a[central] = num entonces
posic ← central
si_no
si num  a[central] entonces
primero ← central + 1
si_no
ultimo ← central - 1
fin_si
busqueda(a,posic,primero,ultimo,num)
fin_si
fin_si
fin_procedimiento
10.7. Partiendo de la siguiente lista inicial:
80 36 98 62 26 78 22 27 2 45
tome como elemento pivote el contenido del que ocupa la posición central y realice el seguimiento de los distintos
pasos que llevarían a su ordenación por el método Quick-Sort. Implemente el algoritmo correspondiente.
1 2 3 4 5 6 7 8 9 10
80 36 98 62 26 78 22 27 2 45
2 80
22 36
26 98
j i
1 2 3 4 5 6 7 8 9 10
2 22 26 62 98 78 36 27 80 45
22
j i
1 2 3 4 5 6 7 8 9 10
2 22 26 62 98 78 36 27 80 45
27 62
36 98
j i
1 2 3 4 5 6 7 8 9 10
2 22 26 27 36 78 98 62 80 45
27
j i
1 2 3 4 5 6 7 8 9 10
2 22 26 27 36 78 98 62 80 45
45 78
62 98
j i
1 2 3 4 5 6 7 8 9 10
2 22 26 27 36 45 62 98 80 78
45
j i
1 2 3 4 5 6 7 8 9 10
2 22 26 27 36 45 62 98 80 78
78 98
80
j i
1 2 3 4 5 6 7 8 9 10
2 22 26 27 36 45 62 78 80 98
Ordenación, búsqueda e intercalación 401
algoritmo quicksort
tipo
array[1..10] de entero: arr
var
arr : a
entero : k
inicio
desde k ← 1 hasta 10 hacer
leer (a[k])
fin_desde
rápido (a,10)
desde k ← 1 hasta 10 hacer
escribir (a[k])
fin_desde
fin
procedimiento intercambiar (E/S entero: m,n)
var
entero: AUXI
inicio
AUXI ← m
m ← n
n ← AUXI
fin_procedimiento
procedimiento partir (E/S arr: a E entero: primero, ultimo)
var
entero: i,j,central
inicio
i ← primero
j ← ultimo
// encontrar elemento pivote, central, y almacenar su contenido
central ← a[ (primero+ultimo) div 2 ]
repetir
mientras a[i]  central hacer
i ← i+1
fin_mientras
mientras a[j]  central hacer
j ← j-1
fin_mientras
si i = j entonces
intercambiar( a[i],a[j] )
i ← i+1
j ← j-1
fin_si
hasta_que i  j
si primero  j entonces
partir (a,primero,j)
fin_si
si i  ultimo entonces
partir (a,i,ultimo)
fin_si
fin_procedimiento
procedimiento rapido (E/S arr: a; E entero: n)
inicio
partir (a,1,n)
fin_procedimiento
402 Fundamentos de programación
CONCEPTOS CLAVE
• Búsqueda.
• Eficiencia de los métodos de
ordenación.
• Intercalación.
• Ordenación.
• Tipos de búsqueda.
RESUMEN
La ordenación de datos es una de las aplicaciones más im-
portantes de las computadoras. Dado que es frecuente que
un programa trabaje con grandes cantidades de datos alma-
cenados en arrays, resulta imprescindible conocer diversos
métodos de ordenación de arrays y cómo, además, puede
ser necesario determinar si un array contiene un valor que
coincide con un cierto valor clave también resulta básico
conocer los algoritmos de búsqueda.
1. La ordenación o clasificación es el proceso de
organizar datos en algún orden o secuencia espe-
cífica, tal como creciente o decreciente para datos
numéricos o alfabéticamente para datos de caracte-
res. La ordenación de arrays (arreglos) se denomi-
na ordenación interna, ya que se efectúa con todos
los datos en la memoria interna de computadora.
2. Es posible ordenar arrays por diversas técnicas,
como burbuja, selección, inserción, Shell o Quick-
Sort y, cuando el número de elementos a ordenar
es pequeño, todos estos métodos son aceptables.
3. Para ordenar arrays con un gran número de ele-
mentos debe tenerse en cuenta la diferente efi-
ciencia en cuanto al tiempo de ejecución entre los
métodos comentados. Entre los citados, QuickSort
y Shell son los más avanzados.
4. El método de búsqueda lineal de un determinado
valor clave en un array, que compara cada elemen-
to con la clave buscada, puede ser útil en arrays
pequeños o no ordenados.
5. El método de búsqueda binaria es mucho más efi-
ciente pero requiere arrays ordenados.
6. Puesto que los arrays permiten el acceso directo a
un determinado elemento o posición, la informa-
ción en un array no tiene por qué ser colocada en
forma secuencial. Es, por tanto, posible usar una
función hash que transforme el valor clave en un
número válido para ser utilizado como subíndice
en el array y almacenar la información en la po-
sición especificada por dicho subíndice.
7. Una función de conversión hash no siempre pro-
porciona valores distintos, y puede suceder que
para dos claves diferentes devuelva la misma
dirección. Esta situación se denomina colisión
y se deben encontrar métodos para su correcta
resolución.
8. Entre los métodos para resolver las colisiones
destacan:
a) Reservar una zona especial en el array para
colocar las colisiones.
b) Buscar la primera posición libre que siga a
aquélla donde se debiera haber colocado la
información y en la que no se pudo situar por
encontrarse ya ocupada debido a la colisión.
c) Utilizar encadenamiento.
9. Si la información se coloca en un array apli-
cando una función hash a determinado campo
clave y estableciendo un método de resolución
de colisiones, la consulta por dicho campo clave
también se efectuará de forma análoga.
10. Cuando se tienen dos vectores ordenados y se ne-
cesita obtener otro también ordenado, el proceso
de intercalación o mezcla debe producirnos el
resultado deseado, sin que sea necesario aplicar
a continuación ningún método de ordenación.
Ordenación, búsqueda e intercalación 403
EJERCICIOS
10.1. Realizar el diagrama de flujo y el pseudocódigo que
permuta tres enteros: n1, n2 y n3 en orden cre-
ciente.
10.2. Escribir un algoritmo que lea diez nombres y los pon-
ga en orden alfabético utilizando el método de selec-
ción. Utilice los siguientes datos para comprobación:
Sánchez, Waterloo, McDonald, Bartolomé, Jorba,
Clara, David, Robinson, Francisco, Westfalia.
10.3. Clasificar el array (vector):
42 57 14 40 96 19 08 68
por los métodos: 1) selección, 2) burbuja. Cada vez
que se reorganice el vector, se debe mostrar el nuevo
vector reformado.
10.4. Supongamos que se tiene una secuencia de n núme-
ros que deben ser clasificados:
1. Utilizando el método de selección, cuántas com-
paraciones y cuántos intercambios se requieren
para clasificar la secuencia si:
• Ya está clasificado.
• Está en orden inverso.
2. Repetir el paso i para el método de selección.
10.5. Escribir un algoritmo de búsqueda lineal para un
vector ordenado.
10.6. Un algoritmo ha sido diseñado para leer una lista de
no más de 1.000 enteros positivos, cada uno menos
de 100, y ejecutar algunas operaciones. El cero es la
marca final de la lista. El programador debe obtener
en el algoritmo.
1. Visualizar los números de la lista en orden cre-
ciente.
2. Calcular e imprimir la mediana (valor central).
3. Determinar el número que ocurre más frecuen-
temente.
4. Imprimir una lista que contenga:
• Números menores de 30.
• Números mayores de 70.
• Números que no pertenezcan a los dos grupos
anteriores.
5. Encontrar e imprimir el entero más grande de la
lista junto con su posición en la lista antes de
que los números hayan sido ordenados.
10.7. Diseñar diferentes algoritmos para insertar un nuevo
valor en una lista (vector). La lista debe estar orde-
nada en orden ascendente antes y después de la in-
serción.
Fundamentos_de_programacion_Algoritmos_e.pdf
CAPÍTULO 11
Ordenación, búsqueda
y fusión externa (archivos)
11.1. Introducción
11.2. Archivos ordenados
11.3. Fusión de archivos
11.4. Partición de archivos
11.5. Clasificación de archivos
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
CONCEPTOS CLAVE
RESUMEN
EJERCICIOS
Los sistemas de procesamiento de la información pro-
cesan normalmente gran cantidad de información. En
estos casos los datos se almacenan sobre soportes de
almacenamiento masivo (cintas y discos magnéticos).
Los algoritmos de ordenación presentados en el Ca-
pítulo 10 no son aplicables si la masa de datos no
cabe en la memoria central de la computadora y se
encuentran almacenados en su soporte como una cin-
ta. En estos casos se suelen colocar en memoria cen-
tral las fichas que se procesan y a las que se pueda
acceder directamente. Normalmente estas técnicas no
son muy eficaces y se utilizan técnicas distintas de
ordenación. La técnica más importante es la fusión o
mezcla.
Este capítulo realiza una introducción a las técnicas
de ordenación, búsqueda y mezcla o fusión externas.
INTRODUCCIÓN
406 Fundamentos de programación
11.1. INTRODUCCIÓN
Cuando la masa de datos a procesar es grande y no cabe en la memoria central de la computadora, los datos se or-
ganizan en archivos que, a su vez, se almacenan en dispositivos externos de memoria auxiliar (discos, cintas magné-
ticas, etc.).
Las operaciones básicas estudiadas en el Capítulo 10, ordenación, búsqueda e intercalación o mezcla, sufren un
cambio importante en su concepción, derivado esencialmente del hecho físico de que los datos a procesar no caben
en la memoria principal de la computadora.
11.2. ARCHIVOS ORDENADOS
El tratamiento de los archivos secuenciales exige que éstos se encuentren ordenados respecto a un campo del registro,
denominado campo clave.
Supongamos un archivo del personal de una empresa, cuya estructura de registros es la siguiente:
NOMBRE
DIRECCION
FECHA
SALARIO
CATEGORIA
DNI
tipo cadena
tipo cadena
tipo cadena
tipo numérico
tipo cadena
tipo cadena
(nombre del empleado)
(dirección)
(fecha de nacimiento)
(salario)
(categoría laboral)
(número de DNI)
La clasificación en orden ascendente o descendente se puede realizar con respecto a una clave (nombre,
dirección, etc.). Sin embargo, puede ser interesante tener clasificado un fichero por categoría laboral y a su vez se
puede tener por cada categoría laboral los registros agrupados por nombres o direcciones. Ello nos lleva a la conclu-
sión de que un archivo puede estar ordenado por un campo clave o una jerarquía de campos.
Se dice que un archivo (estructura del registro: campos C1, C2, ... Cn) está ordenado principalmente por el cam-
po C1, en orden secundario 1 por el campo C2, en orden secundario 2 por el campo C3, etc., en orden secundario n
por el campo Cn. Si el archivo tiene la siguiente organización:
• Los registros aparecen en el archivo según el orden de los valores del campo clave C1.
• Si se considera un mismo valor C1, los registros aparecen en el orden de los valores del campo C2.
• Para un mismo valor de C(Ci) los registros aparecen según el orden de los valores del campo Ci + 1, siendo
1 = i = n.
Si se desea ordenar un archivo principalmente por C1, y en orden secundario 1 por C2, se necesita:
• Ordenar primero por C2.
• Ejecutar a continuación una ordenación estable por el campo C1.
La mayoría de los Sistemas Operativos actuales disponen de programas estándar (utilidad) que realizan la clasi-
ficación de uno o varios archivos (sort). En el caso del Sistema Operativo MS-DOS existe la orden SORT, que per-
mite realizar la clasificación de archivos según ciertos criterios específicos.
Los algoritmos de clasificación externa son muy numerosos y a ellos dedicaremos gran parte de este capítulo.
11.3. FUSIÓN DE ARCHIVOS
La fusión o mezcla de archivos (merge) consiste en reunir en un archivo los registros de dos o más archivos ordena-
dos por un campo clave T. El archivo resultante será un archivo ordenado por el campo clave T.
Supongamos que se dispone de dos archivos ordenados sobre dos cintas magnéticas y que se desean mezclar o
fundir en un solo archivo ordenado. Sean los archivos F1 y F2 almacenados en dos cintas diferentes. El archivo F3
se construye en una tercera cinta.
Ordenación, búsqueda y fusión externa (archivos) 407
El algoritmo de fusión de archivos será
inicio
//fusión de dos archivos
1. poner archivo 1 en cinta 1, archivo 2 en cinta 2
2. seleccionar de los dos primeros registros de archivo
1 y archivo 2 el registro de clave más pequeña y
almacenarlo en un nuevo archivo 3
3. mientras (archivo 1 no vacio) y (archivo 2 no vacio) hacer
4. seleccionar el registro siguiente con clave mas
pequeña y almacenarlo en el archivo 3
fin_mientras
//uno de los archivos no está aún vacío
5. almacenar resto archivo en archivo 3 registro a registro
fin
EJEMPLO 11.1
Se dispone de dos archivos, F1 y F2, cuyos campos claves son
F1 12 24 36 37 40 52
F2 3 8 9 20
y se desea un archivo FR ordenado, que contenga los dos archivos F1 y F2.
La estructura de los archivos F1 y F2 es:
F1 12 24 36 37 40 52 EOF(*) Fin archivo (eof)
F2 3 8 9 20
Para realizar la fusión de F1 y F2 es preciso acceder a los archivos F1 y F2 que se encuentran en soportes mag-
néticos en organización secuencial. En cada operación de acceso a un archivo sólo se puede acceder a un único ele-
mento del archivo en un momento dado. Para realizar la operación se utiliza una variable de trabajo del mismo tipo
que los elementos del archivo. Esta variable representa al elemento actual del archivo y denominaremos ventana,
debido a que será la variable que nos permitirá ver el archivo, elemento tras elemento. El archivo se recorre en un
único sentido y su final físico termina con una marca especial denominada fin de archivo (EOF, end of file); por
ejemplo, un asterisco (*).
12
3 8 9 20 *
24 36 37 52
40
F1
Ventana
Ventana
F2
*
Se comparan las claves de las ventanas y se sitúa la más pequeña 3(F2) en el archivo de salida. A continuación,
se avanza un elemento el archivo F2 y se realiza una nueva comparación de los elementos situados en las ventanas.
3 8 9 20 *
Ventana
Ventana
12 24 36 40 *
52
F1
F2
3
F3
408 Fundamentos de programación
Cuando uno u otro de los archivos de entrada se ha terminado, se copia el resto del archivo sobre el archivo de
salida y el resultado final será:
3 8 9 12 20 24 36 37 40 52 *
FR
El algoritmo correspondiente de fusión de archivos será
algoritmo fusion_archivo
var
entero:ventana1, ventana2, ventanaS
archivo_s de entero: F1,F2,F3
//ventana1,ventana2 claves de los archivos F1,F2
ventanaS claves del archivo FR
inicio
abrir (F1, l, 'nombre')
abrir (F2, l, 'nombre2')
crear (FR, 'nombre3')
abrir (FR, e, 'nombre3')
leer (F1, ventana1)
leer (F2, ventana2)
mientras no FDA(F1) y no FDA (F2) hacer
si ventana1 = ventana2 entonces
ventanaS ← ventana1
escribir(FR,ventanaS)
leer (F1, ventana1)
si_no
ventanaS ← ventana2
escribir (FR, ventanaS)
leer (F2, ventana2)
fin_si
fin_mientras
//lectura terminada de F1 o F2
mientras no FDA (F1) hacer
ventanaS ← ventana1
escribir(FR, ventanaS)
leer(F1, ventana1)
fin_mientras
mientras_no FDA(F2)hacer
ventanaS ← ventana2
escribir (FR, ventanaS)
leer(F2, ventana2)
fin_mientras
cerrar (F1,F2,FR)
fin
Se considera ahora el otro caso posible en los archivo secuenciales. El final físico del archivo se detecta al leer
el último elemento (no la marca de fin de archivo) y los ficheros son de registros con varios campos. El algoritmo
correspondiente a la fusión sería:
tipo
registro: datos_personales
-: C //campo por el que estan ordenados
-:-
fin_registro
archivo_s de datos_personales: arch
Ordenación, búsqueda y fusión externa (archivos) 409
var
datos_personales:r1, r2
arch: f1, f2, f //f es el fichero resultante
lógico: fin1, fin2
inicio
abrir (f1, l, 'nombre1')
abrir (f2, l, 'nombre2')
crear (f, 'nombre3')
abrir (f, e, 'nombre3')
fin1← falso
fin2← falso
si FDA (f1) entonces
fin1← verdad
si-no
leer_reg (f1, r1)
fin_si
si FDA (f2) entonces
fin2← verdad
si_no
leer_reg (f2, r2)
fin_si
mientras NO fin1 y NO fin2 hacer
si r1.c  r2.c entonces
escribir_reg (f, r1)
si FDA (f1) entonces
fin1← verdad
si_no
leer_reg (f1, r1)
fin_si
si_no
escribir_reg (f, r2)
si FDA (f2) entonces
fin2← verdad
si_no
leer_reg (f2,r2)
fin_si
fin_si
fin_mientras
mientras NO fin1 hacer
escribir_reg (f, r1)
si FDA (f1) entonces
fin1← verdad
si_no
leer_reg (f1, r1)
fin_si
fin_mientras
mientras NO fin2 hacer
escribir_reg (f, r2)
si FDA (f2) entonces
fin2← verdad
si_no
leer_reg (f2, r2)
fin_si
fin_mientras
cerrar (f1, f2, f)
fin
410 Fundamentos de programación
11.4. PARTICIÓN DE ARCHIVOS
La partición o división de un archivo consiste en repartir los registros de un archivo en otros dos o más archivos en
función de una determinada condición.
Aunque existen muchos métodos de producir particiones a partir de un archivo no clasificado, consideraremos
sólo los siguientes métodos:
• clasificación interna,
• por el contenido,
• selección por sustitución,
• secuencias.
Supongamos el archivo de entrada siguiente, en el que se indican las claves de los registros:
110 48 33 69 46 2 62 39 28 47 16 19 34 55
99 78 75 40 35 87 10 26 61 92 99 75 11 2
28 16 80 73 18 12 89 50 47 36 67 94 23 15
84 44 53 60 10 39 76 18 24 86
11.4.1. Clasificación interna
El método más sencillo consiste en leer M registros a la vez de un archivo no clasificado, clasificarlos utilizando un
método de clasificación interna y a continuación darles salida como partición. Obsérvese que todas las particiones
producidas de este modo, excepto posiblemente la última, contendrán exactamente M registros. La figura muestra las
particiones producidas a partir del archivo de entrada de la figura utilizada un tamaño de memoria (M) de cinco re-
gistros.
33 46 48 69 110
2 28 39 47 62
16 19 34 55 99
35 40 75 78 87
10 26 61 92 99
2 11 16 28 75
12 18 73 80 89
36 47 50 67 94
15 23 44 53 84
10 18 39 60 76
24 86
11.4.2. Partición por contenido
La partición del archivo de entrada se realiza en función del contenido de uno o más campos del registro.
Así, por ejemplo, si se supone un archivo f que se desea dividir en dos archivos f1 y f2, tal que f1 contenga
todos los registros que contengan en el campo clave c, el valor v y en el archivo f2 los restantes registros.
El algoritmo de partición se muestra a continuación:
algoritmo particionå_contenido
....
inicio
abrir (f, l,'nombre')
crear (f1, 'nombre1')
abrir (f1, e, 'nombre1')
Ordenación, búsqueda y fusión externa (archivos) 411
crear (f2, 'nombre2')
abrir ( f2, e, 'nombre2')
leer(v)
mientras NO FDA (f) hacer
leer_reg (f, r)
si v = r.c entonces
escribir_reg (f1,r)
si_no
escribir_reg (f2, r)
fin_si
fin_mientras
cerrar (f, f1, f2)
fin
11.4.3. Selección por sustitución
La clasificación interna vista en el apartado 11.4.1 no tiene en cuenta la ventaja que puede suponer cualquier orde-
nación parcial que pueda existir en el archivo de entrada. El algoritmo de selección por sustitución tiene en cuenta
tal ordenación. Los pasos a dar para obtener particiones ordenadas son:
1. Leer N registros del archivo desordenado, poniéndolos todos a no congelados.
2. Obtener el registro R con clave más pequeña de entre los no congelados y escribirlo en partición.
3. Sustituir el registro por el siguiente del archivo de entrada. Este registro se congelará si su clave es más pe-
queña que la del registro R y no se congelará en otro caso. Si hay registro sin congelar volver al paso 2.
4. Comenzar nueva partición. Si se ha llegado a fin de fichero se repite el proceso sin leer.
Nota: Al final de este método los ficheros con las particiones tienen secuencias ordenadas, lo que no quiere decir
que ambos hayan quedado completamente ordenados.
F: 3 31 14 42 10 15 8 13 63 18 50
F1 F2
3 31 14 42 3 13 50 8 18 8
10 31 14 42 10 13 50 8 18 13
15 31 14 42 14 13 50 8 18 18
15 31 8 42 15 13 50 8 18 50
13 31 8 42 31 13 50 8 18
13 63 8 42 42
13 63 8 18 63
13 50 8 18
algoritmo particion_s
const n= valor
tipo
registro: datos_personales
tipo_dato:c
...
fin_registro
registro: datos
datos_personales: dp
logico : congela
fin_registro
array[1..n] de datos: arr
archivo_s de datos_personales: arch
var
412 Fundamentos de programación
datos_personales: r
arr : a
arch : f1,f2, f
lógico : sw
entero : numcongelados, y, posicionmenor
inicio
abrir(f, l, 'nombre')
crear(f1, 'nombre1')
abrir(f1, e, 'nombre1')
crear(f2,'nombre2')
abrir(f2, e, 'nombre32')
numcongelados ← 0
desde i ← 1 hasta n hacer
si no fda(f) entonces
leer_reg(f, r)
a[i].dp ← r
a[i].congela ← falso
si_no
a[i].congela ← verdad
numcongelados ← numcongelados + 1
fin_si
fin_desde
sw ← verdad
mientras no fda(f) hacer
mientras (numcongelados  n) y no fda(f) hacer
buscar_no_congelado_menor(a, posicionmenor)
si sw entonces
escribir_reg(f1, a[posicionmenor].dp)
si_no
escribir_reg(f2, a[posicionmenor].dp)
fin_si
leer_reg(f, r)
si r.c.  a[posicionmenor].dp.c entonces
a[posicionmenor].dp ← r
si_no
a[posicionmenor].dp ← r
a[posicionmenor].congela ← verdad
numcongelados ← numcongelados + 1
fin_si
fin_mientras
sw ← no sw
descongelar(a)
numcongelados ← 0
fin_mientras
mientras numcongelados  n hacer
buscar_no_congelado_menor(a, posicionmenor)
si sw entonces
escribir_reg(f1,a[posicionmenor].dp)
si_no
escribir_reg(f2, a[posicionmenor].dp)
fin_si
a[posicionmenor].congela ← verdad
numcongelados ← numcongelados + 1
fin_mientras
cerrar(f, f1, f2)
fin
Ordenación, búsqueda y fusión externa (archivos) 413
11.4.4. Partición por secuencias
Los registros se dividen en secuencias alternativas con longitudes iguales o diferentes según los casos.
Las secuencias pueden ser de diferentes diseños:
• El archivo f se divide en dos archivos, f1 y f2, copiando alternativamente en uno y otro archivo secuencias de
registros de longitud m. (Algoritmo particion_1.)
• El archivo f se divide en dos archivos, f1 y f2, de modo que en f1 se copian los registros que ocupan las
posiciones pares y en f2 los registros que ocupan las posiciones impares. (Algoritmo particion_2.)
algoritmo particion_1
tipo
registro: datos personales
tipodato : C
..............
fin_registro
archivo_s de datos_personales : arch
var
datos_personales: r
arch : f, f1, f2
lógico : SW
entero : i, n
inicio
abrir (f, l, 'nombre')
crear (f1, 'nombre1')
abrir (f1, e, 'nombre1')
crear (f2, 'nombre2')
abrir (f2, e, 'nombre2')
i← 0
leer (n)
SW← verdad
mientras NO FDA (f) hacer
leer_reg (f,r)
si SW entonces
escribir_reg (f2, r)
si_no
escribir_reg (f2,r)
fin_si
i← i+1
si i = n entonces
SW ← NO SW
i ← 0
fin_si
fin_mientras
cerrar (f, f1, f2)
fin
algoritmo particion_2
tipo
registro: datos_personales
tipo_dato : C
...............
fin_registro
archivo_s de datos_personales : arch
var
datos_personales : r
414 Fundamentos de programación
arch : f1, f2, f
lógico : SW
inicio
abrir (f, l, 'nombre')
crear (f1, 'nombre1')
abrir (f1, e, 'nombre1')
crear (f2, 'nombre2')
abrir (f2, e, 'nombre2')
SW← verdad
mientras NO FDA (f) hacer
leer_reg (f, r)
si SW entonces
escribir_reg (f1,r)
si_no
escribir_reg (f2,r)
fin_si
SW← NO SW
fin_mientras
cerrar (f, f1, f2)
fin
11.5. CLASIFICACIÓN DE ARCHIVOS
Los archivos están clasificados en orden ascendente o descendente cuando todos sus registros están ordenados en
sentido ascendente o descendente respecto al valor de un campo determinado, denominado clave de ordenación.
Si el archivo a ordenar cabe en memoria central, se carga en un vector y se realiza una clasificación interna,
transfiriendo a continuación el archivo ordenado al soporte externo o copiando el resultado en el archivo original si
no se desea conservar.
En el caso de que el archivo no quepa en memoria central, la clasificación se realizará sobre el archivo almace-
nado en un soporte externo. El inconveniente de este tipo de clasificación reside en el tiempo, que será mucho mayor
debido especialmente a las operaciones entrada/salida de información que requiere la clasificación externa.
Los algoritmos de clasificación son muy variados, pero muchos de ellos se basan en procedimientos mixtos con-
sistentes en aprovechar al máximo la capacidad de la memoria central.
Como métodos de clasificación de archivos que no utilizan la memoria central y son aplicables a archivos secuen-
ciales, se tienen la mezcla directa y la mezcla natural.
11.5.1. Clasificación por mezcla directa
El método más fácil de comprender es el denominado mezcla directa. Se analiza su aplicación a través de un breve
ejemplo en el que se aplicará el método sobre un vector. Se puede pensar en los componentes del vector como las
claves de los registros sucesivos del archivo.
El procedimiento consiste en una partición sucesiva del archivo y una fusión que produce secuencias ordenadas.
La primera partición se hace para secuencias de longitud 1 utilizando dos archivos auxiliares y la fusión produci-
rá secuencias ordenadas de longitud 2. A cada nueva partición y fusión se duplicará la longitud de las secuencias
ordenadas. El método terminará cuando la longitud de la secuencia ordenada exceda la longitud del archivo a or-
denar.
Consideremos el archivo:
F: 19 27 2 8 36 5 20 15 6
El archivo F se divide en dos nuevos archivos F1 y F2:
F1: 19 2 36 20 6
F2: 27 8 5 15
Ordenación, búsqueda y fusión externa (archivos) 415
Ahora se funden los archivos F1 y F2, formando pares ordenados:
F: 19 27 2 8 5 36 15 20 6
Se vuelve a dividir de nuevo en partes iguales y en secuencias de longitud 2
F1: 19 27 5 36 6
F2: 2 8 15 20
La fusión de los archivos producirá
F: 2 8 19 27 5 15 20 36 6
La nueva partición será
F1: 2 8 19 27 6
F2: 5 15 20 36
La nueva fusión será
F: 2 5 8 15 19 20 27 36 6
Cada operación que trata por completo el conjunto de datos en su totalidad se denomina una fase y el proceso de
ordenación se denomina pasada.
F1: 2 5 8 15 19 20 27 36
F2: 6
F: 2 5 6 8 15 19 20 27 36
Evidentemente, la clave de la clasificación es disminuir el número de pasadas e incrementar su tamaño; una se-
cuencia ordenada es una que contiene sólo una pasada que, a su vez, contiene todos los elementos de la pasada.
EJEMPLO 11.2
Para la implementación de los siguientes algoritmos no se consideró la existencia de un registro especial que indi-
cara el fin de archivo. La función FDA(id_arch) retorna cierto cuando se accede al último registro.
Si se considerase la existencia del registro especial que marca el fin de archivo se podría prescindir del uso de
las variables lógicas fin, fin1, fin2.
algoritmo ord_mezcla_directa
...
procedimiento ordmezcladirecta
var
datos_personales: r,r1,r2
arch : f,f1,f2
// El tipo arch es archivo_s de datos_personales
entero : lgtud, long
lógico : sw,fin1,fin2
entero : i,j
inicio
// calcularlongitud(f) es una función definida por el usuario que
// devuelve el número de registros del archivo original
416 Fundamentos de programación
long ← calcularlogitud(f)
lgtud ← 1
mientras lgtud  long hacer
abrir(f,l,'fd')
crear(f1,'f1d')
crear(f2,'f2d')
abrir(f1,e,'f1d')
abrir(f2,e,'f2d')
i ← 0
sw ← verdad
mientras no FDA(f) hacer
leer_reg(f,r)
si sw entonces
escribir_reg(f1,r)
si_no
escribir_reg(f2,r)
fin_si
i ← i + 1
si i=lgtud entonces
sw ← no sw
i ← 0
fin_si
fin_mientras
cerrar(f,f1,f2)
abrir(f1,l,'f1d')
abrir(f2,l,'f2d')
crear(f,'fd')
abrir (f,e,'fd')
i ← 0
j ← 0
fin1 ← falso
fin2 ← falso
si FDA(f1) entonces
fin1 ← verdad
si_no
leer_reg(f1,r1)
fin_si
si FDA(f2) entonces
fin2 ← verdad
si_no
leer_reg(f2,r2)
fin_si
mientras no fin1 o no fin2 hacer
mientras no fin1 y no fin2 y (ilgtud) y (jlgtud) hacer
si menor(r1,r2) entonces
escribir_reg(f,r1)
si FDA(f1) entonces
fin1 ← verdad
si_no
leer_reg(f1,r1)
fin_si
i ← i + 1
si_no
escribir_reg(f,r2)
si FDA(f2) entonces
fin2 ← verdad
Ordenación, búsqueda y fusión externa (archivos) 417
si_no
leer_reg(f2,r2)
fin_si
j ← j + 1
fin_si
fin_mientras
mientras no fin1 y (i  lgtud) hacer
escribir_reg(f,r1)
si FDA(f1) entonces
fin1 ← verdad
si_no
leer_reg(f1,r1)
fin_si
i ← i + 1
fin_mientras
mientras no fin2 y (j  lgtud) hacer
escribir_reg(f,r2)
si FDA(f2) entonces
fin2 ← verdad
si_no
leer_reg(f2,r2)
fin_si
j ← j + 1
fin_mientras
i ← 0
j ← 0
fin_mientras // del mientras no fin1 o no fin2
cerrar(f,f1,f2)
lgtud ← lgtud*2
fin_mientras // del mientras lgtud  long
borrar('f1d')
borrar('f2d')
fin_procedimiento
11.5.2. Clasificación por mezcla natural
Es uno de los mejores métodos de ordenación de ficheros secuenciales. Consiste en aprovechar la posible ordenación
interna de las secuencias del archivo (F), obteniendo con ellas particiones ordenadas de longitud variable sobre una
serie de archivos auxiliares, en este caso dos, F1 y F2. A partir de estos ficheros auxiliares se escribe un nuevo F
mezclando los segmentos crecientes máximos de cada uno de ellos.
EJEMPLO 11.3
Clasificar el vector
F: 19 27 2 8 36 5 20 15 6
Se divide F en dos vectores F1 y F2, donde se ponen alternativamente los elementos F1 y F2. F está ahora vacío.
Etapa 1, fase 1:
F1: 19 27/ 5 20/ 6
F2: 2 8 36/ 15
Se selecciona el elemento más pequeño de F1 y F2, que pasan a estar en F3.
418 Fundamentos de programación
Etapa 1, fase 2:
F1: 19 27/ 5 20/ 6
F2: 8 36/ 15
F3: 2
Ahora se comparan 8 y 19, se selecciona 8. De modo similar, 19 y 27:
F1: 5 20/ 6
F2: 36/ 15
F3: 2 8 19 27
En F1 se ha interrumpido la secuencia creciente y se continúa con F2 hasta que también en él se termine la se-
cuencia creciente.
F1: 5 20/ 6
F2: 15
F3: 2 8 19 27 36
Ahora 5 y 15 son menores que 36. Finalmente se tendrá
F3: 2 8 19 27 36/ 5 15 20/ 6
F1 y F2 están ahora vacíos.
Etapa 2, fase 1:
Dividir F3 en dos
F1: 2 8 19 27 36/ 6
F2: 5 15 20
Etapa 2, fase 2:
Se mezclan F1 y F2
F3: 2 5 8 15 19 20 27 36 6
Etapa 3, fase 1:
F1: 2 5 8 15 19 20 27 36
F2: 6
Etapa 3, fase 2:
F3: 2 5 6 8 15 19 20 27 36
y el archivo F3 ya está ordenado.
Algoritmo
algoritmo ord_mezcla_natural
...
procedimiento ordmezclanatural
var
datos_personales: r,r1,r2,ant,ant1,ant2
arch : f,f1,f2
//El tipo arch es archivo_s de datos_personales
Ordenación, búsqueda y fusión externa (archivos) 419
lógico : ordenado,crece,fin,fin1,fin2
entero : numsec
inicio
ordenado ← falso
mientras no ordenado hacer
// Partir
abrir(f,l,'fd')
crear(f1,'f1d')
crear(f2,'f2d');
abrir(f1,e,'f1d')
abrir(f2,e,'f2d')
fin ← falso
si FDA(f) entonces
fin ← verdad
si_no
leer_reg(f,r)
fin_si
mientras no fin hacer
ant ← r
crece ← verdad
mientras crece y no fin hacer
si menorigual(ant,r) entonces
escribir_reg(f1,r)
ant ← r
si FDA(f) entonces
fin ← verdad
si_no
leer_reg(f,r)
fin_si
si_no
crece ← falso
fin_si
fin mientras
ant ← r
crece ← verdad
mientras crece y no fin hacer
si menorigual(ant,r) entonces
escribir_reg(f2,r)
ant ← r
si FDA(f) entonces
fin ← verdad
si_no
leer_reg(f,r)
fin_si
si_no
crece ← falso
fin_si
fin_mientras
fin_mientras
cerrar(f,f1,f2)
//Mezclar
abrir(f1,l,'f1d')
abrir(f2,l.'f2d')
crear(f,'fd')
abrir(f,e,'fd')
fin1 ← falso
420 Fundamentos de programación
fin2 ← falso
si FDA(f1) entonces
fin1 ← verdad
si_no
leer_reg(f1,r1)
fin_si
si FDA(f2) entonces
fin2 ← verdad
si_no
leer_reg(f2,r2)
fin_si
numsec ← 0
mientras NO fin1 y NO fin2 hacer
ant1 ← r1
ant2 ← r2
crece ← verdad
mientras NO fin1 y NO fin2 y crece hacer
si menorigual(ant1,r1) y menorigual(ant2,r2) entonces
si menorigual(r1,r2) entonces
escribir_reg(f,r1)
ant1 ← r1
si FDA(f1) entonces
fin1 ← verdad
si_no
leer_reg(f1,r1)
fin_si
si_no
escribir_reg(f,r2)
ant2 ← r2
si FDA(f2) entonces
fin2 ← verdad
si_no
leer_reg(f2,r2)
fin_si
fin_si
si_no
crece ← falso
fin_si
fin_mientras
mientras NO fin1 y menorigual(ant1,r1) hacer
escribir_reg(f,r1)
ant1 ← r1
si FDA(f1) entonces
fin1 ← verdad
si_no
leer_reg(f1,r1)
fin_si
fin_mientras
mientras NO fin2 y menorigual(ant2,r2) hacer
escribir_reg(f,r2)
ant2 ← r2
si FDA(f2) entonces
fin2 ← verdad
si_no
leer_reg(f2,r2)
fin_si
Ordenación, búsqueda y fusión externa (archivos) 421
fin_mientras
numsec ← numsec + 1
fin_mientras // del mientras no fin1 y no fin2
si NO fin1 entonces
numsec ← numsec+1
mientras NO fin1 hacer
escribir_reg(f,r1)
si FDA(f1) entonces
fin1 ← verdad
si_no
leer_reg(f1,r1)
fin_si
fin_mientras
fin_si
si no fin2 entonces
numsec ← numsec+1
mientras no fin2 hacer
escribir_reg(f,r2)
si FDA(f2) entonces
fin2 ← verdad
si_no
leer_reg(f2,r2)
fin_si
fin_mientras
fin_si
cerrar(f,f1,f2)
si numsec = 1 entonces
ordenado ← verdad
fin_si
fin_mientras // del mientras no ordenado
borrar('f1d')
borrar('f2d')
fin_procedimiento
11.5.3. Clasificación por mezcla de secuencias equilibradas
Este método utiliza la memoria de la computadora para realizar clasificaciones internas y cuatro archivos secuencia-
les temporales para trabajar.
Supóngase un archivo de entrada F que se desea ordenar por orden creciente de las claves de sus elementos. Se
dispone de cuatro archivos secuenciales de trabajo, F1, F2, F3 y F4, y que se pueden colocar m elementos en me-
moria central en un momento dado en una tabla T de m elementos. El proceso es el siguiente:
1. Lectura de archivo de entrada por bloques de n elementos.
2. Ordenación de cada uno de estos bloques y escritura alternativa sobre F1 y F2.
3. Fusión de F1 y F2 en bloques de 2n elementos que se escriben alternativamente sobre F3 y F4.
4. Fusión de F3 y F4 y escritura alternativa en F1 y F2, de bloques con 4n elementos ordenados.
5. El proceso consiste en doblar cada vez el tamaño de los bloques y utilizando las parejas (F1, F2) y (F3, F4).
Fichero de entrada
46 66 4 12 7 5 34 32 68 8 99 16 13 14 12 10
F1 4 12 46 66 8 16 68 99
F2 [5 7 32 34] [10 12 13 14]
F3 vacio
F4 vacio
422 Fundamentos de programación
Fusión por bloques
F1 vacío
F2 vacío
F3 4 5 7 12 32 34 46 66 /F4 8 10 12 13 14 16 68 99
La mezcla o fusión final es
F1 4 5 7 8 10 12 12 13 14 16 32 34 46 66 68 99
F2 vacío
F3 vacío
F4 vacío
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
11.1. Realizar el algoritmo de partición de un archivo F en dos particiones F1 y F2, según el contenido de un campo
clave C. El contenido debe tener el valor v.
algoritmo Partición_contenido
...
inicio
abrir(f, l, 'f0') //lectura
crear (f1, 'f1')
crear (f2, 'f2')
abrir (f1, e, 'f1') //escritura
abrir (f2, e, 'f2') //escritura
mientras no fda(f) hacer
leer_reg(f, r)
si r.c = v entonces
escribir_reg(f1, r)
si_no
escribir_reg(f2, r)
fin_si
fin_mientras
cerrar( f1, f2, f)
fin
11.2. Realizar el algoritmo de partición por secuencias alternativas de longitud n.
• Entrada: Archivo F
• Salida: Archivos F1, F2
• Secuencia: longitud n (n registros en cada secuencia)
• Cada n registros se almacenan alternativamente en F1 y F2.
algoritmo Partir_alternativa
tipo
registro: reg
...
fin_registro
archivo_s de reg : arch
var
logico: sw
entero: i //contador de elementos de la secuencia
arch: f, f1, f2
reg: r
inicio
abrir(f, l, 'f0') //lectura
crear (f1, 'f1')
Ordenación, búsqueda y fusión externa (archivos) 423
crear (f2, 'f2')
abrir (f1, e, 'f1') //escritura
abrir (f2, e, 'f2') //escritura
sw ← falso
i ← 0
mientras no fda(f) hacer
leer_reg(f, r)
si NO sw entonces
escribir_reg(f1, r)
si_no
escribir_reg(f2, r)
fin_si
i ← i+1
si i= n entonces
sw ← verdadero
i ← 0 //se inicializa el contador de la secuencia
fin_si
fin_mientras
cerrar(f, f1, f2)
fin
11.3. Aplicar el algoritmo de mezcla directa al archivo F de claves.
F: 9 7 2 8 16 15 2 10
1. Primera división (partición en secuencias de longitud 1)
F1: 9 2 16 2
F2: 7 8 15 10
2. Mezcla de F1 y F2, formando pares ordenados
F: 7 9 || 2 8 || 15 16 || 2 10
3. Segunda división (partición en secuencias de longitud 2)
F1: 7 9 || 15 16
F2: 2 8 || 2 10
4. Mezcla de F1 y F2
F: 2 7 8 9 || 2 10 15 16
5. Tercera división (partición en secuencias de longitud 4)
F1: 2 7 8 9
F2: 2 10 15 16
6. Mezcla de F1 y F2 (última)
F: 2 2 7 8 9 10 15 16
11.4. Escribir el procedimiento de mezcla de dos archivos ordenados en secuencias de una determinada longitud.
procedimiento fusion (E cadena: nombre1, nombre2, nombre3; E entero: lgtud)
var
arch : f1, f2, f
//el tipo arch se supone definido en el programa principal
reg: r1, r2
// el tipo reg se supone definido en el programa principal
entero : i, j
lógico : fin1, fin2
inicio
{los nombres de los archivos en el dispositivo de almacenamiento se
424 Fundamentos de programación
pasan al procedimiento de fusión a través de las variables nombre1,
nombre2 y nombre3 }
abrir(f1,l, nombre1)
abrir(f2,l, nombre2)
crear(f, nombre3)
abrir (f, e, nombre3)
leerRegYFin(f1, r1, fin1)
{ leerRegYFin es un procedimiento, desarrollado más adelante, que
lee un registro y detecta la marca de fin de archivo}
leerRegYFin(f2, r2, fin2)
mientras no fin1 o no fin2 hacer
i ← 0
j ← 0
mientras no fin1 y no fin2 y (ilgtud) y (jlgtud) hacer
//lgtud es la longitud de la secuencia recibida como parámetro
si menor(r1,r2) entonces
escribir_reg(f,r1)
leerRegYFin(f1, r1, fin1)
i ← i+1
si_no
escribir_reg(f,r2)
leerRegYFin(f2, r2, fin2)
j ← j+1
fin_si
fin_mientras
mientras no fin1 y (i  lgtud) hacer
escribir_reg(f,r1)
leerRegYFin(f1, r1, fin1)
i ← i+1
fin_mientras
mientras no fin2 y (j  lgtud) hacer
escribir_reg(f,r2)
leerRegYFin(f2, r2, fin2)
j ← j+1
fin_mientras
fin_mientras // del mientras no fin1 o no fin2
cerrar(f,f1,f2)
fin_procedimiento
procedimiento leerRegYFin(E/S arch: f; E/S reg: r; E/S lógico: fin)
inicio
si fda(f) entonces
fin ← verdad
si_no
leer_reg(f, r)
fin_si
fin_procedimiento
11.5. Escribir el procedimiento de ordenación por mezcla directa de un archivo con long registros, utilizando el proce-
dimiento fusión del ejercicio anterior.
procedimiento ordenarDirecta(E cadena: nombref, nombref1, nombref2;
E entero: long)
var
entero: lgtud
inicio
lgtud ← 1
mientras lgtud = long hacer
partirAlternativoEnSec (nombref, nombref1, nombref2, lgtud)
fusion(nombref1, nombref2, nombref, lgtud)
lgtud ← lgtud * 2
Ordenación, búsqueda y fusión externa (archivos) 425
fin_mientras
borrar(nombref1)
borrar(nombref2)
fin_procedimiento
procedimiento partirAlternativoEnSec (E cadena: nombref, nombref1,
nombref2; E entero: lgtud)
var
lógico: sw
entero: i // contador de elementos de la secuencia
arch : f1, f2, f // tipo definido en el programa principal
reg: r // tipo definido en el programa principal
inicio
abrir(f, l, nombref) //lectura
crear (f1, nombref1)
crear (f2, nombref2)
abrir (f1, e, nombref1) //escritura
abrir (f2, e, nombref2) //escritura
sw ← falso
i ← 0
mientras no fda(f) hacer
leer_reg(f, r)
si NO sw entonces
escribir_reg(f1, r)
si_no
escribir_reg(f2, r)
fin_si
i ← i+1
si i= lgtud entonces
sw ← verdadero
i ← 0 //se inicializa el contador de la secuencia
fin_si
fin_mientras
cerrar(f, f1, f2)
fin
11.6. Escribir el procedimiento de ordenación por mezcla natural de un archivo, utilizando los procedimientos auxiliares
partir y mezclar que se suponen implementados. El procedimiento partir aprovecha las secuencias ordenadas
que pudieran existir en el archivo original y las coloca alternativamente sobre dos archivos auxiliares. El procedi-
miento mezclar construye a partir de dos ficheros auxiliares un nuevo fichero, mezclando las secuencias crecientes
que encuentra en los ficheros auxiliares para construir sobre el destino secuencias crecientes de longitud mayor.
procedimiento ordenarNatural(E cadena: nombref, nombref1, nombref2)
var
entero: numsec
lógico: ordenado
inicio
ordenado ← falso
mientras NO ordenado hacer
partir (nombref, nombref1, nombref2)
numsec ← 0
mezclar(nombref1, nombref2, nombref, numsec)
si numsec =1 entonces
ordenado ← verdad
fin_si
fin_mientras
borrar(nombref1)
borrar(nombref2)
fin_procedimiento
426 Fundamentos de programación
CONCEPTOS CLAVE
• Mezcla.
• Mezcla directa.
• Mezcla natural.
• Ordenación externa.
• Partición.
RESUMEN
La ordenación externa se emplea cuando la masa de datos
a procesar es grande y no cabe en la memoria central de la
computadora. Si el archivo es directo, aunque los registros
se encuentran colocados en él de forma secuencial, servirá
cualquiera de los métodos de clasificación vistos como mé-
todos de ordenación interna, con ligeras modificaciones
debido a las operaciones de lectura y escritura de registros
en el disco. Si el archivo es secuencial, es necesario em-
plear otros métodos basados en procesos de partición y
medida.
1. La partición es el proceso por el cual los registros
de un archivo se reparten en otros dos o más archi-
vos en función de una condición.
2. La fusión o mezcla consiste en reunir en un archi-
vo los registros de dos o más. Habitualmente los
registros de los archivos originales se encuentran
ordenados por un campo clave, y la mezcla ha de
efectuarse de tal forma que se obtenga un archivo
ordenado por dicho campo clave.
3. Los archivos están clasificados en orden ascen-
dente o descendente cuando todos sus registros
están ordenados en sentido ascendente o descen-
dente respecto al valor de un campo determinado,
denominado clave de ordenación. Los algoritmos
de clasificación son muy variados: (1) si el archi-
vo a ordenar cabe en memoria central, se carga
en un vector y se realiza una clasificación interna,
transfiriendo a continuación el archivo ordenado
al soporte externo; (2) si el archivo a ordenar
no cabe en memoria central y es secuencial son
aplicables la mezcla directa y la mezcla natural;
(3) si no es secuencial pueden aplicarse métodos
similares a los vistos en la clasificación interna
con ligeras modificaciones; (4) otros métodos se
basan en procedimientos mixtos consistentes en
aprovechar al máximo la capacidad de la memoria
central.
4. La clasificación por mezcla directa consiste en
una partición sucesiva del archivo y una fusión
que produce secuencias ordenadas. La primera
partición se hace para secuencias de longitud 1
y la fusión producirá secuencias ordenadas de
longitud 2. A cada nueva partición y fusión se
duplicará la longitud de las secuencias ordenadas.
El método terminará cuando la longitud de la se-
cuencia ordenada exceda la longitud del archivo
a ordenar.
5. La clasificación por mezcla natural consiste en
aprovechar la posible ordenación interna de las
secuencias del archivo original (F), obteniendo
con ellas particiones ordenadas de longitud va-
riable sobre los ficheros auxiliares. A partir de
estos ficheros auxiliares escribiremos un nuevo F
mezclando los segmentos crecientes de cada uno
de ellos.
6. La búsqueda es el proceso de localizar un registro
en un archivo con un determinado valor en uno de
sus campos. Los archivos de tipo secuencial obli-
gan a efectuar búsquedas secuenciales, mientras
que los archivos directos son estructuras de acceso
aleatorio y permiten otros tipos de búsquedas.
7. La búsqueda binaria podría aplicarse a archivos
directos con los registros colocados uno a conti-
nuación de otro y ordenados por el campo por el
que se desea efectuar la búsqueda.
Ordenación, búsqueda y fusión externa (archivos) 427
EJERCICIOS
11.1. Se desea intercalar los registros del archivo P con los
registros del archivo Q y grabarlos en otro archivo R.
NOTA: Los archivos P y Q están clasificados en or-
den ascendente por una determinada clave y se desea
que el archivo R quede también ordenado en modo
ascendente.
11.2. Los archivos M, N y P contienen todas las operaciones
de ventas de una empresa en los años 1985, 1986 y
1987 respectivamente. Se desea un algoritmo que
intercale los registros de los tres archivos en un solo
archivo Z, teniendo en cuenta que los tres archivos
están clasificados en orden ascendente por el campo
clave ventas.
11.3. Se dispone de dos archivos secuenciales F1 y F2 que
contienen cada uno de ellos los mismos campos. Los
dos archivos están ordenados de modo ascendente
por el campo clave (alfanumérico) y existen registros
comunes a ambos archivos. Se desea diseñar un pro-
grama que obtenga: a) un archivo C a partir de F1 y
F2, que contenga todos los registros comunes, pero
sólo una vez; b) un archivo que contenga todos los
registros que no son comunes a F1 y F2.
11.4. Se desea intercalar los registros del archivo A con los
registros del archivo B y grabarlos en un tercer ar-
chivo C. Los archivos A y B están clasificados en
orden ascendente por su campo clave. Y se desea
también que el archivo C quede clasificado en orden
ascendente.
11.5. El archivo A contiene los números de socios del Club
Deportivo Esmeralda y el archivo B los códigos de
los socios del Club Deportivo Diamante. Se desea
crear un archivo C que contenga los números de los
socios que pertenecen a ambos clubes. Asimismo, se
desea saber cuántos registros se han leído y cuántos
se han grabado.
11.6. Los archivos F1, F2 y F3 contienen todas las opera-
ciones de ventas de una compañía informática en los
años 1985, 1986 y 1987 respectivamente. Se desea un
programa que intercale todos los registros de los tres
archivos en un solo archivo F, suponiendo que todo
registro posee un campo clave y que F1, F2 y F3 están
clasificados en orden ascendente de ese campo clave.
11.7. Se desea actualizar un archivo maestro de la nómina
de la compañía Aguas del Pacífico con un archivo
MODIFICACIONES que contiene todas las incidencias
de empleados (altas, bajas, modificaciones). Ambos
archivos están clasificados en orden ascendente del
código de empleado (campo clave). El nuevo archivo
maestro actualizado debe conservar la clasificación
ascendente por código de empleado y sólo debe exis-
tir un registro por empleado.
11.8. Se tiene un archivo maestro de inventarios con los
siguientes campos:
CODIGO DE ARTICULO DESCRIPCION
EXISTENCIAS
Se desea actualizar el archivo maestro con los movi-
mientos habidos durante el mes (altas/bajas). Para
ello se incluyen los movimientos en un archivo OPE-
RACIONES que contiene los siguientes campos:
CODIGO DE ARTICULO CANTIDAD
OPERACION (1-Alta, 2-Baja)
Los dos archivos están clasificados por el mismo
campo clave.
Fundamentos_de_programacion_Algoritmos_e.pdf
CAPÍTULO 12
Estructuras dinámicas
lineales de datos
(pilas, colas y listas enlazadas)
12.1. Introducción a las estructuras de datos
12.2. Listas
12.3. Listas enlazadas
12.4. Procesamiento de listas enlazadas
12.5. Listas circulares
12.6. Listas doblemente enlazadas
12.7. Pilas
12.8. Colas
12.9. Doble cola
ACTIVIDADES DE PROGRAMACIÓN RESUELTAS
CONCEPTOS CLAVE
RESUMEN
EJERCICIOS
Los datos estudiados hasta ahora se denominan está-
ticos. Ello es debido a que las variables son direcciones
simbólicas de posiciones de memoria; esta relación
entre nombres de variables y posiciones de memoria
es una relación estática que se establece por la decla-
ración de las variables de una unidad de programa y
que se establece durante la ejecución de esa unidad.
Aunque el contenido de una posición de memoria
asociada con una variable puede cambiar durante la
ejecución, es decir, el valor de la variable puede cam-
biar, las variables por sí mismas no se pueden crear ni
destruir durante la ejecución. En consecuencia, las va-
riables consideradas hasta este punto se denominan
variables estáticas.
En algunas ocasiones, sin embargo, no se conoce
por adelantado cuánta memoria se requerirá para un
programa. En esos casos es conveniente disponer de
un método para adquirir posiciones adicionales de
memoria a medida que se necesiten durante la ejecu-
ción del programa y liberarlas cuando no se necesitan.
Las variables que se crean y están disponibles durante
la ejecución de un programa se llaman variables diná-
micas. Estas variables se representan con un tipo de
datos conocido como puntero. Las variables dinámicas
se utilizan para crear estructuras dinámicas de datos
que se pueden ampliar y comprimir a medida que se
requieran durante la ejecución del programa. Una es-
tructura de datos dinámica es una colección de ele-
mentos denominados nodos de la estructura —nor-
malmente de tipo registro— que son enlazados juntos.
Las estructuras dinámicas de datos se clasifican en
lineales y no lineales. El estudio de las estructuras li-
neales, listas, pilas y colas, es el objetivo de este capí-
tulo.
INTRODUCCIÓN
430 Fundamentos de programación
12.1. INTRODUCCIÓN A LAS ESTRUCTURAS DE DATOS
En capítulos anteriores se ha introducido a las estructuras de datos, definiendo tipos y estructuras de datos primitivos,
tales como enteros, real y carácter, utilizados para construir tipos más complicados como arrays y registros, deno-
minados estructuras de datos compuestos. Tienen una estructura porque sus datos están relacionados entre sí. Las
estructuras compuestas, tales como arrays y registros, están soportadas en la mayoría de los lenguajes de programa-
ción, debido a que son necesarias en casi todas las aplicaciones.
La potencia y flexibilidad de un lenguaje está directamente relacionada con las estructuras de datos que posee.
La programación de algoritmos complicados puede resultar muy difícil en un lenguaje con estructuras de datos limi-
tados, caso de FORTRAN y COBOL. En ese caso es conveniente pensar en la implementación con lenguajes que
soporten punteros como C y C++ o bien que no soporten pero tengan recolección de basura como Java o C#, o bien
recurrir, al menos en el período de formación, al clásico Pascal.
Cuando una aplicación particular requiere una estructura de datos no soportada por el lenguaje, se hace necesaria
una labor de programación para representarla. Se dice que necesitamos implementar la estructura de datos. Esto na-
turalmente significa más trabajo para el programador. Si la programación no se hace bien, se puede malgastar tiem-
po de programación y —naturalmente— de computadora. Por ejemplo, supongamos que tenemos un lenguaje como
Pascal que permite arrays de una dimensión de números enteros y reales, pero no arrays multidimensionales. Para
implementar una tabla con cinco filas y diez columnas podemos utilizar
type
array[0..10] of real: FILA;
var
FILA: FILA1, FILA2, FILA3, FILA4, FILA5;
La llamada al elemento de la tercera fila y sexta columna se realizará con la instrucción
FILA3 [6]
Un método muy eficaz es diseñar procedimientos y funciones que ejecuten las operaciones realizadas por las
estructuras de datos. Sin embargo, con las estructuras vistas hasta ahora arrays y registros tienen dos inconvenientes:
1) la reorganización de una lista, si ésta implica movimiento de muchos elementos de datos, puede ser muy costosa,
y 2) son estructuras de datos estáticas.
Una estructura de datos se dice que es estática cuando el tamaño ocupado en memoria es fijo, es decir, siempre
ocupa la misma cantidad de espacio en memoria. Por consiguiente, si se representa una lista como vector, se debe
anticipar (declarar o dimensionar) la longitud de esa lista cuando se escribe un programa; es imposible ampliar el
espacio de memoria disponible (algunos lenguajes permiten dimensionar dinámicamente el tamaño de un array du-
rante la ejecución del programa, como es el caso de Visual BASIC). En consecuencia, puede resultar difícil repre-
sentar diferentes estructuras de datos.
Los arrays unidimensionales son estructuras estáticas lineales ordenadas secuencialmente. Las estructuras se con-
vierten en dinámicas cuando los elementos pueden ser insertados o suprimidos directamente sin necesidad de algo-
ritmos complejos. Se distinguen las estructuras dinámicas de las estáticas por los modos en que se realizan las inser-
ciones y borrados de elementos.
12.1.1. Estructuras dinámicas de datos
Las estructuras dinámicas de datos son estructuras que «crecen a medida que se ejecuta un programa». Una estruc-
tura dinámica de datos es una colección de elementos —llamados nodos— que son normalmente registros. Al con-
trario que un array, que contiene espacio para almacenar un número fijo de elementos, una estructura dinámica de
datos se amplía y contrae durante la ejecución del programa, basada en los registros de almacenamiento de datos del
programa.
Las estructuras dinámicas de datos se pueden dividir en dos grandes grupos:
lineales
{ pilas
colas
listas enlazadas
Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas) 431
no lineales
{ árboles
grafos
Las estructuras dinámicas de datos se utilizan para almacenamiento de datos del mundo real que están cam-
biando constantemente. Un ejemplo típico ya lo hemos visto como estructura estática de datos: la lista de pasaje-
ros de una línea aérea. Si esta lista se mantuviera en orden alfabético en un array, sería necesario hacer espacio
para insertar un nuevo pasajero por orden alfabético. Esto requiere utilizar un bucle para copiar los datos del re-
gistro de cada pasajero en el siguiente elemento del array. Si en su lugar se utilizara una estructura dinámica de
datos, los nuevos datos del pasajero se pueden insertar simplemente entre dos registros existentes sin un mínimo
esfuerzo.
Las estructuras dinámicas de datos son extremadamente flexibles. Como se ha descrito anteriormente, es relati-
vamente fácil añadir nueva información creando un nuevo nodo e insertándolo entre nodos existentes. Se verá que es
también relativamente fácil modificar estructuras dinámicas de datos, eliminando o borrando un nodo existente.
En este capítulo examinaremos las tres estructuras dinámicas lineales de datos: listas, colas y pilas, dejando para
el próximo capítulo las estructuras no lineales de datos: árboles y grafos.
Una estructura estática de datos es aquella cuya estructura se especifica en el momento en que se escribe el
programa y no puede ser modificada por el programa. Los valores de sus diferentes elementos pueden variar,
pero no su estructura, ya que ésta es fija.
Una estructura dinámica de datos puede modificar su estructura mediante el programa. Puede ampliar o limitar
su tamaño mientras se ejecuta el programa.
12.2. LISTAS
Una lista lineal es un conjunto de elementos de un tipo dado que pueden variar en número y donde cada elemento
tiene un único predecesor y un único sucesor o siguiente, excepto el primero y último de la lista. Esta es una defini-
ción muy general que incluye los ficheros y vectores.
Los elementos de una lista lineal se almacenan normalmente contiguos —un elemento detrás de otro— en posi-
ciones consecutivas de la memoria. Las sucesivas entradas en una guía o directorio telefónico, por ejemplo, están en
líneas sucesivas, excepto en las partes superior e inferior de cada columna. Una lista lineal se almacena en la me-
moria principal de una computadora en posiciones sucesivas de memoria; cuando se almacenan en cinta magnética,
los elementos sucesivos se presentan en sucesión en la cinta. Esta asignación de memoria se denomina almacena-
miento secuencial. Posteriormente se verá que existe otro tipo de almacenamiento denominado encadenado o enla-
zado.
Las líneas así definidas se denominan contiguas. Las operaciones que se pueden realizar con listas lineales con-
tiguas son:
1. Insertar, eliminar o localizar un elemento.
2. Determinar el tamaño —número de elementos— de la lista.
3. Recorrer la lista para localizar un determinado elemento.
4. Clasificar los elementos de la lista en orden ascendente o descendente.
5. Unir dos o más listas en una sola.
6. Dividir una lista en varias sublistas.
7. Copiar la lista.
8. Borrar la lista.
Una lista lineal contigua se almacena en la memoria de la computadora en posiciones sucesivas o adyacentes y
se procesa como un array unidimensional. En este caso, el acceso a cualquier elemento de la lista y la adición de
nuevos elementos es fácil; sin embargo, la inserción o borrado requiere un desplazamiento de lugar de los elementos
que le siguen y, en consecuencia, el diseño de un algoritmo específico.
Para permitir operaciones con listas como arrays se deben dimensionar éstos con tamaño suficiente para que
contengan todos los posibles elementos de la lista.
432 Fundamentos de programación
EJEMPLO 12.1
Se desea leer el elemento j-ésimo de una lista P.
El algoritmo requiere conocer el número de elementos de la lista (su longitud, L). Los pasos a dar son:
1. conocer longitud de la lista L.
2. si L = 0 visualizar «error lista vacía».
si_no comprobar si el elemento j-ésimo está dentro del rango permitido de elementos 1 = j = L; en este
caso, asignar el valor del elemento P(j) a una variable B; si el elemento j-ésimo no está dentro del rango,
visualizar un mensaje de error «elemento solicitado no existe en la lista».
3. fin.
El pseudocódigo correspondiente sería:
procedimiento acceso(E lista: P; S elementolista: B; E entero: L, J)
inicio
si L = 0 entonces
escribir('Lista vacia')
si_no
si (j = 1) y (j = L) entonces
B ← P[j]
si_no
escribir('ERROR: elemento no existente')
fin_si
fin_si
fin
EJEMPLO 12.2
Borrar un elemento j de la lista P.
Variables
L longitud de la lista
J posición del elemento a borrar
I subíndice del array P
P lista
Las operaciones necesarias son:
1. Comprobar si la lista es vacía.
2. Comprobar si el valor de J está en el rango I de la lista 1 = J = L.
3. En caso de J correcto, mover los elementos J+1, J+2, ..., a las posiciones J, J+1, ..., respectivamente,
con lo que se habrá borrado el antiguo elemento J.
4. Decrementar en uno el valor de la variable L, ya que la lista contendrá ahora L – 1 elementos.
El algoritmo correspondiente será:
inicio
si L = 0 entonces
escribir('lista vacia')
si_no
leer(J)
si (J = 1) y (J = L) entonces
desde I ← J hasta L-1 hacer
P[I] ← P[I+1]
fin_desde
Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas) 433
L ← L-1
si_no
escribir('Elemento no existe')
fin_si
fin_si
fin
Una lista contigua es aquella cuyos elementos son adyacentes en la memoria o soporte direccionable. Tiene unos
límites izquierdo y derecho o inferior/superior que no pueden ser rebajados cuando se le añade un elemento.
La inserción o eliminación de un elemento, excepto en la cabecera o final de la lista, necesita una traslación
de una parte de los elementos de la misma: la que precede o sigue a la posición del elemento modificado.
Las operaciones directas de añadir y eliminar se efectúan únicamente en los extremos de la lista. Esta limi-
tación es una de las razones por las que esta estructura es poco utilizada.
Las listas enlazadas o de almacenamiento enlazado o encadenado son mucho más flexibles y potentes, y su uso
es mucho más amplio que las listas contiguas.
12.3. LISTAS ENLAZADAS1
Los inconvenientes de las listas contiguas se eliminan con las listas enlazadas. Se pueden almacenar los elementos
de una lista lineal en posiciones de memoria que no sean contiguas o adyacentes.
Una lista enlazada o encadenada es un conjunto de elementos en los que cada elemento contiene la posición
—o dirección— del siguiente elemento de la lista. Cada elemento de la lista enlazada debe tener al menos dos cam-
pos: un campo que tiene el valor del elemento y un campo (enlace, link) que contiene la posición del siguiente ele-
mento, es decir, su conexión, enlace o encadenamiento. Los elementos de una lista son enlazados por medio de los
campos enlaces.
Las listas enlazadas tienen una terminología propia que se suele utilizar normalmente. Primero, los valores se
almacenan en un nodo (Figura 12.1).
Dato
(valor elemento)
Enlace
Figura 12.1. Nodo con dos campos.
Una lista enlazada se muestra en la Figura 12.2.
5 4 1 7 18 19 9 7 45 …
(a)
(b)
LISTA
5 4 7 18 19 9 7 45
1
Figura 12.2. (a) array representado por una lista; (b) lista enlazada representada por una lista de enteros.
Los componentes de un nodo se llaman campos. Un nodo tiene al menos un campo dato o valor y un enlace (in-
dicador o puntero) con el siguiente nodo. El campo enlace apunta (proporciona la dirección o referencia de) al siguien-
te nodo de la lista. El último nodo de la lista enlazada, por convenio, se suele representar por un enlace con la palabra
reservada nil (nulo), una barra inclinada (/) y, en ocasiones, el símbolo eléctrico de tierra o masa (Figura 12.3).
1
Las listas enlazadas se conocen también en Latinoamérica con el término «ligadas» y «encadenadas». El término en inglés es linked list.
434 Fundamentos de programación
4 4 nil 4
Figura 12.3. Representación del último nodo de una lista.
La implementación de una lista enlazada depende del lenguaje. C, C++, Pascal, PL/I, Ada y Modula-2 utilizan
simplemente como enlace una variable puntero, o puntero (apuntador). Java no dispone de punteros, por consi-
guiente, resuelve el problema de forma diferente y almacena en el enlace la referencia al siguiente objeto nodo. Los
lenguajes como FORTRAN y COBOL no disponen de este tipo de datos y se debe simular con una variable entera
que actúa como indicador o cursor. En nuestro libro utilizaremos a partir de ahora el término puntero (apuntador)
para describir el enlace entre dos elementos o nodos de una lista enlazada.
Un puntero (apuntador) es una variable cuyo valor es la dirección o posición de otra variable.
En las listas enlazadas no es necesario que los elementos de la lista sean almacenados en posiciones físicas adya-
centes, ya que el puntero indica dónde se encuentra el siguiente elemento de la lista, tal como se indica en la Figu-
ra 12.4.
NULO
INFO SIG
INFO SIG
INFO SIG
INFO SIG
PRIMERO
Figura 12.4. Elementos no adyacentes de una lista enlazada.
Por consiguiente, la inserción y borrado no exigen desplazamiento como en el caso de las listas contiguas.
Para eliminar el 45.º elemento ('INÉS') de una lista lineal con 2.500 elementos [Figura 12.5 (a)] sólo es nece-
sario cambiar el puntero en el elemento anterior, 44.º, y que apunte ahora al elemento 46.º [Figura 12.5 (b)]. Para
insertar un nuevo elemento ('HIGINIO') después del 43.º ('GONZALO') elemento, es necesario cambiar el puntero
del elemento 43.º y hacer que el nuevo elemento apunte al elemento 44.º [Figura 12.5 (c)].
GONZALO HORACIO INÉS IVÁN JUAN ZAYA NULO
(a)
GONZALO HORACIO INÉS IVÁN JUAN ZAYA NULO
(b)
(c)
HIGINI O
GONZALO HORACIO IVÁN JUAN ZAYA NULO
Figura 12.5. Inserción y borrado de elementos.
Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas) 435
Una lista enlazada sin ningún elemento se llama lista vacía. Su puntero inicial o de cabecera tiene el valor nulo
(nil).
Una lista enlazada se define por:
• El tipo de sus elementos: campo de información (datos) y campo enlace (puntero o apuntador).
• Un puntero de cabecera que permite acceder al primer elemento de la lista.
• Un medio para detectar el último elemento de la lista: puntero nulo (nil).
EJEMPLO 12.3
El director de un hotel desea registrar el nombre de cada cliente a medida de su llegada al hotel, junto con el nú-
mero de habitación que ocupa —el antiguo libro de entradas—. También desea disponer en cualquier momento de
una lista de sus clientes por orden alfabético.
Ya que no es posible registrar los clientes alfabética y cronológicamente en la misma lista, se necesita o bien
listas alfabéticas independientes o bien añadir punteros a la lista existente, con lo que sólo se utilizará una única lis-
ta. El método manual en el libro requería muchos cruces y reescrituras; sin embargo, una computadora mediante un
algoritmo adecuado lo realizará fácilmente.
Por cada nodo de la lista el campo de información o datos tiene dos partes: nombre del cliente y número de ha-
bitación. Si x es un puntero a uno de estos nodos, l[x].nombre y l[x].habitación representarán las dos partes del
campo información.
El listado alfabético se consigue siguiendo el orden de los punteros de la lista (campo puntero). Se utiliza una
variable CABECERA(S) para apuntar al primer cliente.
CABECERA ← 3
Así, CABECERA(S) es 3, ya que el primer cliente, Antolín, ocupa el lugar 3. A su vez, el puntero asociado al
nodo ocupado por Antolín contiene el valor 10, que es el segundo nombre de los clientes en orden alfabético y éste
tiene como campo puntero el valor 7, y así sucesivamente. El campo puntero del último cliente, Tomás, contiene el
puntero nulo indicado por un 0 o bien una Z.
Registro Nombre Habitación Puntero
S(=3) 1 Tomás 324 z (final)
2 Cazorla 28 8
3 Antolín 95 10
4 Pérez 462 6
5 López 260 12
6 Sánchez 220 1
7 Bautista 115 2
8 García 105 9
9 Jiménez 173 5
10 Apolinar 341 7
11 Martín 205 4
12 Luzárraga 420 11
.
.
.
.
.
.
.
.
.
.
.
.
Figura 12.6. Lista enlazada de clientes de un hotel.
436 Fundamentos de programación
12.4. PROCESAMIENTO DE LISTAS ENLAZADAS
Para procesar una lista enlazada se necesitan las siguientes informaciones:
• Primer nodo (cabecera de la lista).
• El tipo de sus elementos.
Las operaciones que normalmente se ejecutan con listas incluyen:
1. Recuperar información de un nodo específico (acceso a un elemento).
2. Encontrar el nodo que contiene una información específica (localizar la posición de un elemento dado).
3. Insertar un nuevo nodo en un lugar específico de la lista.
4. Insertar un nuevo nodo en relación a una información particular.
5. Borrar (eliminar) un nodo existente que contiene información específica.
12.4.1. Implementación de listas enlazadas con punteros
Como ya hemos visto, la representación gráfica de un puntero consiste en una flecha que sale del puntero y llega a
la variable dinámica apufintada.
Para declarar una variable de tipo puntero:
tipo
puntero_a tipo_dato: punt
var
punt : p, q
El tipo_dato podrá ser simple o estructurado.
Operaciones con punteros:
Inicialización
p ← nulo A nulo para indicar que no apunta a ninguna variable.
Comparación
p = q Con los operadores = o .
p
q
p→ q→
Asignación
p ← q Implica hacer que el puntero p apunte a donde apunta q.
Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas) 437
Creación de variables dinámicas
Reservar(p) Reservar espacio en memoria para la variable dinámica.
Eliminación de variables dinámicas
Liberar(p) Liberar el espacio en memoria ocupado por la variable dinámica.
Variables dinámicas
Variable simple o estructura de datos sin nombre y creada en tiempo de ejecución.
p p →
Para acceder a una variable dinámica apuntada, como no tiene nombre se escribe p →
Las variables p → podrán intervenir en toda operación o expresión de las permitidas para una variable estática
de su mismo tipo.
Nodo
Las estructuras dinámicas de datos están fo
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf
Fundamentos_de_programacion_Algoritmos_e.pdf

Más contenido relacionado

PDF
Rodriguez, m.a. (1991). metodología de la programación a través de pseudocódigo
PDF
PLC: Programación de un sistema de automatización de una linea de producción ...
PDF
libro_microcontroladores_omarnieves
PDF
Sistemas operativos-david-luis
PDF
Sistema_de_gestion_de_asistencias_de_ase.pdf
PDF
Automatizacion Industria_Teoria y Control (1).pdf
PDF
Programacion de algoritmos
DOC
Separata Informatica I 2009 I Unidad 1 Semana 1
Rodriguez, m.a. (1991). metodología de la programación a través de pseudocódigo
PLC: Programación de un sistema de automatización de una linea de producción ...
libro_microcontroladores_omarnieves
Sistemas operativos-david-luis
Sistema_de_gestion_de_asistencias_de_ase.pdf
Automatizacion Industria_Teoria y Control (1).pdf
Programacion de algoritmos
Separata Informatica I 2009 I Unidad 1 Semana 1

Similar a Fundamentos_de_programacion_Algoritmos_e.pdf (20)

PDF
Microcontroladores: Microcontroladores PIC diseño practico de aplicaciones 1r...
DOCX
Tarea # 02 generalidades de la auditoria de sistemas
PDF
Sistemas operativos -_luis_la_red_martinez
PDF
Sistemaoperativos lared-martinez
PDF
Open ERP Doc-06-tinyerp4.2
PDF
DocOpenERP - Tiny erp4.2
PPTX
Trabajo de clasificacion de las computadoras 2
PDF
Mantenimiento de computadores
PDF
Mantenimiento decomputadores
PDF
Sistema Informatico
PPTX
Computadora
DOCX
Universidad nacional de chimborazo
PDF
PDF
Tfg g3750
PDF
Peer to Peer
PDF
Sistema de Computación Distribuida Peer to Peer
DOCX
Practica en-clases
DOCX
Practica en clases
PDF
Fundamentos de Programacion.pdf
PPTX
Informatica para administracion universidad
Microcontroladores: Microcontroladores PIC diseño practico de aplicaciones 1r...
Tarea # 02 generalidades de la auditoria de sistemas
Sistemas operativos -_luis_la_red_martinez
Sistemaoperativos lared-martinez
Open ERP Doc-06-tinyerp4.2
DocOpenERP - Tiny erp4.2
Trabajo de clasificacion de las computadoras 2
Mantenimiento de computadores
Mantenimiento decomputadores
Sistema Informatico
Computadora
Universidad nacional de chimborazo
Tfg g3750
Peer to Peer
Sistema de Computación Distribuida Peer to Peer
Practica en-clases
Practica en clases
Fundamentos de Programacion.pdf
Informatica para administracion universidad
Publicidad

Más de ssuserbe139c (15)

PDF
CLR_via_CSharp_(Jeffrey_Richter_4th_Edition).pdf
PDF
Libro_Csharp.pdf
PDF
Interfaces Web Adaptables al dispositivo empleando HTML5 y CSS3.pdf
PDF
Liu11-3.pdf
PDF
Improving_programming_skills_of_Mechanical_Enginee.pdf
PDF
GRAFOS_Y_ALGORITMOS_POR_A_B_T_S.pdf
PDF
introduccion_a_la_IO.pdf
PDF
introcs.PDF
PDF
FABRICACIÓN ASISTIDA POR ordenador.pdf
PDF
Hormann.2001.TPI.pdf
PDF
Guia_AEA_Inst_hasta_10_Kw_COLOR.pdf
PDF
Manual_softstarter_3RW30_3RW40_es-MX.pdf
PDF
Programa de estudio Diplomatura en Programacion.pdf
PDF
honeywell-dc1000-dc1010-dc1030-dc1040-manual.pdf
PDF
TF-832.pdf
CLR_via_CSharp_(Jeffrey_Richter_4th_Edition).pdf
Libro_Csharp.pdf
Interfaces Web Adaptables al dispositivo empleando HTML5 y CSS3.pdf
Liu11-3.pdf
Improving_programming_skills_of_Mechanical_Enginee.pdf
GRAFOS_Y_ALGORITMOS_POR_A_B_T_S.pdf
introduccion_a_la_IO.pdf
introcs.PDF
FABRICACIÓN ASISTIDA POR ordenador.pdf
Hormann.2001.TPI.pdf
Guia_AEA_Inst_hasta_10_Kw_COLOR.pdf
Manual_softstarter_3RW30_3RW40_es-MX.pdf
Programa de estudio Diplomatura en Programacion.pdf
honeywell-dc1000-dc1010-dc1030-dc1040-manual.pdf
TF-832.pdf
Publicidad

Último (6)

PPTX
sistemas de informacion.................
DOCX
trabajo programacion.docxxdxxxddxdxxdxdxxxdxxdxdxd
PPTX
Conceptos basicos de Base de Datos y sus propiedades
PPTX
Derechos_de_Autor_y_Creative_Commons.pptx
PDF
AutoCAD Herramientas para el futuro, Juan Fandiño
PDF
Su punto de partida en la IA: Microsoft 365 Copilot Chat
sistemas de informacion.................
trabajo programacion.docxxdxxxddxdxxdxdxxxdxxdxdxd
Conceptos basicos de Base de Datos y sus propiedades
Derechos_de_Autor_y_Creative_Commons.pptx
AutoCAD Herramientas para el futuro, Juan Fandiño
Su punto de partida en la IA: Microsoft 365 Copilot Chat

Fundamentos_de_programacion_Algoritmos_e.pdf

  • 5. FUNDAMENTOS DE PROGRAMACIÓN Algoritmos, estructura de datos y objetos Cuarta edición Luis Joyanes Aguilar Catedrático de Lenguajes y Sistemas Informáticos Facultad de Informática, Escuela Universitaria de Informática Universidad Pontificia de Salamanca campus de Madrid MADRID • BOGOTÁ • BUENOS AIRES • CARACAS • GUATEMALA • LISBOA • MÉXICO NUEVA YORK • PANAMÁ • SAN JUAN • SANTIAGO • SÃO PAULO AUCKLAND • HAMBURGO • LONDRES • MILÁN • MONTREAL • NUEVA DELHI • PARÍS SAN FRANCISCO • SIDNEY • SINGAPUR • ST LOUIS • TOKIO • TORONTO
  • 6. FUNDAMENTOS DE PROGRAMACIÓN. Algoritmos, estructura de datos y objetos. Cuarta edición. No está permitida la reproducción total o parcial de este libro, ni su tratamiento informático, ni la transmisión de ninguna forma o por cualquier medio, ya sea elec- trónico, mecánico, por fotocopia, por registro u otros métodos, sin el permiso previo y por escrito de los titulares del Copyright. DERECHOS RESERVADOS © 2008, respecto a la cuarta edición en español, por McGRAW-HILL/INTERAMERICANA DE ESPAÑA, S. A. U. Edificio Valrealty, 1.ª planta Basauri, 17 28023 Aravaca (Madrid) ISBN: 978-84-481-6111-8 Depósito legal: M. Editores: José Luis García y Cristina Sánchez Técnicos editoriales: Blanca Pecharromán y María León Preimpresión: Nuria Fernández Sánchez Cubierta: Escriña Diseño Gráfico Compuesto en: Gráficas Blanco, S. L. Impreso en: IMPRESO EN ESPAÑA - PRINTED IN SPAIN
  • 7. Contenido Prefacio a la cuarta edición................................................................................................................................................... xvii PARTE I. ALGORITMOS Y HERRAMIENTAS DE PROGRAMACIÓN................................................ 1 Capítulo 1. Introducción a las computadoras y los lenguajes de programación................................................................ 3 INTRODUCCIÓN......................................................................................................................................................... 3 1.1. ¿Qué es una computadora?.................................................................................................................................. 4 1.1.1. Origen de las computadoras .................................................................................................................... 5 1.1.2. Clasificación de las computadoras........................................................................................................... 6 1.2. Organización física de una computadora............................................................................................................. 7 1.2.1. Dispositivos de Entrada/Salida (E/S): periféricos ................................................................................... 8 1.2.2. La memoria principal............................................................................................................................... 9 1.2.3. Unidades de medida de memoria ............................................................................................................ 10 1.2.4. El procesador ........................................................................................................................................... 12 1.2.5. Propuestas para selección de la computadora ideal para aprender programación o para actividades profesionales ............................................................................................................................................ 14 1.3. Representación de la información en las computadoras ..................................................................................... 15 1.3.1. Representación de textos ......................................................................................................................... 15 1.3.2. Representación de valores numéricos...................................................................................................... 16 1.3.3. Representación de imágenes.................................................................................................................... 17 1.3.4. Representación de sonidos....................................................................................................................... 18 1.4. Codificación de la información ........................................................................................................................... 19 1.4.1. Sistemas de numeración .......................................................................................................................... 19 1.5. Dispositivos de almacenamiento secundario (almacenamento masivo).............................................................. 21 1.5.1. Discos magnéticos ................................................................................................................................... 21 1.5.2. Discos ópticos: CD-ROM y DVD ........................................................................................................... 21 1.5.3. Discos y memorias Flash USB................................................................................................................ 24 1.5.4. Otros dispositivos de Entrada y Salida (E/S) .......................................................................................... 24 1.6. Conectores de dispositivos de E/S....................................................................................................................... 26 1.6.1. Puertos serie y paralelo............................................................................................................................ 26 1.6.2. USB.......................................................................................................................................................... 27 1.6.3. Bus IEEE Firewire – 1394....................................................................................................................... 27 1.7. Redes, Web y Web 2.0......................................................................................................................................... 28 1.7.1. Redes P2P, igual-a-igual (peer-to-peer, P2P).......................................................................................... 29 1.7.2. Aplicaciones de las redes de comunicaciones......................................................................................... 29 1.7.3. Módem..................................................................................................................................................... 30 1.7.4. Internet y la World Wide Web ................................................................................................................. 30 1.8. El software (los programas)................................................................................................................................. 32 1.8.1. Software del sistema................................................................................................................................ 32 1.8.2. Software de aplicación............................................................................................................................. 33 1.8.3. Sistema operativo..................................................................................................................................... 34 1.8.3.1. Multiprogramación/Multitarea.................................................................................................. 35 1.8.3.2. Tiempo compartido (múltiples usuarios, time sharing) ........................................................... 35 1.8.3.3. Multiproceso............................................................................................................................. 35
  • 8. 1.9. Lenguajes de programación............................................................................................................................... 36 1.9.1. Traductores de lenguaje: el proceso de traducción de un programa..................................................... 37 1.9.2. La compilación y sus fases.................................................................................................................... 38 1.9.3. Evolución de los lenguajes de programación........................................................................................ 39 1.9.4. Paradigmas de programación................................................................................................................. 40 1.10. Breve historia de los lenguajes de programación.............................................................................................. 42 RESUMEN.................................................................................................................................................................... 43 Capítulo 2. Metodología de la programación y desarrollo de software............................................................................. 45 INTRODUCCIÓN......................................................................................................................................................... 45 2.1. Fases en la resolución de problemas ................................................................................................................... 46 2.1.1. Análisis del problema .............................................................................................................................. 47 2.1.2. Diseño del algoritmo................................................................................................................................ 48 2.1.3. Herramientas de programación................................................................................................................ 48 2.1.4. Codificación de un programa................................................................................................................... 51 2.1.5. Compilación y ejecución de un programa............................................................................................... 52 2.1.6. Verificación y depuración de un programa.............................................................................................. 52 2.1.7. Documentación y mantenimiento............................................................................................................ 53 2.2. Programación modular......................................................................................................................................... 54 2.3. Programación estructurada .................................................................................................................................. 54 2.3.1. Datos locales y datos globales................................................................................................................. 55 2.3.2. Modelado del mundo real........................................................................................................................ 56 2.4. Programación orientada a objetos........................................................................................................................ 56 2.4.1. Propiedades fundamentales de la orientación a objetos.......................................................................... 57 2.4.2. Abstracción .............................................................................................................................................. 57 2.4.3. Encapsulación y ocultación de datos....................................................................................................... 58 2.4.4. Objetos..................................................................................................................................................... 59 2.4.5. Clases....................................................................................................................................................... 61 2.4.6. Generalización y especialización: herencia............................................................................................. 61 2.4.7 Reusabilidad............................................................................................................................................. 63 2.4.8. Polimorfismo............................................................................................................................................ 63 2.5. Concepto y características de algoritmos ............................................................................................................ 64 2.5.1. Características de los algoritmos............................................................................................................. 65 2.5.2. Diseño del algoritmo................................................................................................................................ 66 2.6. Escritura de algoritmos........................................................................................................................................ 68 2.7. Representación gráfica de los algoritmos............................................................................................................ 69 2.7.1. Pseudocódigo........................................................................................................................................... 70 2.7.2. Diagramas de flujo................................................................................................................................... 71 2.7.3. Diagramas de Nassi-Schneiderman (N-S)............................................................................................... 80 RESUMEN.................................................................................................................................................................... 81 EJERCICIOS................................................................................................................................................................. 81 Capítulo 3. Estructura general de un programa.................................................................................................................. 83 INTRODUCCIÓN......................................................................................................................................................... 83 3.1. Concepto de programa......................................................................................................................................... 84 3.2. Partes constitutivas de un programa .................................................................................................................... 84 3.3. Instrucciones y tipos de instrucciones ................................................................................................................. 85 3.3.1. Tipos de instrucciones ............................................................................................................................. 85 3.3.2. Instrucciones de asignación..................................................................................................................... 86 3.3.3. Instrucciones de lectura de datos (entrada) ............................................................................................. 87 3.3.4. Instrucciones de escritura de resultados (salida) ..................................................................................... 87 3.3.5. Instrucciones de bifurcación.................................................................................................................... 87 3.4. Elementos básicos de un programa ..................................................................................................................... 89 3.5. Datos, tipos de datos y operaciones primitivas ................................................................................................... 89 3.5.1. Datos numéricos ...................................................................................................................................... 90 3.5.2. Datos lógicos (booleanos) ....................................................................................................................... 92 3.5.3. Datos tipo carácter y tipo cadena............................................................................................................. 92 vi Contenido
  • 9. 3.6. Constantes y variables ....................................................................................................................................... 92 3.6.1. Declaración de constants y variables..................................................................................................... 94 3.7. Expresiones........................................................................................................................................................ 94 3.7.1. Expresiones aritméticas......................................................................................................................... 95 3.7.2. Reglas de prioridad................................................................................................................................ 97 3.7.3. Expresiones lógicas (booleanas)........................................................................................................... 99 3.8. Funciones internas............................................................................................................................................. 102 3.9. La operación de asignación............................................................................................................................... 104 3.9.1. Asignación aritmética............................................................................................................................ 105 3.9.2. Asignación lógica .................................................................................................................................. 105 3.9.3. Asignación de cadenas de caracteres..................................................................................................... 105 3.9.4. Asignación múltiple............................................................................................................................... 105 3.9.5. Conversión de tipo................................................................................................................................. 106 3.10. Entrada y salida de información........................................................................................................................ 107 3.11. Escritura de algoritmos/programas.................................................................................................................... 108 3.11.1. Cabecera del programa o algoritmo.................................................................................................... 108 3.11.2. Declaración de variables ..................................................................................................................... 108 3.11.3. Declaración de constantes numéricas.................................................................................................. 109 3.11.4. Declaración de constantes y variables carácter................................................................................... 109 3.11.5. Comentarios......................................................................................................................................... 110 3.11.6. Estilo de escritura de algoritmos/programas....................................................................................... 111 ACTIVIDADES DE PROGRAMACIÓapítulo 4. Flujo de control I: Estructuras selectivas......................................................................................................... 127 INTRODUCCIÓN......................................................................................................................................................... 127 4.1. El flujo de control de un programa...................................................................................................................... 128 4.2. Estructura secuencial ........................................................................................................................................... 128 4.3. Estructuras selectivas........................................................................................................................................... 130 4.4. Alternativa simple (si-entonces/if-then).................................................................................................... 131 4.4.1. Alternativa doble (si-entonces-sino/if-then-else).................................................................... 132 4.5. Alternativa múltiple (según_sea, caso de/case)........................................................................................ 137 4.6. Estructuras de decisión anidadas (en escalera).................................................................................................... 144 4.7. La sentencia ir-a (goto) ................................................................................................................................... 148 ACTIVIDADES DE PROGRAMACIÓapítulo 5. Flujo de control II: Estructuras repetitivas ...................................................................................................... 157 INTRODUCCIÓN......................................................................................................................................................... 157 5.1. Estructuras repetitivas.......................................................................................................................................... 158 5.2. Estructura mientras ("while") ..................................................................................................................... 160 5.2.1. Ejecución de un bucle cero veces............................................................................................................ 162 5.2.2. Bucles infinitos ........................................................................................................................................ 163 5.2.3. Terminación de bucles con datos de entrada........................................................................................... 163 5.3. Estructura hacer-mientras ("do-while") ................................................................................................. 165 5.4. Diferencias entre mientras (while) y hacer-mientras (do-while): una aplicación en C++.................... 167 5.5. Estructura repetir ("repeat") ........................................................................................................................ 168 5.6. Estructura desde/para ("for") ........................................................................................................................ 171 5.6.1. Otras representaciones de estructuras repetitivas desde/para (for).................................................... 171 5.6.2. Realización de una estructura desde con estructura mientras ............................................................ 174 5.7. Salidas internas de los bucles .............................................................................................................................. 175 5.8. Sentencias de salto interrumpir (break) y continuar (continue)............................................................ 176 5.8.1. Sentencia interrumpir (break)........................................................................................................... 176 5.8.2. Sentencia continuar (continue)......................................................................................................... 177 Contenido vii
  • 10. 5.9. Comparación de bucles while, for y do-while: una aplicación en C++ ..................................................... 178 5.10. Diseño de bucles (lazos).................................................................................................................................... 179 5.10.1. Bucles para diseño de sumas y productos........................................................................................... 179 5.10.2. Fin de un bucle.................................................................................................................................... 179 5.11. Estructuras repetitivas anidadas......................................................................................................................... 181 5.11.1. Bucles (lazos) anidados: una aplicación en C++ ................................................................................ 183 ACTIVIDADES DE PROGRAMACIÓÁFICAS.......................................................................................................................... 199 Capítulo 6. Subprogramas (subalgoritmos): Funciones ..................................................................................................... 201 INTRODUCCIÓN......................................................................................................................................................... 201 6.1. Introducción a los subalgoritmos o subprogramas............................................................................................ 202 6.2. Funciones........................................................................................................................................................... 203 6.2.1. Declaración de funciones......................................................................................................................... 204 6.2.2. Invocación a las funciones....................................................................................................................... 205 6.3. Procedimientos (subrutinas) ................................................................................................................................ 210 6.3.1. Sustitución de argumentos/parámetros.................................................................................................... 211 6.4. Ámbito: variables locales y globales................................................................................................................... 215 6.5. Comunicación con subprogramas: paso de parámetros....................................................................................... 218 6.5.1. Paso de parámetros .................................................................................................................................. 219 6.5.2. Paso por valor .......................................................................................................................................... 219 6.5.3. Paso por referencia................................................................................................................................... 220 6.5.4. Comparaciones de los métodos de paso de parámetros .......................................................................... 221 6.5.5. Síntesis de la transmisión de parámetros................................................................................................. 223 6.6. Funciones y procedimientos como parámetros ................................................................................................... 225 6.7. Los efectos laterales............................................................................................................................................. 227 6.7.1. En procedimientos ................................................................................................................................... 227 6.7.2. En funciones ............................................................................................................................................ 228 6.8. Recursión (recursividad)...................................................................................................................................... 229 6.9. Funciones en C/C++ , Java y C# ......................................................................................................................... 231 6.10. Ámbito (alcance) y almacenamiento en C/C++ y Java....................................................................................... 233 6.11. Sobrecarga de funciones en C++ y Java.............................................................................................................. 235 ACTIVIDADES DE PROGRAMACIÓapítulo 7. Estructuras de datos I (arrays y estructuras).................................................................................................... 247 INTRODUCCIÓN......................................................................................................................................................... 247 7.1. Introducción a las estructuras de datos................................................................................................................ 248 7.2. Arrays (arreglos) unidimensionales: los vectores................................................................................................ 248 7.3. Operaciones con vectores .................................................................................................................................... 251 7.3.1. Asignación ............................................................................................................................................... 252 7.3.2. Lectura/escritura de datos........................................................................................................................ 253 7.3.3. Acceso secuencial al vector (recorrido)................................................................................................... 253 7.3.4. Actualización de un vector ...................................................................................................................... 255 7.4. Arrays de varias dimensiones.............................................................................................................................. 258 7.4.1. Arrays bidimensionales (tablas/matrices)................................................................................................ 258 7.5. Arrays multidimensionales .................................................................................................................................. 260 7.6. Almacenamiento de arrays en memoria .............................................................................................................. 262 7.6.1. Almacenamiento de un vector ................................................................................................................. 262 7.6.2. Almacenamiento de arrays multidimensionales...................................................................................... 263 viii Contenido
  • 11. 7.7. Estructuras versus registros ............................................................................................................................... 265 7.7.1. Registros ................................................................................................................................................ 265 7.8. Arrays de estructuras......................................................................................................................................... 266 7.9. Uniones.............................................................................................................................................................. 268 7.9.1. Unión versus estructura ......................................................................................................................... 268 7.10. Enumeraciones................................................................................................................................................... 270 ACTIVIDADES DE PROGRAMACIÓapítulo 8. Las cadenas de caracteres................................................................................................................................ 285 INTRODUCCIÓN......................................................................................................................................................... 285 8.1. Introducción......................................................................................................................................................... 286 8.2. El juego de caracteres.......................................................................................................................................... 286 8.2.1. Código ASCII .......................................................................................................................................... 286 8.2.2. Código EBCDIC...................................................................................................................................... 287 8.2.3. Código universal Unicode para Internet.................................................................................................. 287 8.2.4. Secuencias de escape............................................................................................................................... 289 8.3. Cadena de caracteres............................................................................................................................................ 289 8.4. Datos tipo carácter............................................................................................................................................... 291 8.4.1. Constantes................................................................................................................................................ 291 8.4.2. Variables................................................................................................................................................... 291 8.4.3. Instrucciones básicas con cadenas........................................................................................................... 292 8.5. Operaciones con cadenas..................................................................................................................................... 293 8.5.1. Cálculo de la longitud de una cadena...................................................................................................... 293 8.5.2. Comparación............................................................................................................................................ 294 8.5.3. Concatenación.......................................................................................................................................... 295 8.5.4. Subcadenas............................................................................................................................................... 296 8.5.5. Búsqueda.................................................................................................................................................. 297 8.6. Otras funciones de cadenas.................................................................................................................................. 297 8.6.1. Insertar ..................................................................................................................................................... 298 8.6.2. Borrar....................................................................................................................................................... 298 8.6.3. Cambiar.................................................................................................................................................... 299 8.6.4. Conversión de cadenas/números.............................................................................................................. 300 ACTIVIDADES DE PROGRAMACIÓapítulo 9. Archivos (ficheros) .......................................................................................................................................... 307 INTRODUCCIÓN......................................................................................................................................................... 307 9.1. Archivos y flujos (stream): La jerarquía de datos ............................................................................................... 308 9.1.1. Campos .................................................................................................................................................... 309 9.1.2. Registros .................................................................................................................................................. 309 9.1.3. Archivos (ficheros) .................................................................................................................................. 310 9.1.4. Bases de datos.......................................................................................................................................... 310 9.1.5. Estructura jerárquica................................................................................................................................ 310 9.1.6. Jerarquía de datos .................................................................................................................................... 311 9.2. Conceptos y definiciones = terminología............................................................................................................ 312 9.2.1. Clave (indicativo)..................................................................................................................................... 312 9.2.2. Registro físico o bloque........................................................................................................................... 312 9.2.3. Factor de bloqueo..................................................................................................................................... 312 9.3. Soportes secuenciales y direccionables ............................................................................................................... 313 9.4. Organización de archivos..................................................................................................................................... 314 9.4.1. Organización secuencial .......................................................................................................................... 314 9.4.2. Organización directa................................................................................................................................ 315 9.4.3. Organización secuencial indexada........................................................................................................... 316 Contenido ix
  • 12. 9.5. Operaciones sobre archivos............................................................................................................................... 317 9.5.1. Creación de un archivo.......................................................................................................................... 318 9.5.2. Consulta de un archivo .......................................................................................................................... 318 9.5.3. Actualización de un archivo .................................................................................................................. 319 9.5.4. Clasificación de un archivo ................................................................................................................... 319 9.5.5. Reorganización de un archivo ............................................................................................................... 320 9.5.6. Destrucción de un archivo..................................................................................................................... 320 9.5.7. Reunión, fusión de un archivo............................................................................................................... 320 9.5.8. Rotura/estallido de un archivo............................................................................................................... 321 9.6. Gestión de archivos............................................................................................................................................ 321 9.6.1. Crear un archivo .................................................................................................................................... 322 9.6.2. Abrir un archivo..................................................................................................................................... 322 9.6.3. Cerrar archivos....................................................................................................................................... 324 9.6.4. Borrar archivos ...................................................................................................................................... 324 9.7. Flujos ................................................................................................................................................................. 324 9.7.1. Tipos de flujos ....................................................................................................................................... 325 9.7.2. Flujos en C++ ........................................................................................................................................ 325 9.7.3. Flujos en Java ........................................................................................................................................ 325 9.7.4. Consideraciones prácticas en Java y C#................................................................................................ 326 9.8. Mantenimiento de archivos................................................................................................................................ 326 9.8.1. Operaciones sobre registros................................................................................................................... 328 9.9. Procesamiento de archivos secuenciales (algoritmos) ...................................................................................... 328 9.9.1. Creación................................................................................................................................................. 328 9.9.2. Consulta................................................................................................................................................. 329 9.9.3. Actualización......................................................................................................................................... 332 9.10. Procesamiento de archivos directos (algoritmos).............................................................................................. 335 9.10.1. Operaciones con archivos directos...................................................................................................... 335 9.10.2. Clave-dirección.................................................................................................................................... 341 9.10.3. Tratamiento de las colisiones .............................................................................................................. 341 9.10.4. Acceso a los archivos directos mediante indexación.......................................................................... 341 9.11. Procesamiento de archivos secuenciales indexados.......................................................................................... 343 9.12. Tipos de archivos: consideraciones prácticas en C/C++ y Java........................................................................ 344 9.12.1. Archivos de texto................................................................................................................................. 344 9.12.2. Archivos binarios................................................................................................................................. 345 9.12.3. Lectura y escritura de archivos............................................................................................................ 345 ACTIVIDADES DE PROGRAMACIÓapítulo 10. Ordenación, búsqueda e intercalación............................................................................................................. 355 INTRODUCCIÓN......................................................................................................................................................... 355 10.1. Introducción....................................................................................................................................................... 356 10.2. Ordenación......................................................................................................................................................... 357 10.2.1. Método de intercambio o de burbuja .................................................................................................. 358 10.2.2. Ordenación por inserción .................................................................................................................... 363 10.2.3. Ordenación por selección.................................................................................................................... 365 10.2.4. Método de Shell .................................................................................................................................. 368 10.2.5. Método de ordenación rápida (quicksort) ........................................................................................... 370 10.3. Búsqueda............................................................................................................................................................ 374 10.3.1. Búqueda secuencial............................................................................................................................. 374 10.3.2. Búqueda binaria................................................................................................................................... 379 10.3.3. Búsqueda mediante transformación de claves (hasting)..................................................................... 383 10.4. Intercalación ...................................................................................................................................................... 388 ACTIVIDADES DE PROGRAMACIÓx Contenido
  • 13. Capítulo 11. Ordenación, búsqueda y fusión externa (archivos).......................................................................................... 405 INTRODUCCIÓN......................................................................................................................................................... 405 11.1. Introducción....................................................................................................................................................... 406 11.2. Archivos ordenados ........................................................................................................................................... 406 11.3. Fusión de archivos............................................................................................................................................. 406 11.4. Partición de archivos.......................................................................................................................................... 410 11.4.1. Clasificación interna............................................................................................................................ 410 11.4.2. Partición por contenido ....................................................................................................................... 410 11.4.3. Selección por sustitución..................................................................................................................... 411 11.4.4. Partición por secuencias...................................................................................................................... 413 11.5. Clasificación de archivos................................................................................................................................... 414 11.5.1. Clasificación por mezcla directa ......................................................................................................... 414 11.5.2. Clasificación por mezcla natural......................................................................................................... 417 11.5.3. Clasificación por mezcla de secuencias equilibridas.......................................................................... 421 ACTIVIDADES DE PROGRAMACIÓapítulo 12. Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas)........................................................ 429 INTRODUCCIÓN......................................................................................................................................................... 429 12.1. Introducción a las estructuras de datos.............................................................................................................. 430 12.1.1. Estructuras dinámicas de datos ........................................................................................................... 430 12.2. Listas.................................................................................................................................................................. 431 12.3. Listas enlazadas................................................................................................................................................. 433 12.4. Procesamiento de listas enlazadas..................................................................................................................... 436 12.4.1. Implementación de listas enlazadas con punteros............................................................................... 436 12.4.2. Implementación de listas enlazadas con arrays (arreglos).................................................................. 442 12.5. Listas circulares................................................................................................................................................. 450 12.6. Listas doblemente enlazadas ............................................................................................................................. 450 12.6.1. Inserción .............................................................................................................................................. 451 12.6.2. Eliminación.......................................................................................................................................... 452 12.7. Pilas.................................................................................................................................................................... 452 12.7.1. Aplicaciones de las pilas..................................................................................................................... 458 12.8. Colas .................................................................................................................................................................. 460 12.8.1. Representación de las colas................................................................................................................. 461 12.8.2. Aprovechamiento de la memoria ........................................................................................................ 467 12.9. Doble cola.......................................................................................................................................................... 468 ACTIVIDADES DE PROGRAMACIÓapítulo 13. Estructuras de datos no lineales (árboles y grafos) ......................................................................................... 479 INTRODUCCIÓN......................................................................................................................................................... 479 13.1. Introducción....................................................................................................................................................... 480 13.2. Árboles............................................................................................................................................................... 480 13.2.1. Terminología y representación de un árbol general............................................................................ 481 13.3. Árbol binario...................................................................................................................................................... 482 13.3.1. Terminología de los árboles binarios .................................................................................................. 483 13.3.2. Árboles binarios completos................................................................................................................. 484 13.3.3. Conversión de un árbol general en árbol binario................................................................................ 485 13.3.4. Representación de los árboles binarios ............................................................................................... 489 13.3.5. Recorrido de un árbol binario ............................................................................................................. 493 13.4. Árbol binario de búsqueda................................................................................................................................. 495 13.4.1. Búsqueda de un elemento.................................................................................................................... 497 13.4.2. Insertar un elemento............................................................................................................................ 498 13.4.3. Eliminación de un elemento................................................................................................................ 499 Contenido xi
  • 14. 13.5. Grafos ................................................................................................................................................................ 506 13.5.1. Terminología de grafos........................................................................................................................ 506 13.5.2. Representación de grafos .................................................................................................................... 509 ACTIVIDADES DE PROGRAMACIÓN RESUELTAS.............................................................................................. 512 CONCEPTOS CLAVE.................................................................................................................................................. 516 RESUMEN.................................................................................................................................................................... 516 EJERCICIOS ................................................................................................................................................................ 517 Capítulo 14. Recursividad..................................................................................................................................................... 519 INTRODUCCIÓN......................................................................................................................................................... 519 14.1. La naturaleza de la recursividad........................................................................................................................ 520 14.2. Recursividad directa e indirecta ........................................................................................................................ 524 14.2.1. Recursividad indirecta......................................................................................................................... 527 14.2.2. Condición de terminación de la recursión .......................................................................................... 528 14.3. Recursión versus iteración................................................................................................................................. 528 14.4. Recursión infinita............................................................................................................................................... 531 14.5. Resolución de problemas complejos con recursividad ..................................................................................... 535 14.5.1. Torres de Hanoi ................................................................................................................................... 535 14.5.2. Búsqueda binaria recursiva.................................................................................................................. 540 14.5.3. Ordenación rápida (QuickSort) ........................................................................................................... 542 14.5.4. Ordenación mergesortÓN ORIENTADA A OBJETOS Y UML 2.1 ................................................. 551 Capítulo 15. Tipos abstractos de datos, objetos y modelado con UML 2.1 ........................................................................ 553 INTRODUCCIÓN......................................................................................................................................................... 553 15.1. Programación estructurada (procedimental)...................................................................................................... 554 15.1.1. Limitaciones de la programación estructurada ................................................................................... 554 15.1.2. Modelado de objetos del mundo real.................................................................................................. 555 15.2. Programación orientada a objetos ..................................................................................................................... 556 15.2.1. Objetos................................................................................................................................................. 557 15.2.2. Tipos abstractos de datos: CLASES.................................................................................................... 558 15.3. Modelado e identificación de objetos................................................................................................................ 560 15.4. Propiedades fundamentales de orientación a objetos........................................................................................ 561 15.4.1. Abstracción.......................................................................................................................................... 561 15.4.2. La abstracción en el software.............................................................................................................. 561 15.4.3. Encapsulamiento y ocultación de datos .............................................................................................. 562 15.4.4 Herencia............................................................................................................................................... 562 15.4.5. Reutilización o reusabilidad................................................................................................................ 563 15.4.6. Polimorfismo ....................................................................................................................................... 564 15.5. Modelado de aplicaciones: UML ...................................................................................................................... 565 15.5.1. Lenguaje de modelado ........................................................................................................................ 566 15.5.2. ¿Qué es un lenguaje de modelado?..................................................................................................... 566 15.6. Diseño de software con UML ........................................................................................................................... 567 15.6.1. Desarrollo de software orientado a objetos con UML........................................................................ 568 15.6.2. Especificaciones de UML ................................................................................................................... 568 15.7. Historia de UML................................................................................................................................................ 568 15.7.1. El futuro de UML 2.1.......................................................................................................................... 569 15.8. Terminología de orientación a objetosxii Contenido
  • 15. Capítulo 16. Diseño de clases y objetos: Representaciones gráficas en UML .................................................................... 573 INTRODUCCIÓN......................................................................................................................................................... 573 16.1. Diseño y representación gráfica de objetos en UML........................................................................................ 574 16.1.1. Representación gráfica en UML ......................................................................................................... 575 16.1.2. Características de los objetos .............................................................................................................. 576 16.1.3. Estado .................................................................................................................................................. 577 16.1.4. Múltiples instancias de un objeto........................................................................................................ 579 16.1.5. Evolución de un objeto........................................................................................................................ 579 16.1.6. Comportamiento.................................................................................................................................. 580 16.1.7. Identidad.............................................................................................................................................. 582 16.1.8. Los mensajes ....................................................................................................................................... 582 16.1.9. Responsabilidad y restricciones .......................................................................................................... 584 16.2. Diseño y representación gráfica de clases en UML.......................................................................................... 584 16.2.1. Representación gráfica de una clase ................................................................................................... 585 16.2.2. Declaración de una clase..................................................................................................................... 588 16.2.3. Reglas de visibilidad ........................................................................................................................... 590 16.2.4. Sintaxis ................................................................................................................................................ 592 16.3. Declaración de objetos de clases....................................................................................................................... 593 16.3.1. Acceso a miembros de la clase: encapsulamiento .............................................................................. 595 16.3.2. Declaración de métodos ...................................................................................................................... 597 16.3.3. Tipos de métodos................................................................................................................................. 601 16.4. Constructores..................................................................................................................................................... 602 16.4.1. Constructor por defecto....................................................................................................................... 603 16.5. Destructores....................................................................................................................................................... 606 16.6. Implementación de clases en C++..................................................................................................................... 607 16.6.1. Archivos de cabecera y de clases........................................................................................................ 608 16.6.2. Clases compuestas............................................................................................................................... 609 16.7. Recolección de basura....................................................................................................................................... 610 16.7.1. El método finalizeapítulo 17. Relaciones entre clases: Delegaciones, asociaciones, agregaciones, herencia................................................ 615 INTRODUCCIÓN......................................................................................................................................................... 615 17.1. Relaciones entre clases...................................................................................................................................... 616 17.2. Dependencia ...................................................................................................................................................... 616 17.3. Asociación ......................................................................................................................................................... 617 17.3.1. Multiplicidad ....................................................................................................................................... 619 17.3.2. Restricciones en asociaciones ............................................................................................................. 620 17.3.3. Asociación cualificada......................................................................................................................... 620 17.3.4. Asociaciones reflexivas ....................................................................................................................... 620 17.3.5. Diagrama de objetos............................................................................................................................ 621 17.3.6. Clases de asociación............................................................................................................................ 621 17.3.7. Restricciones en asociaciones ............................................................................................................. 625 17.4. Agregación......................................................................................................................................................... 626 17.4.1 Composición........................................................................................................................................ 628 17.5. Jerarquía de clases: generalización y especialización....................................................................................... 629 17.5.1. Jerarquías de generalización/especialización...................................................................................... 631 17.6. Herencia: clases derivadas................................................................................................................................. 634 17.6.1. Herencia simple................................................................................................................................... 634 17.6.2. Herencia múltiple ................................................................................................................................ 635 17.6.3. Niveles de herencia ............................................................................................................................ 636 17.6.4. Declaración de una clase derivada ...................................................................................................... 638 17.6.5. Consideraciones de diseño .................................................................................................................. 639 17.7. Accesibilidad y visibilidad en herencia............................................................................................................. 640 17.7.1. Herencia pública.................................................................................................................................. 640 Contenido xiii
  • 16. 17.7.2. Herencia privada.................................................................................................................................. 640 17.7.3. Herencia protegida............................................................................................................................... 641 17.8. Un caso de estudio especial: herencia múltiple................................................................................................. 642 17.8.1. Características de la herencia múltiple................................................................................................ 644 17.9. Clases abstractas................................................................................................................................................ 645 17.9.1. Operaciones abstractasÍA DE LA PROGRAMACIÓN Y DESARROLLO DE SOFTWARE ................. 649 Capítulo 18. Resolución de problemas y desarrollo de software: Metodología de la programación .................................. 653 INTRODUCCIÓN......................................................................................................................................................... 653 18.1. Abstracción y resolución de problemas........................................................................................................... 654 18.1.1. Descomposición procedimental......................................................................................................... 654 18.1.2. Diseño descendente ........................................................................................................................... 655 18.1.3. Abstracción procedimental................................................................................................................ 656 18.1.4. Abstracción de datos.......................................................................................................................... 656 18.1.5. Ocultación de la información ............................................................................................................ 657 18.1.6. Programación orientada a objetos ..................................................................................................... 657 18.1.7. Diseño orientado a objetos ................................................................................................................ 657 18.2. El ciclo de vida del software ........................................................................................................................... 658 18.2.1. El ciclo de vida del software tradicional (modelo en cascada) ........................................................ 658 18.2.2. El proceso unificado.......................................................................................................................... 660 18.2.3. Cliente, desarrollador y usuario......................................................................................................... 661 18.3. Fase de análisis: requisitos y especificaciones ................................................................................................ 662 18.4. Diseño .............................................................................................................................................................. 664 18.5. Implementación (codificación)........................................................................................................................ 666 18.6. Pruebas e integración....................................................................................................................................... 666 18.6.1. Verificación........................................................................................................................................ 667 18.6.2. Técnicas de pruebas........................................................................................................................... 667 18.7. Mantenimiento................................................................................................................................................. 669 18.7.1. La obsolescencia: programas obsoletos ............................................................................................ 669 18.7.2. Iteración y evolución del software .................................................................................................... 669 18.8. Principios de diseño de sistemas de software.................................................................................................. 670 18.8.1. Modularidad mediante diseño descendente....................................................................................... 670 18.8.2. Abstracción y encapsulamiento......................................................................................................... 671 18.8.3. Modificabilidad.................................................................................................................................. 671 18.8.4. Comprensibilidad y fiabilidad ........................................................................................................... 672 18.8.5. Interfaces de usuario.......................................................................................................................... 672 18.8.6. Programación segura contra fallos .................................................................................................... 673 18.8.7. Facilidad de uso................................................................................................................................. 673 18.8.8. Eficiencia ........................................................................................................................................... 674 18.8.9. Estilo de programación, documentación y depuración ..................................................................... 674 18.9. Estilo de programación.................................................................................................................................... 674 18.9.1. Modularizar un programa en subprogramas...................................................................................... 674 18.9.2. Evitar variables globales en subprogramas ....................................................................................... 675 18.9.3. Usar nombres significativos para identificadores.............................................................................. 675 18.9.4. Definir constantes con nombres ........................................................................................................ 676 18.9.5. Evitar el uso de ir (goto) .................................................................................................................. 676 18.9.6. Uso adecuado de parámetros valor/variable...................................................................................... 676 18.9.7. Uso adecuado de funciones............................................................................................................... 677 18.9.8. Tratamiento de errores....................................................................................................................... 677 18.9.9. Legibilidad......................................................................................................................................... 677 18.10. La documentación............................................................................................................................................ 678 18.10.1. Manual del usuario .......................................................................................................................... 679 xiv Contenido
  • 17. 18.10.2. Manual de mantenimiento (documentación para programadores).................................................. 680 18.10.3. Reglas de documentación ................................................................................................................ 681 18.11. Depuración....................................................................................................................................................... 681 18.11.1. Localización y reparación de errores............................................................................................... 681 18.11.2. Depuración de sentencias si-entonces-sino ..................................................................................... 682 18.11.3. Los equipos de programación.......................................................................................................... 683 18.12. Diseño de algoritmos....................................................................................................................................... 683 18.13. Pruebas (testing) .............................................................................................................................................. 684 18.13.1. Errores de sintaxis (de compilación) ............................................................................................... 685 18.13.2. Errores en tiempo de ejecución ....................................................................................................... 685 18.13.3. Errores lógicos................................................................................................................................. 686 18.13.4. El depurador..................................................................................................................................... 686 18.14. Eficiencia ......................................................................................................................................................... 687 18.14.1. Eficiencia versus legibilidad (claridad) ........................................................................................... 689 18.15. Transportabilidad ............................................................................................................................................. 689 CONCEPTOS CLAVE.................................................................................................................................................. 689 RESUMEN.................................................................................................................................................................... 690 APÉNDICES......................................................................................................................................................... 689 Apéndice A. Especificaciones del lenguaje algorítmico UPSAM 2.0.................................................................................. 691 Apéndice B. Prioridad de operadores................................................................................................................................... 713 Apéndice C. Código ASCII y Unicode................................................................................................................................. 717 Apéndice D. Guía de sintaxis del lenguaje C ....................................................................................................................... 723 Bibliografía y recursos de programación ............................................................................................................................ 751 Contenido xv
  • 19. Prefacio a la cuarta edición La informática y las ciencias de la computación en los primeros años del siglo xxi vienen marcadas por los avan- ces tecnológicos de la pasada década. Los más de veinte años de vida de la computadora personal (PC) y los más de cincuenta años de la informática/computación tradicional vienen acompañados de cambios rápidos y evolutivos en las disciplinas clásicas. El rápido crecimiento del mundo de las redes y, en consecuencia, la World Wide Web hacen revolucionarios a estos cambios y afectan al cuerpo de conocimiento de los procesos educativos y profesio- nales. Así, como declara ACM en su informe final (15 de diciembre de 2001) CC2001 Computer Science, la formación en carreras de informática, ciencias de la computación o ingeniería de sistemas deberá prestar especial importancia a temas tales como: • Algoritmos y estructuras de datos. • La World Wide Web y sus aplicaciones. • Las tecnologías de red y en especial aquellas basadas en TCP/IP. • Gráficos y multimedia. • Sistemas empotrados. • Bases de datos relacionales. • Inteoperabilidad. • Programación orientada a objetos. • Interacción Persona-Máquina. • … ACM, velando porque sus miembros —al fin y al cabo, representantes de la comunidad informática mundial— si- gan los progresos científicos y, en consecuencia, culturales y sociales derivados de las innovaciones tecnológicas, ha trabajado durante muchos años en un nuevo modelo curricular de la carrera de ingeniero informático o ingeniero de sistemas (computer sciences) y a finales del 2001 publicó su anteproyecto de currículo profesional (informe CC2001). El cuerpo de conocimiento incluido en este informe contempla una estructura con 14 grupos de conocimiento que van desde las Estructuras Discretas a la Ingeniería de Software pasando por Fundamentos de Programación (Progra- mming Fundamentals, PF). En nuestro caso, y para reconocimiento de las citadas palabras, nos cabe el honor de que nuestra obra, que ha cumplido recientemente VEINTE AÑOS DE VIDA, tenga el mismo título en español (Funda- mentos de Programación, Programming Fundamentals) que uno de los 14 grupos de conocimiento ahora reco- mendados como disciplina fundamental por la ACM dentro de su currículo de Computer Science. Así, en el citado currículo se incluyen descriptores tales como: construcciones de programación fundamentales, algoritmos y resolu- ción de problemas, estructuras de datos fundamentales y recursividad o recursión. También los planes de estudios de ingeniería informática en España (superior y técnicas de sistemas o de gestión) y de otras ingenierías (telecomunicaciones, industriales, etc.) y de ingeniería de sistemas en Latinoamérica, incluyen asignaturas tales como Metodología de la Programación, Fundamentos de Programación o Introducción a la Pro- gramación. Del estudio comparado de las citadas recomendaciones curriculares, así como de planes de estudios conocidos de carreras de ingeniería de sistemas y licenciaturas en informática de universidades latinoamericanas, hemos llega- do a la consideración de que la iniciación de un estudiante de ingeniería informática o de ingeniería de sistemas en las técnicas de programación del siglo xxi requiere no sólo del aprendizaje clásico del diseño de algoritmos y de la comprensión de las técnicas orientadas a objetos, sino un método de transición hacia tecnologías de Internet. Por
  • 20. otra parte, un libro dirigido a los primeros cursos de introducción a la programación exige no sólo la elección de un lenguaje de programación adecuado si no, y sobre todo, «proporcionar al lector las herramientas para desarrollar programas correctos, eficientes, bien estructurados y con estilo, que sirvan de base para la construcción de unos fun- damentos teóricos y prácticos que le permitan continuar con éxito sus estudios de los cursos superiores de su carrera, así como su futura especialización en ciencias e ingeniería». En consecuencia y de modo global, la obra pretende enseñar técnicas de análisis, diseño y construcción de algoritmos, estructuras de datos y objetos, así como reglas para la escritura de programas, eficientes tanto estructurados, fundamentalmente, como orientados a objetos. De modo complementario, y no por ello menos importante, se busca también enseñar al alumno técnicas de abstrac- ción que le permitan resolver los problemas de programación del modo más sencillo y racional pensando no sólo en el aprendizaje de reglas de sintaxis y construcción de programas, sino, y sobre todo, aprender a pensar para conseguir la resolución del problema en cuestión de forma clara, eficaz y fácil de implementar en un lenguaje de programación y su ejecución posterior en una computadora u ordenador. OBJETIVOS DEL LIBRO El libro pretende enseñar a programar utilizando conceptos fundamentales, tales como: 1. Algoritmos (conjunto de instrucciones programadas para resolver una tarea específica). 2. Datos (una colección de datos que se proporcionan a los algoritmos que se han de ejecutar para encontrar una solución: los datos se organizarán en estructuras de datos). 3. Objetos (conjunto de datos y algoritmos que los manipulan, encapsulados en un tipo de dato conocido como objeto). 4. Clases (tipos de objetos con igual estado y comportamiento, o dicho de otro modo, los mismos atributos y operaciones). 5. Estructuras de datos (conjunto de organizaciones de datos para tratar y manipular eficazmente datos homo- géneos y heterogéneos). 6. Temas avanzados (recursividad, métodos avanzados de ordenación y búsqueda, relaciones entre clases, etc.). Los dos primeros aspectos, algoritmos y datos, han permanecido invariables a lo largo de la corta historia de la informática/computación, pero la interrelación entre ellos sí que ha variado y continuará haciéndolo. Esta interrelación se conoce como paradigma de programación. En el paradigma de programación procedimental (procedural o por procedimientos) un problema se modela di- rectamente mediante un conjunto de algoritmos. Por ejemplo, la nómina de una empresa o la gestión de ventas de un almacén se representan como una serie de funciones que manipulan datos. Los datos se almacenan separadamente y se accede a ellos o bien mediante una posición global o mediante parámetros en los procedimientos. Tres lenguajes de programación clásicos, FORTRAN, Pascal y C, han representado el arquetipo de la programación procedimental, también relacionada estrechamente y —normalmente— conocida como programación estructurada. La programa- ción con soporte en C y Pascal proporciona el paradigma procedimental tradicional con un énfasis en funciones, plantillas de funciones y algoritmos genéricos. En la década de los ochenta, el enfoque del diseño de programas se desplazó desde el paradigma procedimental al orientado a objetos apoyado en los tipos abstractos de datos (TAD). Desde entonces conviven los dos paradigmas. En el paradigma orientado a objetos un problema se modela un conjunto de abstracciones de datos (tipos de datos) conocidos como clases. Las clases contienen un conjunto de instancias o ejemplares de la misma que se denominan objetos, de modo que un programa actúa como un conjunto de objetos que se relacionan entre sí. La gran diferencia entre ambos paradigmas reside en el hecho de que los algoritmos asociados con cada clase se conocen como interfaz pública de la clase y los datos se almacenan privadamente dentro de cada objeto, de modo que el acceso a los datos está oculto al programa general y se gestionan a través de la interfaz. Así pues, en resumen, los objetivos fundamentales de esta obra son: aprendizaje y formación en algoritmos y programación estructurada, estructuras de datos y programación orientada a objetos. Evidentemente, la mejor forma de aprender a programar es con la ayuda de un lenguaje de programación. Apoyados en la experiencia de nuestras tres primeras ediciones y en los resultados conseguidos con nuestros alumnos y lectores, hemos seguido apostando por utilizar un lenguaje algorítmico —pseudolenguaje— que apoyado en un pseudocódigo (seudocódigo) en español nos permitiera enseñar al alumno las técnicas y reglas de programación y que su aprendizaje fuese rápido y gradual. Naturalmente, además del pseudocódigo hemos utilizado las otras herramientas de programación clásicas y probadas como los diagramas de flujo o los diagramas N-S. xviii Prefacio a la cuarta edición
  • 21. En esta cuarta edición hemos seguido utilizando el mismo lenguaje algorítmico al que ya se le añadió las cons- trucciones y estructuras necesarias para incorporar en sus especificaciones las técnicas orientadas a objetos. Así, hemos seguido utilizando nuestro lenguaje UPSAM inspirado en los lenguajes estructurados por excelencia, C, Pas- cal y FORTRAN, y le hemos añadido las propiedades de los lenguajes orientados a objetos tales como C++, Java y C#, en la mejor armonía posible y con unas especificaciones que hemos incluido en los Apéndices I a V del sitio de Internet del libro (www.mhe.es/joyanes), como ya hiciéramos también en las tres primeras ediciones. EL LIBRO COMO HERRAMIENTA DOCENTE En el contenido de la obra hemos tenido en cuenta no sólo las directrices de los planes de estudio españoles de in- geniería informática (antigua licenciatura en informática), ingeniería técnica en informática y licenciatura en ciencias de la computación, sino también de ingenierías, tales como industriales, telecomunicaciones, agrónomos o minas, o las más jóvenes, como ingeniería en geodesia, ingeniería química o ingeniería telemática. Nuestro conocimiento del mundo educativo latinoamericano nos ha llevado a pensar también en las carreras de ingeniería de sistemas compu- tacionales y las licenciaturas en informática y en sistemas de información, como se las conoce en Latinoamérica. El contenido del libro se ha escrito pensando en un posible desarrollo de dos cuatrimestres o semestres o en un año completo, y siguiendo los descriptores (temas centrales) recomendados en las directrices del Ministerio de Edu- cación y Ciencia español para los planes de estudio de Ingeniería en Informática, Ingeniería Técnica en Informá- tica e Ingeniería Técnica en Informática, y los planes de estudios de Ingeniería de sistemas y Licenciaturas en Informática con el objeto de poder ser utilizado también por los estudiantes de primeros semestres de estas carreras. Igualmente pretende seguir las directrices que contiene el Libro Blanco de Informática en España para la futura ca- rrera Grado en Ingeniería Informática adaptada al futuro Espacio Europeo de Educación Superior (Declaración de Bolonia). Desde el punto de vista de currículum, se pretende que el libro pueda servir para asignaturas tales como Introducción a la Programación, Fundamentos de Programación y Metodología de la Programación, y también, si el lector o el maestro/profesor lo consideran oportuno, para cursos de Introducción a Estructuras de Datos y/o a Programación Orientada a Objetos. No podíamos dejar de lado las recomendaciones de la más prestigiosa organización de informáticos del mundo, ACM, anteriormente citada. Se estudió en su momento los Curricula de Computer Science vigentes durante el largo periodo de elaboración de esta obra (68, 78 y 91), pero siguiendo la evolución del último curricula, por lo que tras su publicación el 15 de diciembre de 2001 del «Computing Curricula 2001 Computer Science» estudiamos el citado cu- rrículo y durante la escritura de nuestra tercera edición consideramos cómo introducir también sus directrices más destacadas; como lógicamente no se podía seguir todas las directrices de su cuerpo de conocimiento al pie de la letra, analizamos en profundidad las unidades más acordes con nuestros planes de estudios: Programming Fundamentals (PF), Algorithms and Complexity (AL) y Programming Languages (PL). Por suerte nuestra obra incorporaba la mayo- ría de los temas importantes recomendados en las tres citadas unidades de conocimiento, en gran medida de la unidad PF, y temas específicos de programación orientado a objetos y de análisis de algoritmos de las unidades PL y AL. El contenido del libro abarca los citados programas y comienza con la introducción a los algoritmos y a la pro- gramación, para llegar a estructuras de datos y programación orientada a objetos. Por esta circunstancia la estructura del curso no ha de ser secuencial en su totalidad sino que el profesor/maestro y el alumno/lector podrán estudiar sus materias en el orden que consideren más oportuno. Esta es la razón principal por la cual el libro se ha organizado en cuatro partes y en cuatro apéndices y ocho apéndices en Internet. Se trata de describir los dos paradigmas más populares en el mundo de la programación: el procedimental y el orientado a objetos. Los cursos de programación en sus niveles inicial y medio están evolucionando para aprovechar las ventajas de nuevas y futuras tendencias en ingeniería de software y en diseño de lenguajes de programación, es- pecíficamente diseño y programación orientada a objetos. Numerosas facultades y escuelas de ingenieros, junto con la nueva formación profesional (ciclos formativos de nivel superior) en España y en Latinoamérica, están introdu- ciendo a sus alumnos en la programación orientada a objetos, inmediatamente después del conocimiento de la pro- gramación estructurada, e incluso —en ocasiones antes—. Por esta razón, una metodología que se podría seguir sería impartir un curso de algoritmos e introducción a la programación (parte I) seguido de estructuras de datos (parte II) y luego seguir con un segundo nivel de programación avanzada y programacion orientada a objetos (partes II, III y IV) que constituyen las cuatro partes del libro. De modo complementario, si el alumno o el profesor/maestro lo desea se puede practicar con algún lenguaje de programación estructurado u orientado a objetos, ya que pensando en esa posibilidad se incluyen en la página web del libro, apéndices con guías de sintaxis de los lenguajes de programación más populares hoy día, C, C++, Java y C# e incluso se han mantenido resúmenes de guías de sintaxis de Pascal, FORTRAN y Modula-2. Prefacio a la cuarta edición xix
  • 22. Uno de los temas más debatidos en la educación en informática o en ciencias de la computación (Computer Sciences) es el rol de la programación en el currículo introductorio. A través de la historia de la disciplina —como fielmente reconoce en la introducción del Capítulo 7 relativo a cursos de introducción, ACM en su Computing Cu- rricula 2001 [ACM91]— la mayoría de los cursos de introducción a la informática se han centrado principalmente en el desarrollo de habilidades o destrezas de programación. La adopción de un curso de introducción a la progra- mación proviene de una serie de factores prácticos e históricos e incluyen los siguientes temas: • La programación es una técnica esencial que debe ser dominada por cualquier estudiante de informática. Su inserción en los primeros cursos de la carrera asegura que los estudiantes tengan la facilidad necesaria con la programación para cuando se matriculan en los cursos de nivel intermedio y avanzado. • La informática no se convirtió en una disciplina académica hasta después que la mayoría de las instituciones ha desarrollado un conjunto de cursos de programación introductorias que sirvan a una gran audiencia. • El modelo de aprendizaje en programación siguió desde el principio las tempranas recomendaciones del Currí- culo 68 [ACM68] que comenzaba con un curso denominado «Introducción a la Computación», en la que la abrumadora mayoría de los temas estaban relacionados con la programación. Con posterioridad, y en el currí- culum del 78 de la ACM [ACM78] definía a estos cursos como «Introducción a la Programación» y se les denominó CS1 y CS2; hoy día se le sigue denominando así por la mayoría de los profesores y universidades que seguimos criterios emanados de la ACM. La fluidez en un lenguaje de programación es prerrequisito para el estudio de las ciencias de la computación. Ya en 1991 el informe CC1991 de la ACM reconocía la exigencia del conocimiento de un lenguaje de programación. • Los programas de informática deben enseñar a los estudiantes cómo usar al menos bien un lenguaje de progra- mación. Además, recomendamos que los programas en informática deben enseñar a los estudiantes a ser com- petentes en lenguajes y que hagan uso de al menos dos paradigmas de programación. Como consecuencia de estas ideas, el currículo 2001 de la ACM contempla la necesidad de conceptos y habilidades que son funda- mentales en la práctica de la programación con independencia del paradigma subyacente. Como resultado de este pensamiento, el área de Fundamentos de Programación incluye unidades sobre conceptos de programación, estructuras de datos básicas y procesos algorítmicos. Además de estas unidades fundamentales se requieren conceptos básicos pertenecientes a otras áreas, como son Lenguajes de Programación (PL, Programming Lan- guages) y de Ingeniería de Software (SE, Software Engineering). Los temas fundamentales que considera el currículo 2001 son: • construcciones fundamentales de programación, • algoritmos y resolución de problemas, • estructuras de datos fundamentales, • recursión o recursividad, • programación controlada por eventos, de otras áreas, Lenguajes de Programación (PL), destacar: • revisión de lenguajes de programación, • declaraciones y tipos, • mecanismos de abstracción, • programación orientada a objetos, y de Ingeniería de Software (SE): • diseño de software, • herramientas y entornos de software, • requisitos y especificaciones de software. Este libro se ha escrito pensando en que pudiera servir de referencia y guía de estudio para un primer curso de introducción a la programación, con una segunda parte que, a su vez, sirviera como continuación y para un posible segundo curso, de estructuras de datos y programación orientada a objetos. El objetivo final que busca es, no sólo xx Prefacio a la cuarta edición
  • 23. describir la sintaxis de un lenguaje de programación, sino, y sobre todo, mostrar las características más sobresalien- tes del lenguaje algorítmico y a la vez enseñar técnicas de programación estructurada y orientada a objetos. Así pues, los objetivos fundamentales son: • Énfasis fuerte en el análisis, construcción y diseño de programas. • Un medio de resolución de problemas mediante técnicas de programación. • Una introducción a la informática y a las ciencias de la computación usando una herramienta de programación denominada pseudocódigo. • Aprendizaje de técnicas de construcción de programas estructurados y una iniciación a los programas orientados a objetos. Así se tratará de enseñar las técnicas clásicas y avanzadas de programación estructurada, junto con técnicas orientadas a objetos. La programación orientada a objetos no es la panacea universal de un programador del siglo xxi, pero le ayudará a realizar tareas que, de otra manera, serían complejas y tediosas. El contenido del libro trata de proporcionar soporte a un año académico completo (dos semestres o cuatrimestres), alrededor de 24 a 32 semanas, dependiendo lógicamente de su calendario y planificación. Los diez primeros capítu- los pueden comprender el primer semestre y los restantes capítulos pueden impartirse en el segundo semestre. Lógi- camente la secuencia y planificación real dependerá del maestro o profesor que marcará y señalará semana a semana la progresión que él considera lógica. Si usted es un estudiante autodidacta, su propia progresión vendrá marcada por las horas que dedique al estudio y al aprendizaje con la computadora, aunque no debe variar mucho del ritmo citado al principio de este párrafo. EL LENGUAJE ALGORÍTMICO DE PROGRAMACIÓN UPSAM 2.0 Los cursos de introducción a la programación se apoyan siempre en un lenguaje de programación o en un pseudo- lenguaje sustentado sobre un pseudocódigo. En nuestro caso optamos por esta segunda opción: el pseudolenguaje con la herramienta del pseudocódigo en español o castellano. Desde la aparición de la primera edición, allá por fina- les de los años ochenta, apostamos fundamentalmente por el pseudocódigo para que junto con los diagramas de flujo y diagramas N-S nos ayudara a explicar técnicas de programación a nuestros alumnos. Con ocasión de la publicación de la segunda edición (año 1996) no sólo seguimos apostando otra vez, y fundamentalmente, por el pseudocódigo sino que juntamos los trabajos de todos los profesores del antiguo Departamento de Lenguajes y Sistemas Informá- ticos e Ingeniería de Software de la Facultad de Informática y Escuela Universitaria de Informática de la Universidad Pontificia de Salamanca en el campus de Madrid y le dimos forma a la versión 1.0 del lenguaje UPSAM1 . La versión 1.0 de UPSAM se apoyaba fundamentalmente en los lenguajes de programación Pascal (Turbo Pascal) y C, con referencias a FORTRAN, COBOL y BASIC, y algunas ideas del lenguaje C++ que comenzaba ya a ser un estándar en el mundo de la programación. Java nació en 1995 mientras el libro estaba en imprenta, aunque la edición de nuestra obra se publicó en 1996. Por ello el lenguaje algorítmico sólo contenía reglas de sintaxis y técnicas de programación estructurada. Sin embargo, en la segunda mitad de los noventa, C++ se acabó por imponer como es- tándar en el mundo de la programación, y Java iba asentándose como lenguaje de programación para la Web e Inter- net, por lo que la nueva especificación algorítmica debería contemplar estos lenguajes emergentes, consolidado en el caso de C++. En los primeros años del siglo XXI, Java se terminó de implantar como lenguaje universal de Internet y también como lenguaje estándar para el aprendizaje de programación de computadoras; pero además, y sobre todo, para cur- sos de programación orientada a objetos y estructuras de datos. De igual modo, C#, el lenguaje creado y presentado por Microsoft a comienzos del año 2000, como competidor de Java y extensión de C/C++, también ha pasado a ser una realidad del mundo de construcción de software y aunque no ha tenido tanta aceptación en el mundo del apren- dizaje educativo de la programación, sí se ha implantado como lenguaje de desarrollo principalmente para plataformas .Net. Por todo ello, la versión 2.0 del lenguaje algorítmico UPSAM que presentamos ya en la tercera edición de esta obra, se apoyó fundamentalmente en C y C++, así como en Java y C#, aunque hemos intentado no olvidar sus viejos orígenes apoyados en Pascal y Turbo Pascal, y algo menos en FORTRAN y COBOL. Así pues, la versión 2.0 del lenguaje UPSAM presentada en 2003 y hoy revisada con la actualización 2.1, se apoyaba en los quince años de vida (originalmente dicha versión se conocía como UPS; hoy hace ya veinte años) y 1 En los prólogos de la segunda y tercera edición, se referencian los nombres de todos los profesores que intervinimos en la redacción de la especificación de la versión 1.0 y 2.0 y, por consiguiente, figuran como autores de dicha especificación. Prefacio a la cuarta edición xxi
  • 24. se construyó como mejora de la versión 1.0 presentada en la primera y segunda edición de esta obra. Para completar la versión algorítmica, en el Apéndice D, se incluye una guía rápida de referencia del lenguaje C, “padre de todos los lenguajes modernos”, y en el portal del libro (www.mhe.es/joyanes) se incluyen guías de todos los lenguajes de programación considerados en la especificación UPSAM 2.1. En la versión 2.0 trabajamos todos los profesores, de aquel entonces, del área de programación de la Universidad Pontificia de Salamanca en el campus de Madrid, pero de un modo muy especial los profesores compiladores de to- das las propuestas de nuestros compañeros, además del autor de esta obra. Especialmente quiero destacar a los pro- fesores Luis Rodríguez Baena, Víctor Martín García, Lucas Sánchez García, Ignacio Zahonero Martínez y Matilde Fernández Azuela. Cabe destacar también la gran contribución y revisión de la versión 2.0 del profesor Joaquín Abeger, y restantes compañeros del entonces departamento de Lenguajes y Sistemas Informáticos e Ingenie- ría de Software de la Facultad de Informática y Escuela Universitaria de Informática de la Universidad Pontificia de Salamanca en el campus de Madrid, cuyas aportaciones han sido fundamentales para que la versión 2.0 viera la luz. Deseo resaltar de modo muy especial la gran aportación práctica y de investigación a todas las versiones de UP- SAM realizada por los profesores de Procesadores de Lenguajes (Compiladores), María Luisa Díez Plata y Enrique Torres Franco, que durante numerosos cursos académicos han implementado partes del lenguaje en un traductor, en las prácticas y proyectos de compiladores diseñados por y para los alumnos de la citada asignatura de cuarto curso (séptimo y octavo semestre), en algunos casos funcionando con prototipos. De igual forma, deseo expresar mi agra- decimiento a la profesora de la Universidad de Alicante, Rosana Latorre Cuerda, que no sólo ha apoyado conti- nuamente esta obra sino que además ha utilizado el lenguaje algorítmico UPSAM en sus clases de compiladores y de programación. Muchos —innumerables diría yo— son los profesores, colegas, y sin embargo amigos, que me han apoyado, re- visado y dado ideas para mejorar las sucesivas ediciones del lenguaje algorímico. Es imposible enumerarlos a todos aquí —y asumo el enorme riesgo de haber olvidado a muchos, a los que ya pido y presento mis disculpas— por lo que trataré de enumerar al menos a aquellos que me vienen a la memoria en este instante —que los duendes de las imprentas me exigen sea ya— y reitero mis disculpas a todos los que ahora no figuran (y trataré de que estén en el sitio oficial del libro y en próximas ediciones). Gracias infinitas a todos: María Eugenia Valesani (Universidad Na- cional del Nordeste, Argentina), Héctor Castán Rodríguez (Universidad Pontificia de Salamanca, campus de Madrid), Vidal Alonso Secades, Alfonso López Rivero y Miguel Ángel Sánchez Vidales (Universidad Pontificia de Salamanca, campus de Salamanca), David La Red (Universidad Nacional del Nordeste, Argentina), Óscar Sanjuán Martínez y Juan Manuel Cueva Lovelle (Universidad de Oviedo), Darwin Muñoz (Unibe, República Dominicana), Ricardo Mo- reno (Universidad Tecnológica de Pereira, Colombia), Miguel Cid (INTEC, República Dominicana), Julio Perrier (Universidad Autónoma de Santo Domingo, República Dominicana), Quinta Ana Pérez (ITLA, República Dominica- na), Jorge Torres (Tecnológico de Monterrey, campus de Querétaro, México), Augusto Bernuy (UTP, Lima, Perú), Juan José Moreno (Universidad Católica de Uruguay), Manuel Pérez Cota (Universidad de Vigo), Ruben González (Universidad Pontificia de Salamanca, campus de Madrid), José Rafael García-Bermejo Giner (Universidad de Sala- manca), Víctor Hugo Medina García y Giovanni Tarazona (Universidad Distrital, Bogotá, Colombia), Luz Mayela Ramírez y mi querido Jota Jota (Universidad Católica de Colombia), Alveiro (de la Universidad Cooperativa de Co- lombia), Marcelo (de la Universidad de Caldas), Sergio Ríos (Universidad Pontificia de Salamanca, campus de Sala- manca), Rosana Latorre Cuerda (Universidad de Salamanca)... bueno, son tantos que necesitaría quizá un tiempo infinito para nombrarlos a todos. A los ausentes, mis disculpas; y a todos, gracias: esta obra es, en gran parte, vuestra, con todas vuestras ayudas, críticas, apoyos y con todo cuanto el corazón pueda hablar. Espero que la versión 2.1, la actual, y la futura, 3.0, sean capaces de recoger todo el trabajo de nuestro grupo de investigación y de todos los profesores de universidades amigas. CARACTERÍSTICAS IMPORTANTES DEL LIBRO Fundamentos de programación, cuarta edición, utiliza en cada capítulo los siguientes elementos clave para conseguir obtener el mayor rendimiento del material incluido: • Objetivos. Enumera los conceptos y técnicas que el lector y los estudiantes aprenderán en el capítulo. Su lec- tura ayudará a los estudiantes a determinar si se han cumplido estos objetivos después de terminar el capítulo. • Contenido. Índice completo del capítulo que facilita la lectura y la correcta progresión en la lectura y com- prensión de los diferentes temas que se exponen posteriormente. • Introducción. Abre el capítulo con una breve revisión de los puntos y objetivos más importantes que se trata- rán y todo aquello que se puede esperar del mismo. xxii Prefacio a la cuarta edición
  • 25. • Descripción del capítulo. Explicación usual de los apartados correspondientes del capítulo. En cada capítulo se incluyen ejemplos y ejercicios resueltos. Los listados de los programas completos o parciales se escriben en letra “courier” con la finalidad principal de que puedan ser identificados fácilmente por el lector. Todos ellos han sido probados para facilitar la práctica del lector/alumno. • Conceptos clave. Enumera los términos de computación, informáticos y de programación (terminología) más notables que se han descrito o tratado en el capítulo. • Resumen del capítulo. Revisa los temas importantes que los estudiantes y lectores deben comprender y recor- dar. Busca también ayudar a reforzar los conceptos clave que se han aprendido en el capítulo. • Ejercicios. Al final de cada capítulo se proporciona a los lectores una lista de ejercicios sencillos de modo que le sirvan de oportunidad para que puedan medir el avance experimentado mientras leen y siguen —en su caso— las explicaciones del profesor relativas al capítulo. • Problemas. En muchos capítulos se incluyen enunciados de problemas propuestos para realizar por el alumno y que presentan una mayor dificultad que los ejercicios antes planteados. Se suelen incluir una serie de activi- dades y proyectos de programación que se le proponen al lector como tarea complementaria de los ejercicios. A lo largo de todo el libro se incluyen una serie de recuadros —sombreados o no— que ofrecen al lector conse- jos, advertencias y reglas de uso del lenguaje y de técnicas de programación, con la finalidad de que puedan ir asi- milando conceptos prácticos de interés que les ayuden en el aprendizaje y construcción de programas eficientes y de fácil lectura. • Recuadro. Conceptos importantes que el lector debe considerar durante el desarrollo del capítulo. • Consejo. Ideas, sugerencias, recomendaciones... al lector, con el objetivo de obtener el mayor rendimiento posible del lenguaje y de la programación. • Precaución. Advertencia al lector para que tenga cuidado al hacer uso de los conceptos incluidos en el recuadro adjunto. • Nota. Normas o ideas que el lector debe seguir preferentemente en el diseño y construcción de sus programas. ORGANIZACIÓN DEL LIBRO El libro se ha dividido en cuatro partes a efectos de organización para su lectura y estudio gradual. Dado que el co- nocimiento es acumulativo, se comienza en los primeros capítulos con conceptos conceptuales y prácticos, y se avan- za de modo progresivo hasta llegar a las técnicas avanzadas y a una introducción a la ingeniería de software que intentan preparar al lector/estudiante para sus estudios posteriores. Como complemento y ayuda al lector durante sus estudios y para su posterior formación profesional, se han incluido una gran cantidad de apéndices que incluyen fun- damentalmente guías de sintaxis de los lenguajes de programación más populares con el objetivo de facilitar la im- plementación de los algoritmos en el lenguaje de programación elegido para «dialogar» con la computadora. Así mismo, y para ayudar a la preparación del aprendizaje, lecturas y estudios futuros, se ha incluido una amplia guía de recursos de programación (libros, revistas y sitios Web «URLs») que hemos consultado en la elaboración de nuestra obra y seguimos consultando también en nuestra vida profesional. PARTE I. ALGORITMOS Y HERRAMIENTAS DE PROGRAMACIÓN Esta parte es un primer curso de programación para alumnos principiantes en asignaturas de introducción a la pro- gramación en lenguajes estructurados y sirve tanto para cursos introductorios de carácter semestral, tales como In- troducción a la Programación, Metodología de la Programación o Fundamentos de programación, en primeros cursos de carreras de ingeniería informática, ingeniería de sistemas y licenciatura en informática o en sistemas de información, y asignaturas de programación de ingeniería y de ciencias. Contiene esta parte los fundamentos teóricos y prácticos relativos a la organización de una computadora y los lenguajes de programación, así como la descripción de las herramientas de programación más frecuentemente utilizadas en el campo de la programación. Se incluyen también en esta parte los elementos básicos constitutivos de un programa y las herramientas de programación utili- zadas, tales como algoritmos, diagramas de flujo, etc. La segunda mitad de esta primera parte es una descripción teórico-práctica de las estructuras utilizadas para controlar el flujo de instrucciones de un programa y una descripción detallada del importante concepto de subprograma (procedimiento/función), piedra angular de la programación mo- dular y estructurada. Prefacio a la cuarta edición xxiii
  • 26. Capítulo 1. Introducción a las computadoras y los lenguajes de programación. Las computadoras son herramien- tas esenciales en muchas áreas de la vida: profesional, industrial, empresarial, académica,... en realidad, en casi todos los campos de la sociedad. Las computadoras funcionan correctamente con la ayuda de los programas. Los programas se escriben mediante lenguajes de programación que previamente se han escrito en algoritmos u otras herramientas, tales como diagramas de flujo. Este capítulo introductorio describe la organización de una computadora y sus dife- rentes partes junto con el concepto de programa y de lenguaje de programación. Así mismo y al objeto de que el lector pueda entender los fundamentos teóricos en que se asienta la programación, se incluye una breve historia de los lenguajes de programación más influyentes y que, en el caso de la tercera edición, han servido de inspiración para la nueva versión del pseudocódigo UPSAM 2.0: es decir, C, C++, Java y C#, con referencias lógicas al histórico Pascal. Capítulo 2. Metodología de la programación y desarrollo de software. En este capítulo se describen métodos para la resolución de problemas con computadora y con un lenguaje de programación (en nuestro caso el pseudolen- guaje o lenguaje algorítmico UPSAM 2.0). Se explican las fases de la resolución de un problema junto con las técnicas de programación modular y estructurada. Se inicia en este capítulo la descripción del concepto, función y uso de algoritmo. Uno de los objetivos más importantes de este libro es el aprendizaje, diseño y construcción de algoritmos. Capítulo 3. Estructura general de un programa. Enseña la organización y estructura general de un programa así como su creación y proceso de ejecución. Se describen los elementos básicos de un programa: tipos de datos, cons- tantes, variables y entradas/salidas de datos. También se introduce al lector en la operación de asignación así como en el concepto de función interna. De igual forma se estudian los importantes conceptos de expresiones y operaciones junto con sus diferentes tipos. Capítulo 4. Flujo de control I: Estructuras selectivas. Introduce al concepto de estructura de control y, en particu- lar, estructuras de selección, tales como si-entonces ("if-then"), según_sea/caso_de ("switch/case"). Se describen también las estructuras de decisión anidadas. Así mismo se explica también la «denostada» sentencia ir_a (goto), cuyo uso no se recomienda pero sí el conocimiento de su funcionamiento, Capítulo 5. Flujo de control II: Estructuras repetitivas. El capítulo introduce las estructuras repetitivas (mientras ("while"), hacer-mientras ("do-while"), repetir ("repeat"), desde/para ("for")). Examina la re- petición (iteración) de sentencias en detalle y compara los bucles controlados por centinela, bandera, etc. Explica precauciones y reglas de uso de diseño de bucles. Compara los tres diferentes tipos de bucles, así como el concepto de bucles anidados. Capítulo 6. Subprogramas (subalgoritmos): Funciones. La resolución de problemas complejos se facilita con- siderablemente si se divide en problemas más pequeños (subproblemas). La resolución de estos problemas se realiza con subalgoritmos (subprogramas) que a su vez se dividen en dos grandes categorías: funciones y proce- dimientos. PARTE II. ESTRUCTURA DE DATOS Esta parte es clave en el aprendizaje de técnicas de programación. Tal es su importancia que los planes de estudio de cualquier carrera de ingeniería informática o de ciencias de la computación incluye una asignatura troncal denomi- nada Estructura de datos. Capítulo 7. Estructuras de datos I (arrays y estructuras). Examina la estructuración de los datos en arrays o grupos de elementos dato del mismo tipo. El capítulo presenta numerosos ejemplos de arrays de uno, dos o múltiples índices. También se explican los otros tipos de estructuras de datos básicas: estructuras y registros. Estas estructuras de datos permiten encapsular en un tipo de dato definido por el usuario otros datos heterogéneos. Así mismo se describe el concepto de arrays de estructuras y arrays de registros. Capítulo 8. Las cadenas de caracteres. Se examina el concepto de carácter y de cadena (String) junto con su declaración e inicialización. Se introducen conceptos básicos de manipulación de cadenas: lectura y asignación jun- to con operaciones básicas, tales como longitud, concatenación, comparación, conversión y búsqueda de caracteres y cadenas. Las operaciones de tratamiento de caracteres y cadenas son operaciones muy usuales en todo tipo de pro- gramas. xxiv Prefacio a la cuarta edición
  • 27. Capítulo 9. Archivos (ficheros). El concepto de archivo junto con su definición e implementación es motivo de es- tudio en este capítulo. Los tipos de archivos más usuales junto con las operaciones básicas de manipulación se estu- dian con detenimiento. Capítulo 10. Ordenación, búsqueda e intercalación. Las computadoras emplean una gran parte de su tiempo en operaciones de búsqueda, clasificación y mezcla de datos. Los archivos se sitúan adecuadamente en dispositivos de almacenamiento externo que son más lentos que la memoria central pero que, por el contrario, tienen la ventaja de almacenamiento permanente después de apagar la computadora. Se describen los algoritmos de los métodos más utilizados en el diseño e implementación de programas. Capítulo 11. Ordenación, búsqueda y fusión externa (archivos). Normalmente los datos almacenados de modo permanente en dispositivos externos requieren para su procesamiento el almacenamiento en la memoria central. Por esta circunstancia, las técnicas de ordenación y búsqueda sobre arrays y vectores comentados en el capítulo anterior necesitan una profundización en cuanto a técnicas y métodos. Una de las técnicas más importantes es la fusión o mezcla. En el capítulo se describen las técnicas de manipulación externa de archivos. Capítulo 12. Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas). Una lista enlazada es una estructura de datos que mantiene una colección de elementos, pero el número de ellos no se conoce por anticipado o varía en un amplio rango. La lista enlazada se compone de elementos que contienen un valor y un puntero. El ca- pítulo describe los fundamentos teóricos y las operaciones que se pueden realizar en la lista enlazada. También se describen los distintos tipos de listas enlazadas, tales como doblemente enlazadas y circulares. Las ideas abstractas de pila y cola se describen en el capítulo. Pilas y colas se pueden implementar de diferentes maneras, bien con vec- tores (arrays) o con listas enlazadas. Capítulo 13. Estructuras de datos no lineales (árboles y grafos). Los árboles son otro tipo de estructura de datos dinámica y no lineal. Se estudian las operaciones básicas en los árboles junto con sus operaciones fundamentales. Capítulo 14. Recursividad. El importante concepto de recursividad (propiedad de una función de llamarse a sí mis- ma) se introduce en el capítulo junto con algoritmos complejos de ordenación y búsqueda en los que además se es- tudia su eficiencia. PARTE III. PROGRAMACIÓN ORIENTADA A OBJETOS Y UML 2.1. Nuestra experiencia en la enseñanza de la programación orientada a objetos a estudiantes universitarios data de fina- les de la década de los ochenta. En este largo periodo, los primitivos y básicos conceptos de orientación a objetos se siguen manteniendo desde el punto de vista conceptual y práctico, tal y como se definieron hace treinta años. Hoy la programación orientada a objetos es una clara realidad y por ello cualquier curso de introducción a la programación aconseja, al menos, incluir un pequeño curso de orientación a objetos que puede impartirse como un curso indepen- diente, como complemento de la Parte II o como parte de un curso completo de introducción a la programación que comienza en el Capítulo 1. Capítulo 15. Tipos abstractos de datos, objetos y modelado con UML 2.1. Este capítulo describe los conceptos fundamentales de la orientación a objetos: clases, objetos y herencia. La definición y declaración de una clase junto con su organización y estructura se explican detenidamente. Se describen también otros conceptos importantes, tales como polimorfismo, ligadura dinámica y sobrecarga y un resumen de la terminología orientada a objetos. Capítulo 16. Diseño de clases y objetos: representaciones gráficas en UML. Una de las tareas fundamentales de un programador es el diseño y posterior implementación de una clase y de un objeto en un lenguaje de programación. Para realizar esta tarea con eficiencia se exige el uso de una herramienta gráfica. UML es el lenguaje de modelado unificado estándar en el campo de la ingeniería de software y en el capítulo se describen las notaciones gráficas bá- sicas de clases y objetos. Capítulo 17. Relaciones entre clases: Delegaciones, asociaciones, agregaciones, herencia. En este capítulo se in- troducen los conceptos fundamentales de las relaciones entre clases: asociación, agregación y generalización/espe- cialización. Se describen todas estas relaciones así como las notaciones gráficas que las representan en el lenguaje de modelado UML. Prefacio a la cuarta edición xxv
  • 28. PARTE IV. METODOLOGÍA DE LA PROGRAMACIÓN Y DESARROLLO DE SOFTWARE En esta parte se describen reglas prácticas para la resolución de problemas mediante programación y a su posterior desarrollo de software. Estas reglas buscan proporcionar al lector reglas de puesta a punto de programas junto con directrices de metodología de programación que faciliten al lector la tarea de diseñar y construir programas con ca- lidad y eficiencia junto con una introducción a la ingeniería de software. Capítulo 18. Resolución de problemas y desarrollo de software: Metodología de la programación. En el capítulo se analiza el desarrollo de un programa y sus diferentes fases: análisis, diseño, codificación, depuración, pruebas y mantenimiento. Estos principios básicos configuran la ingeniería de software como ciencia que pretende la concep- ción, diseño y construcción de programas eficientes. APÉNDICES En todos los libros dedicados a la enseñanza y aprendizaje de técnicas de programación es frecuente incluir apéndi- ces de temas complementarios a los explicados en los capítulos anteriores. Estos apéndices sirven de guía y referen- cia de elementos importantes del lenguaje y de la programación de computadoras. Apéndice A. Especificaciones del lenguaje algorítmico UPSAM 2.0. Se describen los elementos básicos del lengua- je algorítmico en su versión 2.0 junto con la sintaxis de todos los componentes de un programa. Asímismo se espe- cifican las palabras reservadas y símbolos reservados. En relación con la versión 1.0 de UPSAM es de destacar una nueva guía de especificaciones de programación orientada a objetos, novedad en esta versión y que permitirá la tra- ducción del pseudocódigo a los lenguajes orientados a objetos tales como C++, Java o C#. Apéndice B. Prioridad de operadores. Tabla que contiene todos los operadores y el orden de prioridad y asociativi- dad en las operaciones cuando aparecen en expresiones. Apéndice C. Código ASCII y Unicode. Tablas de los códigos de caracteres que se utilizan en programas de compu- tadoras. El código ASCII es el más universal y empleado de modo masivo por programadores de todo el mundo y, naturalmente, es el que utilizan la mayoría de las computadoras actuales. Unicode es un lenguaje mucho más amplio que utilizan las computadoras personales para realizar programas y aplicaciones en cualquier tipo de computadora y en Internet. Unicode proporciona un número único para cada carácter, sin importar la plataforma, sin importar el programa, sin importar el idioma. La importancia de Unicode reside, entre otras cosas, en que está avalado por líde- res de la industria tales como Apple, HP, IBM, Microsoft, Oracle, Sun, entre otros. También es un requisito para los estándares modernos, tales como XML, Java, C#, etc. Apéndice D. Guía de sintaxis del lenguaje C. En este apéndice se hace una descripción de la sintaxis, gramática y especificaciones más importantes del lenguaje C. Bibliografía y recursos de programación: Libros, Revistas, Web, Compiladores. Enumeración de los libros más sobresalientes empleados por el autor en la escritura de esta obra, así como otras obras importantes de referencia que ayuden al lector que desee profundizar o ampliar aquellos conceptos que considere necesario conocer con más dete- nimiento. Listado de sitios Web de interés para la formación en Java, tanto profesionales como medios de comuni- cación, especialmente revistas especializadas. APÉNDICES EN EL SITIO WEB (www.mhe.es/joyanes) Apéndice I. Guía de sintaxis de Pascal y Turbo Pascal. Aunque ya está muy en desuso en la enseñanza de la pro- gramación el lenguaje Pascal, su sintaxis y estructura sigue siendo un modelo excelente de aprendizaje y es ésta la razón de seguir incluyendo esta guía de sintaxis en la obra. Apéndice II. Guía de sintaxis del lenguaje ANSI C. Especificaciones, normas de uso y reglas de sintaxis del len- guaje de programación C en su versión estándar ANSI/ISO. Apéndice III. Guía de sintaxis del lenguaje ANSI/ISO C++ estándar. Especificaciones, normas de uso y reglas de sintaxis del lenguaje de programación C++ en su versión estándar ANSI/ISO. xxvi Prefacio a la cuarta edición
  • 29. Apéndice IV. Guía de sintaxis del lenguaje Java 2. Descripción detallada de los elementos fundamentales del es- tándar Java: especificaciones, reglas de uso y de sintaxis. Apéndice V. Guía de sintaxis del lenguaje C#. Descripción detallada de los elementos fundamentales del lenguaje C#: especificaciones, reglas de uso y de sintaxis. Apéndice VI. Palabras reservadas: C++, Java y C#. Listados de palabras reservadas (clave) de los lenguajes de programación C++, Java y C#. Se incluye también una tabla comparativa de las palabras reservadas de los tres len- guajes de programación. Apéndice VII. Glosario de palabras reservadas de C/C++. Glosario terminológico de las palabras reservadas del lenguaje de programación C/C++ con una breve descripción y algunos ejemplos de uso de cada palabra. Apéndice VIII. Glosario de palabras reservadas de C#. Glosario terminológico de las palabras reservadas del len- guaje de programación C# con una breve descripción y algunos ejemplos de uso de cada palabra. AGRADECIMIENTOS Un libro nunca es fruto único del autor, sobre todo si el libro está concebido como libro de texto y autoaprendizaje, y pretende llegar a lectores y estudiantes de informática y de computación, y, en general, de ciencias e ingeniería, así como autodidactas en asignaturas tales como programación (introducción, fundamentos, avanzada, etc.). Esta obra no es una excepción a la regla y son muchas las personas que nos han ayudado a terminarla. En primer lugar deseo agradecer a mis colegas de la Universidad Pontificia de Salamanca en el campus de Madrid, y en particular del De- partamento de Lenguajes y Sistemas Informáticos e Ingeniería de Software de la misma que desde hace muchos años nos ayudan y colaboran en la impartición de las diferentes asignaturas del departamento y sobre todo en la elaboración de los programas y planes de estudio de las mismas. A todos ellos les agradezco públicamente su apoyo y ayuda. Esta cuarta edición ha sido leída y revisada con toda minuciosidad y —fundamentalmente— rigurosidad por los siguientes profesores de la Universidad Pontificia de Salamanca en el campus de Madrid: Matilde Fernández Azue- la, Lucas Sánchez García e Ignacio Zahonero Martínez (mi eterno agradecimiento). Como ya comenté anteriormente, muchos otros profesores españoles y latinoamericanos me han ayudado en la concepción y realización de esta obra y de otras muchas, de una u otra manera, apoyándome con su continua cola- boración y sugerencia de ideas para la puesta en marcha de asignaturas del área de programación, en temas tan va- riados como Fundamentos de Programación, Lenguajes de programación tales como BASIC, Visual Basic, Pascal, C, C++, Java o Delphi. Citar a todos ellos me llevaría páginas completas. Sí, al menos, y como reconocimiento si- lencioso, decir que además de España, se incluyen todos los países latinoamericanos desde México, Perú, Venezuela o Colombia a Argentina, Uruguay y Chile en el cono sur, pasando por Guatemala o República Dominicana en Cen- troamérica. En cualquier forma, sí quería destacar de modo especial a la profesora M.ª Eugenia Valesany de la Uni- versidad Nacional del Nordeste de Corrientes en Argentina, por la labor de rigurosa revisión que realizó sobre la segunda edición y la gran cantidad de sugerencias y propuestas que me ha hecho para esta nueva edición motivada fundamentalmente por su extraordinaria y valiosa investigación al mundo de los algoritmos y de la programación. A todos ellos y a todos nuestros lectores y alumnos de España y Latinoamérica, una vez más, nuestro agradeci- miento eterno. Además de a nuestros compañeros en la docencia y a nuestros alumnos, no puedo dejar de agradecer, una vez más, a mi editor —y sin embargo amigo— José Luis García Jurado, que inició y puso en marcha todo el proyecto de esta 4.ª edición, y también a mi nueva editora, Cristina Sánchez, que ha terminado dicho proyecto, las constantes muestras de afecto y comprensión que han tenido con mi obra. Esta ocasión, como no era menos, tampoco ha sido una excepción. Sin embargo, ahora he de resaltar esa gran amistad que nos une. La elaboración de esta obra por mil circunstancias ha entrañado, más que nunca, tal vez muchas más dificultades que otras obras nuestras. De nuevo y con gran paciencia, me han ayudado, comprendido y tolerado mis mil y una duda, sugerencias, retrasos, etc. No puedo por menos de expresar mi infinito reconocimiento y agradecimiento. Sin esta comprensión y su apoyo continuo posiblemente hoy todavía no habría visto la luz esta obra, debido a mis grandes retrasos en la entrega del original y posteriores revisiones de imprenta. Con el corazón en la mano, mi eterno agradecimiento. Pero en esta ocasión tam- bién deseo agradecer las muchas atenciones que mis editores de McGraw-Hill México dedican siempre a mis obras. Sus consejos, ideas y sugerencias siempre son un enorme aliciente y una ayuda inestimable. Sus consejos, ideas y sugerencias, unido a su gran paciencia y comprensión con el autor por sus muchos retrasos en la entrega de origina- les, han hecho que la obra haya sido mejorada considerablemente en el proceso de edición. Prefacio a la cuarta edición xxvii
  • 30. Naturalmente —y aunque ya los he citado anteriormente—, no puedo dejar de agradecer a nuestros numerosos alumnos, estudiantes y lectores, en general, españoles y latinoamericanos, que continuamente me aconsejan, critican y proporcionan ideas para mejoras continuas de mis obras. Sin todo lo que hemos aprendido, seguimos aprendiendo y seguiremos aprendiendo de ellos y sin su aliento continuo me sería prácticamente imposible terminar mis nuevas obras y, en especial, este libro. De modo muy especial deseo reiterar mi agradecimiento a tantos y tantos colegas de universidades españolas y latinoamericanas que apoyan nuestra labor docente y editorial. Mi más sincero reconoci- miento y agradecimiento, una vez más, a todos: alumnos, lectores, colegas, profesores, maestros, monitores y edito- res. Muy bien sé que siempre estaré en deuda con vosotros. Mi único consuelo es que vuestro apoyo me sigue dando fuerza en esta labor académica y que, allá por donde mis derroteros profesionales me llevan, siempre está presente ese inmenso e impagable agradecimiento a esa enorme ayuda que me prestáis. Gracias, una vez más, por vuestra ayuda. En Carchelejo (Jaén) y en Madrid, otoño de 2007. El autor xxviii Prefacio a la cuarta edición
  • 31. 1 Fundamentos de programación PARTE I Algoritmos y herramientas de programación CONTENIDO Capítulo 1. Introducción a las computadoras y los lenguajes de programación Capítulo 2. Metodología de la programación y desarrollo de software Capítulo 3. Estructura general de un programa Capítulo 4. Flujo de control I: Estructuras selectivas Capítulo 5. Flujo de control II: Estructuras repetitivas Capítulo 6. Subprogramas (subalgoritmos): Funciones
  • 33. CAPÍTULO 1 Introducción a las computadoras y los lenguajes de programación 1.1. ¿Qué es una computadora? 1.2. Organización física de una computadora 1.3. Representación de la información en las computadoras 1.4. Codificación de la información 1.5. Dispositivos de almacenamiento secundario (almacenamento masivo) 1.6. Conectores de dispositivos de E/S 1.7. Redes, Web y Web 2.0 1.8. El software (los programas) 1.9. Lenguajes de programación 1.10. Breve historia de los lenguajes de progra- mación RESUMEN Las computadoras (ordenadores) electrónicas moder- nas son uno de los productos más importantes del siglo XXI ya que se han convertido en un dispositivo esencial en la vida diaria de las personas, como un electrodoméstico más del hogar o de la oficina y han cambiado el modo de vivir y de hacer negocios. Cons- tituyen una herramienta esencial en muchas áreas: empresa, industria, gobierno, ciencia, educación..., en realidad en casi todos los campos de nuestras vidas. Son infinitas las aplicaciones que se pueden realizar con ellas: consultar el saldo de una cuenta corriente, retirar dinero de un banco, enviar o recibir mensajes por teléfonos celulares (móviles) que a su vez están conectados a potentes computadoras, escribir docu- mentos, navegar por Internet, enviar y recibir correos electrónicos (e-mail), etc. El papel de los programas de computadoras es fundamental; sin una lista de instrucciones a seguir, la computadora es virtualmente inútil. Los lenguajes de programación nos permiten escribir esos progra- mas y por consiguiente comunicarnos con las compu- tadoras. La principal razón para que las personas aprendan lenguajes y técnicas de programación es utilizar la computadora como una herramienta para resolver problemas. En el capítulo se introducen conceptos importantes tales como la organización de una computadora, el hardware, el software y sus componentes, y se intro- ducen los lenguajes de programación más populares C, C++, Java o C#. INTRODUCCIÓN
  • 34. 4 Fundamentos de programación 1.1. ¿QUÉ ES UNA COMPUTADORA? Las computadoras se construyen y se incluyen en todo tipo de dispositivos: automóviles (coches/carros), aviones, trenes, relojes, televisiones... A su vez estas máquinas pueden enviar, recibir, almacenar, procesar y visualizar infor- mación de todo tipo: números, texto, imágenes, gráficos, sonidos, etc. Estas potentes máquinas son dispositivos que realizan cálculos a velocidades increíbles (millones de operaciones de las computadoras personales hasta cientos de millones de operaciones de las supercomputadoras). La ejecución de una tarea determinada requiere una lista de ins- trucciones o un programa. Los programas se escriben normalmente en un lenguaje de programación específico, tal como C, para que pueda ser comprendido por la computadora. Una computadora1 es un dispositivo electrónico, utilizado para procesar información y obtener resultados, capaz de ejecutar cálculos y tomar decisiones a velocidades millones o cientos de millones más rápidas que puedan hacer- lo los seres humanos. En el sentido más simple una computadora es “un dispositivo” para realizar cálculos o com- putar. El término sistema de computadora o simplemente computadora se utiliza para enfatizar que, en realidad, son dos partes distintas: hardware y software. El hardware es la computadora en sí misma. El software es el conjunto de programas que indican a la computadora las tareas que debe realizar. Las computadoras procesan datos bajo el con- trol de un conjunto de instrucciones denominadas programas de computadora. Estos programas controlan y dirigen a la computadora para que realice un conjunto de acciones (instrucciones) especificadas por personas especializadas, llamadas programadores de computadoras. Los datos y la información se pueden introducir en la computadora por una entrada (input) y a continuación se procesan para producir una salida (output, resultados), como se observa en la Figura 1.1. La computadora se puede considerar como una unidad en la que se colocan ciertos datos (entrada de datos), se procesan y se produce un re- sultado (datos de salida o información). Los datos de entrada y los datos de salida pueden ser, realmente, de cualquier tipo: texto, dibujos, sonido, imágenes... El sistema más sencillo para comunicarse una persona con la computadora es mediante un teclado, una pantalla (monitor) y un ratón (mouse). Hoy día existen otros dispositivos muy populares tales como escáneres, micrófonos, altavoces, cámaras de vídeo, teléfonos inteligentes, agendas PDA, reproductores de música MP3, iPod, etc.; de igual manera, a través de módems, es posible conectar su computadora con otras com- putadoras a través de la red Internet. Como se ha dicho antes, los componentes físicos que constituyen la computadora, junto con los dispositivos que realizan las tareas de entrada y salida, se conocen con el término hardware o sistema físico. El programa se encuen- tra almacenado en su memoria; a la persona que escribe programas se llama programador y al conjunto de programas escritos para una computadora se llama software. Este libro se dedicará casi exclusivamente al software, pero se hará una breve revisión del hardware como recordatorio o introducción según sean los conocimientos del lector en esta materia. Una computadora consta de varios dispositivos (tales como teclado, pantalla, “ratón” (mouse), discos duros, me- morias, escáner, DVD, CD, memorias flash, unidades de proceso, impresoras, etc.) que son conocidos como hardware. Los programas de computadora que se ejecutan o “corren” (run) sobre una máquina se conocen como software. El coste del hardware se ha reducido drásticamente en los últimos años y sigue reduciéndose al menos en términos de relación precio/prestaciones, ya que por el mismo precio es posible encontrar equipos de computadoras con unas prestaciones casi el doble de las que se conseguían hace tan sólo dos o tres años por un coste similar2 . Afortunada- mente, el precio del software estándar también se ha reducido drásticamente, pero por suerte cada día se requieren más aplicaciones específicas y los programadores profesionales cada día tienen ante sí grandes retos y oportunidades, de modo que los esfuerzos y costes que requieren los desarrollos modernos suelen tener compensaciones económicas para sus autores. 1 En España está muy extendido el término ordenador para referirse a la traducción de la palabra inglesa computer. El DRAE (Diccionario de la Real Academia Española, realizado por la Academia Española y todas las Academias de la Lengua de Latinoamérica, África y Asia) acepta, indistintamente, los términos sinónimos: computador, computadora y ordenador. Entre las diferentes acepciones define la computadora electróni- ca como: “máquina electrónica, analógica o digital, dotada de una memoria de gran capacidad y de métodos de tratamiento de la información capaz de resolver problemas matemáticos y lógicos mediante la utilización automática de programas informáticos”. En el Diccionario panhispá- nico de dudas (Madrid: RAE, 2005, p. 157), editado también por la Real Academia Española y la Asociación de Academias de la Lengua Espa- ñola, se señala que el término computadora (del término inglés computer) se utiliza en la mayoría de los países de América, mientras que el masculino computador es de uso mayoritario en Chile y Colombia; en España se usa preferentemente el término ordenador, tomado del francés ordinateur. En este reciente diccionario la definición de computador es “Máquina electrónica capaz de realizar un tratamiento automático de la información y de resolver con gran rapidez problemas matemáticos y lógicos mediante programas informáticos”. 2 A título meramente comparativo resaltar que el primer PC que tuvo el autor de esta obra, comprado en la segunda mitad de los ochenta, costó unos 5-6.000$ y sólo contemplaba una unidad central de 512 KB, disco duro de 10 MB y una impresora matricial.
  • 35. Introducción a las computadoras y los lenguajes de programación 5 1.1.1. Origen de las computadoras La primera computadora digital que reseña la historia de la informática, se puede considerar, fue diseñada a finales de la década de los treinta por el Dr. John Atanasoff y el estudiante de postgrado Clifford Berry3 en la Universidad de Iowa (Iowa State University). Diseñaron la computadora para realizar cálculos matemáticos en física nuclear. Sin embargo, la primera computadora electrónica digital de aplicaciones o propósito general se llamaba ENIAC y se terminó en 1946 en la Universidad de Pennsylvania, fue financiada por el Ejército de EE.UU. (U.S. Army). La ENIAC pesaba 30 toneladas y ocupaba un espacio de 30 por 50 pies. Se utilizaba esencialmente para predicciones de tiempo, cálculos da tablas balísticas, cálculos de energía atómica. Sus diseñadores fueron J. Prespert Eckert y John Mauchley. En el mismo año de 1946, el Dr. John Von Neumann de Princeton University propuso el concepto de computa- dora con programa almacenado que consistía en un programa cuyas instrucciones se almacenaban en la memoria de la computadora. Von Neumann descubrió que era posible que los programas se almacenaran en la memoria de la computadora y que se podrían cambiar más fácilmente que las complejas conexiones de cables y fijaciones de interruptores del ENIAC. Von Neumann diseñó una computadora basada en esta idea. Su diseño ha constituido el nacimiento de la computación moderna y ha dado origen a la denominada arquitectura de Von Neumann que es la base de las com- putadoras digitales actuales. Estas computadoras primitivas utilizaban tubos de vacío como componentes electrónicos básicos. No sólo eran muy voluminosas, sino lentas y difíciles de manipular a la par que requerían usos y cuidados especiales. Los avances tecnológicos en semiconductores, transistores y circuitos integrados concluyeron en diseñar y fabricar las nuevas generaciones de computadoras que conducían a máquinas más pequeñas, más rápidas y más económicas que sus predecesoras. En la década de los setenta, los fabricantes Altair (suele considerarse la primera microcomputadora de la historia) y Apple fabrican la primera microcomputadora de la historia. Steve Jobs y Stephen Wozniac construyen el Apple, la primera computadora doméstica de la historia. Por aquella época otras compañías que fabricaron microcomputadoras fueron Commodore, Radio Shack, Heathkit y en Europa, Sinclair que fabricó el mítico ZX Spectrum con el que aprendieron a programar y a jugar con videojuegos muchos de los grandes ingenieros, catedráticos, etc., de esta dé- cada. Eran computadoras que en aquella época no eran aceptadas por la comunidad profesional, las empresas y las industrias. El 12 de agosto de 1981 IBM presentó en Nueva York y en otras ciudades norteamericanas, la primera computa- dora de escritorio de la historia, denominada por su inventor, IBM PC (Personal Computer, computadora personal de IBM), cuyo software fundamental fue desarrollado por una joven compañía conocida como Microsoft. El PC se con- virtió en un éxito instantáneo hasta llegar a convertirse en un aparato o dispositivo electrónico4 de uso general, al 3 En su honor se conoce como computadora de Atanasoff-Berry. 4 Coomodity, el término por el que se conoce en inglés un dispositivo electrónico de consumo que se puede comprar en un gran almacén. COMPUTADORA Programa Datos de entrada (entrada) Datos de salida (resultados) Figura 1.1. Proceso de información en una computadora.
  • 36. 6 Fundamentos de programación estilo de una TV o un equipo de música. Sin embargo, conviene recordar que el PC, tal como se le conoce en la ac- tualidad, no fue la primera computadora personal ya que le precedieron otras máquinas con microprocesadores de 8 bits, muy populares en su tiempo, tales como Apple II, Pet CBM, Atari, TRS-80, etc., y el mítico ZX Spectrum, de los diferentes fabricantes citados en el párrafo anterior. El término PC se utiliza indistintamente con el término genérico de computadora de escritorio o computadora portátil (desktop) o (laptop)5 . 1.1.2. Clasificación de las computadoras Las computadoras modernas se pueden clasificar en computadoras personales, servidores, minicomputadoras, gran- des computadoras (mainframes) y supercomputadoras. Las computadoras personales (PC) son las más populares y abarcan desde computadoras portátiles (laptops o notebooks, en inglés) hasta computadoras de escritorio (desktop) que se suelen utilizar como herramientas en los puestos de trabajo, en oficinas, laboratorios de enseñanza e investigación, empresas, etc. Los servidores son compu- tadoras personales profesionales y de gran potencia que se utilizan para gestionar y administrar las redes internas de las empresas o departamentos y muy especialmente para administrar sitios Web de Internet. Las computadoras tipo servidor son optimizadas específicamente para soportar una red de computadoras, facilitar a los usuarios la compar- tición de archivos, de software o de periféricos como impresoras y otros recursos de red. Los servidores tienen me- morias grandes, altas capacidades de memoria en disco e incluso unidades de almacenamiento masivo como unidades de cinta magnética u ópticas, así como capacidades de comunicaciones de alta velocidad y potentes CPUS, normal- mente específicas para sus cometidos. Estaciones de trabajo (Workstation) son computadoras de escritorio muy potentes destinadas a los usuarios pero con capacidades matemáticas y gráficas superiores a un PC y que pueden realizar tareas más complicadas que un PC en la misma o menor cantidad de tiempo. Tienen capacidad para ejecutar programas técnicos y cálculos científicos, y suelen utilizar UNIX o Windows NT como sistema operativo. Las minicomputadoras, hoy día muchas veces confundidas con los servidores, son computadoras de rango me- dio, que se utilizan en centros de investigación, departamentos científicos, fábricas, etc., y que poseen una gran ca- pacidad de proceso numérico y tratamiento de gráficos, fundamentalmente, aunque también son muy utilizadas en el mundo de la gestión, como es el caso de los conocidos AS/400 de IBM. Las grandes computadoras (mainframes) son máquinas de gran potencia de proceso y extremadamente rápidas y además disponen de una gran capacidad de almacenamiento masivo. Son las grandes computadoras de los bancos, universidades, industrias, etc. Las supercomputadoras6 son las más potentes y sofisticadas que existen en la actua- lidad; se utilizan para tareas que requieren cálculos complejos y extremadamente rápidos. Estas computadoras utilizan numerosos procesadores en paralelo y tradicionalmente se han utilizado y utilizan para fines científicos y militares en aplicaciones tales como meteorología, previsión de desastres naturales, balística, industria aeroespacial, satélites, aviónica, biotecnología, nanotecnología, etc. Estas computadoras emplean numerosos procesadores en paralelo y se están comenzando a utilizar en negocios para manipulación masiva de datos. Una supercomputadora, ya popular es el Blue Gene de IBM o el Mare Nostrum de la Universidad Politécnica de Cataluña. Además de esta clasificación de computadoras, existen actualmente otras microcomputadoras (handheld compu- ters, computadoras de mano) que se incorporan en un gran número de dispositivos electrónicos y que constituyen el corazón y brazos de los mismos, por su gran capacidad de proceso. Este es el caso de los PDA (Asistentes Persona- les Digitales) que en muchos casos vienen con versiones específicas para estos dispositivos de los sistemas operativos populares, como es el caso de Windows Mobile, y en otros casos utilizan sistemas operativos exclusivos como es el caso de Symbiam y Palm OS. También es cada vez más frecuente que otros dispositivos de mano, tales como los teléfonos inteligentes, cámaras de fotos, cámaras digitales, videocámaras, etc., incorporen tarjetas de memoria de 128 Mb hasta 4 GB, con tendencia a aumentar. 5 En muchos países de Latinoamérica, el término computadora portátil, es más conocido popularmente por su nombre en inglés, laptop. 6 En España existen varias supercomputadoras. A destacar, las existentes en el Centro de Supercomputación de Galicia, la de la Universidad Politécnica de Valencia y la de la Universidad Politécnica de Madrid. En agosto de 2004 se puso en funcionamiento en Barcelona, en la sede de la Universidad Politécnica de Cataluña, otra gran supercomputadora, en este caso de IBM que ha elegido España y, en particular Barcelona, como sede de esta gran supercomputadora que a la fecha de la inauguración se prevé esté entre las cinco más potentes del mundo. Esta supercomputa- dora denominada Mare Nostrum es una de las más potentes del mundo y está ubicada en el Centro de Supercomputación de Barcelona, dirigido por el profesor Mateo Valero, catedrático de Arquitectura de Computadoras de la Universidad Politécnica de Cataluña.
  • 37. Introducción a las computadoras y los lenguajes de programación 7 1.2. ORGANIZACIÓN FÍSICA DE UNA COMPUTADORA Los dos componentes principales de una computadora son: hardware y software. Hardware es el equipo físico o los dispositivos asociados con una computadora. Sin embargo, para ser útil una computadora necesita además del equipo físico, un conjunto de instrucciones dadas. El conjunto de instrucciones que indican a la computadora aquello que deben hacer se denomina software o programas y se escriben por programadores. Este libro se centra en la ense- ñanza y aprendizaje de la programación o proceso de escribir programas. Una red consta de un número de computadoras conectadas entre sí directamente o a través de otra computadora central (llamada servidor), de modo que puedan compartir recursos tales como impresoras, unidades de almacena- miento, etc., y que pueden compartir información. Una red puede contener un núcleo de PC, estaciones de trabajo y una o más computadoras grandes, así como dispositivos compartidos como impresora. La mayoría de las computadoras, grandes o pequeñas, están organizadas como se muestra en la Figura 1.2. Una computadora consta fundamentalmente de cinco componentes principales: dispositivos de entrada; dispositivos de salida; unidad central de proceso (UCP) o procesador (compuesto de la UAL, Unidad Aritmética y Lógica y la UC, Unidad de Control); la memoria principal o central; memoria secundaria o externa y el programa. Si a la organización física de la Figura 1.2 se le añaden los dispositivos para comunicación exterior con la com- putadora, aparece la estructura típica de un sistema de computadora que, generalmente, consta de los siguientes dis- positivos de hardware: • Unidad Central de Proceso, UCP (CPU, Central Processing Unit). • Memoria principal. • Memoria secundaria (incluye medios de almacenamiento masivo como disquetes, memorias USB, discos duros, discos CD-ROM, DVD...). • Dispositivos de entrada tales como teclado y ratón. • Dispositivos de salida tales como monitores o impresoras. • Conexiones de redes de comunicaciones, tales como módems, conexión Ethernet, conexiones USB, conexiones serie y paralelo, conexión Firewire, etc. Dispositivos de entrada Unidad de control Memoria central Unidad aritmética y lógica Dispositivos de salida Memoria externa (almacenamiento permanente) UCP (Procesador) Figura 1.2. Organización física de una computadora. Las computadoras sólo entienden un lenguaje compuesto únicamente por ceros y unos. Esta forma de comunica- ción se denomina sistema binario digital y en el caso concreto de las máquinas computadoras, código o lenguaje máquina. Este lenguaje máquina utiliza secuencias o patrones de ceros y unos para componer las instrucciones que posteriormente reciben de los diferentes dispositivos de la computadora, tales como el microprocesador, las unidades de discos duros, los teclados, etc. La Figura 1.2 muestra la integración de los componentes que conforman una computadora cuando se ejecuta un programa; las flechas conectan los componentes y muestran la dirección del flujo de información.
  • 38. 8 Fundamentos de programación El programa se debe transferir primero de la memoria secundaria a la memoria principal antes de que pueda ser ejecutado. Los datos se deben proporcionar por alguna fuente. La persona que utiliza un programa (usuario de programa) puede proporcionar datos a través de un dispositivo de entrada. Los datos pueden proceder de un archi- vo (fichero), o pueden proceder de una máquina remota vía una conexión de red de la empresa o bien la red In- ternet. Los datos se almacenan en la memoria principal de una computadora a la cual se puede acceder y manipu- lar mediante la unidad central de proceso (UCP). Los resultados de esta manipulación se almacenan de nuevo en la memoria principal. Por último, los resultados (la información) de la memoria principal se pueden visualizar en un dispositivo de salida, guardar en un almacenamiento secundario o enviarse a otra computadora conectada con ella en red. Unidad de control Unidad lógica y aritmética Memoria central Datos de entrada Datos de salida Programa Unidad central de proceso Figura 1.3. Unidad Central de Proceso. Uno de los componentes fundamentales de un PC es la placa base (en inglés, motherboard o mainboard) que es una gran placa de circuito impreso que conecta entre sí los diferentes elementos contenidos en ella y sobre la que se conectan los elementos más importantes del PC: zócalo del microprocesador, zócalos de memoria, diferentes conec- tores, ranuras de expansión, puertos, etc. Los paquetes de datos (de 8, 16, 32, 64 o más bits a la vez) se mueven continuamente entre la CPU y todos los demás componentes (memoria RAM, disco duro, etc.). Estas transferencias se realizan a través de buses. Los buses son los cana- les de datos que interconectan los componentes del PC; algunos están diseñados para transferencias pequeñas y otros para transferencias mayores. Existen diferentes buses siendo el más importante el bus frontal (FSB, Front Side Bus) en los sis- temas actuales o bus del sistema (en sistemas más antiguos) y que conectan la CPU o procesador con la memoria RAM. Otros buses importantes son los que conectan la placa base de la computadora con los dispositivos periféricos del PC y se denominan buses de E/S. 1.2.1. Dispositivos de Entrada/Salida (E/S): periféricos Los dispositivos de Entrada/Salida (E/S) [Input/Output (I/O) en inglés] permiten la comunicación entre la computa- dora y el usuario. Los dispositivos de entrada, como su nombre indica, sirven para introducir datos (información) en la computadora para su proceso. Los datos se leen de los dispositivos de entrada y se almacenan en la memoria cen- tral o interna. Los dispositivos de entrada convierten la información de entrada en señales eléctricas que se almacenan en la memoria central. Dispositivos de entrada típicos son los teclados; otros son: lectores de tarjetas —ya en des- uso—, lápices ópticos, palancas de mando (joystick), lectores de códigos de barras, escáneres, micrófonos, etc.
  • 39. Introducción a las computadoras y los lenguajes de programación 9 Hoy día tal vez el dispositivo de entrada más popular es el ratón (mouse) que mueve un puntero electrónico sobre la pantalla que facilita la interacción usuario-máquina7 . Los dispositivos de salida permiten representar los resultados (salida) del proceso de los datos. El dispositivo de salida típico es la pantalla (CRT)8 o monitor. Otros dispositivos de salida son: impresoras (imprimen resultados en papel), trazadores gráficos (plotters), reconocedores de voz, altavoces, etc. El teclado y la pantalla constituyen —en muchas ocasiones— un único dispositivo, denominado terminal. Un teclado de terminal es similar al teclado de una máquina de escribir moderna con la diferencia de algunas teclas ex- tras que tiene el terminal para funciones especiales. Si está utilizando una computadora personal, el teclado y el monitor son dispositivos independientes conectados a la computadora por cables. En ocasiones, la impresora se co- noce como dispositivo de copia dura (hard copy), debido a que la escritura en la impresora es una copia permanen- te (dura) de la salida, y en contraste a la pantalla se la denomina dispositivo de copia blanda (soft copy), ya que la pantalla actual se pierde cuando se visualiza la siguiente. Los dispositivos de entrada/salida y los dispositivos de almacenamiento secundario o auxiliar (memoria externa) se conocen también con el nombre de dispositivos periféricos o simplemente periféricos ya que, normalmente, son externos a la computadora. Estos dispositivos son unidades de discos [disquetes (ya en desuso), CD-ROM, DVD, cintas, etc.], videocámaras, teléfonos celulares (móviles), etc. Todos los dispositivos periféricos se conectan a las computadoras a través de conectores y puertos (ports) que son interfaces electrónicos. 1.2.2. La memoria principal La memoria de una computadora almacena los datos de entrada, programas que se han de ejecutar y resultados. En la mayoría de las computadoras existen dos tipos de memoria principal: memoria de acceso aleatorio RAM que soporta almacenamiento temporal de programas y datos y memoria de sólo lectura ROM que almacena datos o programas de modo permanente. La memoria central (RAM, Random, Access Memory) o simplemente memoria se utiliza para almacenar, de modo temporal información, datos y programas. En general, la información almacenada en memoria puede ser de dos tipos: las instrucciones de un programa y los datos con los que operan las instrucciones. Para que un programa se pueda ejecutar (correr, rodar, funcionar..., en inglés run), debe ser situado en la memoria central, en una operación denominada carga (load) del programa. Después, cuando se ejecuta (se realiza, funciona) el programa, cualquier dato a procesar por el programa se debe llevar a la memoria mediante las instrucciones del programa. En la memoria central, hay también datos diversos y espacio de almacenamiento temporal que necesita el programa cuando se eje- cuta y así poder funcionar9 . La memoria principal es la encargada de almacenar los programas y datos que se están ejecutando y su principal característica es que el acceso a los datos o instrucciones desde esta memoria es muy rápido. Es un tipo de memoria volátil (su contenido se pierde cuando se apaga la computadora); esta memoria es, en rea- lidad, la que se suele conocer como memoria principal o de trabajo; en esta memoria se pueden escribir datos y leer de ella. Esta memoria RAM puede ser estática (SRAM) o dinámica (DRAM) según sea el proceso de fabricación. Las memorias RAM actuales más utilizadas son las SDRAM en sus dos tipos: DDR (Double Data Rate) y DDR2. En la memoria principal se almacenan: • Los datos enviados para procesarse desde los dispositivos de entrada. • Los programas que realizarán los procesos. • Los resultados obtenidos preparados para enviarse a un dispositivo de salida. La memoria ROM, es una memoria que almacena información de modo permanente en la que no se puede es- cribir (viene pregrabada “grabada” por el fabricante) ya que es una memoria de sólo lectura. Los programas alma- 7 Todas las acciones a realizar por el usuario se realizarán con el ratón con la excepción de las que requieren de la escritura de datos por teclado. El nombre de ratón parece que proviene de la similitud del cable de conexión con la cola de un ratón. Hoy día, sin embargo, este razo- namiento carece de sentido ya que existen ratones inalámbricos que no usan cable y se comunican entre sí a través de rayos infrarrojos. 8 Cathode Ray Tube: Tubo de rayos catódicos. 9 En la jerga informática también se conoce esta operación como “correr un programa”.
  • 40. 10 Fundamentos de programación cenados en ROM no se pierden al apagar la computadora y cuando se enciende, se lee la información almacenada en esta memoria. Al ser esta memoria de sólo lectura, los programas almacenados en los chips ROM no se pueden mo- dificar y suelen utilizarse para almacenar los programas básicos que sirven para arrancar la computadora. Con el objetivo de que el procesador pueda obtener los datos de la memoria central más rápidamente, la mayoría de los procesadores actuales (muy rápidos) utilizan con frecuencia una memoria denominada caché que sirva para almacenamiento intermedio de datos entre el procesador y la memoria principal. La memoria caché —en la actuali- dad— se incorpora casi siempre al procesador. Los programas y los datos se almacenan en RAM. Las memorias de una computadora personal se miden en uni- dades de memoria (se describen en el apartado 1.2.3) y suelen ser actualmente de 512 MB a 1, 2 o 3 GB, aunque ya es frecuente encontrar memorias centrales de 4 y 8 GB en computadoras personales y en cantidad mayor en compu- tadoras profesionales y en servidores. Normalmente una computadora contiene mucha más memoria RAM que memoria ROM interna; también la can- tidad de memoria se puede aumentar hasta un máximo especificado, mientras que la cantidad de memoria ROM, normalmente es fija. Cuando en la jerga informática y en este texto se menciona la palabra memoria se suele referir a memoria RAM que normalmente es la memoria accesible al programador. La memoria RAM es una memoria muy rápida y limitada en tamaño, sin embargo la computadora tiene otro tipo de memoria denominada memoria secundaria o almacenamiento secundario que puede crecer comparativamente en términos mucho mayores. La memoria secundaria es realmente un dispositivo de almacenamiento masivo de infor- mación y por ello, a veces, se la conoce como memoria auxiliar, almacenamiento auxiliar, almacenamiento externo y memoria externa. 1.2.3. Unidades de medida de memoria La memoria principal es uno de los componentes más importantes de una computadora y sirve para almacena- miento de información (datos y programas). Existen dos tipos de memoria y de almacenamiento: Almacenamiento principal (memoria principal o memoria central) y almacenamiento secundario o almacenamiento masivo (discos, cintas, etc.). La memoria central de una computadora es una zona de almacenamiento organizada en centenares o millares de unidades de almacenamiento individual o celdas. La memoria central consta de un conjunto de celdas de memoria (estas celdas o posiciones de memoria se denominan también palabras, aunque no “guardan” analogía con las pa- labras del lenguaje). Cada palabra puede ser un grupo de 8 bits, 16 bits, 32 bits o incluso 64 bits, en las computado- ras más modernas y potentes. Si la palabra es de 8 bits se conoce como byte. El término bit (dígito binario)10 se deriva de las palabras inglesas “binary digit” y es la unidad de información más pequeña que puede tratar una com- putadora. El término byte es muy utilizado en la jerga informática y, normalmente, las palabras de 16 bits se suelen conocer como palabras de 2 bytes, y las palabras de 32 bits como palabras de 4 bytes. { bit 10010011 byte Figura 1.4. Relación entre un bit y un byte. La memoria central de una computadora puede tener desde unos centenares de millares de bytes hasta millones de bytes. Como el byte es una unidad elemental de almacenamiento, se utilizan múltiplos para definir el tamaño de la memoria central: Kilobyte (KB) igual a 1.024 bytes11 (210 ), Megabyte (MB) igual a 1.024 × 1.024 bytes (220 = 1.048.576), 10 Binario se refiere a un sistema de numeración basado en los dos números o dígitos, 0 y 1; por consiguiente, un bit es o bien un 0 o bien un 1. 11 Se adoptó el término Kilo en computadoras debido a que 1.024 es muy próximo a 1.000, y por eso en términos familiares y para que los cálculos se puedan hacer fáciles mentalmente se asocia 1 KB a 1.000 bytes y 1 MB a 1.000.000 de bytes y 1 GB a 1.000.000.000 de bytes. Así, cuando se habla en jerga diaria de 5 KB estamos hablando, en rigor, de 5 × 1.024 = 5.120 bytes, pero en cálculos consideramos 5.000 bytes. De
  • 41. Introducción a las computadoras y los lenguajes de programación 11 Gigabyte (GB) igual a 1.024 MB (230 = 1.073.741.824). Las abreviaturas MB y GB se han vuelto muy populares como unidades de medida de la potencia de una computadora. Desgraciadamente la aplicación de estos prefijos representa un mal uso de la terminología de medidas, ya que en otros campos las referencias a las unidades son potencias de 10. Por ejemplo, las medidas en distancias, Kilómetro (Km) se refiere a 1.000 metros, las medidas de frecuencias, Megahercio (MHz) se refieren a 1.000.000 de hercios. En la jerga informática popular para igualar terminología, se suele hablar de 1 KB como 1.000 bytes y 1 MB como 1.000.000 de bytes y un 1 GB como 1.000 millones de bytes, sobre todo para correspondencia y fáciles cálculos mentales, aunque como se observa en la Tabla 1.1 estos valores son sólo aproximaciones prácticas. Tabla 1.1. Unidades de medida de almacenamiento Byte Byte (B) equivale a 8 bits Kilobyte Kbyte (KB) equivale a 1.024 bytes (103 ) Megabyte Mbyte (MB) equivale a 1.024 Kbytes (106 ) Gigabyte Gbyte (GB) equivale a 1.024 Mbytes (109 ) Terabyte Tbyte (TB) equivale a 1.024 Gbytes (1012 ) Petabyte Pbyte (PB) equivale a 1.024 Tbytes (1015 ) Exabyte Ebyte (EB) equivale a 1.024 Pbytes (1018 ) Zettabyte Zbyte (ZB) equivale a 1.024 Ebytes (1021 ) Yotta Ybyte (YB) equivale a 1.024 Zbytes (1024 ) 1 Tb = 1.024 Gb; 1 GB = 1.024 Mb = 1.048.576 Kb = 1.073.741.824 b Celda de memoria • La memoria de una computadora es una secuencia ordenada de celdas de memoria. • Cada celda de memoria tiene una única dirección que indica su posición relativa en la memoria. • Los datos se almacenan en una celda de memoria y constituyen el contenido de dicha celda. Byte Un byte es una posición de memoria que puede contener ocho bits. Cada bit sólo puede contener dos valores posibles, 0 o 1. Se requieren ocho bits (un byte) para codificar un carácter (una letra u otro símbolo del teclado). Bytes, direcciones, memoria La memoria principal se divide en posiciones numeradas que se denominan bytes. A cada byte se asocia un número denominado dirección. Un número o una letra se representan por un grupo de bytes consecutivos en una posición determinada. La dirección del primer byte del grupo se utiliza como la dirección más grande de esta posición de memoria. Espacio de direccionamiento Para tener acceso a una palabra en la memoria se necesita un identificador que a nivel de hardware se le conoce como dirección. Existen dos conceptos importantes asociados a cada celda o posición de memoria: su dirección y su con- tenido. Cada celda o byte tiene asociada una única dirección que indica su posición relativa en memoria y mediante este modo se guarda correspondencia con las restantes representaciones de las palabras Kilo, Mega, Giga... Usted debe considerar siempre los valores reales para 1 KB, 1 MB o 1 GB, mientras esté en su fase de formación y posteriormente en el campo profesional desde el punto de vista de programación, para evitar errores técnicos en el diseño de sus programas, y sólo recurrir a las cifras mil, millón, etc., para la jerga diaria.
  • 42. 12 Fundamentos de programación la cual se puede acceder a la posición para almacenar o recuperar información. La información almacenada en una posición de memoria es su contenido. La Figura 1.5 muestra una memoria de computadora que consta de 1.000 po- siciones en memoria con direcciones de 0 a 999 en código decimal. El contenido de estas direcciones o posiciones de memoria se llaman palabras, que como ya se ha comentado pueden ser de 8, 16, 32 y 64 bits. Por consiguiente, si trabaja con una máquina de 32 bits, significa que en cada posición de memoria de su computadora puede alojar 32 bits, es decir 32 dígitos, bien ceros o unos. . . . 325 999 998 997 3 2 1 0 Direcciones Contenido de la dirección 997 Figura 1.5. Memoria central de una computadora. Las direcciones de memoria se definen usando enteros binarios sin signo o sus correspondientes enteros deci- males. El número de posiciones únicas identificables en memoria se denomina espacio de direccionamiento. Por ejem- plo, en una memoria de 64 kilobytes (KB) y un tamaño de palabra de un byte tienen un espacio de direccionamiento que varía de 0 a 65.535 (64 KB, 64 × 1.024 = 65.536). Los bytes sirven para representar los caracteres (letras, números y signos de puntuación adicionales) en un códi- go estándar internacional denominado ASCII (American Standard Code for Information Interchange), utilizado por todas las computadoras del mundo, o bien en un código estándar más moderno denominado Unicode. Todos estos símbolos se almacenan en memoria y con ellos trabajan las computadoras. 1.2.4. El procesador El procesador o Unidad Central de Proceso, UCP (CPU, Central Processing Unit) controla el funcionamiento de la computadora y realiza sus funciones de procesamiento de los datos, constituyendo el cerebro y corazón de la com- putadora o también su sistema nervioso. Se encarga de un modo práctico de realizar numerosos cálculos y operacio- nes ordenadas por los diferentes programas instalados en la computadora. Cada computadora tiene al menos una UCP para interpretar y ejecutar las instrucciones de cada programa, reali- zar las manipulaciones de datos aritméticos y lógicos, y comunicarse con todas las restantes partes de la máquina indirectamente a través de la memoria. Un moderno procesador o microprocesador, es una colección compleja de dispositivos electrónicos. En una com- putadora de escritorio o en una portátil (laptop o notebook) la UCP se aloja junto con otros chips y componentes electrónicos en la placa base también denominada placa madre (motherboard). La elección de la placa base propor- cionará una mayor o menor potencia a la computadora y está compuesta por numerosos componentes electrónicos y se ramifica hacia todos los periféricos externos a través de conectores (puertos) colocados en la mayoría de las veces en la parte posterior del equipo, principalmente en los equipos de sobremesa y torre, mientras que en los equipos portátiles o portables, están colocados no sólo en la parte posterior sino también en las partes laterales o incluso de- lantera. Existen numerosos fabricantes de procesadores aunque, entre otros, los más acreditados son Intel, AMD, Trans- meta (empresa conocida por estar vinculada en sus orígenes con Linus Torvald creador del sistema operativo Linux), IBM, Motorola y Sun Microsystems. En cuanto a familias en concreto, los más populares son: Pentium de Intel (que
  • 43. Introducción a las computadoras y los lenguajes de programación 13 incluye Celeron y Xeon), Opteron de AMD, SPARC de Sun Microsystemas, Crusoe de Transmeta, Centrino Core 2 y Centro Core 2 Duo de Intel que se instalan en portátiles, etc. Todas las UCP tienen una velocidad de trabajo, regulada por un pequeño cristal de cuarzo, y que se conoce como frecuencia de reloj. El cristal vibra a un elevado número de ciclos de reloj. Con cada ciclo de reloj se envía un impul- so a la UCP, y en principio, cada pulsación puede hacer realizar una o más tareas a la UCP. El número de ciclos de reloj por segundo se mide en hertzios. El cristal de la UCP vibra millones de veces por segundo y por esta razón la velocidad del reloj se calcula en millones de oscilaciones (megahercios o MHz) o miles de millones de ciclos por se- gundo, gigahercios (GHz). En consecuencia la velocidad de los microprocesadores se mide en MHz o en GHz. De esta forma si el procesador de su equipo funciona a 3 GHz significa que realiza 3 millones de operaciones por segundo. Generaciones de microprocesadores El PC original de 1981 trabajaba a 4,77 MHz y su microprocesador era el Intel 8088. Trabajaba a 16 bits interna- mente, aunque el bus externo para comunicarse con el resto de componentes era tan sólo de 8 bits. El microprocesa- dor Intel 8088 fue lanzado al mercado en junio de 1979, aunque con anterioridad (junio de 1978) Intel lanzó el 8086. Estos microprocesadores con sus diferentes modelos, constituyeron la primera generación o familia de microproce- sadores. En total, Intel ha lanzado numerosas generaciones o familias de procesadores que han permanecido en el mercado durante varios años durante los cuales se ha ido incrementando la frecuencia de reloj. En 1993 Intel presentó el Pentium II, Motorola el 68060 y AMD el K5. Desde entonces Intel y AMD, fundamen- talmente, han continuado presentando numerosas generaciones o familias de procesadores que permanecen en el mercado durante varios años incrementando la frecuencia de reloj con cada nuevo modelo además de otras caracte- rísticas importantes. En el año 2000 Intel presentó el Pentium IV y AMD el Athlon XP y Duron, desencadenantes de los potentes procesadores existentes hoy día y que han servido de soporte a la mayoría de las computadoras perso- nales de la primera década de los 2000. En 2004, Intel presentó los Pentium M, D y Core Duo, mientras que AMD presentó en 2005, el AMD Athlon. En enero de 2006, Intel lanzó el procesador Core Duo, optimizado para aplicaciones de procesos múltiples y multitarea. Puede ejecutar varias aplicaciones complejas simultáneamente, como juegos con gráficos potentes o pro- gramas que requieran muchos cálculos y al mismo tiempo puede descargar música o analizar su PC con un antivirus en segundo plano. A finales del mismo año, Intel presentó el Core 2 Duo que dobla la potencia de cálculo y reduce considerablemente el consumo de energía. Intel sigue fabricando para sus equipos de sobremesa y portátiles, proce- sadores Pentium (Pentium D y Pentium 4) y procesadores Celeron En 2007 han aparecido los procesadores de más de un núcleo, tales como Intel Core 2 Quad, AMD Quad Core y AMD Quad FX, todos ellos de cuatro núcleos y en 2008 se espera el lanzamiento de procesadores Intel y AMD con más de ocho núcleos. De igual modo Intel también fabrica Pentium de dos y cuatro núcleos. (Pentium Dual Core, Pentium Cuad Core) y Athlon 64 y con tendencia a aumentar el número de núcleos. Proceso de ejecución de un programa El ratón y el teclado introducen datos en la memoria central cuando se ejecuta el programa. Los datos intermedios o auxiliares se transfieren desde la unidad de disco a la pantalla y a la unidad de disco, a medida que se ejecuta el programa. Cuando un programa se ejecuta, se debe situar primero en memoria central de igual modo que los datos. Sin embargo, la información almacenada en la memoria se pierde (borra) cuando se apaga (desconecta de la red eléctri- ca) la computadora, y por otra parte le memoria central es limitada en capacidad. Por esta razón, para poder disponer de almacenamiento permanente, tanto para programas como para datos, se necesitan dispositivos de almacenamien- to secundario, auxiliar o masivo (mass storage, o secondary storage). En el campo de las computadoras es frecuente utilizar la palabra memoria y almacenamiento o memoria exter- na, indistintamente. En este libro —y recomendamos su uso— se utilizará el término memoria sólo para referirse a la memoria central. Comparación de la memoria central y la memoria auxiliar La memoria central o principal es mucho más rápida y cara que la memoria auxiliar. Se deben transferir los datos desde la memoria auxiliar hasta la memoria central, antes de que puedan ser procesados. Los datos en memoria central son: volátiles y desaparecen cuando se apaga la computadora. Los datos en memoria auxiliar son per- manentes y no desaparecen cuando se apaga la computadora.
  • 44. 14 Fundamentos de programación 1.2.5. Propuestas para selección de la computadora ideal para aprender programación o para actividades profesionales Las computadoras personales que en el primer trimestre de 2008 se comercializan para uso doméstico y en oficinas o en las empresas suelen tener características comunes, y es normal que sus prestaciones sean similares a las utiliza- das en los laboratorios de programación de Universidades, Institutos Tecnológicos y Centros de Formación Profesio- nal. Por estas razones en la Tabla 1.2 se incluyen recomendaciones de características técnicas medias que son, nor- malmente, utilizadas, para prácticas de aprendizaje de programación, por el alumno o por el lector autodidacta, así como por profesionales en su actividad diaria. Tabla 1.2. Características técnicas recomendadas para computadoras de escritorio (profesionales y uso doméstico) Procesador (Computadora de sobremesa- computadora portátil o laptop) Intel www.intel.com/cd/products/services/emea/spa/processors/322163.htm* Procesadores para equipos de sobremesa • Intel Core 2 Extreme • Intel Core 2 Quad • Intel Core 2 Duo • Intel Celeron, Celeron D y Celeron de doble núcleo • Pentium Extreme • Pentium D Edition • Pentium 4 Procesadores para portátiles (laptop) • Intel Centrino Duo con procesador Intel Core Duo • Intel Pentium e Intel Celeron AMD www.amd.com/es-es/Processors/ProductInformation/0,,30_118,00.html* Procesadores para equipos de sobremesa • AMD Phenom Quad Core • AMD Athlon • AMD Sempron Procesadores para portátiles (laptop) • Tecnología Mobile AMD Turion 64 × 2 Dual Core • Mobile Athlon 64 × 2 • Mobile AMD Sempron Memoria RAM 512 MB, 1 GB a 4 GB DDR2 Disco duro SATA 80 GB, 160 G, 250 GB, 320 GB y superiores Tarjeta gráfica Memoria dedicada o compartida, 256-1.024 Mb Nvidia GeForce ATI Mobility Radeom Intel Grabadora DVD +/– RW de doble capa Blue-Ray HD-DVD (desde febrero de 2008, se ha dejado de comercializar por Toshiba) Pantalla 7", 11,1", 11,9", 12,1", 13", 13,3", 14", 15", 15,4", 17", 19", 20" Sistema operativo Windows XP, Mac OS Windows Vista Home, Premiun, Business, Ultimate Mac OS Linux Redes y conectividad Wifi Bluetooth v2.0 LAN USB 2.0 Protocolos a, b, g, n Ethernet 10/100, 10/100/1000 Varios puertos (2 o más) Otras características WebCam de 1,3-2 Mpixel Sintonizadora TV GPS integrado Lector multitarjetas Firewire 3G (UMTS), 3,5 G (HSDPA), 3,75 G (HSUPA), HSPA (ya existen en el mercado computadoras con banda ancha móvil —HSPA— integrada, p.e. modelo DELL Vostro 1500) * En estas direcciones Web, el lector encontrará todas las especificaciones y características técnicas más sobresalientes de los procesadores de los fabricantes Intel y AMD.
  • 45. Introducción a las computadoras y los lenguajes de programación 15 1.3. REPRESENTACIÓN DE LA INFORMACIÓN EN LAS COMPUTADORAS Una computadora es un sistema para procesar información de modo automático. Un tema vital en el proceso de fun- cionamiento de una computadora es estudiar la forma de representación de la información en dicha computadora. Es necesario considerar cómo se puede codificar la información en patrones de bits que sean fácilmente almacenables y procesables por los elementos internos de la computadora. Las formas de información más significativas son: textos, sonidos, imágenes y valores numéricos y, cada una de ellas presentan peculiaridades distintas. Otros temas importantes en el campo de la programación se refieren a los métodos de detección de errores que se puedan producir en la transmisión o almacenamiento de la información y a las técnicas y mecanismos de comprensión de información al objeto de que ésta ocupe el menor espacio en los dis- positivos de almacenamiento y sea más rápida su transmisión. 1.3.1. Representación de textos La información en formato de texto se representa mediante un código en el que cada uno de los distintos símbolos del texto (tales como letras del alfabeto o signos de puntuación) se asignan a un único patrón de bits. El texto se representa como una cadena larga de bits en la cual los sucesivos patrones representan los sucesivos símbolos del texto original. En resumen, se puede representar cualquier información escrita (texto) mediante caracteres. Los caracteres que se utilizan en computación suelen agruparse en cinco categorías: 1. Caracteres alfabéticos (letras mayúsculas y minúsculas, en una primera versión del abecedario inglés). A, B, C, D, E, ... X, Y, Z, a, b, c, ... , X, Y, Z 2. Caracteres numéricos (dígitos del sistema de numeración). 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 sistema decimal 3. Caracteres especiales (símbolos ortográficos y matemáticos no incluidos en los grupos anteriores). { } Ñ ñ ! ? & > # ç ... 4. Caracteres geométricos y gráficos (símbolos o módulos con los cuales se pueden representar cuadros, figu- ras geométricas, iconos, etc. | — | ||— — ♠ ∼ ... 5. Caracteres de control (representan órdenes de control como el carácter para pasar a la siguiente línea [NL] o para ir al comienzo de una línea [RC, retorno de carro, “carriage return, CR”] emitir un pitido en el ter- minal [BEL], etc.). Al introducir un texto en una computadora, a través de un periférico, los caracteres se codifican según un código de entrada/salida de modo que a cada carácter se le asocia una determinada combinación de n bits. Los códigos más utilizados en la actualidad son: EBCDIC, ASCII y Unicode. • Código EBCDIC (Extended Binary Coded Decimal Inter Change Code). Este código utiliza n = 8 bits de forma que se puede codificar hasta m = 28 = 256 símbolos diferentes. Éste fue el primer código utilizado para computadoras, aceptado en principio por IBM. • Código ASCII (American Standard Code for Information Interchange). El código ASCII básico utiliza 7 bits y permite representar 128 caracteres (letras mayúsculas y minúsculas del alfabeto inglés, símbolos de puntuación, dígitos 0 a 9 y ciertos controles de información tales como retorno de carro, salto de línea, tabulaciones, etc.). Este código es el más utilizado en computadoras, aunque el ASCII ampliado con 8 bits permite llegar a 28 (256) caracteres distintos, entre ellos ya símbolos y caracteres especia- les de otros idiomas como el español.
  • 46. 16 Fundamentos de programación • Código Unicode Aunque ASCII ha sido y es dominante en la representación de los caracteres, hoy día se requiere de la necesidad de representación de la información en muchas otras lenguas, como el portugués, español, chino, el japonés, el árabe, etc. Este código utiliza un patrón único de 16 bits para representar cada símbolo, que permi- te 216 bits o sea hasta 65.536 patrones de bits (símbolos) diferentes. Desde el punto de vista de unidad de almacenamiento de caracteres, se utiliza el archivo (fichero). Un archivo consta de una secuencia de símbolos de una determinada longitud codificados utilizando ASCII o Unicode y que se denomina archivo de texto. Es importante diferenciar entre archivos de texto simples que son manipulados por los programas de utilidad denominados editores de texto y los archivos de texto más elaborados que se producen por los procesadores de texto, tipo Microsoft Word. Ambos constan de caracteres de texto, pero mientras el obtenido con el editor de texto, es un archivo de texto puro que codifica carácter a carácter, el archivo de texto producido por un procesador de textos contiene números, códigos que representan cambios de formato, de tipos de fuentes de letra y otros, e incluso pueden utilizar códigos propietarios distintos de ASCII o Unicode. 1.3.2. Representación de valores númericos El almacenamiento de información como caracteres codificados es ineficiente cuando la información se registra como numérica pura. Veamos esta situación con la codificación del número 65; si se almacena como caracteres ASCII uti- lizando un byte por símbolo, se necesita un total de 16 bits, de modo que el número mayor que se podía almacenar en 16 bits (dos bytes) sería 99. Sin embargo, si utilizamos notación binaria para almacenar enteros, el rango puede ir de 0 a 65.535 (216 – 1) para números de 16 bits. Por consiguiente, la notación binaria (o variantes de ellas) es la más utilizada para el almacenamiento de datos numéricos codificados. La solución que se adopta para la representación de datos numéricos es la siguiente: al introducir un número en la computadora se codifica y se almacena como un texto o cadena de caracteres, pero dentro del programa a cada dato se le envía un tipo de dato específico y es tarea del programador asociar cada dato al tipo adecuado correspon- diente a las tareas y operaciones que se vayan a realizar con dicho dato. El método práctico realizado por la computadora es que una vez definidos los datos numéricos de un programa, una rutina (función interna) de la biblioteca del compilador (traductor) del lenguaje de programación se encarga de transformar la cadena de caracteres que representa el número en su notación binaria. Existen dos formas de representar los datos numéricos: números enteros o números reales. Representación de enteros Los datos de tipo entero se representan en el interior de la computadora en notación binaria. La memoria ocupada por los tipos enteros depende del sistema, pero normalmente son dos, bytes (en las versiones de MS-DOS y versiones antiguas de Windows y cuatro bytes en los sistemas de 32 bits como Windows o Linux). Por ejemplo, un entero al- macenado en 2 bytes (16 bits): 1000 1110 0101 1011 Los enteros se pueden representar con signo (signed, en C++) o sin signo (unsigned, en C++); es decir, nú- meros positivos o negativos. Normalmente, se utiliza un bit para el signo. Los enteros sin signo al no tener signo pueden contener valores positivos más grandes. Normalmente, si un entero no se especifica “con/sin signo” se suele asignar con signo por defecto u omisión. El rango de posibles valores de enteros depende del tamaño en bytes ocupado por los números y si se representan con signo o sin signo (la Tabla 1.3 resume características de tipos estándar en C++). Representación de reales Los números reales son aquellos que contienen una parte decimal como 2,6 y 3,14152. Los reales se representan en notación científica o en coma flotante; por esta razón en los lenguajes de programación, como C++, se conocen como números en coma flotante. Existen dos formas de representar los números reales. La primera se utiliza con la notación del punto decimal (ojo en el formato de representación español de números decimales, la parte decimal se representa por coma).
  • 47. Introducción a las computadoras y los lenguajes de programación 17 EJEMPLOS 12.35 99901.32 0.00025 9.0 La segunda forma para representar números en coma flotante en la notación científica o exponencial, conocida también como notación E. Esta notación es muy útil para representar números muy grandes o muy pequeños. Opcional (signo +/–) Se puede utilizar el E Signo +/o u omitido +6.45 E+15 Punto decimal opcional Ningún espacio { Notación exponencial Exponente Mantisa Base de numeración (10, 2...) N = M · BE EJEMPLOS 2.52 e + 8 equivale a 252000000 8.34 E – 4 equivale a 8.34/104 = 0.000834 7E5 equivale a 7000000 –18.35e15 equivale a -18500000000000000 5.95E25 equivale a 595000000000000000000000 9.11e – 31 equivale a 0.000000000000000000000000000000911 Representación de caracteres Un documento de texto se escribe utilizando un conjunto de caracteres adecuado al tipo de documento. En los lengua- jes de programación se utilizan, principalmente, dos códigos de caracteres. El más común es ASCII (American Stan- dard Code for Information Interchange) y algunos lenguajes, tal como Java, utilizan Unicode (www.unicode.org). Ambos códigos se basan en la asignación de un código numérico a cada uno de los tipos de caracteres del código. En C++, los caracteres se procesan normalmente usando el tipo char, que asocia cada carácter a un código nu- mérico que se almacena en un byte. El código ASCII básico que utiliza 7 bits (128 caracteres distintos) y el ASCII ampliado a 8 bits (256 caracteres distintos) son los códigos más utilizados. Así se pueden representar caracteres tales como 'A', 'B', 'c', '$', '4', '5', etc. La Tabla 1.3, recoge los tipos enteros, reales y carácter utilizados en C++, la memoria utilizada (número de bytes ocupados por el dato) y el rango de números. 1.3.3. Representación de imágenes Las imágenes se adquieren mediante periféricos especializados tales como escáneres, cámaras digitales de vídeo, cámaras fotográficas, etc. Una imagen, al igual que otros tipos de información, se representa por patrones de bits, generados por el periférico correspondiente. Existen dos métodos básicos para representar imágenes: mapas de bits y mapas de vectores.
  • 48. 18 Fundamentos de programación En las técnicas de mapas de bits, una imagen se considera como una colección de puntos, cada uno de los cuales se llama pixel (abreviatura de “picture element”). Una imagen en blanco y negro se representa como una cadena lar- ga de bits que representan las filas de píxeles en la imagen, donde cada bit es bien 1 o bien 0, dependiendo de que el pixel correspondiente sea blanco o negro. En el caso de imágenes en color, cada pixel se representa por una com- binación de bits que indican el color de los pixel. Cuando se utilizan técnicas de mapas de bits, el patrón de bits resultante se llama mapa de bits, significando que el patrón de bits resultante que representa la imagen es poco más que un mapa de la imagen. Muchos de los periféricos de computadora —tales como cámaras de vídeo, escáneres, etc.— convierten imágenes de color en formato de mapa de bits. Los formatos más utilizados en la representación de imágenes se muestran en la Tabla 1.4. Tabla 1.4. Mapas de bits Formato Origen y descripción BMP Microsoft. Formato sencillo con imágenes de gran calidad pero con el inconveniente de ocupar mucho (no útil para la web). JPEG Grupo JPEG. Calidad aceptable para imágenes naturales. Incluye compresión. Se utiliza en la web. GIF CompuServe. Muy adecuado para imágenes no naturales (logotipos, banderas, dibujos anidados...). Muy usado en la web. Mapas de vectores. Otros métodos de representar una imagen se fundamentan en descomponer la imagen en una colección de objetos tales como líneas, polígonos y textos con sus respectivos atributos o detalles (grosor, color, etc.). Tabla 1.5. Mapas de vectores Formato Descripción IGES ASME/ANSI. Estándar para intercambio de datos y modelos de (AutoCAD...). Pict Apple Computer. Imágenes vectoriales. EPS Adobe Computer. TrueType Apple y Microsoft para EPS. 1.3.4. Representación de sonidos La representación de sonidos ha adquirido una importancia notable debido esencialmente a la infinidad de aplicacio- nes multimedia tanto autónomas como en la web. El método más genérico de codificación de la información de audio para almacenamiento y manipulación en computadora es mostrar la amplitud de la onda de sonido en intervalos regulares y registrar las series de valores ob- Tabla 1.3. Tipos enteros reales, en C++ Carácter y bool Tipo Tamaño Rango short (short int) 2 bytes –32.738..32.767 int 4 bytes –2.147.483.648 a 2.147.483.647 long (long int) 4 bytes –2.147.483.648 a 2.147.483.647 float (real) 4 bytes 10–38 a 1038 (aproximadamente) double 8 bytes 10–308 a 10308 (aproximadamente) long double 10 bytes 10–4932 a 104932 (aproximadamente) char (carácter) 1 byte Todos los caracteres ASCII bool 1 byte True (verdadero) y false (falso)
  • 49. Introducción a las computadoras y los lenguajes de programación 19 tenidos. La señal de sonido se capta mediante micrófonos o dispositivos similares y produce una señal analógica que puede tomar cualquier valor dentro de un intervalo continuo determinado. En un intervalo de tiempo continuo se dispone de infinitos valores de la señal analógica, que es necesario almacenar y procesar, para lo cual se recurre a una técnica de muestreo. Las muestras obtenidas se digitalizan con un conversor analógico-digital, de modo que la señal de sonido se representa por secuencias de bits (por ejemplo, 8 o 16) para cada muestra. Esta técnica es similar a la utilizada, históricamente, por las comunicaciones telefónicas a larga distancia. Naturalmente, dependiendo de la calidad de sonido que se requiera, se necesitarán más números de bits por muestra, frecuencias de muestreo más altas y lógicamente más muestreos por períodos de tiempo12 . Como datos de referencia puede considerar que para obtener reproducción de calidad de sonido de alta fidelidad para un disco CD de música, se suele utilizar, al menos, una frecuencia de muestreo de 44.000 muestras por segundo. Los datos obtenidos en cada muestra se codifican en 16 bits (32 bits para grabaciones en estéreo). Como dato anec- dótico, cada segundo de música grabada en estéreo requiere más de un millón de bits. Un sistema de codificación de música muy extendido en sintetizadores musicales es MIDI (Musical Instruments Digital Interface) que se encuentra en sintetizadores de música para sonidos de videojuegos, sitios web, teclados electrónicos, etc. 1.4. CODIFICACIÓN DE LA INFORMACIÓN La información que manejan las computadoras es digital. Esto significa que esta información se construye a partir de unidades contables llamadas dígitos. Desde el punto de vista físico, las unidades de una computadora están cons- tituidas por circuitos formados por componentes electrónicos denominados puertas, que manejan señales eléctricas que no varían de modo continuo sino que sólo pueden tomar dos estados discretos (dos voltajes). Cerrado y abierto, bajo y alto, 0 y 1. De este modo la memoria de una computadora está formada por millones de componentes de na- turaleza digital que almacenan uno de dos estados posibles. Una computadora no entiende palabras, números, dibujos ni notas musicales, ni incluso letras del alfabeto. De hecho, sólo entienden información que ha sido descompuesta en bits. Un bit, o dígito binario, es la unidad más pe- queña de información que una computadora puede procesar. Un bit puede tomar uno de dos valores: 0 y 1. Por esta razón las instrucciones de la máquina y los datos se representan en códigos binarios al contrario de lo que sucede en la vida cotidiana en donde se utiliza el código o sistema decimal. 1.4.1. Sistemas de numeración El sistema de numeración más utilizado en el mundo es el sistema decimal que tiene un conjunto de diez dígitos (0 al 9) y con la base de numeración 10. Así, cualquier número decimal se representa como una expresión aritmética de potencias de base 10; por ejemplo, 1.492, en base 10, se representa por la cantidad: 1492 = 1.103 + 4.102 + 9.101 + 2.100 = 1.1000 + 4.100 + 9.10 + 2.1 y 2.451,4 se representa por 2451,4 = 2.103 + 4.102 + 5.101 + 1.100 + 4.10–1 = 2.1000 + 4.100 + 5.10 + 1.1 + 4.0,1 Además del sistema decimal existen otros sistemas de numeración utilizados con frecuencia en electrónica e in- formática (computación): el sistema hexadecimal y el sistema octal. El sistema o código hexadecimal tiene como base 16, y 16 dígitos para su representación (0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E y F), los diez dígitos decimales y las primeras letras del alfabeto que re- presentan los dígitos de mayor peso, de valor 10, 11, 12, 13, 14 y 15. El sistema o código octal tiene por base 8 y 8 dígitos (0, 1, 2, 3, 4, 5, 6 y 7). En las computadoras, como ya se ha comentado, se utiliza el sistema binario o de base 2 con dos dígitos: 0 y 1. En el sistema de numeración binario o digital, cada número se representa por un único patrón de dígitos 0 y 1. La Tabla 1.6 representa los equivalentes de números en código decimal y binario. 12 En las obras del profesor Alberto Prieto, Schaum “Conceptos de Informática e Introducción a la Informática”, publicadas en McGraw-Hill, puede encontrar una excelente referencia sobre estos conceptos y otros complementarios de este capítulo introductorio.
  • 50. 20 Fundamentos de programación Tabla 1.6. Representación de números decimales y binarios Representación decimal Representación binaria 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 0 1 10 11 100 101 110 111 1000 1001 1010 1011 1100 1101 1110 1111 Así, un número cualquiera se representará por potencias de base 2, tal como: 54 en decimal (54) equivale a 00110110 54 = 00110110 = 0.27 + 0.26 + 1.25 + 1.24 + 0.23 + 1.22 + 1.21 + 0.20 = 0 + 0 + 32 + 16 + 0 + 4 + 2 + 0 = 54 La Tabla 1.7 representa notaciones equivalentes de los cuatro sistemas de numeración comentados anteriormente. Tabla 1.7. Equivalencias de códigos decimal, binario, octal y hexadecimal Decimal Binario Octal Hexadecimal 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 1 10 11 100 101 110 111 1000 1001 1010 1011 1100 1101 1110 1111 10000 10001 10010 10011 10100 0 1 2 3 4 5 6 7 10 11 12 13 14 15 16 17 20 21 22 23 24 0 1 2 3 4 5 6 7 8 9 A B C D E F 10 11 12 13 14
  • 51. Introducción a las computadoras y los lenguajes de programación 21 1.5. DISPOSITIVOS DE ALMACENAMIENTO SECUNDARIO (ALMACENAMENTO MASIVO) La memoria secundaria, mediante los dispositivos de almacenamiento secundario, proporciona capacidad de almace- namiento fuera de la UCP y del almacenamiento o memoria principal. El almacenamiento secundario es no volátil y mantiene los datos y programas, incluso cuando se apaga la computadora. Las unidades (drives, en inglés), periféricos o dispositivos de almacenamiento secundario son dispositivos periféricos que actúan como medio de soporte para almacenar datos —temporal o permanentemente— que ha de manipular la UCP durante el proceso en curso y que no puede contener la memoria principal. Las tecnologías de almacenamiento secundario más importantes son discos magnéticos, discos ópticos y cintas magnéticas. El dispositivo de almacenamiento secundario más común es la unidad de disco o disquetera, que sirve para alojar los discos. En ella se almacenan y recuperan datos y programas de un disco, transfiriendo los datos entre la memoria secundaria y la memoria principal. La información almacenada en la memoria central es volátil (desaparece cuando se apaga la computadora) y la información almacenada en la memoria auxiliar es permanente. Esta información contenida en la memoria secunda- ria se conserva en unidades de almacenamiento denominadas archivos (ficheros, files en inglés) que pueden ser tan grandes como se desee. Un programa, por ejemplo, se almacena en un archivo y se copia en memoria principal cuan- do se ejecuta el programa. Se puede almacenar desde un programa, hasta un capítulo de un libro, un inventario de un almacén o un listado de clientes o cualquier otra unidad de información como música, archivos MP3, DivX, un correo electrónico, etc. Los resultados de los programas se pueden guardar como archivos de datos y los programas que se escriben se guardan como archivos de programas, ambos en la memoria auxiliar. Cualquier tipo de archivo se puede transferir fácilmente desde la memoria auxiliar hasta la central para su proceso posterior. 1.5.1. Discos magnéticos Los discos son dispositivos formados por componentes electromagnéticos que permiten un acceso rápido a bloques físicos de datos. La información se registra en la superficie del disco y se accede a ella por medio de cabezas de lectura/escritura que se mueven sobre la superficie. Los discos magnéticos se clasifican en disquetes (flopy disk), ya prácticamente en desuso, y discos duros (hard disk). Los primeros disquetes, antes del advenimiento del PC eran de 8 pulgadas; posteriormente aparecieron del tama- ño de 5 1/4" de 360 KB de capacidad que llegaron a alcanzar 1,2 MB (ya prácticamente en desuso) y los que se fabrican en la actualidad de 3,5" y capacidad de 1,44 Megabytes (2,8 MB, en algunos casos). Los disquetes han sido muy populares, pero hoy día cada vez se utilizan menos, su gran ventaja era su tamaño y que eran transportables de una computadora a otra, además, era relativamente fácil grabar y borrar su información. Los discos duros también llamados discos fijos (hard disk) se caracterizan por su gran capacidad de almacenamiento (del orden de decenas, centenas y millares de GB, TB, etc.) y porque normalmente se encuentran empotrados en la unidad física de la com- putadora. Las computadoras grandes utilizan múltiples discos duros ya que ellos requieren gran capacidad de alma- cenamiento que se mide en Gigabytes o en Terabytes. Es posible ampliar el tamaño de los discos duros de una computadora, bien cambiándolos físicamente por otros de capacidad mayor o bien añadiendo otros a los existentes. Un disco debe ser formateado antes de ser utilizado. La operación de formateado escribe información en el disco de modo que los datos se pueden escribir y recuperar eficientemente. El proceso de formatear un disquete es análo- go al proceso de dibujar líneas en un aparcamiento y la numeración de las correspondientes plazas. Permite que la información se sitúe (plaza de aparcamiento o “parqueo”) y se recupere (encontrar su automóvil de modo rápido y seguro). Esto explica por qué un disco tiene menos espacio en el mismo después de que ha sido formateado (al igual que un aparcamiento, ya que las líneas y la numeración ocupan un espacio determinado). Hoy día se comercializan numerosos discos duros transportables (removibles) que se conectan fácilmente median- te los controladores USB que se verán posteriormente y que se comercializan con tamaños de centenares de MB hasta 1 y 2 TB. 1.5.2. Discos ópticos: CD-ROM y DVD Los discos ópticos difieren de los tradicionales discos duros o discos magnéticos en que los primeros utilizan un haz de láser para grabar la información. Son dispositivos de almacenamiento que utilizan la misma tecnología que los dispositivos compactos de audio para almacenar información digital. Por esta razón suelen tener las mismas caracte-
  • 52. 22 Fundamentos de programación rísticas que los discos de música: muy resistentes al paso del tiempo y con gran capacidad de almacenamiento. Estos discos se suelen utilizar para almacenar información histórica (no va a sufrir modificaciones frecuentes), archivos gráficos complejos, imágenes digitales, etc. Al igual que los disquetes, son transportables y compatibles entre com- putadoras. Los dos grandes modelos existentes en la actualidad son los discos compactos (CD) y los discos versátiles digitales (DVD). El CD-ROM (el cederrón)13 (Compact Disk-Read Only Memory, Disco compacto - Memoria de solo lectura) Estos discos son el medio ideal para almacenar información de forma masiva que no necesita ser actualizada con frecuencia (dibujos, fotografías, enciclopedias...). La llegada de estos discos al mercado hizo posible el desarrollo de la multimedia, es decir, la capacidad de integrar medios de todo tipo (texto, sonido e imágenes). Permiten almacenar 650 o 700 Megabytes de información. En la actualidad son muy económicos, alrededor de medio euro (medio dólar). Estos discos son de sólo lectura, por lo que sólo se pueden grabar una vez. Estos discos conocidos como CD-R o CD+R son cada día más populares y han sustituido a los disquetes de 3,5". Existen discos CD que permiten grabación de datos, además de lectura y se conocen como discos CD-RW (CD- Recordable y ReWritable). Desde hace años es posible encontrar en el mercado estos discos ópticos CD en los que se puede leer y escribir información por parte del usuario cuantas veces se deseen. Es el modelo regrabable, por excelencia. Este modelo se suele utilizar para realizar copias de seguridad del disco duro o de la información más sensible, al poder actualizarse continuamente. Aunque nació para emplearse en servidores, estaciones de trabajo, etc., hoy día, es un disco que suele utilizarse en computadoras personales de grandes prestaciones. Las unidades lectoras y grabadoras de discos14 de este tipo, tiene ya precios asequibles y son muchos los usuarios, incluso, domésticos, que incorporan estas unidades a sus equipos informáticos. DVD (Digital Versatile Disc): Videodisco digital (DVD-+RW, DVD de alta capacidad de almacenamiento: HD DVD y Blu-ray) Este disco óptico nació en 1995, gracias a un acuerdo entre los grandes fabricantes de electrónica de consumo, estu- dios de cine y de música (Toshiba, Philips, Hitachi, JVC, etc.). Son dispositivos de alta capacidad de almacenamien- to, interactivos y con total compatibilidad con los medios existentes. Tiene además una gran ventaja: su formato sirve tanto para las computadoras como para los dispositivos de electrónica de consumo. El DVD es capaz de alma- cenar hasta 26 CD con una calidad muy alta y con una capacidad que varía, desde los 4,7 GB del tipo de una cara y una capa hasta los 17 GB del de dos caras y dos capas, o lo que es igual, el equivalente a la capacidad de 7 a 26 CD convencionales. Estas cifras significan que se pueden almacenar en uno de estos discos una película completa en diferentes idiomas e incluso subtítulos. En la actualidad se pueden encontrar tres formatos de DVD grabables: DVD-R (se puede grabar una sola vez); DVD-RAM (reescribible pero con un funcionamiento similar al disco duro); DVD-RW (lectura y escritura, regraba- ble). Al igual que en el caso de los discos compactos, requieren de unas unidades especiales de lectura y reproducción, así como grabadoras/regrabadoras. Estas últimas se encuentran ya en el mercado, a precios muy asequibles. La ma- yoría de las computadoras que se comercializan en cualquier gran almacén incluyen de serie una unidad lectora de DVD y grabadora de CD-RW o de DVD, que permiten grabar una y otra vez en los discos de formato RW. Comien- za a ser también frecuente encontrar PCs con unidades de grabación de todos los formatos DVD, tales como DVD-R, DVD+R, DVD-RW y DVD+RW y, ya son una realidad, los nuevos DVD de alta definición de Toshiba y Blu-ray de Sony de alta capacidad de almacenamiento (15 GB a 50 GB). En abril de 2006 se presentaron los 16 nuevos lectores de DVD de gran capacidad de almacenamiento de Toshiba (HD DVD, de 15 GB a 30 GB) y Blu-ray de Sony (de 25 GB a 50 GB), y a finales del primer semestre de 2007, Toshiba presentó su nuevo HD_DVD de 3 capas con lo que llegó a 51 GB y así competir directamente con Sony también en capacidad (Figura 1.6). Discos duros virtuales Es un nuevo dispositivo de almacenamiento de información que no reside en la computadora del usuario sino en un espacio virtual residente en un sitio Web de Internet (de tu propia empresa, o de cualquiera otra que ofrezca el servicio). 13 La última edición (22.ª, 2001) del Diccionario de la Lengua Española (DRAE) ha incorporado el término cederrón. 14 En Hispanoamérica se conoce también a estas unidades como unidades “quemadoras” de disco, traducción fiel del término anglosajón.
  • 53. Introducción a las computadoras y los lenguajes de programación 23 Es una buena opción para el usuario (estudiantes, particulares, profesionales, empresas...) de tipo medio y empresas que utilizan grandes volúmenes de información y que necesitan más espacio y no lo tienen disponible en sus equipos. Este almacenamiento o alojamiento puede ser gratuito o de pago, pero en cualquier forma no deja de ser una intere- sante oferta para el programador que encuentra un lugar donde situar aplicaciones, archivos, etc., que no puede alma- cenar en su computadora. El inconveniente de esta solución es el riesgo que se ha de asumir al depositar información en lugares no contro- lados por uno mismo. Esta situación plantea la necesidad de un estudio de la privacidad y seguridad que van a tener los datos que deposite en estos discos virtuales. La Tabla 1.8 muestra algunas direcciones de almacenamiento virtual en Internet que en algunos casos son gratuitos. Tabla 1.8. Algunas direcciones de sitios Web para almacenamiento virtual de datos Nombre de la empresa Dirección de Internet Xdrive www.xdrive.com FreeDrive (propiedad de Xdrive) www.freedrive.com FreeMailGuide www.freemailguide.com Yahoo¡ Briefcase (necesita registro previo) briefcase.yahoo.com Hoy, además de sitios como los referenciados en la tabla anterior, la mayoría de los buscadores de Internet ofre- cen una gran capacidad de almacenamiento gratuito, donde se pueden almacenar gran cantidad de datos además de los correos electrónicos, y totalmente gratuitos, y con un programa adecuado se puede también convertir este espacio de correo electrónico en espacio para un disco duro virtual. Los servicios de correo electrónico (webmail) ofrecen capacidad de almacenamiento creciente que pueden ser muy bien utilizados por el internauta15 . 15 La tendencia en 2008, es aumentar el almacenamiento gratuito que ofrecen los grandes buscadores. Gmail, ofrece en febrero de 2008, la cantidad de 6389 MB, o sea más de 6,2 GB, de almacenamiento gratuito a sus clientes de correo electrónico. Yahoo! ofrece almacenamiento ili- mitado y Windows Live Hotmail más de 5 GB. Figura 1.6. Unidad de disco USB (arriba izquierda), unidad de DVD regrabable (arriba derecha), lector de Blu-ray (abajo).
  • 54. 24 Fundamentos de programación 1.5.3. Discos y memorias Flash USB Los chips de memoria flash, similares a los chips de RAM, son unos chips con una tecnología especial, flash, en los que se puede escribir y borrar rápida y repetidamente, pero al contrario que las memorias RAM, las memorias flash no son volátiles y se puede mantener su contenido sin alimentación eléctrica. Cámaras digitales, teléfonos celulares (móviles), computadoras portátiles, PDA, y otros dispositivos digitales utilizan memoria flash para almacenar datos que necesitan modificarse en el transcurso del tiempo. Las memorias flash siguen siendo muy caras aunque el proceso de abaratamiento se ha iniciado en estos últimos años y pronto reemplazarán a discos y chips de memoria tradicionales. Hoy día, finales de 2007, es relativamente fácil encontrar tarjetas de memorias flash o lápices USB (pen drives) de 1 GB a 8 GB por precios muy asequibles (15 a 30 €) y la tendencia es aumentar la cantidad de memoria que almacena y reducción del precio. Asimismo los discos duros externos con conexiones mediante USB se comercializan con tamaños de memoria de cientos de GB hasta Terabytes (1 y 2 TB son capacidades de unidades de disco externo USB que se encuentran fácilmente en grandes almacenes y tiendas especializadas y también con precios asequibles en torno a 100 y 200 €). Una memoria flash, también comercializada como un disco es un pequeño almacén de memoria móvil de un ta- maño algo mayor que un mechero o llavero (por esta razón a veces se les llama llaveros flash) y por consiguiente se puede transportar en el bolsillo de una prenda de vestir. Este disco o memoria se puede conectar a cualquier PC de escritorio o portátil que disponga de una conexión USB (véase apartado 1.4.2). Se comercializa por muchos fabri- cantes16 y se han convertido en el medio más económico y práctico para llevar archivos de cualquier tipo e incluso hasta programas como copias de seguridad. Los discos duros USB al ser regrabables y de fácil instalación (sólo ne- cesitan enchufarse en un puerto USB) se están constituyendo en el medio idóneo para almacenamiento de información personal y como dispositivo de copia de seguridad. Figura 1.7. Tarjeta compact flash (izquierda), memoria flash USB (centro) y disco duro (derecha). 1.5.4. Otros dispositivos de Entrada y Salida (E/S) Los dispositivos de entrada y de salida permiten la comunicación entre las personas y la UCP. Un dispositivo de entrada es cualquier dispositivo que permite que una persona envíe información a la computadora. Los dispositivos de entrada, por excelencia, son un teclado y un ratón. Entre otras cosas un ratón se utiliza para apuntar, moverse por la pantalla y elegir una lista de opciones visualizadas en la pantalla. El dispositivo fue bautizado como ratón (mouse en inglés, jerga muy utilizada también en Latinoamérica) porque se conecta a la computadora por un largo cable y el conjunto se asemeja a un ratón. El ratón típico tiene dos o tres botones, e incluso una pequeña ruedecita que per- mite desplazarse por menús y similares en la pantalla. El puntero en la pantalla se conoce como cursor o sprite. Moviéndose con el ratón de modo que el cursor apunte a una región específica de la pantalla (por ejemplo, un menú de una aplicación) y haciendo clic en el botón del ratón, se puede señalar a la computadora para que realice la orden indicada en la opción del menú. El uso del ratón y de menús facilita dar órdenes a la computadora y es mucho más sencillo que las tediosas órdenes de tecleado que siempre se deben memorizar. Algunos dispositivos de entrada, no tan típicos pero cada vez más usuales en las configuraciones de sistemas informáticos son: escáner, lápiz óptico, mi- crófono y reconocedor de voz. 16 En febrero de 2006.
  • 55. Introducción a las computadoras y los lenguajes de programación 25 Un dispositivo de salida es cualquier dispositivo que permite a una computadora pasar información al usuario. El dispositivo de salida por excelencia es la pantalla de presentación, también llamada monitor o terminal. Otro dis- positivo de salida muy usual es la impresora para producir salidas impresas en papel. Al teclado y la pantalla inte- grados se les suele conocer también como terminal o VDT (video display terminal). El monitor, conocido también como CRT (cathode ray tube) funciona igual que un aparato de televisión. El mo- nitor está controlado por un dispositivo de salida denominado tarjeta gráfica. Las tarjetas gráficas envían los datos para ser visualizados en el monitor con un formato que el monitor puede manipular. Las características más importan- tes del monitor y la tarjeta gráfica son la velocidad de refresco, la resolución y el número de colores soportados. La velocidad de refresco es la velocidad a la cual la tarjeta gráfica actualiza la imagen en la pantalla. Una tasa de refres- co baja tal como 60 KHz, puede producir fatiga en los ojos ya que la imagen puede parpadear imperceptiblemente. Las tarjetas gráficas usuales presentan tasas de refresco de 70 a 100 MHz. Esta frecuencia elimina el parpadeo y la consiguiente fatiga para los ojos. La resolución es el número de puntos por pulgada que se pueden visualizar a lo lar- go de la pantalla. Un punto (dot) en este contexto se conoce como un píxel (picture elemental). En los monitores clá- sicos VGA una resolución típica es 640 × 480: hay 640 pixels en el sentido horizontal de la pantalla y 480 pixels en el vertical. La tarjeta gráfica almacena la información en la pantalla para cada píxel en su propia memoria. Las tarjetas gráficas que pueden visualizar a resoluciones más altas requieren más memoria. Por ejemplo muchas tarjetas soportan resoluciones que corren desde 800 × 640 hasta 12.180 × 1.024. Tales tarjetas requieren 1 a 4 Mb de memoria. Rela- cionado directamente con la cantidad de memoria y la resolución es el número de colores que se pueden visualizar. La tarjeta gráfica debe almacenar la información del color para visualizar cada píxel en la pantalla. Para visualizar 256 (28 ) colores, se necesita 1 byte por cada píxel. Dado que las personas y las computadoras utilizan lenguajes diferentes se requiere algún proceso de traducción. Las interacciones con un teclado, la pantalla o la impresora tienen lugar en el idioma español, el inglés o cualquier otro como el catalán. Eso significa que en la jerga informática cuando se pulsa la letra C (de Carchelejo) en un te- clado se produce que una letra C vaya a la pantalla del monitor, o a una impresora y allí se visualice o se imprima como una letra C. Existen diversos códigos de uso frecuente. El código más usual entre computadoras es el ASCII (acrónimo de American Standard Code for Information Interchange) que es un código de siete bits que soporta letras mayúsculas y minúsculas del alfabeto, signos numéricos y de puntuación, y caracteres de control. Cada dispositivo tiene su propio conjunto de códigos pero los códigos construidos para un dispositivo no son necesariamente los mis- mos códigos construidos para otros dispositivos. Algunos caracteres, especialmente caracteres tales como tabulacio- nes, avances de línea o de página y retornos de carro son manipulados de modo diferente por dispositivos diferentes e incluso por piezas diferentes de sistemas software que corren sobre el mismo dispositivo. Desde la aparición del lenguaje Java y su extensión para aplicaciones en Internet se está haciendo muy popular el código Unicode que fa- cilita la integración de alfabetos de lenguajes muy diversos no sólo los occidentales, sino orientales, árabes, etc. Nuevos dispositivos de E/S móviles Los sistemas de transmisión de datos que envían señales a través del aire o del espacio sin ninguna atadura física se han vuelto una alternativa fiable a los canales cableados tradicionales tales como el cable de cobre, cable coaxial o de fibra óptica. Hoy en programación se utilizan como dispositivos de E/S, teléfonos inteligentes (smartphones), asistentes digitales personales, PDA y redes de datos móviles. Los teléfonos móviles (celulares) son dispositivos que transmiten voz o datos (últimamente también imágenes y sonidos) que utilizan ondas radio para comunicarse con antenas de radios situados en celdas (áreas geográficas adyacen- tes) que a su vez se comunican con otras celdas hasta llegar a su destino, donde se transmiten al teléfono receptor o al servidor de la computadora al que está conectado. Los nuevos modelos de teléfonos digitales pueden manejar co- rreo voz, correo electrónico y faxes, almacenan direcciones, acceden a redes privadas corporativas y a información de Internet. Los teléfonos inteligentes vienen equipados con software de navegación Web que permite a estos dispo- sitivos acceder a páginas Web cuyos formatos han sido adaptados al tamaño de sus pantallas. Los asistentes personales digitales (PDA) son pequeñas computadoras de mano capaces de realizar transmi- siones de comunicaciones digitales. Pueden incorporar17 telecomunicaciones inalámbricas y software de organi- zación del trabajo de oficina o para ayuda al estudio. Nokia, Palm, HP, Microsoft son algunos de los fabricantes que construyen este tipo de dispositivos. Los teléfonos móviles o celulares y los PDAs pueden venir incorporados con tecnologías GPRS o tecnología UMTS/CDMA. Las tecnologías GPRS conocidas como generación 2.5 per- 17 Este es el caso del PDA del fabricante español Airis que comercializa a un coste asequible, un teléfono/PDA.
  • 56. 26 Fundamentos de programación miten velocidades de transmisión de 50 a 100 Kbps, similar y un poco mayor a la velocidad de la red de telefo- nía básica, RTB. Los teléfonos UMTS/CDMA que ya se comercializan en Europa18 y también en América y Asia, se conocen como teléfonos de 3.ª generación (3G), y permiten velocidades de transmisión hasta 1 o 2 Mbps, igual cantidad que las telefonías digitales ADSL. Figura 1.8. Blackberry (izquierda), Palm Treo (centro) y HP iPAQ hw6500 (derecha). 1.6. CONECTORES DE DISPOSITIVOS DE E/S Los dispositivos de E/S no se pueden conectar directamente a la UCP y la memoria, dada su diferente naturaleza. Los dispositivos de E/S son dispositivos electromecánicos, magnéticos u ópticos que además funcionan a diferentes velocidades, la UCP y la memoria son dispositivos electrónicos. Por otra parte los dispositivos de E/S operan a una velocidad mucho más lenta que la UCP/memoria. Se requiere por consiguiente de un dispositivo intermediario o adaptador denominado interfaz o controlador. Existe un controlador específico para cada dispositivo de entrada/sa- lida que puede ser de software o de hardware. Los controladores de hardware más utilizados presentan al exterior conectores donde se enchufan o conectan los diferentes dispositivos. Cada computadora tiene un número determina- do de conectores estándar incorporados y que se localizan fácilmente en el exterior de su chasis. Los sistemas ope- rativos modernos como Windows XP reconocen automáticamente los dispositivos de E/S tan pronto se conectan a la computadora. Si no es así necesitará cargar en memoria un programa de software denominado controlador del dis- positivo correspondiente con el objetivo de que el sistema operativo reconozca al citado dispositivo. Los conectores más comunes son: puertos serie y paralelo, buses USB y firewire. 1.6.1. Puertos serie y paralelo El PC está equipado con puertos serie y paralelo. El puerto serie (como mínimo suele tener dos) es un conector ma- cho de la parte trasera o lateral del PC con 9 o 25 clavijas, aunque sólo suelen utilizarse 3 o 4 para la transmisión en serie. El puerto paralelo también se denomina puerto de impresora, ya que es donde solía conectarse la impresora 18 Ya comienza a extenderse, al menos en el ámbito empresarial, las tarjetas digitales del tipo PCMCIA, 2.5G/3G que son tarjetas módem 2G/3G con una memoria SIM y número teléfono móvil (celular) incorporado y que enchufadas a una computadora portátil permiten conexiones a Internet a velocidad UMTS y en aquellas zonas geográficas donde no exista cobertura, automáticamente se conecta a velocidad 2.5 G (GPRS) que tiene mayor cobertura en el resto del territorio. En España desde el mes de julio de 2004, tanto Vodafone como Telefónica Móviles ofrecen estas soluciones.
  • 57. Introducción a las computadoras y los lenguajes de programación 27 hasta que aparecieron los conectores USB. El conector de la impresora de la parte trasera del PC es un conector hembra de 25 clavijas. Los puertos se llaman también COM1, COM2 y LPT conocidos por nombres de dispositivos lógicos que el programa de inicio del PC automáticamente asigna a estos dispositivos durante el inicio, por ejemplo A:, C:, E:, CON, PRN y KBD son nombres lógicos. 1.6.2. USB USB son las siglas de Universal Serial Bus (Bus serie universal) y corresponden a un bus estándar de E/S que desa- rrollaron originalmente varias empresas, entre ellas Compaq, Digital, IBM, Intel, Microsoft, NEC y Northern Tele- com19 . La importancia del bus USB es que es un bus de E/S serie de precio asequible con una especificación prácti- ca, lo que significa que cualquiera puede producir productos USB sin tener que pagar ninguna licencia. Sin duda, el bus USB es la innovación más importante y de éxito del mundo PC en muchos años. Es un bus de expansión que permite conectar una gran cantidad de equipamiento al PC. El objetivo del USB conseguido es reunir las diferentes conexiones del teclado, el ratón, el escáner, el joystick, la cámara digital, impresora, disco duro, etc., en un bus compartido conectado a través de un tipo de conector común. Otra gran ventaja es también su compatibilidad con computadoras Macintosh. Existen dos versiones: USB 1.1 cuya velocidad de transferencia está limitada a un máximo de 12 Mbps; USB 2.0 puede transmitir hasta 40 Mbps y se utiliza en todos los PC modernos. La versión 2.0 es compatible descendente; es decir, un dispositivo con un conector USB 2.0 es compatible con los conectores 1.1 y no siempre sucede igual al revés. Otra gran ventaja es que ya se fabrican distribuidores (hubs) que permiten conectar numerosos dispositivos USB a un único bus USB. Con indepen- dencia de la conexión de distribuidores USB, ya es frecuente que tanto los PC de escritorio como los portátiles ven- gan de fábrica con un número variable de 2 a 8 e incluso 10 puertos USB, normalmente el estándar 2.0. 1.6.3. Bus IEEE Firewire – 1394 El bus IEEE 1394 (firewire) es una nueva interfaz SCSI (un bus antiguo pero avanzado utilizado para discos duros, unidades de CD-ROM, escáneres y unidades de cinta). Es un bus serie de alta velocidad con una velocidad de trans- ferencia máxima de 400 Mbps patentado por Apple. Es una interfaz estándar de bus serie para computadoras perso- nales (y vídeo/audio digital). IEEE 1394 ha sido adoptado como la interfaz de conexiones estándar HANA (High Definition Audio-Video Network Alliance) para comunicación y control de componentes audiovisuales. Firewire está también disponible en versiones inalámbricas (wireless), fibra óptica y cable coaxial. Las computadoras Apple y Sony suelen venir con puertos firewire, y ya comienza a ser usual que los PC incluyan al menos un puerto firewire. Las actuales videocámaras digitales y otros dispositivos de audio e imagen suelen incorporar conectores firewire. Figura 1.9. Conectores USB (izquierda) y conector Firewire (derecha). 19 En el sitio www.usb.org y en el forum “USB Implementers Forum” puede encontrar historia y características del bus USB.
  • 58. 28 Fundamentos de programación 1.7. REDES, WEB Y WEB 2.0 Hoy día las computadoras autónomas (standalone) prácticamente no se utilizan (excepción hecha del hogar) y están siendo reemplazadas hasta en los hogares y en las pequeñas empresas, por redes de computadoras. Una red es un conjunto de computadoras conectadas entre sí para compartir recursos. Al contrario que una gran computadora que es una única computadora compartida por muchos usuarios, una red (network) consta de muchas computadoras que comparten recursos. Las computadoras modernas necesitan comunicarse con otras computadoras. Si la computadora se conecta con una tarjeta de red se puede conectar a una red de datos locales (red de área local). De este modo se puede acceder y compartir a cada una de las memorias de disco y otros dispositivos de entrada y salida. Si la computadora tiene un módem, se puede comunicar con computadoras distantes. Se pueden conectar a una red de datos o enviar correo electrónico a través de las redes corporativas Intranet/Extranet o la propia red Internet. También es posible enviar y recibir mensajes de fax. El uso de múltiples computadoras enlazadas por una red de comunicaciones para distribuir el proceso se deno- mina proceso distribuido en contraste con el proceso centralizado en el cual todo el proceso se realiza por una com- putadora central. De esta forma los sistemas de computadoras también se clasifican en sistemas distribuidos y sis- temas centralizados. Las redes se pueden clasificar en varias categorías siendo las más conocidas las redes de área local (LAN, Local Area Network) y las redes área amplia o ancha WAN (Wide Area Network). Una Red de Área Local permite a mu- chas computadoras acceder a recursos compartidos de una computadora más potente denominada servidor. Una WAN es una red que enlaza muchas computadoras personales y redes de área local en una zona geográfica amplia. La red WAN más conocida y popular en la actualidad es la red Internet que está soportada por la World Wide Web. Una de las posibilidades más interesantes de las computadoras es la comunicación entre ellas cuando se encuen- tran en sitios separados físicamente y se encuentran enlazadas por vía telefónica. Estas computadoras se conectan en redes LAN (Red de Área Local) y WAN (Red de Área Ancha), aunque hoy día las redes más implantadas son las redes que se conectan con tecnología Internet y por tanto conexión a la Red Internet. Estas redes son Intranet y Ex- tranet y se conocen como redes corporativas ya que enlazan computadoras de los empleados de las empresas. Las instalaciones de las comunicaciones requieren de líneas telefónicas analógicas o digitales y de modems. Los sistemas distribuidos realizan el proceso de sus operaciones de varias formas siendo las más conocidas clien- te-servidor e igual-a-igual (peer-to-peer, P2P). Compartición de recursos Uno de los usos más extendidos de la red es permitir a diferentes computadoras compartir recursos tales como sis- temas de archivos, impresoras, escáneres o discos DVD. Estas computadoras normalmente se conectan en una relación denominada cliente-servidor (Figura 1.10). El servidor posee los recursos que se quieren compartir. Los clientes conectados vía un concentrador (hub) o una conexión ethernet comparten el uso de estos recursos. El usuario de una CLIENTE SERVIDOR CLIENTE CLIENTE CLIENTE CLIENTE SERVIDOR Petición de servicio Servicio solicitado Figura 1.10. Sistema de computadoras Cliente/Servidor.
  • 59. Introducción a las computadoras y los lenguajes de programación 29 máquina cliente puede imprimir documentos o acceder a archivos como si los dispositivos realmente estuvieran físi- camente conectados a la máquina local. Esto puede dar la ilusión de que realmente se tienen más recursos de los que realmente existen, así como un entorno de programación uniforme, independiente de la máquina que realmente se utilice. El sistema cliente-servidor es el más popular en computación. El sistema divide el procesamiento de las tareas entre las computadoras “cliente” y las computadoras “servidor” que a su vez están conectadas en red. A cada máqui- na se le asignan funciones adecuadas a sus características. El cliente es el usuario final o punto de entrada a la red y normalmente en una computadora personal de escritorio o portátil, o una estación de trabajo. El usuario, normal- mente interactúa directamente sólo con la parte cliente del sistema, normalmente, para entrada o recuperación de información y uso de aplicaciones para análisis y cálculos posteriores. El servidor proporciona recursos y servicios a otras computadoras de la red (los clientes). El servidor puede ser desde una gran computadora a otra computadora de escritorio pero especializada para esta finalidad y mucho más potente. Los servidores almacenan y procesan los datos compartidos y también realizan las funciones no visibles, de segundo plano (back-end), a los usuarios, tales como actividades de gestión de red, implementación de bases de da- tos, etc. La Figura 1.10 muestra un sistema cliente/servidor. La red Internet es el sistema cliente/servidor más po- pular. 1.7.1. Redes P2P, igual-a-igual (peer-to-peer, P2P) Otra forma de sistema distribuido es la computación P2P20 (peer-to-peer) que es un sistema que enlaza las compu- tadoras vía Internet o redes privadas de modo que pueden compartir tareas de proceso. El modelo P2P se diferencia del modelo de red cliente/servidor en que la potencia de proceso reside sólo en las computadoras individuales de modo que trabajan juntos colaborando entre sí, pero sin un servidor o cualquier otra computadora que los controle. Los sistemas P2P utilizan espacio de disco o potencia de proceso del PC no utilizado por los sistemas en red. Estos sistemas P2P se utilizan hoy con gran profusión en ambientes científicos y de investigación, así como para descargas de música por Internet. 1.7.2. Aplicaciones de las redes de comunicaciones En el interior de la computadora los diferentes componentes de hardware se comunican entre sí utilizando el bus interno. Hoy día es práctica común que las computadoras se comuniquen unas con otras compartiendo recursos e información. Esta actividad es posible a través del uso de redes, con cables físicos (normalmente teléfonos alámbri- cos), junto con transmisiones electrónicas, sin cables (inalámbricas) mediante teléfonos móviles o celulares, redes inalámbricas o tecnologías Bluetooth. Existen muchos tipos de redes. Una red de área local (LAN, local area network) normalmente une decenas y a veces centenares de computadoras en una pequeña empresa u organismo público. Una red global, tal como Internet, que se expande a distancias mucho mayores y conecta centenares o millares de máquinas que, a su vez, se unen a redes más pequeñas a través de computadoras pasarela (gateway). Una computadora pasarela (gateway) es un puen- te entre una red tal como Internet en un lado y una red de área local en el otro lado. La computadora también suele actuar como un cortafuegos (firewall) cuyo propósito es mantener las transmisiones ilegales, no deseadas o peligro- sas fuera del entorno local. Estas redes se suelen conocer normalmente como redes Intranet y en realidad son redes corporativas o institucionales que utilizan tecnología Internet y que por consiguiente pueden enlazarse con otras redes de compañías socias, clientes, amigas, etc., y todo tipo de posibles clientes personales e institucionales sin necesidad de que estos a su vez formen una red. Otro uso típico de redes es la comunicación. El correo electrónico (e-mail) se ha convertido en un medio muy popular para enviar cartas y documentos de todo tipo así como archivos a amigos, clientes, socios, etc. La World Wide Web está proporcionando nuevas oportunidades comerciales y profesionales tanto a usuarios aislados como a usuarios pertenecientes a entidades y empresas. Las redes han cambiado también los conceptos y hábitos de los lu- gares de trabajo y el trabajo en sí mismo. Muchos estudiantes y profesionales utilizan las transmisiones de las redes entre el hogar y la oficina o entre dos oficinas de modo que puedan acceder a la información que necesiten siempre 20 Los sistemas P2P se hicieron muy populares y llegaron al gran público cuando un estudiante estadounidense, Shawn Fanning, inventó el sistema Napster, un sistema que permite descargas de música entre computadoras personales sin intervención de ningún servidor central.
  • 60. 30 Fundamentos de programación que lo necesiten, y de hecho desde el lugar que ellos decidan siempre que exista una línea telefónica o un teléfono móvil (celular). Otro concepto importante es la informática distribuida. Las redes se utilizan también para permitir que las com- putadoras se comuniquen entre sí. La complejidad de muchos problemas actuales requiere el uso de reservas de computación. Esto se puede conseguir por sincronización de los esfuerzos de múltiples computadoras, trabajando todas en paralelo en componentes independientes de un problema. Un sistema distribuido grande puede hacer uso de centenares de computadoras. 1.7.3. Módem El módem es un dispositivo periférico que permite intercambiar información entre computadoras a través de una línea telefónica. El módem es un acrónimo de Modulador-Demodulador, y es un dispositivo que transforma las señales digitales de la computadora en señales eléctricas analógicas telefónicas y viceversa, con lo que es posible transmitir y recibir información a través de la línea telefónica. El módem convierte una señal analógica en señal digital, y viceversa. Los modems permiten además de las conexiones entre computadoras, envío y recepción de faxes, acceso a In- ternet, etc. Una de las características importantes de un módem es su velocidad; cifras usuales son 56 kilobaudios (1 baudio es 1 bit por segundo, bps; 1Kbps son 1.000 baudios). Los modems pueden ser de tres tipos: Interno (es una tarjeta que se conecta a la placa base internamente); Ex- terno (es un dispositivo que se conecta externamente a la computadora a través de puertos COM, USB, etc.); PC-Card, son modems del tipo tarjeta de crédito, que sirven para la conexión a las computadoras portátiles. Además de los modems analógicos es posible la conexión con Internet y las redes corporativas de las compañías mediante la Red Digital de Sistemas Integrados (RDSI, IDSN, en inglés) que permite la conexión a 128 Kbps, dis- poniendo de dos líneas telefónicas, cada una de ellas a 64 Kbps (hoy día ya es poco utilizada). En la actualidad se está implantando a gran velocidad la tecnología digital ADSL que permite la conexión a Internet a velocidad superior a la red RDSI, 256 Kbps a 1 a 8 Mbps; son velocidades típicas según sea para “subir” datos a la Red o para “bajar”, respectivamente. Estas cifras suelen darse para accesos personales, ya que en accesos profesionales se pueden alcan- zan velocidades de hasta 20-40 Mbps, e incluso superior. 1.7.4. Internet y la World Wide Web Internet, conocida también como la Red de Redes, se basa en la tecnología Cliente/Servidor. Las personas que utili- zan la Red controlan sus tareas mediante aplicaciones Web tal como software de navegador. Todos los datos inclu- yendo mensajes de correo-e y las páginas Web se almacenan en servidores. Un cliente (usuario) utiliza Internet para solicitar información de un servidor Web determinado situado en una computadora lejana; el servidor envía la infor- mación solicitada al cliente vía la red Internet. Las plataformas cliente incluyen PC y otras computadoras pero también un amplio conjunto de dispositivos elec- trónicos de mano (handheld) tales como PDA, teléfonos móviles, consolas de juegos, etc., que acceden a Internet de modo inalámbrico (sin cables) a través de señales radio. La World Wide Web (WWW) o simplemente la Web fue creada en 1989 por Bernards Lee en el CERN (European Laboratory for Particles Physics) aunque su difusión masiva comenzó en 1993 como medio de comunicación universal. La Web es un sistema de estándares aceptados universalmente para almacenamiento, recuperación, formateado y visua- lización de información, utilizando una arquitectura cliente/servidor. Se puede utilizar la Web para enviar, visualizar, re- cuperar y buscar información o crear una página Web. La Web combina texto, hipermedia, sonidos y gráficos, utilizando interfaces gráficas de usuario para una visualización fácil. Para acceder a la Web se necesita un programa denominado navegador Web (browser). Un navegador21 es una interfaz gráfica de usuario que permite “navegar” a través de la Web. Se utiliza el navegador para visualizar textos, 21 El navegador más utilizado en la actualidad es Explorer de Microsoft, aunque Firefox alcanzaba ya un 10% del mercado. En su día fueron muy populares Netscape y Mosaic.
  • 61. Introducción a las computadoras y los lenguajes de programación 31 gráficos y sonidos de un documento Web y activar los enlaces (links) o conexiones a otros documentos. Cuando se hace clic (con el ratón) en un enlace a otro documento se produce la transferencia de ese documento situado en otra computadora a su propia computadora. La World Wide Web está constituida por millones de documentos enlazados entre sí, denominados páginas Web. Una página Web, normalmente, está construida por texto, imágenes, audio y vídeo, al estilo de la página de un libro. Una colección de páginas relacionadas, almacenadas en la misma computadora, se denomina sitio Web (Web site). Un sitio Web está organizado alrededor de una página inicial (home page) que sirve como página de entrada y pun- to de enlace a otras páginas del sitio. En el párrafo siguiente se describe cómo se construye una página Web. Cada página Web tiene una dirección única, conocida como URL (Uniform Resource Locator). Por ejemplo, la URL de la página inicial de este libro es: www.mhe.es/joyanes. La Web se basa en un lenguaje estándar de hipertexto denominado HTML (Hypertext Markup Language) que da formatos a documentos e incorpora enlaces dinámicos a otros documentos almacenados en la misma computadora o en computadoras remotas. El navegador Web está programado de acuerdo al estándar citado. Los documentos HTML, cuan- do, ya se han situado en Internet, se conocen como páginas Web y el conjunto de páginas Web pertenecientes a una mis- ma entidad (empresa, departamento, usuario individual) se conoce como sitio Web (Website). En los últimos años ha aparecido un nuevo lenguaje de marcación para formatos, heredero de HTML, y que se está convirtiendo en estándar universal, es el lenguaje XML. Otros servicios que proporciona la Web y ya muy populares para su uso en el mundo de la programación son: el correo electrónico y la mensajería instantánea. El correo electrónico (e-mail) utiliza protocolos específicos para el intercambio de mensajes: SMTP (Simple Mail Transfer Protocol), POP (Post Office Protocol) e IMAP (Internet Message Action Protocol). La mensajería instantánea o chat que permite el diálogo en línea simultánea entre dos o más personas, y cuya organización y estructura han sido trasladadas a los teléfonos celulares donde también se pue- de realizar este tipo de comunicaciones con mensajes conocidos como “cortos” SMS (short message) o MMS (mul- timedia message). Web 2.0 Este término, ya muy popular, alude a una nueva versión o generación de la Web basada en tecnologías tales como el lenguaje AJAX, los agregadores de noticias RSS, blogs, podcasting, redes sociales, interfaces de programación de aplicaciones Web (APIs), etc. En esencia, la Web 2.0, cuyo nombre data de 2004, fue empleado por primera vez por Tim O’Reilly, editor de la editorial O’Reilly, ha dado lugar a una Web más participativa y colaborativa, donde el usuario ha dejado de ser un actor pasivo para convertirse en un actor activo y participativo en el uso y desarrollo de aplicaciones Web. Figura 1.11. Elementos de la siguiente generación de la web. (Fuente: http://web2.wsj2.com.)
  • 62. 32 Fundamentos de programación 1.8. EL SOFTWARE (LOS PROGRAMAS) El software de una computadora es un conjunto de instrucciones de programa detalladas que controlan y coordinan los componentes hardware de una computadora y controlan las operaciones de un sistema informático. El auge de las computadoras el siglo pasado y en el actual siglo xxi, se debe esencialmente al desarrollo de sucesivas genera- ciones de software potentes y cada vez más amistosas (“fáciles de utilizar”). Las operaciones que debe realizar el hardware son especificadas por una lista de instrucciones, llamadas progra- mas, o software. Un programa de software es un conjunto de sentencias o instrucciones a la computadora. El pro- ceso de escritura o codificación de un programa se denomina programación y las personas que se especializan en esta actividad se denominan programadores. Existen dos tipos importantes de software: software del sistema y soft- ware de aplicaciones. Cada tipo realiza una función diferente. El software del sistema es un conjunto generalizado de programas que gestiona los recursos de la computadora, tal como el procesador central, enlaces de comunicaciones y dispositivos periféricos. Los programadores que escriben software del sistema se llaman programadores de sistemas. El software de aplicaciones es el conjunto de programas escritos por empresas o usuarios individuales o en equipo y que instruyen a la computadora para que ejecute una tarea específica. Los programadores que escriben software de aplicaciones se llaman programadores de aplicaciones. Los dos tipos de software están relacionados entre sí, de modo que los usuarios y los programadores pueden ha- cer así un uso eficiente de la computadora. En la Figura 1.12 se muestra una vista organizacional de una computa- dora donde se ven los diferentes tipos de software a modo de capas de la computadora desde su interior (el hardware) hasta su exterior (usuario). Las diferentes capas funcionan gracias a las instrucciones específicas (instrucciones má- quina) que forman parte del software del sistema y llegan al software de aplicación, programado por los programa- dores de aplicaciones, que es utilizado por el usuario que no requiere ser un especialista. Programas del sistema Programas de la aplicación Hardware Usuario Figura 1.12. Relación entre programas de aplicación y programas del sistema. 1.8.1. Software del sistema El software del sistema coordina las diferentes partes de un sistema de computadora y conecta e interactúa entre el software de aplicación y el hardware de la computadora. Otro tipo de software del sistema que gestiona, controla las actividades de la computadora y realiza tareas de proceso comunes, se denomina utility o utilidades (en algunas partes de Latinoamérica, utilerías). El software del sistema que gestiona y controla las actividades de la computado- ra se denomina sistema operativo. Otro software del sistema son los programas traductores o de traducción de lenguajes de computadora que convierten los lenguajes de programación, entendibles por los programadores, en len- guaje máquina que entienden las computadoras.
  • 63. Introducción a las computadoras y los lenguajes de programación 33 El software del sistema es el conjunto de programas indispensables para que la máquina funcione; se denominan también programas del sistema. Estos programas son, básicamente, el sistema operativo, los editores de texto, los compiladores/intérpretes (lenguajes de programación) y los programas de utilidad. 1.8.2. Software de aplicación El software de aplicación tiene como función principal asistir y ayudar a un usuario de una computadora para eje- cutar tareas específicas. Los programas de aplicación se pueden desarrollar con diferentes lenguajes y herramientas de software. Por ejemplo, una aplicación de procesamiento de textos (word processing) tal como Word o Word Per- fect que ayuda a crear documentos, una hoja de cálculo tal como Lotus 1-2-3 o Excel que ayudan a automatizar tareas tediosas o repetitivas de cálculos matemáticos o estadísticos, a generar diagramas o gráficos, presentaciones visuales como PowerPoint, o a crear bases de datos como Access u Oracle que ayudan a crear archivos y registros de datos. Los usuarios, normalmente, compran el software de aplicaciones en discos CD o DVD (antiguamente en disque- tes) o los descargan (bajan) de la Red Internet y han de instalar el software copiando los programas correspondientes de los discos en el disco duro de la computadora. Cuando compre estos programas asegúrese de que son compatibles con su computadora y con su sistema operativo. Existe una gran diversidad de programas de aplicación para todo tipo de actividades tanto de modo personal, como de negocios, navegación y manipulación en Internet, gráficos y presentaciones visuales, etc. Los lenguajes de programación sirven para escribir programas que permitan la comunicación usuario/máqui- na. Unos programas especiales llamados traductores (compiladores o intérpretes) convierten las instrucciones escritas en lenguajes de programación en instrucciones escritas en lenguajes máquina (0 y 1, bits) que ésta pueda entender. Los programas de utilidad22 facilitan el uso de la computadora. Un buen ejemplo es un editor de textos que per- mite la escritura y edición de documentos. Este libro ha sido escrito en un editor de textos o procesador de palabras (“word procesor”). Los programas que realizan tareas concretas, nóminas, contabilidad, análisis estadístico, etc., es decir, los progra- mas que podrá escribir en C, se denominan programas de aplicación. A lo largo del libro se verán pequeños progra- mas de aplicación que muestran los principios de una buena programación de computadora. Se debe diferenciar entre el acto de crear un programa y la acción de la computadora cuando ejecuta las instruc- ciones del programa. La creación de un programa se hace inicialmente en papel y a continuación se introduce en la computadora y se convierte en lenguaje entendible por la computadora. La ejecución de un programa requiere una aplicación de una entrada (datos) al programa y la obtención de una salida (resultados). La entrada puede tener una variedad de formas, tales como números o caracteres alfabéticos. La salida puede también tener formas, tales como datos numéricos o caracteres, señales para controlar equipos o robots, etc. (Figura 1.13). Memoria externa UCP Programa Sistema operativo Programa Figura 1.13. Ejecución de un programa. 22 Utility: programa de utilidad o utilitería.
  • 64. 34 Fundamentos de programación 1.8.3. Sistema operativo Un sistema operativo SO (Operating System, OS) es tal vez la parte más importante del software del sistema y es el software que controla y gestiona los recursos de la computadora. En la práctica el sistema operativo es la colección de programas de computadora que controla la interacción del usuario y el hardware de la computadora. El sistema operativo es el administrador principal de la computadora, y por ello a veces se la compara con el director de una orquesta ya que este software es el responsable de dirigir todas las operaciones de la computadora y gestionar todos sus recursos. El sistema operativo asigna recursos, planifica el uso de recursos y tareas de la computadora, y monitoriza las actividades del sistema informático. Estos recursos incluyen memoria, dispositivos de E/S (Entrada/Salida), y la UCP (Unidad Central de Proceso). El sistema operativo proporciona servicios tales como asignar memoria a un programa y manipulación del control de los dispositivos de E/S tales como el monitor, el teclado o las unidades de disco. La Tabla 1.9 muestra algunos de los sistemas operativos más populares utilizados en enseñanza y en informática profe- sional. Tabla 1.9. Sistemas operativos más utilizados en educación y en la empresa Sistema operativo Características Windows Vista Nuevo sistema operativo de Microsoft presentado a comienzos del año 2007. Windows XP Sistema operativo más utilizado en la actualidad, tanto en el campo de la enseñanza, como en la industria y negocios. Su fabricante es Microsoft. Windows 98/ME/2000 Versiones anteriores de Windows pero que todavía hoy son muy utilizados. UNIX Sistema operativo abierto, escrito en C y todavía muy utilizado en el campo profesional. Linux Sistema operativo de software abierto, gratuito y de libre distribución, similar a UNIX, y una gran alternativa a Windows. Muy utilizado actualmente en servidores de aplicaciones para Internet. Mac OS Sistema operativo de las computadoras Apple Macintosh. DOS y OS/2 Sistemas operativos creados por Microsoft e IBM respectivamente, ya poco utilizados pero que han sido la base de los actuales sistemas operativos. CP/M Sistema operativo de 8 bits para las primeras microcomputadoras nacidas en la década de los setenta. Symbian Sistema operativo para teléfonos móviles apoyado fundamentalmente por el fabricante de teléfonos celulares Nokia. PalmOS Sistema operativo para agendas digitales, PDA; del fabricante Palm. Windows Mobile, CE Sistema operativo para teléfonos móviles con arquitectura y apariencias similares a Windows XP. Las últimas versiones son: 5.0 y 6.0. Cuando un usuario interactúa con una computadora, la interacción está controlada por el sistema operativo. Un usuario se comunica con un sistema operativo a través de una interfaz de usuario de ese sistema operativo. Los sis- temas operativos modernos utilizan una interfaz gráfica de usuario, IGU (Graphical User Interface, GUI) que hace uso masivo de iconos, botones, barras y cuadros de diálogo para realizar tareas que se controlan por el teclado o el ratón (mouse), entre otros dispositivos. Normalmente el sistema operativo se almacena de modo permanente en un chip de memoria de sólo lectura (ROM), de modo que esté disponible tan pronto la computadora se pone en marcha (“se enciende” o “se prende”). Otra parte del sistema operativo puede residir en disco, que se almacena en memoria RAM en la inicialización del sistema por primera vez en una operación que se llama carga del sistema (booting). El sistema operativo dirige las operaciones globales de la computadora, instruye a la computadora para ejecu- tar otros programas y controla el almacenamiento y recuperación de archivos (programas y datos) de cintas y discos. Gracias al sistema operativo es posible que el programador pueda introducir y grabar nuevos programas, así como instruir a la computadora para que los ejecute. Los sistemas operativos pueden ser: monousuarios (un solo usuario) y multiusuarios, o tiempo compartido (diferentes usuarios), atendiendo al número de usuarios y mo- nocarga (una sola tarea) o multitarea (múltiples tareas) según las tareas (procesos) que puede realizar simultánea- mente.
  • 65. Introducción a las computadoras y los lenguajes de programación 35 Windows Vista El 30 de enero de 2007, Microsoft presentó a nivel mundial su nuevo sistema operativo Windows Vista. Esta nueva versión en la que Microsoft llevaba trabajando desde hacía cinco años, en que presentó su hasta ahora, última versión, Windows XP, es un avance significativo en la nueva generación de sistemas operativos que se utilizarán en la próxi- ma década. Windows Vista contiene numerosas características nuevas y muchas otras actualizadas, algunas de las cuales son: una interfaz gráfica de usuario muy amigable, herramientas de creación de multimedia, potentes herramientas de comunicación entre computadoras, etc. También ha incluido programas que hasta el momento de su lanzamiento se comercializaban independientemente tales como programas de reproducción de música, vídeo, accesos a Internet, etc. Es de destacar que Vista ha mejorado notablemente la seguridad en el sistema operativo, ya que Windows XP y sus predecesores han sido muy vulnerables a virus, malware, y otros ataques a la seguridad del sistema y del usuario. Existen cinco versiones comerciales: Home Basic, Home Premium, Business, Ultimate y Enterprise. Los requi- sitos que debe tener su computadora dependerá de la versión elegida y variará desde la más básica, recomendada para usuarios domésticos (512 MB de RAM mínima, procesador de 32 bits (x86) o de 64 bits (x64) a 1 GHz, 15 GB de espacio disponible en el disco duro, etc.) a Ultimate que incorpora todas las funcionalidades y ventajas contenidas en las demás versiones (ya se requiere al menos 1 GB de memoria, mayor capacidad de disco duro, etc.). A nivel de empresas y grandes corporaciones se recomienda Enterprise, diseñada para reducir los riesgos de seguridad y los enormes costes de este tipo de infraestructuras. Tipos de sistemas operativos Las diferentes características especializadas del sistema operativo permiten a las computadoras manejar muchas tareas diferentes, así como múltiples usuarios de modo simultáneo o en paralelo, bien de modo secuencial. En función de sus características específicas los sistemas operativos se pueden clasificar en varios grupos. 1.8.3.1. Multiprogramación/Multitarea La multiprogramación permite a múltiples programas compartir recursos de un sistema de computadora en cualquier momento a través del uso concurrente una UCP. Sólo un programa utiliza realmente la UCP en cualquier momento dado, sin embargo las necesidades de entrada/salida pueden ser atendidas en el mismo momento. Dos o más progra- mas están activos al mismo tiempo, pero no utilizan los recursos de la computadora simultáneamente. Con multipro- gramación, un grupo de programas se ejecutan alternativamente y se alternan en el uso del procesador. Cuando se utiliza un sistema operativo de un único usuario, la multiprogramación toma el nombre de multitarea. Multiprogramación Método de ejecución de dos o más programas concurrentemente utilizando la misma computadora. La UCP eje- cuta sólo un programa pero puede atender los servicios de entrada/salida de los otros al mismo tiempo. 1.8.3.2. Tiempo compartido (múltiples usuarios, time sharing) Un sistema operativo multiusuario es un sistema operativo que tiene la capacidad de permitir que muchos usuarios compartan simultáneamente los recursos de proceso de la computadora. Centenas o millares de usuarios se pueden conectar a la computadora que asigna un tiempo de computador a cada usuario, de modo que a medida que se libera la tarea de un usuario, se realiza la tarea del siguiente, y así sucesivamente. Dada la alta velocidad de transferencia de las operaciones, la sensación es de que todos los usuarios están conectados simultáneamente a la UCP con cada usuario recibiendo únicamente un tiempo de máquina. 1.8.3.3. Multiproceso Un sistema operativo trabaja en multiproceso cuando puede enlazar dos o más UCP para trabajar en paralelo en un único sistema de computadora. El sistema operativo puede asignar múltiples UCP para ejecutar diferentes instrucciones del mismo programa o de programas diferentes simultáneamente, dividiendo el trabajo entre las diferentes UCP.
  • 66. 36 Fundamentos de programación La multiprogramación utiliza proceso concurrente con una UCP; el multiproceso utiliza proceso simultáneo con múltiples UCP. 1.9. LENGUAJES DE PROGRAMACIÓN Como se ha visto en el apartado anterior, para que un procesador realice un proceso se le debe suministrar en primer lugar un algoritmo adecuado. El procesador debe ser capaz de interpretar el algoritmo, lo que significa: • comprender las instrucciones de cada paso, • realizar las operaciones correspondientes. Cuando el procesador es una computadora, el algoritmo se ha de expresar en un formato que se denomina pro- grama, ya que el pseudocódigo o el diagrama de flujo no son comprensibles por la computadora, aunque pueda en- tenderlos cualquier programador. Un programa se escribe en un lenguaje de programación y las operaciones que conducen a expresar un algoritmo en forma de programa se llaman programación. Así pues, los lenguajes utilizados para escribir programas de computadoras son los lenguajes de programación y programadores son los escritores y diseñadores de programas. El proceso de traducir un algoritmo en pseudocódigo a un lenguaje de programación se denomina codificación, y el algoritmo escrito en un lenguaje de programación se denomina código fuente. En la realidad la computadora no entiende directamente los lenguajes de programación sino que se requiere un programa que traduzca el código fuente a otro lenguaje que sí entiende la máquina directamente, pero muy comple- jo para las personas; este lenguaje se conoce como lenguaje máquina y el código correspondiente código máquina. Los programas que traducen el código fuente escrito en un lenguaje de programación —tal como C++— a código máquina se denominan traductores. El proceso de conversión de un algoritmo escrito en pseudocódigo hasta un programa ejecutable comprensible por la máquina, se muestra en la Figura 1.14. Algoritmo en pseudocódigo (o diagrama de flujo) Algoritmo en C++ Código fuente en C++ Código máquina (programa ejecutable) Problema Escritura en C++ Resultado Traducción y ejecución (traductor/ compilador) Edición (editory EID) Figura 1.14. Proceso de transformación de un algoritmo en pseudocódigo en un programa ejecutable. Hoy en día, la mayoría de los programadores emplean lenguajes de programación como C++, C, C#, Java, Visual Basic, XML, HTML, Perl, PHP, JavaScript..., aunque todavía se utilizan, sobre todo profesionalmente, los clásicos COBOL, FORTRAN, Pascal o el mítico BASIC. Estos lenguajes se denominan lenguajes de alto nivel y permiten a los profesionales resolver problemas convirtiendo sus algoritmos en programas escritos en alguno de estos lenguajes de programación. Los lenguajes de programación se utilizan para escribir programas. Los programas de las computadoras mo- dernas constan de secuencias de instrucciones que se codifican como secuencias de dígitos numéricos que podrán entender dichas computadoras. El sistema de codificación se conoce como lenguaje máquina que es el lenguaje nativo de una computadora. Desgraciadamente la escritura de programas en lenguaje máquina es una tarea tediosa y difícil ya que sus instrucciones son secuencias de 0 y 1 (patrones de bit, tales como 11110000, 01110011...) que son muy difíciles de recordar y manipular por las personas. En consecuencia, se necesitan lenguajes de progra- mación “amigables con el programador” que permitan escribir los programas para poder “charlar” con facilidad
  • 67. Introducción a las computadoras y los lenguajes de programación 37 con las computadoras. Sin embargo, las computadoras sólo entienden las instrucciones en lenguaje máquina, por lo que será preciso traducir los programas resultantes a lenguajes de máquina antes de que puedan ser ejecutadas por ellas. Cada lenguaje de programación tiene un conjunto o “juego” de instrucciones (acciones u operaciones que debe realizar la máquina) que la computadora podrá entender directamente en su código máquina o bien se traducirán a dicho código máquina. Las instrucciones básicas y comunes en casi todos los lenguajes de programación son: • Instrucciones de entrada/salida. Instrucciones de transferencia de información entre dispositivos periféricos y la memoria central, tales como "leer de..." o bien "escribir en...". • Instrucciones de cálculo. Instrucciones para que la computadora pueda realizar operaciones aritméticas. • Instrucciones de control. Instrucciones que modifican la secuencia de la ejecución del programa. Además de estas instrucciones y dependiendo del procesador y del lenguaje de programación existirán otras que conformarán el conjunto de instrucciones y junto con las reglas de sintaxis permitirán escribir los programas de las computadoras. Los principales tipos de lenguajes de programación son: • Lenguajes máquina. • Lenguajes de bajo nivel (ensambladores). • Lenguajes de alto nivel. Figura 1.15. Diferentes sistemas operativos: Windows Vista (izquierda) y Red Hat Enterprise Linux 4. 1.9.1. Traductores de lenguaje: el proceso de traducción de un programa El proceso de traducción de un programa fuente escrito en un lenguaje de alto nivel a un lenguaje máquina compren- sible por la computadora, se realiza mediante programas llamados “traductores”. Los traductores de lenguaje son programas que traducen a su vez los programas fuente escritos en lenguajes de alto nivel a código máquina. Los traductores se dividen en compiladores e intérpretes. Intérpretes Un intérprete es un traductor que toma un programa fuente, lo traduce y, a continuación, lo ejecuta. Los programas intérpretes clásicos como BASIC, prácticamente ya no se utilizan, más que en circunstancias especiales. Sin embar- go, está muy extendida la versión interpretada del lenguaje Smalltalk, un lenguaje orientado a objetos puro. El siste- ma de traducción consiste en: traducir la primera sentencia del programa a lenguaje máquina, se detiene la traducción, se ejecuta la sentencia; a continuación, se traduce la siguiente sentencia, se detiene la traducción, se ejecuta la sen- tencia y así sucesivamente hasta terminar el programa (Figura 1.16).
  • 68. 38 Fundamentos de programación Compiladores Un compilador es un programa que traduce los programas fuente escritos en lenguaje de alto nivel a lenguaje má- quina. La traducción del programa completo se realiza en una sola operación denominada compilación del programa; es decir, se traducen todas las instrucciones del programa en un solo bloque. El programa compilado y depurado (eliminados los errores del código fuente) se denomina programa ejecutable porque ya se puede ejecutar directamen- te y cuantas veces se desee; sólo deberá volver a compilarse de nuevo en el caso de que se modifique alguna instruc- ción del programa. De este modo el programa ejecutable no necesita del compilador para su ejecución. Los traduc- tores de lenguajes típicos más utilizados son: C, C++, Java, C#, Pascal, FORTRAN y COBOL (Figura 1.17). 1.9.2. La compilación y sus fases La compilación es el proceso de traducción de programas fuente a programas objeto. El programa objeto obtenido de la compilación ha sido traducido normalmente a código máquina. Para conseguir el programa máquina real se debe utilizar un programa llamado montador o enlazador (linker). El proceso de montaje conduce a un programa en lenguaje máquina directamente ejecutable (Figura 1.18). Compilador (traductor) Programa ejecutable (en lenguaje máquina) Enlazador (linker) Programa objeto Programa fuente Figura 1.18. Fases de la compilación. El proceso de ejecución de un programa escrito en un lenguaje de programación y mediante un compilador sue- le tener los siguientes pasos: 1. Escritura del programa fuente con un editor (programa que permite a una computadora actuar de modo simi- lar a una máquina de escribir electrónica) y guardarlo en un dispositivo de almacenamiento (por ejemplo, un disco). 2. Introducir el programa fuente en memoria. Programa fuente Compilador Programa objeto Figura 1.17. La compilación de programas. Programa fuente Traducción y ejecución línea a línea Intérprete Figura 1.16. Intérprete.
  • 69. Introducción a las computadoras y los lenguajes de programación 39 3. Compilar el programa con el compilador seleccionado. 4. Verificar y corregir errores de compilación (listado de errores). 5. Obtención del programa objeto. 6. El enlazador (linker) obtiene el programa ejecutable. 7. Se ejecuta el programa y, si no existen errores, se tendrá la salida del programa. El proceso de ejecución se muestra en las Figuras 1.19 y 1.20. 1.9.3. Evolución de los lenguajes de programación En la década de los cuarenta cuando nacían las primeras computadoras digitales el lenguaje que se utilizaba para programar era el lenguaje máquina que traducía directamente el código máquina (código binario) comprensible para las computadoras. Las instrucciones en lenguaje máquina dependían de cada computadora y debido a la dificultad de su escritura, los investigadores de la época simplificaron el proceso de programación desarrollando sistemas de no- tación en los cuales las instrucciones se representaban en formatos nemónicos (nemotécnicos) en vez de en formatos numéricos que eran más difíciles de recordar. Por ejemplo, mientras la instrucción Mover el contenido del registro 4 al registro 8 se podía expresar en lenguaje máquina como 4048 o bien 0010 0000 0010 1000 en código nemotécnico podía aparecer como MOV R5, R6 Para convertir los programas escritos en código nemotécnico a lenguaje máquina, se desarrollaron programas ensambladores (assemblers). Es decir, los ensambladores son programas que traducen otros programas escritos en código nemotécnico en instrucciones numéricas en lenguaje máquina que son compatibles y legibles por la máquina. Estos programas de traducción se llaman ensambladores porque su tarea es ensamblar las instrucciones reales de la Programa fuente Compilador Existen errores en la compilación no Montador Modificación programa Programa Programa ejecutable Ejecución Figura 1.20. Fases de ejecución de un programa. Datos programa ejecutable Computadora Programa Resultados Figura 1.19. Ejecución de un programa.
  • 70. 40 Fundamentos de programación máquina con los nemotécnicos e identificadores que representan las instrucciones escritas en ensamblador. A estos lenguajes se les denominó de segunda generación, reservando el nombre de primera generación para los lenguajes de máquina. En la década de los cincuenta y sesenta comenzaron a desarrollarse lenguajes de programación de tercera ge- neración que diferían de las generaciones anteriores en que sus instrucciones o primitivas eran de alto nivel (com- prensibles por el programador, como si fueran lenguajes naturales) e independientes de la máquina. Estos lengua- jes se llamaron lenguajes de alto nivel. Los ejemplos más conocidos son FORTRAN (FORmula TRANslator) que fue desarrollado para aplicaciones científicas y de ingeniería, y COBOL (COmmon Business-Oriented Language), que fue desarrollado por la U.S. Navy de Estados Unidos, para aplicaciones de gestión o administración. Con el paso de los años aparecieron nuevos lenguajes tales como Pascal, BASIC, C, C++, Ada, Java, C#, HTML, XML... Los lenguajes de programación de alto nivel se componen de un conjunto de instrucciones o primitivas más fá- ciles de escribir y recordar su función que los lenguajes máquina y ensamblador. Sin embargo, los programas escri- tos en un lenguaje de alto nivel, como C o Java necesitan ser traducidos a código máquina; para ello se requiere un programa denominado traductor. Estos programas de traducción se denominaron técnicamente, compiladores. De este modo existen compiladores de C, FORTRAN, Pascal, Java, etc. También surgió una alternativa a los traductores compiladores como medio de implementación de lenguajes de tercera generación que se denominaron intérpretes23 . Estos programas eran similares a los traductores excepto que ellos ejecutaban las instrucciones a medida que se traducían, en lugar de guardar la versión completa traducida para su uso posterior. Es decir, en vez de producir una copia de un programa en lenguaje máquina que se ejecuta más tarde (este es el caso de la mayoría de los lenguajes, C, C++, Pascal, Java...), un intérprete ejecuta realmente un pro- grama desde su formato de alto nivel, instrucción a instrucción. Cada tipo de traductor tiene sus ventajas e inconve- nientes, aunque hoy día prácticamente los traductores utilizados son casi todos compiladores por su mayor eficiencia y rendimiento. Sin embargo, en el aprendizaje de programación se suele comenzar también con el uso de los lenguajes algorít- micos, similares a los lenguajes naturales, mediante instrucciones escritas en pseudocódigo (o seudocógido) que son palabras o abreviaturas de palabras escritas en inglés, español, portugués, etc. Posteriormente se realiza la conversión al lenguaje de alto nivel que se vaya a utilizar realmente en la computadora, tal como C, C++ o Java. Esta técnica facilita la escritura de algoritmos como paso previo a la programación. 1.9.4. Paradigmas de programación La evolución de los lenguajes de programación ha ido paralela a la idea de paradigma de programación: enfoques alternativos a los procesos de programación. En realidad un paradigma de programación representa fundamental- mente enfoques diferentes para la construcción de soluciones a problemas y por consiguiente afectan al proceso completo de desarrollo de software. Los paradigmas de programación clásicos son: procedimental (o imperativo), funcional, declarativo y orientado a objetos. En la Figura 1.21 se muestra la evolución de los paradigmas de progra- mación y los lenguajes asociados a cada paradigma [BROOKSHEAR 04]24 . Lenguajes imperativos (procedimentales) El paradigma imperativo o procedimental representa el enfoque o método tradicional de programación. Un len- guaje imperativo es un conjunto de instrucciones que se ejecutan una por una, de principio a fin, de modo secuencial excepto cuando intervienen instrucciones de salto de secuencia o control. Este paradigma define el proceso de pro- gramación como el desarrollo de una secuencia de órdenes (comandos) que manipulan los datos para producir los resultados deseados. Por consiguiente, el paradigma imperativo señala un enfoque del proceso de programación me- diante la realización de un algoritmo que resuelve de modo manual el problema y a continuación expresa ese algo- ritmo como una secuencia de órdenes. En un lenguaje procedimental cada instrucción es una orden u órdenes para que la computadora realice alguna tarea específica. 23 Uno de los intérpretes más populares en las décadas de los setenta y ochenta, fue BASIC. 24 J. Glenn Brookshear, Computer Science: An overview, Eigth edition, Boston (EE.UU.): Pearson/Addison Wesley, 2005, p. 230. Obra clá- sica y excelente para la introducción a la informática y a las ciencias de la computación en todos sus campos fundamentales. Esta obra se reco- mienda a todos los lectores que deseen profundizar en los diferentes temas tratados en este capítulo y ayudará considerablemente al lector como libro de consulta en su aprendizaje en programación.
  • 71. Introducción a las computadoras y los lenguajes de programación 41 Los lenguajes de programación procedimentales, por excelencia, son FORTRAN, COBOL, Pascal, BASIC, ALGOL, C y Ada (aunque sus últimas versiones ya tienen un carácter completamente orientado a objetos). Lenguajes declarativos En contraste con el paradigma imperativo el paradigma declarativo solicita al programador que describa el proble- ma en lugar de encontrar una solución algorítmica al problema; es decir, un lenguaje declarativo utiliza el principio del razonamiento lógico para responder a las preguntas o cuestiones consultadas. Se basa en la lógica formal y en el cálculo de predicados de primer orden. El razonamiento lógico se basa en la deducción. El lenguaje declarativo por excelencia es Prolog. Figura 1.21. Paradigmas de programación (evolución de lenguajes). Lenguajes orientados a objetos El paradigma orientado a objetos se asocia con el proceso de programación llamado programación orientada a objetos (POO)25 consistente en un enfoque totalmente distinto al proceso procedimental. El enfoque orientado a objetos guarda analogía con la vida real. El desarrollo de software OO se basa en el diseño y construcción de objetos que se componen a su vez de datos y operaciones que manipulan esos datos. El programador define en primer lugar los objetos del problema y a continuación los datos y operaciones que actuarán sobre esos datos. Las ventajas de la programación orientada a objetos se derivan esencialmente de la estructura modular existente en la vida real y el modo de respuesta de estos módulos u objetos a mensajes o eventos que se producen en cualquier instante. Los orígenes de la POO se remontan a los Tipos Abstractos de Datos como parte constitutiva de una estructura de datos. En este libro se dedicará un capítulo completo al estudio del TAD como origen del concepto de programa- ción denominado objeto. C++ lenguaje orientado a objetos, por excelencia, es una extensión del lenguaje C y contiene las tres propiedades más importantes: encapsulamiento, herencia y polimorfismo. Smalltalk es otro lenguaje orientado a objetos muy potente y de gran impacto en el desarrollo del software orientado a objetos que se ha realizado en las últimas dé- cadas. Hoy día Java y C# son herederos directos de C++ y C, y constituyen los lenguajes orientados a objetos más uti- lizados en la industria del software del siglo XXI. Visual Basic y VB.Net son otros lenguajes orientados a objetos, no tan potentes como los anteriores pero extremadamente sencillos y fáciles de aprender. 25 Si desea profundizar en este tipo de programación existen numerosos y excelentes libros que puede consultar en la Bibliografía.
  • 72. 42 Fundamentos de programación 1.10. BREVE HISTORIA DE LOS LENGUAJES DE PROGRAMACIÓN La historia de la computación ha estado asociada indisolublemente a la aparición y a la historia de lenguajes de pro- gramación de computadoras26 . La Biblia de los lenguajes ha sido una constante en el desarrollo de la industria del software y en los avances científicos y tecnológicos. Desde el año 1642 en que Blaise Pascal, inventó La Pascalina, una máquina que ayudaba a contar mediante unos dispositivos de ruedas, se han sucedido numerosos inventos que han ido evolucionando, a medida que se programaban mediante códigos de máquina, lenguajes ensambladores, has- ta llegar a los lenguajes de programación de alto nivel en los que ya no se dependía del hardware de la máquina sino de la capacidad de abstracción del programador y de la sintaxis, semántica y potencia del lenguaje. En la década de los cincuenta, IBM diseñó el primer lenguaje de programación comercial de alto nivel y conce- bido para resolver problemas científicos y de ingeniería (FORTRAN, 1954). Todavía hoy, muchos científicos e inge- nieros siguen utilizando FORTRAN en sus versiones más recientes FORTRAN 77 y FORTRAN 90. En 1959, la doctora y almirante, Grace Hopper, lideró el equipo que desarrolló COBOL, el lenguaje por excelencia del mundo de la gestión y de los negocios hasta hace muy poco tiempo; aunque todavía el mercado sigue demandando progra- madores de COBOL ya que numerosas aplicaciones comerciales siguen corriendo en este lenguaje. Una enumeración rápida de lenguajes de programación que han sido o son populares y los años en que aparecie- ron es la siguiente: Década 50 Década 60 Década 70 Década 80 Década 90 Década 00 FORTRAN (1954) ALGOL 58 (1958) LISP (1958) COBOL (1959) BASIC (1964) LOGO (1968) Simula 67 (1967) Smalltalk (1969) Pascal (1970) C (1971) Modula 2 (1975) Ada (1979) C++ (1983) Eiffel (1986) Perl (1987) Java (1997) C# (2000) Programación de la Web Si después o en paralelo de su proceso de aprendizaje en fundamentos y metodología de la programación desea prac- ticar no sólo con un lenguaje tradicional como Pascal, C, C++, Java o C#, sino introducirse en lenguajes de progra- mación para la Web, enumeramos a continuación los más empleados en este campo. Los programadores pueden utilizar una amplia variedad de lenguajes de programación, incluyendo C y C++ para escribir aplicaciones Web. Sin embargo, algunas herramientas de programación son, particularmente, útiles para de- sarrollar aplicaciones Web: • HTML, técnicamente es un lenguaje de descripción de páginas más que un lenguaje de programación. Es el elemento clave para la programación en la Web. • JavaScript, es un lenguaje interpretado de guionado (scripting) que facilita a los diseñadores de páginas Web añadir guiones a páginas Web y modos para enlazar esas páginas. • VBScript, la respuesta de Microsoft a JavaScript basada en VisualBasic. • Java, lenguaje de programación, por excelencia, de la Web. • ActiveX, lenguaje de Microsoft para simular a algunas de las características de Java. • C#, el verdadero competidor de Java y creado por Microsoft. • Perl, lenguaje interpretado de guionado (scripting) idóneo para escritura de texto. • XML, lenguaje de marcación que resuelve todas las limitaciones de HTML y ha sido el creador de una nueva forma de programar la Web. Es el otro gran lenguaje de la Web. • AJAX, es el futuro de la Web. Es una mezcla de JavaScript y XML. Es la espina dorsal de la nueva generación Web 2.0. 26 Si desea una breve historia pero más detallada de los lenguajes de programación más utilizados por los programadores profesionales tanto para aprendizaje como para el desarrollo profesional puede consultarlo en la página web del libro: www.mhe.es/joyanes. En el sitio Web de la editorial O’Reilly puede descargarse un póster (en PDF) con una magnífica y fiable Historia de los Lenguajes de Pro- gramación: www.oreilly.com/news/graphics/prog_lang_poster.pdf
  • 73. Introducción a las computadoras y los lenguajes de programación 43 Una computadora es una máquina para procesar informa- ción y obtener resultados en función de unos datos de en- trada. Hardware: parte física de una computadora (dispositi- vos electrónicos). Software: parte lógica de una computadora (pro- gramas). Las computadoras se componen de: • Dispositivos de Entrada/Salida (E/S). • Unidad Central de Proceso (Unidad de Control y Uni- dad Lógica y Aritmética). • Memoria central. • Dispositivos de almacenamiento masivo de informa- ción (memoria auxiliar o externa). El software del sistema comprende, entre otros, el siste- ma operativo Windows, Linux, en computadoras personales y los lenguajes de programación. Los lenguajes de progra- mación de alto nivel están diseñados para hacer más fácil la escritura de programas que los lenguajes de bajo nivel. Exis- ten numerosos lenguajes de programación cada uno de los cuales tiene sus propias características y funcionalidades, y normalmente son más fáciles de transportar a máquinas di- ferentes que los escritos en lenguajes de bajo nivel. Los programas escritos en lenguaje de alto nivel deben ser traducidos por un compilador antes de que se puedan ejecutar en una máquina específica. En la mayoría de los lenguajes de programación se require un compilador para cada máquina en la que se desea ejecutar programas escritos en un lenguaje específico... Los lenguajes de programación se clasifican en: • Alto nivel: Pascal, FORTRAN, Visual Basic, C, Ada, Modula-2, C++, Java, Delphi, C#, etc. • Bajo nivel: Ensamblador. • Máquina: Código máquina. • Diseño de Web: SMGL, HTML, XML, PHP... Los programas traductores de lenguajes son: • Compiladores. • Intérpretes. RESUMEN
  • 75. CAPÍTULO 2 Metodología de la programación y desarrollo de software 2.1. Fases en la resolución de problemas 2.2. Programación modular 2.3. Programación estructurada 2.4. Programación orientada a objetos 2.5. Concepto y características de algoritmos 2.6. Escritura de algoritmos 2.7. Representación gráfica de los algoritmos RESUMEN EJERCICIOS Este capítulo le introduce a la metodología que hay que seguir para la resolución de problemas con compu- tadoras. La resolución de un problema con una computa- dora se hace escribiendo un programa, que exige al menos los siguientes pasos: 1. Definición o análisis del problema. 2. Diseño del algoritmo. 3. Transformación del algoritmo en un programa. 4. Ejecución y validación del programa. Uno de los objetivos fundamentales de este libro es el aprendizaje y diseño de los algoritmos. Este ca- pítulo introduce al lector en el concepto de algoritmo y de programa, así como las herramientas que permi- ten “dialogar” al usuario con la máquina: los lengua- jes de programación. INTRODUCCIÓN
  • 76. 46 Fundamentos de programación 2.1. FASES EN LA RESOLUCIÓN DE PROBLEMAS El proceso de resolución de un problema con una computadora conduce a la escritura de un programa y a su ejecu- ción en la misma. Aunque el proceso de diseñar programas es, esencialmente, un proceso creativo, se puede consi- derar una serie de fases o pasos comunes, que generalmente deben seguir todos los programadores. Las fases de resolución de un problema con computadora son: • Análisis del problema. • Diseño del algoritmo. • Codificación. • Compilación y ejecución. • Verificación. • Depuración. • Mantenimiento. • Documentación. Las características más sobresalientes de la resolución de problemas son: • Análisis. El problema se analiza teniendo presente la especificación de los requisitos dados por el cliente de la empresa o por la persona que encarga el programa. • Diseño. Una vez analizado el problema, se diseña una solución que conducirá a un algoritmo que resuelva el problema. • Codificación (implementación). La solución se escribe en la sintaxis del lenguaje de alto nivel (por ejemplo, Pascal) y se obtiene un programa fuente que se compila a continuación. • Ejecución, verificación y depuración. El programa se ejecuta, se comprueba rigurosamente y se eliminan todos los errores (denominados “bugs”, en inglés) que puedan aparecer. • Mantenimiento. El programa se actualiza y modifica, cada vez que sea necesario, de modo que se cumplan todas las necesidades de cambio de sus usuarios. • Documentación. Escritura de las diferentes fases del ciclo de vida del software, esencialmente el análisis, dise- ño y codificación, unidos a manuales de usuario y de referencia, así como normas para el mantenimiento. Las dos primeras fases conducen a un diseño detallado escrito en forma de algoritmo. Durante la tercera fase (codificación) se implementa1 el algoritmo en un código escrito en un lenguaje de programación, reflejando las ideas desarrolladas en las fases de análisis y diseño. Las fases de compilación y ejecución traducen y ejecutan el programa. En las fases de verificación y depuración el programador busca errores de las etapas anteriores y los elimina. Comprobará que mientras más tiempo se gaste en la fase de análisis y diseño, menos se gastará en la depuración del programa. Por último, se debe realizar la do- cumentación del programa. Antes de conocer las tareas a realizar en cada fase, se considera el concepto y significado de la palabra algoritmo. La palabra algoritmo se deriva de la traducción al latín de la palabra Alkhô-warîzmi2 , nombre de un matemático y astrónomo árabe que escribió un tratado sobre manipulación de números y ecuaciones en el siglo IX. Un algoritmo es un método para resolver un problema mediante una serie de pasos precisos, definidos y finitos. Características de un algoritmo • preciso (indica el orden de realización en cada paso), • definido (si se sigue dos veces, obtiene el mismo resultado cada vez), • finito (tiene fin; un número determinado de pasos). 1 En la última edición (21.ª) del DRAE (Diccionario de la Real Academia Española) se ha aceptado el término implementar: (Informática) “Poner en funcionamiento, aplicar métodos, medidas, etc. para llevar algo a cabo”. 2 Escribió un tratado matemático famoso sobre manipulación de números y ecuaciones titulado Kitab al-jabr w’almugabala. La palabra ál- gebra se derivó, por su semejanza sonora, de al-jabr.
  • 77. Metodología de la programación y desarrollo de software 47 Un algoritmo debe producir un resultado en un tiempo finito. Los métodos que utilizan algoritmos se denominan métodos algorítmicos, en oposición a los métodos que implican algún juicio o interpretación que se denominan mé- todos heurísticos. Los métodos algorítmicos se pueden implementar en computadoras; sin embargo, los procesos heurísticos no han sido convertidos fácilmente en las computadoras. En los últimos años las técnicas de inteligencia artificial han hecho posible la implementación del proceso heurístico en computadoras. Ejemplos de algoritmos son: instrucciones para montar en una bicicleta, hacer una receta de cocina, obtener el máximo común divisor de dos números, etc. Los algoritmos se pueden expresar por fórmulas, diagramas de flujo o N-S y pseudocódigos. Esta última representación es la más utilizada para su uso con lenguajes estructurados como Pascal. 2.1.1. Análisis del problema La primera fase de la resolución de un problema con computadora es el análisis del problema. Esta fase requiere una clara definición, donde se contemple exactamente lo que debe hacer el programa y el resultado o solución deseada. Dado que se busca una solución por computadora, se precisan especificaciones detalladas de entrada y salida. La Figura 2.1 muestra los requisitos que se deben definir en el análisis. Análisis del problema Resolución de un problema Diseño del algoritmo Resolución del problema con computadora Figura 2.1. Análisis del problema. Para poder identificar y definir bien un problema es conveniente responder a las siguientes preguntas: • ¿Qué entradas se requieren? (tipo de datos con los cuales se trabaja y cantidad). • ¿Cuál es la salida deseada? (tipo de datos de los resultados y cantidad). • ¿Qué método produce la salida deseada? • Requisitos o requerimientos adicionales y restricciones a la solución. PROBLEMA 2.1 Se desea obtener una tabla con las depreciaciones acumuladas y los valores reales de cada año, de un automóvil comprado por 20.000 euros en el año 2005, durante los seis años siguientes suponiendo un valor de recuperación o rescate de 2.000. Realizar el análisis del problema, conociendo la fórmula de la depreciación anual constante D para cada año de vida útil. D = coste – valor de recuperación vida útil D = 20.000 – 2.000 6 = 18.000 6 = 3.000 coste original Entrada {vida útil valor de recuperación
  • 78. 48 Fundamentos de programación depreciación anual por año Salida {depreciación acumulada en cada año valor del automóvil en cada año depreciación acumulada Proceso {cálculo de la depreciación acumulada cada año cálculo del valor del automóvil en cada año La tabla siguiente muestra la salida solicitada Año Depreciación Depreciación acumulada Valor anual 1 (2006) 3.000 3.000 17.000 2 (2007) 3.000 6.000 14.000 3 (2008) 3.000 9.000 11.000 4 (2009) 3.000 12.000 8.000 5 (2010) 3.000 15.000 5.000 6 (2011) 3.000 18.000 2.000 2.1.2. Diseño del algoritmo En la etapa de análisis del proceso de programación se determina qué hace el programa. En la etapa de diseño se de- termina cómo hace el programa la tarea solicitada. Los métodos más eficaces para el proceso de diseño se basan en el conocido divide y vencerás. Es decir, la resolución de un problema complejo se realiza dividiendo el problema en subproblemas y a continuación dividiendo estos subproblemas en otros de nivel más bajo, hasta que pueda ser imple- mentada una solución en la computadora. Este método se conoce técnicamente como diseño descendente (top-down) o modular. El proceso de romper el problema en cada etapa y expresar cada paso en forma más detallada se denomi- na refinamiento sucesivo. Cada subprograma es resuelto mediante un módulo (subprograma) que tiene un solo punto de entrada y un solo punto de salida. Cualquier programa bien diseñado consta de un programa principal (el módulo de nivel más alto) que llama a subprogramas (módulos de nivel más bajo) que a su vez pueden llamar a otros subprogramas. Los programas estruc- turados de esta forma se dice que tienen un diseño modular y el método de romper el programa en módulos más pequeños se llama programación modular. Los módulos pueden ser planeados, codificados, comprobados y depura- dos independientemente (incluso por diferentes programadores) y a continuación combinarlos entre sí. El proceso implica la ejecución de los siguientes pasos hasta que el programa se termina: 1. Programar un módulo. 2. Comprobar el módulo. 3. Si es necesario, depurar el módulo. 4. Combinar el módulo con los módulos anteriores. El proceso que convierte los resultados del análisis del problema en un diseño modular con refinamientos sucesivos que permitan una posterior traducción a un lenguaje se denomina diseño del algoritmo. El diseño del algoritmo es independiente del lenguaje de programación en el que se vaya a codificar posterior- mente. 2.1.3. Herramientas de programación Las dos herramientas más utilizadas comúnmente para diseñar algoritmos son: diagramas de flujo y pseudocódigos. Un diagrama de flujo (flowchart) es una representación gráfica de un algoritmo. Los símbolos utilizados han sido normalizados por el Instituto Norteamericano de Normalización (ANSI), y los más frecuentemente empleados se muestran en la Figura 2.2, junto con una plantilla utilizada para el dibujo de los diagramas de flujo (Figura 2.3). En la Figura 2.4 se representa el diagrama de flujo que resuelve el Problema 2.1.
  • 79. Metodología de la programación y desarrollo de software 49 Terminal Subprograma Entrada/ Salida Proceso Decisión No Sí Conectores Figura 2.2. Símbolos más utilizados en los diagramas de flujo. Figura 2.3. Plantilla para dibujo de diagramas de flujo. El pseudocódigo es una herramienta de programación en la que las instrucciones se escriben en palabras simila- res al inglés o español, que facilitan tanto la escritura como la lectura de programas. En esencia, el pseudocódigo se puede definir como un lenguaje de especificaciones de algoritmos. Aunque no existen reglas para escritura del pseudocódigo en español, se ha recogido una notación estándar que se utilizará en el libro y que ya es muy empleada en los libros de programación en español3 . Las palabras reserva- das básicas se representarán en letras negritas minúsculas. Estas palabras son traducción libre de palabras reservadas de lenguajes como C, Pascal, etc. Más adelante se indicarán los pseudocódigos fundamentales para utilizar en esta obra. El pseudocódigo que resuelve el Problema 2.1 es: Previsiones de depreciacion Introducir coste vida util valor final de rescate (recuperacion) imprimir cabeceras Establecer el valor inicial del año Calcular depreciacion 3 Para mayor ampliación sobre el pseudocódigo, puede consultar, entre otras, algunas de estas obras: Fundamentos de programación, Luis Joyanes, 2.ª edición, 1997; Metodología de la programación, Luis Joyanes, 1986; Problemas de Metodología de la programación, Luis Joyanes, 1991 (todas ellas publicadas en McGraw-Hill, Madrid), así como Introducción a la programación, de Clavel y Biondi. Barcelona: Masson, 1987, o bien Introducción a la programación y a las estructuras de datos, de Braunstein y Groia. Buenos Aires: Editorial Eudeba, 1986. Para una for- mación práctica puede consultar: Fundamentos de programación: Libro de problemas de Luis Joyanes, Luis Rodríguez y Matilde Fernández, en McGraw-Hill (Madrid, 1998).
  • 80. 50 Fundamentos de programación mientras valor año =< vida util hacer calcular depreciacion acumulada calcular valor actual imprimir una linea en la tabla incrementar el valor del año fin de mientras EJEMPLO 2.1 Calcular la paga neta de un trabajador conociendo el número de horas trabajadas, la tarifa horaria y la tasa de impuestos. Algoritmo 1. Leer Horas, Tarifa, Tasa 2. Calcular PagaBruta = Horas * Tarifa 3. Calcular Impuestos = PagaBruta * Tasa 4. Calcular PagaNeta = PagaBruta - Impuestos 5. Visualizar PagaBruta, Impuestos, PagaNeta Valor actual ← Coste Depreciación ← (Coste-ValorRescate)/VidaÚtil Acumulada ← 0 Año < Vida_Útil Leer Coste, Vida útil, ValorRescate Inicio Leer Año Acumulada ← Acumulada + Depreciación Valor actual ← Valor actual + Depreciación Año ← Año + 1 Fin No Sí Figura 2.4. Diagrama de flujo (Problema 2.1).
  • 81. Metodología de la programación y desarrollo de software 51 EJEMPLO 2.2 Calcular el valor de la suma 1+2+3+...+100. algoritmo Se utiliza una variable Contador como un contador que genere los sucesivos números enteros, y Suma para alma- cenar las sumas parciales 1, 1+2, 1+2+3… 1. Establecer Contador a 1 2. Establecer Suma a 0 3. mientras Contador <= 100 hacer Sumar Contador a Suma Incrementar Contador en 1 fin_mientras 4. Visualizar Suma 2.1.4. Codificación de un programa La codificación es la escritura en un lenguaje de programación de la representación del algoritmo desarrollada en las etapas precedentes. Dado que el diseño de un algoritmo es independiente del lenguaje de programación utilizado para su implementación, el código puede ser escrito con igual facilidad en un lenguaje o en otro. Para realizar la conversión del algoritmo en programa se deben sustituir las palabras reservadas en español por sus homónimos en inglés, y las operaciones/instrucciones indicadas en lenguaje natural por el lenguaje de programa- ción correspondiente. {Este programa obtiene una tabla de depreciaciones acumuladas y valores reales de cada año de un determinado producto} algoritmo primero Real: Coste, Depreciacion, Valor_Recuperacion Valor_Actual, Acumulado Valor_Anual; entero: Año, Vida_Util; inicio escribir('introduzca coste, valor recuperación y vida útil') leer(Coste, Valor_Recuperacion, Vida_Util) escribir('Introduzca año actual') leer(Año) Valor_Actual ← Coste; Depreciacion ← (Coste-Valor_Recuperacion)/Vida_Util Acumulado ← 0 escribir('Año Depreciación Dep. Acumulada') mientras (Año < Vida_Util) Acumulado ← Acumulado + Depreciacion Valor_Actual ← Valor_Actual – Depreciacion escribir('Año, Depreciacion, Acumulado') Año ← Año + 1; fin mientras fin
  • 82. 52 Fundamentos de programación Documentación interna Como se verá más tarde, la documentación de un programa se clasifica en interna y externa. La documentación in- terna es la que se incluye dentro del código del programa fuente mediante comentarios que ayudan a la comprensión del código. Todas las líneas de programas que comiencen con un símbolo / * son comentarios. El programa no los necesita y la computadora los ignora. Estas líneas de comentarios sólo sirven para hacer los programas más fáciles de comprender. El objetivo del programador debe ser escribir códigos sencillos y limpios. Debido a que las máquinas actuales soportan grandes memorias (512 Mb o 1.024 Mb de memoria central mínima en computadoras personales) no es necesario recurrir a técnicas de ahorro de memoria, por lo que es recomendable que se incluya el mayor número de comentarios posibles, pero eso sí, que sean significativos. 2.1.5. Compilación y ejecución de un programa Una vez que el algoritmo se ha convertido en un programa fuente, es preciso introducirlo en memoria mediante el teclado y almacenarlo posteriormente en un disco. Esta operación se realiza con un programa editor. Posteriormente el programa fuente se convierte en un archivo de programa que se guarda (graba) en disco. El programa fuente debe ser traducido a lenguaje máquina, este proceso se realiza con el compilador y el siste- ma operativo que se encarga prácticamente de la compilación. Si tras la compilación se presentan errores (errores de compilación) en el programa fuente, es preciso volver a editar el programa, corregir los errores y compilar de nuevo. Este proceso se repite hasta que no se producen errores, obteniéndose el programa objeto que todavía no es ejecutable directamente. Suponiendo que no existen errores en el programa fuente, se debe instruir al sistema operativo para que realice la fase de montaje o enlace (link), carga, del programa objeto con las bibliotecas del programa del compilador. El proceso de montaje produce un programa ejecutable. La Figura 2.5 describe el proceso completo de compilación/ejecución de un programa. Una vez que el programa ejecutable se ha creado, ya se puede ejecutar (correr o rodar) desde el sistema operati- vo con sólo teclear su nombre (en el caso de DOS). Suponiendo que no existen errores durante la ejecución (llama- dos errores en tiempo de ejecución), se obtendrá la salida de resultados del programa. Las instrucciones u órdenes para compilar y ejecutar un programa en C, C++,... o cualquier otro lenguaje depen- derá de su entorno de programación y del sistema operativo en que se ejecute Windows, Linux, Unix, etc. 2.1.6. Verificación y depuración de un programa La verificación o compilación de un programa es el proceso de ejecución del programa con una amplia variedad de datos de entrada, llamados datos de test o prueba, que determinarán si el programa tiene o no errores (“bugs”). Para realizar la verificación se debe desarrollar una amplia gama de datos de test: valores normales de entrada, valores extremos de entrada que comprueben los límites del programa y valores de entrada que comprueben aspectos espe- ciales del programa. La depuración es el proceso de encontrar los errores del programa y corregir o eliminar dichos errores. Cuando se ejecuta un programa, se pueden producir tres tipos de errores: 1. Errores de compilación. Se producen normalmente por un uso incorrecto de las reglas del lenguaje de pro- gramación y suelen ser errores de sintaxis. Si existe un error de sintaxis, la computadora no puede compren- der la instrucción, no se obtendrá el programa objeto y el compilador imprimirá una lista de todos los errores encontrados durante la compilación. 2. Errores de ejecución. Estos errores se producen por instrucciones que la computadora puede comprender pero no ejecutar. Ejemplos típicos son: división por cero y raíces cuadradas de números negativos. En estos casos se detiene la ejecución del programa y se imprime un mensaje de error. 3. Errores lógicos. Se producen en la lógica del programa y la fuente del error suele ser el diseño del algoritmo. Estos errores son los más difíciles de detectar, ya que el programa puede funcionar y no producir errores de compilación ni de ejecución, y sólo puede advertirse el error por la obtención de resultados incorrectos. En este caso se debe volver a la fase de diseño del algoritmo, modificar el algoritmo, cambiar el programa fuen- te y compilar y ejecutar una vez más.
  • 83. Metodología de la programación y desarrollo de software 53 2.1.7. Documentación y mantenimiento La documentación de un problema consta de las descripciones de los pasos a dar en el proceso de resolución de dicho problema. La importancia de la documentación debe ser destacada por su decisiva influencia en el producto final. Programas pobremente documentados son difíciles de leer, más difíciles de depurar y casi imposibles de mantener y modificar. La documentación de un programa puede ser interna y externa. La documentación interna es la contenida en líneas de comentarios. La documentación externa incluye análisis, diagramas de flujo y/o pseudocódigos, manuales de usuario con instrucciones para ejecutar el programa y para interpretar los resultados. La documentación es vital cuando se desea corregir posibles errores futuros o bien cambiar el programa. Tales cambios se denominan mantenimiento del programa. Después de cada cambio la documentación debe ser actualiza- da para facilitar cambios posteriores. Es práctica frecuente numerar las sucesivas versiones de los programas 1.0, 1.1, 2.0, 2.1, etc. (Si los cambios introducidos son importantes, se varía el primer dígito [1.0, 2.0,...]; en caso de pequeños cambios sólo se varía el segundo dígito [2.0, 2.1…].) Memoria externa UCP Compilador Programa editor Programa objeto b) a) UCP EIDCIDE Editor de textos Teclado Programa editor UCP Enlace del programa c) Programa de carga Memoria externa Memoria externa Programa objeto Figura 2.5. Fases de la compilación/ejecución de un programa: a) edición; b) compilación; c) montaje o enlace.
  • 84. 54 Fundamentos de programación 2.2. PROGRAMACIÓN MODULAR La programación modular es uno de los métodos de diseño más flexible y potente para mejorar la productividad de un programa. En programación modular el programa se divide en módulos (partes independientes), cada uno de los cuales ejecuta una única actividad o tarea y se codifican independientemente de otros módulos. Cada uno de estos módulos se analiza, codifica y pone a punto por separado. Cada programa contiene un módulo denominado progra- ma principal que controla todo lo que sucede; se transfiere el control a submódulos (posteriormente se denominarán subprogramas), de modo que ellos puedan ejecutar sus funciones; sin embargo, cada submódulo devuelve el control al módulo principal cuando se haya completado su tarea. Si la tarea asignada a cada submódulo es demasiado com- pleja, éste deberá romperse en otros módulos más pequeños. El proceso sucesivo de subdivisión de módulos continúa hasta que cada módulo tenga solamente una tarea específica que ejecutar. Esta tarea puede ser entrada, salida, ma- nipulación de datos, control de otros módulos o alguna combinación de éstos. Un módulo puede transferir temporal- mente (bifurcar) el control a otro módulo; sin embargo, cada módulo debe eventualmente devolver el control al módulo del cual se recibe originalmente el control. Los módulos son independientes en el sentido en que ningún módulo puede tener acceso directo a cualquier otro módulo excepto el módulo al que llama y sus propios submódulos. Sin embargo, los resultados producidos por un módulo pueden ser utilizados por cualquier otro módulo cuando se transfiera a ellos el control. Raíz Módulo 1 Módulo 2 Módulo 4 Módulo 41 Módulo 42 Módulo 3 Módulo 31 Módulo 21 Módulo 22 Módulo 221 Módulo 222 Módulo 11 Módulo 12 Figura 2.6. Programación modular. Dado que los módulos son independientes, diferentes programadores pueden trabajar simultáneamente en dife- rentes partes del mismo programa. Esto reducirá el tiempo del diseño del algoritmo y posterior codificación del pro- grama. Además, un módulo se puede modificar radicalmente sin afectar a otros módulos, incluso sin alterar su función principal. La descomposición de un programa en módulos independientes más simples se conoce también como el método de divide y vencerás (divide and conquer). Cada módulo se diseña con independencia de los demás, y siguiendo un método ascendente o descendente se llegará hasta la descomposición final del problema en módulos en forma jerár- quica. 2.3. PROGRAMACIÓN ESTRUCTURADA C, Pascal, FORTRAN, y lenguajes similares, se conocen como lenguajes procedimentales (por procedimientos). Es decir, cada sentencia o instrucción señala al compilador para que realice alguna tarea: obtener una entrada, producir una salida, sumar tres números, dividir por cinco, etc. En resumen, un programa en un lenguaje procedi- mental es un conjunto de instrucciones o sentencias. En el caso de pequeños programas, estos principios de orga- nización (denominados paradigma) se demuestran eficientes. El programador sólo tiene que crear esta lista de
  • 85. Metodología de la programación y desarrollo de software 55 instrucciones en un lenguaje de programación, compilar en la computadora y ésta, a su vez, ejecuta estas instruc- ciones. Cuando los programas se vuelven más grandes, cosa que lógicamente sucede cuando aumenta la complejidad del problema a resolver, la lista de instrucciones aumenta considerablemente, de modo tal que el programador tiene muchas dificultades para controlar ese gran número de instrucciones. Los programadores pueden controlar, de modo normal, unos centenares de líneas de instrucciones. Para resolver este problema los programas se des- compusieron en unidades más pequeñas que adoptaron el nombre de funciones (procedimientos, subprogramas o subrutinas en otros lenguajes de programación). De este modo en un programa orientado a procedimientos se di- vide en funciones, de modo que cada función tiene un propósito bien definido y resuelve una tarea concreta, y se diseña una interfaz claramente definida (el prototipo o cabecera de la función) para su comunicación con otras funciones. Con el paso de los años, la idea de romper el programa en funciones fue evolucionando y se llegó al agrupamien- to de las funciones en otras unidades más grandes llamadas módulos (normalmente, en el caso de C, denominadas archivos o ficheros); sin embargo, el principio seguía siendo el mismo: agrupar componentes que ejecutan listas de instrucciones (sentencias). Esta característica hace que a medida que los programas se hacen más grandes y comple- jos, el paradigma estructurado comienza a dar señales de debilidad y resultando muy difícil terminar los programas de un modo eficiente. Existen varias razones de la debilidad de los programas estructurados para resolver problemas complejos. Tal vez las dos razones más evidentes son éstas. Primero, las funciones tienen acceso ilimitado a los da- tos globales. Segundo, las funciones inconexas y datos, fundamentos del paradigma procedimental proporcionan un modelo pobre del mundo real. 2.3.1. Datos locales y datos globales En un programa procedimental, por ejemplo escrito en C, existen dos tipos de datos. Datos locales que están ocultos en el interior de la función y son utilizados, exclusivamente, por la función. Estos datos locales están estrechamente relacionados con sus funciones y están protegidos de modificaciones por otras funciones. Otro tipo de datos son los datos globales a los cuales se puede acceder desde cualquier función del programa. Es decir, dos o más funciones pueden acceder a los mismos datos siempre que estos datos sean globales. En la Fi- gura 2.7 se muestra la disposición de variables locales y globales en un programa procedimental. Accesible sólo por función B Accesibles, por cualquier función Accesible sólo por función A Función A Variables locales Función B Variables locales Variables globales Figura 2.7. Datos locales y globales. Un programa grande (Figura 2.8) se compone de numerosas funciones y datos globales y ello conlleva una mul- titud de conexiones entre funciones y datos que dificulta su comprensión y lectura. Todas estas conexiones múltiples originan diferentes problemas. En primer lugar, hacen difícil conceptuar la es- tructura del programa. En segundo lugar, el programa es difícil de modificar ya que cambios en datos globales pue- den necesitar la reescritura de todas las funciones que acceden a los mismos. También puede suceder que estas mo- dificaciones de los datos globales pueden no ser aceptadas por todas o algunas de las funciones.
  • 86. 56 Fundamentos de programación 2.3.2. Modelado del mundo real Un segundo problema importante de la programación estructurada reside en el hecho de que la disposición separada de datos y funciones no se corresponden con los modelos de las cosas del mundo real. En el mundo físico se trata con objetos físicos tales como personas, autos o aviones. Estos objetos no son como los datos ni como las funciones. Los objetos complejos o no del mundo real tienen atributos y comportamiento. Los atributos o características de los objetos son, por ejemplo: en las personas, su edad, su profesión, su domi- cilio, etc.; en un auto, la potencia, el número de matrícula, el precio, número de puertas, etc; en una casa, la super- ficie, el precio, el año de construcción, la dirección, etc. En realidad, los atributos del mundo real tienen su equiva- lente en los datos de un programa; tienen un valor específico, tal como 200 metros cuadrados, 20.000 dólares, cinco puertas, etc. El comportamiento es una acción que ejecutan los objetos del mundo real como respuesta a un determinado estímulo. Si usted pisa los frenos en un auto, el coche (carro) se detiene; si acelera, el auto aumenta su velocidad, etcétera. El comportamiento, en esencia, es como una función: se llama a una función para hacer algo (visualizar la nómina de los empleados de una empresa). Por estas razones, ni los datos ni las funciones, por sí mismas, modelan los objetos del mundo real de un modo eficiente. La programación estructurada mejora la claridad, fiabilidad y facilidad de mantenimiento de los programas; sin embargo, para programas grandes o a gran escala, presentan retos de difícil solución. 2.4. PROGRAMACIÓN ORIENTADA A OBJETOS La programación orientada a objetos, tal vez el paradigma de programación más utilizado en el mundo del desarrollo de software y de la ingeniería de software del siglo XXI, trae un nuevo enfoque a los retos que se plantean en la pro- gramación estructurada cuando los problemas a resolver son complejos. Al contrario que la programación procedi- mental que enfatiza en los algoritmos, la POO enfatiza en los datos. En lugar de intentar ajustar un problema al en- foque procedimental de un lenguaje, POO intenta ajustar el lenguaje al problema. La idea es diseñar formatos de datos que se correspondan con las características esenciales de un problema. La idea fundamental de los lenguajes orientados a objetos es combinar en una única unidad o módulo, tanto los datos como las funciones que operan sobre esos datos. Tal unidad se llama un objeto. Las funciones de un objeto se llaman funciones miembro en C++ o métodos (éste es el caso de Smalltalk, uno de los primeros lenguajes orientados a objetos), y son el único medio para acceder a sus datos. Los datos de un objeto, se conocen también como atributos o variables de instancia. Si se desea leer datos de un objeto, se llama a una fun- ción miembro del objeto. Se accede a los datos y se devuelve un valor. No se puede acceder a los datos directamen- te. Los datos están ocultos, de modo que están protegidos de alteraciones accidentales. Los datos y las funciones se dice que están encapsulados en una única entidad. El encapsulamiento de datos y la ocultación de los datos son términos clave en la descripción de lenguajes orientados a objetos. Si se desea modificar los datos de un objeto, se conoce exactamente cuáles son las funciones que interactúan con miembros del objeto. Ninguna otra función puede acceder a los datos. Esto simplifica la escritura, depuración Función Función Función Función Función Función Función Función Datos globales Datos globales Datos globales Figura 2.8. Un programa procedimental.
  • 87. Metodología de la programación y desarrollo de software 57 y mantenimiento del programa. Un programa C++ se compone normalmente de un número de objetos que se co- munican unos con otros mediante la llamada a otras funciones miembro. La organización de un programa en C++ se muestra en la Figura 2.9. La llamada a una función miembro de un objeto se denomina enviar un mensaje a otro objeto. Objeto Función miembro (método) Función miembro (método) Datos Objeto Función miembro (método) Función miembro (método) Datos Objeto Función miembro (método) Función miembro (método) Datos Figura 2.9. Organización típica de un programa orientado a objetos. En el paradigma orientado a objetos, el programa se organiza como un conjunto finito de objetos que contiene datos y operaciones (funciones miembro o métodos) que llaman a esos datos y que se comunican entre sí me- diante mensajes. 2.4.1. Propiedades fundamentales de la orientación a objetos Existen diversas características ligadas a la orientación a objetos. Todas las propiedades que se suelen considerar no son exclusivas de este paradigma, ya que pueden existir en otros paradigmas, pero en su conjunto definen claramen- te los lenguajes orientados a objetos. Estas propiedades son: • Abstracción (tipos abstractos de datos y clases). • Encapsulado de datos. • Ocultación de datos. • Herencia. • Polimorfismo. 2.4.2. Abstracción La abstracción es la propiedad de los objetos que consiste en tener en cuenta sólo los aspectos más importantes des- de un punto de vista determinado y no tener en cuenta los restantes aspectos. El término abstracción que se suele
  • 88. 58 Fundamentos de programación utilizar en programación se refiere al hecho de diferenciar entre las propiedades externas de una entidad y los detalles de la composición interna de dicha entidad. Es la abstracción la que permite ignorar los detalles internos de un dis- positivo complejo tal como una computadora, un automóvil, una lavadora o un horno de microondas, etc., y usarlo como una única unidad comprensible. Mediante la abstracción se diseñan y fabrican estos sistemas complejos en primer lugar y, posteriormente, los componentes más pequeños de los cuales están compuestos. Cada componente representa un nivel de abstracción en el cual el uso del componente se aísla de los detalles de la composición interna del componente. La abstracción posee diversos grados denominados niveles de abstracción. En consecuencia, la abstracción posee diversos grados de complejidad que se denominan niveles de abstracción que ayudan a estructurar la complejidad intrínseca que poseen los sistemas del mundo real. En el modelado orien- tado a objetos de un sistema esto significa centrarse en qué es y qué hace un objeto y no en cómo debe implemen- tarse. Durante el proceso de abstracción es cuando se decide qué características y comportamiento debe tener el modelo. Aplicando la abstracción se es capaz de construir, analizar y gestionar sistemas de computadoras complejos y grandes que no se podrían diseñar si se tratara de modelar a un nivel detallado. En cada nivel de abstracción se vi- sualiza el sistema en términos de componentes, denominados herramientas abstractas, cuya composición interna se ignora. Esto nos permite concentrarnos en cómo cada componente interactúa con otros componentes y centrarnos en la parte del sistema que es más relevante para la tarea a realizar en lugar de perderse a nivel de detalles menos significativos. En estructuras o registros, las propiedades individuales de los objetos se pueden almacenar en los miembros. Para los objetos, no sólo es de interés cómo están organizados, sino también qué se puede hacer con ellos; es decir, las operaciones que forman la interfaz de un objeto son también importantes. El primer concepto en el mundo de la orientación a objetos nació con los tipos abstractos de datos (TAD). Un tipo abstracto de datos describe no sólo los atributos de un objeto, sino también su comportamiento (las operaciones). Esto puede incluir también una descripción de los estados que puede alcanzar un objeto. Un medio de reducir la complejidad es la abstracción. Las características y los procesos se reducen a las propie- dades esenciales, son resumidas o combinadas entre sí. De este modo, las características complejas se hacen más manejables. EJEMPLO 2.3 Diferentes modelos de abstracción del término coche (carro). • Un coche (carro) es la combinación (o composición) de diferentes partes, tales como motor, carrocería, cuatro ruedas, cinco puertas, etc. • Un coche (carro) es un concepto común para diferentes tipos de coches. Pueden clasificarse por el nombre del fabricante (Audi, BMW, SEAT, Toyota, Chrisler...), por su categoría (turismo, deportivo, todoterreno...), por el carburante que utilizan (gasolina, gasoil, gas, híbrido...). La abstracción coche se utilizará siempre que la marca, la categoría o el carburante no sean significativos. Así, un carro (coche) se utilizará para transportar personas o ir de Carchelejo a Cazorla. 2.4.3. Encapsulación y ocultación de datos El encapsulado o encapsulación de datos es el proceso de agrupar datos y operaciones relacionadas bajo la misma unidad de programación. En el caso de los objetos que poseen las mismas características y comportamiento se agrupan en clases, que no son más que unidades o módulos de programación que encapsulan datos y opera- ciones. La ocultación de datos permite separar el aspecto de un componente, definido por su interfaz con el exterior, de sus detalles internos de implementación. Los términos ocultación de la información (information hiding) y encapsu- lación de datos (data encapsulation) se suelen utilizar como sinónimos, pero no siempre es así, y muy al contrario, son términos similares pero distintos. Normalmente, los datos internos están protegidos del exterior y no se puede acceder a ellos más que desde su propio interior y por tanto, no están ocultos. El acceso al objeto está restringido sólo a través de una interfaz bien definida.
  • 89. Metodología de la programación y desarrollo de software 59 El diseño de un programa orientado a objetos contiene, al menos, los siguientes pasos: 1. Identificar los objetos del sistema. 2. Agrupar en clases a todos objetos que tengan características y comportamiento comunes. 3. Identificar los datos y operaciones de cada una de las clases. 4. Identificar las relaciones que pueden existir entre las clases. Un objeto es un elemento individual con su propia identidad; por ejemplo, un libro, un automóvil... Una clase puede describir las propiedades genéricas de un ejecutivo de una empresa (nombre, título, salario, cargo...) mientras que un objeto representará a un ejecutivo específico (Luis Mackoy, director general). En general, una clase define qué datos se utilizan para representar un objeto y las operaciones que se pueden ejecutar sobre esos datos. Cada clase tiene sus propias características y comportamiento; en general, una clase define los datos que se uti- lizan y las operaciones que se pueden ejecutar sobre esos datos. Una clase describe un objeto. En el sentido estricto de programación, una clase es un tipo de datos. Diferentes variables se pueden crear de este tipo. En programación orientada a objetos, éstas se llaman instancias. Las instancias son, por consiguiente, la realización de los objetos descritos en una clase. Estas instancias constan de datos o atributos descritos en la clase y se pueden manipular con las operaciones definidas dentro de ellas. Los términos objeto e instancia se utilizan frecuentemente como sinónimos (especialmente en C++). Si una va- riable de tipo Carro se declara, se crea un objeto Carro (una instancia de la clase Carro). Las operaciones definidas en los objetos se llaman métodos. Cada operación llamada por un objeto se interpreta como un mensaje al objeto, que utiliza un método específico para procesar la operación. En el diseño de programas orientados a objetos se realiza en primer lugar el diseño de las clases que representan con precisión aquellas cosas que trata el programa. Por ejemplo, un programa de dibujo, puede definir clases que representan rectángulos, líneas, pinceles, colores, etc. Las definiciones de clases incluyen una descripción de opera- ciones permisibles para cada clase, tales como desplazamiento de un círculo o rotación de una línea. A continuación se prosigue el diseño de un programa utilizando objetos de las clases. El diseño de clases fiables y útiles puede ser una tarea difícil. Afortunadamente, los lenguajes POO facilitan la tarea ya que incorporan clases existentes en su propia programación. Los fabricantes de software proporcionan nu- merosas bibliotecas de clases, incluyendo bibliotecas de clases diseñadas para simplificar la creación de programas para entornos tales como Windows, Linux, Macintosh o Unix. Uno de los beneficios reales de C++ es que permite la reutilización y adaptación de códigos existentes y ya bien probados y depurados. 2.4.4. Objetos El objeto es el centro de la programación orientada a objetos. Un objeto es algo que se visualiza, se utiliza y juega un rol o papel. Si se programa con enfoque orientado a objetos, se intentan descubrir e implementar los objetos que juegan un rol en el dominio del problema y en consecuencia programa. La estructura interna y el comportamiento de un objeto, en una primera fase, no tiene prioridad. Es importante que un objeto tal como un carro o una casa jue- gan un rol. Dependiendo del problema, diferentes aspectos de un aspecto son relevantes. Un carro puede ser ensamblado de partes tales como un motor, una carrocería, unas puertas o puede ser descrito utilizando propiedades tales como su velocidad, su kilometraje o su fabricante. Estos atributos indican el objeto. De modo similar, una persona también se puede ver como un objeto, del cual se disponen de diferentes atributos. Dependiendo de la definición del proble- ma, esos atributos pueden ser el nombre, apellido, dirección, número de teléfono, color del cabello, altura, peso, profesión, etc. Un objeto no necesariamente ha de realizar algo concreto o tangible. Puede ser totalmente abstracto y también puede describir un proceso. Por ejemplo, un partido de baloncesto o de rugby puede ser descrito como un objeto. Los atributos de este objeto pueden ser los jugadores, el entrenador, la puntuación y el tiempo transcurrido de par- tido. Cuando se trata de resolver un problema con orientación a objetos, dicho problema no se descompone en funcio- nes como en programación estructurada tradicional, caso de C, sino en objetos. El pensar en términos de objetos tiene una gran ventaja: se asocian los objetos del problema a los objetos del mundo real. ¿Qué tipos de cosas son objetos en los programas orientados a objetos? La respuesta está limitada por su imagi- nación aunque se pueden agrupar en categorías típicas que facilitarán su búsqueda en la definición del problema de un modo más rápido y sencillo.
  • 90. 60 Fundamentos de programación • Recursos Humanos: — Empleados. — Estudiantes. — Clientes. — Vendedores. — Socios. • Colecciones de datos: — Arrays (arreglos). — Listas. — Pilas. — Árboles. — Árboles binarios. — Grafos. • Tipos de datos definidos por usuarios: — Hora. — Números complejos. — Puntos del plano. — Puntos del espacio. — Ángulos. — Lados. • Elementos de computadoras: — Menús. — Ventanas. — Objetos gráficos (rectángulos, círculos, rectas, puntos...). — Ratón (mouse). — Teclado. — Impresora. — USB. — Tarjetas de memoria de cámaras fotográficas. • Objetos físicos: — Carros. — Aviones. — Trenes. — Barcos. — Motocicletas. — Casas. • Componentes de videojuegos: — Consola. — Mandos. — Volante. — Conectores. — Memoria. — Acceso a Internet. La correspondencia entre objetos de programación y objetos del mundo real es el resultado eficiente de combinar datos y funciones que manipulan esos datos. Los objetos resultantes ofrecen una mejor solución al diseño del pro- grama que en el caso de los lenguajes orientados a procedimientos. Un objeto se puede definir desde el punto de vista conceptual como una entidad individual de un sistema y que se caracteriza por un estado y un comportamiento. Desde el punto de vista de implementación un objeto es una en- tidad que posee un conjunto de datos y un conjunto de operaciones (funciones o métodos).
  • 91. Metodología de la programación y desarrollo de software 61 El estado de un objeto viene determinado por los valores que toman sus datos, cuyos valores pueden tener las restricciones impuestas en la definición del problema. Los datos se denominan también atributos y componen la es- tructura del objeto y las operaciones —también llamadas métodos— representan los servicios que proporciona el objeto. La representación gráfica de un objeto en UML se muestra en la Figura 2.10. c) Un objeto Toyota de la clase Carro d) Un objeto Mackoy de la clase Persona Un objeto: Clase X Toyota: Carro Mackoy: Persona Un objeto: Clase X a) Notación completa de un objeto b) Notación reducida de un objeto Figura 2.10. Representación de objetos en UML (Lenguaje Unificado de Modelado). 2.4.5. Clases En POO los objetos son miembros de clases. En esencia, una clase es un tipo de datos al igual que cualquier otro tipo de dato definido en un lenguaje de programación. La diferencia reside en que la clase es un tipo de dato que contiene datos y funciones. Una clase contiene muchos objetos y es preciso definirla, aunque su definición no impli- ca creación de objetos. Una clase es, por consiguiente, una descripción de un número de objetos similares. Madonna, Sting, Prince, Jua- nes, Carlos Vives o Juan Luis Guerra son miembros u objetos de la clase "músicos de rock". Un objeto concreto, Juanes o Carlos Vives, son instancias de la clase "músicos de rock". Una clase es una descripción general de un conjunto de objetos similares. Por definición todos los objetos de una clase comparten los mismos atributos (datos) y las mismas operaciones (métodos). Una clase encapsula las abstrac- ciones de datos y operaciones necesarias para describir una entidad u objeto del mundo real. Una clase se representa en UML mediante un rectángulo que contiene en una banda con el nombre de la clase y opcionalmente otras dos bandas con el nombre de sus atributos y de sus operaciones o métodos (Figuras 2.11 y 2.12). 2.4.6. Generalización y especialización: herencia La generalización es la propiedad que permite compartir información entre dos entidades evitando la redundancia. En el comportamiento de objetos existen con frecuencia propiedades que son comunes en diferentes objetos y esta propiedad se denomina generalización. Por ejemplo, máquinas lavadoras, frigoríficos, hornos de microondas, tostadoras, lavavajillas, etc., son todos elec- trodomésticos (aparatos del hogar). En el mundo de la orientación a objetos, cada uno de estos aparatos es una sub- clase de la clase Electrodoméstico y a su vez Electrodoméstico es una superclase de todas las otras clases (máquinas lavadoras, frigoríficos, hornos de microondas, tostadoras, lavavaji- llas...). El proceso inverso de la generalización por el cual se definen nuevas clases a partir de otras ya existentes se denomina especialización En orientación a objetos, el mecanismo que implementa la propiedad de generalización se denomina herencia. La herencia permite definir nuevas clases a partir de otras clases ya existentes, de modo que presentan las mismas características y comportamiento de éstas, así como otras adicionales.
  • 92. 62 Fundamentos de programación La idea de clases conduce a la idea de herencia. Clases diferentes se pueden conectar unas con otras de modo jerárquico. Como ya se ha comentado anteriormente con las relaciones de generalización y especialización, en nues- tras vidas diarias se utiliza el concepto de clases divididas en subclases. La clase animal se divide en anfibios, mamíferos, insectos, pájaros, etc., y la clase vehículo en carros, motos, camiones, buses, etc. El principio de la división o clasificación es que cada subclase comparte características comunes con la clase de la que procede o se deriva. Los carros, motos, camiones y buses tiene ruedas, motores y carrocerías; son las caracte- rísticas que definen a un vehículo. Además de las características comunes con los otros miembros de la clase, cada subclase tiene sus propias características. Por ejemplo los camiones tienen una cabina independiente de la caja que transporta la carga; los buses tienen un gran número de asientos independientes para los viajeros que ha de transpor- tar, etc. En la Figura 2.13 se muestran clases pertenecientes a una jerarquía o herencia de clases. De modo similar una clase se puede convertir en padre o raíz de otras subclases. En C++ la clase original se de- nomina clase base y las clases que se derivan de ella se denominan clases derivadas y siempre son una especializa- ción o concreción de su clase base. A la inversa, la clase base es la generalización de la clase derivada. Esto signifi- ca que todas las propiedades (atributos y operaciones) de la clase base se heredan por la clase derivada, normalmente suplementada con propiedades adicionales. c) Clase Carro d) Clases Persona, Carro y Avión a) Notación completa de un objeto b) Notación abreviada de una clase Nombre de la clase Persona Nombre de la clase Atributos Métodos Excepciones, etc. Carro Marca Modelo Año de matrícula Potencia Acelerar ( ) Frenar ( ) Girar ( ) Carro Avión Figura 2.11. Representación de clases en UML. Perro Nombre Edad Peso Altura Correr ( ) Dormir ( ) Jugador de Baloncesto Lanzar ( ) Saltar ( ) … Nombre Altura Peso Edad Figura 2.12. Representación de clases en UML con atributos y métodos.
  • 93. Metodología de la programación y desarrollo de software 63 2.4.7 Reusabilidad Una vez que una clase ha sido escrita, creada y depurada, se puede distribuir a otros programadores para utilizar en sus propios programas. Esta propiedad se llama reusabilidad4 o reutilización. Su concepto es similar a las funciones incluidas en las bibliotecas de funciones de un lenguaje procedimental como C que se pueden incorporar en diferen- tes programas. En C++, el concepto de herencia proporciona una extensión o ampliación al concepto de reusabilidad. Un pro- gramador puede considerar una clase existente y sin modificarla, añadir competencias y propiedades adicionales a ella. Esto se consigue derivando una nueva clase de una ya existente. La nueva clase heredará las características de la clase antigua, pero es libre de añadir nuevas características propias. La facilidad de reutilizar o reusar el software existente es uno de los grandes beneficios de la POO: muchas em- presas consiguen con la reutilización de clase en nuevos proyectos la reducción de los costes de inversión en sus presupuestos de programación. ¿En esencia cuáles son las ventajas de la herencia? Primero, se utiliza para consisten- cia y reducir código. Las propiedades comunes de varias clases sólo necesitan ser implementadas una vez y sólo necesitan modificarse una vez si es necesario. La otra ventaja es que el concepto de abstracción de la funcionalidad común está soportada. 2.4.8. Polimorfismo Además de las ventajas de consistencia y reducción de código, la herencia, aporta también otra gran ventaja: facilitar el polimorfismo. Polimorfismo es la propiedad de que un operador o una función actúen de modo diferente en función del objeto sobre el que se aplican. En la practica, el polimorfismo significa la capacidad de una operación de ser interpretada sólo por el propio objeto que lo invoca. Desde un punto de vista práctico de ejecución del programa, el polimorfismo se realiza en tiempo de ejecución ya que durante la compilación no se conoce qué tipo de objeto y por consiguiente qué operación ha sido llamada. En el Capítulo 14 se describirá en profundidad la propiedad de polimor- fismo y los diferentes modos de implementación del polimorfismo. La propiedad de polimorfismo es aquella en que una operación tiene el mismo nombre en diferentes clases, pero se ejecuta de diferentes formas en cada clase. Así, por ejemplo, la operación de abrir se puede dar en diferentes cla- ses: abrir una puerta, abrir una ventana, abrir un periódico, abrir un archivo, abrir una cuenta corriente en un banco, abrir un libro, etc. En cada caso se ejecuta una operación diferente aunque tiene el mismo nombre en todos ellos “abrir”. El polimorfismo es la propiedad de una operación de ser interpretada sólo por el objeto al que pertenece. Existen diferentes formas de implementar el polimorfismo y variará dependiendo del lenguaje de programación. Veamos el concepto con ejemplos de la vida diaria. En un taller de reparaciones de automóviles existen numerosos carros, de marcas diferentes, de modelos diferen- tes, de tipos diferentes, potencias diferentes, etc. Constituyen una clase o colección heterogénea de carros (coches). Supongamos que se ha de realizar una operación común “cambiar los frenos del carro”. La operación a realizar es la 4 El término proviene del concepto ingles reusability. La traducción no ha sido aprobada por la RAE, pero se incorpora al texto por su gran uso y difusión entre los profesionales de la informática. Animal Mamífero Reptil Anfibio Rana Caballo Serpiente Figura 2.13. Herencia de clases en UML.
  • 94. 64 Fundamentos de programación misma, incluye los mismos principios, sin embargo, dependiendo del coche, en particular, la operación será muy diferente, incluirá diferentes acciones en cada caso. Otro ejemplo a considerar y relativo a los operadores “+” y “*” aplicados a números enteros o números complejos; aunque ambos son números, en un caso la suma y multiplicación son operaciones simples, mientras que en el caso de los números complejos al componerse de parte real y parte ima- ginaria, será necesario seguir un método específico para tratar ambas partes y obtener un resultado que también será un número complejo. El uso de operadores o funciones de forma diferente, dependiendo de los objetos sobre los que están actuando se llama polimorfismo (una cosa con diferentes formas). Sin embargo, cuando un operador existente, tal como + o =, se le permite la posibilidad de operar sobre nuevos tipos de datos, se dice entonces que el operador está sobrecarga- do. La sobrecarga es un tipo de polimorfismo y una característica importante de la POO. En el Capítulo 10 se am- pliará, también en profundidad, este nuevo concepto. 2.5. CONCEPTO Y CARACTERÍSTICAS DE ALGORITMOS El objetivo fundamental de este texto es enseñar a resolver problemas mediante una computadora. El programador de computadora es antes que nada una persona que resuelve problemas, por lo que para llegar a ser un programador eficaz se necesita aprender a resolver problemas de un modo riguroso y sistemático. A lo largo de todo este libro nos referiremos a la metodología necesaria para resolver problemas mediante programas, concepto que se denomina metodología de la programación. El eje central de esta metodología es el concepto, ya tratado, de algoritmo. Un algoritmo es un método para resolver un problema. Aunque la popularización del término ha llegado con el advenimiento de la era informática, algoritmo proviene —como se comentó anteriormente— de Mohammed al- KhoWârizmi, matemático persa que vivió durante el siglo IX y alcanzó gran reputación por el enunciado de las reglas paso a paso para sumar, restar, multiplicar y dividir números decimales; la traducción al latín del apellido en la pa- labra algorismus derivó posteriormente en algoritmo. Euclides, el gran matemático griego (del siglo IV a. C.) que inventó un método para encontrar el máximo común divisor de dos números, se considera con Al-Khowârizmi el otro gran padre de la algoritmia (ciencia que trata de los algoritmos). El profesor Niklaus Wirth —inventor de Pascal, Modula-2 y Oberon— tituló uno de sus más famosos libros, Al- goritmos + Estructuras de datos = Programas, significándonos que sólo se puede llegar a realizar un buen programa con el diseño de un algoritmo y una correcta estructura de datos. Esta ecuación será una de las hipótesis fundamen- tales consideradas en esta obra. La resolución de un problema exige el diseño de un algoritmo que resuelva el problema propuesto. Problema Diseño de algoritmo Programa de computadora Figura 2.14. Resolución de un problema. Los pasos para la resolución de un problema son: 1. Diseño del algoritmo, que describe la secuencia ordenada de pasos —sin ambigüedades— que conducen a la solución de un problema dado. (Análisis del problema y desarrollo del algoritmo.) 2. Expresar el algoritmo como un programa en un lenguaje de programación adecuado. (Fase de codifica- ción.) 3. Ejecución y validación del programa por la computadora. Para llegar a la realización de un programa es necesario el diseño previo de un algoritmo, de modo que sin algo- ritmo no puede existir un programa. Los algoritmos son independientes tanto del lenguaje de programación en que se expresan como de la computa- dora que los ejecuta. En cada problema el algoritmo se puede expresar en un lenguaje diferente de programación y ejecutarse en una computadora distinta; sin embargo, el algoritmo será siempre el mismo. Así, por ejemplo, en una analogía con la vida diaria, una receta de un plato de cocina se puede expresar en español, inglés o francés, pero cualquiera que sea el lenguaje, los pasos para la elaboración del plato se realizarán sin importar el idioma del coci- nero.
  • 95. Metodología de la programación y desarrollo de software 65 En la ciencia de la computación y en la programación, los algoritmos son más importantes que los lenguajes de programación o las computadoras. Un lenguaje de programación es tan sólo un medio para expresar un algoritmo y una computadora es sólo un procesador para ejecutarlo. Tanto el lenguaje de programación como la computadora son los medios para obtener un fin: conseguir que el algoritmo se ejecute y se efectúe el proceso correspondiente. Dada la importancia del algoritmo en la ciencia de la computación, un aspecto muy importante será el diseño de algoritmos. A la enseñanza y práctica de esta tarea se dedica gran parte de este libro. El diseño de la mayoría de los algoritmos requiere creatividad y conocimientos profundos de la técnica de la programación. En esencia, la solución de un problema se puede expresar mediante un algoritmo. 2.5.1. Características de los algoritmos Las características fundamentales que debe cumplir todo algoritmo son: • Un algoritmo debe ser preciso e indicar el orden de realización de cada paso. • Un algoritmo debe estar bien definido. Si se sigue un algoritmo dos veces, se debe obtener el mismo resultado cada vez. • Un algoritmo debe ser finito. Si se sigue un algoritmo, se debe terminar en algún momento; o sea, debe tener un número finito de pasos. La definición de un algoritmo debe describir tres partes: Entrada, Proceso y Salida. En el algoritmo de receta de cocina citado anteriormente se tendrá: Entrada: Ingredientes y utensilios empleados. Proceso: Elaboración de la receta en la cocina. Salida: Terminación del plato (por ejemplo, cordero). EJEMPLO 2.4 Un cliente ejecuta un pedido a una fábrica. La fábrica examina en su banco de datos la ficha del cliente, si el clien- te es solvente entonces la empresa acepta el pedido; en caso contrario, rechazará el pedido. Redactar el algoritmo correspondiente. Los pasos del algoritmo son: 1. Inicio. 2. Leer el pedido. 3. Examinar la ficha del cliente. 4. Si el cliente es solvente, aceptar pedido; en caso contrario, rechazar pedido. 5. Fin. EJEMPLO 2.5 Se desea diseñar un algoritmo para saber si un número es primo o no. Un número es primo si sólo puede dividirse por sí mismo y por la unidad (es decir, no tiene más divisores que él mismo y la unidad). Por ejemplo, 9, 8, 6, 4, 12, 16, 20, etc., no son primos, ya que son divisibles por números distintos a ellos mismos y a la unidad. Así, 9 es divisible por 3, 8 lo es por 2, etc. El algoritmo de resolución del problema pasa por dividir sucesivamente el número por 2, 3, 4..., etc. 1. Inicio. 2. Poner X igual a 2 (X ← 2, X variable que representa a los divisores del número que se busca N).
  • 96. 66 Fundamentos de programación 3. Dividir N por X (N/X). 4. Si el resultado de N/X es entero, entonces N no es un número primo y bifurcar al punto 7; en caso contrario, continuar el proceso. 5. Suma 1 a X (X ← X + 1). 6. Si X es igual a N, entonces N es un número primo; en caso contrario, bifurcar al punto 3. 7. Fin. Por ejemplo, si N es 131, los pasos anteriores serían: 1. Inicio. 2. X = 2. 3. 131/X. Como el resultado no es entero, se continúa el proceso. 5. X ← 2 + 1, luego X = 3. 6. Como X no es 131, se continúa el proceso. 3. 131/X resultado no es entero. 5. X ← 3 + 1, X = 4. 6. Como X no es 131 se continúa el proceso. 3. 131/X..., etc. 7. Fin. EJEMPLO 2.6 Realizar la suma de todos los números pares entre 2 y 1.000. El problema consiste en sumar 2 + 4 + 6 + 8 ... + 1.000. Utilizaremos las palabras SUMA y NÚMERO (variables, serán denominadas más tarde) para representar las sumas sucesivas (2+4), (2+4+6), (2+4+6+8), etc. La solución se puede escribir con el siguiente algoritmo: 1. Inicio. 2. Establecer SUMA a 0. 3. Establecer NÚMERO a 2. 4. Sumar NÚMERO a SUMA. El resultado será el nuevo valor de la suma (SUMA). 5. Incrementar NÚMERO en 2 unidades. 6. Si NÚMERO =< 1.000 bifurcar al paso 4; en caso contrario, escribir el último valor de SUMA y terminar el proceso. 7. Fin. 2.5.2. Diseño del algoritmo Una computadora no tiene capacidad para solucionar problemas más que cuando se le proporcionan los sucesivos pasos a realizar. Estos pasos sucesivos que indican las instrucciones a ejecutar por la máquina constituyen, como ya conocemos, el algoritmo. La información proporcionada al algoritmo constituye su entrada y la información producida por el algoritmo constituye su salida. Los problemas complejos se pueden resolver más eficazmente con la computadora cuando se rompen en subpro- blemas que sean más fáciles de solucionar que el original. Es el método de divide y vencerás (divide and conquer), mencionado anteriormente, y que consiste en dividir un problema complejo en otros más simples. Así, el problema de encontrar la superficie y la longitud de un círculo se puede dividir en tres problemas más simples o subproblemas (Figura 2.15). La descomposición del problema original en subproblemas más simples y a continuación la división de estos subproblemas en otros más simples que pueden ser implementados para su solución en la computadora se denomina diseño descendente (top-down design). Normalmente, los pasos diseñados en el primer esbozo del algoritmo son incompletos e indicarán sólo unos pocos pasos (un máximo de doce aproximadamente). Tras esta primera descripción, éstos se amplían en una descripción más detallada con más pasos específicos. Este proceso se denomina refinamien-
  • 97. Metodología de la programación y desarrollo de software 67 to del algoritmo (stepwise refinement). Para problemas complejos se necesitan con frecuencia diferentes niveles de refinamiento antes de que se pueda obtener un algoritmo claro, preciso y completo. El problema de cálculo de la circunferencia y superficie de un círculo se puede descomponer en subproblemas más simples: 1) leer datos de entrada; 2) calcular superficie y longitud de circunferencia, y 3) escribir resultados (datos de salida). Subproblema Refinamiento leer radio leer radio calcular superficie superficie = 3.141592 * radio ^ 2 calcular circunferencia circunferencia = 2 * 3.141592 * radio escribir resultados escribir radio, circunferencia, superficie Las ventajas más importantes del diseño descendente son: • El problema se comprende más fácilmente al dividirse en partes más simples denominadas módulos. • Las modificaciones en los módulos son más fáciles. • La comprobación del problema se puede verificar fácilmente. Tras los pasos anteriores (diseño descendente y refinamiento por pasos) es preciso representar el algoritmo me- diante una determinada herramienta de programación: diagrama de flujo, pseudocódigo o diagrama N-S. Así pues, el diseño del algoritmo se descompone en las fases recogidas en la Figura 2.16. Diseño de un algoritmo Diseño descendente (1) Refinamiento por casos (2) Herramienta de programación (3) — diagrama de flujo — pseudocódigo — diagrama N-S Figura 2.16. Fases del diseño de un algoritmo. Superficie y longitud de circunferencia Entrada de datos Cálculo de superficie (S) Cálculo de longitud (L) Salida resultados Entrada radio (R) S = PI* R2 L = 2* PI * R Salida R Salida S Salida L Figura 2.15. Refinamiento de un algoritmo.
  • 98. 68 Fundamentos de programación 2.6. ESCRITURA DE ALGORITMOS Como ya se ha comentado anteriormente, el sistema para describir (“escribir”) un algoritmo consiste en realizar una descripción paso a paso con un lenguaje natural del citado algoritmo. Recordemos que un algoritmo es un método o conjunto de reglas para solucionar un problema. En cálculos elementales estas reglas tienen las siguientes propie- dades: • deben ir seguidas de alguna secuencia definida de pasos hasta que se obtenga un resultado coherente, • sólo puede ejecutarse una operación a la vez. El flujo de control usual de un algoritmo es secuencial; consideremos el algoritmo que responde a la pregunta: ¿Qué hacer para ver la película de Harry Potter? La respuesta es muy sencilla y puede ser descrita en forma de algoritmo general de modo similar a: ir al cine comprar una entrada (billete o ticket) ver la película regresar a casa El algoritmo consta de cuatro acciones básicas, cada una de las cuales debe ser ejecutada antes de realizar la si- guiente. En términos de computadora, cada acción se codificará en una o varias sentencias que ejecutan una tarea particular. El algoritmo descrito es muy sencillo; sin embargo, como ya se ha indicado en párrafos anteriores, el algoritmo general se descompondrá en pasos más simples en un procedimiento denominado refinamiento sucesivo, ya que cada acción puede descomponerse a su vez en otras acciones simples. Así, por ejemplo, un primer refinamiento del algo- ritmo ir al cine se puede describir de la forma siguiente: 1. inicio 2. ver la cartelera de cines en el periódico 3. si no proyectan "Harry Potter" entonces 3.1. decidir otra actividad 3.2. bifurcar al paso 7 si_no 3.3. ir al cine fin_si 4. si hay cola entonces 4.1. ponerse en ella 4.2. mientras haya personas delante hacer 4.2.1. avanzar en la cola fin_mientras fin_si 5. si hay localidades entonces 5.1. comprar una entrada 5.2. pasar a la sala 5.3. localizar la(s) butaca(s) 5.4. mientras proyectan la película hacer 5.4.1. ver la película fin_mientras 5.5. abandonar el cine si_no 5.6. refunfuñar fin_si 6. volver a casa 7. fin
  • 99. Metodología de la programación y desarrollo de software 69 En el algoritmo anterior existen diferentes aspectos a considerar. En primer lugar, ciertas palabras reservadas se han escrito deliberadamente en negrita (mientras, si_no; etc.). Estas palabras describen las estructuras de control fundamentales y procesos de toma de decisión en el algoritmo. Éstas incluyen los conceptos importantes de selección (expresadas por si-entonces-si_no, if-then-else) y de repetición (expresadas con mientras-hacer o a veces repetir-hasta e iterar-fin_iterar, en inglés, while-do y repeat-until) que se encuentran en casi todos los algoritmos, especialmente en los de proceso de datos. La capacidad de decisión permite seleccionar alternativas de acciones a seguir o bien la repetición una y otra vez de operaciones básicas. si proyectan la película seleccionada ir al cine si_no ver la televisión, ir al fútbol o leer el periódico mientras haya personas en la cola, ir avanzando repetidamente hasta llegar a la taquilla Otro aspecto a considerar es el método elegido para describir los algoritmos: empleo de indentación (sangrado o justificación) en escritura de algoritmos. En la actualidad es tan importante la escritura de programa como su poste- rior lectura. Ello se facilita con la indentación de las acciones interiores a las estructuras fundamentales citadas: se- lectivas y repetitivas. A lo largo de todo el libro la indentación o sangrado de los algoritmos será norma constante. Para terminar estas consideraciones iniciales sobre algoritmos, describiremos las acciones necesarias para refinar el algoritmo objeto de nuestro estudio; para ello analicemos la acción: Localizar la(s) butaca(s). Si los números de los asientos están impresos en la entrada, la acción compuesta se resuelve con el siguiente algoritmo: 1. inicio //algoritmo para encontrar la butaca del espectador 2. caminar hasta llegar a la primera fila de butacas 3. repetir compara número de fila con número impreso en billete si son iguales entonces pasar a la siguiente fila fin_si hasta_que se localice la fila correcta 4. mientras número de butaca no coincida con número de billete hacer avanzar a través de la fila a la siguiente butaca fin_mientras 5. sentarse en la butaca 6. fin En este algoritmo la repetición se ha mostrado de dos modos, utilizando ambas notaciones, repetir... has- ta_que y mientras... fin_mientras. Se ha considerado también, como ocurre normalmente, que el número del asiento y fila coincide con el número y fila rotulado en el billete. 2.7. REPRESENTACIÓN GRÁFICA DE LOS ALGORITMOS Para representar un algoritmo se debe utilizar algún método que permita independizar dicho algoritmo del lenguaje de programación elegido. Ello permitirá que un algoritmo pueda ser codificado indistintamente en cualquier lengua- je. Para conseguir este objetivo se precisa que el algoritmo sea representado gráfica o numéricamente, de modo que las sucesivas acciones no dependan de la sintaxis de ningún lenguaje de programación, sino que la descripción pue- da servir fácilmente para su transformación en un programa, es decir, su codificación. Los métodos usuales para representar un algoritmo son: 1. diagrama de flujo, 2. diagrama N-S (Nassi-Schneiderman), 3. lenguaje de especificación de algoritmos: pseudocódigo, 4. lenguaje español, inglés… 5. fórmulas.
  • 100. 70 Fundamentos de programación Los métodos 4 y 5 no suelen ser fáciles de transformar en programas. Una descripción en español narrativo no es satisfactoria, ya que es demasiado prolija y generalmente ambigua. Una fórmula, sin embargo, es un buen siste- ma de representación. Por ejemplo, las fórmulas para la solución de una ecuación cuadrática (de segundo grado) son un medio sucinto de expresar el procedimiento algorítmico que se debe ejecutar para obtener las raíces de dicha ecuación. xl = (–b + √–– b2 – 4ac)/2a x2 = (–b – √–– b2 – 4ac)/2a y significa lo siguiente: 1. Elevar al cuadrado b. 2. Tomar a; multiplicar por c; multiplicar por 4. 3. Restar el resultado obtenido de 2 del resultado de 1, etc. Sin embargo, no es frecuente que un algoritmo pueda ser expresado por medio de una simple fórmula. 2.7.1. Pseudocódigo El pseudocódigo es un lenguaje de especificación (descripción) de algoritmos. El uso de tal lenguaje hace el paso de codificación final (esto es, la traducción a un lenguaje de programación) relativamente fácil. Los lenguajes APL Pascal y Ada se utilizan a veces como lenguajes de especificación de algoritmos. El pseudocódigo nació como un lenguaje similar al inglés y era un medio de representar básicamente las estruc- turas de control de programación estructurada que se verán en capítulos posteriores. Se considera un primer borrador, dado que el pseudocódigo tiene que traducirse posteriormente a un lenguaje de programación. El pseudocódigo no puede ser ejecutado por una computadora. La ventaja del pseudocódigo es que en su uso, en la planificación de un programa, el programador se puede concentrar en la lógica y en las estructuras de control y no preocuparse de las reglas de un lenguaje específico. Es también fácil modificar el pseudocódigo si se descubren errores o anomalías en la lógica del programa, mientras que en muchas ocasiones suele ser difícil el cambio en la lógica, una vez que está codificado en un lenguaje de programación. Otra ventaja del pseudocódigo es que puede ser traducido fácilmente a lenguajes estructurados como Pascal, C, FORTRAN 77/90, C++, Java, C#, etc. El pseudocódigo original utiliza para representar las acciones sucesivas palabras reservadas en inglés —similares a sus homónimas en los lenguajes de programación—, tales como start, end, stop, if-then-else, while-end, repeat-until, etc. La escritura de pseudocódigo exige normalmente la indentación (sangría en el margen izquier- do) de diferentes líneas. Una representación en pseudocódigo —en inglés— de un problema de cálculo del salario neto de un trabajador es la siguiente: start //cálculo de impuesto y salarios read nombre, horas, precio salario ← horas * precio tasas ← 0,25 * salario salario_neto ← salario – tasas write nombre, salario, tasas, salario end El algoritmo comienza con la palabra start y finaliza con la palabra end, en inglés (en español, inicio, fin). Entre estas palabras, sólo se escribe una instrucción o acción por línea. La línea precedida por // se denomina comentario. Es una información al lector del programa y no realiza nin- guna instrucción ejecutable, sólo tiene efecto de documentación interna del programa. Algunos autores suelen utilizar corchetes o llaves. No es recomendable el uso de apóstrofos o simples comillas como representan en algunos lenguajes primitivos los comentarios, ya que este carácter es representativo de apertura o cierre de cadenas de caracteres en lenguajes como Pascal o FORTRAN, y daría lugar a confusión.
  • 101. Metodología de la programación y desarrollo de software 71 Otro ejemplo aclaratorio en el uso del pseudocódigo podría ser un sencillo algoritmo del arranque matinal de un coche. inicio //arranque matinal de un coche introducir la llave de contacto girar la llave de contacto pisar el acelerador oir el ruido del motor pisar de nuevo el acelerador esperar unos instantes a que se caliente el motor fin Por fortuna, aunque el pseudocódigo nació como un sustituto del lenguaje de programación y, por consiguiente, sus palabras reservadas se conservaron o fueron muy similares a las del idioma inglés, el uso del pseudocódigo se ha extendido en la comunidad hispana con términos en español como inicio, fin, parada, leer, escribir, si-en- tonces-si_no, mientras, fin_mientras, repetir, hasta_que, etc. Sin duda, el uso de la terminología del pseudocódigo en español ha facilitado y facilitará considerablemente el aprendizaje y uso diario de la programación. En esta obra, al igual que en otras nuestras, utilizaremos el pseudocódigo en español y daremos en su momento las estructuras equivalentes en inglés, al objeto de facilitar la traducción del pseudocódigo al lenguaje de programación seleccionado. Así pues, en los pseudocódigos citados anteriormente deberían ser sustituidas las palabras start, end, read, write, por inicio, fin, leer, escribir, respectivamente. inicio start leer read . . . . . fin end escribir write 2.7.2. Diagramas de flujo Un diagrama de flujo (flowchart) es una de las técnicas de representación de algoritmos más antigua y a la vez más utilizada, aunque su empleo ha disminuido considerablemente, sobro todo, desde la aparición de lenguajes de pro- gramación estructurados. Un diagrama de flujo es un diagrama que utiliza los símbolos (cajas) estándar mostrados en la Tabla 2.1 y que tiene los pasos de algoritmo escritos en esas cajas unidas por flechas, denominadas líneas de flujo, que indican la secuencia en que se debe ejecutar. La Figura 2.17 es un diagrama de flujo básico. Este diagrama representa la resolución de un programa que de- duce el salario neto de un trabajador a partir de la lectura del nombre, horas trabajadas, precio de la hora, y sabiendo que los impuestos aplicados son el 25 por 100 sobre el salario bruto. Los símbolos estándar normalizados por ANSI (abreviatura de American National Standars Institute) son muy variados. En la Figura 2.18 se representa una plantilla de dibujo típica donde se contemplan la mayoría de los sím- bolos utilizados en el diagrama; sin embargo, los símbolos más utilizados representan: • proceso • decisión • conectores • fin • entrada/salida • dirección del flujo El diagrama de flujo de la Figura 2.17 resume sus características: • existe una caja etiquetada “inicio”, que es de tipo elíptico, • existe una caja etiquetada “fin” de igual forma que la anterior, • si existen otras cajas, normalmente son rectangulares, tipo rombo o paralelogramo (el resto de las figuras se utilizan sólo en diagramas de flujo generales o de detalle y no siempre son imprescindibles).
  • 102. 72 Fundamentos de programación Tabla 2.1. Símbolos de diagrama de flujo Símbolos principales Función Terminal (representa el comienzo, “inicio”, y el final, “fin” de un programa. Puede representar también una parada o interrupción programada que sea necesario realizar en un programa. Entrada/Salida (cualquier tipo de introducción de datos en la memoria desde los periféricos, “entrada”, o registro de la información procesada en un periférico, “salida”. Proceso (cualquier tipo de operación que pueda originar cambio de valor, formato o posición de la información almacenada en memoria, operaciones aritméticas, de transferencia, etc.). NO SÍ Decisión (indica operaciones lógicas o de comparación entre datos —normalmente dos— y en función del resultado de la misma determina cuál de los distintos caminos alternativos del programa se debe seguir; normalmente tiene dos salidas —respuestas SÍ o NO— pero puede tener tres o más, según los casos). Decisión múltiple (en función del resultado de la comparación se seguirá uno de los diferentes caminos de acuerdo con dicho resultado). Conector (sirve para enlazar dos partes cualesquiera de un ordinograma a través de un conector en la salida y otro conector en la entrada. Se refiere a la conexión en la misma página del diagrama. Indicador de dirección o línea de flujo (indica el sentido de ejecución de las operaciones). Línea conectora (sirve de unión entre dos símbolos). Conector (conexión entre dos puntos del organigrama situado en páginas diferentes). Llamada a subrutina o a un proceso predeterminado (una subrutina es un módulo independientemente del programa principal, que recibe una entrada procedente de dicho programa, realiza una tarea determinada y regresa, al terminar, al programa principal). Pantalla (se utiliza en ocasiones en lugar del símbolo de E/S). Impresora (se utiliza en ocasiones en lugar del símbolo de E/S). Teclado (se utiliza en ocasiones en lugar del símbolo de E/S). Comentarios (se utiliza para añadir comentarios clasificadores a otros símbolos del diagrama de flujo. Se pueden dibujar a cualquier lado del símbolo).
  • 103. Metodología de la programación y desarrollo de software 73 Se puede escribir más de un paso del algoritmo en una sola caja rectangular. El uso de flechas significa que la caja no necesita ser escrita debajo de su predecesora. Sin embargo, abusar demasiado de esta flexibilidad conduce a diagramas de flujo complicados e ininteligibles. EJEMPLO 2.7 Calcular la media de una serie de números positivos, suponiendo que los datos se leen desde un terminal. Un valor de cero —como entrada— indicará que se ha alcanzado el final de la serie de números positivos. inicio leer nombre, horas, precio bruto ← horas * precio tasas ← 0,25 * bruto neto ← bruto – tasas escribir nombre, bruto, tasas, neto fin Figura 2.17. Diagrama de flujo. Entrada/ Salida Terminal Decisión no sí Subprograma Proceso Figura 2.18. Plantilla típica para diagramas de flujo. Problema: Calcular el salario bruto y el salario neto de un trabajador “por horas” conociendo el nombre, número de horas trabajadas, im- puestos a pagar y salario neto.
  • 104. 74 Fundamentos de programación El primer paso a dar en el desarrollo del algoritmo es descomponer el problema en una serie de pasos secuencia- les. Para calcular una media se necesita sumar y contar los valores. Por consiguiente, nuestro algoritmo en forma descriptiva sería: 1. Inicializar contador de números C y variable suma S. 2. Leer un número. 3. Si el número leído es cero: • calcular la media; • imprimir la media; • fin del proceso. Si el número leído no es cero: • calcular la suma; • incrementar en uno el contador de números; • ir al paso 2. 4. Fin. El refinamiento del algoritmo conduce a los pasos sucesivos necesarios para realizar las operaciones de lectura, verificación del último dato, suma y media de los datos. Si el primer dato leído es 0, la división S/C produciría un error si el algoritmo se ejecutara en una computadora, ya que en ella no está permitida la división por cero. Terminal C - contador de números S - sumador de números C 0 S 0 leer dato dato <> 0 C C + 1 S S + dato media S/C Imprimir media Fin Si el primer dato leído es 0, la división s/c producirá un error si el algoritmo se ejecutara en una computadora, ya que en ella no está permitida la división por cero. entero: dato, C Real: Media, S C ← 0 S ← 0 escribir('Datos numéricos; para finalizar se introduce 0') repetir leer(dato) si dato <> = 0 entonces C ← C + 1 S ← S + dato fin_si hasta dato = 0 {Calcula la media y la escribe} si (C > 0) entonces Media ← S/C escribir (Media) fin_si Pseudocódigo Diagrama de flujo
  • 105. Metodología de la programación y desarrollo de software 75 EJEMPLO 2.8 Suma de los números pares comprendidos entre 2 y 100. Diagrama de flujo Pseudocódigo SUMA 2 NÚMERO 4 Inicio SUMA SUMA + NÚMERO NÚMERO NÚMERO + 2 NÚMERO = < 100 Escribir SUMA Fin entero: numero,Suma Suma ← 2 numero ← 4 mientras (numero <= 100) hacer suma ← suma + numero numero ← numero + 2 fin mientras escribe ('Suma pares entre 2 y 100 =', suma) EJEMPLO 2.9 Se desea realizar el algoritmo que resuelva el siguiente problema: Cálculo de los salarios mensuales de los emplea- dos de una empresa, sabiendo que éstos se calculan en base a las horas semanales trabajadas y de acuerdo a un precio especificado por horas. Si se pasan de cuarenta horas semanales, las horas extraordinarias se pagarán a razón de 1,5 veces la hora ordinaria. Los cálculos son: 1. Leer datos del archivo de la empresa, hasta que se encuentre la ficha final del archivo (HORAS, PRECIO_HORA, NOMBRE). 2. Si HORAS <= 40, entonces SALARIO es el producto de horas por PRECIO_HORA. 3. Si HORAS > 40, entonces SALARIO es la suma de 40 veces PRECIO_HORA más 1.5 veces PRECIO_HORA por (HORAS-40).
  • 106. 76 Fundamentos de programación El diagrama de flujo completo del algoritmo y la codificación en pseudocódigo se indican a continuación: Diagrama de flujo Pseudocódigo Inicio HORAS < = 40 Leer HORAS, PRECIO HORA NOMBRE SALARIO = HORAS* PRECIO HORA SALARIO = 40* PRECIO HORA + 1,5* PRECIO HORA (HORAS – 40) más datos SALARIO Fin sí no sí no Escribir real: horas, precioHora, salario cadena: nombre caracter: masDatos inicio escribir('Introducir horas, precio hora y nombre') repetir escribir ('Nombre') leer (Nombre) escribir ('Horas trabajadas') leer (horas) escribir ('Precio hora') leer (precio Hora) si (horas <= 40) entonces Salario ← horas * precioHora sino Salario ← 40 * precioHora + 1.5 * (horas - 40) * preciohora fin si escribir ('Salario de', nombre, salario) escribir ('Mas trabajadores S/N') leer (masDatos) hasta masDatos = 'N' fin
  • 107. Metodología de la programación y desarrollo de software 77 Una variante también válida del diagrama de flujo anterior es: Diagrama de flujo Pseudocódigo Inicio HORAS < = 40 Leer HORAS, PRECIO_HORA NOMBRE SALARIO = HORAS* PRECIO HORA SALARIO = 40* PRECIO HORA + 1,5* PRECIO HORA (HORAS – 40) ¿más datos? SALARIO Fin sí sí no no Escribir real: horas, precioHora, salario cadena: nombre caracter: masDatos inicio masDatos ← 'S'; escribir ('Introducir horas, precio hora y nombre') mientras (masDatos = 'S' o masDatos = 's') hacer escribir ('Nombre') leer (nombre) escribir ('Horas trabajadas') leer (horas) escribir ('Precio hora') leer (PrecioHora) si horas <= 40 entonces salario ← horas * precioHora sino salario ← 40 * precioHora + 1.5 * (horas – 40) * precioHora fin si escribir ('Salario de', nombre, salario) escribir ('Mas trabajadores (S/N)') leer (masDatos) fin mientras fin EJEMPLO 2.10 La escritura de algoritmos para realizar operaciones sencillas de conteo es una de las primeras cosas que una com- putadora puede aprender. Supongamos que se proporciona una secuencia de números, tales como 5 3 0 2 4 4 0 0 2 3 6 0 2 y desea contar e imprimir el número de ceros de la secuencia. El algoritmo es muy sencillo, ya que sólo basta leer los números de izquierda a derecha, mientras se cuentan los ceros. Utiliza como variable la palabra NUMERO para los números que se examinan y TOTAL para el número de ce- ros encontrados. Los pasos a seguir son: 1. Establecer TOTAL a cero. 2. ¿Quedan más numeros a examinar? 3. Si no quedan numeros, imprimir el valor de TOTAL y fin.
  • 108. 78 Fundamentos de programación 4. Si existen mas numeros, ejecutar los pasos 5 a 8. 5. Leer el siguiente numero y dar su valor a la variable NUMERO. 6. Si NUMERO = 0, incrementar TOTAL en 1. 7. Si NUMERO <> 0, no modificar TOTAL. 8. Retornar al paso 2. El diagrama de flujo y la codificación en pseudocódigo correspondiente es: Diagrama de flujo Pseudocódigo Total 0 Inicio TOTAL TOTAL + 1 NÚMERO = 0 Escribir TOTAL Fin Leer NÚMERO ¿más números? no sí no sí entero: numero, total caracter: mas Datos; inicio escribir ('Cuenta de ceros leidos del teclado') mas Datos ← 'S'; total ← 0 mientras (mas Datos = 'S') o (mas Datos = 's') hacer leer (numero) si (numero = 0) total ← total + 1 fin si escribir ('Mas números 'S/N'') leer (mas Datos) fin mientras escribir ('total de ceros =', total) fin
  • 109. Metodología de la programación y desarrollo de software 79 EJEMPLO 2.11 Dados tres números, determinar si la suma de cualquier pareja de ellos es igual al tercer número. Si se cumple esta condición, escribir “Iguales” y, en caso contrario, escribir “Distintas”. En el caso de que los números sean: 3 9 6 la respuesta es "Iguales", ya que 3 + 6 = 9. Sin embargo, si los números fueran: 2 3 4 el resultado sería "Distintas". Para resolver este problema, se puede comparar la suma de cada pareja con el tercer número. Con tres números solamente existen tres parejas distintas y el algoritmo de resolución del problema será fácil. 1. Leer los tres valores, A, B y C. 2. Si A + B = C escribir "Iguales" y parar. 3. Si A + C = B escribir "Iguales" y parar. 4. Si B + C = A escribir "Iguales" y parar. 5. Escribir "Distintas" y parar. El diagrama de flujo y la codificación en pseudocódigo correspondiente es la Figura 2.19. Diagrama de flujo Pseudocódigo Inicio Fin A + B = C Leer A, B, C A + C = B B + C = A escribir “distintas” escribir “iguales” sí sí sí no no no entero: a, b, c inicio escribir ('test con tres números:') leer (a, b, c) si (a + b = c) entonces escribir ('Son iguales', a,'+',b,'=',c) sino si (a + c = b) entonces escribir ('Son iguales', a,'+',c,'=',b) sino si (b + c = a) entonces escribir ('Son iguales', b,'+',c,'=',a) sino escribir ('Son distintas') fin si fin si fin si fin Figura 2.19. Diagrama de flujo y codificación en pseudocódigo (Ejemplo 2.11).
  • 110. 80 Fundamentos de programación 2.7.3. Diagramas de Nassi-Schneiderman (N-S) El diagrama N-S de Nassi Schneiderman —también conocido como diagrama de Chapin— es como un diagrama de flujo en el que se omiten las flechas de unión y las cajas son contiguas. Las acciones sucesivas se escriben en cajas sucesivas y, como en los diagramas de flujo, se pueden escribir diferentes acciones en una caja. Un algoritmo se representa con un rectángulo en el que cada banda es una acción a realizar. EJEMPLO Escribir un algoritmo que lea el nombre de un empleado, las horas trabajadas, el precio por hora y calcule los im- puestos a pagar (tasa = 25%) y el salario neto. leer nombre, horas, precio calcular salario ← horas * precio calcular impuestos ← 0.25 * salario calcular neto ← salario impuestos escribir nombre, salario, impuestos, neto nombre del algoritmo <accion 1> <accion 2> <accion 3> ... fin Figura 2.20. Representación gráfica N-S de un algoritmo. Otro ejemplo es la representación de la estructura condicional (Figura 2.21). ¿condición? acción 1 acción 2 ¿condición? <acciones> <acciones> a) b) sí no Figura 2.21. Estructura condicional o selectiva: a) diagrama de flujo: b) diagrama N-S.
  • 111. Metodología de la programación y desarrollo de software 81 EJEMPLO 2.12 Se desea calcular el salario neto semanal de un trabajador (en dólares o en euros) en función del número de horas trabajadas y la tasa de impuestos: • las primeras 35 horas se pagan a tarifa normal, • las horas que pasen de 35 se pagan a 1,5 veces la tarifa normal, • las tasas de impuestos son: a) los primeros 1.000 dólares son libres de impuestos, b) los siguientes 400 dólares tienen un 25 por 100 de impuestos, c) los restantes, un 45 por 100 de impuestos, • la tarifa horaria es 15 dólares. También se desea escribir el nombre, salario bruto, tasas y salario neto (este ejemplo se deja como ejercicio para el alumno). Un método general para la resolución de un problema con computadora tiene las siguientes fases: 1. Análisis del programa. 2. Diseño del algoritmo. 3. Codificación. 4. Compilación y ejecución. 5. Verificación. 6. Documentación y mantenimiento. El sistema más idóneo para resolver un problema es descomponerlo en módulos más sencillos y luego, median- te diseños descendentes y refinamiento sucesivo, llegar a módulos fácilmente codificables. Estos módulos se deben codificar con las estructuras de control de programación estructurada. 1. Secuenciales: las instrucciones se ejecutan sucesi- vamente una después de otra. 2. Repetitivas: una serie de instrucciones se repiten una y otra vez hasta que se cumple una cierta condición. 3. Selectivas: permite elegir entre dos alternativas (dos conjuntos de instrucciones) dependiendo de una con- dición determinada). RESUMEN 2.1. Diseñar una solución para resolver cada uno de los siguientes problemas y tratar de refinar sus soluciones mediante algoritmos adecuados: a) Realizar una llamada telefónica desde un teléfono público. b) Cocinar una tortilla. c) Arreglar un pinchazo de una bicicleta. d) Freír un huevo. 2.2. Escribir un algoritmo para: a) Sumar dos números enteros. b) Restar dos números enteros. c) Multiplicar dos números enteros. d) Dividir un número entero por otro. 2.3. Escribir un algoritmo para determinar el máximo co- mún divisor de dos números enteros (MCD) por el algoritmo de Euclides: • Dividir el mayor de los dos enteros positivos por el más pequeño. • A continuación dividir el divisor por el resto. • Continuar el proceso de dividir el último divisor por el último resto hasta que la división sea exacta. • El último divisor es el mcd. 2.4. Diseñar un algoritmo que lea y visualice una serie de números distintos de cero. El algoritmo debe terminar con un valor cero que no se debe visualizar. Visualizar el número de valores leídos. EJERCICIOS
  • 112. 82 Fundamentos de programación 2.5. Diseñar un algoritmo que visualice y sume la serie de números 3, 6, 9, 12…, 99. 2.6. Escribir un algoritmo que lea cuatro números y a con- tinuación visualice el mayor de los cuatro. 2.7. Diseñar un algoritmo que lea tres números y descubra si uno de ellos es la suma de los otros dos. 2.8. Diseñar un algoritmo para calcular la velocidad (en m/s) de los corredores de la carrera de 1.500 metros. La entrada consistirá en parejas de números (minutos, segundos) que dan el tiempo del corredor; por cada corredor, el algoritmo debe visualizar el tiempo en minutos y segundos, así como la velocidad media. Ejemplo de entrada de datos: (3,53) (3,40) (3,46) (3,52) (4,0) (0,0); el último par de datos se utilizará como fin de entrada de datos. 2.9. Diseñar un algoritmo para determinar los números primos iguales o menores que N (leído del teclado). (Un número primo sólo puede ser divisible por él mis- mo y por la unidad.) 2.10. Escribir un algoritmo que calcule la superficie de un triángulo en función de la base y la altura (S = 1/2 Base × Altura). 2.11. Calcular y visualizar la longitud de la circunferencia y el área de un círculo de radio dado. 2.12. Escribir un algoritmo que encuentre el salario sema- nal de un trabajador, dada la tarifa horaria y el núme- ro de horas trabajadas diariamente. 2.13. Escribir un algoritmo que indique si una palabra leída del teclado es un palíndromo. Un palíndromo (capi- cúa) es una palabra que se lee igual en ambos sentidos como “radar”. 2.14. Escribir un algoritmo que cuente el número de ocu- rrencias de cada letra en una palabra leída como en- trada. Por ejemplo, "Mortimer" contiene dos "m", una "o", dos "r", una "i", una "t" y una "e". 2.15. Muchos bancos y cajas de ahorro calculan los inte- reses de las cantidades depositadas por los clientes diariamente según las premisas siguientes. Un capital de 1.000 euros, con una tasa de interés del 6 por 100, renta un interés en un día de 0,06 multiplicado por 1.000 y dividido por 365. Esta operación pro- ducirá 0,16 euros de interés y el capital acumulado será 1.000,16. El interés para el segundo día se cal- culará multiplicando 0,06 por 1.000 y dividiendo el resultado por 365. Diseñar un algoritmo que reciba tres entradas: el capital a depositar, la tasa de interés y la duración del depósito en semanas, y calcular el capital total acumulado al final del período de tiempo especificado.
  • 113. CAPÍTULO 3 Estructura general de un programa 3.1. Concepto de programa 3.2. Partes constitutivas de un programa 3.3. Instrucciones y tipos de instrucciones 3.4. Elementos básicos de un programa 3.5. Datos, tipos de datos y operaciones primi- tivas 3.6. Constantes y variables 3.7. Expresiones 3.8. Funciones internas 3.9. La operación de asignación 3.10. Entrada y salida de información 3.11. Escritura de algoritmos/programas ACTIVIDADES DE PROGRAMACIÓN RESUELTAS CONCEPTOS CLAVE RESUMEN EJERCICIOS En los capítulos anteriores se ha visto la forma de di- señar algoritmos para resolver problemas con compu- tadora. En este capítulo se introduce al proceso de la programación que se manifiesta esencialmente en los programas. El concepto de programa como un conjunto de instrucciones y sus tipos constituye la parte funda- mental del capítulo. La descripción de los elementos básicos de programación, que se encontrarán en casi todos los programas: interruptores, contadores, tota- lizadores, etc., junto con las normas elementales para la escritura de algoritmos y programas, conforman el resto del capítulo. En el capítulo se examinan los importantes con- ceptos de datos, constantes y variables, expresiones, operaciones de asignación y la manipulación de las entradas y salidas de información, así como la rea- lización de las funciones internas como elemento clave en el manejo de datos. Por último se descri- ben reglas de escritura y de estilo para la realización de algoritmos y su posterior conversión en pro- gramas. INTRODUCCIÓN
  • 114. 84 Fundamentos de programación 3.1. CONCEPTO DE PROGRAMA Un programa de computadora es un conjunto de instrucciones —órdenes dadas a la máquina— que producirán la ejecución de una determinada tarea. En esencia, un programa es un medio para conseguir un fin. El fin será proba- blemente definido como la información necesaria para solucionar un problema. El proceso de programación es, por consiguiente, un proceso de solución de problemas —como ya se vio en el Capítulo 2— y el desarrollo de un programa requiere las siguientes fases: 1. definición y análisis del problema; 2. diseño de algoritmos: • diagrama de flujo, • diagrama N-S, • pseudocódigo; 3. codificación del programa; 4. depuración y verificación del programa; 5. documentación; 6. mantenimiento. Definición del problema Diseño del algoritmo Codificación del programa Depuración y verificación D O C U M E N T A C I Ó N M A N T E N I M I E N T O Figura 3.1. El proceso de la programación. Las fases 1 y 2 ya han sido analizadas en los capítulos anteriores y son el objetivo fundamental de este libro; sin embargo, dedicaremos atención, a lo largo del libro (véase Capítulo 13) y en los apéndices, a las fases 3, 4, 5 y 6, aunque éstas son propias de libros específicos sobre lenguajes de programación. 3.2. PARTES CONSTITUTIVAS DE UN PROGRAMA Tras la decisión de desarrollar un programa, el programador debe establecer el conjunto de especificaciones que debe contener el programa: entrada, salida y algoritmos de resolución, que incluirán las técnicas para obtener las salidas a partir de las entradas. Conceptualmente un programa puede ser considerado como una caja negra, como se muestra en la Figura 3.2. La caja negra o el algoritmo de resolución, en realidad, es el conjunto de códigos que transforman las entradas del pro- grama (datos) en salidas (resultados). El programador debe establecer de dónde provienen las entradas al programa. Las entradas, en cualquier caso, procederán de un dispositivo de entrada —teclado, disco...—. El proceso de introducir la información de entrada —datos— en la memoria de la computadora se denomina entrada de datos, operación de lectura o acción de leer. Las salidas de datos se deben presentar en dispositivos periféricos de salida: pantalla, impresoras, discos, etc. La operación de salida de datos se conoce también como escritura o acción de escribir.
  • 115. Estructura general de un programa 85 3.3. INSTRUCCIONES Y TIPOS DE INSTRUCCIONES El proceso de diseño del algoritmo o posteriormente de codificación del programa consiste en definir las acciones o instrucciones que resolverán el problema. Las acciones o instrucciones se deben escribir y posteriormente almacenar en memoria en el mismo orden en que han de ejecutarse, es decir, en secuencia. Un programa puede ser lineal o no lineal. Un programa es lineal si las instrucciones se ejecutan secuencialmen- te, sin bifurcaciones, decisión ni comparaciones. instrucción 1 instrucción 2 . . . instrucción n En el caso del algoritmo las instrucciones se suelen conocer como acciones, y se tendría: acción 1 acción 2 . . . acción n Un programa es no lineal cuando se interrumpe la secuencia mediante instrucciones de bifurcación. acción 1 acción 2 . . . acción x acción n . acción n + i 3.3.1. Tipos de instrucciones Las instrucciones disponibles en un lenguaje de programación dependen del tipo de lenguaje. Por ello, en este apar- tado estudiaremos las instrucciones —acciones— básicas que se pueden implementar de modo general en un algo- ritmo y que esencialmente soportan todos los lenguajes. Dicho de otro modo, las instrucciones básicas son indepen- dientes del lenguaje. La clasificación más usual, desde el punto de vista anterior, es: Entrada Programa (algoritmo de resolución) Salida Figura 3.2. Bloques de un programa.
  • 116. 86 Fundamentos de programación 1. instrucciones de inicio/fin, 2. instrucciones de asignación, 3. instrucciones de lectura, 4. instrucciones de escritura, 5. instrucciones de bifurcación. Algunas de estas instrucciones se recogen en la Tabla 3.1. Tabla 3.1. Instrucciones/acciones básicas Tipo de instrucción Pseudocódigo inglés Pseudocódigo español comienzo de proceso begin inicio fin de proceso end fin entrada (lectura) read leer salida (escritura) write escribir asignación A ← 5 B ← 7 3.3.2. Instrucciones de asignación Como ya son conocidas del lector, repasaremos su funcionamiento con ejemplos: a) A ← 80 la variable A toma el valor de 80. b) ¿Cuál será el valor que tomará la variable C tras la ejecución de las siguientes instrucciones? A ← 12 B ← A C ← B A contiene 12, B contiene 12 y C contiene 12. Nota Antes de la ejecución de las tres instrucciones, el valor de A, B y C es indeterminado. Si se desea darles un valor inicial, habrá que hacerlo explícitamente, incluso cuando este valor sea 0. Es decir, habrá que definir e inicializar las instrucciones. A ← 0 B ← 0 C ← 0 c) ¿Cuál es el valor de la variable AUX al ejecutarse la instrucción 5? 1. A ← 10 2. B ← 20 3. AUX ← A 4. A ← B 5. B ← AUX • en la instrucción 1, A toma el valor 10 • en la instrucción 2, B toma el valor 20 • en la instrucción 3, AUX toma el valor anterior de A, o sea 10 • en la instrucción 4, A toma el valor anterior de B, o sea 20 • en la instrucción 5, B toma el valor anterior de AUX, o sea 10 • tras la instrucción 5, AUX sigue valiendo 10.
  • 117. Estructura general de un programa 87 d) ¿Cuál es el significado de N ← N + 5 si N tiene el valor actual de 2? N ← N + 5 Se realiza el cálculo de la expresión N + 5 y su resultado 2 + 5 = 7 se asigna a la variable situada a la iz- quierda, es decir, N tomará un nuevo valor 7. Se debe pensar en la variable como en una posición de memoria, cuyo contenido puede variar mediante instruc- ciones de asignación (un símil suele ser un buzón de correos, donde el número de cartas depositadas en él variará según el movimiento diario del cartero de introducción de cartas o del dueño del buzón de extracción de dichas cartas). 3.3.3. Instrucciones de lectura de datos (entrada) Esta instrucción lee datos de un dispositivo de entrada. ¿Cuál será el significado de las instrucciones siguientes? a) leer (NÚMERO, HORAS, TASA) Leer del terminal los valores NÚMERO, HORAS y TASAS, archivándolos en la memoria; si los tres números se teclean en respuesta a la instrucción son 12325, 32, 1200, significaría que se han asignado a las variables esos valores y equivaldría a la ejecución de las instrucciones. NÚMERO ← 12325 HORAS ← 32 TASA ← 1200 b) leer (A, B, C) Si se leen del terminal 100, 200, 300, se asignarían a las variables los siguientes valores: A = 100 B = 200 C = 300 3.3.4. Instrucciones de escritura de resultados (salida) Estas instrucciones se escriben en un dispositivo de salida. Explicar el resultado de la ejecución de las siguientes instrucciones: A ← 100 B ← 200 C ← 300 escribir (A, B, C) Se visualizarían en la pantalla o imprimirían en la impresora los valores 100, 200 y 300 que contienen las varia- bles A, B y C. 3.3.5. Instrucciones de bifurcación El desarrollo lineal de un programa se interrumpe cuando se ejecuta una bifurcación. Las bifurcaciones pueden ser, según el punto del programa a donde se bifurca, hacia adelante o hacia atrás.
  • 118. 88 Fundamentos de programación Bifurcación adelante (positivo) Bifurcación atrás (negativo) instrucción 1 instrucción 2 instrucción 3 . . . instrucción 8 . . última instrucción instrucción 1 instrucción 2 instrucción 3 . . . instrucción 12 . . última instrucción Las bifurcaciones en el flujo de un programa se realizarán de modo condicional en función del resultado de la evaluación de la condición. Bifurcación incondicional: la bifurcación se realiza siempre que el flujo del programa pase por la instrucción sin necesidad del cumplimiento de ninguna condición (véase Figura 3.3). Programa fuente Compilador Existen errores en la compilación Programa Programa ejecutable Ejecución Montador Modificación programa fuente Datos programa ejecutable Computadora Programa Resultados sí no Figura 3.3. Fases de la ejecución de un programa.
  • 119. Estructura general de un programa 89 Bifurcación condicional: la bifurcación depende del cumplimiento de una determinada condición. Si se cumple la condición, el flujo sigue ejecutando la acción F2. Si no se cumple, se ejecuta la acción F1 (véase Figura 3.4). acción F1 ¿condición? acción F2 no sí Figura 3.4. Bifurcación condicional. 3.4. ELEMENTOS BÁSICOS DE UN PROGRAMA En programación se debe separar la diferencia entre el diseño del algoritmo y su implementación en un lenguaje específico. Por ello, se debe distinguir claramente entre los conceptos de programación y el medio en que ellos se implementan en un lenguaje específico. Sin embargo, una vez que se comprendan cómo utilizar los conceptos de programación y, la enseñanza de un nuevo lenguaje es relativamente fácil. Los lenguajes de programación —como los restantes lenguajes— tienen elementos básicos que se utilizan como bloques constructivos, así como reglas para las que esos elementos se combinan. Estas reglas se denominan sintaxis del lenguaje. Solamente las instrucciones sintácticamente correctas pueden ser interpretadas por la computadora y los programas que contengan errores de sintaxis son rechazados por la máquina. Los elementos básicos constitutivos de un programa o algoritmo son: • palabras reservadas (inicio, fin, si-entonces..., etc.), • identificadores (nombres de variables esencialmente, procedimientos, funciones, nombre del programa, etc.), • caracteres especiales (coma, apóstrofo, etc.), • constantes, • variables, • expresiones, • instrucciones. Además de estos elementos básicos, existen otros elementos que forman parte de los programas, cuya compren- sión y funcionamiento será vital para el correcto diseño de un algoritmo y naturalmente la codificación del programa. Estos elementos son: • bucles, • contadores, • acumuladores, • interruptores, • estructuras: 1. secuenciales, 2. selectivas, 3. repetitivas. El amplio conocimiento de todos los elementos de programación y el modo de su integración en los programas constituyen las técnicas de programación que todo buen programador debe conocer. 3.5. DATOS, TIPOS DE DATOS Y OPERACIONES PRIMITIVAS El primer objetivo de toda computadora es el manejo de la información o datos. Estos datos pueden ser las cifras de ventas de un supermercado o las calificaciones de una clase. Un dato es la expresión general que describe los objetos
  • 120. 90 Fundamentos de programación con los cuales opera una computadora. La mayoría de las computadoras pueden trabajar con varios tipos (modos) de datos. Los algoritmos y los programas correspondientes operan sobre esos tipos de datos. La acción de las instrucciones ejecutables de las computadoras se refleja en cambios en los valores de las partidas de datos. Los datos de entrada se transforman por el programa, después de las etapas intermedias, en datos de sali- da. En el proceso de resolución de problemas el diseño de la estructura de datos es tan importante como el diseño del algoritmo y del programa que se basa en el mismo. Un programa de computadora opera sobre datos (almacenados internamente en la memoria almacenados en me- dios externos como discos, memorias USB, memorias de teléfonos celulares, etc., o bien introducidos desde un dis- positivo como un teclado, un escáner o un sensor eléctrico). En los lenguajes de programación los datos deben de ser de un tipo de dato específico. El tipo de datos determina cómo se representan los datos en la computadora y los di- ferentes procesos que dicha computadora realiza con ellos. Tipo de datos Conjunto específico de valores de los datos y un conjunto de operaciones que actúan sobre esos datos. Existen dos tipos de datos: básicos, incorporados o integrados (estándar) que se incluyen en los lenguajes de programación; definidos por el programador o por el usuario. Además de los datos básicos o simples, se pueden construir otros datos a partir de éstos, y se obtienen los datos compuestos o datos agregados, tales como estructuras, uniones, enumeraciones (subrango, como caso particular de las enumeraciones, al igual de lo que sucede en Pascal), vectores o matrices/tablas y cadenas “arrays o arre- glos”; también existen otros datos especiales en lenguajes como C y C++, denominados punteros (apuntadores) y referencias. Existen dos tipos de datos: simples (sin estructura) y compuestos (estructurados). Los datos estructurados se es- tudian a partir del Capítulo 6 y son conjuntos de partidas de datos simples con relaciones definidas entre ellos. Los distintos tipos de datos se representan en diferentes formas en la computadora. A nivel de máquina, un dato es un conjunto o secuencia de bits (dígitos 0 o 1). Los lenguajes de alto nivel permiten basarse en abstracciones e ignorar los detalles de la representación interna. Aparece el concepto de tipo de datos, así como su representación. Los tipos de datos básicos son los siguientes: numéricos (entero, real) lógicos (boolean) carácter (caracter, cadena) Existen algunos lenguajes de programación —FORTRAN esencialmente— que admiten otros tipos de datos: complejos, que permiten tratar los números complejos, y otros lenguajes —Pascal— que también permiten declarar y definir sus propios tipos de datos: enumerados (enumerated) y subrango (subrange). 3.5.1. Datos numéricos El tipo numérico es el conjunto de los valores numéricos. Estos pueden representarse en dos formas distintas: • tipo numérico entero (integer). • tipo numérico real (real). Enteros: el tipo entero es un subconjunto finito de los números enteros. Los enteros son números completos, no tienen componentes fraccionarios o decimales y pueden ser negativos o positivos. Ejemplos de números enteros son: 5 6 –15 4 20 17 1340 26
  • 121. Estructura general de un programa 91 Los números enteros se pueden representar en 8, 16 o 32 bits, e incluso 64 bits, y eso da origen a una escala de enteros cuyos rangos dependen de cada máquina Enteros –32.768 a 32.767 Enteros cortos –128 a 127 Enteros largos –2147483648 a 2147483647 Además de los modificadores corto y largo, se pueden considerar sin signo (unsigned) y con signo (signed). sin signo: 0 .. 65.5350 0 .. 4294967296 Los enteros se denominan en ocasiones números de punto o coma fija. Los números enteros máximos y mínimos de una computadora1 suelen ser –32.768 a +32.767. Los números enteros fuera de este rango no se suelen representar como enteros, sino como reales, aunque existen excepciones en los lenguajes de programación modernos como C, C++ y Java. Reales: el tipo real consiste en un subconjunto de los números reales. Los números reales siempre tienen un pun- to decimal y pueden ser positivos o negativos. Un número real consta de un entero y una parte decimal. Los siguien- tes ejemplos son números reales: 0.08 3739.41 3.7452 –52.321 –8.12 3.0 En aplicaciones científicas se requiere una representación especial para manejar números muy grandes, como la masa de la Tierra, o muy pequeños, como la masa de un electrón. Una computadora sólo puede representar un nú- mero fijo de dígitos. Este número puede variar de una máquina a otra, siendo ocho dígitos un número típico. Este límite provocará problemas para representar y almacenar números muy grandes o muy pequeños como son los ya citados o los siguientes: 4867213432 0.00000000387 Existe un tipo de representación denominado notación exponencial o científica y que se utiliza para números muy grandes o muy pequeños. Así, 367520100000000000000 se representa en notación científica descomponiéndolo en grupos de tres dígitos 367 520 100 000 000 000 000 y posteriormente en forma de potencias de 10 3.675201 x 1020 y de modo similar .0000000000302579 se representa como 3.02579 x 10–11 1 En computadoras de 16 bits como IBM PC o compatibles.
  • 122. 92 Fundamentos de programación La representación en coma flotante es una generalización de notación científica. Obsérvese que las siguientes expresiones son equivalentes: 3.675201 x 1019 = .3675207 x 1020 = .03675201 x 1021 = ... = 36.75201 x 1018 = 367.5201 x 1017 = ... En estas expresiones se considera la mantisa (parte decimal) al número real y el exponente (parte potencial) el de la potencia de diez. 36.75201 mantisa 18 exponente Los tipos de datos reales se representan en coma o punto flotante y suelen ser de simple precisión, doble precisión o cuádruple precisión y suelen requerir 4 bytes, 8 bytes o 10-12 bytes, respectivamente. La Tabla 3.2 muestra los datos reales típicos en compiladores C/C++. Tabla 3.2. Tipos de datos reales (coma flotante) en el lenguaje C/C++ Tipo Rango de valores real (float) -3.4 x 1038 .. 3.4 x 1038 doble (double) -1.7 x 10-308 .. 1.7 x 10308 3.5.2. Datos lógicos (booleanos) El tipo lógico —también denominado booleano— es aquel dato que sólo puede tomar uno de dos valores: cierto o verdadero (true) y falso (false). Este tipo de datos se utiliza para representar las alternativas (sí/no) a determinadas condiciones. Por ejemplo, cuando se pide si un valor entero es par, la respuesta será verdadera o falsa, según sea par o impar. C++ y Java soportan el tipo de dato bool. 3.5.3. Datos tipo carácter y tipo cadena El tipo carácter es el conjunto finito y ordenado de caracteres que la computadora reconoce. Un dato tipo carácter contiene un solo carácter. Los caracteres que reconocen las diferentes computadoras no son estándar; sin embargo, la mayoría reconoce los siguientes caracteres alfabéticos y numéricos: • caracteres alfabéticos (A, B, C, ..., Z) (a, b, c, ..., z), • caracteres numéricos (1, 2, ..., 9, 0), • caracteres especiales (+, -, *, /, ^, ., ;, <, >, $, ...). Una cadena (string) de caracteres es una sucesión de caracteres que se encuentran delimitados por una comilla (apóstrofo) o dobles comillas, según el tipo de lenguaje de programación. La longitud de una cadena de caracteres es el número de ellos comprendidos entre los separadores o limitadores. Algunos lenguajes tienen datos tipo cadena. 'Hola Mortimer' '12 de octubre de 1492' 'Sr. McKoy' 3.6. CONSTANTES Y VARIABLES Los programas de computadora contienen ciertos valores que no deben cambiar durante la ejecución del programa. Tales valores se llaman constantes. De igual forma, existen otros valores que cambiarán durante la ejecución del
  • 123. Estructura general de un programa 93 programa; a estos valores se les llama variables. Una constante es un dato que permanece sin cambios durante todo el desarrollo del algoritmo o durante la ejecución del programa. Constantes reales válidas Constantes reales no válidas 1.234 1,752.63 (comas no permitidas) –0.1436 82 (normalmente contienen un punto decimal, aunque exis- ten lenguajes que lo admiten sin punto) + 54437324 Constantes reales en notación científica 3.374562E equivale a 3.374562 × 102 Una constante tipo carácter o constante de caracteres consiste en un carácter válido encerrado dentro de após- trofos; por ejemplo, 'B' '+' '4' ';' Si se desea incluir el apóstrofo en la cadena, entonces debe aparecer como un par de apóstrofos, encerrados den- tro de simples comillas. "" Una secuencia de caracteres se denomina normalmente una cadena y una constante tipo cadena es una cadena encerrada entre apóstrofos. Por consiguiente, 'Juan Minguez' y 'Pepe Luis Garcia' son constantes de cadena válidas. Nuevamente, si un apóstrofo es uno de los caracteres en una constante de cadena, debe aparecer como un par de apóstrofos 'John"s' Constantes lógicas (boolean) Sólo existen dos constantes lógicas o boolean: verdadero falso La mayoría de los lenguajes de programación permiten diferentes tipos de constantes: enteras, reales, caracteres y boolean o lógicas, y representan datos de esos tipos. Una variable es un objeto o tipo de datos cuyo valor puede cambiar durante el desarrollo del algoritmo o ejecu- ción del programa. Dependiendo del lenguaje, hay diferentes tipos de variables, tales como enteras, reales, carácter, lógicas y de cadena. Una variable que es de un cierto tipo puede tomar únicamente valores de ese tipo. Una variable de carácter, por ejemplo, puede tomar como valor sólo caracteres, mientras que una variable entera puede tomar sólo valores enteros. Si se intenta asignar un valor de un tipo a una variable de otro tipo se producirá un error de tipo. Una variable se identifica por los siguientes atributos: nombre que lo asigna y tipo que describe el uso de la va- riable. Los nombres de las variables, a veces conocidos como identificadores, suelen constar de varios caracteres al- fanuméricos, de los cuales el primero normalmente es una letra. No se deben utilizar —aunque lo permita el lengua-
  • 124. 94 Fundamentos de programación je, caso de FORTRAN— como nombres de identificadores palabras reservadas del lenguaje de programación. Nom- bres válidos de variables son: A510 NOMBRES Letra SalarioMes NOTAS Horas SegundoApellido NOMBRE_APELLIDOS2 Salario Ciudad Los nombres de las variables elegidas para el algoritmo o el programa deben ser significativos y tener relación con el objeto que representan, como pueden ser los casos siguientes: NOMBRE para representar nombres de personas PRECIOS para representar los precios de diferentes artículos NOTAS para representar las notas de una clase Existen lenguajes —Pascal— en los que es posible darles nombre a determinadas constantes típicas utilizadas en cálculos matemáticos, financieros, etc. Por ejemplo, las constantes π = 3.141592... y e = 2.718228 (base de los loga- ritmos naturales) se les pueden dar los nombres PI y E. PI = 3.141592 E = 2.718228 3.6.1. Declaración de constants y variables Normalmente los identificadores de las variables y de las constantes con nombre deben ser declaradas en los progra- mas antes de ser utilizadas. La sintaxis de la declaración de una variable suele ser: <tipo_de_dato> <nombre_variable> [=<expresión>] EJEMPLO car letra, abreviatura ent numAlumnos = 25 real salario = 23.000 Si se desea dar un nombre (identificador) y un valor a una constante de modo que su valor no se pueda modificar posteriormente, su sintaxis puede ser así: const <tipo_de_dato> <nombre_constante> =<expresión> EJEMPLO const doble PI = 3.141592 const cad nombre = 'Mackoy' const car letra = 'c' 3.7. EXPRESIONES Las expresiones son combinaciones de constantes, variables, símbolos de operación, paréntesis y nombres de funcio- nes especiales. Las mismas ideas son utilizadas en notación matemática tradicional; por ejemplo, a + (b + 3) + √ c 2 Algunos lenguajes de programación admiten como válido el carácter subrayado en los identificadores.
  • 125. Estructura general de un programa 95 Aquí los paréntesis indican el orden de cálculo y √ representa la función raíz cuadrada. Cada expresión toma un valor que se determina tomando los valores de las variables y constantes implicadas y la ejecución de las operaciones indicadas. Una expresión consta de operandos y operadores. Según sea el tipo de objetos que manipulan, las expresiones se clasifican en: • aritméticas, • relacionales, • lógicas, • carácter. El resultado de la expresión aritmética es de tipo numérico; el resultado de la expresión relacional y de una ex- presión lógica es de tipo lógico; el resultado de una expresión carácter es de tipo carácter. 3.7.1. Expresiones aritméticas Las expresiones aritméticas son análogas a las fórmulas matemáticas. Las variables y constantes son numéricas (real o entera) y las operaciones son las aritméticas. + suma - resta * multiplicación / división ↑, **, ^ exponenciación div, / división entera mod, % módulo (resto) Los símbolos +, –, *, ^ (↑ o **) y las palabras clave div y mod se conocen como operadores aritméticos. En la expresión 5 + 3 los valores 5 y 3 se denominan operandos. El valor de la expresión 5 + 3 se conoce como resultado de la expre- sión. Los operadores se utilizan de igual forma que en matemáticas. Por consiguiente, A ∙ B se escribe en un algo- ritmo como A * B y 1/4 ∙ C como C/4. Al igual que en matemáticas el signo menos juega un doble papel, como resta en A – B y como negación en –A. Todos los operadores aritméticos no existen en todos los lenguajes de programación; por ejemplo, en FORTRAN no existe div y mod. El operador exponenciación es diferente según sea el tipo de lenguaje de programación elegido (^, ↑ en BASIC, ** en FORTRAN). Los cálculos que implican tipos de datos reales y enteros suelen dar normalmente resultados del mismo tipo si los operandos lo son también. Por ejemplo, el producto de operandos reales produce un real (véase Tabla 3.3). EJEMPLO 5 x 7 se representa por 5 * 7 6 4 se representa por 6/4 37 se representa por 3^7
  • 126. 96 Fundamentos de programación Tabla 3.3. Operadores aritméticos Operador Significado Tipos de operandos Tipo de resultado + Signo positivo Entero o real Entero o real – Signo negativo Entero o real Entero o real * Multiplicación Entero o real Entero o real / División Real Real div, / División entera Entero Entero mod, % Módulo (resto) Entero Entero ++ Incremento Entero Entero –– Decremento Entero Entero Operadores DIV (/) y MOD (%) El símbolo / se utiliza para la división real y la división entera (el operador div —en algunos lenguajes, por ejemplo BASIC, se suele utilizar el símbolo — representa la división entera). El operador mod representa el resto de la divi- sión entera, y la mayoría de lenguajes utilizan el símbolo %. A div B Sólo se puede utilizar si A y B son expresiones enteras y obtiene la parte entera de A/B. Por consiguiente, 19 div 6 19/6 toma el valor 3. Otro ejemplo puede ser la división 15/6 15 |6 3 2 cociente | resto En forma de operadores resultará la operación anterior 15 div 6 = 2 15 mod 6 = 3 Otros ejemplos son: 19 div 3 equivale a 6 19 mod 6 equivale a 1 EJEMPLO 3.1 Los siguientes ejemplos muestran resultados de expresiones aritméticas: expresión resultado expresión resultado 10.5/3.0 3.5 10/3 3 1/4 0.25 18/2 9 2.0/4.0 0.5 30/30 1 6/1 6.0 6/8 0 30/30 1.0 10%3 1 6/8 0.75 10%2 0
  • 127. Estructura general de un programa 97 Operadores de incremento y decremento Los lenguajes de programación C/C++, Java y C# soportan los operadores unitarios (unarios) de incremento, ++, y decremento, --. El operador de incremento (++) aumenta el valor de su operando en una unidad, y el operador de decremento (--) disminuye también en una unidad. El valor resultante dependerá de que el operador se emplee como prefijo o como sufijo (antes o después de la variable). Si actúa como prefijo, el operador cambia el valor de la varia- ble y devuelve este nuevo valor; en caso contrario, si actúa como sufijo, el resultado de la expresión es el valor de la variable, y después se modifica esta variable. ++i Incrementa i en 1 y después utiliza el valor de i en la correspondiente expresión. i++ Utiliza el valor de i en la expresión en que se encuentra y después se incrementa en 1. --i Decrementa i en 1 y después utiliza el nuevo valor de i en la correspondiente expresión. i-i-- Utiliza el valor de i en la expresión en que se encuentra y después se incrementa en 1. EJEMPLO: n = 5 escribir n escribir n++ escribir n n = 5 escribir n escribir ++n escribir n Al ejecutarse el algoritmo se obtendría: 5 5 6 5 6 6 3.7.2. Reglas de prioridad Las expresiones que tienen dos o más operandos requieren unas reglas matemáticas que permitan determinar el orden de las operaciones, se denominan reglas de prioridad o precedencia y son: 1. Las operaciones que están encerradas entre paréntesis se evalúan primero. Si existen diferentes paréntesis anidados (interiores unos a otros), las expresiones más internas se evalúan primero. 2. Las operaciones aritméticas dentro de una expresión suelen seguir el siguiente orden de prioridad: • operador ( ) • operadores ++, – – + y – unitarios, • operadores *, /, % (producto, división, módulo) • operadores +, – (suma y resta). En los lenguajes que soportan la operación de exponenciación, este operador tiene la mayor prioridad. En caso de coincidir varios operadores de igual prioridad en una expresión o subexpresión encerrada entre parén- tesis, el orden de prioridad en este caso es de izquierda a derecha, y a esta propiedad se denomina asociatividad.
  • 128. 98 Fundamentos de programación EJEMPLO 3.2 ¿Cuál es el resultado de las siguientes expresiones? a) 3 + 6 * 14 b) 8 + 7 * 3 + 4 * 6 Solución a) 3 + 6 * 14 b) 8 + 7 * 3 + 4 * 6 { { { 3 + 84 8 + 21 24 { { 87 29 + 24 { 53 EJEMPLO 3.3 Obtener los resultados de las expresiones: –4 * 7 + 2 ^ 3 / 4 – 5 Solución –4 * 7 + 2 ^ 3 / 4 – 5 resulta –4 * 7 + 8 / 4 – 5 –28 + 8 / 4 – 5 –28 + 2 - 5 –26 - 5 –31 EJEMPLO 3.4 Convertir en expresiones aritméticas algorítmicas las siguientes expresiones algebraicas: 5 ∙ (x + y) a2 + b2 x + y u + w a x y · (z + w) Los resultados serán: 5 ∗ (x + y) a ^2 + b ^2 (x + y) / (u + w/a) x / y ∗ (z + w) EJEMPLO 3.5 Los paréntesis tienen prioridad sobre el resto de las operaciones: A * (B + 3) la constante 3 se suma primero al valor de B, después este resultado se multipli- ca por el valor de A.
  • 129. Estructura general de un programa 99 (A * B) + 3 A y B se multiplican primero y a continuación se suma 3. A + (B + C) + D esta expresión equivale a A + B + C + D (A + B/C) + D equivale a A + B/C + D A * B/C * D equivale a ((A * B)/C) * D y no a (A * B)/(C * D). EJEMPLO 3.6 Evaluar la expresión 12 + 3 * 7 + 5 * 4. En este ejemplo existen dos operadores de igual prioridad, * (multiplicación); por ello los pasos sucesivos son: 12 + 3 * 7 + 5 * 4 { 21 12 + 21 + 5 * 4 { 20 12 + 21 + 20 = 53 3.7.3. Expresiones lógicas (booleanas) Un segundo tipo de expresiones es la expresión lógica o booleana, cuyo valor es siempre verdadero o falso. Recuer- de que existen dos constantes lógicas, verdadera (true) y falsa (false) y que las variables lógicas pueden tomar sólo estos dos valores. En esencia, una expresión lógica es una expresión que sólo puede tomar estos dos valores, verda- dero y falso. Se denominan también expresiones booleanas en honor del matemático británico George Boole, que desarrolló el Álgebra lógica de Boole. Las expresiones lógicas se forman combinando constantes lógicas, variables lógicas y otras expresiones lógicas, utilizando los operadores lógicos not, and y or y los operadores relacionales (de relación o comparación) =, , , =, =, . Operadores de relación Los operadores relacionales o de relación permiten realizar comparaciones de valores de tipo numérico o carácter. Los operadores de relación sirven para expresar las condiciones en los algoritmos. Los operadores de relación se recogen en la Tabla 3.4. El formato general para las comparaciones es expresión1 operador de relación expresión2 y el resultado de la operación será verdadero o falso. Así, por ejemplo, si A = 4 y B = 3, entonces A B es verdadero Tabla 3.4. Operadores de relación Operador Significado menor que mayor que =, == igual que = menor o igual que = mayor o igual que , != distinto de
  • 130. 100 Fundamentos de programación mientras que (A – 2) (B – 4) es falso. Los operadores de relación se pueden aplicar a cualquiera de los cuatro tipos de datos estándar: enteros, real, lógico, carácter. La aplicación a valores numéricos es evidente. Los ejemplos siguientes son significativos: N1 N2 Expresión lógica Resultado 3 6 3 6 verdadero 0 1 0 1 falso 4 2 4 = 2 falso 8 5 8 = 5 falso 9 9 9 = 9 verdadero 5 5 5 5 falso Para realizar comparaciones de datos tipo carácter, se requiere una secuencia de ordenación de los caracteres similar al orden creciente o decreciente. Esta ordenación suele ser alfabética, tanto mayúsculas como minúsculas, y numérica, considerándolas de modo independiente. Pero si se consideran caracteres mixtos, se debe recurrir a un código normalizado como es el ASCII (véase Apéndice A). Aunque no todas las computadoras siguen el código nor- malizado en su juego completo de caracteres, sí son prácticamente estándar los códigos de los caracteres alfanumé- ricos más usuales. Estos códigos normalizados son: • Los caracteres especiales #, %, $, (, ), +, –, /, ..., exigen la consulta del código de ordenación. • Los valores de los caracteres que representan a los dígitos están en su orden natural. Esto es, '0''1', '1''2', ..., '8''9'. • Las letras mayúsculas A a Z siguen el orden alfabético ('A''B', 'C''F', etc.). • Si existen letras minúsculas, éstas siguen el mismo criterio alfabético ('a''b', 'c''h', etc.). En general, los cuatro grupos anteriores están situados en el código ASCII en orden creciente. Así, '1''A' y 'B''C'. Sin embargo, para tener completa seguridad será preciso consultar el código de caracteres de su compu- tadora (normalmente, el ASCII, American Standar Code for Information Interchange o bien el ambiguo código EBCDIC, Extended Binary-Coded Decimal Interchange Code, utilizado en computadoras IBM diferentes a los mo- delos PC y PS/2). Cuando se utilizan los operadores de relación, con valores lógicos, la constante false (falsa) es menor que la constante true (verdadera). false true true false Si se utilizan los operadores relacionales = y para comparar cantidades numéricas, es importante recordar que la mayoría de los valores reales no pueden ser almacenados exactamente. En consecuencia, las expresiones lógicas formales con comparación de cantidades reales con (=), a veces se evalúan como falsas, incluso aunque estas canti- dades sean algebraicamente iguales. Así, (1.0 / 3.0) * 3.0 = 1.0 teóricamente es verdadera y, sin embargo, al realizar el cálculo en una computadora se puede obtener .999999... y, en consecuencia, el resultado es falso; esto es debido a la precisión limitada de la aritmética real en las computa- doras. Por consiguiente, a veces deberá excluir las comparaciones con datos de tipo real.
  • 131. Estructura general de un programa 101 Operadores lógicos Los operadores lógicos o booleanos básicos son not (no), and (y) y or (o). La Tabla 3.5 recoge el funciona- miento de dichos operadores. Tabla 3.5. Operadores lógicos Operador lógico Expresión lógica Significado no (not), ! no p (not p) negación de p y (and), p y q (p and q) conjunción de p y q o (o), || p o q (p o q) disyunción de p y q Las definiciones de las operaciones no, y, o se resumen en unas tablas conocidas como tablas de verdad. a no a verdadero falso falso verdadero no (610) es verdadera ya que (610) es falsa. a b a y b verdadero verdadero falso falso verdadero falso verdadero falso verdadero falso falso falso a y b es verdadera sólo si a y b son verdaderas. a b a o b verdadero verdadero falso falso verdadero falso verdadero falso verdadero verdadero verdadero falso a o b es verdadera cuando a, b o ambas son verdaderas. En las expresiones lógicas se pueden mezclar operadores de relación y lógicos. Así, por ejemplo, (1 5) y (5 10) es verdadera (5 10) o ('A' 'B') es verdadera, ya que 'A' 'B' EJEMPLO 3.7 La Tabla 3.6 resume una serie de aplicaciones de expresiones lógicas. Tabla 3.6. Aplicaciones de expresiones lógicas Expresión lógica Resultado Observaciones (1 0) y (3 = 3) verdadero no PRUEBA verdadero ∙PRUEBA es un valor lógico falso. (0 5) o (0 5) verdadero (5 = 7) y (2 4) falso no (5 5) verdadero (numero = 1) o (7 = 4) verdadero ∙numero es una variable entera de valor 5.
  • 132. 102 Fundamentos de programación Prioridad de los operadores lógicos Los operadores aritméticos seguían un orden específico de prioridad cuando existía más de un operador en las expre- siones. De modo similar, los operadores lógicos y relaciones tienen un orden de prioridad. Tabla 3.7. Prioridad de operadores (lenguaje Pascal) Operador Prioridad no (not) más alta (primera ejecutada). /, *, div, mod, y (and) +, -, o (or) , , =, =, =, más baja (última ejecutada). Tabla 3.8. Prioridad de operadores (lenguajes C, C++, C# y Java) Operador Prioridad ++ y -- (incremento y decremento en 1), +, –, ! más alta *, /, % (módulo de la división entera) +, - (suma, resta) , =, , = == (igual a), != (no igual a) (y lógica, AND) || (o lógica, or) =, +=, -=, *=, /=, %= (operadores de asignación) más baja Al igual que en las expresiones aritméticas, los paréntesis se pueden utilizar y tendrán prioridad sobre cualquier operación. EJEMPLO 3.8 no 4 6 produce un error, ya que el operador no se aplica a 4 no (4 14) produce un valor verdadero (1.0 x) y (x z + 7.0) si x vale 7 y z vale 4, se obtiene un valor verdadero 3.8. FUNCIONES INTERNAS Las operaciones que se requieren en los programas exigen en numerosas ocasiones, además de las operaciones de las operaciones aritméticas básicas, ya tratadas, un número determinado de operadores especiales que se denominan funciones internas, incorporadas o estándar. Por ejemplo, la función ln se puede utilizar para determinar el logaritmo neperiano de un número y la función raiz2 (sqrt) calcula la raíz cuadrada de un número positivo. Existen otras funciones que se utilizan para determinar las funciones trigonométricas. La Tabla 3.9 recoge las funciones internas más usuales, siendo x el argumento de la función. Tabla 3.9. Funciones internas Función Descripción Tipo de argumento Resultado abs(x) valor absoluto de x entero o real igual que argumento arctan(x) arco tangente de x entero o real real cos(x) coseno de x entero o real real
  • 133. Estructura general de un programa 103 EJEMPLO 3.9 Las funciones aceptan argumentos reales o enteros y sus resultados dependen de la tarea que realice la función: Expresión Resultado raiz2 (25) 5 redondeo (6.5) 7 redondeo (3.1) 3 redondeo (–3.2) –3 trunc (5.6) 5 trunc (3.1) 3 trunc (–3.8) –3 cuadrado (4) 16 abs (9) 9 abs (-12) 12 EJEMPLO 3.10 Utilizar las funciones internas para obtener la solución de la ecuación cuadrática ax2 + bx + c = 0. Las raíces de la ecuación son: x b b ac a = − ± − 2 4 2 o lo que es igual: x b b ac a x b b ac a 1 4 2 2 4 2 2 2 = − − = − − − + Las expresiones se escriben como x1 = (-b + raiz2 (cuadrado(b) - 4 * a * c)) / (2 * a) x2 = (-b - raiz2 (cuadrado(b) - 4 * a * c)) / (2 * a) Función Descripción Tipo de argumento Resultado exp(x) exponencial de x entero o real real ln(x) logaritmo neperiano de x entero o real real log10(x) logaritmo decimal de x entero o real real redondeo(x) redondeo de x real entero (round(x))* seno(x) seno de x entero o real real (sin(x))* cuadrado(x) cuadrado de x entero o real igual que argumento (sqr(x))* raiz2(x) raíz cuadrada de x entero o real real (sqrt(x))* trunc(x) truncamiento de x real entero * Terminología en inglés. Tabla 3.9. Funciones internas (continuación)
  • 134. 104 Fundamentos de programación Si el valor de la expresión raiz2 (cuadrado(b) - 4 * a * c) es negativo se producirá un error, ya que la raíz cuadrada de un número negativo no está definida. 3.9. LA OPERACIÓN DE ASIGNACIÓN La operación de asignación es el modo de almacenar valores a una variable. La operación de asignación se represen- ta con el símbolo u operador ← (en la mayoría de los lenguajes de programación, como C, C++, Java, el signo de la operación asignación es =). La operación de asignación se conoce como instrucción o sentencia de asignación cuan- do se refiere a un lenguaje de programación. El formato general de una operación de asignación es nombre de la variable ← expresión expresión es igual a expresión, variable o constante La flecha (operador de asignación) se sustituye en otros lenguajes por = (Visual Basic, FORTRAN), := (Pascal) o = (Java, C++, C#). Sin embargo, es preferible el uso de la flecha en la redacción del algoritmo para evitar ambi- güedades, dejando el uso del símbolo = exclusivamente para el operador de igualdad. La operación de asignación: A ← 5 significa que a la variable A se le ha asignado el valor 5. La acción de asignar es destructiva, ya que el valor que tuviera la variable antes de la asignación se pierde y se reemplaza por el nuevo valor. Así, en la secuencia de operaciones A ← 25 A ← 134 A ← 5 cuando éstas se ejecutan, el valor último que toma A será 5 (los valores 25 y 134 han desaparecido). La computadora ejecuta la sentencia de asignación en dos pasos. En el primero de ellos, el valor de la expresión al lado derecho del operador se calcula, obteniéndose un valor de un tipo específico. En el segundo caso, este valor se almacena en la variable cuyo nombre aparece a la izquierda del operador de asignación, sustituyendo al valor que tenía anteriormente. X ← Y + 2 el valor de la expresión Y + 2 se asigna a la variable X. Es posible utilizar el mismo nombre de variable en ambos lados del operador de asignación. Por ello, acciones como N ← N + 1 tienen sentido; se determina el valor actual de la variable N, se incrementa en 1 y a continuación el resultado se asigna a la misma variable N. Sin embargo, desde el punto de vista matemático no tiene sentido N ← N + 1. Las acciones de asignación se clasifican según sea el tipo de expresiones en: aritméticas, lógicas y de ca- racteres.
  • 135. Estructura general de un programa 105 3.9.1. Asignación aritmética Las expresiones en las operaciones de asignación son aritméticas: AMN ← 3 + 14 + 8 se evalúa la expresión 3 + 14 + 8 y se asigna a la variable AMN, es decir, 25 será el valor que toma AMN TER1 ← 14.5 + 8 TER2 ← 0.75 * 3.4 COCIENTE ← TER1/TER2 Se evalúan las expresiones 14.5 + 8 y 0.75 * 3.4 y en la tercera acción se dividen los resultados de cada ex- presión y se asigna a la variable COCIENTE, es decir, las tres operaciones equivalen a COCIENTE ← (14.5 + 8)/ (0.75 * 3.4). Otro ejemplo donde se pueden comprender las modificaciones de los valores almacenados en una variable es el siguiente: A ← 0 la variable A toma el valor 0 N ← 0 la variable N toma el valor 0 A ← N + 1 la variable A toma el valor 0 + 1, es decir 1. El ejemplo anterior se puede modificar para considerar la misma variable en ambos lados del operador de asig- nación: N ← 2 N ← N + 1 En la primera acción N toma el valor 2 y en la segunda se evalúa la expresión N + 1, que tomará el valor 2 + 1 = 3 y se asignará nuevamente a N, que tomará el valor 3. 3.9.2. Asignación lógica La expresión que se evalúa en la operación de asignación es lógica. Supóngase que M, N y P son variables de tipo lógico. M ← 8 5 N ← M o (7 = 12) P ← 7 6 Tras evaluar las operaciones anteriores, las variables M, N y P tomarán los valores falso, verdadero, verdadero. 3.9.3. Asignación de cadenas de caracteres La expresión que se evalúa es de tipo cadena: x ← '12 de octubre de 1942' La acción de asignación anterior asigna la cadena de caracteres '12 de octubre de 1942' a la variable tipo cadena x. 3.9.4. Asignación múltiple Todos los lenguajes modernos admiten asignaciones múltiples y con combinaciones de operadores, además de la asignación única con el operador ← . Así se puede usar el operador de asignación (←) precedido por cualquiera de los siguientes operadores aritméticos: +, –, *, /, %. La sintaxis es la siguiente: nombre_variable ← variable operador expresión
  • 136. 106 Fundamentos de programación y es equivalente a: variable operador ← expresión EJEMPLO c ← c + 5 equivale a c +← 5 a ← a * (b + c) equivale a a *← b + c o si lo prefiere utilizando el signo de asignación (=) de C, C++, Java o C#. Caso especial Los lenguajes C, C++, Java y C# permiten realizar múltiples asignaciones en una sola sentencia a = b = c = d = e = n +35; Tabla 3.10. Operadores aritméticos de asignación múltiple Operador de asignación Ejemplo Operación Resultado Entero a = 3, b= 5, c = 4, d = 6, e = 10 *= a += 8 a = a+8 a = 11 -= b -= 5 b = b-5 b = 0 *= c *= 4 c = c*4 c = 16 /= d /= 3 d = d/3 d = 2 %= e %= 9 e = e%9 e = 1 3.9.5. Conversión de tipo En las asignaciones no se pueden asignar valores a una variable de un tipo incompatible al suyo. Se presentará un error si se trata de asignar valores de tipo carácter a una variable numérica o un valor numérico a una variable tipo carácter. EJEMPLO 3.11 ¿Cuáles son los valores de A, B y C después de la ejecución de las siguientes operaciones? A ← 3 B ← 4 C ← A + 2 * B C ← C + B B ← C - A A ← B * C En las dos primeras acciones A y B toman los valores 3 y 4. C ← A + 2 * B la expresión A + 2 * B tomará el valor 3 + 2 * 4 = 3 + 8 = 11 C ← 11 La siguiente acción C ← C + B
  • 137. Estructura general de un programa 107 producirá un valor de 11 + 4 = 15 C ← 15 En la acción B ← C – A se obtiene para B el valor 15 – 3 = 12 y por último: A ← B * C A tomará el valor B * C, es decir, 12 * 15 = 180; por consiguiente, el último valor que toma A será 180. EJEMPLO 3.12 ¿Cuál es el valor de x después de las siguientes operaciones? x ← 2 x ← cuadrado(x + x) x ← raiz2(x + raiz2(x) + 5) Los resultados de cada expresión son: x ← 2 x toma el valor 2 x ← cuadrado(2 + 2) x toma el valor 4 al cuadrado; es decir 16 x ← raiz2(16 + raiz2(16) + 5) en esta expresión se evalúa primero raiz2(16), que produce 4 y, por último, raiz2(16+4+5) proporciona raiz2(25), es decir, 5. Los resultados de las expresiones sucesivas anteriores son: x ← 2 x ← 16 x ← 5 3.10. ENTRADA Y SALIDA DE INFORMACIÓN Los cálculos que realizan las computadoras requieren para ser útiles la entrada de los datos necesarios para ejecutar las operaciones que posteriormente se convertirán en resultados, es decir, salida. Las operaciones de entrada permiten leer determinados valores y asignarlos a determinadas variables. Esta entra- da se conoce como operación de lectura (read). Los datos de entrada se introducen al procesador mediante disposi- tivos de entrada (teclado, tarjetas perforadas, unidades de disco, etc.). La salida puede aparecer en un dispositivo de salida (pantalla, impresora, etc.). La operación de salida se denomina escritura (write). En la escritura de algoritmos las acciones de lectura y escritura se representan por los formatos siguientes: leer (lista de variables de entrada) escribir (lista de variables de salida) Así, por ejemplo: leer (A, B, C) representa la lectura de tres valores de entrada que se asignan a las variables A, B y C. escribir ('hola Vargas') visualiza en la pantalla —o escribe en el dispositivo de salida— el mensaje 'hola Vargas'.
  • 138. 108 Fundamentos de programación Nota 1 Si se utilizaran las palabras reservadas en inglés, como suele ocurrir en los lenguajes de programación, se de- berá sustituir leer escribir por read write o bien print Nota 2 Si no se especifica el tipo de dispositivo del cual se leen o escriben datos, los dispositivos de E/S por defecto son el teclado y la pantalla. 3.11. ESCRITURA DE ALGORITMOS/PROGRAMAS La escritura de un algoritmo mediante una herramienta de programación debe ser lo más clara posible y estructurada, de modo que su lectura facilite considerablemente el entendimiento del algoritmo y su posterior codificación en un lenguaje de programación. Los algoritmos deben ser escritos en lenguajes similares a los programas. En nuestro libro utilizaremos esencial- mente el lenguaje algorítmico, basado en pseudocódigo, y la estructura del algoritmo requerirá la lógica de los pro- gramas escritos en el lenguaje de programación estructurado; por ejemplo, Pascal. Un algoritmo constará de dos componentes: una cabecera de programa y un bloque algoritmo. La cabecera de programa es una acción simple que comienza con la palabra algoritmo. Esta palabra estará seguida por el nombre asignado al programa completo. El bloque algoritmo es el resto del programa y consta de dos componentes o sec- ciones: las acciones de declaración y las acciones ejecutables. Las declaraciones definen o declaran las variables y constantes que tengan nombres. Las acciones ejecutables son las acciones que posteriormente deberá realizar la computación cuando el algoritmo convertido en programa se ejecute. algoritmo cabecera del programa sección de declaración sección de acciones 3.11.1. Cabecera del programa o algoritmo Todos los algoritmos y programas deben comenzar con una cabecera en la que se exprese el identificador o nombre correspondiente con la palabra reservada que señale el lenguaje. En los lenguajes de programación, la palabra reser- vada suele ser program. En Algorítmica se denomina algoritmo. algoritmo DEMO1 3.11.2. Declaración de variables En esta sección se declaran o describen todas las variables utilizadas en el algoritmo, listándose sus nombres y espe- cificando sus tipos. Esta sección comienza con la palabra reservada var (abreviatura de variable) y tiene el formato
  • 139. Estructura general de un programa 109 var tipo-1 : lista de variables-1 tipo-2 : lista de variables-2 . . tipo-n : lista de variables-n donde cada lista de variables es una variable simple o una lista de variables separadas por comas y cada tipo es uno de los tipos de datos básicos (entero, real, char o boolean). Por ejemplo, la sección de declaración de va- riables var entera : Numero_Empleado real : Horas real : Impuesto real : Salario o de modo equivalente var entera : Numero_Empleado real : Horas, Impuesto, Salario declara que sólo las tres variables Hora, Impuesto y Salario son de tipo real. Es una buena práctica de programación utilizar nombres de variables significativos que sugieran lo que ellas re- presentan, ya que eso hará más fácil y legible el programa. También es buena práctica incluir breves comentarios que indiquen cómo se utiliza la variable. var entera : Numero_Empleado // número de empleado real : Horas, // horas trabajadas Impuesto, // impuesto a pagar Salario // cantidad ganada 3.11.3. Declaración de constantes numéricas En esta sección se declaran todas las constantes que tengan nombre. Su formato es const pi = 3.141592 tamaño = 43 horas = 6.50 Los valores de estas constantes ya no pueden variar en el transcurso del algoritmo. 3.11.4. Declaración de constantes y variables carácter Las constantes de carácter simple y cadenas de caracteres pueden ser declaradas en la sección del programa const, al igual que las constantes numéricas. const estrella = '*' frase = '12 de octubre' mensaje = 'Hola mi nene'
  • 140. 110 Fundamentos de programación Las variables de caracteres se declaran de dos modos: 1. Almacenar un solo carácter. var carácter : nombre, inicial, nota, letra Se declaran nombre, inicial, nota y letra, que almacenarán sólo un carácter. 2. Almacenar múltiples caracteres (cadenas). El almacenamiento de caracteres múltiples dependerá del lengua- je de programación. Así, en los lenguajes VB 6.0/VB .NET (VB, Visual Basic) Dim var1 As String Var1 = Pepe Luis García Rodriguez Pascal formato tipo array o arreglo (véase Capítulo 8). Existen algunas versiones de Pascal, como es el caso de Turbo Pascal, que tienen implementados un tipo de datos denominados string (cadena) que permite declarar variables de caracteres o de cadena que almacenan palabras compuestas de diferentes caracteres. var nombre : string[20]; en Turbo Pascal var cadena : nombre[20]; en pseudocódigo 3.11.5. Comentarios La documentación de un programa es el conjunto de información interna externa al programa, que facilitará su pos- terior mantenimiento y puesta a punto. La documentación puede ser interna y externa. La documentación externa es aquella que se realiza externamente al programa y con fines de mantenimiento y actualización; es muy importante en las fases posteriores a la puesta en marcha inicial de un programa. La documen- tación interna es la que se acompaña en el código o programa fuente y se realiza a base de comentarios significativos. Estos comentarios se representan con diferentes notaciones, según el tipo de lenguaje de programación. Visual Basic 6 / VB .NET 1. Los comentarios utilizan un apóstrofe simple y el compilador ignora todo lo que viene después de ese ca- rácter 'Este es un comentario de una sola línea Dim Mes As String 'comentario después de una línea de código ............... 2. También se admite por guardar compatibilidad con versiones antiguas de BASIC y Visual Basic la palabra reservada Rem Rem esto es un comentario C/C++ y C# Existen dos formatos de comentarios en los lenguajes C y C++: 1. Comentarios de una línea (comienzan con el carácter //) // Programa 5.0 realizado por el Señor Mackoy // en Carchelejo (Jaén)en las Fiestas de Agosto // de Moros y Cristiano
  • 141. Estructura general de un programa 111 2. Comentarios multilínea (comienzan con los caracteres /* y terminan con los caracteres */, todo lo encerrado entre ambos juegos de caracteres son comentarios) /* El maestro Mackoy estudió el Bachiller en el mismo Instituto donde dio clase Don Antonio Machado, el poeta */ Java 1. Comentarios de una línea // comentarios sobre la Ley de Protección de Datos 2. Comentarios multilíneas /* El pueblo de Mr. Mackoy está en Sierra Mágina, y produce uno de los mejores aceites de oliva del mundo mundial */ 3. Documentación de clases /** Documentación de la clase */ Pascal Los comentarios se encierran entre los símbolos (* *) o bien { } (* autor J.R. Mackoy *) {subrutina ordenacion} Modula-2 Los comentarios se encierran entre los símbolos (* *) Nota A lo largo del libro utilizaremos preferentemente para representar nuestros comentarios los símbolos // y /*. Sin embargo, algunos autores de algoritmos, a fin de independizar la simbología del lenguaje, suelen representar los comentarios con corchetes ([ ]). 3.11.6. Estilo de escritura de algoritmos/programas El método que seguiremos normalmente a lo largo del libro para escribir algoritmos será el descrito al comienzo del Apartado 3.11. algoritmo identificador //cabecera // seccion de declaraciones
  • 142. 112 Fundamentos de programación var tipo de datos : lista de identificadores const lista de identificadores = valor inicio sentencia S1 sentencia S2 // cuerpo del algoritmo . . . sentencia Sn fin Notas 1. En ocasiones, la declaración de constantes y variables las omitiremos o se describirán en una tabla de varia- bles que hace sus mismas funciones. 2. Las cadenas de caracteres se encerrarán entre comillas simples. 3. Utilizar siempre sangrías en los bucles o en aquellas instrucciones que proporcionen legibilidad al programa, como inicio y fin. MODELO PROPUESTO DE ALGORITMO algoritmo raices // resuelve una ecuación de 2.º grado var real : a, b, c inicio leer(a, b, c) d ← b ^ 2 - 4 * a * c si d 0 entonces escribir('raices complejas') si_no si d = 0 entonces escribir (-b / (2 * a) si_no escribir ((-b - raiz2(d)) / (2 * a) escribir ((-b + raiz2(d)) / (2 * a) fin_si fin_si fin
  • 143. Estructura general de un programa 113 ACTIVIDADES DE PROGRAMACIÓN RESUELTAS 3.1. Diseñar un algoritmo para cambiar una rueda de un coche. Solución algoritmo pinchazo inicio si gato del coche está averiado entonces llamar a la estación de servicio si_no levantar el coche con el gato repetir aflojar y sacar los tornillos de las ruedas hasta_que todos los tornillos estén flojos y quitados quitar la rueda poner la rueda de repuesto repetir poner los tornillos y apretarlos hasta_que estén puestos todos los tornillos bajar el gato fin_sí fin 3.2. Encontrar el valor de la variable VALOR después de la ejecución de las siguientes operaciones: (A) VALOR ← 4.0 * 5 (B) X ← 3.0 Y ← 2.0 VALOR ← X ^ Y - Y (C) VALOR ← 5 X ← 3 VALOR ← VALOR * X Solución (A) VALOR = 20.0 (B) X = 3.0 Y = 2.0 VALOR = 3 ^ 2 - 2 = 9 - 2 = 7 VALOR = 7 (C) VALOR = 5 X = 3 VALOR = VALOR * X = 5 * 3 = 15 VALOR = 15 3.3. Deducir el resultado que se produce con las siguientes instrucciones: var Entero : X, Y X ← 1 Y ← 5 escribir (X, Y) Solución X e Y toman los valores 1 y 5. La instrucción de salida (escribir) presentará en el dispositivo de salida 1 y 5, con los formatos específicos del lenguaje de programación; por ejemplo, 1 5 3.4. Deducir el valor de las expresiones siguientes: X ← A + B + C X ← A + B * C
  • 144. 114 Fundamentos de programación X ← A + B / C X ← A + B C X ← A + B mod C X ← (A + B) C X ← A + (B / C) Siendo A = 5 B = 25 C = 10 Solución Expresión X A + B + C = 5 + 25 + 10 40 A + B * C = 5 + 25 * 10 225 A + B / C = 5 + 25 / 10 7.5 A + B C = 5 + 25 10 = 5 + 2 7 A + B mod C = 5 + 25 mod 10 = 5 + 5 10 (A + B) / C = (5 + 25) / 10 = 30 / 10 3 A + (B / C) = 5 + (25 / 10) = 5 + 2.5 7.5 3.5. Escribir las siguientes expresiones en forma de expresiones algorítmicas: a) M N + P d) m + n p – q b) M + N P – Q e) m + n p q – r 5 c) seno(x) + cos(x) tan(x) f) –b + √b2 – 4ac 2a Solución a) M / N + P b) M + N / (P - Q) c) (SEN(X) + COS(X) / TAN (X) d) (M + N) / (P - Q) e) (M + N / P) / (Q - R / 5) f) (-B + raiz2 (B ^ 2 - 4 * A * C)) / (2 * A) 3.6. Calcúlese el valor de las siguientes expresiones: a) 8 + 7 * 3 + 4 * 6 b) –2 ^ 3 c) (33 + 3 * 4) / 5 d) 2 ^ 2 * 3 e) 3 + 2 * (18 – 4 ^ 2) f) 16 * 6 – 3 * 2 Solución a) 8 + 7 * 3 + 4 * 6 { { 8 + 21 + 24 { 29 + 24 { 53
  • 145. Estructura general de un programa 115 b) -2 ^ 3 { -8 c) (33 + 3 * 4) / 5 { 33 + 12 / 5 { 45 / 5 { 9 d) 2 ^ 2 * 3 { 4 * 3 { 12 f) 16 * 6 - 3 * 2 { { 96 - 6 { 90 3.7. Se tienen tres variables A, B y C. Escribir las instrucciones necesarias para intercambiar entre sí sus valores del modo siguiente: • B toma el valor de A • C toma el valor de B • A toma el valor de C Nota: Sólo se debe utilizar una variable auxiliar. Solución Utilizaremos una variable auxiliar AUX. Las instrucciones que resuelven el problema de intercambio son: AUX ← A A ← C C ← B B ← AUX Comprobémoslo con los valores de A, B y C: 5, 10 y 15. Instrucción A B C AUX Observaciones (1) A ← 5 5 -- -- -- (2) B ← 10 -- 10 -- -- (3) C ← 15 -- -- 15 -- AUX ← A 5 10 15 5 A ← C 15 10 15 5 C ← B 15 10 10 5 B ← AUX 15 5 10 5 Obsérvese que al igual que en el ejercicio de intercambio de valores entre dos variables, la variable AUX no modifica su valor.
  • 146. 116 Fundamentos de programación 3.8. Cómo se intercambian los valores de dos variables, A y B. Solución Con el ejercicio se ha visto cómo se pueden intercambiar los valores de una variable mediante las instrucciones: A ← B B ← A El procedimiento para conseguir intercambiar los valores de dos variables entre sí debe recurrir a una variable AUX y a las instrucciones de asignación siguientes: AUX ← A A ← B B ← AUX Veámoslo con un ejemplo: a ← 10 B ← 5 Instrucción A B AUX Observaciones A ← 10 10 -- -- B ← 5 10 5 -- AUX ← A 10 5 10 La variable AUX toma el valor de A A ← B 5 5 10 A toma el valor de B, 5 B ← AUX 5 10 10 B toma el valor inicial de A, 10 Ahora A = 5 y B = 10. 3.9. Deducir el valor que toma la variable tras la ejecución de las instrucciones: A ← 4 B ← A B ← A + 3 Solución Mediante una tabla se da un método eficaz para obtener los sucesivos valores: A B (1) A ← A 4 -- (2) B ← A 4 4 (3) B ← A + 3 4 7 Después de la instrucción (1) la variable A contiene el valor 4. La variable B no ha tomado todavía ningún valor y se representa esa situación con un guión. La instrucción (2) asigna el valor actual de A (4) a la variable B. La instrucción (3) efectúa el cálculo de la expre- sión A + 3, lo que produce un resultado de 7 (4 + 3) y este valor se asigna a la variable B, cuyo último valor (4) se des- truye. Por consiguiente, los valores finales que tienen las variables A y B son: A = 4 B = 7 3.10. ¿Qué se obtiene en las variables A y B, después de la ejecución de las siguientes instrucciones? A ← 5 B ← A + 6 A ← A + 1 B ← A - 5
  • 147. Estructura general de un programa 117 Solución Siguiendo las directrices del ejercicio anterior: Instrucción A B Observaciones (1) A ← 5 5 — B no toma ningún valor (2) B ← A + 6 5 11 Se evalúa A + 6(5 + 6) y se asigna a B (3) A ← A + 1 6 11 Se evalúa A + 1(5 + 1) y se asigna a A, borrándose el valor que tenía (5) y tomando el nuevo valor (6) (4) B ← A - 5 6 1 Se evalúa A – 5(6 – 1) y se asigna a B Los valores últimos de A y B son: A = 6, B = 1. 3.11. ¿Qué se obtiene en las variables A, B y C después de ejecutar las instrucciones siguientes? A ← 3 B ← 20 C ← A + B B ← A + B A ← B - C Solución Instrucción A B C Observaciones (1) A ← 3 3 -- -- B y C no toman ningún valor (2) B ← 20 3 20 -- C sigue sin valor (3) C ← A + B 3 20 23 Se evalúa A + B(20 + 3) y se asigna a C (4) B ← A + B 3 23 23 Se evalúa A + B(20 + 3) y se asigna a B; destruye el valor antiguo (20) (5) A ← B - C 0 23 23 Se evalúa B – C(23 – 23) y se asigna a A Los valores finales de las variables son: A = 0 B = 23 C = 23 3.12. ¿Qué se obtiene en A y B tras la ejecución de A ← 10 B ← 5 A ← B B ← A Solución Instrucción A B Observaciones (1) A ← 10 10 -- B no toma valor (2) B ← 5 10 5 B recibe el valor inicial 5 (3) A ← B 5 5 A toma el valor de B (5) (4) B ← A 5 5 B toma el valor actual de A (5) Los valores finales de A y B son 5. En este caso se podría decir que la instrucción (4) B ← A es redundante respecto a las anteriores, ya que su ejecución no afecta al valor de las variables.
  • 148. 118 Fundamentos de programación 3.13. Determinar el mayor de tres números enteros. Solución Los pasos a seguir son: 1. Comparar el primero y el segundo entero, deduciendo cuál es el mayor. 2. Comparar el mayor anterior con el tercero y deducir cuál es el mayor. Este será el resultado. Los pasos anteriores se pueden descomponer en otros pasos más simples en lo que se denomina refinamiento del algo- ritmo: 1. Obtener el primer número (entrada), denominarlo NUM1. 2. Obtener el segundo número (entrada), denominarlo NUM2. 3. Comparar NUM1 con NUM2 y seleccionar el mayor; si los dos enteros son iguales, seleccionar NUM1. Llamar a este número MAYOR. 4. Obtener el tercer número (entrada) y denominarlo NUM3. 5. Comparar MAYOR con NUM3 y seleccionar el mayor; si los dos enteros son iguales, seleccionar el MAYOR. Denominar a este número MAYOR. 6. Presentar el valor de MAYOR (salida). 7. Fin. 3.14. Determinar la cantidad total a pagar por una llamada telefónica, teniendo en cuenta lo siguiente: • toda llamada que dure menos de tres minutos (cinco pasos) tiene un coste de 10 céntimos, • cada minuto adicional a partir de los tres primeros es un paso de contador y cuesta 5 céntimos. Solución Análisis El algoritmo de resolución del problema entraña los siguientes pasos: 1. Inicio. 2. Leer el número se pasos (npasos) hablados por teléfono. 3. Comprobar que el número de pasos es mayor que cero, ya que realmente se ha realizado la llamada si el número de pasos es distinto de cero (positivo). Si el número de pasos es menor a cero, se producirá un error. 4. Calcular el precio de la conferencia de acuerdo con los siguientes conceptos: • si el número de pasos es menor que 5, el precio es de 10 céntimos, • si el número de pasos es mayor que 5, es preciso calcular los pasos que exceden de 5, ya que éstos importan 5 céntimos cada uno; al producto de los pasos sobrantes por cin- co céntimos se le suman 10 pesetas y se obtendrá el precio total. Variables NPASOS Número de pasos de la llamada N Número de pasos que exceden a 5 FACT Importe o precio de la llamada.
  • 149. Estructura general de un programa 119 Diagrama de flujo inicio leer NPASOS NPASOS = 0 N 0 escribir NPASOS FACT fin escribir ERROR 1 1 sí no hacer FACT ← 10 N ← NPASOS-5 hacer FACT ← FACT + N * 5 sí 3.15. Calcular la suma de los cincuenta primeros números enteros. Solución Análisis El algoritmo expresado en lenguaje natural o en secuencia de pasos es el siguiente: 1. Inicio. 2. Hacer el primer número 1 igual a una variable X que actuará de contador de 1 a 50 y S igual a 0. 3. Hacer S = S+X para realizar las sumas parciales. 4. Hacer X = X+1 para generar los números enteros. 5. Repetir los pasos 3 y 4 hasta que X = 50, en cuyo caso se debe visualizar la suma. 6. Fin.
  • 150. 120 Fundamentos de programación Diagrama de flujo escribir S X = 50 fin sí inicio X ← 1 no S ← 0 S ← S + X X ← X + 1 3.16. Escribir un algoritmo que calcule el producto de los n primeros números naturales. Solución Análisis El problema puede calcular el producto N * (N – 1 * (n – 2) * ... * 3 * 2 * 1, que en términos matemáti- cos se le conoce con el nombre de FACTORIAL de N. El algoritmo que resuelve el problema será el siguiente: 1. Leer N. 2. Caso de que N = 0, visualizar «Factorial de 0 igual 1». 3. Comprobar que N 0 (los números negativos no se consideran). 4. Hacer la variable P que va a contener el productor igual a 1. 5. Realizar el producto P = P * N. Disminuir en una unidad sucesivamente hasta llegar a N = 1, y de modo simultáneo los productos P * N. 6. Visualizar P. 7. Fin.
  • 151. Estructura general de un programa 121 Diagrama de flujo sí no leer N N = 0 N = 1 fin N 0 P ← 1 P ← P * N N ← N – 1 escribir 'Prueba con positivos' escribir 'Factorial =' P escribir 'Número negativo' escribir 'Factorial de 0 igual a 1' inicio no sí Pseudocódigo algoritmo Factorial var entero : N real : P inicio leer(N) si N = 0 entonces escribir('Factorial de 0 igual a 1')
  • 152. 122 Fundamentos de programación si_no si N 0 entonces P ← 1 (1) P ← P * N N ← N - 1 si N = 1 entonces escribir('Factorial =', P) si_no ir_a (1) fin_si si_no escribir('Numero negativo') escribir('Pruebe con positivos') fin_si fin_si fin 3.17. Diseñar un algoritmo para resolver una ecuación de segundo grado Ax2 + Bx + C = 0. Solución Análisis La ecuación de segundo grado es Ax2 + Bx + C = 0 y las soluciones o raíces de la ecuación son: X1 = –B + √B2 – 4AC 2A X2 = –B – √B2 – 4AC 2A Para que la ecuación de segundo grado tenga solución es preciso que el discriminante sea mayor o igual que 0. El discriminante de una ecuación de segundo grado es D = B ^ 2 - 4AC Por consiguiente, si D = 0 X1 = -B / 2A X2 = -B / 2A D 0 X1 y X2 no tienen solución real. En consecuencia, el algoritmo que resolverá el problema es el siguiente: 1. Inicio. 2. Introducir los coeficientes A, B y C. 3. Cálculo del discriminante D = B ^ 2 - 4AC 4. Comprobar el valor de D. • si D es menor que 0, visualizar un mensaje de error, • si D es igual a 0, se obtienen dos raíces iguales X1 = X2 = -B / 2A. • si D es mayor que 0, se calculan las dos raíces X1 y X2. 5. Fin del algoritmo.
  • 153. Estructura general de un programa 123 Diagrama de flujo leer A, B, C D 0 fin sí sí D = 0 hacer D = B2 – 4AC no inicio X1 = (–B + D)/2A X2 = (–B – D)/2A mensaje de error escribir –B/2A no 3.18. Escribir un algoritmo que acepte tres números enteros e imprima el mayor de ellos. Solución Análisis El diseño del algoritmo requiere de una serie de comparaciones sucesivas. Las operaciones sucesivas son las siguientes: 1. Inicio. 2. Introducir los tres números A, B, C. 3. Comparar A y B: • si A es menor que B: – comparar B y C: • si B es mayor que C, el mayor es B, • si B es menor que C, el mayor es C. • si A es mayor que B: – comparar A y C: • si A es menor que C, el mayor es C, • si A es mayor que C, el mayor es A.
  • 154. 124 Fundamentos de programación Diagrama de flujo leer A, B, C fin sí sí no inicio no A C A B B C escribir C no sí 1 1 1 escribir B escribir A CONCEPTOS CLAVE • Algoritmo. • Asignación. • Caracteres especiales. • Constantes. • Datos. • Declaraciones. • Escritura de resultados. • Expresiones. • Función interna. • Identificador. • Instrucción. • Lectura de datos. • Operaciones primitivas. • Operadores. • Palabras reservadas. • Programa. • Pseudocódigo. • Tipos de datos. • Variables. RESUMEN Un programa es un conjunto de instrucciones que se pro- porciona a una computadora para realizar una tarea de- terminada. El proceso de programación requiere las si- guientes fases o etapas fundamentales: definición y análisis del problema, diseño del algoritmo, codificación del pro- grama, depuración y verificación, documentación y man- tenimiento. En la práctica un programa es una caja negra —un al- goritmo de resolución del problema— que tiene una entra- da de datos y una salida de resultados. La entrada de datos se realiza a través del teclado, ratón, escáner, discos... y la salida se representa en impresora, pantalla, etc. Existen diferentes tipos de instrucciones básicas: inicio, fin, asignación, lectura, escritura y bifurcación.
  • 155. Estructura general de un programa 125 Los elementos básicos constitutivos de un programa son: palabras reservadas, identificadores, caracteres espe- ciales, constantes, variables, expresiones, instrucciones a los cuales se unen para tareas de ejecución de operaciones otros elementos primitivos de un programa, tales como: bu- cles, contadores, acumuladores, interruptores y estructuras. Todos estos elementos manipulan datos o información de diferentes tipos como numéricos, lógicos o carácter. Los valores de estos datos se almacenan para su tratamiento en constantes y variables. Las combinaciones de constantes, variables, símbolos de operaciones, nombres de funciones, etc., constituyen las expresiones que a su vez se clasifican en función del tipo de objetos que manipulan en: aritméti- cas, relacionales, lógicas y carácter. Otro concepto importante a considerar en la iniciación a la programación es el concepto y tipos de operadores que sirven para la resolución de expresiones y constituyen ele- mentos clave en las sentencias de flujo de control que se estudiarán en los capítulos posteriores. La operación de asignación es un sistema de almacena- miento de valores en una variable. Existen diferentes tipos de asignaciones en función de los tipos de datos cuyos de- seos se desean almacenar. La conversión de tipos en opera- ciones de asignaciones es una tarea importante y su com- prensión es vital para evitar errores en el proceso de depuración de un programa. La última característica importante a considerar en el capítulo es la escritura de algoritmos y programas, para lo que se necesitan unas reglas claras y precisas que faciliten su legibilidad y su posterior codificación en un lenguaje de programación. EJERCICIOS 3.1. Diseñar los algoritmos que resuelvan los siguientes problemas: a) Ir al cine. b) Comprar una entrada para los toros. c) Colocar la mesa para comer. d) Cocer un huevo. e) Hacer una taza de té. f) Fregar los platos del almuerzo. g) Buscar el número de teléfono de un alumno. h) Reparar un pinchazo de una bicicleta. i) Pagar una multa de tráfico. j) Cambiar un neumático pinchado (se dispone de herramientas y gato). k) Hacer palomitas de maíz en una olla puesta al fuego con aceite, sal y maíz. l) Cambiar el cristal roto de una ventana. m) Hacer una llamada telefónica. Considerar los ca- sos: a) manual, con operadora; b) automático; c) cobro revertido. n) Quitar una bombilla quemada de un techo. o) Encontrar la media de una lista indeterminada de números positivos terminada con un número ne- gativo. 3.2. ¿Cuáles de los siguientes identificadores no son vá- lidos? a) XRayo b) X_Rayo c) R2D2 d) X e) 45 f) N14 g) ZZZZ h) 3μ 3.3. ¿Cuáles de las siguientes constantes no son válidas? a) 234 b) –8.975 c) 12E – 5 d) 0 e) 32,767 f) 1/2 g) 3.6E + 7 h) –7E12 i) 3.5 x 10 j) 0,456 k) 0.000001 l) 224E1 3.4. Evaluar la siguiente expresión para A = 2 y B = 5: 3 * A - 4 * B / A ^ 2 3.5. Evaluar la expresión 4 / 2 * 3 / 6 + 6 / 2 / 1 / 5 ^ 2 / 4 * 2 3.6. Escribir las siguientes expresiones algebraicas como expresiones algorítmicas: a) √ b2 – 4ac b) x2 + y2 z2 c) 3x + 2y 2z d) a + b c – d e) 4x2 – 2x + 7 f) x + y x – 3x 5 g) a bc h) xyz i) y2 – y1 x2 – x1 j) 2πr k) 4 3 πr3 h) (x2 – x1)2 + (y2 – y1)2 3.7. Escribir las siguientes expresiones algorítmicas como expresiones algebraicas: a) b ^ 2 – 4 * a * c b) 3 * X ^ 4 – 5 * X ^ 3 + X 12 – 17 c) (b + d) / (c + 4) d) (x ^ 2 + y ^ 2) ^ (1 / 2)
  • 156. 126 Fundamentos de programación 3.8. Si el valor de A es 4, el valor de B es 5 y el valor de C es 1, evaluar las siguientes expresiones: a) B * A – B ^ 2 / 4 * C b) (A * B) / 3 ^ 2 c) (((B + C) / 2 * A + 10) * 3 * B) – 6 3.9. Si el valor de A es 2, B es 3 y C es 2, evaluar la ex- presión: A ^ B ^ C 3.10. Obtener el valor de cada una de las siguientes expre- siones aritméticas: a) 7 div 2 b) 7 mod 2 c) 12 div 3 d) 12 mod 3 e) 0 mod 5 f) 15 mod 5 g) 7 * 10 – 50 mod 3 * 4 + 9 h) (7 * (10 – 5) mod 3) * 4 + 9 Nota: Considérese la prioridad de Pascal: más alta: *, /, div, mod; más baja: +, –. 3.11. Encontrar el valor de cada una de las siguientes ex- presiones o decir si no es una expresión válida: a) 9 – 5 – 3 b) 2 div 3 + 3 / 5 c) 9 div 2 / 5 d) 7 mod 5 mod 3 e) 7 mod (5 mod 3) f) (7 mod 5) mod 3 g) (7 mod 5 mod 3) h) ((12 + 3) div 2) / (8 – (5 + 1)) i) 12 / 2 * 3 j) raiz2 (cuadrado(4) k) cuadrado (raiz2(4)) l) trunc(815) + redondeo(815) Considérese la prioridad del Ejercicio 3.10. 3.12. Se desea calcular independiente la suma de los nú- meros pares e impares comprendidos entre 1 y 200. 3.13. Leer una serie de números distintos de cero (el últi- mo número de la serie es –99) y obtener el número mayor. Como resultado se debe visualizar el número mayor y un mensaje de indicación de número ne- gativo, caso de que se haya leído un número nega- tivo. 3.14. Calcular y visualizar la suma y el producto de los números pares comprendidos entre 20 y 400, ambos inclusive. 3.15. Leer 500 números enteros y obtener cuántos son po- sitivos. 3.16. Se trata de escribir el algoritmo que permita emitir la factura correspondiente a una compra de un artículo determinado, del que se adquieren una o varias unidades. El IVA a aplicar es del 15 por 100 y si el precio bruto (precio venta más IVA) es mayor de 1.000 euros, se debe realizar un descuento del 5 por 100. 3.17. Calcular la suma de los cuadrados de los cien prime- ros números naturales. 3.18. Sumar los números pares del 2 al 100 e imprimir su valor. 3.19. Sumar diez números introducidos por teclado. 3.20. Calcular la media de cincuenta números e imprimir su resultado. 3.21. Calcular los N primeros múltiplos de 4 (4 inclusive), donde N es un valor introducido por teclado. 3.22. Diseñar un diagrama que permita realizar un conta- dor e imprimir los cien primeros números enteros. 3.23. Dados diez números enteros, visualizar la suma de los números pares de la lista, cuántos números pares existen y cuál es la media aritmética de los números impares. 3.24. Calcular la nota media de los alumnos de una clase considerando n-número de alumnos y c-número de notas de cada alumno. 3.25. Escribir la suma de los diez primeros números pares. 3.26. Escribir un algoritmo que lea los datos de entrada de un archivo que sólo contiene números y sume los números positivos. 3.27. Desarrollar un algoritmo que determine en un con- junto de cien números naturales: • ¿Cuántos son menores de 15? • ¿Cuántos son mayores de 50? • ¿Cuántos están comprendidos entre 25 y 45?
  • 157. CAPÍTULO 4 Flujo de control I: Estructuras selectivas 4.1. El flujo de control de un programa 4.2. Estructura secuencial 4.3. Estructuras selectivas 4.4. Alternativa simple (si-entonces/if-then) 4.5. Alternativa múltiple (según_sea, caso de/ case) 4.6. Estructuras de decisión anidadas (en esca- lera) 4.7. La sentencia ir-a (goto) ACTIVIDADES DE PROGRAMACIÓN RESUELTAS CONCEPTOS CLAVE RESUMEN EJERCICIOS En la actualidad, dado el tamaño considerable de las memorias centrales y las altas velocidades de los pro- cesadores —Intel Core 2 Duo, AMD Athlon 64, AMD Turion 64, etc.—, el estilo de escritura de los progra- mas se vuelve una de las características más sobresa- lientes en las técnicas de programación. La legibilidad de los algoritmos y posteriormente de los programas exige que su diseño sea fácil de comprender y su flu- jo lógico fácil de seguir. La programación modular enseña la descomposición de un programa en módu- los más simples de programar, y la programación es- tructurada permite la escritura de programas fáciles de leer y modificar. En un programa estructurado el flujo lógico se gobierna por las estructuras de control básicas: 1. Secuenciales. 2. Repetitivas. 3. Selectivas. En este capítulo se introducen las estructuras selec- tivas que se utilizan para controlar el orden en que se ejecutan las sentencias de un programa. Las sentencias si (en inglés, “if”) y sus variantes, si-entonces, si-entonces-sino y la sentencia según-sea (en inglés, “switch”) se describen como parte fundamen- tal de un programa. Las sentencias si anidadas y las sentencias de multibifurcación pueden ayudar a resol- ver importantes problemas de cálculo. Asimismo se describe la “tristemente famosa” sentencia ir-a (en inglés “goto”), cuyo uso se debe evitar en la mayoría de las situaciones, pero cuyo significado debe ser muy bien entendido por el lector, precisamente para evitar su uso, aunque puede haber una situación específica en que no quede otro remedio que recurrir a ella. El estudio de las estructuras de control se realiza basado en las herramientas de programación ya estu- diadas: diagramas de flujo, diagramas N-S y pseudo- códigos. INTRODUCCIÓN
  • 158. 128 Fundamentos de programación 4.1. EL FLUJO DE CONTROL DE UN PROGRAMA Muchos avances han ocurrido en los fundamentos teóricos de programación desde la aparición de los lenguajes de alto nivel a finales de la década de los cincuenta. Uno de los más importantes avances fue el reconocimiento a fina- les de los sesenta de que cualquier algoritmo, no importaba su complejidad, podía ser construido utilizando combi- naciones de tres estructuras de control de flujo estandarizadas (secuencial, selección, repetitiva o iterativa) y una cuarta denominada, invocación o salto (“jump”). Las sentencias de selección son: si (if) y según-sea (switch); las sentencias de repetición o iterativas son: desde (for), mientras (while), hacer-mientras (do-while) o repetir-hasta que (repeat-until); las sentencias de salto o bifurcación incluyen romper (break), conti- nuar (continue), ir-a (goto), volver (return) y lanzar (throw). El término flujo de control se refiere al orden en que se ejecutan las sentencias del programa. Otros términos utilizados son secuenciación y control del flujo. A menos que se especifique expresamente, el flujo normal de control de todos los programas es el secuencial. Este término significa que las sentencias se ejecutan en secuencia, una des- pués de otra, en el orden en que se sitúan dentro del programa. Las estructuras de selección, repetición e invocación permiten que el flujo secuencial del programa sea modificado en un modo preciso y definido con anterioridad. Como se puede deducir fácilmente, las estructuras de selección se utilizan para seleccionar cuáles sentencias se han de eje- cutar a continuación y las estructuras de repetición (repetitivas o iterativas) se utilizan para repetir un conjunto de sentencias. Hasta este momento, todas las sentencias se ejecutaban secuencialmente en el orden en que estaban escritas en el código fuente. Esta ejecución, como ya se ha comentado, se denomina ejecución secuencial. Un programa basado en ejecución secuencial, siempre ejecutará exactamente las mismas acciones; es incapaz de reaccionar en respuesta a condiciones actuales. Sin embargo, la vida real no es tan simple. Normalmente, los programas necesitan alterar o modificar el flujo de control en un programa. Así, en la solución de muchos problemas se deben tomar acciones di- ferentes dependiendo del valor de los datos. Ejemplos de situaciones simples son: cálculo de una superficie sólo si las medidas de los lados son positivas; la ejecución de una división se realiza, sólo si el divisor no es cero; la visua- lización de mensajes diferentes depende del valor de una nota recibida, etc. Una bifurcación (“branch”, en inglés) es un segmento de programa construida con una sentencia o un grupo de sentencias. Una sentencia de bifurcación se utiliza para ejecutar una sentencia de entre varias o bien bloques de sen- tencias. La elección se realiza dependiendo de una condición dada. Las sentencias de bifurcación se llaman también sentencias de selección o sentencias de alternación o alternativas. 4.2. ESTRUCTURA SECUENCIAL Una estructura secuencial es aquella en la que una acción (instrucción) sigue a otra en secuencia. Las tareas se su- ceden de tal modo que la salida de una es la entrada de la siguiente y así sucesivamente hasta el final del proceso. La estructura secuencial tiene una entrada y una salida. Su representación gráfica se muestra en las Figuras 4.1, 4.2 y 4.3. acción 1 acción 2 acción n Figura 4.1. Estructura secuencial. acción 1 acción 2 . . . . . . . acción n Figura 4.2. Diagrama N-S de una estructura secuencial. inicio acción 1 acción 2 fin Figura 4.3. Pseudocódigo de una estructura secuencial.
  • 159. Flujo de control I: Estructuras selectivas 129 EJEMPLO 4.1 Cálculo de la suma y producto de dos números. La suma S de dos números es S = A+B y el producto P es P = A*B. El pseudocódigo y el diagrama de flujo co- rrespondientes se muestran a continuación: Pseudocódigo inicio leer(A) leer(B) S ← A + B P ← A * B escribir(S, P) fin Diagrama de flujo inicio fin leer A leer B S ← A + B P ← A * B escribir S, P EJEMPLO 4.2 Se trata de calcular el salario neto de un trabajador en función del número de horas trabajadas, precio de la hora de trabajo y, considerando unos descuentos fijos, el sueldo bruto en concepto de impuestos (20 por 100). Pseudocódigo inicio // cálculo salario neto leer(nombre, horas, precio_hora) salario_bruto ← horas * precio_hora impuestos ← 0.20 * salario_bruto salario_neto ← salario_bruto - impuestos escribir(nombre, salario_bruto, salario_neto) fin
  • 160. 130 Fundamentos de programación Diagrama de flujo inicio fin SALARIO_NETO ← SALARIO_BRUTO – IMPUESTOS IMPUESTOS ← 0.20 * SALARIO_BRUTO SALARIO_BRUTO ← HORAS * PRECIO_HORA leer NOMBRE, HORAS PRECIO_HORA escribir NOMBRE, SALARIO BRUTO, SALARIO_NETO Diagrama N-S leer nombre, horas, precio salario_bruto ← horas * precio impuestos ← 0.20 * salario_bruto salario_neto ← salario_bruto - impuestos escribir nombre, salario_bruto, salario_neto 4.3. ESTRUCTURAS SELECTIVAS La especificación formal de algoritmos tiene realmente utilidad cuando el algoritmo requiere una descripción más complicada que una lista sencilla de instrucciones. Este es el caso cuando existen un número de posibles alternativas resultantes de la evaluación de una determinada condición. Las estructuras selectivas se utilizan para tomar decisiones lógicas; de ahí que se suelan denominar también estructuras de decisión o alternativas. En las estructuras selectivas se evalúa una condición y en función del resultado de la misma se realiza una opción u otra. Las condiciones se especifican usando expresiones lógicas. La representación de una estructura selectiva se hace con palabras en pseudocódigo (if, then, else o bien en español si, entonces, si_no), con una figura geométrica en forma de rombo o bien con un triángulo en el interior de una caja rectangular. Las estructuras selec- tivas o alternativas pueden ser: • simples, • dobles, • múltiples.
  • 161. Flujo de control I: Estructuras selectivas 131 La estructura simple es si (if) con dos formatos: Formato Pascal, si-entonces (if-then) y formato C, si (if). La estructura selectiva doble es igual que la estructura simple si a la cual se le añade la cláusula si-no (else). La estructura selectiva múltiple es según_sea (switch en lenguaje C, case en Pascal). 4.4. ALTERNATIVA SIMPLE (SI-ENTONCES/IF-THEN) La estructura alternativa simple si-entonces (en inglés if-then) ejecuta una determinada acción cuando se cum- ple una determinada condición. La selección si-entonces evalúa la condición y • si la condición es verdadera, entonces ejecuta la acción S1 (o acciones caso de ser S1 una acción compuesta y constar de varias acciones), • si la condición es falsa, entonces no hacer nada. Las representaciones gráficas de la estructura condicional simple se muestran en la Figura 4.4. a) acciones condición falsa verdadera b) Pseudocódigo en español si condición entonces acción S1 fin _ si Pseudocódigo en inglés if condición then acción S1 endif c) ¿condición? verdadera falsa acción Pseudocódigo en español //S1 accion compuesta si condición entonces acción S11 acción S12 . . . acción S1n fin _ si Figura 4.4. Estructuras alternativas simples: a) Diagrama de flujo; b) Pseudocódigo; c) Diagrama N-S. Obsérvese que las palabras del pseudocódigo si y fin_si se alinean verticalmente indentando (sangrando) la acción o bloque de acciones. Diagrama de sintaxis Sentencia if_simple::= 1. si (expresión_lógica) 2. si expresión lógica entonces inicio sentencia Sentencia_compuesta fin fin-si Sentencia_compuesta ::= inicio Sentencias fin
  • 162. 132 Fundamentos de programación Sintaxis en lenguajes de programación Pseudocódigo Pascal C/C++ si (condición) entonces acciones fin-si if (condición) then begin sentencias end if (condición) { sentencias } 4.4.1. Alternativa doble (si-entonces-sino/if-then-else) La estructura anterior es muy limitada y normalmente se necesitará una estructura que permita elegir entre dos op- ciones o alternativas posibles, en función del cumplimiento o no de una determinada condición. Si la condición C es verdadera, se ejecuta la acción S1 y, si es falsa, se ejecuta la acción S2 (véase Figura 4.5). Pseudocódigo en español si condicion entonces accion S1 si _ no accion S2 fin _ si Pseudocódigo en inglés if condicion then accion S1 else accion S2 endif Pseudocódigo en español //S1 accion compuesta si condicion entonces accion S11 accion S12 . . . acción S1n si _ no accion S21 accion S22 . . . acción S2n fin _ si a) acción S1 acción S2 ¿condición? b) c) ¿condición? verdadera falsa acción S1 acción S2 Figura 4.5. Estructura alternativa doble: a) diagrama de flujo; b) pseudocódigo; c) diagrama N-S. Obsérvese que en el pseudocódigo las acciones que dependen de entonces y si_no están indentadas en relación con las palabras si y fin_si; este procedimiento aumenta la legibilidad de la estructura y es el medio más idóneo para representar algoritmos.
  • 163. Flujo de control I: Estructuras selectivas 133 EJEMPLO 4.3 Resolución de una ecuación de primer grado. Si la ecuación es ax + b = 0, a y b son los datos, y las posibles soluciones son: • a 0 x = -b/a • a = 0 b 0 entonces solución imposible • a = 0 b = 0 entonces solución indeterminada El algoritmo correspondiente será algoritmo RESOL1 var real : a, b, x inicio leer (a, b) si a 0 entonces x ← –b/a escribir(x) si_no si b 0 entonces escribir ('solución imposible') si_no escribir ('solución indeterminada') fin_si fin_si fin EJEMPLO 4.4 Calcular la media aritmética de una serie de números positivos. La media aritmética de n números es x1 + x2 + x3 + ... + xn n En el problema se supondrá la entrada de datos por el teclado hasta que se introduzca el último número, en nues- tro caso -99. Para calcular la media aritmética se necesita saber cuántos números se han introducido hasta llegar a -99; para ello se utilizará un contador n que llevará la cuenta del número de datos introducidos. Tabla de variables real: s (suma) entera: n (contador de números) real: m (media) algoritmo media var real: s, m entera: n
  • 164. 134 Fundamentos de programación inicio s ← 0 // inicialización de variables : s y n n ← 0 datos: leer (x) // el primer número ha de ser mayor que cero si x 0 entonces ir_a(media) si_no n ← n + 1 s ← s + x ir_a(datos) fin_si media: m ← s/n // media de los números positivos escribir (m) fin En este ejemplo se observa una bifurcación hacia un punto referenciado por una etiqueta alfanumérica denomi- nada media y otro punto referenciado por datos. Trate el alumno de simplificar este algoritmo de modo que sólo contenga un punto de bifurcación. EJEMPLO 4.5 Se desea obtener la nómina semanal —salario neto— de los empleados de una empresa cuyo trabajo se paga por horas y del modo siguiente: • las horas inferiores o iguales a 35 horas (normales) se pagan a una tarifa determinada que se debe introducir por teclado al igual que el número de horas y el nombre del trabajador, • las horas superiores a 35 se pagarán como extras a un promedio de 1,5 horas normales, • los impuestos a deducir a los trabajadores varían en función de su sueldo mensual: — sueldo = 2.000, libre de impuestos, — las siguientes 220 euros al 20 por 100, — el resto, al 30 por 100. Análisis Las operaciones a realizar serán: 1. Inicio. 2. Leer nombre, horas trabajadas, tarifa horaria. 3. Verificar si horas trabajadas = 35, en cuyo caso salario_bruto = horas * tarifa; en caso contrario, salario_bruto = 35 * tarifa + (horas - 35) * tarifa. 4. Cálculo de impuestos si salario_bruto = 2.000, entonces impuestos = 0 si salario_bruto = 2.220 entonces impuestos = (salario_bruto - 2.000) * 0.20 si salario_bruto 2.220 entonces impuestos = (salario_bruto - 2.220) * 0.30 + (220 * 0.20) 5. Cálculo del salario_neto salario_neto = salario_bruto - impuestos. 6. Fin.
  • 165. Flujo de control I: Estructuras selectivas 135 Representación del algoritmo en pseudocódigo algoritmo Nómina var cadena : nombre real : horas, impuestos, sbruto, sneto inicio leer(nombre, horas, tarifa) si horas = 35 entonces sbruto ← horas * tarifa si_no sbruto ← 35 * tarifa + (horas - 35) * 1.5 * tarifa fin_si si sbruto = 2.000 entonces impuestos ← 0 si_no si (sbruto 2.000) y (sbruto = 2.220) entonces impuestos ← (sbruto - 2.000) * 0.20 si_no impuestos ← (220 * 0.20) + (sbruto - 2.220) fin_si fin_si sneto ← sbruto - impuestos escribir(nombre, sbruto, impuestos, neto) fin Representación del algoritmo en diagrama N-S inicio leer nombre, horas, tarifas horas = 35 sí no sbruto ← horas * tarifa sbruto ← 35 * tarifa + (horas-35)* 15 * tarifa sbruto = 2.000 sí no sí no sbruto 2.000 y sbruto = 2.220 impuestos ← (sbruto-2.000) * 0.20 impuestos ← 220 * 0.20 + (sbruto-2.220) * 0.30 sneto ← sbruto - impuestos escribir nombre, sbruto, impuestos, sneto fin impuestos ← 0
  • 166. 136 Fundamentos de programación Representación del algoritmo en diagrama de flujo inicio HORAS = 35 SBRUTO = 2.000 leer NOMBRE, HORAS, TARIFA SBRUTO = 2.220 SBRUTO ← HORAS * TARIFA SBRUTO ← 35 * TARIFA + (HORAS-35) * 1.5 * TARIFA IMPUESTOS ← 0 SNETO ← SBRUTO-IMPUESTOS) IMPUESTOS ← 220 * 0.20 + (SBRUTO – 2.220) * 0.30 IMPUESTOS ← (SBRUTO – 2.000) * 0,20 escribir NOMBRE, SBRUTO, IMPUESTOS, SNETO fin sí no sí no sí no EJEMPLOS 4.6 Empleo de estructura selectiva para detectar si un número tiene o no parte fraccionaria. algoritmo Parte_fraccionaria var real : n inicio escribir('Deme numero ') leer(n) si n = trunc(n) entonces escribir('El numero no tiene parte fraccionaria') si_no escribir('Numero con parte fraccionaria') fin_si fin EJEMPLOS 4.7 Estructura selectiva para averiguar si un año leído de teclado es o no bisiesto. algoritmo Bisiesto var
  • 167. Flujo de control I: Estructuras selectivas 137 entero : año inicio leer(año) si (año MOD 4 = 0) y (año MOD 100 0) 0 (año MOD 400 = 0) entonces escribir('El año ', año, ' es bisiesto') si_no escribir('El año ', año, ' no bisiesto') fin_si fin EJEMPLOS 4.8 Algoritmo que nos calcule el área de un triángulo conociendo sus lados. La estructura selectiva se utiliza para el control de la entrada de datos en el programa. Nota: Area = √p.(p – a) ∙ (p – b) ∙ (p – c) p = (a + b + c)/2 algoritmo Area_triangulo var real : a,b,c,p,area inicio escribir('Deme los lados ') leer(a,b,c) p ← (a + b + c) / 2 si (p a) y (p b) y (p c) entonces area ← raiz2(p * (p - a) * (p - b) * (p - c)) escribir(area) si_no escribir('No es un triangulo') fin_si fin 4.5. ALTERNATIVA MÚLTIPLE (según_sea, caso de/case) Con frecuencia —en la práctica— es necesario que existan más de dos elecciones posibles (por ejemplo, en la reso- lución de la ecuación de segundo grado existen tres posibles alternativas o caminos a seguir, según que el discrimi- nante sea negativo, nulo o positivo). Este problema, como se verá más adelante, se podría resolver por estructuras alternativas simples o dobles, anidadas o en cascada; sin embargo, este método si el número de alternativas es gran- de puede plantear serios problemas de escritura del algoritmo y naturalmente de legibilidad. La estructura de decisión múltiple evaluará una expresión que podrá tomar n valores distintos, 1, 2, 3, 4, ..., n. Según que elija uno de estos valores en la condición, se realizará una de las n acciones, o lo que es igual, el flujo del algoritmo seguirá un determinado camino entre los n posibles. Los diferentes modelos de pseudocódigo de la estructura de decisión múltiple se representan en las Figuras 4.6 y 4.7. Sentencia switch (C , C++, Java, C#) switch (expresión) { case valor1: sentencia1; sentencia2; sentencia3;
  • 168. 138 Fundamentos de programación Modelo 1: según_sea expresion (E) hacer e1: accion S11 accion S12 . . accion S1a e2: accion S21 accion S22 . . accion S2b . . en: accion S31 accion S32 . . accion S3p si-no accion Sx fin_según Modelo 2 (simplificado): según E hacer . . . fin_según Modelo 3 (simplificado): opción E de . . fin_opción Modelo 4 (simplificado): caso_de E hacer . . . fin_caso Modelo 5 (simplificado): si E es n hacer . . . fin_si Figura 4.6. Estructuras de decisión múltiple. Modelo 6: según_sea (expresión) hacer caso expresión constante : [Sentencia sentencia ... sentencia de ruptura | sentencia ir_a ] caso expresión constante : [Sentencia sentencia ... sentencia de ruptura | sentencia ir_a ] caso expresión constante : [Sentencia ... sentencia sentencia de ruptura | sentencia ir_a ] [otros: [Sentencia ... sentencia sentencia de ruptura | sentencia ir_a ] fin_según Figura 4.7. Sintaxis de sentencia según_sea.
  • 169. Flujo de control I: Estructuras selectivas 139 Diagrama de flujo acción S1 acción S2 acción S3 acción S4 .......... acción Sn condición 1 2 3 4 n Diagrama N-S condición otros n n = 1 2 3 S2 S3 S1 Sn Sx condición S2 S3 S1 Sn Sx Modelo 2 Modelo 1 Pseudocódigo En inglés la estructura de decisión múltiple se representa: case expresión of case expresión of [e1]: acción S1 [e1]: acción S1 . . break; case valor2: sentencia1; sentencia2; sentencia3; . . break; . . default: sentencia1; sentencia2; sentencia3; . . } // fin de la sentencia compuesta
  • 170. 140 Fundamentos de programación [e2]: acción S2 [e2]: acción S2 . . [en]: acción Sn [en]: acción Sn otherwise else acción Sx acción Sx end_case end_case Como se ha visto, la estructura de decisión múltiple en pseudocódigo se puede representar de diversas formas, pudiendo ser las acciones S1, S2, etc., simples como en el caso anterior o compuestas y su funcionalidad varía algo de unos lenguajes a otros. Notas 1. Obsérvese que para cada valor de la expresión (e) se pueden ejecutar una o varias acciones. Algunos lenguajes como Pascal a estas instrucciones les denominan compuestas y las delimitan con las palabras reservadas begin-end (inicio-fin); es decir, en pseudocódigo. según_sea E hacer e1: acción S1 e2: acción S2 . . en: acción Sn otros: acción Sx fin_según o bien en el caso de instrucciones compuestas según_sea E hacer e1: inicio acción S11 acción S12 . . acción S1a fin e2: inicio acción S21 . . . fin en: inicio . . . fin si-no acción Sx fin_según 2. Los valores que toman las expresiones (E) no tienen por qué ser consecutivos ni únicos; se pueden con- siderar rangos de constantes numéricas o de caracteres como valores de la expresión E. caso_de E hacer 2, 4, 6, 8, 10: escribir ('números pares') 1, 3, 5, 7, 9: escribir ('números impares') fin_caso
  • 171. Flujo de control I: Estructuras selectivas 141 ¿Cuál de los modelos expuestos se puede considerar representativo? En realidad, como el pseudocódigo es un lenguaje algorítmico universal, cualquiera de los modelos se podría ajustar a su presentación; sin embargo, nosotros consideramos como más estándar los modelos 1, 2 y 4. En esta obra seguiremos normalmente el modelo 1, aunque en ocasiones, y para familiarizar al lector en su uso, podremos utilizar los modelos citados 2 y 4. Los lenguajes como C y sus derivados C++, Java o C# utilizan como sentencia selectiva múltiple la sentencia switch, cuyo formato es muy parecido al modelo 6. EJEMPLO 4.9 Se desea diseñar un algoritmo que escriba los nombres de los días de la semana en función del valor de una varia- ble DIA introducida por teclado. Los días de la semana son 7; por consiguiente, el rango de valores de DIA será 1 .. 7, y caso de que DIA tome un valor fuera de este rango se deberá producir un mensaje de error advirtiendo la situación anómala. algoritmo DiasSemana var entero: DIA inicio leer(DIA) según_sea DIA hacer 1: escribir('LUNES') 2: escribir('MARTES') 3: escribir('MIERCOLES') 4: escribir('JUEVES') 5: escribir('VIERNES') 6: escribir('SABADO') 7: escribir('DOMINGO') sí-no escribir('ERROR') fin_según fin EJEMPLO 4.10 Se desea convertir las calificaciones alfabéticas A, B, C, D, E y F a calificaciones numéricas 4, 5, 6, 7, 8 y 9 res- pectivamente. Los valores de A, B, C, D, E y F se representarán por la variable LETRA, el algoritmo de resolución del proble- ma es: algoritmo Calificaciones var carácter: LETRA entero: calificación inicio leer(LETRA) según_sea LETRA hacer 'A': calificación ← 4 'B': calificación ← 5 'C': calificación ← 6 'D': calificación ← 7 'E': calificación ← 8 'F': calificación ← 9
  • 172. 142 Fundamentos de programación otros: escribir ('ERROR') fin_según fin Como se ve en el pseudocódigo, no se contemplan otras posibles calificaciones —por ejemplo, 0, resto notas numéricas—; si así fuese, habría que modificarlo en el siguiente sentido: según_sea LETRA hacer 'A': calificación ← 4 'B': calificación ← 5 'C': calificación ← 6 'D': calificación ← 7 'E': calificación ← 8 'F': calificación ← 9 otros: calificación ← 0 fin_según EJEMPLO 4.11 Se desea leer por teclado un número comprendido entre 1 y 10 (inclusive) y se desea visualizar si el número es par o impar. En primer lugar, se deberá detectar si el número está comprendido en el rango válido (1 a 10) y a continuación si el número es 1, 3, 5, 7, 9, escribir un mensaje de “impar”; si es 2, 4, 6, 8, 10, escribir un mensaje de “par”. algoritmo PAR_IMPAR var entero: numero inicio leer(numero) si numero = 1 y numero = 10 entonces según_sea numero hacer 1, 3, 5, 7, 9: escribir ('impar') 2, 4, 6, 8, 10: escribir ('par') fin_según fin_si fin EJEMPLO 4.12 Leída una fecha, decir el día de la semana, suponiendo que el día 1 de dicho mes fue lunes. algoritmo Día_semana var entero : dia inicio escribir('Diga el día ') leer(dia) según_sea dia MOD 7 hacer 1: escribir('Lunes') 2: escribir('Martes')
  • 173. Flujo de control I: Estructuras selectivas 143 3: escribir('Miercoles') 4: escribir('Jueves') 5: escribir('Viernes') 6: escribir('Sabado') 0: escribir('Domingo') fin_según fin EJEMPLO 4.13 Preguntar qué día de la semana fue el día 1 del mes actual y calcular que día de la semana es hoy. algoritmo Dia_semana_modificado var entero : dia,d1 carácter : dia1 inicio escribir('El dia 1 fue (L,M,X,J,V,S,D) ') leer( dia1) según_sea dia1 hacer 'L': d1← 0 'M': d1← 1 'X': d1← 2 'J': d1← 3 'V': d1← 4 'S': d1← 5 'D': d1← 6 si_no d1← -40 fin_según escribir('Diga el dia ') leer( dia) dia ← dia + d1 según_sea dia MOD 7 hacer 1: escribir('Lunes') 2: escribir('Martes') 3: escribir('Miercoles')
  • 174. 144 Fundamentos de programación 4: escribir('Jueves') 5: escribir('Viernes') 6: escribir('Sabado') 0: escribir('Domingo') fin_según fin EJEMPLO 4.14 Algoritmo que nos indique si un número entero, leído de teclado, tiene 1, 2, 3 o más de 3 dígitos. Considerar los negativos. Se puede observar que la estructura según_sea expresion hacer son varios si expr.logica en- tonces ... anidados en la rama si_no. Si se cumple el primero ya no pasa por los demás. algoritmo Digitos var entero : n inicio leer(n) según_sea n hacer -9 .. 9: escribir('Tiene 1 digito') -99 .. 99: escribir('Tiene 2') -999 .. 999: escribir('Tiene tres') si_no escribir('Tiene mas de tres') fin_según fin 4.6. ESTRUCTURAS DE DECISIÓN ANIDADAS (EN ESCALERA) Las estructuras de selección si-entonces y si-entonces-si_no implican la selección de una de dos alternativas. Es posible también utilizar la instrucción si para diseñar estructuras de selección que contengan más de dos alterna- tivas. Por ejemplo, una estructura si-entonces puede contener otra estructura si-entonces, y esta estructura si- entonces puede contener otra, y así sucesivamente cualquier número de veces; a su vez, dentro de cada estructura pueden existir diferentes acciones. si condicion1 entonces escribir 'hola Mortimer' . . . si condicion2 entonces
  • 175. Flujo de control I: Estructuras selectivas 145 Las estructuras si interiores a otras estructuras si se denominan anidadas o encajadas: si condicion1 entonces si condicion2 entonces . . . acciones fin_si fin_si Una estructura de selección de n alternativas o de decisión múltiple puede ser construida utilizando una estruc- tura si con este formato: si condicion1 entonces acciones si_no si condicion2 entonces acciones si_no si condicion3 entonces acciones si_no . . . fin_si fin_si fin_si Una estructura selectiva múltiple constará de una serie de estructuras si, unas interiores a otras. Como las es- tructuras si pueden volverse bastante complejas para que el algoritmo sea claro, será preciso utilizar indentación (sangría o sangrado), de modo que exista una correspondencia entre las palabras reservadas si y fin_si, por un lado, y entonces y si_no, por otro. La escritura de las estructuras puede variar de unos lenguajes a otros, por ejemplo, una estructura si admite tam- bién los siguientes formatos: si expresion booleana1 entonces acciones si_no si expresion booleana2 entonces acciones si_no si expresion booleana3 entonces acciones si_no acciones fin_si fin_si fin_si o bien si expresion booleana1 entonces acciones
  • 176. 146 Fundamentos de programación si_no si expresion booleana2 entonces acciones fin_si . . . fin_si EJEMPLO 4.15 Diseñar un algoritmo que lea tres números A, B, C y visualice en pantalla el valor del más grande. Se supone que los tres valores son diferentes. Los tres números son A, B y C; para calcular el más grande se realizarán comparaciones sucesivas por parejas. algoritmo Mayor var real: A, B, C, Mayor inicio leer(A, B, C) si A B entonces si A C entonces Mayor ← A //A B, A C si_no Mayor ← C //C = A B fin_si si_no si B C entonces Mayor ← B //B = A, B C si_no Mayor ← C //C = B = A fin_si fin_si escribir('Mayor:', Mayor) fin EJEMPLO 4.16 El siguiente algoritmo lee tres números diferentes, A, B, C, e imprime los valores máximo y mínimo. El procedimien- to consistirá en comparaciones sucesivas de parejas de números. algoritmo Ordenar var real : a,b,c inicio escribir('Deme 3 numeros') leer(a, b, c) si a b entonces // consideramos los dos primeros (a, b) // y los ordenamos si b c entonces // tomo el 3o (c) y lo comparo con el menor // (a o b) escribir(a, b, c) si-no // si el 3o es mayor que el menor averiguo si si c a entonces // va delante o detras del mayor escribir(c, a, b)
  • 177. Flujo de control I: Estructuras selectivas 147 si_no escribir(a, c, b) fin_si fin_si si_no si a c entonces escribir(b, a, c) si_no si c b entonces escribir(c, b, a) si_no escribir(b, c, a) fin_si fin_si fin_si fin EJEMPLO 4.17 Pseudocódigo que nos permita calcular las soluciones de una ecuación de segundo grado, incluyendo los valores imaginarios. algoritmo Soluciones_ecuacion var real : a,b,c,d,x1,x2,r,i inicio escribir('Deme los coeficientes') leer(a, b, c) si a = 0 entonces escribir('No es ecuacion de segundo grado') si_no d ← b * b - 4 * a * c si d = 0 entonces x1 ← -b / (2 * a) x2 ← x1 escribir(x1, x2) si_no si d 0 entonces x1 ← (-b + raiz2(d)) / (2 * a) x2 ← (-b - raiz2(d)) / (2 * a) escribir(x1, x2) si_no r ← (-b) / (2 * a) i ← raiz2(abs(d)) / (2 * a) escribir(r, '+', i, 'i') escribir(r, '-', i, 'i') fin_si fin_si fin_si fin
  • 178. 148 Fundamentos de programación EJEMPLO 4.18 Algoritmo al que le damos la hora HH, MM, SS y nos calcule la hora dentro de un segundo. Leeremos las horas mi- nutos y segundos como números enteros. algoritmo Hora_segundo_siguiente var entero : hh, mm, ss inicio escribir('Deme hh,mm,ss') leer(hh, mm, ss) si (hh 24) y (mm 60) y (ss 60) entonces ss ← ss + 1 si ss = 60 entonces ss ← 0 mm ← mm + 1 si mm = 60 entonces mm ← 0 hh ← hh + 1 si hh = 24 entonces hh ← 0 fin_si fin_si fin_si escribir(hh, ':', mm, ':', ss) fin_si fin 4.7. LA SENTENCIA ir-a (goto) El flujo de control de un algoritmo es siempre secuencial, excepto cuando las estructuras de control estudiadas ante- riormente realizan transferencias de control no secuenciales. La programación estructurada permite realizar programas fáciles y legibles utilizando las tres estructuras ya co- nocidas: secuenciales, selectivas y repetitivas. Sin embargo, en ocasiones es necesario realizar bifurcaciones incon- dicionales; para ello se recurre a la instrucción ir_a (goto). Esta instrucción siempre ha sido problemática y pres- tigiosos informáticos, como Dijkstra, han tachado la instrucción goto como nefasta y perjudicial para los programadores y recomiendan no utilizarla en sus algoritmos y programas. Por ello, la mayoría de los lenguajes de programación, desde el mítico Pascal —padre de la programación estructurada— pasando por los lenguajes más uti- lizados en los últimos años y en la actualidad como C, C++, Java o C#, huyen de esta instrucción y prácticamente no la utilizan nunca, aunque eso sí, mantienen en su juego de sentencias esta “dañina” sentencia por si en situaciones excepcionales es necesario recurrir a ella. La sentencia ir_a (goto) es la forma de control más primitiva en los programas de computadoras y correspon- de a una bifurcación incondicional en código máquina. Aunque lenguajes modernos como VB .NET (Visual Basic .NET) y C# están en su juego de instrucciones, prácticamente no se utiliza. Otros lenguajes modernos como Java no contienen la sentencia goto, aunque sí es una palabra reservada. Aunque la instrucción ir_a (goto) la tienen todos los lenguajes de programación en su juego de instrucciones, existen algunos que dependen más de ellas que otros, como BASIC y FORTRAN. En general, no existe ninguna necesidad de utilizar instrucciones ir_a. Cualquier algoritmo o programa que se escriba con instrucciones ir_a se puede reescribir para hacer lo mismo y no incluir ninguna instrucción ir_a. Un programa que utiliza muchas ins- trucciones ir_a es más difícil de leer que un programa bien escrito que utiliza pocas o ninguna instrucción ir_a.
  • 179. Flujo de control I: Estructuras selectivas 149 En muy pocas situaciones las instrucciones ir_a son útiles; tal vez, las únicas razonables son diferentes tipos de situaciones de salida de bucles. Cuando un error u otra condición de terminación se encuentra, una instrucción ir_a puede ser utilizada para saltar directamente al final de un bucle, subprograma o un procedimiento completo. Las bifurcaciones o saltos producidos por una instrucción ir_a deben realizarse a instrucciones que estén nume- radas o posean una etiqueta que sirva de punto de referencia para el salto. Por ejemplo, un programa puede ser dise- ñado para terminar con una detección de un error. algoritmo error . . . si condicion error entonces ir_a(100) fin_si 100: fin La sentencia ir-a (goto) o sentencia de invocación directa transfiere el control del programa a una posición especificada por el programador. En consecuencia, interfiere con la ejecución secuencial de un programa. La senten- cia ir-a tiene una historia muy controvertida y a la que se ha hecho merecedora por las malas prácticas de enseñan- za que ha producido. Uno de los primeros lenguajes que incluyó esta construcción del lenguaje en sus primeras versiones fue FORTRAN. Sin embargo, en la década de los sesenta y setenta, y posteriormente con la aparición de unos lenguajes más sencillos y populares por aquella época, BASIC, la historia negra siguió corriendo, aunque lle- garon a existir teorías a favor y en contra de su uso y fue tema de debate en foros científicos, de investigación y profesionales. La historia ha demostrado que no se debe utilizar, ya que produce un código no claro y produce mu- chos errores de programación que a su vez produce programas poco legibles y muy difíciles de mantener. Sin embargo, la historia continúa y uno de los lenguajes más jovenes, de propósito general, como C# creado por Microsoft en el año 2000 incluye esta sentencia entre su diccionario de sentencias y palabras reservadas. Como regla general es un elemento superfluo del lenguaje y sólo en muy contadas ocasiones, precisamente con la sentencia switch en algunas aplicaciones muy concretas podría tener alguna utilidad práctica. Como regla general, es interesante que sepa cómo funciona esta sentencia, pero no la utilice nunca a menos que le sirva en un momento determinado para resolver una situación no prevista y que un salto prefijado le ayude en esa resolución. La sintaxis de la sentencia ir_a tiene tres variantes: ir_a etiqueta (goto etiqueta) ir_a caso (goto case, en la sentencia switch) ir_a otros (goto default, en la sentencia switch) La construcción ir_a etiqueta consta de una sentencia ir_a y una sentencia asociada con una etiqueta. Cuando se ejecuta una sentencia ir_a, se transfiere el control del programa a la etiqueta asociada, como se ilustra en el si- guiente recuadro. … inicio … ir_a etiqueta1 … fin … etiqueta1: … // el flujo del programa salta a la sentencia siguiente // a la rotulada por etiqueta1
  • 180. 150 Fundamentos de programación Normalmente, en el caso de soportar la sentencia ir_a como es el caso del lenguaje C#, la sentencia ir_a (goto) transfiere el control fuera de un ámbito anidado, no dentro de un ámbito anidado. Por consiguiente, la sentencia si- guiente no es válida. inicio ir_a etiquetaC … inicio …. etiquetaC … fin … fin No válido: transferencia de control dentro de un ámbito anidado Sin embargo, sí se suele aceptar por el compilador (en concreto C#) el siguiente código: inicio … inicio …. ir_a etiquetaC … fin etiquetaC … fin La sentencia ir_a pertenece a un grupo de sentencias conocidas como sentencias de salto (jump). Las sentencias de salto hacen que el flujo de control salte a otra parte del programa. Otras sentencias de salto o bifurcación que se encuentran en los lenguajes de programación, tanto tradicionales como nuevos (Pascal, C, C++, C#, Java...) son interrumpir (break), continuar (continue), volver (return) y lanzar (throw). Las tres primeras se sue- len utilizar con sentencias de control y como retorno de ejecución de funciones o métodos. La sentencia throw se suele utilizar en los lenguajes de programación que poseen mecanismos de manipulación de excepciones, como sue- len ser los casos de los lenguajes orientados a objetos tales como C++, Java y C#.
  • 181. Flujo de control I: Estructuras selectivas 151 ACTIVIDADES DE PROGRAMACIÓN RESUELTAS 4.1. Leer dos números y deducir si están en orden creciente. Solución Dos números a y b están en orden creciente si a = b. algoritmo comparacion1 var real : a, b inicio escribir('dar dos numeros') leer(a, b) si a = b entonces escribir('orden creciente') si_no escribir('orden decreciente') fin_si fin 4.2. Determinar el precio del billete de ida y vuelta en avión, conociendo la distancia a recorrer y sabiendo que si el número de días de estancia es superior a 7 y la distancia superior a 800 km el billete tiene una reducción del 30 por 100. El precio por km es de 2,5 euros. Solución Análisis Las operaciones secuenciales a realizar son: 1. Leer distancia, duración de la estancia y precio del kilómetro. 2. Comprobar si distancia 800 km. y duración 7 días. 3. Cálculo del precio total del billete: precio total = distancia * 2.5 • si distancia 800 km. y duración 7 días precio total = (distancia*2.5) - 30/100 * (precio total). Pseudocódigo algoritmo billete var entero : E real : D, PT inicio leer(E) PT ← 2.5*D si (D 800) y (E 7) entonces PT ← PT - PT * 30/100 fin_si escribir('Precio del billete', PT) fin 4.3. Los empleados de una fábrica trabajan en dos turnos: diurno y nocturno. Se desea calcular el jornal diario de acuer- do con los siguientes puntos: 1. la tarifa de las horas diurnas es de 5 euros, 2. la tarifa de las horas nocturnas es de 8 euros, 3. caso de ser domingo, la tarifa se incrementará en 2 euros el turno diurno y 3 euros el turno nocturno.
  • 182. 152 Fundamentos de programación Solución Análisis El procedimiento a seguir es: 1. Leer nombre del turno, horas trabajadas (HT) y día de la semana. 2. Si el turno es nocturno, aplicar la fórmula JORNAL = 8*HT. 3. Si el turno es diurno, aplicar la fórmula JORNAL = 5*HT. 4. Si el día es domingo: • turno diurno JORNAL = (5 + 2)* ht, • turno nocturno JORNAL = (8 + 3)* HT. Pseudocódigo algoritmo jornal var cadena : Dia, Turno real : HT, Jornal inicio leer(HT, Dia, Turno) si Dia 'Domingo' entonces si Turno = 'diurno' entonces Jornal ← 5 * HT si_no Jornal ← 8 * HT fin_si si_no si Turno = 'diurno' entonces Jornal ← 7 * HT si_no Jornal ← 11 * HT fin_si fin_si escribir(Jornal) fin 4.4. Construir un algoritmo que escriba los nombres de los días de la semana, en función de la entrada correspondiente a la variable DIA. Solución Análisis El método a seguir consistirá en clasificar cada día de la semana con un número de orden: 1. LUNES 2. MARTES 3. MIERCOLES 4. JUEVES 5. VIERNES 6. SABADO 7. DOMINGO si Dia 7 y 1 error de entrada. rango (1 a 7). si el lenguaje de programación soporta sólo la estructura si-entonces-si_no (if-then-else), se codifica con el método 1; caso de soportar la estructura según_sea (case), la codificación será el método 2.
  • 183. Flujo de control I: Estructuras selectivas 153 Pseudocódigo Método 1 algoritmo Dias_semana1 var entero : Dia inicio leer(Dia) si Dia = 1 entonces escribir('LUNES') si_no si Dia = 2 entonces escribir('MARTES') si_no si Dia = 3 entonces escribir('MIERCOLES') si_no si Dia = 4 entonces escribir('JUEVES') si_no si Dia = 5 entonces escribir('VIERNES') si_no si Dia = 6 entonces escribir('SABADO') si_no si Dia = 7 entonces escribir('DOMINGO') si_no escribir('error') escribir('rango 1-7') fin_si fin_si fin_si fin_si fin_si fin_si fin_si fin Método 2 algoritmo Dias_semana2 var entero : Dia inicio leer(Dia) segun_sea Dia hacer 1: escribir('LUNES') 2: escribir('MARTES') 3: escribir('MIERCOLES') 4: escribir('JUEVES') 5: escribir('VIERNES') 6: escribir('SABADO') 7: escribir('DOMINGO') en_otro_caso escribir('error de entrada, rango 1-7') fin_según fin
  • 184. 154 Fundamentos de programación CONCEPTOS CLAVE • Ámbito. • Claúsula else. • Condición. • Condición falsa. • Condición verdadera. • Expresión booleana. • Expresión lógica. • Operador de comparación. • Operador de relación. • Operador lógico. • Sentencia compuesta. • Sentencia if, switch. • Sentencia según-sea. • Sentencia si-entonces. • Sentencia si-entonces-sino. • Si anidada. • Si en escalera. RESUMEN Las estructuras de selección si y según_sea son sentencias de bifurcación que se ejecutan en función de sus elementos relacionados en las expresiones o condiciones correspondien- tes que se forman con operadores lógicos y de comparación. Estas sentencias permiten escribir algoritmos que realizan to- mas de decisiones y reaccionan de modos diferentes a datos diferentes. 1. Una sentencia de bifurcación es una construcción del lenguaje que utiliza una condición dada (ex- presión booleana) para decidir entre dos o más direcciones alternativas (ramas o bifurcaciones) a seguir en un algoritmo. 2. Un programa sin ninguna sentencia de bifurcación o iteración se ejecuta secuencialmente, en el orden en que están escritas las sentencias en el código fuente o algoritmo. Estas sentencias se denominan secuenciales. 3. La sentencia si es la sentencia de decisión o selec- tiva fundamental. Contiene una expresión booleana que controla si se ejecuta una sentencia (simple o compuesta). 4. Combinando una sentencia si con una cláusula sino, el algoritmo puede elegir entre la ejecución de una o dos acciones alternativas (simple o com- puesta). 5. Las expresiones relacionales, también denominadas condiciones simples, se utilizan para comparar ope- randos. Si una expresión relacional es verdadera, el valor de la expresión se considera en los lenguajes de programación el entero 1. Si la expresión rela- cional es falsa, entonces toma el valor entero de 0. 6. Se pueden construir condiciones complejas utili- zando expresiones relacionales mediante los ope- radores lógicos, Y, O, NO. 7. Una sentencia si-entonces se utiliza para selec- cionar entre dos sentencias alternativas basadas en el valor de una expresión. Aunque las expresiones relacionales se utilizan normalmente para la ex- presión a comprobar, se puede utilizar cualquier expresión válida. Si la expresión (condición) es verdadera se ejecuta la sentencia1 y en caso con- trario se ejecuta la sentencia2 si (expresión) entonces sentencia1 sino sentencia2 fin_si 8. Una sentencia compuesta consta de cualquier nú- mero de sentencias individuales encerradas dentro de las palabras reservadas inicio y fin (en el caso de lenguajes de programación como C y C++, entre una pareja de llaves “{ y }”). Las sentencias compuestas se tratan como si fuesen una única unidad y se pueden utilizar en cualquier parte en que se utilice una sentencia simple. 9. Anidando sentencias si, unas dentro de otras, se pueden diseñar construcciones que pueden elegir entre ejecutar cualquier número de acciones (sen- tencias) diferentes (simples o compuestas). 10. La sentencia según_sea es una sentencia de se- lección múltiple. El formato general de una sen- tencia según_sea (switch, en inglés) es según_sea E hacer e1: inicio acción S11 acción S12 . . acción S1a fin e2: inicio acción S21 . . . fin en: inicio . . . fin otros: acción Sx fin_según
  • 185. Flujo de control I: Estructuras selectivas 155 El valor de la expresión entera se compara con cada una de las constantes enteras (también pueden ser carácter o expresiones constantes). La ejecución del programa se transfiere a la prime- ra sentencia compuesta cuya etiqueta precedente (valor e1, e2,--) coincida con el valor de esa expresión y continúa su ejecución hasta la última sentencia de ese bloque, y a continuación termina la sentencia según_sea. En caso de que el valor de la expresión no coincida con ningún valor de la lista, entonces se realizan las sentencias que vienen a continuación de la cláusula otros. 11. La sentencia ir_a (goto) transfiere el control (salta) a otra parte del programa y, por consiguien- te, pertenece al grupo de sentencias denominadas de salto o bifurcación. Es una sentencia muy controvertida y propensa a errores, por lo que su uso es muy reducido, por no decir nunca, y sólo se recomienda en una sentencia según_sea para salir del correspondiente bloque de sentencias. 12. La sentencia según_sea (switch) es una sen- tencia construida a medida de los requisitos del programador para seleccionar múltiples sentencias (simples o compuestas) y es similar a múltiples sentencias si-entonces anidadas pero con un rango de aplicaciones más restringido. Normal- mente, es más recomendable usar sentencias se- gún_sea que sentencias si-entonces anidadas porque ofrecen un código más simple, más claro y más eficiente. EJERCICIOS 4.1. Escribir las sentencias si apropiadas para cada una de las siguientes condiciones: a) Si un ángulo es igual a 90 grados, imprimir el mensaje El ángulo es un ángulo recto sino imprimir el mensaje El ángulo no es un ángulo recto. b) Si la temperatura es superior a 100 grados, visua- lizar el mensaje “por encima del punto de ebulli- ción del agua” sino visualizar el mensaje “por debajo del punto de ebullición del agua”. c) Si el número es positivo, sumar el número a total de positivos, sino sumar al total de negativos. d) Si x es mayor que y, y z es menor que 20, leer un valor para p. e) Si distancia es mayor que 20 y menos que 35, leer un valor para tiempo. 4.2. Escribir un programa que solicite al usuario introducir dos números. Si el primer número introducido es ma- yor que el segundo número, el programa debe impri- mir el mensaje El primer número es el mayor, en caso contrario el programa debe imprimir el men- saje El primer número es el más pequeño. Considerar el caso de que ambos números sean igua- les e imprimir el correspondiente mensaje. 4.3. Dados tres números deducir cuál es el central. 4.4. Calcular la raíz cuadrada de un número y escribir su resultado. Considerando el caso en que el número sea negativo. 4.5. Escribir los diferentes métodos para deducir si una variable o expresión numérica es par. 4.6. Diseñar un programa en el que a partir de una fecha introducida por teclado con el formato DIA, MES, AÑO se obtenga la fecha del día siguiente. 4.7. Se desea realizar una estadística de los pesos de los alumnos de un colegio de acuerdo a la siguiente tabla: Alumnos de menos de 40 kg. Alumnos entre 40 y 50 kg. Alumnos de más de 50 kg y menos de 60 kg. Alumnos de más o igual a 60 kg. 4.8. Realizar un algoritmo que averigüe si dados dos núme- ros introducidos por teclado uno es divisor del otro. 4.9. Un ángulo se considera agudo si es menor de 90 grados, obtuso si es mayor de 90 grados y recto si es igual a 90 grados. Utilizando esta información, escribir un algoritmo que acepte un ángulo en grados y visualice el tipo de ángulo correspondiente a los grados introducidos. 4.10. El sistema de calificación americano (de Estados Unidos) se suele calcular de acuerdo al siguiente cuadro: Grado numérico Grado en letra Grado mayor o igual a 90 Menor de 90 pero mayor o igual a 80 Menor de 80 pero mayor o igual a 70 Menor de 70 pero mayor o igual a 69 Menor de 69 A B C D F
  • 186. 156 Fundamentos de programación Utilizando esta información, escribir un algo- ritmo que acepte una calificación numérica del es- tudiante (0-100), convierta esta calificación a su equivalente en letra y visualice la calificación corres- pondiente en letra. 4.11. Escribir un programa que seleccione la operación aritmética a ejecutar entre dos números dependiendo del valor de una variable denominada selec- cionOp. 4.12. Escribir un programa que acepte dos números reales de un usuario y un código de selección. Si el código introducido de selección es 1, entonces el programa suma los dos números introducidos previamente y se visualiza el resultado; si el código de selección es 2, los números deben ser multiplicados y visualizado el resultado; y si el código seleccionado es 3, el pri- mer número se debe dividir por el segundo número y visualizarse el resultado. 4.13. Escribir un algoritmo que visualice el siguiente do- ble mensaje Introduzca un mes (1 para Enero, 2 para Febrero,…) Introduzca un día del mes El algoritmo acepta y almacena un número en la variable mes en respuesta a la primera pregunta y acepta y almacena un número en la variable dia en respuesta a la segunda pregunta. Si el mes introducido no está entre 1 y 12 inclusive, se debe visualizar un mensaje de información al usuario advirtiéndole de que el número introducido no es válido como mes; de igual forma se procede con el número que representa el día del mes si no está en el rango entre 1 y 31. Modifique el algoritmo para prever que el usua- rio introduzca números con decimales. Nota: como los años bisiestos, febrero tiene 29 días, modifique el programa de modo que advierta al usuario si introduce un día de mes que no existe (por ejemplo, 30 o 31). Considere también el hecho de que hay meses de 30 días y otros meses de 31 días, de modo que nunca se produzca error de introducción de datos o que en su defecto se visualice un mensaje al usuario advirtiéndole del error cometido. 4.14. Escriba un programa que simule el funcionamiento normal de un ascensor (elevador) moderno con 25 pisos (niveles) y que posee dos botones de SUBIR y BAJAR, excepto en el piso (nivel) inferior, que sólo existe botón de llamada para SUBIR y en el último piso (nivel) que sólo existe botón de BAJAR.
  • 187. CAPÍTULO 5 Flujo de control II: Estructuras repetitivas 5.1. Estructuras repetitivas 5.2. Estructura mientras (while) 5.3. Estructura hacer-mientras (do-while) 5.4. Diferencias entre mientras (while) y hacer- mientras (do-while): una aplicación en C++ 5.5. Estructura repetir (repeat) 5.6. Estructura desde/para (for) 5.7. Salidas internas de los bucles 5.8. Sentencias de salto interrumpir (break) y continuar (continue) 5.9. Comparación de bucles while, for y do- while: una aplicación en C++ 5.10. Diseño de bucles (lazos) 5.11. Estructuras repetitivas anidadas ACTIVIDADES DE PROGRAMACIÓN RESUELTAS CONCEPTOS CLAVE RESUMEN EJERCICIOS REFERENCIAS BIBLIOGRÁFICAS Los programas utilizados hasta este momento han examinado conceptos de programación, tales como entradas, salidas, asignaciones, expresiones y opera- ciones, sentencias secuenciales y de selección. Sin embargo, muchos problemas requieren de caracterís- ticas de repetición, en las que algunos cálculos o se- cuencia de instrucciones se repiten una y otra vez, utilizando diferentes conjuntos de datos. Ejemplos de tales tareas repetitivas incluyen verificaciones (che- queos) de entradas de datos de usuarios hasta que se introduce una entrada aceptable, tal como una contraseña válida; conteo y acumulación de totales parciales; aceptación constante de entradas de datos y recálculos de valores de salida, cuyo proceso sólo se detiene cuando se introduce o se presenta un valor centinela. Este capítulo examina los diferentes métodos que tilizan los programadores para construir secciones de código repetitivas. Se describe y analiza el concepto de bucle como la sección de código que se repite y que se denomina así ya que cuando termina la ejecu- ción de la última sentencia el flujo de control vuelve a la primera sentencia y comienza otra repetición de las sentencias del código. Cada repetición se conoce como iteración o pasada a través del bucle. Se estudian los bucles más típicos, tales como mientras, hacer-mientras, repetir-hasta que y desde (o para). INTRODUCCIÓN
  • 188. 158 Fundamentos de programación 5.1. ESTRUCTURAS REPETITIVAS Las computadoras están especialmente diseñadas para todas aquellas aplicaciones en las cuales una operación o con- junto de ellas deben repetirse muchas veces. Un tipo muy importante de estructura es el algoritmo necesario para repetir una o varias acciones un número determinado de veces. Un programa que lee una lista de números puede repetir la misma secuencia de mensajes al usuario e instrucciones de lectura hasta que todos los números de un fi- chero se lean. Las estructuras que repiten una secuencia de instrucciones un número determinado de veces se denominan bucles y se denomina iteración al hecho de repetir la ejecución de una secuencia de acciones. Un ejemplo aclarará la cuestión. Supongamos que se desea sumar una lista de números escritos desde teclado —por ejemplo, calificaciones de los alumnos de una clase—. El medio conocido hasta ahora es leer los números y añadir sus valores a una variable SUMA que contenga las sucesivas sumas parciales. La variable SUMA se hace igual a cero y a continuación se incrementa en el valor del número cada vez que uno de ellos se lea. El algoritmo que resuelve este problema es: algoritmo suma var entero : SUMA, NUMERO inicio SUMA ← 0 leer(numero) SUMA ← SUMA + numero leer(numero) SUMA ← SUMA + numero leer(numero) fin y así sucesivamente para cada número de la lista. En otras palabras, el algoritmo repite muchas veces las acciones. leer(numero) SUMA ← SUMA + numero Tales opciones repetidas se denominan bucles o lazos. La acción (o acciones) que se repite en un bucle se deno- mina iteración. Las dos principales preguntas a realizarse en el diseño de un bucle son ¿qué contiene el bucle? y ¿cuántas veces se debe repetir? Cuando se utiliza un bucle para sumar una lista de números, se necesita saber cuántos números se han de sumar. Para ello necesitaremos conocer algún medio para detener el bucle. En el ejemplo anterior usaremos la técnica de solicitar al usuario el número que desea, por ejemplo, N. Existen dos procedimientos para contar el número de iteracio- nes, usar una variable TOTAL que se inicializa a la cantidad de números que se desea y a continuación se decrementa en uno cada vez que el bucle se repite (este procedimiento añade una acción más al cuerpo del bucle: TOTAL ← TO- TAL - 1), o bien inicializar la variable TOTAL en 0 o en 1 e ir incrementando en uno a cada iteración hasta llegar al número deseado. algoritmo suma_numero var entero : N, TOTAL real : NUMERO, SUMA inicio leer(N) TOTAL ← N SUMA ← 0 mientras TOTAL 0 hacer leer(NUMERO) SUMA ← SUMA + NUMERO TOTAL ← TOTAL - 1 fin_mientras escribir('La suma de los', N, 'números es', SUMA) fin
  • 189. Flujo de control II: Estructuras repetitivas 159 El bucle podrá también haberse terminado poniendo cualquiera de estas condiciones: • hasta_que TOTAL sea cero • desde 1 hasta N Para detener la ejecución de los bucles se utiliza una condición de parada. El pseudocódigo de una estructura repetitiva tendrá siempre este formato: inicio //inicialización de variables repetir acciones S1, S2, ... salir según condición acciones Sn, Sn+1, ... fin_repetir Aunque la condición de salida se indica en el formato anterior en el interior del bucle —y existen lenguajes que así la contienen expresamente1 —, lo normal es que la condición se indique al final o al principio del bucle, y así se consideran tres tipos de instrucciones o estructuras repetitivas o iterativas generales y una particular que denomina- remos iterar, que contiene la salida en el interior del bucle. iterar (loop) mientras (while) hacer-mientras (do-while) repetir (repeat) desde (for) El algoritmo de suma anterior podría expresarse en pseudocódigo estándar así: algoritmo SUMA_numeros var entero : N, TOTAL real : NUMERO, SUMA inicio leer(N) TOTAL ← N SUMA ← 0 repetir leer(NUMERO) SUMA ← SUMA + NUMERO TOTAL ← TOTAL - 1 hasta_que TOTAL = 0 escribir('La suma es', SUMA) fin Los tres casos generales de estructuras repetitivas dependen de la situación y modo de la condición. La condición se evalúa tan pronto se encuentra en el algoritmo y su resultado producirá los tres tipos de estructuras citadas. 1. La condición de salida del bucle se realiza al principio del bucle (estructura mientras). algoritmo SUMA1 inicio 1 Modula-2 entre otros.
  • 190. 160 Fundamentos de programación //Inicializar K, S a cero K ← 0 S ← 0 leer(n) mientras K n hacer K ← K + 1 S ← S + K fin_mientras escribir (S) fin Se ejecuta el bucle mientras se verifica una condición (K n). 2. La condición de salida se origina al final del bucle; el bucle se ejecuta hasta que se verifica una cierta con- dición. repetir K ← K + 1 S ← S + K hasta_que K n 3. La condición de salida se realiza con un contador que cuenta el número de iteraciones. desde i = vi hasta vf hacer S ← S + i fin_desde i es un contador que cuenta desde el valor inicial (vi) hasta el valor final (vf) con los incrementos que se consideren; si no se indica nada, el incremento es 1. 5.2. ESTRUCTURA mientras (while) La estructura repetitiva mientras (en inglés while o dowhile: hacer mientras) es aquella en que el cuerpo del bucle se repite mientras se cumple una determinada condición. Cuando se ejecuta la instrucción mientras, la pri- mera cosa que sucede es que se evalúa la condición (una expresión booleana). Si se evalúa falsa, no se toma ningu- na acción y el programa prosigue en la siguiente instrucción del bucle. Si la expresión booleana es verdadera, en- tonces se ejecuta el cuerpo del bucle, después de lo cual se evalúa de nuevo la expresión booleana. Este proceso se repite una y otra vez mientras la expresión booleana (condición) sea verdadera. El ejemplo anterior quedaría así y sus representaciones gráficas como las mostradas en la Figura 5.1. EJEMPLO 5.1 Leer por teclado un número que represente una cantidad de números que a su vez se leerán también por teclado. Calcular la suma de todos esos números. algoritmo suma_numeros var entero : N, TOTAL real : numero, SUMA inicio leer(N) {leer numero total N} TOTAL ← N SUMA ← 0
  • 191. Flujo de control II: Estructuras repetitivas 161 mientras TOTAL 0 hacer leer(numero) SUMA ← SUMA + numero TOTAL ← TOTAL - 1 fin_mientras escribir('La suma de los', N, 'numeros es', SUMA) fin En el caso anterior, como la variable TOTAL se va decrementando y su valor inicial era N, cuando tome el valor 0, significará que se han realizado N iteraciones, o, lo que es igual, se han sumado N números y el bucle se debe parar o terminar. EJEMPLO 5.2 Contar los números enteros positivos introducidos por teclado. Se consideran dos variables enteras numero y con- tador (contará el número de enteros positivos). Se supone que se leen números positivos y se detiene el bucle cuan- do se lee un número negativo o cero. algoritmo cuenta_enteros var entero : numero, contador inicio contador ← 0 leer(numero) mientras numero 0 hacer leer(numero) contador ← contador + 1 fin_mientras escribir('El numero de enteros positivos es', contador) fin Pseudocódigo en español mientras condicion hacer accion S1 accion S2 . . acción Sn fin _ mientras Pseudocódigo en inglés while condicion do acciones . . endwhile o bien dowhile condicion acciones . . enddo a) b) c) acciones condición no sí mientras acciones condición Figura 5.1. Estructura mientras: a) diagrama de flujo; b) pseudocódigo; c) diagrama N-S.
  • 192. 162 Fundamentos de programación inicio contador ← 0 leer numero mientras numero 0 leer numero contador ← contador + 1 escribir 'numeros enteros', contador fin La secuencia de las acciones de este algoritmo se puede reflejar en el siguiente pseudocódigo: Paso Pseudocódigo Significado 1 contador ← 0 inicializar contador a 0 2 leer(numero) leer primer número 3 mientras numero 0 hacer comprobar si numero 0. Si es así, continuar con el paso 4. Si no, continuar con el paso 7 4 sumar 1 a contador incrementar contador 5 leer(numero) leer siguiente numero 6 regresar al paso 3 evaluar y comprobar la expresión booleana 7 escribir(contador) visualizar resultados Obsérvese que los pasos 3 a 6 se ejecutarán mientras los números de entrada sean positivos. Cuando se lea –15 (después de 4 pasos), la expresión numero 0 produce un resultado falso y se transfiere el control a la acción es- cribir y el valor del contador será 4. 5.2.1. Ejecución de un bucle cero veces Obsérvese que en una estructura mientras la primera cosa que sucede es la evaluación de la expresión booleana; si se evalúa falsa en ese punto, entonces del cuerpo del bucle nunca se ejecuta. Puede parecer inútil ejecutar el cuerpo del bucle cero veces, ya que no tendrá efecto en ningún valor o salida. Sin embargo, a veces es la acción deseada. inicio n ← 5 s ← 0 mientras n = 4 hacer leer(x) s ← s + x fin_mientras fin En el ejemplo anterior se aprecia que nunca se cumplirá la condición (expresión booleana n = 4), por lo cual se ejecutará la acción fin y no se ejecutará ninguna acción del bucle.
  • 193. Flujo de control II: Estructuras repetitivas 163 EJEMPLO 5.3 El siguiente bucle no se ejecutará si el primer número leído es negativo o cero. C ← 0 leer(numero) mientras numero 0 hacer C ← C + 1 leer(numero) fin_mientras 5.2.2. Bucles infinitos Algunos bucles no exigen fin y otros no encuentran el fin por error en su diseño. Por ejemplo, un sistema de reservas de líneas aéreas puede repetir un bucle que permita al usuario añadir o borrar reservas. El programa y el bucle corren siempre, o al menos hasta que la computadora se apaga. En otras ocasiones un bucle no se termina nunca porque nunca se cumple la condición. Un bucle que nunca se termina se denomina bucle infinito o sin fin. Los bucles sin fin no intencionados son per- judiciales para la programación y se deben evitar siempre. Consideremos el siguiente bucle que visualiza el interés producido por un capital a las tasas de interés compren- didos en el rango desde 10 a 20 por 100. leer(capital) tasa ← 10 mientras tasa 20 hacer interes ← tasa*0.01*capital // tasa*capital/100=tasa*0.01*capital escribir('interes producido', interes) tasa ← tasa + 2 fin_mientras escribir('continuacion') Los sucesivos valores de la tasa serán 10, 12, 14, 16, 18, 20, de modo que al tomar tasa el valor 20 se detendrá el bucle y se escribirá el mensaje 'continuación'. Supongamos que se cambia la línea última del bucle por tasa ← tasa + 3 El problema es que el valor de la tasa salta ahora de 19 a 22 y nunca será igual a 20 (10, 13, 16, 19, 22,...). El bucle sería infinito, la expresión booleana para terminar el bucle será: tasa 20 o bien tasa = 20 Regla práctica Las pruebas o test en las expresiones booleanas es conveniente que sean mayor o menor que en lugar de prue- bas de igualdad o desigualdad. En el caso de la codificación en un lenguaje de programación, esta regla debe seguirse rígidamente en el caso de comparación de números reales, ya que como esos valores se almacenan en cantidades aproximadas las comparaciones de igualdad de valores reales normalmente plantean problemas. Siempre que realice comparaciones de números reales use las relaciones , =, o =. 5.2.3. Terminación de bucles con datos de entrada Si su algoritmo o programa está leyendo una lista de valores con un bucle mientras, se debe incluir algún tipo de mecanismo para terminar el bucle. Existen cuatro métodos típicos para terminar un bucle de entrada:
  • 194. 164 Fundamentos de programación 1. preguntar antes de la iteración, 2. encabezar la lista de datos con su tamaño, 3. finalizar la lista con su valor de entrada, 4. agotar los datos de entrada. Examinémoslos por orden. El primer método simplemente solicita con un mensaje al usuario si existen más en- tradas. Suma ← 0 escribir('Existen mas numeros en la lista s/n') leer(Resp) //variable Resp, tipo carácter mientras(Resp = 'S') o (Resp = 's') hacer escribir('numero') leer(N) Suma ← Suma + N escribir('Existen mas numeros (s/n)') leer(Resp) fin_mientras Este método a veces es aceptable y es muy útil en ciertas ocasiones, pero suele ser tedioso para listas grandes; en este caso, es preferible incluir una señal de parada. El método de conocer en la cabecera del bucle el tamaño o el número de iteraciones ya ha sido visto en ejemplos anteriores. Tal vez el método más correcto para terminar un bucle que lee una lista de valores es con un centinela. Un valor centinela es un valor especial usado para indicar el final de una lista de datos. Por ejemplo, supongamos que se tienen unas calificaciones de unos tests (cada calificación comprendida entre 0 y 100); un valor centinela en esta lista pue- de ser –999, ya que nunca será una calificación válida y cuando aparezca este valor se terminará el bucle. Si la lista de datos son números positivos, un valor centinela puede ser un número negativo que indique el final de la lista. El siguiente ejemplo realiza la suma de todos los números positivos introducidos desde el terminal. suma ← 0 leer(numero) mientras numero = 0 hacer suma ← suma+numero leer(numero) fin_mientras Obsérvese que el último número leído de la lista no se añade a la suma si es negativo, ya que se sale fuera del bucle. Si se desea sumar los números 1, 2, 3, 4 y 5 con el bucle anterior, el usuario debe introducir, por ejemplo: 1 2 3 4 5 -1 el valor final –1 se lee, pero no se añade a la suma. Nótese también que cuando se usa un valor centinela se invierte el orden de las instrucciones de lectura y suma con un valor centinela, éste debe leerse al final del bucle y se debe tener la instrucción leer al final del mismo. El último método de agotamiento de datos de entrada es comprobar simplemente que no existen más datos de entrada. Este sistema suele depender del tipo de lenguaje; por ejemplo, Pascal puede detectar el final de una línea; en los archivos secuenciales se puede detectar el final físico del archivo (eof, end of file). EJEMPLO 5.4 Considere los siguientes algoritmos. ¿Qué visualizará y cuántas veces se ejecuta el bucle? 1. i ← 0 mientras i 6 hacer escribir(i) i ← i + 1 fin_mientras
  • 195. Flujo de control II: Estructuras repetitivas 165 La salida es el valor de la variable de control i al principio de cada ejecución del cuerpo del bucle: 0, 1, 2, 3, 4 y 5. El bucle se ejecuta seis veces. 2. i ← 0 mientras i 6 hacer i ← i + 1 escribir(i) fin_mientras La salida será entonces 1, 2, 3, 4, 5 y 6. El cuerpo del bucle se ejecuta también seis veces. Obsérvese que cuando i = 5, la expresión booleana es verdadera y el cuerpo del bucle se ejecuta; con i = 6 la sentencia escribir se ejecuta, pero a continuación se evalúa la expresión booleana y se termina el bucle. EJEMPLO 5.5 Calcular la media de un conjunto de notas de alumnos. Pondremos un valor centinela de –99 que detecte el fin del bucle. inicio total ← 0 n ← 0 //numero de alumnos leer(nota) //la primera nota debe ser distinta de -99 mientras nota -99 hacer total ← total + nota n ← n + 1 leer (nota) fin_mientras media ← total / n escribir('La media es', media) fin Obsérvese que total y n se inicializan a cero antes de la instrucción mientras. Cuando el bucle termina, la variable total contiene la suma de todas las notas y, por consiguiente, total/n, siendo n el número de alumnos, será la media de la clase. 5.3. ESTRUCTURA hacer-mientras (do-while) El bucle mientras al igual que el bucle desde que se verá con posterioridad evalúan la expresión al comienzo del bucle de repetición; siempre se utilizan para crear bucle pre-test. Los bucles pre-test se denominan también bucles controlados por la entrada. En numerosas ocasiones se necesita que el conjunto de sentencias que componen el cuer- po del bucle se ejecuten al menos una vez sea cual sea el valor de la expresión o condición de evaluación. Estos bucles se denominan bucles post-test o bucles controlados por la salida. Un caso típico es el bucle hacer-mientras (do-while) existente en lenguajes como C/C++, Java o C#. El bucle hacer-mientras es análogo al bucle mientras y el cuerpo del bucle se ejecuta una y otra vez mien- tras la condición (expresión booleana) sea verdadera. Existe, sin embargo, una gran diferencia y es que el cuerpo del bucle está encerrado entre las palabras reservadas hacer y mientras, de modo que las sentencias de dicho cuerpo se ejecutan, al menos una vez, antes de que se evalúe la expresión booleana. En otras palabras, el cuerpo del bucle siempre se ejecuta, al menos una vez, incluso aunque la expresión booleana sea falsa. Regla El bucle hacer-mientras se termina de ejecutar cuando el valor de la condición es falsa. La elección entre un bucle mientras y un bucle hacer-mientras depende del problema de cómputo a resolver. En la mayoría de los casos, la condición de entrada del bucle mientras es la elección correcta. Por ejemplo, si el bucle se utiliza para recorrer una lista de números (o una lista de cualquier tipo de objetos), la lista puede estar vacía, en cuyo caso las sentencias del bucle nunca se ejecutarán. Si se aplica un bucle hacer-mientras nos conduce a un código de errores.
  • 196. 166 Fundamentos de programación Al igual que en el caso del bucle mientras la sentencia en el interior del bucle puede ser simple o compuesta. Todas las sentencias en el interior del bucle se ejecutan al menos una vez antes de que la expresión o condición se evalúe. Entonces, si la expresión es verdadera (un valor distinto de cero, en C/C++) las sentencias del cuerpo del bucle se ejecutan una vez más. El proceso continúa hasta que la expresión evaluada toma el valor falso (valor cero en C/C++). El diagrama de control del flujo se ilustra en la Figura 5.2, donde se muestra el funcionamiento de la sentencia hacer-mientras. La Figura 5.3 representa un diagrama de sintaxis con notación BNF de la sentencia hacer-mientras. Sentencia hacer-mientras::= hacer cuerpo del bucle mientras (condición_del_bucle) donde cuerpo del bucle::= sentencia ::= sentencia_compuesta condición del bucle::= expresión booleana Nota: el cuerpo del bucle se repite mientras condición del bucle sea verdadero. Figura 5.3. Diagrama de sintaxis de la sentencia hacer-mientras. EJEMPLO 5.6 Obtener un algoritmo que lea un número (por ejemplo, 198) y obtenga el número inverso (por ejemplo, 891). algoritmo invertirnummero var entero: num, digitoSig inicio num ← 198 escribir ('Número: ← ', num) escribir ('Número en orden inverso: ') hacer digitoSig = num MOD 10 a) Diagrama de flujo de una sentencia hacer-mientras b) Pseudocódigo de una sentencia hacer-mientras acciones condición verdadera falsa hacer acciones mientras (expresión) Figura 5.2. Estructura hacer-mientras: a) diagrama de flujo; b) pseudocódigo.
  • 197. Flujo de control II: Estructuras repetitivas 167 escribir(digitoSig) num = num DIV 10 mientras num 0 fin La salida de este programa se muestra a continuación: Número: 198 Número en orden inverso: 891 Análisis del ejemplo anterior Con cada iteración se obtiene el dígito más a la derecha, ya que es el resto de la división entera del valor del núme- ro (num) por 10. Así en la primera iteración digitoSig vale 8 ya que es el resto de la división entera de 198 entre 10 (cociente 19 y resto 8). Se visualiza el valor 8. A continuación se divide 198 entre 10 y se toma el cociente ente- ro 19, que se asigna a la variable num. En la siguiente iteración se divide 19 por 10 (cociente entero 1, resto 9) y se visualiza, por consiguiente, el valor del resto, digitoSig, es decir el dígito 9; a continuación se divide 19 por 10 y se toma el cociente entero, es decir, 1. En la tercera y última iteración se divide 1 por 10 y se toma el resto (digitoSig) que es el dígito 1. Se visua- liza el dígito 1 a continuación de 89 y como resultado final aparece 891. A continuación se efectúa la división de nuevo por 10 y entonces el cociente entero es 0 que se asigna a num que al no ser ya mayor que cero hace que se termine el bucle y el algoritmo correspondiente. 5.4. DIFERENCIAS ENTRE mientras (while) Y hacer-mientras (do-while): UNA APLICACIÓN EN C++ Una sentencia do-while es similar a una sentencia while, excepto que el cuerpo del bucle se ejecuta siempre al menos una vez. Sintaxis sentencia compuesta while (Expresion_lógica) do { { sentencia_1; sentencia_1; sentencia_2; sentencia_2; ... ... sentencia_n; sentencia_n; } } while (expresion_lógica) while (Expresión_lógica) do sentencia sentencia while (expresión_lógica) sentencia simple Ejemplo 1 // cuenta a 10 int x = 0;
  • 198. 168 Fundamentos de programación do cout X: x++; while (x 10) Ejemplo 2 // imprimir letras minúsculas del alfabeto char car = 'a'; do { cout car ''; car++; }while (car = 'z'); EJEMPLO 5.7 Visualizar las potencias de dos cuerpos cuyos valores estén en el rango 1 a 1.000. // ejercicio con while // ejercicio con do-while potencia = 1; potencia = 1; while (potencia 1000) do { { cout potencia endl; cout potencia endl; potencia *= 2 potencia *= 2; } // fin de while } while (potencia 1000); 5.5. ESTRUCTURA repetir (repeat) Existen muchas situaciones en las que se desea que un bucle se ejecute al menos una vez antes de comprobar la condición de repetición. En la estructura mientras si el valor de la expresión booleana es inicialmente falso, el cuerpo del bucle no se ejecutará; por ello, se necesitan otros tipos de estructuras repetitivas. La estructura repetir (repeat) se ejecuta hasta que se cumpla una condición determinada que se comprueba al final del bucle (Figura 5.4). El bucle repetir-hasta_que se repite mientras el valor de la expresión booleana de la condición sea falsa, justo la opuesta de la sentencia mientras. algoritmo repetir var real : numero entero: contador inicio contador ← 1 repetir leer(numero) contador ← contador + 1 hasta_que contador 30 escribir('Numeros leidos 30') fin En el ejemplo anterior el bucle se repite hasta que el valor de la variable contador exceda a 30, lo que sucede- rá después de 30 ejecuciones del cuerpo del bucle.
  • 199. Flujo de control II: Estructuras repetitivas 169 EJEMPLO 5.8 Desarrollar el algoritmo necesario para calcular el factorial de un número N que responda a la fórmula: N! = N * (N – 1) * (N – 2), ..., 3 * 2 * 1 El algoritmo correspondiente es: algoritmo factorial var entero : I, N real : Factorial inicio leer(N) // N = 1 Factorial ← 1 I ← 1 repetir Factorial ← Factorial * I I ← I + 1 hasta_que I = N + 1 escribir('El factorial del numero', N, 'es', Factorial) fin Con una estructura repetir el cuerpo del bucle se ejecuta siempre al menos una vez. Cuando una instrucción repetir se ejecuta, lo primero que sucede es la ejecución del bucle y, a continuación, se evalúa la expresión boolea- na resultante de la condición. Si se evalúa como falsa, el cuerpo del bucle se repite y la expresión booleana se evalúa una vez. Después de cada iteración del cuerpo del bucle, la expresión booleana se evalúa; si es verdadera, el bucle termina y el programa sigue en la siguiente instrucción a hasta_que. Diagrama de flujo acciones condición falsa verdadera Diagrama N-S repetir condiciones acciones a) Español Pseudocódigo repetir acciones . . hasta _ que condicion b) Inglés b) c) repeat acciones . . until condicion Figura 5.4. Estructura repetir: pseudocódigo, diagrama de flujo, diagrama N-S.
  • 200. 170 Fundamentos de programación Diferencias de las estructuras mientras y repetir • La estructura mientras termina cuando la condición es falsa, mientras que repetir termina cuando la con- dición es verdadera. • En la estructura repetir el cuerpo del bucle se ejecuta siempre al menos una vez; por el contrario, mientras es más general y permite la posibilidad de que el bucle pueda no ser ejecutado. Para usar la estructura re- petir debe estar seguro de que el cuerpo del bucle —bajo cualquier circunstancia— se repetirá al menos una vez. EJEMPLO 5.9 Encontrar el entero positivo más pequeño (num) para el cual la suma 1+2+3+...+num es menor o igual que lí- mite. 1. Introducir limite. 2. Inicializar num y suma a 0. 3. Repetir las acciones siguientes hasta que suma limite • incrementar num en 1, • añadir num a suma. 4. Visualizar num y suma. El pseudocódigo de este algoritmo es: algoritmo mas_pequeño var entero : num, limite, suma inicio leer(limite) num ← 0 suma ← 0 repetir num ← num + 1 suma ← suma + num hasta_que suma limite escribir(num, suma) fin EJEMPLO 5.10 Escribir los números 1 a 100. algoritmo uno_cien var entero : num inicio num ← 1 repetir escribir(num) num ← num + 1 hasta_que num 100 fin
  • 201. Flujo de control II: Estructuras repetitivas 171 EJEMPLO 5.11 Es muy frecuente tener que realizar validación de entrada de datos en la mayoría de las aplicaciones. Este ejemplo detecta cualquier entrada comprendida entre 1 y 12, rechazando las restantes, ya que se trata de leer los números correspondientes a los meses del año. algoritmo validar_mes var entero : mes inicio escribir('Introducir numero de mes') repetir leer(mes) si (mes 1) o (mes 12) entonces escribir('Valor entre 1 y 12') fin_si hasta_que (mes =1) y (mes = 12) fin Este sistema es conocido como interactivo por entablar un «diálogo imaginario» entre la computadora y el pro- gramador que se produce «en tiempo real» entre ambas partes, es decir, «interactivo» con el usuario. 5.6. ESTRUCTURA desde/para (for) En muchas ocasiones se conoce de antemano el número de veces que se desean ejecutar las acciones de un bucle. En estos casos, en el que el número de iteraciones es fijo, se debe usar la estructura desde o para (for, en inglés). La estructura desde ejecuta las acciones del cuerpo del bucle un número especificado de veces y de modo automá- tico controla el número de iteraciones o pasos a través del cuerpo del bucle. Las herramientas de programación de la estructura desde o para se muestran en la página siguiente junto a la Figura 5.5. 5.6.1. Otras representaciones de estructuras repetitivas desde/para (for) Un bucle desde (for) se representa con los símbolos de proceso y de decisión mediante un contador. Así, por ejem- plo, en el caso de un bucle de lectura de cincuenta números para tratar de calcular su suma: I ← 1 I ← 1 I = 50 Proceso I ← I + 1 no sí no sí proceso o acciones del bucle I 50 inicialización del contador I ← I + 1
  • 202. 172 Fundamentos de programación Pseudocódigo estructura desde desde v ← vi hasta vf [incremento incr] hacer acciones . . . fin_desde v: variable indice vi, vf: valores inicial y final de la variable a) Modelo 1 para v ← vi hasta vf [incremento incr] hacer acciones . . . fin_para b) Modelo 2 Diagrama N-S, estructura desde desde v = vi hasta vf [incremento incr] hacer acciones fin_desde b) Modelo 3 Diagrama de flujo, estructura, desde variable índice valor final verdadero falso acciones calcular valor inicial y valor final fijar la variable índice al valor inicial incrementar variable índice cuerpo del bucle c) Modelo 4 Figura 5.5. Estructura desde (for): a) pseudocódigo, b) diagrama N-S, c) diagrama de flujo.
  • 203. Flujo de control II: Estructuras repetitivas 173 Es posible representar el bucle con símbolos propios no sí acciones i vf no sí acciones i vf i ← vi i ← vi + X i ← vi i ← vi + X o bien mediante este otro símbolo m1 = contador inicial m2 = contador final m3 = incremento de paso proceso repetir variable = m1, m2, m3 Como aplicación, calcular la suma de los N primeros enteros. i vf i ← vi i ← vi + X no sí fin escribir 'Suma =', S S ← S + 1 equivale a algoritmo suma var entero : I, N, S inicio S ← 0 desde I ← 1 hasta N hacer S ← S + I fin_desde escribir('Suma =', S) fin leer (N) ,
  • 204. 174 Fundamentos de programación La estructura desde comienza con un valor inicial de la variable índice y las acciones especificadas se ejecutan, a menos que el valor inicial sea mayor que el valor final. La variable índice se incrementa en uno y si este nuevo valor no excede al final, se ejecutan de nuevo las acciones. Por consiguiente, las acciones específicas en el bucle se ejecutan para cada valor de la variable índice desde el valor inicial hasta el valor final con el incremento de uno en uno. El incremento de la variable índice siempre es 1 si no se indica expresamente lo contrario. Dependiendo del tipo de lenguaje, es posible que el incremento sea distinto de uno, positivo o negativo. Así, por ejemplo, FORTRAN ad- mite diferentes valores positivos o negativos del incremento, y Pascal sólo admite incrementos cuyo tamaño es la unidad: bien positivos, bien negativos. La variable índice o de control normalmente será de tipo entero y es normal emplear como nombres las letras I, J, K. El formato de la estructura desde varía si se desea un incremento distinto a 1, bien positivo, bien negativo (de- cremento). desde v ← vi hasta vf inc paso hacer {inc, incremento} dec {dec, decremento} acciones . . . fin_desde Si el valor inicial de la variable índice es menor que el valor final, los incrementos deben ser positivos, ya que en caso contrario la secuencia de acciones no se ejecutaría. De igual modo, si el valor inicial es mayor que el valor final, el incremento debe ser en este caso negativo, es decir, decremento. Al incremento se le suele denominar también paso (“step”, en inglés). Es decir, desde i ← 20 hasta 10 hacer acciones fin_desde no se ejecutaría, ya que el valor inicial es 20 y el valor final 10, y como se supone un incremento positivo, de valor 1, se produciría un error. El pseudocódigo correcto debería ser desde i ← 20 hasta 10 decremento 1 hacer acciones fin_desde 5.6.2. Realización de una estructura desde con estructura mientras Es posible, como ya se ha mencionado en apartados anteriores, sustituir una estructura desde por una mientras; en las líneas siguientes se indican dos formas para ello: 1. Estructura desde con incrementos de la variable índice positivos. v ← vi mientras v = vf hacer acciones v ← v + incremento fin_mientras 2. Estructura desde con incrementos de la variable índice negativos. v ← vi mientras v = vf hacer acciones v ← v - decremento fin_mientras
  • 205. Flujo de control II: Estructuras repetitivas 175 La estructura desde puede realizarse con algoritmos basados en estructura mientras y repetir, por lo que pueden ser intercambiables cuando así lo desee. Las estructuras equivalentes a desde son las siguientes: a) inicio b) inicio i ← n i ← 1 mientras i 0 hacer mientras i = n hacer acciones acciones i ← i – 1 i ← i + 1 fin_mientras fin_mientras fin fin c) inicio d) inicio i ← 0 i ← 1 repetir repetir acciones acciones i ← i+1 i ← i+1 hasta_que i = n hasta_que i n fin fin e) inicio f) inicio i ← n + 1 i ← n repetir repetir acciones acciones i ← i - 1 i ← i - 1 hasta_que i = 1 hasta_que i 1 fin fin 5.7. SALIDAS INTERNAS DE LOS BUCLES Aunque no se incluye dentro de las estructuras básicas de la programación estructurada, en ocasiones es necesario disponer de una estructura repetitiva que permita la salida en un punto intermedio del bucle cuando se cumpla una condición. Esta nueva estructura sólo está disponible en algunos lenguajes de programación específicos; la denomi- naremos iterar para diferenciarlo de repetir_hasta ya conocida. Las salidas de bucles suelen ser válidas en estructuras mientras, repetir y desde. El formato de la estructura es iterar acciones si condicion entonces salir_bucle fin_si acciones fin_iterar En general, la instrucción iterar no produce un programa legible y comprensible como lo hacen mientras y repetir. La razón para esta ausencia de claridad es que la salida de un bucle ocurre en el medio del bucle, mientras que normalmente la salida del bucle es al principio o al final del mismo. Le recomendamos no recurra a esta opción —aunque la tenga su lenguaje— más que cuando no exista otra alternativa o disponga de la estructura iterar (loop). EJEMPLO 5.12 Una aplicación de un posible uso de la instrucción salir se puede dar cuando se incluyen mensajes de petición en el algoritmo para la introducción sucesiva de informaciones.
  • 206. 176 Fundamentos de programación Algoritmo 1 Algoritmo 2 leer(informacion) leer(informacion) repetir mientras_no fin_de_lectura procesar (informacion) procesar (informacion) leer(informacion) leer(informacion) hasta_que fin_de_lectura fin_mientras En los algoritmos anteriores cada entrada (lectura) de información va acompañada de su correspondiente proceso, pero la primera lectura está fuera del bucle. Se pueden incluir en el interior del bucle todas las lecturas de información si se posee una estructura salir (exit). Un ejemplo de ello es la estructura siguiente: iterar leer(informacion) si fin_de_lectura entonces salir_bucle fin_si procesar (informacion) fin_iterar 5.8. SENTENCIAS DE SALTO interrumpir (break) y continuar (continue) Las secciones siguientes examinan las sentencias de salto (jump) que se utilizan para influir en el flujo de ejecución durante la ejecución de una sentencia de bucle. 5.8.1. Sentencia interrumpir (break) En ocasiones, los programadores desean terminar un bucle en un lugar determinado del cuerpo del bucle en vez de esperar que el bucle termine de modo natural por su entrada o por su salida. Un método de conseguir esta acción —siempre utilizada con precaución y con un control completo del bucle— es mediante la sentencia interrumpir (break) que se suele utilizar en la sentencia según_sea (switch). La sentencia interrumpir se puede utilizar para terminar una sentencia de iteración y cuando se ejecuta produ- ce que el flujo de control salte fuera a la siguiente sentencia inmediatamente a continuación de la sentencia de itera- ción. La sentencia interrumpir se puede colocar en el interior del cuerpo del bucle para implementar este efecto. Sintaxis interrumpir sentencia_interrumpir::= interrumpir EJEMPLO 5.13 hacer escribir ('Introduzca un número de identificiación') leer (numId) si (numId 1000 o numId 1999)entonces escribir ('Número no válido ') escribir ('Por favor, introduzca otro número') si-no interrumpir fin_si mientras (expresión cuyo valor sea siempre verdadero)
  • 207. Flujo de control II: Estructuras repetitivas 177 EJEMPLO 5.14 var entero: t desde t ← 0 hasta t 100 incremento 1 hacer escribir (t) si (t = 1d) entonces interrumpir fin_si fin_desde Regla La sentencia interrumpir (break) se utiliza frecuentemente junto con una sentencia si (if) actuando como una condición interna del bucle. 5.8.2. Sentencia continuar (continue) La sentencia continuar (continue) hace que el flujo de ejecución salte el resto de un cuerpo del bucle para con- tinuar con el siguiente bucle o iteración. Esta característica suele ser útil en algunas circunstancias. Sintaxis continuar Sentencia_continuar::= continuar La sentencia continuar sólo se puede utilizar dentro de una iteración de un bucle. La sentencia continuar no interfiere con el número de veces que se repite el cuerpo del bucle como sucede con interrumpir, sino que simple- mente influye en el flujo de control en cualquier iteración específica. EJEMPLO 5.15 i = 0 desde i = 0 hasta 20 inc 1 hacer si (i mod 4 = 0) entonces continuar fin_si escribir (i, ', ') fin_desde Al ejecutar el bucle anterior se producen estos resultados 1, 2, 3, 5, 6, 7, 9, 10, 11, 13, 14, 15, 17, 18, 19 Un análisis del algoritmo nos proporciona la razón de los resultados anteriores: 1. La variable i se declara igual a cero, como valor inicial. 2. El bucle i se incrementa en cada iteración en 1 hasta llegar a 21, momento en que se termina la ejecución del bucle. 3. Siempre que i es múltiplo de 4 (i mod 4) se ejecuta la sentencia continuar y salta el flujo del programa sobre el resto del cuerpo del bucle, se termina la iteración en curso y comienza una nueva iteración (en ese
  • 208. 178 Fundamentos de programación caso no se escribe el valor de i). En consecuencia, no se visualiza el valor de i correspondiente (múltiplo de 4). 4. Como resultado final, se visualizan todos los números comprendidos entre 0 y 20, excepto los múltiplos de 4; es decir, 4, 8, 12, 16 y 20. 5.9. COMPARACIÓN DE BUCLES while, for Y do-while: UNA APLICACIÓN EN C++ C++ proporciona tres sentencias para el control de bucles: while, for y do-while. El bucle while se repite mientras su condición de repetición del bucle es verdadera; el bucle for se utiliza normalmente cuando el conteo esté impli- cado, o bien el control del bucle for, en donde el número de iteraciones requeridas se puede determinar al principio de la ejecución del bucle, o simplemente cuando existe una necesidad de seguir el número de veces que un suceso particular tiene lugar. El bucle do-while se ejecuta de un modo similar a while excepto que las sentencias del cuerpo del bucle se ejecutan siempre al menos una vez. La Tabla 5.1 describe cuándo se usa cada uno de los tres bucles. En C++, el bucle for es el más frecuentemente utilizado de los tres. Es relativamente fácil reescribir un bucle do-while como un bucle while, insertando una asig- nación inicial de la variable condicional. Sin embargo, no todos los bucles while se pueden expresar de modo ade- cuado como bucles do-while, ya que un bucle do-while se ejecutará siempre al menos una vez y el bucle while puede no ejecutarse. Por esta razón, un bucle while suele preferirse a un bucle do-while, a menos que esté claro que se debe ejecutar una iteración como mínimo. Tabla 5.1. Formatos de los bucles en C++ while El uso más frecuente es cuando la repetición no está controlada por contador; el test de condición precede a cada repetición del bucle; el cuerpo del bucle puede no ser ejecutado. Se debe utilizar cuando se desea saltar el bucle si la condición es falsa. for Bucle de conteo cuando el número de repeticiones se conoce por anticipado y puede ser controlado por un contador; también es adecuado para bucles que implican control no contable del bucle con simples etapas de inicialización y de actualización; el test de la condición precede a la ejecución del cuerpo del bucle. do-while Es adecuada cuando se debe asegurar que al menos se ejecuta el bucle una vez. Comparación de tres bucles cuenta = valor_inicial; while (cuenta valor_parada) { ... cuenta++; } // fin de while for(cuenta=valor_inicial; cuentavalor_parada; cuenta++) { ... } // fin de for cuenta = valor_inicial; if (valor_inicial valor_parada) do { ... cuenta++; } while (cuenta valor_parada);
  • 209. Flujo de control II: Estructuras repetitivas 179 5.10. DISEÑO DE BUCLES (LAZOS) El diseño de un bucle requiere tres partes: 1. El cuerpo del bucle. 2. Las sentencias de inicialización. 3. Las condiciones para la terminación del bucle. 5.10.1. Bucles para diseño de sumas y productos Muchas tareas frecuentes implican la lectura de una lista de números y calculan su suma. Si se conoce cuántos nú- meros habrá, tal tarea se puede ejecutar fácilmente por el siguiente pseudocódigo. El valor de la variable total es el número de números que se suman. La suma se acumula en la variable suma. suma ← 0; repetir lo siguiente total veces: cin siguiente; suma ← suma + siguiente; fin_bucle Este código se implementa fácilmente con un bucle for en C++. int suma = 0; for (int cuenta = 1; cuenta = total; cuenta++) { cin siguiente; suma = suma + siguiente; } Obsérvese que la variable suma se espera tome un valor cuando se ejecuta la siguiente sentencia suma = suma + siguiente; Dado que suma debe tener un valor la primera vez que la sentencia se ejecuta, suma debe estar inicializada a algún valor antes de que se ejecute el bucle. Con el objeto de determinar el valor correcto de inicialización de suma se debe pensar sobre qué sucede después de una iteración del bucle. Después de añadir el primer número, el valor de suma debe ser ese número. Esto es, la primera vez que se ejecute el bucle, el valor de suma + siguiente sea igual a siguiente. Para hacer esta operación true (verdadero), el valor de suma debe ser inicializado a 0. Si en lugar de suma, se desea realizar productos de una lista de números, la técnica a utilizar es: int producto = 1; for (int cuenta = 1; cuenta = total; cuenta++) { cin siguiente; producto = producto * siguiente; } La variable producto debe tener un valor inicial. No se debe suponer que todas las variables se deben inicializar a cero. Si producto se inicializara a cero, seguiría siendo cero después de que el bucle anterior se terminara. 5.10.2. Fin de un bucle Existen cuatro métodos utilizados normalmente para terminar un bucle de entrada. Estos cuatro métodos son2 : 2 Estos métodos son descritos en Savitch, Walter, Problem Solving with C++, The Object of Programming, 2.ª edición, Reading, Massa- chussetts, Addison-Wesley, 1999.
  • 210. 180 Fundamentos de programación 1. Lista encabezada por tamaño. 2. Preguntar antes de la iteración. 3. Lista terminada con un valor centinela. 4. Agotamiento de la entrada. Lista encabezada por el tamaño Si su programa puede determinar el tamaño de una lista de entrada por anticipado, bien preguntando al usuario o por algún otro método, se puede utilizar un bucle “repetir n veces” para leer la entrada exactamente n veces, en donde n es el tamaño de la lista. Preguntar antes de la iteración El segundo método para la terminación de un bucle de entrada es preguntar, simplemente, al usuario, después de cada iteración del bucle, si el bucle debe ser o no iterado de nuevo. Por ejemplo: suma = 0; cout ¿Existen números en la lista?:n teclee S para Sí, N para No y Final, Intro):; char resp; cin resp; while ((resp == 'S')|| (resp == 's')) { cout Introduzca un número: ; cin número; suma = suma + numero; cout ¿Existen más números?:n; S para Sí, N para No. Final con Intro:; cin resp; } Este método es muy tedioso para listas grandes de números. Cuando se lea una lista larga es preferible incluir una única señal de parada, como se incluye en el método siguiente. Valor centinela El método más práctico y eficiente para terminar un bucle que lee una lista de valores del teclado es mediante un valor centinela. Un valor centinela es aquél que es totalmente distinto de todos los valores posibles de la lista que se está leyendo y de este modo sirve para indicar el final de la lista. Un ejemplo típico se presenta cuando se lee una lista de números positivos; un número negativo se puede utilizar como un valor centinela para indicar el final de la lista. // ejemplo de valor centinela (número negativo) ... cout Introduzca una lista de enteros positivos endl; Termine la lista con un número negativo endl; suma = 0; cin numero; while (numero = 0) { suma = suma + numero; cin numero; } cout La suma es: suma;
  • 211. Flujo de control II: Estructuras repetitivas 181 Si al ejecutar el segmento de programa anterior se introduce la lista 4 8 15 -99 el valor de la suma será 27. Es decir, -99, último número de la entrada de datos no se añade a suma. –99 es el último dato de la lista que actúa como centinela y no forma parte de la lista de entrada de números. Agotamiento de la entrada Cuando se leen entradas de un archivo, se puede utilizar un valor centinela. Aunque el método más frecuente es comprobar simplemente si todas las entradas del archivo se han leído y se alcanza el final del bucle cuando no hay más entradas a leer. Éste es el método usual en la lectura de archivos, que suele utilizar una marca al final de archi- vo, eof. En el capítulo de archivos se dedicará una atención especial a la lectura de archivos con una marca de final de archivo. 5.11. ESTRUCTURAS REPETITIVAS ANIDADAS De igual forma que se pueden anidar o encajar estructuras de selección, es posible insertar un bucle dentro de otro. Las reglas para construir estructuras repetitivas anidadas son iguales en ambos casos: la estructura interna debe estar incluida totalmente dentro de la externa y no puede existir solapamiento. La representación gráfica se indica en la Figura 5.6. a) b) c) d) Figura 5.6. Bucles anidados: a) y b), correctos; c) y d), incorrectos. Las variables índices o de control de los bucles toman valores de modo tal que por cada valor de la variable ín- dice del ciclo externo se debe ejecutar totalmente el bucle interno. Es posible anidar cualquier tipo de estructura re- petitiva con tal que cumpla las condiciones de la Figura 5.5. EJEMPLO 5.16 Se conoce la población de cada una de las veinticinco ciudades más grandes de las ocho provincias de Andalucía y se desea identificar y visualizar la población de la ciudad más grande de cada provincia. El problema consistirá, en primer lugar, en la obtención de la población mayor de cada provincia y realizar esta operación ocho veces, una para cada provincia.
  • 212. 182 Fundamentos de programación 1. Encontrar y visualizar la ciudad mayor de una provincia. 2. Repetir el paso 1 para cada una de las ocho provincias andaluzas. El procedimiento para deducir la ciudad más grande de entre las veinticinco de una provincia se consigue crean- do una variable auxiliar MAYOR —inicialmente de valor 0— que se va comparando sucesivamente con los veinticin- co valores de cada ciudad, de modo tal que, según el resultado de comparación, se intercambian valores de la ciudad por el de la variable MAYOR. El algoritmo correspondiente sería: algoritmo CIUDADMAYOR var entero : i //contador de provincias entero : j //contador de ciudades entero : MAYOR //ciudad de mayor población entero : CIUDAD //población de la ciudad inicio i ← 1 mientras i = 8 hacer MAYOR ← 0 j ← 1 mientras j = 25 hacer leer(CIUDAD) si CIUDAD MAYOR entonces MAYOR ← CIUDAD fin_si j ← j + 1 fin_mientras escribir('La ciudad mayor es', MAYOR) i ← i + 1 fin_mientras fin EJEMPLO 5.17 Calcular el factorial de n números leídos del terminal. El problema consistirá en realizar una estructura repetitiva de n iteraciones del algoritmo del problema ya cono- cido del cálculo del factorial de un entero. algoritmo factorial2 var entero : i, NUMERO, n real : FACTORIAL inicio {lectura de la cantidad de números} leer(n) desde i ← 1 hasta n hacer leer(NUMERO) FACTORIAL ← 1 desde j ← 1 hasta NUMERO hacer FACTORIAL ← FACTORIAL * j fin_desde escribir('El factorial del numero', NUMERO, 'es', FACTORIAL) fin_desde fin
  • 213. Flujo de control II: Estructuras repetitivas 183 EJEMPLO 5.18 Imprimir todos los número primos entre 2 y 100 inclusive. algoritmo Primos var entero : i, divisor logico : primo inicio desde i ← hasta 100 hacer primo ← verdad divisor ← 2 mientras (divisor = raiz2(i)) y primo hacer si i mod divisor = 0 entonces primo ← falso si_no divisor ← divisor + 1 fin_si fin_mientras si primo entonces escribir(i,' ') fin_si fin_desde fin 5.11.1. Bucles (lazos) anidados: una aplicación en C++ Es posible anidar bucles. Los bucles anidados constan de un bucle externo con uno o más bucles internos. Cada vez que se repite el bucle externo, los bucles internos se repiten, se reevalúan los componentes de control y se ejecutan todas las iteraciones requeridas. EJEMPLO 5.19 El segmento de programa siguiente visualiza una tabla de multiplicación por cálculo y visualización de productos de la forma x * y para cada x en el rango de 1 a Xultimo y desde cada y en el rango 1 a Yultimo (donde Xultimo, e Yultimo son enteros prefijados). La tabla que se desea obtener es 1 * 1 = 1 1 * 2 = 2 1 * 3 = 3 1 * 4 = 4 1 * 5 = 5 2 * 1 = 2 2 * 2 = 4 2 * 3 = 6 2 * 4 = 8 2 * 5 = 10 ... El bucle que tiene x como variable de control se denomina bucle externo y el bucle que tiene y como variable de control se denomina bucle interno. for (int x = 1; x = Xultimo; x++) for (int y = 1; y = Yultimo; y++) { producto = x * y; cout setw(2) x * setw(2) y = setw(3) producto endl; } bucle externo bucle interno
  • 214. 184 Fundamentos de programación EJEMPLO 5.20 // Aplicación de bucles anidados #include iostream #include iomanip.h // necesario para cin y cout using namespace std; // necesario para setw void main() { // cabecera de impresión cout setw(12) i setw(6) j endl; for (int i = 0; i 4; i++) { cout Externo setw(7) i endl; for (int j = 0; j i; j++) cout Interno setw(10) j endl; } // fin del bucle externo } La salida del programa es i j Externo 0 Externo 1 Interno 0 Externo 2 Interno 0 Interno 1 Externo 3 Interno 0 Interno 1 Interno 2 EJERCICIO 5.1 Escribir un programa que visualice un triángulo isósceles. * * * * * * * * * * * * * * * * * * * * * * * * * El triángulo isósceles se realiza mediante un bucle externo y dos bucles internos. Cada vez que se repite el bucle externo se ejecutan los dos bucles internos. El bucle externo se repite cinco veces (cinco filas); el número de repeticiones realizadas por los bucles internos se basan en el valor de la variable fila. El primer bucle interno visualiza los espacios en blanco no significativos; el segundo bucle interno visualiza uno o más asteriscos. // archivo triángulo.cpp #include iostream using namespace std;
  • 215. Flujo de control II: Estructuras repetitivas 185 void main() { // datos locales... const int num_lineas = 5; const char blanco = ''; const char asterisco = '*'; // comienzo de una nueva línea cout endl; // dibujar cada línea: bucle externo for (int fila = 1; fila = num_lineas; fila++) { // imprimir espacios en blanco: primer bucle interno for (int blancos = num_lineas –fila; blancos 0; blancos--) cout blanco; for (int cuenta_as = 1; cuenta_as 2 * fila; cuenta_as ++) cout asterisco; // terminar línea cout endl; } // fin del bucle externo } El bucle externo se repite cinco veces, uno por línea o fila; el número de repeticiones ejecutadas por los bucles internos se basa en el valor de fila. La primera fila consta de un asterisco y cuatro blancos, la fila 2 consta de tres blancos y tres asteriscos, y así sucesivamente; la fila 5 tendrá 9 asteriscos (2 × 5 – 1). EJERCICIO 5.2 Ejecutar y visualizar el programa siguiente que imprime una tabla de m filas por n columnas y un carácter prefijado. 1: //Listado 2: //ilustra bucles for anidados 3: 4: int main() 5: { 6: int filas, columnas; 7: char elCar; 8: cout ¿Cuántas filas?; 9: cin filas; 10: cout ¿Cuántas columnas?; 11: cin columnas; 12: cout ¿Qué carácter?; 13: cin elCar; 14: for (int i = 0; i filas; i++) 15: { 16: for (int j = 0; j columnas; j++) 17: cout elCar; 18: cout n; 19: } 20: return 0; 21: }
  • 216. 186 Fundamentos de programación ACTIVIDADES DE PROGRAMACIÓN RESUELTAS 5.1. Calcular el factorial de un número N utilizando la estructura desde. Solución Recordemos que factorial de N responde a la fórmula N! = N · (N – 1) · (N – 2) · (N – 3) · ... · 3 · 2 · 1 El algoritmo desde supone conocer el número de iteraciones: var entero : I, N real : FACTORIAL inicio leer(N) FACTORIAL ← 1 desde I ← 1 hasta N hacer FACTORIAL ← FACTORIAL * I fin_desde escribir('El factorial de', N, 'es', FACTORIAL) fin 5.2. Imprimir las treinta primeras potencias de 4, es decir, 4 elevado a 1, 4 elevado a 2, etc. Solución algoritmo potencias4 var entero : n inicio desde n ← 1 hasta 30 hacer escribir(4 ^ n) fin_desde fin 5.3. Calcular la suma de los n primeros números enteros utilizando la estructura desde. Solución S = 1 + 2 + 3 + ... + n El pseudocódigo correspondiente es algoritmo sumaNenteros var entero : i, n real : suma inicio leer(n) suma ← 0 desde i ← 1 hasta n hacer suma ← suma + 1 fin_desde {escribir el resultado de suma} escribir(suma) fin
  • 217. Flujo de control II: Estructuras repetitivas 187 5.4. Diseñar el algoritmo para imprimir la suma de los números impares menores o iguales que n. Solución Los números impares son 1, 3, 5, 7, ..., n. El pseudocódigo es algoritmo sumaimparesmenores var entero : i, n real : S inicio S ← 0 leer(n) desde i ← 1 hasta n inc 2 hacer S ← S + i fin_desde escribir(S) fin 5.5. Dados dos números enteros, realizar el algoritmo que calcule su cociente y su resto. Solución Sean los números M y N. El método para obtener el cociente y el resto es por restas sucesivas; el método sería restar suce- sivamente el divisor del dividendo hasta obtener un resultado menor que el divisor, que será el resto de la división; el nú- mero de restas efectuadas será el cociente 50 |13 50 – 13 = 37 C = 1 11 3 37 – 13 = 24 C = 2 24 – 13 = 11 C = 3 Como 11 es menor que el divisor 13, se terminarán las restas sucesivas y entonces 11 será el resto y 3 (número de restas) el cociente. Por consiguiente, el algoritmo será el siguiente: algoritmo cociente var entero : M, N, Q, R inicio leer(M, N) {M, dividendo / N, divisor} R ← M Q ← 0 repetir R ← R - N Q ← Q + 1 hasta_que R N escribir('dividendo',M, 'divisor',N, 'cociente',Q, 'resto',R) fin 5.6. Realizar el algoritmo para obtener la suma de los números pares hasta 1.000 inclusive. Solución Método 1 S = 2 + 4 + 6 + 8 + ... + 1.000 algoritmo sumapares var real : NUMERO, SUMA
  • 218. 188 Fundamentos de programación inicio SUMA ← 2 NUMERO ← 4 mientras NUMERO = 1.000 hacer SUMA ← SUMA + NUMERO NUMERO ← NUMERO + 2 fin_mientras fin Método 2 {idéntica cabecera y declaraciones} inicio SUMA ← 2 NUMERO ← 4 repetir SUMA ← SUMA + NUMERO NUMERO ← NUMERO + 2 hasta_que NUMERO 1000 fin 5.7. Buscar y escribir la primera vocal leída del teclado. (Se supone que se leen, uno a uno, caracteres desde el te- clado.) Solución algoritmo buscar_vocal var carácter: p inicio repetir leer(p) hasta_que p = 'a' o p = 'e' o p = 'i' o p = 'o' o p = 'u' escribir('Primero', p) fin 5.8. Se desea leer de una consola a una serie de números hasta obtener un número inferior a 100. Solución algoritmo menor_100 var real : numero inicio repetir escribir('Teclear un numero') leer(numero) hasta_que numero 100 escribir('El numero es', numero) fin 5.9. Escribir un algoritmo que permita escribir en una pantalla la frase ‘¿Desea continuar? S/N’ hasta que la respuesta sea 'S' o 'N'. Solución algoritmo SN var carácter : respuesta
  • 219. Flujo de control II: Estructuras repetitivas 189 inicio repetir escribir('Desea continuar S/N') leer(respuesta) hasta_que(respuesta = 'S') o (respuesta = 'N') fin 5.10. Leer sucesivamente números del teclado hasta que aparezca un número comprendido entre 1 y 5. Solución algoritmo numero1_5 var entero : numero inicio repetir escribir('Numero comprendido entre 1 y 5') leer(numero) hasta_que(numero = 1) y (numero = 5) escribir('Numero encontrado', numero) fin 5.11. Calcular el factorial de un número n con métodos diferentes al Ejercicio 5.1. Solución n! = n × (n – 1) × (n – 2) × ... × 3 × 2 × 1 es decir, 5! = 5 × 4 × 3 × 2 × 1 = 120 4! = 4 × 3 × 2 × 1 = 24 3! = 3 × 2 × 1 = 6 2! = 2 × 1 = 2 1! = 1 = 1 Para codificar estas operaciones basta pensar que (n + 1)! = (n + 1) × n × (n – 1) × (n – 2) × ... × 3 × 2 × 1 { n! (n + 1)! = (n + 1) × n! Por consiguiente, para calcular el factorial FACTORIAL de un número, necesitaremos un contador i que cuente de uno en uno y aplicar la fórmula FACTORIAL = FACTORIAL * i inicializando los valores de FACTORIAL e i a 1 y realizando un bucle en el que i se incremente en 1 a cada iteración, es decir, Algoritmo 1 de Factorial de n FACTORIAL ← 1 i ← 1 repetir FACTORIAL ← FACTORIAL * i i ← i + 1 hasta_que i = n + 1
  • 220. 190 Fundamentos de programación Algoritmo 2 de Factorial de n FACTORIAL ← 1 i ← 1 repetir FACTORIAL ← FACTORIAL * (i + 1) i ← i + 1 hasta_que i = n Algoritmo 3 de Factorial de n FACTORIAL ← 1 i ← 1 repetir FACTORIAL ← FACTORIAL * (i + 1) i ← i + 1 hasta_que i n - 1 Algoritmo 4 de factorial de n FACTORIAL ← 1 i ← 1 desde i ← 1 hasta n - 1 hacer FACTORIAL ← FACTORIAL * (i + 1) fin_desde Un algoritmo completo con lectura del número n por teclado podría ser el siguiente: algoritmo factorial var entero : i, n real : f inicio f ← 1 i ← 1 leer(n) repetir f ← f * i i ← i + 1 hasta_que i = n + 1 escribir('Factorial de', n, 'es', f) fin 5.12. Calcular el valor máximo de una serie de 100 números. Solución Para resolver este problema necesitaremos un contador que cuente de 1 a 100 para contabilizar los sucesivos números. El algoritmo que calcula el valor máximo será repetido y partiremos considerando que el primer número leído es el valor máximo, por lo cual se realizará una primera asignación del número 1 a la variable máximo. La siguiente acción del algoritmo será realizar comparaciones sucesivas: • leer un nuevo número • compararlo con el valor máximo • si es inferior, implica que el valor máximo es el antiguo; • si es superior, implica que el valor máximo es el recientemente leído, por lo que éste se convertirá en máximo me- diante una asignación; • repetir las acciones anteriores hasta que n = 100.
  • 221. Flujo de control II: Estructuras repetitivas 191 algoritmo maximo var entero : n, numero, maximo inicio leer(numero) n ← 1 maximo ← numero repetir n ← n+1 leer(numero) si numero maximo entonces maximo ← numero fin_si hasta_que n = 100 escribir('Numero mayor o maximo', maximo) fin Otras soluciones 1. algoritmo otromaximo var entero : n, numero, maximo inicio leer(numero) maximo ← numero n ← 2 repetir n ← n + 1 leer(numero) si numero maximo entonces maximo ← numero fin_si hasta_que n 100 escribir('Numero mayor o maximo', maximo) fin 2. algoritmo otromaximo var entero : n, numero, maximo inicio leer(numero) maximo ← numero para n = 2 hasta 100 hacer //pseudocódigo sustituto de desde leer(numero) si numero maximo entonces maximo ← numero fin_si fin_para escribir('Maximo,', maximo) fin NOTA: Los programas anteriores suponen que los números pueden ser positivos o negativos; si se desea comparar sólo números positivos, los programas correspondientes serían: 1. algoritmo otromaximo var entero : n, numero, maximo inicio n ← 0 maximo ← 0
  • 222. 192 Fundamentos de programación repetir leer(numero) n = n + 1 si numero maximo entonces maximo ← numero fin_si hasta_que n = 100 escribir('Maximo numero', maximo) fin 2. algoritmo otromaximo var entero : n, numero, maximo inicio n ← 0 maximo ← 0 para N ← 1 hasta 100 hacer leer(numero) si numero maximo entonces maximo ← numero fin_si fin_para escribir('Maximo numero =', maximo) fin 5.13. Bucles anidados. Las estructuras de control tipo bucles pueden anidarse internamente, es decir, se puede situar un bucle en el interior de otro bucle. Solución La anidación puede ser: • bucles repetir dentro de bucles repetir, • bucles para (desde) dentro de bucles repetir, • etc. Ejemplo 1. Bucle para en el interior de un bucle repetir-hasta_que repetir leer(n) para i ← 1 hasta hacer 5 escribir(n * n) fin_para hasta_que n = 0 escribir('Fin') Si ejecutamos estas instrucciones, se obtendrá para: n = 5 resultados 25 25 25 25 25 n = 2 resultados 4 4 4 4 4
  • 223. Flujo de control II: Estructuras repetitivas 193 n = 0 resultados 0 0 0 0 0 fin Ejemplo 2. Bucles anidados para (desde) para i ← 1 hasta 3 hacer para j ← 1 hasta 10 hacer escribir(i, 'por', j, '=', i*j) fin_para fin_para Los valores sucesivos de i, j, i*j, serán i = 1 j = 1 i * j = 1 x 1 = 1 j = 2 i * j = 1 x 2 = 2 j = 3 i * j = 1 x 3 = 3 j = 4 i * j = 1 x 4 = 4 .................................. j = 10 i * j = 1 x 10 = 10 i = 2 j = 1 i * j = 2 x 1 = 2 j = 2 i * j = 2 x 2 = 4 j = 3 i * j = 2 x 3 = 6 j = 4 i * j = 2 x 4 = 8 .................................. j = 10 i * j = 2 x 10 = 20 i = 3 j = 1 i * j = 3 x 1 = 3 j = 2 i * j = 3 x 2 = 6 j = 3 i * j = 3 x 3 = 9 j = 4 i * j = 3 x 4 = 12 .................................. j = 10 i * j = 3 x 10 = 30 Es decir, se obtendrá la tabla de multiplicar de 1, 2 y 3. Ejemplo 3. La codificación completa para obtener la popular tabla de multiplicar de los escolares sería la siguiente: algoritmo Tabla_de_multiplicar var entero : i, j, producto inicio para ← 1 hasta 9 hacer escribir('Tabla del', i) para j ← 1 hasta 10 hacer producto ← i * j escribir(i, 'por', j, '=', producto) fin_para fin_para fin 5.14. Se dispone de una lista de N números. Se desea calcular el valor del número mayor. Solución algoritmo var entero : I
  • 224. 194 Fundamentos de programación real : NUM, MAX entero : N inicio leer(N) leer(NUM) MAX ← NUM desde I ← 2 hasta 100 hacer leer(NUM) si NUM MAX entonces MAX ← NUM fin_si fin_desde fin 5.15. Determinar simultáneamente los valores máximo y mínimo de una lista de 100 números. Solución algoritmo max_min var entero : I real : MAX, MIN, NUMERO inicio leer(NUMERO) MAX ← NUMERO MIN ← NUMERO desde I ← 2 hasta 100 hacer leer(NUMERO) si NUMERO MAX entonces MAX ← NUMERO si_no si NUMERO MIN entonces MIN ← NUMERO fin_si fin_si fin_desde escribir('Maximo', MAX, 'Minimo', MIN) fin 5.16. Se dispone de un cierto número de valores de los cuales el último es el 999 y se desea determinar el valor máximo de las medias correspondientes a parejas de valores sucesivos. Solución algoritmo media_parejas var entero : N1, N2 real : M, MAX inicio leer(N1, N2) MAX ← (N1 + N2)/ 2 mientras (N2 999) o (N1 999) hacer leer(N1, N2) M ← (N1 + N2)/2 si M MAX entonces MAX ← M fin_si fin_mientras escribir('Media maxima =' MAX) fin
  • 225. Flujo de control II: Estructuras repetitivas 195 5.17. Detección de entradas numéricas —enteros— erróneas. Solución Análisis Este algoritmo es una aplicación sencilla de «interruptor». Se sitúa el valor inicial del interruptor (SW = 0) antes de re- cibir la entrada de datos. La detección de números no enteros se realizará con una estructura repetitiva mientras que se realizará si SW = 0. La instrucción que detecta si un número leído desde el dispositivo de entradas es entero: leer(N) Realizará la comparación de N y parte entera de N: • si son iguales, N es entero, • si son diferentes, N no es entero. Un método para calcular la parte entera es utilizar la función estándar ent (int) existente en muchos lenguajes de programación. Pseudocódigo algoritmo error var entero : SW real : N inicio SW ← 0 mientras SW = 0 hacer leer(N) si N ent(N) entonces escribir('Dato no valido') escribir('Ejecute nuevamente') SW ← 1 si_no escribir('Correcto', N, 'es entero') fin_si fin_mientras fin 5.18. Calcular el factorial de un número dado (otro nuevo método). Solución Análisis El factorial de un número N (N!) es el conjunto de productos sucesivos siguientes: N! = N * (N – 1) * (N – 2) * (N – 3) * ... * 3 * 2 * 1 Los factoriales de los primeros números son: 1! = 1 2! = 2 * 1 = 2 * 1! 3! = 3 * 2 * 1 = 3 * 2! 4! = 4 * 3 * 2 * 1 = 4 * 3! . . . N! = N * (N – 1) * (N – 2) * ... * 2 * 1 = N * (N – 1)!
  • 226. 196 Fundamentos de programación Los cálculos anteriores significan que el factorial de un número se obtiene con el producto del número N por el factorial de (N – 1)! Como comienzan los productos en 1, un sistema de cálculo puede ser asignar a la variable factorial el valor 1. Se ne- cesita otra variable I que tome los valores sucesivos de 1 a N para poder ir efectuando los productos sucesivos. Dado que en los números negativos no se puede definir el factorial, se deberá incluir en el algoritmo una condición para verificación de error, caso de que se introduzcan números negativos desde el terminal de entrada (N 0). La solución del problema se realiza por dos métodos: 1. Con la estructura repetir (repeat). 2. Con la estructura desde (for). Pseudocódigo Método 1 (estructura repetir) algoritmo FACTORIAL var entero : I, N real : factorial inicio repetir leer(N) hasta_que N 0 factorial ← 1 I ← 1 repetir factorial ← factorial * I I ← I + 1 hasta_que I = N + 1 escribir(factorial) fin Método 2 (estructura desde) algoritmo FACTORIAL var entero : K, N real : factorial inicio leer(N) si n 0 entonces escribir('El numero sera positivo') si_no factorial ← 1 si N 1 entonces desde K ← 2 hasta N hacer factorial ← factorial * K fin_desde fin_si escribir('Factorial de', N, '=', factorial) fin_si fin
  • 227. Flujo de control II: Estructuras repetitivas 197 5.19. Se tienen las calificaciones de los alumnos de un curso de informática correspondiente a las asignaturas BASIC, Pascal, FORTRAN. Diseñar un algoritmo que calcule la media de cada alumno. Solución Análisis Asignaturas: C Pascal FORTRAN Media: (C + Pascal + FORTRAN) ______________________________ 3 Se desconoce el número de alumnos N de la clase; por consiguiente, se utilizará una marca final del archivo ALUMNOS. La marca final es ‘***’ y se asignará a la variable nombre. Pseudocódigo algoritmo media var cadena : nombre real : media real : BASIC, Pascal, FORTRAN inicio {entrada datos de alumnos} leer(nombre) mientras nombre '***' hacer leer(BASIC, Pascal, FORTRAN) media ← (BASIC + Pascal + FORTRAN) / 3 escribir(nombre, media) leer(nombre) fin_mientras fin CONCEPTOS CLAVE • bucle. • bucle anidado. • bucle infinito. • bucle sin fin. • centinela. • iteración. • pasada. • programación estructurada. • sentencia continuar. • sentencia ir_a. • sentencia interrumpir. • sentencia de repetición. • sentencia desde. • sentencia hacer-mientras. • sentencia mientras. • sentencia nula. • sentencia repetir-hasta_ que. Este capítulo examina los aspectos fundamentales de la ite- ración y el modo de implementar esta herramienta de pro- gramación esencial utilizando los cuatro tipos fundamentales de sentencias de iteración: mientras, hacer-mien- tras, repetir-hasta_que y desde (para). 1. Una sección de código repetitivo se conoce como bucle. El bucle se controla por una sentencia de repetición que comprueba una condición para de- terminar si el código se ejecutará. Cada pasada a través del bucle se conoce como una iteración o repetición. Si la condición se evalúa como falsa en la primera iteración, el bucle se termina y se habrán ejecutado las sentencias del cuerpo del bucle una sola vez. Si la condición se evalúa como verdadera la primera vez que se ejecuta el bucle, será necesa- RESUMEN
  • 228. 198 Fundamentos de programación rio que se modifiquen alguna/s sentencias del inte- rior del bucle para que se altere la condición co- rrespondiente. 2. Existen cuatro tipos básicos de bucles: mientras, hacer-mientras, repetir-hasta_que y des- de. Los bucles mientras y desde son bucles contro- lados por la entrada o pretest. En este tipo de bu- cles, la condición comprobada se evalúa al principio del bucle, que requiere que la condición sea com- probada explícitamente antes de la entrada al bucle. Si la condición es verdadera, las repeticiones del bucle comienzan; en caso contrario, no se introdu- ce al bucle. Las iteraciones continúan mientras que la condición permanece verdadera. En la mayoría de los lenguajes, estas sentencias se construyen uti- lizando, respectivamente, las sentencias while y for. Los bucles hacer-mientras y repetir- hasta_que son bucles controlados por salida o posttest, en los que la condición a evaluar se com- prueba al final del bucle. El cuerpo del bucle se ejecuta siempre al menos una vez. El bucle hacer- mientras se ejecuta siempre que la condición sea verdadera y se termina cuando la condición se hace falsa; por el contrario, el bucle repetir-hasta_que se realiza siempre que la condición es falsa y se ter- mina cuando la condición se hace verdadera. 3. Los bucles también se clasifican en función de la condición probada. En un bucle de conteo fijo, la condición sirve para fijar cuantas iteraciones se rea- lizarán. En un bucle con condición variable (mien- tras, hacer-mientras y repetir-hasta_ que), la condición comprobada está basada en que una variable puede cambiar interactivamente con cada iteración a través del bucle. 4. Un bucle mientras es un bucle con condición de entrada, de modo que puede darse el caso de que su cuerpo de sentencias no se ejecute nunca si la condición es falsa en el momento de entrar al bucle. Por el contrario, los bucles hacer-mientras y repe- tir-hasta_que son bucles de salida y, por consi- guiente, las sentencias del cuerpo del bucle al me- nos se ejecutarán una vez. 5. La sintaxis de la sentencia mientras es: mientras cuenta = 1 sentencias mientras (cuenta = 10) hacer cuenta = cuenta + 1 fin_mientras fin_mientras 6. La sentencia desde (for) realiza las mismas fun- ciones que la sentencia mientras pero utiliza un formato diferente. En muchas situaciones, especial- mente aquellas que utilizan una condición de con- teo fijo, la sentencia desde es más fácil de utilizar que la sentencia mientras equivalente. desde v ← vi hasta of [inc/dec] hacer sentencias fin_desde 7. La sentencia hacer_mientras se utiliza para crear bucles posttest, ya que comprueba su expre- sión al final del bucle. Esta característica asegura que el cuerpo de un bucle hacer se ejecuta al menos una vez. Dentro de un bucle hacer debe haber al menos una sentencia que modifique el valor de la expresión comprobada. 8. La programación estructurada utiliza las sentencias explicadas en este capítulo. Esta programación se centra en el modo de escribir las partes detalladas de programas de una computadora como módulos independientes. Su filosofía básica es muy simple: «Utilice sólo construcciones que tengan un punto de entrada y un punto de salida». Esta regla básica se puede romper fácilmente si se utiliza la sentencia de salto ir_a, por lo que no es recomendable su uso, excepto en situaciones excepcionales. EJERCICIOS 5.1. Determinar la media de una lista indefinida de núme- ros positivos, terminados con un número negativo. 5.2. Dado el nombre de un mes y si el año es o no bisies- to, deducir el número de días del mes. 5.3. Sumar los números enteros de 1 a 100 mediante: a) estructura repetir; b) estructura mientras; c) es- tructura desde. 5.4. Determinar la media de una lista de números positivos terminada con un número no positivo después del úl- timo número válido. 5.5. Imprimir todos los números primos entre 2 y 1.000 inclusive. 5.6. Se desea leer las calificaciones de una clase de infor- mática y contar el número total de aprobados (5 o mayor que 5).
  • 229. Flujo de control II: Estructuras repetitivas 199 5.7. Leer las notas de una clase de informática y deducir todas aquellas que son NOTABLES (= 7 y 9). 5.8. Leer 100 números. Determinar la media de los nú- meros positivos y la media de los números negati- vos. 5.9. Un comercio dispone de dos tipos de artículos en fichas correspondientes a diversas sucursales con los siguientes campos: • código del artículo A o B, • precio unitario del artículo, • número de artículos. La última ficha del archivo de artículos tiene un código de artículo, una letra X. Se pide: • el número de artículos existentes de cada catego- ría, • el importe total de los artículos de cada catego- ría. 5.10. Una estación climática proporciona un par de tem- peraturas diarias (máxima, mínima) (no es posible que alguna o ambas temperaturas sea 9 grados). La pareja fin de temperaturas es 0,0. Se pide determinar el número de días, cuyas temperaturas se han pro- porcionado, las medias máxima y mínima, el núme- ro de errores —temperaturas de 9°— y el porcenta- je que representaban. 5.11. Calcular: E(x) = 1 + x = x2 2! + ... + nn n! a) Para N que es un entero leído por teclado. b) Hasta que N sea tal que xn /n E (por ejemplo, E = 10–4 ). 5.12. Calcular el enésimo término de la serie de Fibonac- ci definida por: A1 = 1 A2 = 2 A3 = 1 + 2 = A1 + A2 An = An – 1 + An – 2 (n = 3) 5.13. Se pretende leer todos los empleados de una empre- sa —situados en un archivo EMPRESA— y a la ter- minación de la lectura del archivo se debe visualizar un mensaje «existen trabajadores mayores de 65 años en un número de ...» y el número de trabajado- res mayores de 65 años. 5.14. Un capital C está situado a un tipo de interés R. ¿Al término de cuántos años se doblará? 5.15. Se desea conocer una serie de datos de una empresa con 50 empleados: a) ¿Cuántos empleados ganan más de 300.000 pesetas al mes (salarios altos); b) entre 100.000 y 300.000 pesetas (salarios medios); y c) menos de 100.000 pesetas (salarios bajos y em- pleados a tiempo parcial)? 5.16. Imprimir una tabla de multiplicar como 1 2 3 4 ... 15 ** ** ** ** ** ... ** 1* 1 2 3 4 ... 15 2* 2 4 6 8 ... 30 3* 3 6 9 12 ... 45 4* 4 8 12 16 ... 60 . . . 15* 15 30 45 60 ... 225 5.17. Dado un entero positivo n ( 1), comprobar si es primo o compuesto. REFERENCIAS BIBLIOGRÁFICAS DIJKSTRA, E. W.: «Goto Statement Considered Harmful», Communications of the ACM, vol. 11, núm. 3, marzo 1968, 147-148, 538, 541. KNUTH, D. E.: «Structured Programming with goto Statements», Computing Surveys, vol. 6, núm. 4, diciembre 1974, 261.
  • 231. CAPÍTULO 6 Subprogramas (subalgoritmos): Funciones 6.1. Introducción a los subalgoritmos o subpro- gramas 6.2. Funciones 6.3. Procedimientos (subrutinas) 6.4. Ámbito: variables locales y globales 6.5. Comunicación con subprogramas: paso de parámetros 6.6. Funciones y procedimientos como paráme- tros 6.7. Los efectos laterales 6.8. Recursión (recursividad) 6.9. Funciones en C/C++ , Java y C# 6.10. Ámbito (alcance) y almacenamiento en C/C++ y Java 6.11. Sobrecarga de funciones en C++ y Java ACTIVIDADES DE PROGRAMACIÓN RESUELTAS CONCEPTOS CLAVE RESUMEN EJERCICIOS La resolución de problemas complejos se facilita consi- derablemente si se dividen en problemas más peque- ños (subproblemas). La solución de estos subproblemas se realiza con subalgoritmos. El uso de subalgoritmos permite al programador desarrollar programas de pro- blemas complejos utilizando el método descendente introducido en los capítulos anteriores. Los subalgorit- mos (subprogramas) pueden ser de dos tipos: funcio- nes y procedimientos o subrutinas. Los subalgoritmos son unidades de programa o módulos que están dise- ñados para ejecutar alguna tarea específica. Estas fun- ciones y procedimientos se escriben solamente una vez, pero pueden ser referenciados en diferentes pun- tos de un programa, de modo que se puede evitar la duplicación innecesaria del código. Las unidades de programas en el estilo de progra- mación modular son independientes; el programador puede escribir cada módulo y verificarlo sin preocu- parse de los detalles de otros módulos. Esto facilita considerablemente la localización de un error cuando se produce. Los programas desarrollados de este modo son normalmente también más fáciles de com- prender, ya que la estructura de cada unidad de pro- grama puede ser estudiada independientemente de las otras unidades de programa. En este capítulo se describen las funciones y procedimientos, junto con los conceptos de variables locales y globales, así como parámetros. Se introduce también el concepto de re- cursividad como una nueva herramienta de resolución de problemas. INTRODUCCIÓN
  • 232. 202 Fundamentos de programación 6.1. INTRODUCCIÓN A LOS SUBALGORITMOS O SUBPROGRAMAS Un método ya citado para solucionar un problema complejo es dividirlo en subproblemas —problemas más senci- llos— y a continuación dividir estos subproblemas en otros más simples, hasta que los problemas más pequeños sean fáciles de resolver. Esta técnica de dividir el problema principal en subproblemas se suele denominar “divide y ven- cerás” (divide and conquer). Este método de diseñar la solución de un problema principal obteniendo las soluciones de sus subproblemas se conoce como diseño descendente (top-down design). Se denomina descendente, ya que se inicia en la parte superior con un problema general y el diseño específico de las soluciones de los subproblemas. Normalmente las partes en que se divide un programa deben poder desarrollarse independientemente entre sí. Las soluciones de un diseño descendente pueden implementarse fácilmente en lenguajes de programación de alto nivel, como C/C++, Pascal o FORTRAN. Estas partes independientes se denominan subprogramas o subalgoritmos si se emplean desde el concepto algorítmico. La correspondencia entre el diseño descendente y la solución por computadora en términos de programa principal y sus subprogramas se analizará a lo largo de este capítulo. Consideremos el problema del cálculo de la superficie (área) de un rectángulo. Este problema se puede dividir en tres subproblemas: subproblema 1: entrada de datos de altura y base. subproblema 2: cálculo de la superficie. subproblema 3: salida de resultados. El algoritmo correspondiente que resuelve los tres subproblemas es: leer (altura, base) //entrada de datos area ← base * altura //cálculo de la superficie escribir(base, altura, area) //salida de resultados El método descendente se muestra en la Figura 6.1. Problema principal Algoritmo principal Subproblema 1 Subproblema 2 Subproblema 3 Subalgoritmo 1 Subalgoritmo 2 Subalgoritmo 3 Figura 6.1. Diseño descendente. El problema principal se soluciona por el correspondiente programa o algoritmo principal —también denomi- nado controlador o conductor (driver)— y la solución de los subproblemas mediante subprogramas, conocidos como procedimientos (subrutinas) o funciones. Los subprogramas, cuando se tratan en lenguaje algorítmico, se denomi- nan también subalgoritmos. Un subprograma puede realizar las mismas acciones que un programa: 1) aceptar datos, 2) realizar algunos cálculos y 3) devolver resultados. Un subprograma, sin embargo, se utiliza por el programa para un propósito espe- cífico. El subprograma recibe datos desde el programa y le devuelve resultados. Haciendo un símil con una oficina, el problema es como el jefe que da instrucciones a sus subordinados —subprogramas—; cuando la tarea se termina, el subordinado devuelve sus resultados al jefe. Se dice que el programa principal llama o invoca al subprograma. El subprograma ejecuta una tarea, a continuación devuelve el control al programa. Esto puede suceder en diferentes
  • 233. Subprogramas (subalgoritmos): Funciones 203 lugares del programa. Cada vez que el subprograma es llamado, el control retorna al lugar desde donde fue hecha la llamada (Figura 6.2). Un subprograma puede llamar a su vez a sus propios subprogramas (Figura 6.3). Existen —como ya se ha comentado— dos tipos importantes de subprogramas: funciones y procedimientos o subrutinas. Programa Algoritmo Subprograma Subalgoritmo Retorno 2 Llamada 2 Llamada 1 Retorno 1 Figura 6.2. Un programa con un subprograma: función y procedimiento o subrutina, según la terminología específica del lenguaje: subrutina en BASIC y FORTRAN, función en C, C++, método en Java o C#, procedimiento o función en Pascal. Subprograma 1 Subprograma 1.1 Subprograma 2 Programa Figura 6.3. Un programa con diferentes niveles de subprogramas. 6.2. FUNCIONES Matemáticamente una función es una operación que toma uno o más valores llamados argumentos y produce un va- lor denominado resultado —valor de la función para los argumentos dados—. Todos los lenguajes de programación tienen funciones incorporadas, intrínsecas o internas —en el Capítulo 3 se vieron algunos ejemplos—, y funciones definidas por el usuario. Así, por ejemplo f(x) = x 1 + x2 donde f es el nombre de la función y x es el argumento. Obsérvese que ningún valor específico se asocia con x; es un parámetro formal utilizado en la definición de la función. Para evaluar f debemos darle un valor real o actual a x; con este valor se puede calcular el resultado. Con x = 3 se obtiene el valor 0.3 que se expresa escribiendo f(3) = 0.3 f(3) = 3 1 + 9 = 3 10 = 0.3 Una función puede tener varios argumentos. Por consiguiente, f(x, y) = x – y √ x + √ y es una función con dos argumentos. Sin embargo, solamente un único valor se asocia con la función para cualquier par de valores dados a los argumentos.
  • 234. 204 Fundamentos de programación Cada lenguaje de programación tiene sus propias funciones incorporadas, que se utilizan escribiendo sus nombres con los argumentos adecuados en expresiones tales como raiz2(A+cos(x)) Cuando la expresión se evalúa, el valor de x se da primero al subprograma (función) coseno y se calcula cos(x). El valor de A+cos(x) se utiliza entonces como argumento de la función raiz2 (raíz cuadrada), que evalúa el resultado final. Cada función se evoca utilizando su nombre en una expresión con los argumentos actuales o reales encerrados entre paréntesis. Las funciones incorporadas al sistema se denominan funciones internas o intrínsecas y las funciones definidas por el usuario, funciones externas. Cuando las funciones estándares o internas no permiten realizar el tipo de cálcu- lo deseado es necesario recurrir a las funciones externas que pueden ser definidas por el usuario mediante una decla- ración de función. A una función no se le llama explícitamente, sino que se le invoca o referencia mediante un nombre y una lista de parámetros actuales. El algoritmo o programa llama o invoca a la función con el nombre de esta última en una expresión seguida de una lista de argumentos que deben coincidir en cantidad, tipo y orden con los de la función que fue definida. La función devuelve un único valor. Las funciones son diseñadas para realizar tareas específicas: toman una lista de valores —llamados argumen- tos— y devolver un único valor. 6.2.1. Declaración de funciones La declaración de una función requiere una serie de pasos que la definen. Una función como tal subalgoritmo o subprograma tiene una constitución similar a los algoritmos, por consiguiente, constará de una cabecera que comen- zará con el tipo del valor devuelto por la función, seguido de la palabra función y del nombre y argumentos de dicha función. A continuación irá el cuerpo de la función, que será una serie de acciones o instrucciones cuya ejecu- ción hará que se asigne un valor al nombre de la función. Esto determina el valor particular del resultado que ha de devolverse al programa llamador. La declaración de la función será; tipo_de_resultado funcion nombre_fun (lista de parametros) [declaraciones locales] inicio acciones //cuerpo de la funcion devolver (expresion) fin_función lista de parámetros lista de parámetros formales o argumentos, con uno o más argumentos de la siguien- te forma: ({E|S|E/S} tipo_de_datoA: parámetro 1[, parámetro 2]...; {E|S|E/S} tipo_de_datoB: parámetro x[, parámetro y]...) nombre_func nombre asociado con la función, que será un nombre de identificador válido acciones instrucciones que constituyen la definición de la funcion y que debe contener una única instrucción: devolver (expresion); expresión sólo existe si la función se ha declarado con valor de retorno y expresión es el valor devuelto por la fun- ción tipo_de_resultado tipo del resultado que devuelve la función
  • 235. Subprogramas (subalgoritmos): Funciones 205 Sentencia devolver (return) La sentencia devolver (return, volver) se utiliza para regresar de una función (un método en programación orien- tada a objetos); devolver hace que el control del programa se transfiera al llamador de la función (método). Esta sentencia se puede utilizar para hacer que la ejecución regrese de nuevo al llamador de la función. Regla La sentencia devolver termina inmediatamente la función en la cual se ejecuta. Por ejemplo, la función: f(x) = x 1 + x2 se definirá como: real función F(E real:x) inicio devolver (x/(1+x*x)) fin_función Otro ejemplo puede ser la definición de la función trigonométrica, cuyo valor es tan(x) = sen(x) cos(x) donde sen(x) y cos(x) son las funciones seno y coseno —normalmente funciones internas—. La declaración de la función es real función tan (E real:x) //funcion tan igual a sen(x)/cos(x), angulo x en radianes inicio devolver (sen(x)/cos(x)) fin_función Observe que se incluye un comentario para describir la función. Es buena práctica incluir documentación que describa brevemente lo que hace la función, lo que representan sus parámetros o cualquier otra información que explique la definición de la función. En aquellos lenguajes de programación —como Pascal— que exigen sección de declaraciones, éstas se situarán al principio de la función. Para que las acciones descritas en un subprograma función sean ejecutadas, se necesita que éste sea invocado desde un programa principal o desde otros subprogramas a fin de proporcionarle los argumentos de entrada necesarios para realizar esas acciones. Los argumentos de la declaración de la función se denominan parámetros formales, ficticios o mudos (“dummy”); son nombres de variables, de otras funciones o procedimientos y que sólo se utilizan dentro del cuerpo de la función. Los argumentos utilizados en llamada a la función se denominan parámetros actuales, que a su vez pueden ser cons- tantes, variables, expresiones, valores de funciones o nombres de funciones o procedimientos. 6.2.2. Invocación a las funciones Una función puede ser llamada de la forma siguiente: nombre_función (lista de parametros actuales)
  • 236. 206 Fundamentos de programación nombre_función función que llama lista de parametros actuales constantes, variables, expresiones, valores de funciones. nom- bres de funciones o procedimientos Cada vez que se llama a una función desde el algoritmo principal se establece automáticamente una correspon- dencia entre los parámetros formales y los parámetros actuales. Debe haber exactamente el mismo número de pará- metros actuales que de parámetros formales en la declaración de la función y se presupone una correspondencia uno a uno de izquierda a derecha entre los parámetros formales y los actuales. Una llamada a la función implica los siguientes pasos: 1. A cada parámetro formal se le asigna el valor real de su correspondiente parámetro actual. 2. Se ejecuta el cuerpo de acciones de la función. 3. Se devuelve el valor de la función y se retorna al punto de llamada. EJEMPLO 6.1 Definición de la función: y = xn (potencia n de x) real : función potencia(E real:x;E entero:n) var entero: i, y inicio y ← 1 desde i ← 1 hasta abs(n) hacer y ← y*x fin_desde si n 0 entonces y ← 1/y fin_si devolver (y) fin_función abs(n) es la función valor absoluto de n a fin de considerar exponentes positivos o negativos. Invocación de la función z ← potencia (2.5, –3) { parámetros actuales Transferencia de información x = 2.5 n = –3 z = 0.064 EJEMPLO 6.2 Función potencia para el cálculo de N elevado a A. El número N deberá ser positivo, aunque podrá tener parte frac- cionaria, A es un real. algoritmo Elevar_a_potencia var real : a, n
  • 237. Subprogramas (subalgoritmos): Funciones 207 inicio escribir('Deme numero positivo ') leer(n) escribir('Deme exponente ') leer(a) escribir('N elevado a =', potencia(n, a)) fin real función potencia (E real: n, a) inicio devolver(EXP(a * LN(n))) fin_función EJEMPLO 6.3 Diseñar un algoritmo que contenga un subprograma de cálculo del factorial de un número y una llamada al mismo. Como ya es conocido por el lector el algoritmo factorial, lo indicaremos expresamente. entero función factorial(E entero:n) var entero: i,f //advertencia, segun el resultado, f puede ser real inicio f ← 1 desde i ← 1 hasta n hacer f ← f * i fin_desde devolver (f) fin_función y el algoritmo que contiene un subprograma de cálculo del factorial de un número y una llamada al mismo: algoritmo función_factorial var entero: x, y, numero inicio escribir ('Deme un numero entero y positivo') leer(numero) x ← factorial(numero) y ← factorial(5) escribir(x, y) fin En este caso los parámetros actuales son: una variable (número) y una constante (5). EJEMPLO 6.4 Realizar el diseño de la función y = x3 (cálculo del cubo de un número). algoritmo prueba var entero: N
  • 238. 208 Fundamentos de programación inicio //Programa principal N ← cubo(2) escribir ('2 al cubo es', N) escribir ('3 al cubo es', cubo(3)) fin entero función cubo(E entero: x) inicio devolver(x*x*x) fin_función La salida del algoritmo sería: 2 al cubo es 8 3 al cubo es 27 Las funciones pueden tener muchos argumentos, pero solamente un resultado: el valor de la función. Esto limita su uso, aunque se encuentran con frecuencia en cálculos científicos. Un concepto más potente es el proporcionado por el subprograma procedimiento que se examina en el siguiente apartado. EJEMPLO 6.5 Algoritmo que contiene y utiliza unas funciones (seno y coseno) a las que les podemos pasar el ángulo en grados. algoritmo Sen_cos_en_grados var real : g inicio escribir('Deme ángulo en grados') leer(g) escribir(seno(g)) escribir(coseno(g)) fin real función coseno (E real : g) inicio devolver(COS(g*2*3.141592/360)) fin_función real: función seno (E real g) inicio devolver( SEN(g*2*3.141592/360)) fin_función EJEMPLO 6.6 Algoritmo que simplifique un quebrado, dividiendo numerador y denominador por su máximo común divisor. algoritmo Simplificar_quebrado var entero : n, d inicio escribir('Deme numerador') leer(n)
  • 239. Subprogramas (subalgoritmos): Funciones 209 escribir('Deme denominador') leer(d) escribir(n, '/', d, '=', n div mcd(n, d),'/', d div mcd(n, d)) fin entero función mcd (E entero: n, d) var entero : r inicio r ← n MOD d mientras r 0 hacer n ← d d ← r r ← n MOD d fin_mientras devolver(d) fin_función EJEMPLO 6.7 Supuesto que nuestro compilador no tiene la función seno. Podríamos calcular el seno de x mediante la siguiente serie: sen(x) = x – x3 3! + x5 5! – x7 7! + ... (hasta 17 términos) x (ángulo en radianes). El programa nos tiene que permitir el cálculo del seno de ángulos en grados mediante el diseño de una función seno(x), que utilizará, a su vez, las funciones potencia(x,n) y factorial(n), que también deberán ser imple- mentadas en el algoritmo. Se terminará cuando respondamos N (no) a la petición de otro ángulo. algoritmo Calcular_seno var real : gr carácter : resp inicio repetir escribir('Deme ángulo en grados') leer(gr) escribir('Seno(', gr, ')=', seno(gr)) escribir('¿Otro ángulo?') leer(resp) hasta_que resp = 'N' fin real función factorial (E entero:n) var real : f entero : i inicio f ← 1 desde i ← 1 hasta n hacer f ← f * i fin_desde devolver(f) fin_función
  • 240. 210 Fundamentos de programación real función potencia (E real:x; E entero:n) var real : pot entero : i inicio pot ← 1 desde i ← 1 hasta n hacer pot ← pot * x fin_desde devolver(pot) fin_función real función seno (E real:gr) var real : x, s entero : i, n inicio x ← gr * 3.141592 / 180 s ← x desde i ← 2 hasta 17 hacer n ← 2 * i – 1 si i MOD 2 0 entonces s ← s – potencia(x, n) / factorial(n) si_no s ← s + potencia(x, n) / factorial(n) fin_si fin_desde devolver(s) fin_función 6.3. PROCEDIMIENTOS (SUBRUTINAS) Aunque las funciones son herramientas de programación muy útiles para la resolución de problemas, su alcance está muy limitado. Con frecuencia se requieren subprogramas que calculen varios resultados en vez de uno solo, o que realicen la ordenación de una serie de números, etc. En estas situaciones la función no es apropiada y se necesita disponer del otro tipo de subprograma: el procedimiento o subrutina. Un procedimiento o subrutina1 es un subprograma que ejecuta un proceso específico. Ningún valor está asociado con el nombre del procedimiento; por consiguiente, no puede ocurrir en una expresión. Un procedimiento se llama escribiendo su nombre, por ejemplo, SORT, para indicar que un procedimiento denominado SORT (ORDENAR) se va a usar. Cuando se invoca el procedimiento, los pasos que lo definen se ejecutan y a continuación se devuelve el con- trol al programa que le llamó. Procedimiento versus función Los procedimientos y funciones son subprogramas cuyo diseño y misión son similares; sin embargo, existen unas diferencias esenciales entre ellos. 1. Un procedimiento es llamado desde el algoritmo o programa principal mediante su nombre y una lista de parámetros actuales, o bien con la instrucción llamar_a (call). Al llamar al procedimiento se detiene momentáneamente el programa que se estuviera realizando y el control pasa al procedimiento llamado. Después que las acciones del procedimiento se ejecutan, se regresa a la acción inmediatamente siguien- te a la que se llamó. 2. Las funciones devuelven un valor, los procedimientos pueden devolver 0,1 o n valores y en forma de lis- ta de parámetros. 3. El procedimiento se declara igual que la función, pero su nombre no está asociado a ninguno de los re- sultados que obtiene. 1 En FORTRAN, la subrutina representa el mismo concepto que procedimiento. No obstante, en la mayor parte de los lenguajes el término general para definir un subprograma es procedimiento o simplemente subprograma.
  • 241. Subprogramas (subalgoritmos): Funciones 211 La declaración de un procedimiento es similar a la de funciones. procedimiento nombre [(lista de parámetros formales)] acciones fin_procedimiento Los parámetros formales tienen el mismo significado que en las funciones; los parámetros variables —en aquellos lenguajes que los soportan, por ejemplo, Pascal— están precedidos cada uno de ellos por la palabra var para desig- nar que ellos obtendrán resultados del procedimiento en lugar de los valores actuales asociados a ellos. El procedimiento se llama mediante la instrucción [llamar_a] nombre [(lista de parámetros actuales)] La palabra llamar_a (call) es opcional y su existencia depende del lenguaje de programación. El ejemplo siguiente ilustra la definición y uso de un procedimiento para realizar la división de dos números y obtener el cociente y el resto. Variables enteras: Dividendo Divisor Cociente Resto Procedimiento procedimiento division (E entero:Dividendo,Divisor; S entero: Cociente, Resto) inicio Cociente ← Dividendo DIV Divisor Resto ← Dividendo - Cociente * Divisor fin_procedimiento Algoritmo principal algoritmo aritmética var entero: M, N, P, Q, S, T inicio leer(M, N) llamar_a division (M, N, P, Q) escribir(P, Q) llamar_a division (M * N – 4, N + 1, S, T) escribir(S, T) fin 6.3.1. Sustitución de argumentos/parámetros La lista de parámetros, bien formales en el procedimiento o actuales (reales) en la llamada se conoce como lista de parámetros.
  • 242. 212 Fundamentos de programación procedimiento demo . . . fin_procedimiento o bien procedimiento demo (lista de parametros formales) y la instrucción llamadora llamar_a demo (lista de parametros actuales) Cuando se llama al procedimiento, cada parámetro formal toma como valor inicial el valor del correspondiente parámetro actual. En el ejemplo siguiente se indican la sustitución de parámetros y el orden correcto. algoritmo demo //definición del procedimiento entero: años real: numeros, tasa inicio ... llamar_a calculo(numero, años, tasa) ... fin procedimiento calculo(S real: p1; E entero: p2; E real: p3) inicio p3 ... p1 ... p2 fin_procedimiento Las acciones sucesivas a realizar son las siguientes: 1. Los parámetros reales sustituyen a los parámetros formales. 2. El cuerpo de la declaración del procedimiento se sustituye por la llamada del procedimiento. 3. Por último, se ejecutan las acciones escritas por el código resultante. EJEMPLO 6.8 (DE PROCEDIMIENTO) Algoritmo que transforma un número introducido por teclado en notación decimal a romana. El número será entero y positivo y no excederá de 3.000. Sin utilizar programación modular algoritmo romanos var entero : n,digito,r,j inicio repetir escribir('Deme número') leer(n) hasta_que (n = 0) Y (n = 3000) r ← n digito ← r DIV 1000
  • 243. Subprogramas (subalgoritmos): Funciones 213 r ← r MOD 1000 desde j ← 1 hasta digito hacer escribir('M') fin_desde digito ← r DIV 100 r ← r MOD 100 si digito = 9 entonces escribir('C', 'M') si_no si digito 4 entonces escribir('D') desde j ← 1 hasta digito – 5 hacer escribir('C') fin_desde si_no si digito = 4 entonces escribir('C','D') si_no desde j ← 1 hasta digito hacer escribir('C') fin_desde fin_si fin_si fin_si digito ← r DIV 10 r ← r MOD 10 si digito = 9 entonces escribir('X', 'C') si_no si digito 4 entonces escribir('L') desde j ← 1 hasta digito – 5 hacer escribir('X') fin_desde si_no si digito = 4 entonces escribir('X','L') si_no desde j ← 1 hasta digito hacer escribir('X') fin_desde fin_si fin_si fin_si digito ← r si digito = 9 entonces escribir('I', 'X') si_no si digito 4 entonces escribir('V') desde j ← 1 hasta digito – 5 hacer escribir('I') fin_desde si_no si digito = 4 entonces escribir('I','V')
  • 244. 214 Fundamentos de programación si_no desde j ← 1 hasta digito hacer escribir('I') fin_desde fin_si fin_si fin_si fin Mediante programación modular algoritmo Romanos var entero : n, r, digito inicio repetir escribir('Deme número') leer(n) hasta_que (n = 0) Y (n = 3000) r ← n digito ← r Div 1000 r ← r MOD 1000 calccifrarom(digito, 'M', ' ',' ') digito ← r Div 100 r ← r MOD 100 calccifrarom(digito, 'C', 'D', 'M') digito ← r Div 10 r ← r MOD 10 calccifrarom(digito, 'X', 'L', 'C') digito ← r calccifrarom(digito, 'I', 'V', 'X') fin procedimiento calccifrarom(E entero: digito; E caracter: v1, v2, v3) var entero: j inicio si digito = 9 entonces escribir( v1, v3) si_no si digito 4 entonces escribir(v2) desde j ← 1 hasta digito – 5 hacer escribir(v1) fin_desde si_no si digito = 4 entonces escribir(v1, v2) si_no desde j ← 1 hasta digito hacer escribir(v1) fin_desde fin_si fin_si fin_si fin_procedimiento
  • 245. Subprogramas (subalgoritmos): Funciones 215 6.4. ÁMBITO: VARIABLES LOCALES Y GLOBALES Las variables utilizadas en los programas principales y subprogramas se clasifican en dos tipos: • variables locales; • variables globales. Una variable local es aquella que está declarada y definida dentro de un subprograma, en el sentido de que está dentro de ese subprograma y es distinta de las variables con el mismo nombre declaradas en cualquier parte del programa principal. El significado de una variable se confina al procedimiento en el que está declarada. Cuando otro subprograma utiliza el mismo nombre se refiere a una posición diferente en memoria. Se dice que tales variables son locales al subprograma en el que están declaradas. Una variable global es aquella que está declarada para el programa o algoritmo principal, del que dependen todos los subprogramas. La parte del programa/algoritmo en que una variable se define se conoce como ámbito o alcance (scope, en inglés). El uso de variables locales tiene muchas ventajas. En particular, hace a los subprogramas independientes, con la comunicación entre el programa principal y los subprogramas manipulados estructuralmente a través de la lista de parámetros. Para utilizar un procedimiento sólo necesitamos conocer lo que hace y no tenemos que estar preocupados por su diseño, es decir, cómo están programados. Esta característica hace posible dividir grandes proyectos en piezas más pequeñas independientes. Cuando dife- rentes programadores están implicados, ellos pueden trabajar independientemente. A pesar del hecho importante de los subprogramas independientes y las variables locales, la mayoría de los len- guajes proporcionan algún método para tratar ambos tipos de variables. (Véase Figura 6.4). Una variable local a un subprograma no tiene ningún significado en otros subprogramas. Si un subprograma asigna un valor a una de sus variables locales, este valor no es accesible a otros programas, es decir, no pueden uti- lizar este valor. A veces, también es necesario que una variable tenga el mismo nombre en diferentes subprogramas. Por el contrario, las variables globales tienen la ventaja de compartir información de diferentes subprogramas sin una correspondiente entrada en la lista de parámetros. En un programa sencillo con un subprograma, cada variable u otro identificador es o bien local al procedimiento o global al programa completo. Sin embargo, si el programa incluye procedimientos que engloban a otros procedi- mientos —procedimientos anidados—, entonces la noción de global/local es algo más complicado de entender. Programa DEMO tipo X, X1, ... Ámbito de X Ámbito de Y . . Procedimiento A tipo Y, Y1, ... Procedimiento B tipo Z, Z1, ... Procedimiento C tipo W, W1, ... . . . . . . Ámbito de Z Ámbito de W . r . . . Figura 6.4. Ambito de identificadores.
  • 246. 216 Fundamentos de programación El ámbito de un identificador (variables, constantes, procedimientos) es la parte del programa donde se conoce el identificador. Si un procedimiento está definido localmente a otro procedimiento, tendrá significado sólo dentro del ámbito de ese procedimiento. A las variables les sucede lo mismo; si están definidas localmente dentro de un procedimiento, su significado o uso se confina a cualquier función o procedimiento que pertenezca a esa defini- ción. La Figura 6.5 muestra un esquema de un programa con diferentes procedimientos, algunas variables son locales y otras globales. En la citada figura se muestra el ámbito de cada definición. C B E D F G A Variables definidas en Accesibles desde A A, B, C, D, E, F, G B B, C C C D D, E, F, G E E, F, G F F G G Figura 6.5. Ámbito de definición de variables. Los lenguajes que admiten variables locales y globales suelen tener la posibilidad explícita de definir dichas variables como tales en el cuerpo del programa, o, lo que es lo mismo, definir su ámbito de actuación, para ello se utilizan las cabeceras de programas y subprogramas, con lo que se definen los ámbitos. Las variables definidas en un ámbito son accesibles en el mismo, es decir, en todos los procedimientos interiores. EJEMPLO 6.9 La función (signo) realiza la siguiente tarea: dado un número real x, si x es 0, entonces se devuelve un 0; si x es positivo, se devuelve 1, y si x es negativo, se devuelve un valor –1. La declaración de la función es entero función signo(E real: x) var entero:s inicio //valores de signo: +1,0,–1 si x = 0 entonces s ← 0 si x 0 entonces s ← 1 si x 0 entonces s ← –1 devolver (s) fin_función Antes de llamar a la función, la variable (S), como se declara dentro del subprograma, es local al subprograma y sólo se conoce dentro del mismo. Veamos ahora un pequeño algoritmo donde se invoque la función. algoritmo SIGNOS var entero: a, b, c real: x, y, z
  • 247. Subprogramas (subalgoritmos): Funciones 217 inicio x ← 5.4 a ← signo(x) y ← 0 b ← signo(y) z ← 7.8975 c ← signo(z – 9) escribir('Las respuestas son', a, ' ', b, ' ', c) fin Si se ejecuta este algoritmo, se obtienen los siguientes valores: x = 5.4 a = signo(5.4) y = 0 b = signo(0) z = 7.8975 c = signo(7.8975–9) x es el parámetro actual de la primera llamada a signo(x) a toma el valor 1 b toma el valor de 0 c toma el valor –1 La línea escrita al final será: Las respuestas son 1 0 –1 EJEMPLO 6.10 algoritmo DEMOX var entero: A, X, Y inicio x ← 5 A ← 10 y ← F(x) escribir (x, A, y) fin entero función F(E entero: N) var entero: X inicio A ← 5 X ← 12 devolver(N + A) fin_función A la variable global A se puede acceder desde el algoritmo y desde la función. Sin embargo, X identifica a dos variables distintas: una local al algoritmo y sólo se puede acceder desde él y otra local a la función. Al ejecutar el algoritmo se obtendrían los siguientes resultados: X = 5 A = 10 Y = F(5) A = 5 X = 12 F = 5+5 = 10 Y = 10 invocación a la función F(N) se realiza un paso del parámetro actual X al parámetro formal N se modifica el valor de A en el algoritmo principal por ser A global no se modifica el valor de X en el algoritmo principal porque X es local se pasa el valor del argumento X(5) a través del parámetro N
  • 248. 218 Fundamentos de programación se escribirá la línea 5 5 10 ya que X es el valor de la variable local X en el algoritmo; A, el valor de A en la función, ya que se pasa este valor al algoritmo; Y es el valor de la función F(X). 6.5. COMUNICACIÓN CON SUBPROGRAMAS: PASO DE PARÁMETROS Cuando un programa llama a un subprograma, la información se comunica a través de la lista de parámetros y se establece una correspondencia automática entre los parámetros formales y actuales. Los parámetros actuales son “sustituidos” o “utilizados” en lugar de los parámetros formales. La declaración del subprograma se hace con procedimiento nombre (clase tipo_de_dato: F1; clase tipo_de_dato: F2; ...................... clase tipo_de_dato :Fn) . . . fin_procedimiento y la llamada al subprograma con llamar_a nombre (A1, A2, ..., An) donde F1, F2, ..., Fn son los parámetros formales y A1, A2, ..., An los parámetros actuales o reales. Las clases de parámetros podrían ser: (E) Entrada (S) Salida (E/S) Entrada/Salida Existen dos métodos para establecer la correspondencia de parámetros: 1. Correspondencia posicional. La correspondencia se establece aparejando los parámetros reales y formales según su posición en las listas: así, Fi se corresponde con Ai, donde i = 1, 2, ..., n. Este método tiene algunas desventajas de legibilidad cuando el número de parámetros es grande. 2. Correspondencia por el nombre explícito, también llamado método de paso de parámetros por nombre. En este método, en las llamadas se indica explícitamente la correspondencia entre los parámetros reales y forma- les. Este método se utiliza en Ada. Un ejemplo sería: SUB(Y = B, X = 30); que hace corresponder el parámetro actual B con el formal Y, y el parámetro actual 30 con el formal X duran- te la llamada de SUB. Por lo general, la mayoría de los lenguajes usan exclusivamente la correspondencia posicional y ese será el mé- todo empleado en este libro. Las cantidades de información que pueden pasarse como parámetros son datos de tipos simples, estructurados —en los lenguajes que admiten su declaración— y subprogramas.
  • 249. Subprogramas (subalgoritmos): Funciones 219 6.5.1. Paso de parámetros Existen diferentes métodos para la transmisión o el paso de parámetros a subprogramas. Es preciso conocer el mé- todo adoptado por cada lenguaje, ya que la elección puede afectar a la semántica del lenguaje. Dicho de otro modo, un mismo programa puede producir diferentes resultados bajo diferentes sistemas de paso de parámetros. Los parámetros pueden ser clasificados como: entradas: las entradas proporcionan valores desde el programa que llama y que se utilizan dentro de un procedimiento. En los subprogramas función, las entradas son los argumentos en el sentido tradicional; salidas: las salidas producen los resultados del subprograma; de nuevo si se utiliza el caso de una función, éste devuelve un valor calculado por dicha función, mientras que con pro- cedimientos pueden calcularse cero, una o varias salidas; entradas/salidas: un solo parámetro se utiliza para mandar argumentos a un programa y para devolver resultados. Desgraciadamente, el conocimiento del tipo de parámetros no es suficiente para caracterizar su funcionamiento; por ello, examinaremos los diferentes métodos que se utilizan para pasar o transmitir parámetros. Los métodos más empleados para realizar el paso de parámetros son: • paso por valor (también conocido por parámetro valor), • paso por referencia o dirección (también conocido por parámetro variable), • paso por nombre, • paso por resultado. 6.5.2. Paso por valor El paso por valor se utiliza en muchos lenguajes de programación; por ejemplo, C, Modula-2, Pascal, Algol y Snobol. La razón de su popularidad es la analogía con los argumentos de una función, donde los valores se proporcionan en el orden de cálculo de resultados. Los parámetros se tratan como variables locales y los valores iniciales se propor- cionan copiando los valores de los correspondientes argumentos. Los parámetros formales —locales a la función— reciben como valores iniciales los valores de los parámetros actuales y con ello se ejecutan las acciones descritas en el subprograma. No se hace diferencia entre un argumento que es variable, constante o expresión, ya que sólo importa el valor del argumento. La Figura 6.6 muestra el mecanismo de paso por valor de un procedimiento con tres parámetros. A ← 5 B ← 7 llamar _ a PROC1 (A, 18, B * 3 + 4) 5 18 25 procedimiento PROC1 (E entero: X, Y, Z) Figura 6.6. Paso por valor. El mecanismo de paso se resume así: Valor primer parámetro: A = 5. Valor segundo parámetro: constante = 18. Valor tercer parámetro: expresión B * 3 + 4 = 25. Los valores 5, 18 y 25 se transforman en los parámetros X, Y, Z respectivamente cuando se ejecuta el procedi- miento.
  • 250. 220 Fundamentos de programación Aunque el paso por valor es sencillo, tiene una limitación acusada: no existe ninguna otra conexión con los pa- rámetros actuales, y entonces los cambios que se produzcan por efecto del subprograma no producen cambios en los argumentos originales y, por consiguiente, no se pueden pasar valores de retorno al punto de llamada: es decir, todos los parámetros son sólo de entrada. El parámetro actual no puede modificarse por el subprograma. Cualquier cambio realizado en los valores de los parámetros formales durante la ejecución del subprograma se destruye cuando se ter- mina el subprograma. La llamada por valor no devuelve información al programa que llama. Existe una variante de la llamada por valor y es la llamada por valor resultado. Las variables indicadas por los parámetros formales se inicializan en la llamada al subprograma por valor tras la ejecución del subprograma; los resultados (valores de los parámetros formales) se transfieren a los actuales. Este método se utiliza en algunas ver- siones de FORTRAN. 6.5.3. Paso por referencia En numerosas ocasiones se requiere que ciertos parámetros sirvan como parámetros de salida, es decir, se devuelvan los resultados a la unidad o programas que llama. Este método se denomina paso por referencia o también de llama- da por dirección o variable. La unidad que llama pasa a la unidad llamada la dirección del parámetro actual (que está en el ámbito de la unidad llamante). Una referencia al correspondiente parámetro formal se trata como una re- ferencia a la posición de memoria, cuya dirección se ha pasado. Entonces una variable pasada como parámetro real es compartida, es decir, se puede modificar directamente por el subprograma. Este método existe en FORTRAN, COBOL, Modula-2, Pascal, PL/1 y Algol 68. La característica de este método se debe a su simplicidad y su analogía directa con la idea de que las variables tienen una posición de memoria asig- nada desde la cual se pueden obtener o actualizar sus valores. El área de almacenamiento (direcciones de memoria) se utiliza para pasar información de entrada y/o salida; en ambas direcciones. En este método los parámetros son de entrada/salida y los parámetros se denominan parámetros variables. Los parámetros valor y parámetros variable se suelen definir en la cabecera del subprograma. En el caso de len- guajes como Pascal, los parámetros variables deben ir precedidos por la palabra clave var; program muestra; //parametros actuales a, c, b y d paso por referencia procedure prueba(var x,y:integer); begin //procedimiento //proceso de los valores de x e y end; begin . . . 1. prueba(a, c); . . . 2. prueba(b, d); . . . end. La primera llamada en (1) produce que los parámetros a y c sean sustituidos por x e y si los valores de x e y se modifican dentro de a o c en el algoritmo principal. De igual modo, b y d son sustituidos por x e y, y cualquier mo- dificación de x o y en el procedimiento afectará también al programa principal. La llamada por referencia es muy útil para programas donde se necesita la comunicación del valor en ambas direcciones.
  • 251. Subprogramas (subalgoritmos): Funciones 221 Notas Ambos métodos de paso de parámetros se aplican tanto a la llamada de funciones como a las de procedi- mientos: • Una función tiene la posibilidad de devolver los valores al programa principal de dos formas: a) como valor de la función, b) por medio de argumentos gobernados por la llamada de referencia en la correspondencia parámetro actual-parámetro formal. • Un procedimiento sólo puede devolver valores por el método de devolución de resultados. El lenguaje Pascal permite que el programador especifique el tipo de paso de parámetros y, en un mismo subpro- grama, unos parámetros se pueden especificar por valor y otros por referencia. procedure Q(i:integer; var j:integer); begin i := i+10; j := j+10; write(i, j) end; Los parámetros formales son i, j, donde i se pasa por valor y j por referencia. 6.5.4. Comparaciones de los métodos de paso de parámetros Para examinar de modo práctico los diferentes métodos, consideremos un ejemplo único y veamos los diferentes valores que toman los parámetros. El algoritmo correspondiente con un procedimiento SUBR: algoritmo DEMO var entero: A,B,C inicio //DEMO A ← 3 B ← 5 C ← 17 llamar_a SUBR(A, A, A + B, C) escribir(C) fin //DEMO procedimiento SUBR (Modo entero: x, y; E entero:z; Modo entero: v) inicio x ← x+1 v ← y+z fin_procedimiento Modo por valor a) sólo por valor no se transmite ningún resultado, por consiguiente C no varía C = 17 b) valor_resultado x = A = 3 A = 3 y = A = 3 B = 5 pasa al procedimiento z = A + B = 8 C = 17 v = C = 17
  • 252. 222 Fundamentos de programación al ejecutar el procedimiento quedará x = x + 1 = 3 + 1 = 4 v = y + z = 3 + 8 = 11 el parámetro llamado v pasa el valor del resultado v a su parámetro actual correspondiente, C. Por tanto, C = 11. Modo por referencia Posiciones de la memoria del Programa llamador Posiciones de la memoria del Subprograma llamado C recibirá el valor 12. Utilizando variables globales algoritmo DEMO var entero: A,B,C inicio A ← 3 B ← 5 c ← 17 llamar_a SUBR escribir (c) fin procedimiento SUBR inicio a ← a + 1 c ← a + a + b fin_procedimiento Es decir, el valor de C será 13. La llamada por referencia es el sistema estándar utilizado por FORTRAN para pasar parámetros. La llamada por nombre es estándar en Algol 60. Simula 67 proporciona llamadas por valor, referencia y nombre. Pascal permite pasar bien por valor bien por referencia procedure demo(y:integer; var z:real); especifica que y se pasa por valor mientras que z se pasa por referencia —indicado por la palabra reservada var—. La elección entre un sistema u otro puede venir determinado por diversas consideraciones, como evitar efectos late- rales no deseados provocados por modificaciones inadvertidas de parámetros formales (véase Apartado 6.7).
  • 253. Subprogramas (subalgoritmos): Funciones 223 6.5.5. Síntesis de la transmisión de parámetros Los métodos de transmisión de parámetros más utilizados son por valor y por referencia. El paso de un parámetro por valor significa que el valor del argumento —parámetro actual o real— se asigna al parámetro formal. En otras palabras, antes de que el subprograma comience a ejecutarse, el argumento se evalúa a un valor específico (por ejemplo, 8 o 12). Este valor se copia entonces en el correspondiente parámetro formal den- tro del subprograma. Evaluación Programa principal Parámetro formal Parámetro actual (variable, constante o expresión) No permite la comunicación en este sentido Subprograma ................. ................. Figura 6.7. Paso de un parámetro por valor. Una vez que el procedimiento arranca, cualquier cambio del valor de tal parámetro formal no se refleja en un cambio en el correspondiente argumento. Esto es, cuando el subprograma se termine, el argumento actual tendrá exactamente el mismo valor que cuando el subprograma comenzó, con independencia de lo que haya sucedido al parámetro formal. Este método es el método por defecto en Pascal si no se indica explícitamente otro. Estos paráme- tros de entrada se denominan parámetros valor. En los algoritmos indicaremos como modo E (entrada). El paso de un parámetro por referencia o dirección se llama parámetro variable, en oposición al parámetro por valor. En este caso, la posición o dirección (no el valor) del argumento o parámetro actual se envía al subprograma. Si a un pará- metro formal se le da el atributo de parámetro variable —en Pascal con la palabra reservada var— y si el parámetro actual es una variable, entonces un cambio en el parámetro formal se refleja en un cambio en el correspondiente parámetro actual, ya que ambos tienen la misma posición de memoria. Programa principal Parámetro formal (parámetro var) Parámetro actual (debe ser una variable) Subprograma Una posición de almacenamiento Figura 6.8. Paso de un parámetro por referencia. Para indicar que deseamos transmitir un parámetro por dirección, lo indicaremos con la palabra parámetro variable —en Pascal se indica con la palabra reservada var— y especificaremos como modo E/S (entrada/salida) o S (salida). EJEMPLO 6.11 Se trata de realizar el cálculo del área de un círculo y la longitud de la circunferencia en función del valor del radio leído desde el teclado.
  • 254. 224 Fundamentos de programación Recordemos las fórmulas del área del círculo y de la longitud de la circunferencia: A = pi.r2 = pi.r.r C = 2.pi.r = 2.pi.r donde pi = 3.141592 Los parámetros de entrada: radio Los parámetros de salida: área, longitud El procedimiento círculo calcula los valores pedidos. procedimiento circulo(E real: radio; S real: area, longitud) //parametros valor: radio //parametros variable: area, longitud var real: pi inicio pi ← 3.141592 area ← pi * radio * radio longitud ← 2 * pi * radio fin_procedimiento Los parámetros formales son: radio, area, longitud, de los cuales son de tipo valor (radio) y de tipo variable (area, longitud). Invoquemos el procedimiento círculo utilizando la instrucción llamar_a circulo(6, A, C) //{programa principal inicio //llamada al procedimiento llamar_a circulo(6, A, C) . . . fin procedimiento circulo(E real: radio; S real: area, longitud) //parametros valor:radio //parametros variable: area, longitud inicio pi ← 3.141592 area ← pi * radio * radio longitud ← 2 * pi * radio fin_procedimiento EJEMPLO 6.12 Consideremos un subprograma M con dos parámetros formales: i, transmitido por valor, y j, por variable. algoritmo M //variables A, B enteras var entero: A, B
  • 255. Subprogramas (subalgoritmos): Funciones 225 inicio A ← 2 B ← 3 llamar_a N(A,B) escribir(A, B) fin //algoritmo M procedimiento N(E entero: i; E/S entero: j) //parametros valor i //parametros variable j inicio i ← i + 10 j ← j + 10 escribir(i, j) fin_procedimiento Si se ejecuta el procedimiento N, veamos qué resultados se escribirán: A y B son parámetros actuales. i y j son parámetros formales. Como i es por valor, se transmite el valor de A a i, es decir, i = A = 2. Cuando i se modifica por efecto de i ← i+10 a 12, A no cambia y, por consiguiente, a la terminación de N,A sigue valiendo 2. El parámetro B se transmite por referencia, es decir, j es un parámetro variable. Al comenzar la ejecución de N, B se almacena como el valor j y cuando se suma 10 al valor de j,i en sí mismo no cambia. El valor del parámetro B se cambia a 13. Cuando los valores i,j se escriben en N, los resultados son: 12 y 13 pero cuando retornan a M y al imprimir los valores de A y B, sólo ha cambiado el valor B. El valor de i = 12 se pierde en N cuando éste ya termina. El valor de j también se pierde, pero éste es la dirección, no el valor 13. Se escribirá como resultado final de la instrucción escribir(A, B): 2 13 6.6. FUNCIONES Y PROCEDIMIENTOS COMO PARÁMETROS Hasta ahora los subprogramas que hemos considerado implicaban dos tipos de parámetros formales: parámetros va- lor y parámetros variable. Sin embargo, en ocasiones se requiere que un procedimiento o función dado invoque a otro procedimiento o función que ha sido definido fuera del ámbito de ese procedimiento o función. Por ejemplo, se puede necesitar que un procedimiento P invoque la función F que puede estar o no definida en el procedimiento P; esto puede conseguirse transfiriendo como parámetro el procedimiento o función externa (F) o procedimiento o función dado (por ejemplo, el P). En resumen, algunos lenguajes de programación —entre ellos Pascal— admiten parámetros procedimiento y parámetros función. EJEMPLOS procedimiento P(E func: F1; E real: x, y) real función F(E func: F1, F2; E entero:x, y) Los parámetros formales del procedimiento P son la función F1 y las variables x e y, y los parámetros formales de la función F son las funciones F1 y F2, y las variables x e y.
  • 256. 226 Fundamentos de programación Procedimientos función Para ilustrar el uso de los parámetros función, consideremos la función integral para calcular el área bajo una curva f(x) para un intervalo a = x = b. La técnica conocida para el cálculo del área es subdividir la región en rectángulos, como se muestra en la Figu- ra 6.9, y sumar las áreas de los rectángulos. Estos rectángulos se construyen subdividiendo el intervalo [a, b] en m subintervalos iguales y formando rectángulos con estos subintervalos como bases y alturas dadas por los valores de f en los puntos medios de los subintervalos. a b x y y = f(x) Figura 6.9. Cálculo del área bajo la curva f(x). La función integral debe tener los parámetros formales a, b y n, que son parámetros valor ordinarios actuales de tipo real; se asocian con los parámetros formales a y b; un parámetro actual de tipo entero —las subdivisiones— se asocia con el parámetro formal n y una función actual se asocia con el parámetro formal f. Los parámetros función se designan como tales con una cabecera de función dentro de la lista de parámetros formales. La función integral podrá definirse por real función integral(E func: f; E real: a,b; E entero: n) el tipo func-tipo real func función (E real: x) aquí la función f(x: real): real especifica que f es una función parámetro que denota una función cuyo pará- metro formal y valor son de tipo real. El correspondiente parámetro función actual debe ser una función que tiene un parámetro formal real y un valor real. Por ejemplo, si Integrando es una función de valor real con un parámetro y tipo real función (E real:x):func Area ← Integral(Integrando, 0, 1.5, 20) es una referencia válida a función. Diseñar un algoritmo que utilice la función Integral para calcular el área bajo el gráfico de las funciones f1 (x) = x3 – 6x3 + 10x y f2(x) = x2 +3x+2 para 0 = x = 4. algoritmo Area_bajo_curvas tipo real función(E real : x) : func var real : a,b entero : n inicio escribir('¿Entre qué límites?') leer(a, b) escribir('¿Subintervalos?') leer(n)
  • 257. Subprogramas (subalgoritmos): Funciones 227 escribir(integral(f1, a, b, n)) escribir(integral(f2, a, b, n)) fin real FUNCIÓN f1 (E real : x) inicio devolver( x * x * x – 6 * x * x + 10 * x) fin_funcion real FUNCIÓN f2 (E real : x) inicio devolver( x * x + 3 * x + 2 ) fin_función real FUNCIÓN integral (E func : f; E real : a, b; E entero : n) var real : baserectangulo,altura,x,s entero : i inicio baserectangulo ← (b – a) / n x ← a + baserectangulo/2 s ← 0 desde i ← 1 hasta n hacer altura ← f(x) s ← s + baserectangulo * altura x ← x + baserectangulo fin_desde devolver(s) fin_función 6.7. LOS EFECTOS LATERALES Las modificaciones que se produzcan mediante una función o procedimiento en los elementos situados fuera del subprograma (función o procedimiento) se denominan efectos laterales. Aunque en algunos casos los efectos latera- les pueden ser beneficiosos en la programación, es conveniente no recurrir a ellos de modo general. Consideramos a continuación los efectos laterales en funciones y en procedimientos. 6.7.1. En procedimientos La comunicación del procedimiento con el resto del programa se debe realizar normalmente a través de parámetros. Cualquier otra comunicación entre el procedimiento y el resto del programa se conoce como efectos laterales. Como ya se ha comentado, los efectos laterales son perjudiciales en la mayoría de los casos, como se indica en la Figu- ra 6.10. Si un procedimiento modifica una variable global (distinta de un parámetro actual), éste es un efecto lateral. Por ello, excepto en contadas ocasiones, no debe aparecer en la declaración del procedimiento. Si se necesita una varia- ble temporal en un procedimiento, utilice una variable local, no una variable global. Si se desea que el programa modifique el valor de una variable global, utilice un parámetro formal variable en la declaración del procedimiento y a continuación utilice la variable global como el parámetro actual en una llamada al procedimiento. En general, se debe seguir la regla de “ninguna variable global en procedimientos”, aunque esta prohibición no significa que los procedimientos no puedan manipular variables globales. De hecho, el cambio de variables globales se deben pasar al procedimiento como parámetros actuales. Las variables globales no se deben utilizar directamente en las instrucciones en el cuerpo de un procedimiento; en su lugar, utilice un parámetro formal o variable local.
  • 258. 228 Fundamentos de programación Efectos laterales Programa principal y otros procedimientos Procedimiento Lista de parámetros actuales Figura 6.10. Efectos laterales en procedimientos. En aquellos lenguajes en que es posible declarar constantes —como Pascal— se pueden utilizar constantes glo- bales en una declaración de procedimiento; la razón reside en el hecho de que las constantes no pueden ser modifi- cadas por el procedimiento y, por consiguiente, no existe peligro de que se puedan modificar inadvertidamente. 6.7.2. En funciones Una función toma los valores de los argumentos y devuelve un único valor. Sin embargo, al igual que los procedi- mientos, una función —en algunos lenguajes de programación— puede hacer cosas similares a un procedimiento o subrutina. Una función puede tener parámetros variables además de parámetros valor en la lista de parámetros for- males. Una función puede cambiar el contenido de una variable global y ejecutar instrucciones de entrada/salida (escribir un mensaje en la pantalla, leer un valor del teclado, etc.). Estas operaciones se conocen como parámetros laterales y se deben evitar. Función Argumentos (parámetros valor) Valor devuelto por la función Efectos laterales Programa principal procedimiento y otras funciones Figura 6.11. Efectos laterales en una función. Los efectos laterales están considerados —normalmente— como una mala técnica de programación, pues hacen más difícil de entender los programas. Toda la información que se transfiere entre procedimientos y funciones debe realizarse a través de la lista de pará- metros y no a través de variables globales. Esto convertirá al procedimiento o función en módulos independientes que pueden ser comprobados y depurados por sí solos, lo que evitará preocuparnos por el resto de las partes del programa.
  • 259. Subprogramas (subalgoritmos): Funciones 229 6.8. RECURSIÓN (RECURSIVIDAD) Como ya se conoce, un subprograma puede llamar a cualquier otro subprograma y éste a otro, y así sucesivamente; dicho de otro modo, los subprogramas se pueden anidar. Se puede tener A llamar_a B, B llamar_a C, C llamar_a D Cuando se produce el retorno de los subprogramas a la terminación de cada uno de ellos el proceso resultante será D retornar_a C, C retornar_a B, B retornar_a A ¿Qué sucedería si dos subprogramas de una secuencia son los mismos? A llamar_a A o bien A llamar_a B, B llamar_a A En primera instancia, parece incorrecta. Sin embargo, existen lenguajes de programación —Pascal, C, entre otros— en que un subprograma puede llamarse a sí mismo. Una función o procedimiento que se puede llamar a sí mismo se llama recursivo. La recursión (recursividad) es una herramienta muy potente en algunas aplicaciones, sobre todo de cálculo. La recursión puede ser utilizada como una alternativa a la repetición o estructura repetitiva. El uso de la recursión es particularmente idóneo para la solución de aquellos problemas que pueden definirse de modo natural en términos recursivos. La escritura de un procedimiento o función recursiva es similar a sus homónimos no recursivos; sin embargo, para evitar que la recursión continúe indefinidamente es preciso incluir una condición de terminación. La razón de que existan lenguajes que admiten la recursividad se debe a la existencia de estructuras específicas tipo pilas (stack, en inglés) para este tipo de procesos y memorias dinámicas. Las direcciones de retorno y el estado de cada subprograma se guardan en estructuras tipo pilas (véase Capítulo 11). En el Capítulo 11 se profundizará en el tema de las pilas; ahora nos centraremos sólo en el concepto de recursividad y en su comprensión con ejemplos básicos. EJEMPLO 6.13 Muchas funciones matemáticas se definen recursivamente. Un ejemplo de ello es el factorial de un número entero n. La función factorial se define como n! = { 1 si n = 0 0! = 1 nx(n–1)x(n–2)x ... x3x2x1 si n 0 n. (n–1) . (n–2)....3.2.1 Si se observa la fórmula anterior cuando n 0, es fácil definir n! en función de (n–1)! Por ejemplo, 5! 5! = 5x4x3x2x1 = 120 4! = 4x3x2x1 = 24 3! = 3x2x1 = 6 2! = 2x1 = 2 1! = 1x1 = 1 0! = 1 = 1
  • 260. 230 Fundamentos de programación Se pueden transformar las expresiones anteriores en 5! = 5x4! 4! = 4x3! 3! = 3x2! 2! = 2x1! 1! = 1x0! En términos generales sería: n! = { 1 n(n–1)! si si n = 0 n 0 La función FACTORIAL de N expresada en términos recursivos sería: FACTORIAL ← N * FACTORIAL(N – 1) La definición de la función sería: entero: función factorial(E entero: n) //calculo recursivo del factorial inicio si n = 0 entonces devolver (1) si_no devolver (n * factorial(n – 1)) fin_si fin_función Para demostrar cómo esta versión recursiva de FACTORIAL calcula el valor de n!, consideremos el caso de n = 3. Un proceso gráfico se representa en la Figura 6.12. FACT FACTORIAL (3) N es 3 FACTORIAL ← 3 * FACTORIAL (2) Retorno N es 2 FACTORIAL ← 2 * FACTORIAL (1) Retorno N es 1 FACTORIAL ← 1 * FACTORIAL (0) Retorno N es 0 FACTORIAL ← 1 Retorno Figura 6.12. Cálculo recursivo de FACTORIAL de 3.
  • 261. Subprogramas (subalgoritmos): Funciones 231 EJEMPLO 6.14 Otro ejemplo típico de una función recursiva es la serie Fibonacci. Esta serie fue concebida originalmente como modelo para el crecimiento de una granja de conejos (multiplicación de conejos) por el matemático italiano del si- glo XVI, Fibonacci. La serie es la siguiente: 1, 1, 2, 3, 5, 8, 13, 21, 34 ... Esta serie crece muy rápidamente; como ejemplo, el término 15 es 610. La serie de Fibonacci (fib) se expresa así fib(1) = 1 fib(2) = 1 fib(n) = fib(n – 1) + fib(n – 2) para n 2 Una función recursiva que calcula el elemento enésimo de la serie de Fibonacci es entero: función fibonacci(E entero: n) //calculo del elemento n–ésimo inicio si (n = 1) o (n = 2) entonces devolver (1) si_no devolver (fibonacci(n – 2) + fibonacci(n – 1)) fin_si fin_función Aunque es fácil de escribir la función de Fibonacci, no es muy eficaz definida de esta forma, ya que cada paso recursivo genera otras dos llamadas a la misma función. 6.9. FUNCIONES EN C/C++ , JAVA Y C# La sintaxis básica y estructura de una función en C, C++, Java y C# son realmente idénticas valor_retorno nombre_funcion (tipo1 arg1, tipo2 arg2 …) { // equivalente a la palabra reservada en pseudocódigo inicio // cuerpo de la función } // equivalente a la palabra reservada en pseudocódigo fin En Java, todas las funciones deben estar asociadas con alguna clase y se denominan métodos. En C++, las fun- ciones asociadas con una clase se llaman funciones miembro. Las funciones C tradicionales y las funciones no asociadas con ninguna clase en C++, se denominan simplemente funciones no miembro. El nombre de la función y su lista de argumentos constituyen la signatura. La lista de parámetros formales es la interfaz de la función con el mundo exterior, dado que es el punto de entrada para parámetros entrantes. La descripción de una función se realiza en dos partes: declaración de la función y definición de la función. La declaración de una función, denominada también prototipo de la función, describe cómo se llama (invoca) a la función. Existen dos métodos para declarar una función: 1. Escribir la función completa antes de ser utilizada. 2. Definir el prototipo de la función que proporciona al compilador información suficiente para llamar a la fun- ción. El prototipo de una función es similar a la primera línea de la función, pero el prototipo no tiene cuerpo.
  • 262. 232 Fundamentos de programación Prototipo de función Definición función cabecera cuerpo double precio_total (int numero, double precio); double precio_total (int numero, double precio) { const double IVA = 0.06; // impuesto 6% double subtotal; subtotal = numero * precio; return (subtotal + IVA * subtotal): } Paso de parámetros El paso de parámetros varía ligeramente entre Java y C++. Desde el enfoque de Java: • No existen punteros como en C y C++; • Los tipos integrados o incorporados (built-in, denominados también tipos primitivos de datos) se pasan siempre por valor; • Tipos objeto (similares a las clases que son parte de los paquetes estándar de java) se pasan siempre por refe- rencia Las variables de Java que representan tipos objeto se llaman variables de referencia y aquellas que representan tipos integrados se llaman variables de no referencia. EJEMPLO 6.15. FUNCIÓN EN C++ La función triángulo calcula el área de un triángulo en C++ // Función en C++ // Triángulo, cálculo del área o superficie // Parámetros // anchura – anchura del triángulo // altura - altura del triángulo // retorno (devuelve) // Área del triángulo float triangulo(float anchura, float altura) { float area assert (anchura = 0.0); assert (altura = 0.0); return (area) } ... // Llamada por valor a la función area Superficie = triangulo (2.5, 4.6); // paso de parámetros por valor La llamada por valor ejecuta la función triangulo, calcula la fórmula del área del triángulo y su valor 11.50 se asigna a la variable superficie. EJEMPLO. 6.16. FUNCIÓN EN JAVA import java.awt.Point; // se importa la clase // Point parte del paquete // estándar Java AWT // paso por valor public class DemoPasoParametros {
  • 263. Subprogramas (subalgoritmos): Funciones 233 public static void intercambio_por_valor (int x, int y){ int aux; aux = x; x = y; Y = aunx; } } public static void intercambio_por_referencia (Punto p){ ' int aux = p.x; p.x = p.y; p.y = aux; // … } // llamadas a la función int m = 50; int n = 75; // … intercambio_porvalor (m, n); // … punto unPunto= new Punto (-10, 50); intercambio_porreferencia (unPunto) // ... En las líneas de código anteriores, m y n son variables integradas de tipo int. Para intercambiar los valores de las dos variables se pasan en el método intercambio_porvalor. Una copia de los valores m y n se pasan a la función intercambio_porvalor cuando se llama a la función. En el caso de la llamada por referencia se ha instanciado e inicializado un objeto, unPunto (de la clase Point definido en el paquete Java.awt.Point) a los valores 50, 75. Cuando unPunto se pasa en un método llamado intecambio_porreferencia, el método intercambia el contenido de las coordenadas x e y del argumento. Es preciso observar que una variable referencia es realmente una dirección al objeto y no el objeto en sí mismo. Al pa- sar unPunto, en realidad se pasa la dirección del objeto y no una copia —como en el paso por valor— del objeto. Esta característica de Java es equivalente semánticamente al modo en que funcionan las variables referencia y variables puntero en C++. En resumen, las variables referencia en Java son muy similares a las referencias C++. 6.10. ÁMBITO (ALCANCE) Y ALMACENAMIENTO EN C/C++ Y JAVA Cada identificador (nombre de una entidad) debe referirse a una única identidad (tal como una variable, función, tipo, etc.). A pesar de este requisito, los nombres se pueden utilizar más de una vez en un programa. Un nombre se puede reutilizar mientras se utilice en diferentes contextos, a partir de los cuales los diferentes significados del nombre pueden ser empleados. El contexto utilizado para distinguir los significados de los nombres es su alcance o ámbito (scope). Un ámbito o alcance es una región del código de programa, donde se permite hacer referencia (uso) a un identificador. Un nombre (identificador) se puede referir a diferentes entidades en diferentes ámbitos. Los alcances están separados por los separadores inicio-fin (o llaves en los lenguajes C, C++, Java, etc.). Los nombres son visibles desde su punto de declaración hasta el final del alcance en el que aparece la declaración. Los identificadores definidos fuera de cualquier función tienen ámbito global; son accesibles desde cualquier parte del programa. Los identificadores definidos en el cuerpo de una función se dicen que tienen ámbito local. La clase de almacenamiento de una variable puede ser o bien permanente o temporal. Las variables globales son siempre permanentes; se crean e inicializan antes de que el programa arranque y permanecen hasta que se termina. Las variables temporales se asignan desde una sección de memoria llamada la pila (stack) en el principio del bloque.
  • 264. 234 Fundamentos de programación Si se intentan asignar muchas variables temporales se puede obtener un error de desbordamiento de la pila. El espa- cio utilizado por las variables temporales se devuelve (se libera) a la pila al final del bloque. Cada vez que se entra al bloque, se inicializan las variables temporales. Las variables locales son temporales a menos que sean declaradas estáticas static en C++. Definición y declaración de variables El ámbito (alcance) de una variable es el área (bloque) del programa donde es válida la variable. En general, las de- finiciones o declaraciones de variables se pueden situar en cualquier parte de un programa donde esté permitida una sentencia. Una variable debe ser declarada o definida antes de que sea utilizada. Regla Es una buena idea definir un objeto cerca del punto en el cual se va a utilizar la primera vez. Las variables pueden ser globales o locales. Una variable global es de alcance global y es válida desde el punto en que se declara hasta el final del programa. Su duración es la del programa, hasta que se acaba su ejecución. Una variable local es aquella que está definida en el interior del cuerpo de una función y es accesible sólo dentro de dicha función. El ámbito de una variable local se limita al bloque donde está declarada y no puede ser accedida (leída o asignada un valor) fuera de ese bloque. En el cuerpo o bloque de una función se pueden definir variables locales que son “locales” a dicha función y sus nombres sólo son visibles en el ámbito de la función. Las variables locales sólo existen mientras la función se está ejecutando. Un bloque es una sección de código encerrada entre inicio y fin (en el caso de C/C++ o Java/C#, encerrado en- tre llaves, { }). Los nombres de las variables locales a una función son visibles sólo en el ámbito de la función y existen sólo mientras la función se está ejecutando. La ejecución se termina cuando se encuentra una sentencia devolver (re- turn) y produce como resultado el valor especificado en dicha sentencia. Es posible declarar una variable local con el mismo nombre que una variable global, pero en el bloque donde está definida la variable local tiene prioridad so- bre la variable global y se dice que esta variable se encuentra oculta. Si una variable local oculta a una global para que tenga el mismo nombre entonces, se dice, que la variable global no es posible. Una variable global es aquella que se define fuera del cuerpo de las funciones y están disponibles en todas las partes del programa, incluso en otros archivos como en lenguajes C++ donde un programa puede estar en dos archivos. En el caso de que un programa esté compuesto por dos archivos, en el primero se define la variable global y se declara en el segundo archivo donde se puede utilizar. EJEMPLO 6.17. VARIABLES LOCALES Y GLOBALES EN C++ alcance int cuenta; // variable global int main ( ) // función principal { int local: // variable local cuenta = 100: local = 500;
  • 265. Subprogramas (subalgoritmos): Funciones 235 global local alcance local_uno { int local_uno; local_uno = cuenta + local; } // no se puede utilizar local_uno } Si en el segmento de código siguiente se declara una nueva variable local cuenta, ésta se oculta a la variable global cuenta inicializada a 100 en el cuerpo de la función. int total; int cuenta; int main( ) { total = 0; cuenta = 100; int cuenta; cuenta = 0; while (true) { if (cuenta 10) break; total += cuenta; ++cuenta; } } ++cuenta; return (0); } 6.11. SOBRECARGA DE FUNCIONES EN C++ Y JAVA Algunos lenguajes de programación como C++ o Java permiten la sobrecarga de funciones (funciones miembro en C++, métodos en Java). La sobrecarga de funciones, que aparecen en el mismo ámbito, significa que se pueden definir múltiples funciones con el mismo nombre pero con listas de parámetros diferentes. Sobrecarga de una función es usar el mismo nombre para diferentes funciones, distintas unas de otras por sus listas de parámetros. En realidad, la sobrecarga de funciones es una propiedad que facilita la tarea al programador cuando se desean diseñar funciones que realizan la misma tarea general pero que se aplican a tipos de parámetros diferentes. Estas funciones se pueden llamar sin preocuparse sobre cuál función se invoca ya que el compilador detecta el tipo de dato de los parámetros y ejecuta la función asociada a ellos. Por ejemplo, se trata de ejecutar una función que imprima los valores de determinadas variables de diferentes tipos de datos: car, entero, real, lógico, etc. Así algunas funciones que realizan estas tareas serían: nada ImprimirEnteros (entero n) inicio escribir ('Visualizar') escribirn('El valor es', n) fin
  • 266. 236 Fundamentos de programación nada ImprimirCar(car c) inicio escribir ('Visualizar') escribirn('El valor es', c) fin nada ImprimirReal(real r) inicio escribir ('Visualizar') escribirn('El valor es', r) fin nada ImprimirLogico (lógico l) inicio escribir ('Visualizar') escribirn('El valor es', l) fin Se necesitan cuatro funciones diferentes con cuatro nombres diferentes; si se utilizan funciones sobrecargadas, en lugar de utilizar un nombre para cada tipo de impresión de datos, se puede utilizar una función sobrecargada con el mismo nombre Imprimir y con distintos parámetros. nada Imprimir (entero n) inicio escribir ('Visualizar') escribirn('El valor es', n) fin nada Imprimir (car c) inicio escribir ('Visualizar') escribirn('El valor es', c) fin nada Imprimir (real r) inicio escribir ('Visualizar') escribirn('El valor es', r) fin nada Imprimir (logico l) inicio escribir ('Visualizar') escribirn('El valor es', l) fin El código que llama a estas funciones podría ser: Imprimir (entero1) Imprimir (car1) Imprimir (real1) Imprimir (logico1) De este modo, el nombre de la función tiene cuatro definiciones diferentes ya que el nombre Imprimir está sobrecargado. La sobrecarga es una característica muy notable ya que hace a un programa más fácil de leer. Cuando se invoca a una función sobrecargada el compilador comprueba el número y tipo de argumentos en dicha llamada.
  • 267. Subprogramas (subalgoritmos): Funciones 237 EJERCICIO Sobrecarga de la función media (media aritmética de dos o tres números reales). real media (real n1, real n2) inicio devolver ((n1 + n2)/ 2.0) fin real media (real n1, real n2, real n3) inicio devolver ((n1 + n2 + n3)/ 3.0) fin Algunas llamadas a la función son: media (4.5, 7.5) media (3.5, 5.5, 10.5) C , Pascal y FORTRAN no soportan sobrecarga de funciones. C++ y Java soportan sobrecarga de funciones miembro y métodos. EJEMPLO Función cuadrado que eleva al cuadrado el valor del argumento. entero cuadrado (entero n) entero cuadrado (real n) inicio inicio devolver (n*n) devolver (n * n) fin fin Sobrecarga en C++ Las funciones anteriores escritas en C++ int cuadrado (int n) float cuadrado (float n) { { return (n * n); return (n * n); } } Sobrecarga en Java En Java se pueden diseñar en una clase métodos con el mismo nombre, e incluso en la biblioteca de clases de Java, la misma situación. Dos características diferencian los métodos con igual nombre: • El número de argumentos que aceptan. • El tipo de dato u objetos de cada argumento. Estas dos características constituyen la signatura de un método. El uso de varios métodos con el mismo nombre y signaturas diferentes se denomina sobrecarga. La sobrecarga de métodos puede eliminar la necesidad de escribir métodos diferentes que realizan la misma acción. La sobrecarga facilita que existan métodos que se comportan de modo diferente basado en los argumentos que reciben. Cuando se llama a un método de un objeto, en Java, hace corresponder el nombre del método y los argumentos para seleccionar cuál es la definición a ejecutar. Para crear un método sobrecargado, se crean diferentes definiciones de métodos en una clase, cada uno con el mismo nombre pero diferente lista de argumentos. La diferencia puede ser el número, el tipo de argumentos o ambos. Java permite la sobrecarga de métodos pero cada lista de argumentos es única para el mismo nombre del método.
  • 268. 238 Fundamentos de programación ACTIVIDADES DE PROGRAMACIÓN RESUELTAS 6.1. Realización del factorial de un número entero. entero: función factorial(E entero: n) var entero: f, i inicio si n = 0 entonces devolver (1) si_no desde i ← 1 hasta n hacer f ← f*i fin_desde devolver (f) fin_si fin_función 6.2. Diseñar un algoritmo que calcule el máximo común divisor de dos números mediante el algoritmo de Euclides. Sean los dos números A y B. El método para hallar el máximo común divisor (mcd) de dos números A y B por el método de Euclides es: 1. Dividir el número mayor (A) por el menor (B). Si el resto de la división es cero, el número B es el máximo común divisor. 2. Si la división no es exacta, se divide el número menor (B) por el resto de la división anterior. 3. Se siguen los pasos anteriores hasta obtener un resto cero. El último divisor es el mcd buscado. Algoritmo entero función mcd(E entero: a, b) inicio mientras a b hacer si a b entonces a ← a – b si_no b ← b – a fin_si fin_mientras devolver(a) fin_funcion 6.3. Para calcular el máximo común divisor (mcd) de dos números se recurre a una función específica definida con un subprograma. Se desea calcular la salida del programa principal con dos números A y B, cuyos valores son 10 y 25, es decir, el mcd (A, B) y comprobar el método de paso de parámetros por valor. algoritmo maxcomdiv var entero: N, X, Y inicio //programa principal x ← 10 y ← 25 n ← mcd(x, y) escribir(x, y, n) fin entero función mcd(E entero: a,b) inicio mientras a b hacer si a b entonces a ← a – b
  • 269. Subprogramas (subalgoritmos): Funciones 239 si_no b ← b – a fin_si fin_mientras devolver (a) fin_función Los parámetros formales son a y b y recibirán los valores de x e y. a = 10 b = 25 Las variables locales a la función son A y B y no modificarán los valores de las variables x e y del algoritmo prin- cipal. Variables del Variables de programa principal la función x y N a b mcd(a, b) 10 25 10 25 Las operaciones del algoritmo son: a = 10 b = 25 1. b a realizará la operación b ← b – a y por consiguiente b tomará el valor 25–10 = 15 y a sigue valiendo 10 2. a = 10 b = 15 se realiza la misma operación anterior b ← b – a, es decir, b = 5 a permanece inalterable 3. a = 10 b = 5 como a b entonces se realiza a ← a – b, es decir, a = 5 Por consiguiente, los valores finales serían: a = 5 b = 5 mcd(a, b) = 5 Como los valores a y b no se pasan al algoritmo principal, el resultado de su ejecución será: 10 25 5 6.4. Realizar un algoritmo que permita ordenar tres números mediante un procedimiento de intercambio en dos variables (paso de parámetros por referencia). El algoritmo que permite realizar el intercambio de los valores de variables numéricas es el siguiente: AUXI ← A A ← B B ← AUXI y la definición del procedimiento será: PROCEDIMIENTO intercambio (E/S real: a, b) var real : auxi inicio auxi ← a a ← b b ← auxi fin_procedimiento
  • 270. 240 Fundamentos de programación El algoritmo de ordenación se realizará mediante llamadas al procedimiento intercambio. algoritmo Ordenar_3_numeros var real : x,y,z inicio escribir('Deme 3 números reales') leer(x, y, z) si x y entonces intercambio (x, y) fin_si si y z entonces intercambio (y, z) fin_si si x y entonces intercambio (x, y) fin_si escribir( x, y, z) fin Paso de parámetros por referencia Los tres números X, Y, Z que se van a ordenar son 132 45 15 Los pasos sucesivos al ejecutarse el algoritmo o programa principal son: 1. Lectura X, Y, Z parámetros actuales X = 132 Y = 45 Z = 15 2. Primera llamada al procedimiento intercambio(a, b) x y. La correspondencia entre parámetros será la siguiente: parámetros actuales parámetros formales X A Y B Al ejecutarse el procedimiento se intercambiarán los valores de A y B que se devolverán a las variables X e Y; luego valdrán X = 45 Y = 132 3. Segunda llamada al procedimiento intercambio con Y Z (ya que Y = 132 y Z = 15) parámetros actuales parámetros formales Y A Z B Antes llamada al procedimiento Y = 132, Z = 15. Después terminación del procedimiento Z = 132, Y = 15, ya que A y B han intercambiado los valores reci- bidos, 132 y 15.
  • 271. Subprogramas (subalgoritmos): Funciones 241 4. Los valores actuales de X, Y, Z son 45, 15, 132; por consiguiente, X Y y habrá que hacer otra nueva llamada al procedimiento intercambio. parámetros actuales parámetros formales X(45) A(45) Y(15) B(15) Después de la ejecución del procedimiento A y B intercambiarán sus valores y valdrán A = 15, B = 45, por lo que se pasan al algoritmo principal X = 15, Y = 45. Por consiguiente, el valor final de las tres variables será: X = 15 Y = 45 Z = 132 ya ordenados de modo creciente. 6.5. Diseñar un algoritmo que llame a la función signo(X) y calcule: a) el signo de un número, b) el signo de la función coseno. Variables de entrada: P (real) Variables de salida: Y-signo del valor P-(entero) Z-signo del coseno de P-(entero); Pseudocódigo algoritmo signos var entero: y, z real: P inicio leer(P) Y ← signo(p) Z ← signo(cos (p)) escribir(Y, Z) fin entero función signo(E real: x) inicio si x 0 entonces devolver (1) si_no si x 0 entonces devolver (–1) si_no devolver (0) fin_si fin_si fin_función Notas de ejecución Parámetro actual Parámetro formal P x El parámetro formal x se sustituye por el parámetro actual. Así, por ejemplo, si el parámetro P vale –1.45. Los valores devueltos por la función Signo que se asignará a las variables Y, Z son: Y ← Signo(–1.45) Z ← Signo(Cos (–1.45)) resultando Y = –1 Z = 1
  • 272. 242 Fundamentos de programación CONCEPTOS CLAVE • alcance. • ámbito. • ámbito global. • ámbito local. • argumento. • argumento actual. • argumentos formales. • argumentos reales. • biblioteca estándar. • cabecera de función. • clase de almacenamiento. • cuerpo de la función. • función. • función invocada. • función llamada. • función llamadora. • función recursiva. • módulo. • parámetro. • parámetro actual. • parámetros formales. • parámetros reales. • paso por referencia. • paso por valor. • procedimiento. • prototipo de función. • sentencia devolver (return). • subprograma. • rango. • variable global. • variable local. Aunque los conceptos son similares, las unidades de pro- gramas definidas por el usuario se conocen generalmente por el término de subprogramas para representar los mó- dulos correspondientes; sin embargo, se denominan con nombres diferentes en los distintos lenguajes de programa- ción. Así en los lenguajes C y C++ los subprogramas se denominan funciones; en los lenguajes de programación orientada a objetos (C++, Java y C#) y siempre que se definen dentro de las clases, se les suele también denomi- nar métodos o funciones miembro; en Pascal, son proce- dimientos y funciones; en Módula-2 los nombres son PROCEDIMIENTOS (procedures, incluso aunque algunos de ellos son realmente funciones); en COBOL se conocen como párrafos y en los “viejos” FORTRAN y BASIC se les conoce como subrutinas y funciones. Los conceptos más importantes sobre funciones y procedimientos son los siguientes: 1. Las funciones y procedimientos se pueden utilizar para romper un programa en módulos de menor com- plejidad. De esta forma un trabajo complejo se puede descomponer en otras unidades más pequeñas que interactúan unas con otras de un modo controlado. Estos módulos tienen las siguientes propiedades: a) El propósito de cada función o procedimiento debe estar claro y ser simple. b) Una función o procedimiento debe ser lo bas- tante corta como para ser comprendida en toda su entidad. c) Todas sus acciones deben estar interconectadas y trabajar al mismo nivel de detalle. d) El tamaño y la complejidad de un subprograma se pueden reducir llamando a otros subprogra- mas para que hagan subtareas. 2. Las funciones definidas por el usuario son subruti- nas que realizan una operación y devuelven un va- lor al entorno o módulo que le llamó. Los argumen- tos pasados a las funciones se manipulan por la rutina para producir un valor de retorno. Algunas funciones calculan y devuelven valores, otras fun- ciones no. Una función que no devuelve ningún valor, se denomina función void en el caso del len- guaje C. 3. Los procedimientos no devuelven ningún valor al módulo que le invocó. En realidad, los procedi- mientos ya se conservan sólo en algunos lenguajes procedimentales como Pascal. En el resto de los lenguajes sólo se implementan funciones y los pro- cedimientos son equivalentes a funciones que no devuelven valor. 4. Una llamada a una función que devuelve un valor, se encuentra normalmente en una sentencia de asig- nación, una expresión o una sentencia de salida. 5. Los componentes básicos de una función son la cabecera de la función y el cuerpo de la función. 6. Los argumentos son el medio por el cual un pro- grama llamador comunica o envía los datos a una función. Los parámetros son el medio por el cual una función recibe los datos enviados o comunica- dos. Cuando una función se llama, los argumentos reales en la llamada a la función se pasan a dicha función y sus valores se sustituyen en los paráme- tros formales de la misma. 7. Después de pasar los valores de los parámetros, el control se pasa a la función. El cálculo comienza en la parte superior de la función y prosigue hasta que se termina, en cuyo momento el resultado se devuelve al programa llamador. 8. Cada variable utilizada en un programa tiene un ámbito (rango o alcance) que determina en qué par- te del programa se puede utilizar. El ámbito de una variable es local o global y se determina por la posición donde se sitúa la variable. Una variable local se define dentro de una función y sólo se pue- de utilizar dentro de la definición de dicha función o bloque. Una variable global está definida fuera de una función y se puede utilizar en cualquier fun- RESUMEN
  • 273. Subprogramas (subalgoritmos): Funciones 243 ción a continuación de la definición de la variable. Todas las variables globales que no son iniciali- zadas por el usuario, normalmente se inicializan a cero por la computadora. 9. Una solución recursiva es una en que la solución se puede expresar en términos de una versión más simple de sí misma. Es decir, una función recur- siva se puede llamar a sí misma. 10. Si una solución de un problema se puede expresar repetitivamente o recursivamente con igual facili- dad, la solución repetitiva es preferible, ya que se ejecuta más rápidamente y utiliza menos memo- ria. Sin embargo, en muchas aplicaciones avanza- das la recursión es más simple de visualizar y el único medio práctico de implementar una solu- ción. EJERCICIOS 6.1. Diseñar una función que calcule la media de tres nú- meros leídos del teclado y poner un ejemplo de su aplicación. 6.2. Diseñar la función FACTORIAL que calcule el factorial de un número entero en el rango 100 a 1.000.000. 6.3. Diseñar un algoritmo para calcular el máximo común divisor de cuatro números basado en un subalgorit- mo función mcd (máximo común divisor de dos nú- meros). 6.4. Diseñar una función que encuentre el mayor de dos números enteros. 6.5. Diseñar una función que calcule xn para x, variable real y n variable entera. 6.6. Diseñar un procedimiento que acepte un número de mes, un número de día y un número de año y los vi- sualice en el formato dd/mm/aa Por ejemplo, los valores 19,09,1987 se visualizarían como 19/9/87 y para los valores 3, 9 y 1905 3/9/05 6.7. Realizar un procedimiento que realice la conversión de coordenadas polares (r, θ) a coordenadas cartesia- nas (x, y) x = r.cos (θ) y = r.sen(θ) 6.8. Escribir una función Salario que calcule los salarios de un trabajador para un número dado de horas traba- jadas y un salario hora. Las horas que superen las 40 horas semanales se pagarán como extras con un sala- rio hora 1,5 veces el salario ordinario. 6.9. Escribir una función booleana Digito que determine si un carácter es uno de los dígitos 0 al 9. 6.10. Diseñar una función que permita devolver el valor ab- soluto de un número. 6.11. Realizar un procedimiento que obtenga la división en- tera y el resto de la misma utilizando únicamente los operadores suma y resta. 6.12. Escribir una función que permita deducir si una fecha leída del teclado es válida. 6.13. Diseñar un algoritmo que transforme un número in- troducido por teclado en notación decimal a notación romana. El número será entero positivo y no excederá de 3.000. 6.14. Escribir el algoritmo de una función recursiva que: a) calcule el factorial de un número entero positivo, b) la potencia de un número entero positivo.
  • 275. 245 Fundamentos de programación PARTE II ESTRUCTURA DE DATOS CONTENIDO Capítulo 7. Estructuras de datos I (arrays y estructuras) Capítulo 8. Las cadenas de caracteres Capítulo 9. Archivos (ficheros) Capítulo 10. Ordenación, búsqueda e intercalación Capítulo 11. Ordenación, búsqueda y fusión externa (archivos) Capítulo 12. Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas) Capítulo 13. Estructuras de datos no lineales (árboles y grafos). Capítulo 14. Recursividad.
  • 277. CAPÍTULO 7 Estructuras de datos I (arrays y estructuras)1 7.1. Introducción a las estructuras de datos 7.2. Arrays (arreglos) unidimensionales: los vec- tores 7.3. Operaciones con vectores 7.4. Arrays de varias dimensiones 7.5. Arrays multidimensionales 7.6. Almacenamiento de arrays en memoria 7.7. Estructuras versus registros 7.8. Arrays de estructuras 7.9. Uniones ACTIVIDADES DE PROGRAMACIÓN RESUELTAS CONCEPTOS CLAVE RESUMEN EJERCICIOS En los capítulos anteriores se ha introducido el con- cepto de datos de tipo simple que representan valores de tipo simple, como un número entero, real o un carácter. En muchas situaciones se necesita, sin em- bargo, procesar una colección de valores que están relacionados entre sí por algún método, por ejemplo, una lista de calificaciones, una serie de temperaturas medidas a lo largo de un mes, etc. El procesamiento de tales conjuntos de datos, utilizando datos simples, puede ser extremadamente difícil y por ello la mayoría de los lenguajes de programación incluyen caracterís- ticas de estructuras de datos. Las estructuras de datos básicas que soportan la mayoría de los lenguajes de programación son los “arrays” —concepto matemá- tico de “vector” y “matriz”—. Un array, o arreglo en Latinoamérica, es una se- cuencia de posiciones de la memoria central a las que se puede acceder directamente, que contiene datos del mismo tipo y pueden ser seleccionados individualmen- te mediante el uso de subíndices. Este capítulo estudia el concepto de arrays unidimensionales y multidimen- sionales, así como el procesamiento de los mismos. INTRODUCCIÓN l El término array se conserva en inglés por su amplia aceptación en la comunidad de ingeniería informática y de sistemas. Sin embargo, es preciso constatar que en prácticamente toda Latinoamérica (al menos en muchos de los numerosos países que conocemos y con los que tenemos relaciones académicas y personales) el término empleado como traducción es arreglo. El DRAE (última edición, 22.ª, Madrid 2001) no conside- ra ninguno de los dos términos como válidos, aunque la acepción 2 de la definición de arreglo pudiera ser ilustrativa del porqué de la adopción del término por la comunidad latinoamericana: “Regla, orden, coordinación”.
  • 278. 248 Fundamentos de programación 7.1. INTRODUCCIÓN A LAS ESTRUCTURAS DE DATOS Una estructura de datos es una colección de datos que pueden ser caracterizados por su organización y las operacio- nes que se definen en ella. Las estructuras de datos son muy importantes en los sistemas de computadora. Los tipos de datos más frecuentes utilizados en los diferentes lenguajes de programación son: datos simples estándar entero (integer) real (real) carácter (char) lógico (boolean) definido por el programador subrango (subrange) (no estándar) enumerativo (enumerated) datos estructurados estáticos arrays (vectores/matrices) registros (record) ficheros (archivos) conjuntos (set) cadenas (string) dinámicos listas (pilas/colas) listas enlazadas árboles grafos Los tipos de datos simples o primitivos significan que no están compuestos de otras estructuras de datos; los más frecuentes y utilizados por casi todos los lenguajes son: enteros, reales y carácter (char), siendo los tipos lógicos, subrango y enumerativos propios de lenguajes estructurados como Pascal. Los tipos de datos compuestos están construidos basados en tipos de datos primitivos; el ejemplo más representativo es la cadena (string) de caracteres. Los tipos de datos simples pueden ser organizados en diferentes estructuras de datos: estáticas y dinámicas. Las estructuras de datos estáticas son aquellas en las que el tamaño ocupado en memoria se define antes de que el programa se ejecute y no puede modificarse dicho tamaño durante la ejecución del programa. Estas estructuras están implementadas en casi todos los lenguajes: array (vectores/tablas-matrices), registros, ficheros o archivos (los con- juntos son específicos del lenguaje Pascal). Las estructuras de datos dinámicas no tienen las limitaciones o restric- ciones en el tamaño de memoria ocupada que son propias de las estructuras estáticas. Mediante el uso de un tipo de datos específico, denominado puntero, es posible construir estructuras de datos dinámicas que son soportadas por la mayoría de los lenguajes que ofrecen soluciones eficaces y efectivas en la solución de problemas complejos —Pascal es el lenguaje tipo por excelencia con posibilidad de estructuras de datos dinámicos—. Las estructuras dinámicas por excelencia son las listas —enlazadas, pilas, colas—, árboles —binarios, árbol-b, búsqueda binaria— y grafos. La elección del tipo de estructura de datos idónea a cada aplicación dependerá esencialmente del tipo de aplica- ción y, en menor medida, del lenguaje, ya que en aquellos en que no está implementada una estructura —por ejemplo, las listas y árboles no los soporta COBOL— deberá ser simulada con el algoritmo adecuado, dependiendo del propio algoritmo y de las características del lenguaje su fácil o difícil solución. Una característica importante que diferencia a los tipos de datos es la siguiente: los tipos de datos simples tienen como característica común que cada variable representa a un elemento; los tipos de datos estructurados tienen como característica común que un identificador (nombre) puede representar múltiples datos individuales, pudiendo cada uno de éstos ser referenciado independientemente. 7.2. ARRAYS (ARREGLOS) UNIDIMENSIONALES: LOS VECTORES Un array o arreglo (matriz o vector) es un conjunto finito y ordenado de elementos homogéneos. La propiedad “or- denado” significa que el elemento primero, segundo, tercero, ..., enésimo de un array puede ser identificado. Los
  • 279. Estructuras de datos I (arrays y estructuras) 249 elementos de un array son homogéneos, es decir, del mismo tipo de datos. Un array puede estar compuesto de todos sus elementos de tipo cadena, otro puede tener todos sus elementos de tipo entero, etc. Los arrays se conocen también como matrices —en matemáticas— y tablas —en cálculos financieros—. El tipo más simple de array es el array unidimensional o vector (matriz de una dimensión). Un vector de una dimensión denominado NOTAS que consta de n elementos se puede representar por la Figura 7.1. NOTAS(1) NOTAS(2) ..... NOTAS(I) ..... NOTAS(N) Figura 7.1. Vector. El subíndice o índice de un elemento (1, 2, ..., i, n) designa su posición en la ordenación del vector. Otras posibles notaciones del vector son: a1, a2, ..., ai, ..., an A(1), A(2), ..., A(i), ..., A(n) A[1], A[2], ..., A[i], ..., A[n] en matemáticas y algunos lenguajes (VB 6.0 y VB.Net) en programación (Pascal y C) Obsérvese que sólo el vector global tiene nombre (NOTAS). Los elementos del vector se referencian por su sub- índice o índice (“subscript”), es decir, su posición relativa en el valor. En algunos libros y tratados de programación, además de las notaciones anteriores, se suele utilizar esta otra: A(L:U) = {A(I)} para I = L, L+1, ..., U-1, U donde cada elemento A(I) es de tipo de datos T que significa: A, vector unidimensional con elementos de datos tipo T, cuyos subíndices varían en el rango de L a U, lo cual significa que el índice no tiene por qué comenzar necesariamente en 0 o en 1. Como ejemplo de un vector o array unidimensional, se puede considerar el vector TEMPERATURA que contiene las temperaturas horarias registradas en una ciudad durante las veinticuatro horas del día. Este vector constará de veinticuatro elementos de tipo real, ya que las temperaturas normalmente no serán enteras siempre. El valor mínimo permitido de un vector se denomina límite inferior del vector (L) y el valor máximo permitido se denomina límite superior (U). En el ejemplo del vector TEMPERATURAS el límite inferior es 1 y el superior 24. TEMPERATURAS(I) donde 1 = I = 24 El número de elementos de un vector se denomina rango del vector. El rango del vector A(L:U) es U-L+1. El rango del vector B(1:n) es n. Los vectores, como ya se ha comentado, pueden contener datos no numéricos, es decir, tipo “carácter”. Por ejem- plo, un vector que representa las frutas que se venden en un supermercado: FRUTAS(1) FRUTAS(2) . . . FRUTAS(I) . . . . FRUTAS(N) uvas manzanas . . . papayas . . . . melocotones
  • 280. 250 Fundamentos de programación Otro ejemplo de un vector pueden ser los nombres de los alumnos de una clase. El vector se denomina ALUMNOS y tiene treinta elementos de rango. ALUMNOS 1 Luis Francisco 2 Jose 3 Victoria . i Martin . 30 Graciela Los vectores se almacenan en la memoria central de la computadora en un orden adyacente. Así, un vector de cincuenta números denominado NUMEROS se representa gráficamente por cincuenta posiciones de memoria sucesivas. Memoria NUMEROS[1] Dirección X NUMEROS[2] Dirección X+1 NUMEROS[3] Dirección X+2 NUMEROS[50] Dirección X+49 Cada elemento de un vector se puede procesar como si fuese una variable simple al ocupar una posición de me- moria. Así, NUMEROS[25] ← 72 almacena el valor entero o real 72 en la posición 25.ª del vector NUMEROS y la instrucción de salida escribir (NUMEROS[25]) visualiza el valor almacenado en la posición 25.ª, en este caso 72. Esta propiedad significa que cada elemento de un vector —y posteriormente una tabla o matriz— es accesible directamente y es una de las ventajas más importantes de usar un vector: almacenar un conjunto de datos. Consideremos un vector X de ocho elementos X[1] X[2] X[3] X[4] X[5] X[6] X[7] X[8] 14.0 12.0 8.0 7.0 6.41 5.23 6.15 7.25 Elemento 1.º Elemento 2.º Elemento 8.º
  • 281. Estructuras de datos I (arrays y estructuras) 251 Algunas instrucciones que manipulan este vector se representan en la Tabla 7.1. Tabla 7.1. Operaciones básicas con vectores Acciones Resultados escribir(X[1]) Visualiza el valor de X[1] o 14.0. X[4] ← 45 Almacena el valor 45 en X[4]. SUMA ← X[1]+X[3] Almacena la suma de X[1] y x[3] o bien 22.0 en la variable SUMA. SUMA ← SUMA+X[4] Añade en la variable SUMA el valor de X[4], es decir, SUMA = 67.0. X[5] ← x[5]+3,5 Suma 3.5 a X[5]; el nuevo valor de X[5] será 9.91. X[6] ← X[1]+X[2] Almacena la suma de X[1] y X[2] en X[6]; el nuevo valor de X[6] será 26.5. Antes de pasar a tratar las diversas operaciones que se pueden efectuar con vectores, consideremos la notación de los diferentes elementos. Supongamos un vector V de ocho elementos. V[1] V[2] V[3] V[4] V[5] V[6] V[7] V[8] 12 5 –7 14.5 20 1.5 2.5 -10 Los subíndices de un vector pueden ser enteros, variables o expresiones enteras. Así, por ejemplo, si I ← 4 V[I+1] V[I+2] V[I-2] V[I+3] representa el elemento V(5) de valor 20 representa el elemento V(6) de valor 1.5 representa el elemento V(2) de valor 5 representa el elemento V(7) de valor 2.5 Los arrays unidimensionales, al igual que posteriormente se verán los arrays multidimensionales, necesitan ser dimensionados previamente a su uso dentro de un programa. 7.3. OPERACIONES CON VECTORES Un vector, como ya se ha mencionado, es una secuencia ordenada de elementos como X[1], X[2], ..., X[n] El límite inferior no tiene por qué empezar en uno. El vector L L[0], L[1], L[2], L[3], L[4], L[5] contiene seis elementos, en el que el primer elemento comienza en cero. El vector P, cuyo rango es 7 y sus límites inferior y superior son –3 y 3, es P[-3], P[-2], P[-1], P[0], P[1], P[2], P[3] Las operaciones que se pueden realizar con vectores durante el proceso de resolución de un problema son: • asignación, • lectura/escritura,
  • 282. 252 Fundamentos de programación • recorrido (acceso secuencial), • actualizar (añadir, borrar, insertar), • ordenación, • búsqueda. En general, las operaciones con vectores implican el procesamiento o tratamiento de los elementos individuales del vector. Las notaciones algorítmicas que utilizaremos en este libro son: tipo array [liminf .. limsup] de tipo : nombre_array nombre_array nombre válido del array liminf..limsup límites inferior y superior del rango del array tipo tipo de datos de los elementos del array: entero, real, carácter tipo array[1..10] de carácter : NOMBRES var NOMBRES : N significa que NOMBRES es un array (vector) unidimensional de diez elementos (1 a 10) de tipo carácter. tipo array['A'..'Z'] de real : LISTA var LISTA : L representa un vector cuyos subíndices son A, B, ... y cuyos elementos son de tipo real. tipo array[0..100] de entero : NUMERO var NUMERO:NU NUMERO es un vector cuyos subíndices van de 0 a 100 y de tipo entero. Las operaciones que analizaremos en esta sección serán: asignación, lectura/escritura, recorrido y actualización, dejando por su especial relevancia como tema exclusivo de un capítulo la ordenación o clasificación y búsqueda. 7.3.1. Asignación La asignación de valores a un elemento del vector se realizará con la instrucción de asignación: A[29] ← 5 asigna el valor 5 al elemento 20 del vector A Si se desea asignar valores a todos los elementos de un vector, se debe recurrir a estructuras repetitivas (desde, mientras o repetir) e incluso selectivas (si-entonces, segun). leer(A[i]) Si se introducen los valores 5, 7, 8, 14 y 12 mediante asignaciones A[1] ← 5 A[2] ← 7
  • 283. Estructuras de datos I (arrays y estructuras) 253 A[3] ← 8 A[4] ← 14 A[5] ← 12 El ejemplo anterior ha asignado diferentes valores a cada elemento del vector A; si se desea dar el mismo valor a todos los elementos, la notación algorítmica se simplifica con el formato. desde i = 1 hasta 5 hacer A[i] ← 8 fin_desde donde A[i] tomará los valores numéricos A[1] = 8, A[2] = 8, ..., A[5] = 8 Se puede utilizar también la notación A ← 8 para indicar la asignación de un mismo valor a cada elemento de un vector A. Esta notación se considerará con mu- cho cuidado para evitar confusión con posibles variables simples numéricas de igual nombre (A). 7.3.2. Lectura/escritura de datos La lectura/escritura de datos en arrays u operaciones de entrada/salida normalmente se realizan con estructuras re- petitivas, aunque puede también hacerse con estructuras selectivas. Las instrucciones simples de lectura/escritura se representarán como leer(V[5]) leer el elemento V[5] del vector V 7.3.3. Acceso secuencial al vector (recorrido) Se puede acceder a los elementos de un vector para introducir datos (escribir) en él o bien para visualizar su conte- nido (leer). A la operación de efectuar una acción general sobre todos los elementos de un vector se la denomina recorrido del vector. Estas operaciones se realizan utilizando estructuras repetitivas, cuyas variables de control (por ejemplo, I) se utilizan como subíndices del vector (por ejemplo, S[I]). El incremento del contador del bucle pro- ducirá el tratamiento sucesivo de los elementos del vector. EJEMPLO 7.1 Lectura de veinte valores enteros de un vector denominado F. Procedimiento 1 algoritmo leer_vector tipo array[1..20] de entero : FINAL var FINAL : F inicio desde i ← 1 hasta 20 hacer leer(F[i]) fin_desde fin
  • 284. 254 Fundamentos de programación La lectura de veinte valores sucesivos desde el teclado rellenará de valores el vector F, comenzando con el ele- mento F[1] y terminando en F[20]. Si se cambian los límites inferior y superior (por ejemplo, 5 y 10), el bucle de lectura sería desde i ← 5 hasta 10 hacer leer(F[i]) fin_desde Procedimiento 2 Los elementos del vector se pueden leer también con bucles mientras o repetir. i ← 1 mientras i = 20 hacer leer(F[i]) i ← i + 1 fin_mientras o bien i ← 1 repetir leer (F[i]) i ← i + 1 hasta_que i 20 La salida o escritura de vectores se representa de un modo similar. La estructura desde i ← 1 hasta i ← 20 hacer escribir(F[i]) fin_desde visualiza todo el vector completo (un elemento en cada línea independiente). EJEMPLO 7.2 Este ejemplo procesa un array PUNTOS, realizando las siguientes operaciones; a) lectura del array, b) cálculo de la suma de los valores del array, c) cálculo de la media de los valores. El array lo denominaremos PUNTOS; el límite superior del rango lo introduciremos por teclado y el límite inferior lo consideraremos 1. algoritmo media_puntos const LIMITE = 40 tipo array[1..LIMITE] de real : PUNTUACION var PUNTUACION : PUNTOS real : suma, media entero : i inicio suma ← 0 escribir('Datos del array') desde i ← 1 hasta LIMITE hacer leer(PUNTOS[i]) suma ← suma + PUNTOS[i] fin_desde media ← suma / LIMITE escribir('La media es', media) fin
  • 285. Estructuras de datos I (arrays y estructuras) 255 Se podría ampliar el ejemplo, en el sentido de visualizar los elementos del array, cuyo valor es superior a la me- dia. Mediante una estructura desde se podría realizar la operación, añadiéndole al algoritmo anterior. escribir('Elementos del array superior a la media') desde i ← 1 hasta LIMITE hacer si PUNTOS[i] media entonces escribir(PUNTOS[i]) fin_si fin_desde EJEMPLO 7.3 Calcular la media de las estaturas de una clase. Deducir cuántos son más altos que la media y cuántos son más bajos que dicha media (véase Figura 7.2). Solución Tabla de variables n H[1]...H[n] i MEDIA ALTOS BAJOS SUMA número de estudiantes de la clase estatura de los n alumnos contador de alumnos media de estaturas alumnos de estatura mayor que la media alumnos de estatura menor que la media totalizador de estaturas : entera : real : entera : real : entera : entera : real 7.3.4. Actualización de un vector La operación de actualizar un vector puede constar a su vez de tres operaciones elementales: añadir elementos insertar elementos borrar elementos Se denomina añadir datos a un vector la operación de añadir un nuevo elemento al final del vector. La única condición necesaria para esta operación consistirá en la comprobación de espacio de memoria suficiente para el nue- vo vector; dicho de otro modo, que el vector no contenga todos los elementos con que fue definido al principio del programa. EJEMPLO 7.4 Un array TOTAL se ha dimensionado a seis elementos, pero sólo se le han asignado cuatro valores a los elementos TOTAL[1], TOTAL[2], TOTAL[3] y TOTAL[4]. Se podrán añadir dos elementos más con una simple acción de asignación. TOTAL[5] ← 14 TOTAL[6] ← 12 La operación de insertar un elemento consiste en introducir dicho elemento en el interior del vector. En este caso se necesita un desplazamiento previo hacia abajo para colocar el elemento nuevo en su posición relativa.
  • 286. 256 Fundamentos de programación EJEMPLO 7.5 Se tiene un array Coches2 de nueve elementos de contiene siete marcas de automóviles en orden alfabético y se de- sea insertar dos nuevas marcas: Opel y Citroën. Como Opel está comprendido entre Lancia y Renault, se deberán desplazar hacia abajo los elementos 5 y 6, que pasarán a ocupar la posición relativa 6 y 7. Posteriormente debe realizarse la operación con Citroën, que ocu- pará la posición 2. El algoritmo que realiza esta operación para un vector de n elementos es el siguiente, suponiendo que haya es- pacio suficiente en el vector. 2 En Latinoamérica, su término equivalente es CARRO o AUTO. sí sí no inicio i ← i + 1 SUMA ← SUMA+H[i] MEDIA ← SUMA/n BAJOS ← 0 ALTOS ← 0 I ← 0 i ← i + 1 H[i] MEDIA ALTOS ← ALTOS + 1 escribir n, MEDIA BAJOS, ALTOS sí sí no no leer n leer H[i] i = n i = n? fin H[i] media? BAJOS ← BAJOS + 1 Figura 7.2. Diagrama de flujo para el cálculo de la estatura media de una clase.
  • 287. Estructuras de datos I (arrays y estructuras) 257 1. //Calcular la posición ocupada por el elemento a insertar (por ejemplo, P) 2. //Inicializar contador de inserciones i ← n 3. mientras i = P hacer //transferir el elemento actual i-ésimo hacia abajo, a la posición i+1 COCHES[i + 1] ← COCHES[i] //decrementar contador i ← i - 1 fin_mientras 4. //insertar el elemento en la posición P COCHES[P] ← 'nuevo elemento' 5. //actualizar el contador de elementos del vector 6. n ← n + 1 7. fin a) ALUMNOS b) Insertar OPEL c) Insertar CITROËN 1 Alfa Romeo 1 Alfa Romeo 1 Alfa Romeo 2 Fiat 2 Fiat 2 Citroën 3 Ford 3 Ford 3 Fiat 4 Lancia 4 Lancia 4 Ford 5 Renault 5 Opel 5 Lancia 6 Seat 6 Renault 6 Opel 7 7 Seat 7 Renault 8 8 8 Seat 9 9 9 Si se deseara realizar más inserciones, habría que incluir una estructura de decisión si-entonces para pregun- tar si se van a realizar más inserciones. La operación de borrar un elemento al final del vector no presenta ningún problema; el borrado de un elemen- to del interior del vector provoca el movimiento hacia arriba de los elementos inferiores a él para reorganizar el vector. El algoritmo de borrado del elemento j-ésimo del vector COCHES es el siguiente: algoritmo borrado inicio //se utilizará una variable auxiliar —AUX— que contendrá el valor //del elemento que se desea borrar AUX ← COCHES[j] desde i ← j hasta N-1 hacer //llevar elemento j + 1 hacia arriba COCHES[i] ← COCHES[i + 1] fin_desde //actualizar contador de elementos //ahora tendrá un elemento menos, N - 1 N ← N - 1 fin
  • 288. 258 Fundamentos de programación 7.4. ARRAYS DE VARIAS DIMENSIONES Los vectores examinados hasta ahora se denominan arrays unidimensionales y en ellos cada elemento se define o referencia por un índice o subíndice. Estos vectores son elementos de datos escritos en una secuencia. Sin embargo, existen grupos de datos que son representados mejor en forma de tabla o matriz con dos o más subíndices. Ejemplos típicos de tablas o matrices son: tablas de distancias kilométricas entre ciudades, cuadros horarios de trenes o aviones, informes de ventas periódicas (mes/unidades vendidas o bien mes/ventas totales), etc. Se pueden definir tablas o matrices como arrays multidimensionales, cuyos elementos se pueden referenciar por dos, tres o más subíndices. Los arrays no unidimensionales los dividiremos en dos grandes grupos: arrays bidimensionales (2 dimensiones) arrays multidimensionales (3 o más dimensiones) 7.4.1. Arrays bidimensionales (tablas/matrices) El array bidimensional se puede considerar como un vector de vectores. Es, por consiguiente, un conjunto de ele- mentos, todos del mismo tipo, en el cual el orden de los componentes es significativo y en el que se necesita espe- cificar dos subíndices para poder identificar cada elemento del array. Si se visualiza un array unidimensional, se puede considerar como una columna de datos; un array bidimensio- nal es un grupo de columnas, como se ilustra en la Figura 7.3. El diagrama representa una tabla o matriz de treinta elementos (5 × 6) con 5 filas y 6 columnas. Como en un vector de treinta elementos, cada uno de ellos tiene el mismo nombre. Sin embargo, un subíndice no es suficiente para especificar un elemento de un array bidimensional; por ejemplo, si el nombre del array es M, no se puede indi- car M[3], ya que no sabemos si es el tercer elemento de la primera fila o de la primera columna. Para evitar la am- bigüedad, los elementos de un array bidimensional se referencian con dos subíndices: el primer subíndice se refiere a la fila y el segundo subíndice se refiere a la columna. Por consiguiente, M[2, 3] se refiere al elemento de la se- gunda fila, tercera columna. En nuestra tabla ejemplo M[2, 3] contiene el valor 18. Fila 1 Fila 2 Fila 3 Fila 4 Fila 5 Columna 6 Columna 5 Columna 4 Columna 3 Columna 2 Columna 1 Figura 7.3. Array bidimensional. Un array bidimensional M, también denominado matriz (términos matemáticos) o tabla (términos financieros), se considera que tiene dos dimensiones (una dimensión por cada subíndice) y necesita un valor para cada subíndice para poder identificar un elemento individual. En notación estándar, normalmente el primer subíndice se refiere a la fila del array, mientras que el segundo subíndice se refiere a la columna del array. Es decir, B[I, J] es el elemento de B que ocupa la Iª fila y la Jª columna, como se indica en la Figura 7.4. El elemento B[I, J] también se puede representar por BI, J. Más formalmente en notación algorítmica, el array B con elementos del tipo T (numéricos, alfanuméricos, etc.) con subíndices fila que varían en el rango de 1 a M y subíndices columna en el rango de 1 a N es
  • 289. Estructuras de datos I (arrays y estructuras) 259 1 2 ... I ... M 1 2 3 4 ... J ... N B[I, J] Figura 7.4. Elemento B[I, J] del array B. B(1:M, 1:N) = {B[I, J]} donde I = 1, ..., M J = 1, ..., N o bien 1 = I = M 1 = J = N cada elemento B[I, J] es de tipo T. El array B se dice que tiene M por N elementos. Existen N elementos en cada fila y M elementos en cada columna (M*N). Los arrays de dos dimensiones son muy frecuentes: las calificaciones de los estudiantes de una clase se almace- nan en una tabla NOTAS de dimensiones NOTAS[20, 5], donde 20 es el número de alumnos y 5 el número de asig- naturas. El valor del subíndice I debe estar entre 1 y 20, y el de J entre 1 y 5. Los subíndices pueden ser variables o expresiones numéricas, NOTAS(M, 4) y en ellos el subíndice de filas irá de 1 a M y el de columnas de 1 a N. En general, se considera que un array bidimensional comienza sus subíndices en 0 o en 1 (según el lenguaje de programación, 0 en el lenguaje C, 1 en FORTRAN), pero pueden tener límites seleccionados por el usuario durante la codificación del algoritmo. En general, el array bidimensional B con su primer subíndice, variando desde un lími- te inferior L (inferior, low) a un límite superior U (superior, up). En notación algorítmica B(L1:U1, L2:U2) = {B[I, J]} donde L1 = I = U1 L2 = J = U2 cada elemento B[I, J] es de tipo T. El número de elementos de una fila de B es U2–L2+1 y el número de elementos en una columna de B es U1–L1+1. Por consiguiente, el número total de elementos del array B es (U2–L2+1)*(U1–L1+1). EJEMPLO 7.6 La matriz T representa una tabla de notaciones de saltos de altura (primer salto), donde las filas representan el nombre del atleta y las columnas las diferentes alturas saltadas por el atleta. Los símbolos almacenados en la tabla son: x, salto válido; 0, salto nulo o no intentado. Columna T Fila 2.00 2.10 2.20 2.30 2.35 2.40 García x 0 x x x 0 Pérez 0 x x 0 x 0 Gil 0 0 0 0 0 0 Mortimer 0 0 0 x x x
  • 290. 260 Fundamentos de programación EJEMPLO 7.7 Un ejemplo típico de un array bidimensional es un tablero de ajedrez. Se puede representar cada posición o casilla del tablero mediante un array, en el que cada elemento es una casilla y en el que su valor será un código represen- tativo de cada figura del juego. Figura 7.5. Array típico, “tablero de ajedrez”. Los diferentes elementos serán elemento[i, j] = 0 elemento[i, j] = 1 elemento[i, j] = 2 elemento[i, j] = 3 elemento[i, j] = 4 elemento[i, j] = 5 elemento[i, j] = 6 si no hay nada en la casilla [i, j] si el cuadro (casilla) contiene un peón blanco un caballo blanco un alfil blanco una torre blanca una reina blanca un rey blanco y los correspondientes números, negativos para las piezas negras. EJEMPLO 7.8 Supongamos que se dispone de un mapa de ferrocarriles y los nombres de las estaciones (ciudades) están en un vector denominado “ciudad”. El array f puede tener los siguientes valores: f[i, j] = 1 f[i, j] = 0 si existe enlace entre las ciudades i y j, ciudad[i] y ciudad[j] no existe enlace Nota El array f resume la información de la estructura de la red de enlaces. 7.5. ARRAYS MULTIDIMENSIONALES Un array puede ser definido de tres dimensiones, cuatro dimensiones, hasta de n-dimensiones. Los conceptos de rango de subíndices y número de elementos se pueden ampliar directamente desde arrays de una y dos dimensiones a estos arrays de orden más alto. En general, un array de n-dimensiones requiere que los valores de los n subíndices
  • 291. Estructuras de datos I (arrays y estructuras) 261 puedan ser especificados a fin de identificar un elemento individual del array. Si cada componente de un array tiene n subíndices, el array se dice que es sólo de n-dimensiones. El array A de n-dimensiones se puede identificar como A(L1:U1, L2:U2, ... Ln:Un) y un elemento individual del array se puede especificar por A(I1, I2, ..., In) donde cada subíndice Ik está dentro de los límites adecuados Lk = Ik = Uk donde k = 1, 2, ..., n El número total de elementos de un array A es n Π k = 1 (Uk–Lk+1) Π (símbolo del producto) que se puede escribir alternativamente como (U1–L1+1)*(U2–L2+1)*...*(UN–LN+1) Si los límites inferiores comenzasen en 1, el array se representaría por A(K1, K2, ..., Kn) o bien Ak1, k2, ..., kn donde 1 = K1 = S1 1 = K2 = S2 . . 1 = Kn = Sn EJEMPLO 7.9 Un array de tres dimensiones puede ser uno que contenga los datos relativos al número de estudiantes de la univer- sidad ALFA de acuerdo a los siguientes criterios: • cursos (primero a quinto), • sexo (varón/hembra), • diez facultades. El array ALFA puede ser de dimensiones 5 por 2 por 10 (alternativamente 10 × 5 × 2 o 10 × 2 × 5, 2 × 5 × 10, etcétera). La Figura 7.6 representa el array ALFA. El valor de elemento ALFA[I, J, K] es el número de estudiantes del curso I de sexo J de la facultad K. Para ser válido I debe ser 1, 2, 3, 4 o 5; J debe ser 1 o 2; K debe estar comprendida entre 1 y 10 inclusive. Sexo Curso Facultad Figura 7.6. Array de tres dimensiones.
  • 292. 262 Fundamentos de programación EJEMPLO 7.10 Otro array de tres dimensiones puede ser PASAJE que representa el estado actual del sistema de reserva de una línea aérea, donde i = 1, 2, ..., 10 representa el número de vuelo j = 1, 2, ..., 60 representa la fila del avión k = 1, 2, ..., 12 representa el asiento dentro de la fila Entonces pasaje[i, j, k] = 0 asiento libre pasaje[i, j, k] = 1 asiento ocupado 7.6. ALMACENAMIENTO DE ARRAYS EN MEMORIA Las representaciones gráficas de los diferentes arrays se recogen en la Figura 7.7. Debido a la importancia de los arrays, casi todos los lenguajes de programación de alto nivel proporcionan medios eficaces para almacenar y acce- der a los elementos de los arrays, de modo que el programador no tenga que preocuparse sobre los detalles especí- ficos de almacenamiento. Sin embargo, el almacenamiento en la computadora está dispuesto fundamentalmente en secuencia contigua, de modo que cada acceso a una matriz o tabla la máquina debe realizar la tarea de convertir la posición dentro del array en una posición perteneciente a una línea. A[1] A[2] . . . A[ i ] . . . A[n] a) A[1, 1] A[2, 1] A[3, 1] b) A[1, 2] A[2, 2] A[3, 2] A[1, 3] A[2, 3] A[3, 3] A[1, 4] A[2, 4] A[3, 4] Figura 7.7. Arrays de una y dos dimensiones. 7.6.1. Almacenamiento de un vector El almacenamiento de un vector en memoria se realiza en celdas o posiciones secuenciales. Así, en el caso de un vector A con un subíndice de rango 1 a n, Posición B A[1] Posición B+1 A[2] . . . A[3] . . . A[i] . . . Posición B+n–1 A[n]
  • 293. Estructuras de datos I (arrays y estructuras) 263 Si cada elemento del array ocupa S bytes (1 byte = 8 bits) y B es la dirección inicial de la memoria central de la computadora —posición o dirección base—, la dirección inicial del elemento i-ésimo sería: B+(I-1)*S Nota Si el límite inferior no es igual a 1, considérese el array declarado como N(4:10); la dirección inicial de N(6) es B+(6–4)*S. En general, el elemento N(I) de un array definido como N(L:U) tiene la dirección inicial B+(I-L)*S 7.6.2. Almacenamiento de arrays multidimensionales Debido a que la memoria de la computadora es lineal, un array multidimensional debe estar linealizado para su dis- posición en el almacenamiento. Los lenguajes de programación pueden almacenar los arrays en memoria de dos formas: orden de fila mayor y orden de columna mayor. El medio más natural en que se leen y almacenan los arrays en la mayoría de los compiladores es el denomina- do orden de fila mayor (véase Figura 7.8). Por ejemplo, si un array es B[1:2, 1:3], el orden de los elementos en la memoria es: B[1, 1] B[1, 2] B[1, 3] B[2, 1] B[2, 2] B[2, 3] Fila 1 Fila 2 Figura 7.8. Orden de fila mayor. C, COBOL y Pascal almacenan los elementos por filas. FORTRAN emplea el orden de columna mayor en el que las entradas de la primera columna vienen primero. B[1, 1] B[2, 1] B[1, 2] B[2, 2] B[1, 3] B[2, 3] Columna 1 Columna 2 Columna 3 Figura 7.9. Orden de columna mayor. De modo general, el compilador del lenguaje de alto nivel debe ser capaz de calcular con un índice [i, j] la po- sición del elemento correspondiente. En un array en orden de fila mayor, cuyos subíndices máximos sean m y n (m, filas; n, columnas), la posición p del elemento [i, j] con relación al primer elemento es p = n(i–1)+j Para calcular la dirección real del elemento [i, j] se añade p a la posición del primer elemento y se resta 1. La representación gráfica del almacenamiento de una tabla o matriz B[2, 4] y C[2, 4]. (Véase Figura 7.10.) En el caso de un array de tres dimensiones, supongamos un array tridimensional A[1:2, 1:4, 1:3]. La Figu- ra 7.11 representa el array A y su almacenamiento en memoria.
  • 294. 264 Fundamentos de programación B[1, 2] B[1, 1] B[1, 3] B[1, 4] B[2, 1] B[2, 2] B[2, 3] B[2, 4] a) B[2, 1] B[1, 1] B[1, 2] B[2, 2] B[1, 3] B[2, 3] B[1, 4] B[2, 4] b) B[2, 1] B[2, 2] B[2, 3] B[2, 4] B[1, 1] B[1, 2] B[1, 3] B[1, 4] B[2, 1] B[2, 2] B[2, 3] B[2, 4] B[1, 1] B[1, 2] B[1, 3] B[1, 4] b) a) Figura 7.10. Almacenamiento de una matriz: a) por filas, b) por columnas. A[2, 1, 3] A[2, 2, 3] A[2, 3, 3] A[2, 4, 3] A[1, 1, 3] A[1, 2, 3] A[1, 3, 3] A[1, 4, 3] A[2, 2, 2] A[2, 3, 2] A[2, 4, 2] A[1, 1, 2] A[1, 2, 2] A[1, 3, 2] A[1, 4, 2] A[2, 1, 2] A[2, 1, 1] A[2, 2, 1] A[2, 3, 1] A[2, 4, 1] A[1, 1, 1] A[1, 2, 1] A[1, 3, 1] A[1, 4, 1] Figura 7.11. Almacenamiento de una matriz A[2,4,3] por columnas. En orden a determinar si es más ventajoso almacenar un array en orden de columna mayor o en orden de fila mayor, es necesario conocer en qué orden se referencian los elementos del array. De hecho, los lenguajes de progra- mación no le dan opción al programador para que elija una técnica de almacenamiento. Consideremos un ejemplo del cálculo del valor medio de los elementos de un array A de 50 por 300 elementos, A[50, 300]. Los algoritmos de almacenamiento respectivos serán: Almacenamiento por columna mayor total ← 0 desde j ← 1 hasta 300 hacer desde i ← 1 hasta 50 hacer total ← total + a[i, j] fin_desde fin_desde media ← total / (300*50) Almacenamiento por fila mayor total ← 0 desde i ← 1 hasta 50 hacer desde j ← 1 hasta 300 hacer
  • 295. Estructuras de datos I (arrays y estructuras) 265 total ← total + a[i, j] fin_desde fin_desde media ← total / (300*50) 7.7. ESTRUCTURAS VERSUS REGISTROS Un array permite el acceso a una lista o una tabla de datos del mismo tipo de datos utilizando un único nombre de variable. En ocasiones, sin embargo, se desea almacenar información de diferentes tipos, tales como un nombre de cadena, un número de código entero y un precio de tipo real (coma flotante) juntos en una única estructura. Una estructura que almacena diferentes tipos de datos bajo una misma variable se denomina registro. En POO3 el almacenamiento de información de diferentes tipos con un único nombre suele efectuarse en clases. No obstante, las clases son tipos referencia, esto significa que a los objetos de la clase se accede mediante una refe- rencia. Sin embargo, en muchas ocasiones se requiere el uso de tipos valor. Las variables de un tipo valor contienen directamente los datos, mientras que las variables de tipos referencia almacenan una referencia al lugar donde se encuentran almacenados sus datos. El acceso a los objetos a través de referencia añade tareas y tiempos suplementa- rios y también consume espacio. En el caso de pequeños objetos este espacio extra puede ser significativo. Algunos lenguajes de programación como C y los orientados a objetos como C++, C#, ofrecen el tipo estructura para resolver estos inconvenientes. Una estructura es similar a una clase en orientación a objetos e igual a un registro en lenguajes estructurados como C pero es un tipo valor en lugar de un tipo referencia. 7.7.1. Registros Un registro en Pascal es similar a una estructura en C y aunque en otros lenguajes como C# y C++ las clases pueden actuar como estructuras, en este capítulo restringiremos su definición al puro registro contenedor de diferentes tipos de datos. Un registro se declara con la palabra reservada estructura (struct, en inglés) o registro y se decla- ra utilizando los mismos pasos necesarios para utilizar cualquier variable. Primero, se debe declarar el registro y a continuación se asignan valores a los miembros o elementos individuales del registro o estructura. Sintaxis estructura: nombre_clase tipo_1: campo1 tipo_2: campo2 ... fin_estructura registro: nombre_tipo tipo_1: campo1 tipo_2: campo2 ... fin_registro Ejemplo estructura: fechaNacimiento entero: mes // mes de nacimiento entero: dia // día de nacimiento entero: año // año de nacimiento Fin_estructura La declaración anterior reserva almacenamiento para los elementos de datos individuales denominados campos o miembros de la estructura. En el caso de fecha, la estructura consta de tres campos día, mes y año relativos a una fecha de nacimiento o a una fecha en sentido general. El acceso a los miembros de la estructura se realiza con el operador punto y con la siguiente sintaxis Nombre_estructura.miembro Así fechaNacimiento.mes se refiere al miembro mes de la estructura fecha, y fechaNacimiento.dia se refiere al día de nacimiento de una persona. Un tipo de dato estructura más general podría ser Fecha y que sirviera 3 Programación orientada a objetos.
  • 296. 266 Fundamentos de programación para cualquier dato aplicable a cualquier aplicación (fecha de nacimiento, fecha de un examen, fecha de comienzo de clases, etc.). estructura: Fecha entero: mes entero: dia entero: año fin_estructura Declaración de tipos estructura Una vez definido un tipo estructura se pueden declarar variables de ese tipo al igual que se hace con cualquier otro tipo de datos. Por ejemplo, la sentencia de definición Fecha: Cumpleaños, delDia reserva almacenamiento para dos variables llamadas Cumpleaños y delDia, respectivamente. Cada una de estas estructuras individuales tiene el mismo formato que el declarado en la clase Fecha. Los miembros de una estructura no están restringidos a tipos de datos enteros sino que pueden ser cualquier tipo de dato válido del lenguaje. Por ejemplo, consideremos un registro de un empleado de una empresa que constase de los siguientes miembros: estructura Empleado Cadena: nombre entero: idNumero real: Salario Fecha: FechaNacimiento entero: Antigüedad fin_estructura Obsérvese que en la declaración de la estructura Empleado, el miembro Fecha es un nombre de un tipo estruc- tura previamente definido. El acceso individual a los miembros individuales del tipo estructura de la clase Emplea- do se realiza mediante dos operadores punto, de la forma siguiente: Empleado.Fecha.Dia y se refiere a la variable Dia de la estructura Fecha de la estructura Empleado. Estructuras de datos homogéneas y heterogéneas Los registros (estructuras) y los arrays son tipos de datos estructurados. La diferencia entre estos dos tipos de estructuras de datos son los tipos de elementos que ellos contienen. Un array es una estructura de datos ho- mogénea, que significa que cada uno de sus componentes deben ser del mismo tipo. Un registro es una es- tructura de datos heterogénea, que significa que cada uno de sus componentes pueden ser de tipos de datos diferentes. Por consiguiente, un array de registros es una estructura de datos cuyos elementos son de los mis- mos tipos heterogéneos. 7.8. ARRAYS DE ESTRUCTURAS La potencia real de una estructura o registro se manifiesta en toda su expresión cuando la misma estructura se utiliza para listas de datos. Por ejemplo, supongamos que se deben procesar los datos de la tabla de la Figura 7.12. Un sistema podría ser el siguiente: Almacenar los números de empleado en un array de enteros, los nombres en un array de cadenas de caracteres y los salarios en un array de números reales. Al organizar los datos de esta forma,
  • 297. Estructuras de datos I (arrays y estructuras) 267 cada columna de la Figura 7.13 se considera como una lista independiente que se almacena en su propio array. La correspondencia entre elementos de cada empleado individual se mantiene almacenan los datos de un empleado en la misma posición de cada array. La separación de cada lista completa en tres arrays individuales no es muy eficiente, ya que todos los datos rela- tivos a un empleado se organizan juntos en un registro como se muestra en la Figura 7.13. Utilizando una estructura, se mantiene la integridad de los datos de la organización y bastará un programa que maneje los registros para poder ser manipulados con eficacia. La declaración de un array de estructuras es similar a la declaración de un array de cualquier otro tipo de variable. En consecuencia, en el caso del archivo de empleados de la empresa se puede decla- rar el array de empleado con el nombre Empleado y el registro o estructura lo denominamos RegistroNomina estructura: RegistroNomina entero: NumEmpleado cadena[30]: Nombre real: Salario fin_estructura Se puede declarar un array de estructuras RegistroNomina que permite representar toda la tabla anterior array [1..10] de RegistroNomina : Empleado La sentencia anterior construye un array de diez elementos Empleado, cada uno de los cuales es una estructura de datos de tipo RegistroNomina que representa a un empleado de la empresa Aguas de Sierra Mágina. Obsérvese que la creación de un array de diez estructuras tiene el mismo formato que cualquier otro array. Por ejemplo, la crea- ción de un array de diez enteros denominado Empleado requiere la declaración: array [1..10] de entero : Empleado En realidad la lista de datos de empleado se ha representado mediante una lista de registros como se mostraba en la Figura 7.13. Número de empleado Nombre del empleado Salario 97005 95758 87124 67005 20001 20020 99002 20012 21001 97005 Mackoy, José Luis Mortimer, Juan Rodríguez, Manuel Carrigan, Luis José Mackena, Luis Miguel García de la Cruz, Heraclio Mackoy, María Victoria González, Yiceth Verástegui, Rina Collado, Concha 1.500 1.768 2.456 3.125 2.156 1.990 2.450 4.780 3.590 3.574 Figura 7.13. Lista de registros. Número de empleado Nombre del empleado Salario 97005 95758 87124 67005 20001 20020 99002 20012 21001 97005 Mackoy, José Luis Mortimer, Juan Rodríguez, Manuel Carrigan, Luis José Mackena, Luis Miguel García de la Cruz, Heraclio Mackoy, María Victoria González, Yiceth Gonzáles, Rina Rodríguez, Concha 1.500 1.768 2.456 3.125 2.156 1.990 2.450 4.780 3.590 3.574 Figura 7.12. Lista de datos.
  • 298. 268 Fundamentos de programación 7.9. UNIONES Una unión es un tipo de dato derivado (estructurado) que contiene sólo uno de sus miembros a la vez durante la ejecución del programa. Estos miembros comparten el mismo espacio de almacenamiento; es decir, una unión comparte el espacio en lugar de desperdiciar espacio en variables que no se están utilizando. Los miembros de una unión pueden ser de cualquier tipo, y pueden contener dos o más tipos de datos. La sintaxis para declarar un tipo union es idéntica a la utilizada para definir un tipo estructura, excepto que la palabra union sustituye a es- tructura: Sintaxis union nombre tipo_dato1 identificador1 tipo_dato2 identificador2 … fin_union El número de bytes utilizado para almacenar una unión debe ser suficiente para almacenar el miembro más gran- de. Sólo se puede hacer referencia a un miembro a la vez y, por consiguiente, a un tipo de dato a la vez. En tiempo de ejecución, el espacio asignado a la variable de tipo union no incluye espacio de memoria más que para un miembro de la unión. Ejemplo union TipoPeso entero Toneladas real Kilos real Gramos fin_union TipoPeso peso // Declaración de una variable tipo unión En tiempo de ejecución, el espacio de memoria asignado a la variable peso no incluye espacio para tres compo- nentes distintos; en cambio, peso puede contener uno de los siguientes valores: entero o real. El acceso a un miembro de la unión se realiza con el operador de acceso a miembros (punto, .) peso.Toneladas = 325 Una unión es similar a una estructura con la diferencia de que sólo se puede almacenar en memoria de modo simultáneo un único miembro o campo, al contrario que la estructura que almacena espacio de memoria para todos sus miembros. 7.9.1. Unión versus estructura Una estructura se utiliza para definir un tipo de dato con diferentes miembros. Cada miembro ocupa una posición independiente de memoria estructura rectángulo inicio entero: anchura entero: altura fin_estructura
  • 299. Estructuras de datos I (arrays y estructuras) 269 La estructura rectángulo se puede representar en memoria en la Figura 7.14. anchura estructura rectangulo altura rectángulo valor_e / valor_r unión valor valor Figura 7.14. Estructura versus unión. Una unión es similar a una estructura, sin embargo, sólo se define una única posición que puede ser ocupada por diferentes miembros con nombres diferentes: union valor entero valor_e real valor_r fin_union Los miembros valor_e y valor_r comparten el mismo espacio gráficamente; se puede pensar que una estruc- tura es una caja con diferentes compartimentos, cada uno con su propio nombre (miembro), mientras que una unión es una caja sin compartimentos donde se pueden colocar diferentes etiquetas en su interior. En una estructura, los miembros no interactúan; el cambio de un miembro no modifica a los restantes. En una unión todos los miembros ocupan el mismo espacio, de modo que sólo uno puede estar activo en un momento dado. EJERCICIO 7.1. Se desea almacenar información sobre una figura geométrica estándar (círculo, rectángulo o triángulo). La infor- mación necesaria para dibujar un círculo es diferente de los datos que se necesitan para dibujar un rectángulo, de modo que se necesitan diferentes estructuras para cada figura: estructura circulo entero: radio fin_estructura estructura rectángulo entero: altura, anchura fin_estructura estructura triangulo entero: base entero: altura fin_estructura El ejercicio consiste en definir una estructura que pueda contener una figura genérica. El primer código es un número que indica el tipo de figura y el segundo es una unión que contiene la información de la figura. estructura figura entero: tipo //tipo=0, circulo; tipo=1, rectángulo; tipo=2, triángulo union figura_genérica circulo: datos_circulo rectabgulo: datos_rectangulo triangulo: datos_triangulo fin_union: datos fin_estructura
  • 300. 270 Fundamentos de programación De este modo se puede acceder a miembros de la unión, estructura específica o estructura general con el operador punto. Así el tipo de dato básico figura se puede definir y acceder a sus miembros de la forma siguiente: figura: una_figura // ... una_figura.tipo ← 0 una_figura.datos.datos_circulo.radio ← 125 7.10. ENUMERACIONES Una de las características importantes de la mayoría de los lenguajes de programación modernos es la posibilidad de definir nuevos tipos de datos. Entre estos tipos definidos por el usuario se encuentran los tipos enumerados o enu- meraciones. Un tipo enumerado o de enumeración es un tipo cuyos valores están definidos por una lista de constantes de tipo entero. En un tipo de enumeración las constantes se representan por identificadores separados por comas y encerrados entre llaves. Los valores de un tipo enumerado comienzan con 0, a menos que se especifique lo contrario y se incre- mente en 2. La sintaxis es: enum nombre_tipo {identificador1, identificador2, ...] identificador debe ser válido (1ª, 'B', '24x' no son identificadores válidos). EJEMPLO enum Dias {LUN, MAR, MIE, JUE, VIE, SAB, DOM} enum Meses {ENE, FEB, MAR, ABR, MAY, JUN, JUL, AGO, SEP, OCT, NOV DIC} El tipo Dias toma 7 valores, 0 a 6, y Meses toma 12 valores de 0 a 11. Estas declaraciones crean un nuevo tipo de datos, Dias y Meses; los valores comienzan en 0, a menos que se indique lo contrario. enum MESES {ENE←1, FEB, MAR, ABR, MAY, JUN, JUL, AGO←8, SEP, OCT, NOV, DIC) Con la declaración anterior los meses se enumeran de 1 a 12. El valor de cada constante de enumeración se puede establecer explícitamente en la definición, asignándole un valor al identificador, que puede ser el mismo o distinto entero. También se puede representar el tipo de dato con esta sintaxis: enum Mes { ENE ← 31, FEB ← 28, MAR ← 31, ABR ← 30, MAY ← 31, JUN ← 30, JUL ← 31, AGO ← 31, SEP ← 30, OCT ← 31, NOV ← 30, DIC ← 31 } Si no se especifica ningún valor numérico, los identificadores en una definición de un tipo de enumeración se les asignan valores consecutivos que comienzan por cero. EJEMPLO enum Direccion { NORTE ← 0, SUR ← 1, ESTE ← 2, OESTE ← 3} es equivalente a enum Direccion { NORTE, SUR, ESTE, OESTE}
  • 301. Estructuras de datos I (arrays y estructuras) 271 Sintaxis enum nombre {enumerador1, enumerador2,…} enumerador identificador = expresión constante Las variables de tipo enumeración se pueden utilizar en diferentes tipos de operaciones. Creación de variables enum Semaforo {verde, rojo, amarillo} se pueden asignar variables de tipo Semaforo: var Semaforo Calle, Carretera, Plaza Se crean las variables Calle, Carretera y Plaza de tipo Semaforo. Asignación La sentencia de asignación Calle ← Rojo no asigna a Calle la cadena de caracteres Rojo ni el contenido de una variable de nombre Rojo sino que asigna el valor Rojo que es de uno de los valores del dominio del tipo de datos Semaforo. Sentencias de selección caso_de (switch), si-entonces (if-then) Algoritmo enum Mes { ENE, FEB, MAR, ... } algoritmo DemoEnum var Mes MesVacaciones inicio MesVacaciones ← ENE si (MesVacaciones ← ENE) Escribir ('El mes de vacaciones es Enero') fin_si fin Algoritmo Se pueden usar valores de enumeración en una sentencia según_sea (switch): tipo enum Animales {Raton, Gato, Perro, Paloma, Reptil, Canario} var Animales: ADomesticos según_sea: ADomesticos Raton: escribir '...' Gato : escribir '...' fin_segun_sea
  • 302. 272 Fundamentos de programación Sentencias repetitivas Las variables de enumeración se pueden utilizar en bucles desde, mientras, ...: algoritmo demoEnum2 tipo enum meses { ENE=1, FEB, MAR, ABR, MAY, JUN, JUL. AGO, SEP, OCT, NOV, DIC} var enum meses: mes inicio desde mes ← ENE hasta mes = DIC ... fin_desde fin ACTIVIDADES DE PROGRAMACIÓN RESUELTAS 7.1. Escribir un algoritmo que permita calcular el cuadrado de los cien primeros números enteros y a continuación es- cribir una tabla que contenga dichos cien números cuadrados. Solución El problema consta de dos partes: 1. Cálculo de los cien primeros números enteros y sus cuadrados. 2. Diseño de una tabla T, T(1), T(2), ..., T(100) que contiene los siguientes valores: T(1) = 1*1 = 1 T(2) = 2*2 = 4 T(3) = 3*3 = 9 ... El algoritmo se puede construir con estructuras de decisión o alternativas, o bien con estructuras repetitivas. En nuestro caso utilizaremos una estructura repetitiva desde. algoritmo cuadrados tipo array[1..100] de entero : tabla var tabla : T entero : I, C inicio desde I ← 1 hasta 100 hacer C ← I * I escribir(I, C) fin_desde desde I ← 1 hasta 100 hacer T[I] ← I * I escribir(T[I]) fin_desde fin 7.2. Se tienen N temperaturas. Se desea calcular su media y determinar entre todas ellas cuáles son superiores o iguales a esa media. Solución Análisis En un primer momento se leen los datos y se almacenan en un vector (array unidimensional) TEMP(1:N). A continuación se van realizando las sumas sucesivas a fin de obtener la media.
  • 303. Estructuras de datos I (arrays y estructuras) 273 Por último, con un bucle de lectura de la tabla se va comparando cada elemento de la misma con la media y luego, mediante un contador, se calcula el número de temperaturas igual o superior a la media. Tabla de variables N TEMP SUMA MEDIA C Número de elementos del vector o tabla. Vector o tabla de temperatura. Sumas sucesivas de las temperaturas. Media de la tabla. Contador de temperaturas = MEDIA. Pseudocódigo algoritmo temperaturas const N = 100 tipo array[1..N] de real : temperatura var temperatura: Temp entero : I, C real : suma, media inicio suma ← 0 media ← 0 C ← 0 desde I ← 1 hasta N hacer leer(Temp[I]) suma ← suma+Temp[I] fin_desde media ← suma/N para I ← 1 hasta N hacer si Temp[I] = media entonces C ← C+1 escribir(Temp[I]) fin_si fin_para escribir('La media es:', media) escribir('El total de temperaturas =', media, 'es:', C) fin 7.3. Escribir el algoritmo que permita sumar el número de elementos positivos y el de negativos de una tabla T. Solución Sea una tabla T de dimensiones M, N leídas desde el teclado. Tabla de variables I, J, M, N: SP: SN: entero real real Pseudocódigo algoritmo suma_resta const M = 50 N = 20
  • 304. 274 Fundamentos de programación tipo array[1..M, 1..N] de real : Tabla var Tabla : T entero : I, J real : SP, SN inicio SP ← 0 SN ← 0 desde I ← 1 hasta M hacer desde J ← 1 hasta N hacer si T[I, J] 0 entonces SP ← SP + T[I, J] si_no SN ← SN + T[I, J] fin_si fin_desde fin_desde escribir('Suma de positivos', SP, 'de negativos', SN) fin 7.4. Inicializar una matriz de dos dimensiones con un valor constante dado K. Solución Análisis El algoritmo debe tratar de asignar la constante K a todos los elementos de la matriz A[M, N]. A[1, 1] = K A[1, 2] = K ... A[1, N] = K . . A[M, 1] = K A[M, 2] = K ... A[M, N] = K Dado que es una matriz de dos dimensiones, se necesitan dos bucles anidados para la lectura. Pseudocódigo algoritmo inicializa_matriz inicio desde I ← 1 hasta M hacer desde J ← 1 hasta N hacer A[I, J] ← K fin_desde fin_desde fin 7.5. Realizar la suma de dos matrices bidimensionales. Solución Análisis Las matrices A[I, J], B[I, J] para que se puedan sumar deben tener las mismas dimensiones. La matriz suma S[I, J] tendrá iguales dimensiones y cada elemento será la suma de las correspondientes matrices A y B. Es decir, S[I, J] = A[I, J] + B[I, J] Dado que se trata de matrices de dos dimensiones, el proceso se realizará con dos bucles anidados.
  • 305. Estructuras de datos I (arrays y estructuras) 275 Pseudocódigo algoritmo suma_matrices inicio desde I ← 1 hasta N hacer desde J ← 1 hasta M hacer S[I, J] ← A[I, J] + B[I, J] fin_desde fin_desde fin 7.6. Se dispone de una tabla T de dos dimensiones. Calcular la suma de sus elementos. Solución Supongamos las dimensiones de T, M y A y que se compone de números reales. Tabla de variables I J M N T S I, J, M, N T, S Contador de filas. Contador de columnas. Número de filas de la tabla T. Número de columnas de la tabla T. Tabla. Suma de los elementos de la tabla. Enteros. Reales. Pseudocódigo algoritmo suma_elementos const M = 50 N = 20 tipo array[1..M, 1..N] de real : Tabla var entero : I, J Tabla : T real : S inicio desde I ← 1 hasta M hacer desde J ← 1 hasta N hacer leer(T[I, J]) fin_desde fin_desde S ← 0 {inicialización de la suma S} desde I ← 1 hasta M hacer desde J ← 1 hasta N hacer S ← S + T[I, J] fin_desde fin_desde escribir('La suma de los elementos de la matriz =', S) fin 7.7. Realizar la búsqueda de un determinado nombre en una lista de nombres, de modo que el algoritmo imprima los siguientes mensajes según el resultado: 'Nombre encontrado' si el nombre está en la lista 'Nombre no existe' si el nombre no está en la lista
  • 306. 276 Fundamentos de programación Solución Se recurrirá en este ejercicio a utilizar un interruptor SW, de modo que si SW = falso el nombre no existe en la lista y si SW = verdadero el nombre existe en la lista (o bien caso de no existir la posibilidad de variables lógicas, definir SW como SW = 0 si es falso y SW = 1 si es verdadero o cierto). Método 1 algoritmo búsqueda const N = 50 tipo array[1..N] de cadena : Listas var Listas : l lógico : SW cadena : nombre entero : I inicio SW ← falso leer(nombre) desde I ← 1 hasta N hacer si l[I] = nombre entonces SW ← verdadero fin_si fin_desde si SW entonces escribir('Encontrado') si_no escribir('No existe', nombre) fin_si fin Método 2 algoritmo búsqueda const N = 50 tipo array[1..N] de cadena : Listas var Listas : l lógico : SW cadena : nombre entero : I inicio SW ← 0 leer(nombre) desde I ← 1 hasta N hacer si l[I] = nombre entonces SW ← 1 fin_si fin_desde si SW = 1 entonces escribir('Encontrado') si_no escribir('No existe', nombre) fin_si fin
  • 307. Estructuras de datos I (arrays y estructuras) 277 7.8. Se desea permutar las filas I y J de una matriz (array) de dos dimensiones (M*N):M filas, N columnas. Solución Análisis La tabla T(M*N) se puede representar por: T[1, 1] T[1, 2] T[1, 3] ... T[1, N] T[2, 1] T[2, 2] T[2, 3] ... T[2, N] . . T[M, 1] T[M, 2] T[M, 3] ... T[M, N] El sistema para permutar globalmente toda la fila I con la fila J se debe realizar permutando uno a uno el contenido de los elementos T[I, K] y T[J, K]. Para intercambiar entre sí los valores de dos variables, recordemos que se necesitaba una variable auxiliar AUX. Así, para el caso de las variables A y B AUX ← A A ← B B ← AUX En el caso de nuestro ejercicio, para intercambiar los valores T[I, K] y T[J, K] se debe utilizar el algoritmo: AUX ← T[I, K] T[I, K] ← T[J, K] T[J, K] ← T[I, K] Tabla de variables I, J, K, M, N AUX Array Enteras Real Real Pseudocódigo algoritmo intercambio const M = 50 N = 30 tipo array[1..M, 1.. N] de entero : Tabla var Tabla : T entero : AUX, I, J, K inicio {En este ejercicio y dado que ya se han realizado muchos ejemplos de lectura de arrays con dos bucles desde, la operación de lectura completa del array se representará con la instrucción de leerArr(T)} leerArr(T) //Deducir I, J a intercambiar leer(I, J) desde K ← I hasta N hacer AUX ← T[I, K] T[I, K] ← T[J, K] T[J, K] ← AUX fin_desde //Escritura del nuevo array escribirArr(T) fin
  • 308. 278 Fundamentos de programación 7.9. Algoritmo que nos permita calcular la desviación estándar (SIGMA) de una lista de N números (N = 15). Sabiendo que DESVIACIÓN = √ n Σ i = 1 (xi – m)2 n – 1 algoritmo Calcular_desviación tipo array[1..15] de real : arr var arr : x entero : n inicio llamar_a leer_array(x, n) escribir('La desviación estándar es ',desviacion(x, n)) fin procedimiento leer_array(S arr:x S entero:n) var entero : i inicio repetir escribir('Diga número de elementos de la lista ') leer(n) hasta_que n = 15 escribir('Deme los elementos:') desde i ← 1 hasta n hacer leer(x[i]) fin_desde fin_procedimiento real función desviacion(E arr : x E entero : n) var real : suma, xm, sigma entero : i inicio suma ← 0 desde i ← 1 hasta n hacer suma ← suma + x[i] fin_desde xm ← suma / n sigma ← 0 desde i ← 1 hasta n hacer sigma ← sigma + cuadrado (x[i] - xm) fin_desde devolver(raiz2 (sigma / (n-1))) fin_función 7.10. Utilizando arrays, escribir un algoritmo que visualice un cuadrado mágico de orden impar n, comprendido entre 3 y 11. El usuario debe elegir el valor de n. Un cuadrado mágico se compone de números enteros comprendidos entre 1 y n. La suma de los números que figu- ran en cada fila, columna y diagonal son iguales. Ejemplo 8 3 4 1 5 9 6 7 2
  • 309. Estructuras de datos I (arrays y estructuras) 279 Un método de generación consiste en situar el número 1 en el centro de la primera fila, el número siguiente en la casilla situada por encima y a la derecha y así sucesivamente. El cuadrado es cíclico, la línea encima de la primera es de hecho la última y la columna a la derecha de la última es la primera. En el caso de que el número generado caiga en una casilla ocupada, se elige la casilla que se encuentre debajo del número que acaba de ser situado. algoritmo Cuadrado_magico var entero : n inicio repetir escribir('Dame las dimensiones del cuadrado (3 a 11) ') leer(n) hasta_que (n mod 2 0) Y (n = 11) Y (n = 3) dibujarcuadrado(n) fin procedimiento dibujarcuadrado(E entero:n) var array[1..11,1..11] de entero : a entero : i,j,c inicio i ← 2 j ← n div 2 desde c ← 1 hasta n*n hacer i ← i - 1 j ← j + 1 si j n entonces j ← 1 fin_si si i 1 entonces i ← n fin_si a[i,j] ← c si c mod n = 0 entonces j ← j - 1 i ← i + 2 fin_si fin_desde desde i ← 1 hasta n hacer desde j ← 1 hasta n hacer escribir(a[i,j]) {al codificar esta instrucción en un lenguaje será conveniente utilizar el parámetro correspondiente de no avance de línea en la salida en pantalla o impresora} fin_desde escribir(NL) //NL representa Nueva Línea, es decir, avance de línea fin_desde fin_procedimiento 7.11. Obtener un algoritmo que efectúe la multiplicación de dos matrices A, B. A € Mm,p elementos B € Mp,n elementos Matriz producto: C € Mm,n elementos, tal que Ci, j = p Σ i = 1 ai, k * bk, j
  • 310. 280 Fundamentos de programación algoritmo Multiplicar_matrices tipo array[1..10,1..10] de real : arr var entero : m, n, p arr : a ,b, c inicio repetir escribir('Dimensiones de la 1ª matriz (filas columnas)') leer(m,p) escribir('Columnas de la 2ª matriz ') leer(n) hasta_que (n = 10) Y (m = 10) Y (p = 10) escribir ('Deme elementos de la 1ª matriz') llamar_a leer_matriz(a,m,p) escribir ('Deme elementos de la 2ª matriz') llamar_a leer_matriz(b,p,n) llamar_a calcescrproducto(a, b, c, m, p, n) fin procedimiento leer_matriz(S arr:matriz;E entero:filas,columnas) var entero : i, j inicio desde i ← 1 hasta filas hacer escribir('Fila ',i,':') desde j ← 1 hasta columnas hacer leer(matriz[i,j]) fin_desde fin_desde fin_procedimiento procedimiento calcescrproducto(E arr: a, b, c; E entero: m,p,n) var entero : i, j, k inicio desde i ← 1 hasta m hacer desde j ← 1 hasta n hacer c[i,j] ← 0 desde k ← 1 hasta p hacer c[i,j] ← c[i,j] + a[i,k] * b[k,j] fin_desde escribir (c[i,j]) //no avanzar línea fin_desde escribir ( NL ) //avanzar línea, nueva línea Fin_desde Fin_procedimiento 7.12. Algoritmo que triangule una matriz cuadrada y halle su determinante. En las matrices cuadradas el valor del de- terminante coincide con el producto de los elementos de la diagonal de la matriz triangulada, multiplicado por –1 tantas veces como hayamos intercambiado filas al triangular la matriz. Proceso de triangulación de una matriz para todo i desde 1 hasta n – 1 hacer: a) Si el elemento de lugar (i,i) es nulo, intercambiar filas hasta que dicho elemento sea no nulo o agotar los posibles intercambios. b) A continuación se busca el primer elemento no nulo de la fila i-ésima y, en el caso de existir, se usa para hacer ceros en la columna de abajo.
  • 311. Estructuras de datos I (arrays y estructuras) 281 Sea dicho elemento matriz[i,r] Multiplicar fila i por matriz[i+1,r]/matriz[i,r] y restarlo a la i+1 Multiplicar fila i por matriz[i+2,r]/matriz[i,r] y restarlo a la i+2 ............................................................................................................ Multiplicar fila i por matriz[m,r]/matriz[i,r] y restarlo a la m algoritmo Triangulacion_matriz Const m = expresion n = expresion tipo array[1..m, 1..n] de real : arr var arr : matriz real : dt inicio llamar_a leer_matriz(matriz) llamar_a triangula(matriz, dt) escribir('Determinante= ', dt) fin procedimiento leer_matriz (S arr : matriz) var entero: i,j inicio escribir('Deme los valores para la matriz') desde i ← 1 hasta m hacer desde j ← 1 hasta n hacer leer( matriz[i, j]) fin_desde fin_desde fin_procedimiento procedimiento escribir_matriz (E arr : matriz) var entero : i, j caracter : c inicio escribir('Matriz triangulada') desde i ← 1 hasta m hacer desde j ← 1 hasta n hacer escribir( matriz[i, j]) //no avanzar línea fin_desde escribir(NL) //avanzar línea, nueva línea fin_desde escribir('Pulse tecla para continuar') leer(c) fin_procedimiento procedimiento interc(E/S real: a,b) var real : auxi inicio auxi ← a a ← b b ← auxi fin_procedimiento procedimiento triangula (E arr : matriz; S real dt) var entero: signo entero: t, r, i, j real : cs
  • 312. 282 Fundamentos de programación inicio signo ← 1 desde i ← 1 hasta m - 1 hacer t ← 1 si matriz[i, i] = 0 entonces repetir si matriz[i + t, i] 0 entonces signo ← signo * (-1) desde j ← 1 hasta n hacer llamar_a interc(matriz[i,j],matriz[i + t,j]) fin_desde llamar_a escribir_matriz(matriz) fin_si t ← t + 1 hasta_que (matriz[i, i] 0) O (t = m - i + 1) fin_si r ← i - 1 repetir r ← r + 1 hasta_que (matriz[i, r] 0) O (r = n) si matriz[i, r] 0 entonces desde t ← i + 1 hasta m hacer si matriz[t, r] 0 entonces cs ← matriz[t, r] desde j ← r hasta n hacer matriz[t, j] ← matriz[t, j] - matriz[i, j] * (cs / matriz[i, r]) fin_desde llamar_a escribir_matriz(matriz) fin_si fin_desde fin_si fin_desde dt ← signo desde i ← 1 hasta m hacer dt ← dt * matriz[i, i] fin_desde fin_procedimiento CONCEPTOS CLAVE • Array bidimensional. • Array de una dimensión. • Array multidimensional. • Arrays como parámetros. • Arreglo. • Datos estructurados. • Estructura. • Índice. • Lista. • Longitud de un array. • Subíndice. • Tabla. • Tamaño de un array. • Variable indexada. • Vector. Un array (vector, lista o tabla) es una estructura de datos que almacena un conjunto de valores, todos del mismo tipo de datos. Un array de una dimensión, también conocido como array unidimensional o vector, es una lista de elementos del mismo tipo de datos que se almacenan utilizando un único nombre. En esencia, un array es una colección de variables RESUMEN
  • 313. Estructuras de datos I (arrays y estructuras) 283 que se almacenan en orden en posiciones consecutivas en la memoria de la computadora. Dependiendo del lenguaje de programación el índice del array comienza en 0 (lenguaje C) o bien en 1 (lenguaje FORTRAN); este elemento se alma- cena en la posición con la dirección más baja. 1. Un array unidimensional (vector o lista) es una estructura de datos que se puede utilizar para al- macenar una lista de valores del mismo tipo de datos. Tales arrays se pueden declarar dando el tipo de datos de los valores que se van a almacenar y el tamaño del array. Por ejemplo, en C/C++ la declaración int num[100] crea un array de 100 elementos, el primer elemento es num[0] y el último elemento es num[99]. 2. Los elementos del array se almacenan en posiciones contiguas en memoria y se referencian utilizando el nombre del array y un subíndice; por ejemplo, num[25]. Cualquier expresión de valor entero no negativo se puede utilizar como subíndice y el subín- dice 0 (en el caso de C) o 1 (caso de FORTRAN) siempre se refieren al primer elemento del array. 3. Se utilizan arrays para almacenar grandes coleccio- nes de datos del mismo tipo. Esencialmente en los casos siguientes: • Cuando los elementos individuales de datos se deben utilizar en un orden aleatorio, como es el caso de los elementos de una lista o los datos de una tabla. • Cuando cada elemento representa una parte de un dato compuesto, tal como un vector, que se utilizará repetidamente en los cálculos. • Cuando los datos se deben procesar en fases in- dependientes, como puede ser el cálculo de una media aritmética o varianza. 4. Un array de dos dimensiones (tabla) se declara listando el tamaño de las filas y de las columnas junto con el nombre del array y el tipo de datos que contiene. Por ejemplo, las declaraciones en C de int tabla1[5][10] crean un array bidimensional de cinco filas y 10 columnas de tipo entero. 5. Arrays paralelos. Una tabla multicolumna se puede representar como un conjunto de arrays paralelos, un array por columna, de modo que todos tengan la misma longitud y se accede utilizando la misma variable de subíndice. 6. Los arrays pueden ser, de modo completo o por elementos, pasados como parámetros a funciones y a su vez ser argumentos de funciones. 7. La longitud de un array se fija en su declaración y no puede ser modificada sin una nueva declaración. Esta característica los hace a veces poco adecuados para aplicaciones que requieren de tamaños o lon- gitudes variables. 7.1. Determinar los valores de I, J, después de la ejecución de las instrucciones siguientes: var entero : I, J array[1..10] de entero : A inicio I ← 1 J ← 2 A[I] ← J A[J] ← I A[J+I] ← I + J I ← A[I] + A[J] A[3] ← 5 J ← A[I] - A[J] fin 7.2. Escribir el algoritmo que permita obtener el número de elementos positivos de una tabla. 7.3. Rellenar una matriz identidad de 4 por 4. 7.4. Leer una matriz de 3 por 3 elementos y calcular la suma de cada una de sus filas y columnas, dejando dichos resultados en dos vectores, uno de la suma de las filas y otro de las columnas. 7.5. Cálculo de la suma de todos los elementos de un vec- tor, así como la media aritmética. 7.6. Calcular el número de elementos negativos, cero y positivos de un vector dado de sesenta elementos. 7.7. Calcular la suma de los elementos de la diagonal prin- cipal de una matriz cuatro por cuatro (4 × 4). 7.8. Se dispone de una tabla T de cincuenta números reales distintos de cero. Crear una nueva tabla en la que todos sus elementos resulten de dividir los elementos de la tabla T por el elemento T[K], siendo K un valor dado. 7.9. Se dispone de una lista (vector) de N elementos. Se desea diseñar un algoritmo que permita insertar el valor x en el lugar k-ésimo de la mencionada lista. EJERCICIOS
  • 314. 284 Fundamentos de programación 7.10. Se desea realizar un algoritmo que permita controlar las reservas de plazas de un vuelo MADRID-CARA- CAS, de acuerdo con las siguientes normas de la compañía aérea: Número de plazas del avión: 300. Plazas numeradas de 1 a 100: fumadores. Plazas numeradas de 101 a 300: no fumadores. Se debe realizar la reserva a petición del pasaje- ro y cerrar la reserva cuando no haya plazas libres o el avión esté próximo a despegar. Como ampliación de este algoritmo, considere la opción de anulacio- nes imprevistas de reservas. 7.11. Cada alumno de una clase de licenciatura en Cien- cias de la Computación tiene notas correspondientes a ocho asignaturas diferentes, pudiendo no tener calificación en alguna asignatura. A cada asignatura le corresponde un determinado coeficiente. Escribir un algoritmo que permita calcular la media de cada alumno. Modificar el algoritmo para obtener las siguien- tes medias: • general de la clase • de la clase en cada asignatura • porcenaje de faltas (no presentado a examen) 7.12. Escribir un algoritmo que permita calcular el cuadra- do de los 100 primeros números enteros y a conti- nuación escribir una tabla que contenga dichos cua- drados. 7.13. Se dispone de N temperaturas almacenadas en un array. Se desea calcular su media y obtener el núme- ro de temperaturas mayores o iguales que la media. 7.14. Calcular la suma de todos los elementos de un vector de dimensión 100, así como su media aritmética. 7.15. Diseñar un algoritmo que calcule el mayor valor de una lista L de N elementos. 7.16. Dada una lista L de N elementos, diseñar un algorit- mo que calcule de forma independiente la suma de los números pares y la suma de los números impares. 7.17. Escribir el algoritmo que permita escribir el conte- nido de una tabla de dos dimensiones (3 × 4). 7.18. Leer una matriz de 3 × 3. 7.19. Escribir un algoritmo que permita sumar el número de elementos positivos y el de negativos de una tabla T de n filas y m columnas. 7.20. Se dispone de las notas de cuarenta alumnos. Cada uno de ellos puede tener una o varias notas. Escribir un algoritmo que permita obtener la media de cada alumno y la media de la clase a partir de la entrada de las notas desde el terminal. 7.21. Una empresa tiene diez almacenes y necesita crear un algoritmo que lea las ventas mensuales de los diez almacenes, calcular la media de ventas y obtener un listado de los almacenes cuyas ventas mensuales son superiores a la media. 7.22. Se dispone de una lista de cien números enteros. Cal- cular su valor máximo y el orden que ocupa en la tabla. 7.23. Un avión dispone de ciento ochenta plazas, de las cuales sesenta son de “no fumador” y numeradas de 1 a 60 y ciento veinte plazas numeradas de 61 a 180 de “fumador”. Diseñar un algoritmo que permita ha- cer la reserva de plazas del avión y se detenga media hora antes de la salida del avión, en cuyo momento se abrirá la lista de espera. 7.24. Calcular las medias de las estaturas de una clase. Deducir cuántos son más altos que la media y cuán- tos más bajos que dicha media. 7.25. Las notas de un colegio se tienen en una matriz de 30 × 5 elementos (30, número de alumnos; 5, número de asignaturas). Se desea listar las notas de cada alum- no y su media. Cada alumno tiene como mínimo dos asignaturas y máximo cinco, aunque los alumnos no necesariamente todos tienen que tener cinco materias. 7.26. Dado el nombre de una serie de estudiantes y las calificaciones obtenidas en un examen, calcular e imprimir la calificación media, así como cada cali- ficación y la diferencia con la media. 7.27. Se introducen una serie de valores numéricos desde el teclado, siendo el valor final de entrada de datos o centinela –99. Se desea calcular e imprimir el nú- mero de valores leídos, la suma y media de los va- lores y una tabla que muestre cada valor leído y sus desviaciones de la media. 7.28. Se dispone de una lista de N nombres de alumnos. Escribir un algoritmo que solicite el nombre de un alumno y busque en la lista (array) si el nombre está en la lista.
  • 315. CAPÍTULO 8 Las cadenas de caracteres 8.1. Introducción 8.2. El juego de caracteres 8.3. Cadena de caracteres 8.4. Datos tipo carácter 8.5. Operaciones con cadenas 8.6. Otras funciones de cadenas ACTIVIDADES DE PROGRAMACIÓN RESUELTAS CONCEPTOS CLAVE RESUMEN EJERCICIOS Las computadoras normalmente sugieren operaciones aritméticas ejecutadas sobre datos numéricos. Sin em- bargo, ese concepto no es estadísticamente cierto, sino que, al contrario, hoy día es cada vez más frecuente el uso de las computadoras para procesar problemas de tipo esencialmente alfanuméricos o de tipo texto. En el Capítulo 3 se estudió el concepto de tipo de datos carácter (char) y se definió un carácter como un sím- bolo del juego de caracteres de la computadora. Una constante carácter se definió como cualquier carácter encerrado entre separadores (apóstrofos o dobles co- millas). Una secuencia finita de caracteres se denomina normalmente una cadena (string), y una constante tipo cadena consiste en una cadena encerrada entre apóstrofos o dobles comillas. El procesamiento de ca- denas es el objetivo fundamental de este capítulo. INTRODUCCIÓN
  • 316. 286 Fundamentos de programación 8.1. INTRODUCCIÓN Las computadoras nacieron para resolver problemas numéricos en cálculos científicos y matemáticos. Sin embargo, el paso de los años ha cambiado las aplicaciones y hoy día las computadoras no sólo se utilizan en cálculos numéri- cos, sino también para procesar datos de caracteres. En aplicaciones de gestión, la generación y actualización de listas de dirección, inventarios, etc., la información alfabética es fundamental. La edición de textos, traductores de lenguajes y base de datos son otras aplicaciones donde las cadenas de caracteres tienen gran utilidad. En este capítulo se tratará el concepto de cadena de caracteres y su procesamiento, utilizando para ello una no- tación algorítmica similar a la utilizada hasta ahora. Una cadena de caracteres es una secuencia de cero o más sím- bolos, que incluyen letras del alfabeto, dígitos y caracteres especiales. 8.2. EL JUEGO DE CARACTERES Los lenguajes de programación utilizan juegos de caracteres “alfabeto” para comunicarse con las computadoras. Las primeras computadoras sólo utilizaban informaciones numéricas digitales mediante el código o alfabeto digital, y los primeros programas se escribieron en ese tipo de código, denominado código máquina —basado en dos dígitos, 0 y 1—, por ser inteligible directamente por la máquina (computadora). La enojosa tarea de programar en código má- quina hizo que el alfabeto evolucionase y los lenguajes de programación comenzaran a utilizar códigos o juegos de caracteres similares al utilizado en los lenguajes humanos. Así, hoy día la mayoría de las computadoras trabajan con diferentes tipos de juegos de caracteres de los que se destacan el código ASCII y el EBCDIC. De este modo, una computadora a través de los diferentes lenguajes de programación utiliza un juego o código de caracteres que serán fácilmente interpretados por la computadora y que pueden ser programados por el usuario. Tres son los códigos más utilizados actualmente en computadoras, ASCII (American Standard Code for Information Interchange), EBCDIC (Extended Binary Coded Decimal Interchange Code) y Unicode. El código ASCII básico utiliza 7 bits (dígitos binarios, 0, 1) para cada carácter a representar, lo que supone un total de 27 (128) caracteres distintos. El código ASCII ampliado utiliza 8 bits y, en ese caso, consta de 256 caracteres. Este código ASCII ha adquirido una gran popularidad, ya que es el estándar en todas las familias de computadoras personales. El código EBCDIC utiliza 8 bits por carácter y, por consiguiente, consta de 256 caracteres distintos. Su notorie- dad reside en ser el utilizado por la firma IBM (sin embargo, en las computadoras personales PC, XT, AT y PS/2 IBM ha seguido el código ASCII). El código universal Unicode para aplicación en Internet y en gran número de alfabetos internacionales. En general, un carácter ocupará un byte de almacenamiento de memoria. 8.2.1. Código ASCII El código ASCII se compone de los siguientes tipos de caracteres: • Alfabéticos (a, b, ..., z/A, B, ..., Z). • Numéricos (0, 1, 2, 3, ..., 8, 9). • Especiales (+, –, *, /, {, }, , , etc.). • De control son caracteres no imprimibles y que realizan una serie de funciones relacionadas con la escritura, transmisión de datos, separador de archivos, etc., en realidad con los dispositivos de entrada/salida. Destacamos entre ellos: DEL eliminar o borrar STX inicio de texto LF avance de línea FF avance de página CR retorno de carro Los caracteres del 128 al 255, pertenecientes en exclusiva al código ASCII ampliado, no suelen ser estándar y normalmente cada fabricante los utiliza para situar en ellos caracteres específicos de su máquina o de otros alfabetos, caracteres gráficos, etc. En la Figura 8.2 se muestra el código ASCII de la familia de computadoras IBM PC y com- patibles, donde se puede apreciar tanto el ASCII básico estándar como el ampliado.
  • 317. Las cadenas de caracteres 287 8.2.2. Código EBCDIC Este código es muy similar al ASCII, incluyendo también, además de los caracteres alfanuméricos y especiales, ca- racteres de control. Es propio de computadoras de IBM, con la excepción de los modelos PC, XT, AT y PS/2. 8.2.3. Código universal Unicode para Internet Aunque ASCII es un código ampliamente utilizado para textos en inglés, es muy limitado, ya que un código de un byte sólo puede representar 256 caracteres diferentes (28 = 256). El lenguaje Java comenzó a utilizar la representación internacional Unicode más moderna y más amplia en juego de caracteres, ya que es un código de dos bytes (16 bits), que permiten hasta 65.536 caracteres diferentes (216 = 65.536). El código estándar Unicode es un estándar internacional que define la representación de caracteres de una amplia gama de alfabetos. Tradicionalmente, como ya se ha comentado, los lenguajes de programación utilizaban el código ASCII cuyo juego de caracteres era 127 (o 256 para el código ASCII ampliado) que se almacenaban en 7 (o en 8) bits y que básicamente incluían aquellos caracteres que aparecían en el teclado estándar (QWERTY). Para los pro- gramadores que escriben en inglés estos caracteres son más o menos suficientes. Sin embargo, la aparición de Java y posteriormente C# como lenguajes universales requieren que éstos puedan ser utilizados en lenguajes internacio- nales, como español, alemán, francés, chino, etc. Esta característica requiere de más de 256 caracteres diferentes. La representación Unicode que admite hasta 65.536 resuelve estos problemas. Valor ASCII Carácter Valor ASCII Carácter Valor ASCII Carácter Valor ASCII Carácter 000 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 017 018 019 020 021 022 023 024 025 026 027 028 029 030 031 NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US 032 033 034 035 036 037 038 039 040 041 042 043 044 045 046 047 048 049 050 051 052 053 054 055 056 057 058 059 060 061 062 063 espacio ! # $ % ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; = ? 064 065 066 067 068 069 070 071 072 073 074 075 076 077 078 079 080 081 082 083 084 085 086 087 088 089 090 091 092 093 094 095 @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ ] ↑ _ 096 097 098 099 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 ' a b c d e f g h i j k l m n o p q r s t u v w x y z { | } ~ DEL NOTA: Los 32 primeros caracteres y el último son caracteres de control; no son imprimibles. Figura 8.1. Código ASCII básico.
  • 318. 288 Fundamentos de programación D C D C D C D C D C D C D C D C 0 1 2 3 4 5 6 7 10 11 12 13 14 15 16 17 18 19 20 NUL SOH STX ETX PF HT LC DEL SMM VT FF CR SO SI DLE DC1 DC2 DC3 RES 21 22 23 24 25 26 27 28 29 30 31 32 33 34 36 37 38 39 40 NL BS IL CAN EM CC CU1 IFS IGS IRS IUS DS SOS FS BYP LF ETB ESC SM 43 45 46 47 50 52 53 54 55 59 60 61 63 64 74 75 76 77 78 CU2 ENQ ACK BEL SYN PN RS UC EOT CU3 DC4 NAK SUB SP c . ( + 79 80 90 91 92 93 94 95 96 97 106 107 108 109 110 111 121 122 123 , ! $ * ) ; ¬ – / ñ , % _ ? ` : # 124 125 126 127 129 130 131 132 133 134 135 136 137 139 145 146 147 148 149 @ ´ = a b c d e f g h i { j k l m n 150 151 152 153 155 161 162 163 164 165 166 167 168 169 173 189 192 193 194 o p q r } ~ s t u v w x y z [ ] { A B 195 196 197 198 199 200 201 208 209 210 211 212 213 214 215 216 217 224 226 C D E F G H I } J K L M N O P Q R S 227 228 229 230 231 232 233 240 241 242 243 244 245 246 247 248 249 250 T U V W X Y Z 0 1 2 3 4 5 6 7 8 9 | D: Código decimal. P: Escritura del carácter correspondiente al código en la pantalla. Figura 8.3. Código EBCDIC. D P D P D P D P D P D P D P D P 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 J ♥ ♦ ♣ ♠ • 8 ○ ■ ; = ? @ A ↕ !! ¶ § i ↕ ↑ ↓ → ← I ↔ ▲ ▼ 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 ! # $ % ´ ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; = ? 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ ] ^ _ 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 a b c d e f g h i j k l m n o p q r s t u v w x y z { | } ~ K 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 Ç ü é â ä à å ç ê ë è ï î ì Ä Å É æ Æ ô ö ò û ù Ÿ Ô Ü ¢ £ ¥ Pt f 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 á í ó ú ñ Ñ ª º ¿ h W L M ¡ « » ´ ´ | R } ~ ¡ ¢ S T U V £ ¤ W 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 X Y Z [ z ] ¥ ^ _ ` a b | d § ¨ © ª « ¬ − ® ¯ ° g h ´ u μ μ u 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 α β Γ π Σ σ μ γ φ θ Ω δ ὸ ∅ ∈ ∩ ≡ ± ≥ ≤ ∫ ∫ ÷ ≈ ° • ∙ √ n 2 ´ D: Código decimal. P: Escritura del carácter correspondiente al código en la pantalla. Figura 8.2. Código ASCII de la computadora IBM PC.
  • 319. Las cadenas de caracteres 289 En consecuencia, los identificadores en Java y C# deben comenzar con una letra Java o C#, que es cualquier ca- rácter Unicode que no represente un dígito o un carácter de puntuación. Las letras en inglés, así como los dígitos decimales y los signos de puntuación en inglés, se asignan a los códigos que son los mismos que en el código ASCII. Puede consultar los caracteres Unicode en el sitio Web oficial del con- sorcio Unicode: http://www.unicode.org 8.2.4. Secuencias de escape Una secuencia de escape es un medio de representar caracteres que no se pueden escribir desde el teclado y, por consiguiente, utilizarlos directamente en un editor. Una secuencia de escape consta de dos partes: el carácter escape y un valor de traducción. El carácter escape es un símbolo que indica al compilador Java o C (por ejemplo) que ha de traducir el siguiente carácter de un modo especial. En Java, como en lenguaje C, este carácter de escape especial es la barra inclinada inversa (). Si la barra inclinada marca el principio de una secuencia de escape, ¿qué se puede utilizar para el valor de la traducción? La parte de la secuencia de escape que sigue al carácter escape y, tal vez, el valor de traducción más fácil para utilizar es un código de carácter Unicode. Los valores Unicode deben estar especificados como un número hexadecimal de cuatro dígitos precedido por una letra u. Los literales de caracteres Java o C# se deben encerrar en- tre comillas simples Sintaxis 'uxxxx' Ejemplos 'u0344' 'u2122' En programas escritos en cualquier lenguaje (en particular en Java o en C#) se pueden utilizar las secuencias de escape Unicode en cualquier parte donde algún tipo de carácter pueda aparecer: en literales “carácter”, en literales “cadenas” o incluso en identificadores. Todos los lenguajes de programación (C, C++, Java, etc.) permiten especificar el carácter de escape para especi- ficar otros tipos de caracteres especiales. Estos caracteres incluyen algunos de los “caracteres invisibles” que se han utilizado tradicionalmente para controlar operaciones de computadora (a veces se les conoce también como “carac- teres de control”) así como simples comillas, dobles comillas y el propio carácter de escape. Así, para escribir una comilla simple como un literal carácter, se escribe '. La Tabla 8.1 proporciona las secuencias de escape que el len- guaje Java reconoce. Tabla 8.1. Secuencias de escape en Java Secuencia Significado b Retroceso (u0008) t Tabulación (U0009) n Nueva línea (u000A) f Avance de página (u000C) r Retorno de carro (u000D) Dobles comillas (u0022) ' Comillas simples (u0027) Barra inclinada inversa (u005C) ddd Cualquier carácter especificado por dígitos octales ddd 8.3. CADENA DE CARACTERES Una cadena (string) de caracteres es un conjunto de caracteres —incluido el blanco— que se almacenan en un área contigua de la memoria. Pueden ser entradas o salidas a/desde un terminal.
  • 320. 290 Fundamentos de programación La longitud de una cadena es el número de caracteres que contiene. La cadena que no contiene ningún carácter se le denomina cadena vacía o nula, y su longitud es cero; no se debe confundir con una cadena compuesta sólo de blancos —espacios en blanco—, ya que ésta tendrá como longitud el número de blancos de la misma. La representación de las cadenas suele ser con comillas simples o dobles. En nuestro libro utilizaremos las co- millas simples por ser esa notación la más antigua utilizada en diversos lenguajes como Pascal, FORTRAN, etc., aunque hoy día los lenguajes modernos, tales como C, C++, Java y C#, utilizan las dobles comillas. Notaciones de cadenas Pascal, FORTRAN, UPSAM 'Cartagena de Indias' C, C++, Java, C# Cartagena de Indias EJEMPLO 8.1 '12 de octubre de 1492' 'Por fin llegaste' ' ' 'AMERICA ES GRANDE' Las cadenas pueden contener cualquier carácter válido del código aceptado por el lenguaje y la computadora; el blanco es uno de los caracteres más utilizado; si se le quiere representar de modo especial en la escritura en papel, se emplea alguno de los siguientes símbolos: _ b □ ∪ Por nuestra parte utilizaremos _, dejando libertad al lector para usar el que mejor convenga a su estilo de progra- mación. Las cadenas anteriores tienen longitudes respectivas de 21, 16, 3 y 17. Una subcadena es una cadena de caracteres que ha sido extraída de otra de mayor longitud. '12 de' es una subcadena de '12 de octubre' 'Java' es una subcadena de 'lenguaje Java' 'CHE' es una subcadena de 'CARCHELEJO' Reglas de sintaxis en lenguajes de programación C++ …. Una cadena es un array de caracteres terminado con el carácter nulo, cuya representación es la se- cuencia de escape '0' y su nombre es NULL (nulo). C# …. Las cadenas son objetos del tipo incorporado String. En realidad, String es una clase que proporcio- na funcionalidades de manipulación de cadenas y en particular construcción de cadenas. Java… Las cadenas son objetos del tipo String. String es una clase en Java y una vez que los objetos cadena se crean, el contenido no se puede modificar, aunque pueden ser construidas todas las cade- nas que se deseen. EJEMPLO 8.2 Cadena 'Carchelejo' representada en lenguaje C++ C A R C H E L E J O 0
  • 321. Las cadenas de caracteres 291 8.4. DATOS TIPO CARÁCTER En el Capítulo 3 se analizaron los diferentes tipos de datos y entre ellos existía el dato tipo carácter (char) que se incorpora en diferentes lenguajes de programación, bien con este nombre o bien como datos tipo cadena. Así pues, en esta sección trataremos las constantes y las variables tipo carácter o cadena. 8.4.1. Constantes Una constante tipo carácter es un carácter encerrado entre comillas y una constante de tipo cadena es un conjunto de caracteres válidos encerrados entre comillas —apóstrofos— para evitar confundirlos con nombres de variables, ope- radores, enteros, etc. Si se desea escribir un carácter comilla, se debe escribir duplicado. Como se ha comentado anteriormente, existen lenguajes —BASIC, C, C++, Java, etc., por ejemplo— que encierran las cadenas entre dobles comillas. Nuestros algoritmos sólo tendrán una, por seguir razones históricas y por compatibilidad con versiones anteriores del lenguaje UP SAM. 'Carchelejo es un pueblo de Jaen' es una constante de tipo cadena, de una longitud fija igual a 31. '¿' es una constante de tipo carácter. 8.4.2. Variables Una variable de cadena o tipo carácter es una variable cuyo valor es una cadena de caracteres. Las variables de tipo carácter o cadena se deben declarar en el algoritmo y según el lenguaje tendrán una notación u otra. Nosotros, al igual que muchos lenguajes, las declararemos en la tabla o bloque de declaración de variables. var caracter : A, B cadena : NOMBRE, DIRECCION Atendiendo a la declaración de la longitud, las variables se dividen en estáticas, semiestáticas y dinámicas. Variables estáticas son aquellas en las que su longitud se define antes de ejecutar el programa y ésta no puede cambiarse a lo largo de éste. FORTRAN: CHARACTER A1 * 10, A2 * 15 las variables A1 y A2 se declaran con longitudes 10 y 15, respectivamente. Pascal: var NOMBRE: PACKED ARRAY [1..30] OF CHAR Turbo Pascal: var NOMBRE: array[1..30] of char o bien var NOMBRE:STRING[30] En Pascal, una variable de tipo carácter —char— sólo puede almacenar un carácter y, por consiguiente, una cadena de caracteres debe representarse mediante un array de caracteres. En el ejemplo, NOMBRE se declara como una cadena de 30 caracteres (en este caso, NOMBRE[1] será el primer carácter de la cadena, NOMBRE[2] será el se- gundo carácter de la cadena, etc.). Turbo Pascal admite también tratamiento de cadenas semiestáticas (STRING) como dato. Variables semiestáticas son aquellas cuya longitud puede variar durante la ejecución del programa, pero sin so- brepasar un límite máximo declarado al principio. Variables dinámicas son aquellas cuya longitud puede variar sin limitación dentro del programa. El lenguaje SNOBOL es típico de variables dinámicas.
  • 322. 292 Fundamentos de programación La representación de las diferentes variables de cadena en memoria utiliza un método de almacenamiento dife- rente. Cadenas de longitud fija Se consideran vectores de la longitud declarada, con blancos a izquierda o derecha si la cadena no tiene la longitud declarada. Así, la cadena siguiente E S T A C A S A E S U N A R U I N A 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 se declaró con una dimensión de 24 caracteres y los dos últimos se rellenan con blancos. Cadenas de longitud variable con un máximo Se considera un puntero (en el Capítulo 12 ampliaremos este concepto) con dos campos que contienen la longitud máxima y la longitud actual. Longitud máxima Longitud actual 20 17 E S T A C A S A E S G U A Y Cadenas de longitud indefinida Se representan mediante listas enlazadas, que son listas que se unen mediante puntero longitud actual 6 M A D O N A Estas listas contienen elementos con caracteres empaquetados —2/elemento— y enlazados cada uno con el si- guiente por un puntero (la cadena de caracteres es 'MADONA'). 8.4.3. Instrucciones básicas con cadenas Las instrucciones básicas: asignar y entrada/salida (leer/escribir) se realizan de un modo similar al tratamiento de dichas instrucciones con datos numéricos. Asignación Si la variable NOMBRE se ha declarado como tipo cadena var cadena : NOMBRE la instrucción de asignación debe contener en el lado derecho de la asignación una constante tipo cadena o bien otra variable del mismo tipo. Así, NOMBRE ←'Luis Hermenegildo' significa que la variable NOMBRE toma por valor la cadena 'Luis Hermenegildo'.
  • 323. Las cadenas de caracteres 293 Entrada/Salida La entrada/salida desde un terminal se puede realizar en modo carácter; para ello bastará asignar —a través del co- rrespondiente dispositivo— una cadena de caracteres a una variable tipo cadena. Así, por ejemplo, si A, B, C y D se han declarado como variables tipo cadena var cadena : A, B, C, D las instrucciones leer(A, B) escribir(C, D) asignarán a A y B las cadenas introducidas por el teclado y visualizarán o imprimirán en el dispositivo de salida las cadenas que representan las variables C y D. 8.5. OPERACIONES CON CADENAS El tratamiento de cadenas es un tema importante, debido esencialmente a la gran cantidad de información que se almacena en ellas. Según el tipo de lenguaje de programación elegido se tendrá mayor o menor facilidad para la realización de operaciones. Así, por ejemplo, C tiene grandes posibilidades, FORTRAN sólo operaciones elementa- les y Pascal, dependiendo del compilador, soporta procedimientos y funciones predefinidas o es preciso definirlos por el usuario con la natural complejidad que suponga el diseño del algoritmo correspondiente. Todos los lenguajes orientados a objetos como C++, C# y Java, merced a la clase String soportan una gran gama de funciones de mani- pulación de cadenas. En cualquier caso, las operaciones con cadena más usuales son: • Cálculo de la longitud. • Comparación. • Concatenación. • Extracción de subcadenas. • Búsqueda de información. 8.5.1. Cálculo de la longitud de una cadena La longitud de una cadena, como ya se ha comentado, es el número de caracteres de la cadena. Así, 'Don Quijote de la Mancha' tiene veinticuatro caracteres. La operación de determinación de la longitud de una cadena se representará por la función longitud, cuyo for- mato es: longitud (cadena) La función longitud tiene como argumento una cadena, pero su resultado es un valor numérico entero: longitud('Don Quijote de la Mancha') longitud('□□□') longitud('□□□Mortadelo') proporciona 24 cadena de tres blancos proporciona 3 cadena 'Mortadelo' rellenada de blancos a la izquierda para tener longitud 12 En consecuencia, la función longitud se puede considerar un dato tipo entero y, por consiguiente, puede ser un operando dentro de expresiones aritméticas. 4 + 5 + longitud('DEMO') = 4+5+4 = 13
  • 324. 294 Fundamentos de programación 8.5.2. Comparación La comparación de cadenas (igualdad y desigualdad) es una operación muy importante, sobre todo en la clasificación de datos tipo carácter que se utiliza con mucha frecuencia en aplicaciones de proceso de datos (clasificaciones de listas, tratamiento de textos, etc.). Los criterios de comparación se basan en el orden numérico del código o juego de caracteres que admite la com- putadora o el propio lenguaje de programación. En nuestro lenguaje algorítmico utilizaremos el código ASCII como código numérico de referencia. Así, • El carácter 'A' será el carácter 'C' (código 65) (código 67) • El carácter '8' será el carácter 'i' (código 56) (código 105) En la comparación de cadenas se pueden considerar dos operaciones más elementales: igualdad y desigualdad. Igualdad Dos cadenas a y b de longitudes m y n son iguales si: • El número de caracteres de a y b son los mismos (m = n). • Cada carácter de a es igual a su correspondiente de b si a = a1a2...an y b = b1b2...bn se debe verificar que ai = bi para todo i en el rango 1 = i = n. Así: 'EMILIO' = 'EMILIO' es una expresión verdadera 'EMILIO' = 'EMILIA' es una expresión falsa 'EMILIO' = 'EMILIO ' es una expresión falsa; contiene un blanco final y, por consiguiente, las longitudes no son iguales. Desigualdad Los criterios para comprobar la desigualdad de cadena son utilizados por los operadores de relación , =, =, y se ajustan a una comparación sucesiva de caracteres correspondientes en ambas cadenas hasta conseguir dos carac- teres diferentes. De este modo, se pueden conseguir clasificaciones alfanuméricas 'GARCIA' 'GOMEZ' ya que las comparaciones sucesivas de caracteres es: G-A-R-C-I-A G = G, A O, ... G-O-M-E-Z una vez que se encuentra una desigualdad, no es preciso continuar; como se observa, las cadenas no tienen por qué tener la misma longitud para ser comparadas. EJEMPLO 8.3 En las sucesivas comparaciones se puede apreciar una amplia gama de posibles casos. 'LUIS' 'ANA' 'TOMAS' 'BARTOLO' 'CARMONA' 'LUIS ' = 'LUISITO' 'MARTA' 'LUIS' 'BARTOLOME' 'MADRID' 'LUIS' verdadera verdadera falsa verdadera falsa verdadera Se puede observar de los casos anteriores que la presencia de cualquier carácter —incluso el blanco—, se consi- dera mayor siempre que la ausencia. Por eso, 'LUIS ' es mayor que 'LUIS'.
  • 325. Las cadenas de caracteres 295 8.5.3. Concatenación La concatenación es la operación de reunir varias cadenas de caracteres en una sola, pero conservando el orden de los caracteres de cada una de ellas. El símbolo que representa la concatenación varía de unos lenguajes a otros. Los más utilizados son: + // o En nuestro libro utilizaremos y en ocasiones +. El símbolo evita confusiones con el operador suma. Las ca- denas para concatenarse pueden ser constantes o variables. 'MIGUEL''DE''CERVANTES' == 'MIGUELDECERVANTES' Puede comprobar que las cadenas, en realidad, se “pegan” unas al lado de las otras; por ello, si al concatenar frases desea dejar blancos entre ellas, deberá indicarlos expresamente en alguna de las cadenas. Así, las operaciones 'MIGUEL ''DE ''CERVANTES 'MIGUEL'' DE'' CERVANTES producen el mismo resultado 'MIGUEL DE CERVANTES' lo que significa que la propiedad asociativa se cumple en la operación de concatenación. El operador de concatenación (+, ) actúa como un operador aritmético. EJEMPLO 8.4 Es posible concatenar variables de cadena. var cadena : A, B, C ABC equivale a A(BC) La asignación de constantes tipo cadena a variables tipo cadena puede también realizarse con expresiones con- catenadas. EJEMPLO 8.5 Las variables A, B son de tipo cadena. var cadena : A, B A ← 'FUNDAMENTOS' B ← 'DE PROGRAMACION' La variable C puede recibir como valor C ← A+' '+B que produce un resultado de C = 'FUNDAMENTOS DE PROGRAMACION'
  • 326. 296 Fundamentos de programación Concatenación en Java: El lenguaje Java soporta la concatenación de cadenas mediante el operador + que actúa sobrecargado. Así, suponiendo que la cadena c1 contiene “Fiestas de moros” y la cadena c2 contiene “y cristianos”, la cadena c1 + c2 almacenará “Fiestas de moros y cristianos”. 8.5.4. Subcadenas Otra operación —función— importante de las cadenas es aquella que permite la extracción de una parte específica de una cadena: subcadena. La operación subcadena se representa en dos formatos por: subcadena (cadena, inicio, longitud) • Cadena es la cadena de la que debe extraerse una subcadena. • Inicio es un número o expresión numérica entera que corresponde a la posición inicial de la subcadena. • Longitud es la longitud de la subcadena. subcadena (cadena, inicio) En este caso, la subcadena comienza en inicio y termina en el final de la cadena. EJEMPLOS subcadena ('abcdef', 2, 4) equivale a 'bcde' subcadena ('abcdef', 6, 1) equivale a 'f' subcadena ('abcdef', 3) equivale a 'cdef' subcadena ('abcdef', 3, 4) equivale a 'cdef' longitud = 5 caracteres { subcadena ('12 DE OCTUBRE', 4, 5) = DE OC posición 4 Es posible realizar operaciones de concatenación con subcadenas. subcadena ('PATO DONALD',1,4)+ subcadena ('ESTA TIERRA',5,4) equivale a la cadena 'PATO TIE'. La aplicación de la función a una subcadena, subcadena (cadena, inicio, fin) puede producir los siguientes resultados: 1. Si fin no existe, entonces la subcadena comienza en el mismo carácter inicio y termina con el último carácter. 2. Si fin = 0, el resultado es una cadena vacía. 3. Si inicio longitud (cadena), la subcadena resultante será vacía. subcadena ('MORTIMER', 9, 2) produce una cadena vacía. 4. Si inicio = 0, el resultado es también una cadena vacía. subcadena ('valdez', 0, 4) y subcadena ('valdez', 8) proporcionan cadenas nulas.
  • 327. Las cadenas de caracteres 297 8.5.5. Búsqueda Una operación frecuente a realizar con cadenas es localizar si una determinada cadena forma parte de otra cadena más grande o buscar la posición en que aparece un determinado carácter o secuencia de caracteres de un texto. Estos problemas pueden resolverse con las funciones de cadena estudiadas hasta ahora, pero será necesario dise- ñar los algoritmos correspondientes. Esta función suele ser interna en algunos lenguajes y la definiremos por indi- ce o posicion, y su formato es indice (cadena, subcadena) o bien posicion (cadena, subcadena) donde subcadena es el texto que se trata de localizar. El resultado de la función es un valor entero: • Igual a P = 1, donde P indica la posición del primer carácter de la primera coincidencia de subcadena en cadena. • Igual a cero, si subcadena es una cadena vacía o no aparece en la cadena. Así, suponiendo la cadena C = 'LA CAPITAL ES MADRID' indice (C, 'CAP') toma un valor 4 indice (C, ' ES ') toma un valor 11 indice (C, 'PADRID') toma un valor 0 La función indice en su forma más general realiza la operación que se denomina coincidencia de patro- nes (patter-matching). Esta operación busca una cadena patrón o modelo dentro de una cadena de texto. cursor Texto A B B A B A B A A A B C C C Patrón B A A B A Esta operación utiliza un cursor o puntero en la cadena de texto original y va comprobando los sucesivos valores de ambas cadenas: si son distintos, produce un 0, y si no proporciona la posición del primer carácter coincidente. indice ('ABCDE', 'F') produce 0 indice ('ABXYZCDEF', 'XYZ') produce 3 La función indice (posicion) al tomar también un valor numérico entero se puede utilizar en expresiones aritméticas o en instrucciones de asignación a variables numéricas. P ← indice (C, 'F') 8.6. OTRAS FUNCIONES DE CADENAS Existen otras funciones de cadena internas al lenguaje o definidas por el usuario, que suelen ser de utilidad en pro- gramación y cuyo conocimiento es importante que conozca el lector: • Insertar cadenas. • Borrar cadenas.
  • 328. 298 Fundamentos de programación • Cambiar cadenas. • Convertir cadenas en números y viceversa. 8.6.1. Insertar Si se desea insertar una cadena C dentro de un texto o cadena más grande, se debe indicar la posición. El formato de la función insertar es insertar (t, p, s) • t texto o cadena donde se va a insertar. • p posición a partir de la cual se va a insertar. • s subcadena que se va a insertar. insertar ('ABCDEFGHI', 4, 'XXX') = 'ABCXXXDEFGHI' insertar ('MARIA O', 7, 'DE LA ') = 'MARIA DE LA O' Algoritmo de inserción Si su lenguaje no posee definida esta función, se puede implementar con el siguiente algoritmo: inicio insertar(t,p,s) = subcadena(t,1,p–1) S subcadena(t,p,longitud(t)–p+1) fin Veámoslo con un ejemplo: insertar ('ABCDEFGHI' 4, 'XXX') donde t = 'ABCDEFGHI' y S = 'XXX' p = 4 subcadena (t,1,p–1) = subcadena (t,1,3) = ABC subcadena (t,p,longitud(t)–p+1) = subcadena (t,4,9–4+1) = subcadena (t,4,6) = DEFGHI por consiguiente, insertar ('ABCDEFGHI',4'XXX')= 'ABC'+'XXX'+'DEFGHI'='ABCXXXDEFGHI' 8.6.2. Borrar Si se desea eliminar una subcadena que comienza en la posición p y tiene una longitud l se tiene la función borrar. borrar (t, p, 1) • t texto o cadena de donde se va a eliminar una subcadena, • p posición a partir de la cual se va a borrar (eliminar), • l longitud de la subcadena a eliminar, borrar ('supercalifragilístico', 6, 4) = 'superfragilístico' borrar ('supercalifragilístico', 3, 10) = 'sugilístico'
  • 329. Las cadenas de caracteres 299 Algoritmo borrar Si no se posee la función estándar borrar, será preciso definirla. Ello se consigue con el algoritmo, inicio borrar (t,p,1) = subcadena (t,1,p–1) subcadena (t,p+1,longitud(t)–p–l+1) fin 8.6.3. Cambiar La operación insertar trata de sustituir en un texto t la primera ocurrencia de una subcadena S1 por otra S2. Este es el caso frecuente en los programas de tratamiento de textos, donde a veces es necesario sustituir una palabra cual- quiera por otra (... en el archivo DEMO sustituir la palabra “ordenador” por “computadora”), acomodando las posi- bles longitudes diferentes. La función que realiza la operación de insertar tiene el formato cambiar (t, S1, S2) • t texto donde se realizarán los cambios. • S1 subcadena a sustituir. • S2 subcadena nueva. cambiar ('ABCDEFGHIJ', 'DE', 'XXX') = 'ABCXXXFGHIJ' Si la subcadena S1 no coincide exactamente con una subcadena de t, no se produce ningún cambio y el texto o cadena original no se modifica cambiar ('ABCDEFGHIJK', 'ZY', 'XXX') = 'ABCDEFGHIJK' Algoritmo cambio Si no se dispone de esta función como estándar, es posible definir un algoritmo haciendo uso de las funciones ana- lizadas. cambiar (t, S1, S2) El algoritmo se realiza llamando a las funciones indice, borrar e insertar. procedimiento cambiar(t, S1, S2) inicio j ← indice(t, S1) t ← borrar(t, j, longitud(S1)) insertar(t, j, S2) fin La primera instrucción, j ← indice(s, S1), calcula la posición donde se debe comenzar la inserción, que es, a su vez, el primer elemento de la subcadena S1. La segunda instrucción t ← borrar(t, j, longitud(S1)) borra la subcadena S1 y la nueva cadena se asigna a la variable de cadena t. La tercera instrucción inserta en la nueva cadena t —original sin la cadena S1— la subcadena S2 a partir del carácter de posición j, como se había previsto.
  • 330. 300 Fundamentos de programación 8.6.4. Conversión de cadenas/números Existen funciones o procedimientos en los lenguajes de programación (val y str en BASIC, val y str en Turbo Pascal) que permiten convertir un número en una cadena y viceversa. En nuestro algoritmo los denotaremos por valor y cad. valor (cadena) convierte la cadena en un número; siempre que la cadena fuese de dígitos numéricos cad (valor) convierte un valor numérico en una cadena EJEMPLOS valor ('12345') = 12345 cad (12345) = '12345' Otras funciones importantes relacionadas con la conversión de caracteres en números y de números en caracte- res son código (un_caracter) devuelve el código ASCII de un carácter car (un_codigo) Devuelve el carácter asociado en un código ASCII ACTIVIDADES DE PROGRAMACIÓN RESUELTAS 8.1. Se desea eliminar los blancos de una frase dada terminada en un punto. Se supone que es posible leer los caracteres de la frase de uno en uno. Solución Análisis Para poder efectuar la lectura de la frase, almacena ésta en un array de caracteres (F) —esto es posible en lenguajes como Pascal; en BASIC sería preciso recurrir a enojosas tareas de operaciones con funciones de cadenas MID$, LEFT$ o RIG- HT$—, de modo que F[i] contiene el carácter i-ésimo de la frase dada. Construiremos una nueva frase sin blancos en otro array G. Algoritmo Los pasos a dar para la realización del algoritmo son: • Inicializar contador de letras de la nueva frase G. • Leer el primer carácter. • Repetir. Si el primer carácter no es en blanco, entonces escribir en el lugar siguiente del array G, leer carácter siguiente de la frase dada. Hasta que el último carácter se encuentre. • Escribir la nueva frase —G— ya sin blancos.
  • 331. Las cadenas de caracteres 301 Tabla de variables: F array de caracteres de la frase dada. G array de caracteres de la nueva frase. I contador del array F. J contador del array G. Pseudocódigo: algoritmo blanco inicio I ← 1 J ← 0 F[i] ← leercar() {leercar es una función que permite la lectura de un carácter} repetir si F[I] ' ' entonces J ← J+1 G[I] ← F[I] fin_si I ← I+1 F[i] ← leercar() hasta_que F[I] = '.' //escritura de la nueva frase G desde I ← 1 hasta J hacer escribir(G[I]) //no avanzar linea fin_desde fin 8.2. Leer un carácter y deducir si está situado antes o después de la letra “m” en orden alfabético. Solución Análisis La comparación de datos de tipo carácter se realiza mediante los códigos numéricos ASCII, de modo que una letra estará situada antes o después de ésta si su código ASCII es menor o mayor. La propia computadora se encarga de realizar la comparación de datos tipo carácter de acuerdo al código ASCII, siempre que los datos a comparar sean de tipo carácter. Por ello se deben declarar de tipo carácter las variables que representan las comparaciones. Variables C: caracter Pseudocódigo algoritmo caracter var carácter : C inicio leer(C) si C 'M' entonces escribir(C, 'esta antes que M en orden alfabético') si_no escribir(C, 'esta despues que M en orden alfabético') fin_si fin 8.3. Leer los caracteres y deducir si están en orden alfabético. Solución Tabla de variables CAR1, CAR2: caracter
  • 332. 302 Fundamentos de programación Pseudocódigo algoritmo comparacion var carácter : CAR1, CAR2 inicio leer(CAR1, CAR2) si CAR1 = CAR2 entonces escribir('en orden') si_no escribir('desordenados') fin_si fin 8.4. Leer una letra de un texto. Deducir si está o no comprendida entre las letras mayúsculas I-M inclusive. Solución Variables LETRA: caracter. Pseudocódigo algoritmo var carácter : LETRA inicio leer(LETRA) si (LETRA = 'I') y (LETRA = 'M') entonces escribir('esta comprendida') si_no escribir('no esta comprendida') fin_si fin 8.5. Contar el número de letras “i” de una frase terminada en un punto. Se supone que las letras pueden leerse indepen- dientemente. Solución En este algoritmo el contador de letras sólo se incrementa cuando se encuentran las letras “i” buscadas. Pseudocódigo algoritmo letras_i var entero : N carácter : LETRA inicio N ← 0 repetir LETRA ← leercar() si LETRA = 'i' entonces N ← N+1 fin_si hasta_que LETRA = '.' escribir('La frase tiene', N, 'letras i') fin
  • 333. Las cadenas de caracteres 303 8.6. Contar el número de vocales de una frase terminada en un punto. Solución Pseudocódigo algoritmo vocales var entero : NUMVOCALES carácter : C inicio repetir C ← leercar() {la función leercar permite la lectura de caracteres independientes} si C = 'a' o C = 'e' o C = 'i' o C = 'o' o C = 'u' entonces NUMVOCALES ← NUMVOCALES+1 fin_si hasta_que C = '.' escribir('El numero de vocales es =', NUMVOCALES) fin 8.7. Se desea contar el número de letras “a” y el número de letras “b” de una frase terminada en un punto. Se supone que es posible leer los caracteres independientemente. Solución Método 1 algoritmo letras_a_b var entero : NA, NB carácter : C inicio NA ← 0 NB ← 0 repetir C ← leercar() si C = 'a' entonces NA ← NA+1 fin_si si C = 'b' entonces NB ← NB+1 fin_si hasta_que C = '.' escribir('Letras a =', NA, 'Letras b=', NB) fin Método 2 algoritmo letras_a_b var entero : NA, NB carácter : C inicio NA ← 0 NB ← 0 repetir C ← leercar() si C = 'a' entonces NA ← NA+1
  • 334. 304 Fundamentos de programación si_no si C = 'b' entonces NB ← NB+1 fin_si fin_si hasta_que C = '.' fin Método 3 algoritmo letras_a_b var entero : NA, NB carácter : C inicio NA ← 0 NB ← 0 repetir C ← leercar() según_sea C hacer 'a': NA ← NA+1 'b': NB ← NB+1 fin_según hasta_que C = '.' fin 8.8. Leer cien caracteres de un texto y contar el número de letras “b”. Solución Tabla de variables entero : I, NE caracter : C Pseudocódigo algoritmo letras_b var entero : I, NE carácter : C inicio NE ← 0 desde I ← 1 hasta 100 hacer C ← leercar() si C = 'b' entonces NE ← NE+1 fin_si fin_desde escribir('Existen', NE, 'letras b') fin 8.9. Escribir una función convertida (núm,b) que nos permita transformar un número entero y positivo en base 10 a la base que le indiquemos como parámetro. Comprobar el algoritmo para las bases 2 y 16. algoritmo Cambio_de_base var entero: num, b inicio escribir('Déme número') leer(num)
  • 335. Las cadenas de caracteres 305 escribir('Indique base') leer(b) escribir(convertir(num,b),'es el número', num, 'en base',b) fin cadena función convertir(E entero: num,b) var entero: r carácter: c cadena: unacadena inicio unacadena ← '' si num 0 entonces mientras num 0 hacer r ← num MOD b si r 9 entonces c ← car(r+55) si_no c ← car(r + codigo('0')) fin_si unacadena ← c + unacadena num ← num div b fin_mientras si_no unacadena ← '0' fin_si devolver(unacadena) fin_función CONCEPTOS CLAVE • Cadena. • Cadena nula. • Comparación de cadenas. • Concatenación. • Funciones de biblioteca. • Literal de cadena. • Longitud de la cadena. • String. • Variable de cadena. RESUMEN Cada lenguaje de computadora tiene su propio método de manipulación de cadenas de caracteres. Algunos lenguajes, tales como C++ y C, tienen un conjunto muy rico de fun- ciones de manipulación de cadenas. Otros lenguajes, tales como FORTRAN, que se utilizan predominantemente para cálculos numéricos, incorporan características de manipu- lación de cadenas en sus últimas versiones. También len- guajes tales como LISP, que está concebido para manipular aplicaciones de listas proporciona capacidades excepciona- les de manipulación de cadenas. En un lenguaje como C o C++, las cadenas son simple- mente arrays de caracteres terminados en caracteres nulos (“0”) que se pueden manipular utilizando técnicas estánda- res de procesamiento de arrays elemento por elemento. En esencia, las cadenas en los lenguajes de progra- mación modernos tienen, fundamentalmente, estas caracte- rísticas: 1. Una cadena (string) es un array de caracteres que en algunos casos (C++) se termina con el carácter NULO (NULL). 2. Las cadenas se pueden procesar siempre utilizando técnicas estándares de procesamiento de arrays. 3. En la mayoría de los lenguajes de programación existen muchas funciones de biblioteca para proce- samiento de cadenas como una unidad completa. Internamente estas funciones manipulan las cade- nas carácter a carácter. 4. Algunos caracteres se escriben con un código de escape o secuencia de escape, que consta del carác-
  • 336. 306 Fundamentos de programación ter escape () seguido por un código del propio carácter. 5. Un carácter se representa utilizando un único byte (8 bits). Los códigos de caracteres estándar más utilizados en los lenguajes de programación son ASCII y Unicode. 6. El código ASCII representa 127 caracteres y el có- digo ASCII ampliado representa 256 caracteres. Mediante el código Unicode se llegan a representar numerosos lenguajes internacionales, además del inglés, como el español, francés, chino, hindi, ale- mán, etc. 7. Las bibliotecas estándar de funciones incorporadas a los lenguajes de programación incluyen gran can- tidad de funciones integradas que manipulan ca- denas y que actúan de modo similar a los algorit- mos de las funciones explicadas en el capítulo. Este es el caso de la biblioteca de cadenas del len- guaje C o la biblioteca string.h de C++. 8. Algunas de la funciones de cadena típicas son: lon- gitud de la cadena, comparar cadenas, insertar cadena, copiar cadenas, concatenar cadenas, etc. 9. El lenguaje C++ soporta las cadenas como arrays de caracteres terminado en el carácter nulo repre- sentado por la secuencia de escape “0”. 10. Los lenguajes orientados a objetos Java y C# so- portan las cadenas como objetos de la clase String. EJERCICIOS 8.1. Escribir un algoritmo para determinar si una cadena especificada ocurre en una cadena dada, y si es así, escribir un asterisco (*) en la primera posición de cada ocurrencia. 8.2. Escribir un algoritmo para contar el número de ocu- rrencias de cada una de las palabras 'a', 'an' y 'and' en las diferentes líneas de texto. 8.3. Contar el número de ocurrencias de una cadena espe- cificada en diferentes líneas de texto. 8.4. Escribir un algoritmo que permita la entrada de un nombre consistente en un nombre, un primer apellido y un segundo apellido, en ese orden, y que imprima a continuación el último apellido, seguido del primer apellido y el nombre. Por ejemplo: Luis Garcia Garcia producirá: Garcia Garcia Luis. 8.5. Escribir un algoritmo que elimine todos los espacios finales en una cadena determinada. Por ejemplo: 'J. R. GARCIA ' se deberá transformar en 'J. R. GARCIA'. 8.6. Diseñar un algoritmo cuya entrada sea una cadena S y un factor de multiplicación N, cuya función sea ge- nerar la cadena dada N veces. Por ejemplo: ‘¡Hey!’, 3 se convertirá en '¡Hey! ¡Hey! ¡Hey!' 8.7. Diseñar un algoritmo que elimine todas las ocurren- cias de cada carácter en una cadena dada a partir de otra cadena dada. Las dos cadenas son: • CADENA1 es la cadena donde deben eliminarse caracteres. • LISTA es la cadena que proporciona los ca- racteres que deben eliminarse. CADENA = 'EL EZNZZXTX' LISTA = 'XZ' la cadena pedida es 'EL ENT'. 8.8. Escribir un algoritmo que convierta los números ará- bigos en romanos y viceversa (I = 1, V = 5, X = 10, L = 50, C = 100, D = 500 y M = 1000). 8.9. Diseñar un algoritmo que mediante una función per- mita cambiar un número n en base 10 a la base b, siendo b un número entre 2 y 20. 8.10. Escribir el algoritmo de una función que convierta una cadena en mayúsculas y otra que la convierta en minúsculas. 8.11. Diseñar una función que informe si una cadena es un palíndromo (una cadena es un palíndromo si se lee igual de izquierda a derecha que de derecha a izquierda).
  • 337. CAPÍTULO 9 Archivos (ficheros) 9.1. Archivos y flujos (stream): La jerarquía de datos 9.2. Conceptos y definiciones = terminología 9.3. Soportes secuenciales y direccionables 9.4. Organización de archivos 9.5. Operaciones sobre archivos 9.6. Gestión de archivos 9.7. Flujos 9.8. Mantenimiento de archivos 9.9. Procesamiento de archivos secuenciales (algoritmos) 9.10. Procesamiento de archivos directos (algo- ritmos) 9.11. Procesamiento de archivos secuenciales indexados 9.12. Tipos de archivos: consideraciones prácticas en C/C++ y Java ACTIVIDADES DE PROGRAMACIÓN RESUELTAS CONCEPTOS CLAVE RESUMEN EJERCICIOS Los datos que se han tratado hasta este capítulo y procesados por un programa pueden residir simultá- neamente en la memoria principal de la computadora. Sin embargo, grandes cantidades de datos se alma- cenan normalmente en dispositivos de memoria auxi- liar. Las diferentes técnicas que han sido diseñadas para la estructuración de estas colecciones de datos complejas se alojaban en arrays; en este capítulo se realiza una introducción a la organización y gestión de datos estructurados sobre dispositivos de almace- namiento secundario, tales como cintas y discos mag- néticos. Estas colecciones de datos se conocen como archivos (ficheros). Las técnicas requeridas para ges- tionar archivos son diferentes de las técnicas de orga- nización de datos que son efectivas en memoria prin- cipal, aunque se construyen sobre la base de esas técnicas. Este capítulo introductorio está concebido para la iniciación a los archivos, lo que son y sus mi- siones en los sistemas de información y de los proble- mas básicos en su organización y gestión. INTRODUCCIÓN
  • 338. 308 Fundamentos de programación 9.1. ARCHIVOS Y FLUJOS (STREAM): LA JERARQUÍA DE DATOS El almacenamiento de datos en variables y arrays (arreglos) es temporal; los datos se pierden cuando una variable sale de su ámbito o alcance de influencia, o bien cuando se termina el programa. La mayoría de las aplicaciones requieren que la información se almacene de forma persistente, es decir que no se borre o elimine cuando se termina la ejecución del programa. Por otra parte, en numerosas aplicaciones se requiere utilizar grandes cantidades de infor- mación que, normalmente, no caben en la memoria principal. Debido a estas causas se requiere utilizar archivos (ficheros) para almacenar de modo permanente grandes cantidades de datos, incluso después que los programas que crean los datos se terminan. Estos datos almacenados en archivos se conocen como datos persistentes y permanecen después de la duración de la ejecución del programa. Las computadoras almacenan los archivos en dispositivos de almacenamiento secundarios, tales como discos CD, DVD, memorias flash USB, memorias de cámaras digitales, etc. En este capítulo se explicará cómo los programas escritos en un lenguaje de programación crean, actualizan o procesan archivos de datos. El procesamiento de archivos es una de las características más importantes que un lenguaje de programación debe tener para soportar aplicaciones comerciales que procesan, normalmente, cantidades masivas de datos persistentes. La entrada de datos normalmente se realiza a través del teclado y la salida o resultados van a la pantalla. Estas ope- raciones, conocidas como Entrada/Salida (E/S), se realizan también hacia y desde los archivos. Los programas que se crean con C/C++, Java u otros lenguajes necesitan interactuar con diferentes fuentes de datos. Los lenguajes antiguos como FORTRAN, Pascal o COBOL tenían integradas en el propio lenguaje las entra- das y salidas; palabras reservadas como PRINT, READ, write, writeln, etc, son parte del vocabulario del lenguaje. Sin embargo, los lenguajes de programación modernos como C/C++ o Java/C# tienen entradas y salidas en el len- guaje y para acceder o almacenar información en una unidad de disco duro o en un CD o en un DVD, en páginas de un sitio web e incluso guardar bytes en la memoria de la computadora, se necesitan técnicas que pueden ser diferen- tes para diferente dispositivo de almacenamiento. Afortunadamente, los lenguajes citados anteriormente pueden al- macenar y recuperar información, utilizando sistemas de comunicaciones denominados flujos que se implementan en bibliotecas estándar de funciones de E/S (en archivos de cabecera stdio.h y cstdio.h) en C, en una biblioteca estándar de clases (en archivos de cabecera iostream y fstream) en C++, o en el paquete Java.io en el lenguaje Java. Las estructuras de datos enunciadas en los capítulos anteriores se encuentran almacenadas en la memoria central o principal. Este tipo de almacenamiento, conocido por almacenamiento principal o primario, tiene la ventaja de su pequeño tiempo de acceso y, además, que este tiempo necesario para acceder a los datos almacenados en una posición es el mismo que el tiempo necesario para acceder a los datos almacenados en otra posición del dispositivo —memo- ria principal—. Sin embargo, no siempre es posible almacenar los datos en la memoria central o principal de la computadora, debido a las limitaciones que su uso plantea: • La cantidad de datos que puede manipular un programa no puede ser muy grande debido a la limitación de la memoria central de la computadora1 . • La existencia de los datos en la memoria principal está supeditada al tiempo que la computadora está encendi- da y el programa ejecutándose (tiempo de vida efímero). Esto supone que los datos desaparecen de la memoria principal cuando la computadora se apaga o se deja de ejecutar el programa. Estas limitaciones dificultan: • La manipulación de gran número de datos, ya que —en ocasiones— pueden no caber en la memoria principal (aunque hoy día han desaparecido las limitaciones que la primera generación de PC presentaba con la limitación de memoria a 640 KBytes, no admitiéndose información a almacenar mayor de esa cantidad en el caso de computadoras IBM PC y compatibles). • La transmisión de salida de resultados de un programa pueda ser tratada como entrada a otro programa. 1 En sus orígenes y en la década de los ochenta, 640 K-bytes en el caso de las computadoras personales IBM PC y compatibles. Hoy día esas cifras han sido superadas con creces, pero aunque las memorias centrales varían, en computadoras domésticas, portátiles (laptops) y de es- critorio, entre 1 GB y 4 GB, la temporalidad de los datos almacenados en ellas aconseja siempre el uso de archivos para datos de carácter perma- nente.
  • 339. Archivos (ficheros) 309 Para poder superar estas dificultades se necesitan dispositivos de almacenamiento secundario (memorias externas o auxiliares) como cintas, discos magnéticos, tarjetas perforadas, etc., donde se almacenará la información o datos que podrá ser recuperada para su tratamiento posterior. Las estructuras de datos aplicadas a colección de datos en almacenamientos secundarios se llaman organización de archivos. La noción de archivo o fichero está relacionada con los conceptos de: • Almacenamiento permanente de datos. • Fraccionamiento o partición de grandes volúmenes de información en unidades más pequeñas que puedan ser almacenadas en memoria central y procesadas por un programa. Un archivo o fichero es un conjunto de datos estructurados en una colección de entidades elementales o básicas denominadas registros o artículos, que son de igual tipo y constan a su vez de diferentes entidades de nivel más bajo denominadas campos. 9.1.1. Campos Un campo es un item o elemento de datos elementales, tales como un nombre, número de empleados, ciudad, núme- ro de identificación, etc. Un campo está caracterizado por su tamaño o longitud y su tipo de datos (cadena de caracteres, entero, lógico, etcétera.). Los campos pueden incluso variar en longitud. En la mayoría de los lenguajes de programación los campos de longitud variable no están soportados y se suponen de longitud fija. Campos Nombre Dirección Fecha de nacimiento Estudios Salario Trienios Figura 9.1. Campos de un registro. Un campo es la unidad mínima de información de un registro. Los datos contenidos en un campo se dividen con frecuencia en subcampos; por ejemplo, el campo fecha se di- vide en los subcampos día, mes, año. Campo 0 7 0 7 1 9 9 5 Subcampo Día Mes Año Los rangos numéricos de variación de los subcampos anteriores son: 1 ≤ día ≤ 31 1 ≤ mes ≤ 12 1 ≤ año ≤ 1987 9.1.2. Registros Un registro es una colección de información, normalmente relativa a una entidad particular. Un registro es una co- lección de campos lógicamente relacionados, que pueden ser tratados como una unidad por algún programa. Un ejemplo de un registro puede ser la información de un determinado empleado que contiene los campos de nombre, dirección, fecha de nacimiento, estudios, salario, trienios, etc. Los registros pueden ser todos de longitud fija; por ejemplo, los registros de empleados pueden contener el mis- mo número de campos, cada uno de la misma longitud para nombre, dirección, fecha, etc. También pueden ser de longitud variables.
  • 340. 310 Fundamentos de programación Los registros organizados en campos se denominan registros lógicos. Registro de datos N N = longitud del registro Figura 9.2. Registro. Nota El concepto de registro es similar al concepto de estructura (struct) estudiado en el Capítulo 7, ya que ambas estructuras de datos permiten almacenar datos de tipo heterogéneo. 9.1.3. Archivos (ficheros) Un fichero (archivo) de datos —o simplemente un archivo— es una colección de registros relacionados entre sí con aspectos en común y organizados para un propósito específico. Por ejemplo, un fichero de una clase escolar contiene un conjunto de registros de los estudiantes de esa clase. Otros ejemplos pueden ser el fichero de nóminas de una empresa, inventarios, stocks, etc. La Figura 9.3 recoge la estructura de un archivo correspondiente a los suscriptores de una revista de informá- tica. Registro 4 Registro 3 Registro 2 Registro 1 Nombre Profesión Dirección Teléfono Ciudad Figura 9.3. Estructuras de un archivo “suscriptores”. Un archivo en una computadora es una estructura diseñada para contener datos. Los datos están organizados de tal modo que puedan ser recuperados fácilmente, actualizados o borrados y almacenados de nuevo en el archivo con todos los campos realizados. 9.1.4. Bases de datos Una colección de archivos a los que puede accederse por un conjunto de programas y que contienen todos ellos da- tos relacionados constituye una base de datos. Así, una base de datos de una universidad puede contener archivos de estudiantes, archivos de nóminas, inventarios de equipos, etc. 9.1.5. Estructura jerárquica Los conceptos carácter, campos, registro, archivo y base de datos son conceptos lógicos que se refieren al medio en que el usuario de computadoras ve los datos y se organizan. Las estructuras de datos se organizan de un modo jerár- quico, de modo que el nivel más alto lo constituye la base de datos y el nivel más bajo el carácter.
  • 341. Archivos (ficheros) 311 9.1.6. Jerarquía de datos Una computadora, como ya conoce el lector (Capítulo 1), procesa todos los datos como combinaciones de ceros y unos. Tal elemento de los datos se denomina bit (binary digit). Sin embargo, como se puede deducir fácilmente, es difícil para los programadores trabajar con datos en estos formatos de bits de bajo nivel. En su lugar, los programa- dores prefieren trabajar con caracteres tales como los dígitos decimales (0-9), letras (A-Z y a-z) o símbolos espe- ciales (, *, , @, €, #,...). El conjunto de todos los caracteres utilizados para escribir los programas se denomina conjunto o juegos de caracteres de la computadora. Cada carácter se representa como un patrón de ceros y unos. Por ejemplo, en Java, los caracteres son caracteres Unicode (Capítulo 1) compuestos de 2 bytes. Al igual que los caracteres se componen de bits, los campos se componen de caracteres o bytes. Un campo es un grupo de caracteres o bytes que representan un significado. Por ejemplo, un campo puede constar de letras ma- yúsculas y minúsculas que representan el nombre de una ciudad. Los datos procesados por las computadoras se organizan en jerarquías de datos formando estructuras a partir de bits, caracteres, campos, etc. Los campos (variables de instancias en C++ y Java) se agrupan en registros que se implementan en una clase en Java o en C++. Un registro es un grupo de campos relacionados que se implementan con tipos de datos básicos o estructurados. En un sistema de matrícula en una universidad, un registro de un alumno o de un profesor puede cons- tar de los siguientes campos: • Nombre (cadena). • Número de expediente (entero). • Número de Documento Nacional de Identidad o Pasaporte (entero doble). • Año de nacimiento (entero). • Estudios (cadena). Un archivo es un grupo de registros relacionados. Así, una universidad puede tener muchos alumnos y profesores, y un archivo de alumnos contiene un registro para cada empleado. Un archivo de una universidad puede contener miles de registros y millones o incluso miles de millones de caracteres de información. Las Figura 9.4 muestra la jerarquía de datos de un archivo (byte, campo, registro, archivo). Campos Base de datos Archivos Subcampos Caracteres Registros Figura 9.4. Estructuras jerárquicas de datos. Los registros poseen una clave o llave que identifica a cada registro y que es única para diferenciarla de otros registros. En registros de nombres es usual que el campo clave sea el pasaporte o el DNI (Documento Nacional de Identidad). Un conjunto de archivos relacionados se denomina base de datos. En los negocios o en la administración, los datos se almacenan en bases de datos y en muchos archivos diferentes. Por ejemplo, las universidades pueden tener archivos de profesores, archivos de estudiantes, archivos de planes de estudio, archivos de nóminas de profesores y de PAS (Personal de Administración y Servicios). Otra jerarquía de datos son los sistemas de gestión de bases de datos (SGBD o DBMS) que es un conjunto de programas diseñados para crear y administrar bases de datos.
  • 342. 312 Fundamentos de programación 9.2. CONCEPTOS Y DEFINICIONES = TERMINOLOGÍA Aunque en el apartado anterior ya se han comentado algunos términos relativos a la teoría de archivos, en este apar- tado se enunciarán todos los términos más utilizados en la gestión y diseño de archivos. 9.2.1. Clave (indicativo) Una clave (key) o indicativo es un campo de datos que identifica el registro y lo diferencia de otros registros. Esta clave debe ser diferente para cada registro. Claves típicas son nombres o números de identificación. 9.2.2. Registro físico o bloque Un registro físico o bloque es la cantidad más pequeña de datos que pueden transferirse en una operación de entra- da/salida entre la memoria central y los dispositivos periféricos o viceversa. Ejemplos de registros físicos son: una tarjeta perforada, una línea de impresión, un sector de un disco magnético, etc. Un bloque puede contener uno o más registros lógicos. Un registro lógico puede ocupar menos de un registro físico, un registro físico o más de un registro físico. 9.2.3. Factor de bloqueo Otra característica que es importante en relación con los archivos es el concepto de factor de bloqueo o blocaje. El número de registros lógicos que puede contener un registro físico se denomina factor de bloqueo. Se pueden dar las siguientes situaciones: • Registro lógico Registro físico. En un bloque se contienen varios registros físicos por bloque; se denominan registros expandidos. • Registro lógico = Registro físico. El factor de bloqueo es 1 y se dice que los registros no están bloqueados. • Registro lógico Registro físico. El factor de bloqueo es mayor que 1 y los registros están bloqueados. Registro Bloque Espacio entre bloques a) Un registro por bloque (factor = 1) Registro1 Registro2 Registro3 Registro4 Bloque b) N registros por bloque (factor = N) Espacio entre bloques Figura 9.5. Factor de bloqueo. La importancia del factor de bloqueo se puede apreciar mejor con un ejemplo. Supongamos que se tienen dos archivos. Uno de ellos tiene un factor de bloqueo de 1 (un registro en cada bloque). El otro archivo tiene un factor de bloqueo de 10 (10 registros/bloque). Si cada archivo contiene un millón de registros, el segundo archivo requeri- rá 900.000 operaciones de entrada/salida menos para leer todos los registros. En el caso de las computadoras perso- nales con un tiempo medio de acceso de 90 milisegundos, el primer archivo emplearía alrededor de 24 horas más para leer todos los registros del archivo.
  • 343. Archivos (ficheros) 313 Un factor de bloqueo mayor que 1 siempre mejora el rendimiento; entonces, ¿por qué no incluir todos los regis- tros en un solo bloque? La razón reside en que las operaciones de entrada/salida que se realizan por bloques se hacen a través de un área de la memoria central denominada memoria intermedia (buffer) y entonces el aumento del bloque implicará aumento de la memoria intermedia y, por consiguiente, se reducirá el tamaño de la memoria central. El tamaño de una memoria intermedia de un archivo es el mismo que el del tamaño de un bloque. Como la me- moria central es más cara que la memoria secundaria, no conviene aumentar el tamaño del bloque alegremente, sino más bien conseguir un equilibrio entre ambos criterios. En el caso de las computadoras personales, el registro físico puede ser un sector del disco (512 bytes). Memoria central Memoria intermedia Flujo de datos Programa del usuario Disco Almacenamiento secundario Cinta La Tabla 9.1 resume los conceptos lógicos y físicos de un registro. Tabla 9.1. Unidades de datos lógicos y físicos Organización lógica Organización físcia Descripción Bit Un dígito binario. Carácter Byte (octeto, 8 bits) En la mayoría de los códigos un carácter se representa aproximadamente por un byte. Campo Palabra Un campo es un conjunto relacionado de caracteres. Una palabra de computadora es un número fijo de bytes. Registro Bloque (1 página = bloques de longitud) Los registros pueden estar bloqueados. Archivo Área Varios archivos se pueden almacenar en un área de almacenamiento. Base de datos Áreas Colección de archivos de datos relacionados que se pueden organizar en una base de datos. Resumen de archivos • Un archivo está siempre almacenado en un soporte externo a la memoria central. • Existe independencia de las informaciones respecto de los programas. • Todo programa de tratamiento intercambia información con el archivo y la unidad básica de entrada/salida es el registro. • La información almacenada es permanente. • En un momento dado, los datos extraídos por el archivo son los de un registro y no los del archivo completo. • Los archivos en memoria auxiliar permiten una gran capacidad de almacenamiento. 9.3. SOPORTES SECUENCIALES Y DIRECCIONABLES El soporte es el medio físico donde se almacenan los datos. Los tipos de soporte utilizados en la gestión de archi- vos son: • Soportes secuenciales. • Soportes direccionables.
  • 344. 314 Fundamentos de programación Los soportes secuenciales son aquellos en los que los registros —informaciones— están escritos unos a conti- nuación de otros y para acceder a un determinado registro n se necesita pasar por los n – 1 registros anteriores. Los soportes direccionables se estructuran de modo que las informaciones registradas se pueden localizar direc- tamente por su dirección y no se requiere pasar por los registros precedentes. En estos soportes los registros deben poseer un campo clave que los diferencie del resto de los registros del archivo. Una dirección en un soporte direc- cionable puede ser número de pista y número de sector en un disco. Los soportes direccionables son los discos magnéticos, aunque pueden actuar como soporte secuencial. 9.4. ORGANIZACIÓN DE ARCHIVOS Según las características del soporte empleado y el modo en que se han organizado los registros, se consideran dos tipos de acceso a los registros de un archivo: • Acceso secuencial. • Acceso directo. El acceso secuencial implica el acceso a un archivo según el orden de almacenamiento de sus registros, uno tras otro. El acceso directo implica el acceso a un registro determinado, sin que ello implique la consulta de los registros precedentes. Este tipo de acceso sólo es posible con soportes direccionables. La organización de un archivo define la forma en la que los registros se disponen sobre el soporte de almacena- miento, o también se define la organización como la forma en que se estructuran los datos en un archivo. En general, se consideran tres organizaciones fundamentales: • Organización secuencial. • Organización directa o aleatoria (“random”). • Organización secuencial indexada (“indexed”). 9.4.1. Organización secuencial Un archivo con organización secuencial es una sucesión de registros almacenados consecutivamente sobre el sopor- te externo, de tal modo que para acceder a un registro n dado es obligatorio pasar por todos los n – 1 artículos que le preceden. Los registros se graban consecutivamente cuando el archivo se crea y se debe acceder consecutivamente cuando se leen dichos registros. Principio del archivo Registro 1 Registro 2 . . . . Registro I – 1 Registro I Registro I + 1 . . . . Registro N – 1 Fin del archivo Registro N Figura 9.6. Organización secuencial.
  • 345. Archivos (ficheros) 315 • El orden físico en que fueron grabados (escritos) los registros es el orden de lectura de los mismos. • Todos los tipos de dispositivos de memoria auxiliar soportan la organización secuencial. Los archivos organizados secuencialmente contienen un registro particular —el último— que contiene una marca fin de archivo (EOF o bien FF). Esta marca fin de archivo puede ser un carácter especial como '*'. 9.4.2. Organización directa Un archivo está organizado en modo directo cuando el orden físico no se corresponde con el orden lógico. Los da- tos se sitúan en el archivo y se accede a ellos directamente mediante su posición, es decir, el lugar relativo que ocupan. Esta organización tiene la ventaja de que se pueden leer y escribir registros en cualquier orden y posición. Son muy rápidos de acceso a la información que contienen. La organización directa tiene el inconveniente de que necesita programar la relación existente entre el contenido de un registro y la posición que ocupa. El acceso a los registros en modo directo implica la posible existencia de huecos libres dentro del soporte y, por consecuencia, pueden existir huecos libres entre registros. La correspondencia entre clave y dirección debe poder ser programada y la determinación de la relación entre el registro y su posición física se obtiene mediante una fórmula. Las condiciones para que un archivo sea de organización directa son: • Almacenado en un soporte direccionable. • Los registros deben contener un campo específico denominado clave que identifica cada registro de modo úni- co, es decir, dos registros distintos no pueden tener un mismo valor de clave. • Existencia de una correspondencia entre los posibles valores de la clave y las direcciones disponibles sobre el soporte. Un soporte direccionable es normalmente un disco o paquete de discos. Cada posición se localiza por su dirección absoluta, que en el caso del disco suele venir definida por dos parámetros —número de pista y número de sector— o bien por tres parámetros —pista, sector y número de cilindro—; un cilindro i es el conjunto de pistas de número i de cada superficie de almacenamiento de la pila. En la práctica el programador no gestiona directamente direcciones absolutas, sino direcciones relativas respecto al principio del archivo. La manipulación de direcciones relativas permite diseñar el programa con independencia de la posición absoluta del archivo en el soporte. El programador crea una relación perfectamente definida entre la clave indicativa de cada registro y su posición física dentro del dispositivo de almacenamiento. Esta relación, en ocasiones, produce colisiones. Consideremos a continuación el fenómeno de las colisiones mediante un ejemplo. La clave de los registros de estudiantes de una Facultad de Ciencias es el número de expediente escolar que se le asigna en el momento de la matriculación y que consta de ocho dígitos. Si el número de estudiantes es un número decimal de ocho dígitos, existen 108 posibles números de estudiantes (0 a 99999999), aunque lógicamente nunca existirán tantos estudiantes (incluso incluyendo alumnos ya graduados). El archivo de estudiantes constará a lo sumo de decenas o centenas de miles de estudiantes. Se desea almacenar este archivo en un disco sin utilizar mucho espa- cio. Si se desea obtener el algoritmo de direccionamiento, se necesita una función de conversión de claves o función “hash”. Suponiendo que N es el número de posiciones disponibles para el archivo, el algoritmo de direccionamien- to convierte cada valor de la clave en una dirección relativa d, comprendida entre 1 y N. Como la clave puede ser numérica o alfanumérica, el algoritmo de conversión debe prever esta posibilidad y asignar a cada registro corres- pondiente a una clave una posición física en el soporte de almacenamiento. Así mismo, el algoritmo o función de conversión de claves debe eliminar o reducir al máximo las colisiones. Se dice que en un algoritmo de conversión de claves se produce una colisión cuando dos registros de claves distintas producen la misma dirección física en el so- porte. El inconveniente de una colisión radica en el hecho de tener que situar el registro en una posición diferente de la indicada por el algoritmo de conversión y, por consiguiente, el acceso a este registro será más lento. Las colisiones son difíciles de evitar en las organizaciones directas. Sin embargo, un tratamiento adecuado en las operaciones de lectura/escritura disminuirá su efecto perjudicial en el archivo. Para representar la función de transformación o conversión de claves (hash), se puede utilizar una notación matemática. Así, si K es una clave, f(K) es la correspondiente dirección; f es la función llamada función de con- versión.
  • 346. 316 Fundamentos de programación EJEMPLO 9.1 Una compañía de empleados tiene un número determinado de vendedores y un archivo en el que cada registro co- rresponde a un vendedor. Existen 200 vendedores, cada uno referenciado por un número de cinco dígitos. Si tuvié- semos que asignar un archivo de 100.000 registros, cada registro se corresponderá con una posición del disco. Para el diseño del archivo crearemos 250 registros (un 25 por 100 más que el número de registros necesarios —25 por 100 suele ser un porcentaje habitual—) que se distribuirán de la siguiente forma: 1. Posiciones 0-199 constituyen el área principal del archivo y en ella se almacenarán todos los vendedores. 2. Posiciones 200-249 constituyen el área de desbordamiento, si K(1) K(2), pero f(K(1)) = f(K(2)), y el re- gistro con clave K(1) ya está almacenado en el área principal, entonces el registro con K(2) se almacena en el área de desbordamiento. La función f se puede definir como: f(k) = resto cuando K se divide por 199, esto es, el módulo de 199; 199 ha sido elegido por ser el número primo mayor y que es menor que el tamaño del área principal. Para establecer el archivo se borran primero 250 posiciones. A continuación, para cada registro de vendedor se calcula p = f(K). Si la posición p está vacía, se almacena el registro en ella. En caso contrario se busca secuencial- mente a través de las posiciones 200, 201, ..., para el registro con la clave deseada. 9.4.3. Organización secuencial indexada Un diccionario es un archivo secuencial, cuyos registros son las entradas y cuyas claves son las palabras definidas por las entradas. Para buscar una palabra (una clave) no se busca secuencialmente desde la “a” hasta la “z”, sino que se abre el diccionario por la letra inicial de la palabra. Si se desea buscar “índice”, se abre el índice por la letra I y en su primera página se busca la cabecera de página hasta encontrar la página más próxima a la palabra, buscando a continuación palabra a palabra hasta encontrar “índice”. El diccionario es un ejemplo típico de archivo secuencial indexado con dos niveles de índices, el nivel superior para las letras iniciales y el nivel menor para las cabeceras de página. En una organización de computadora las letras y las cabeceras de páginas se guardarán en un archivo de ín- dice independiente de las entradas del diccionario (archivo de datos). Por consiguiente, cada archivo secuencial in- dexado consta de un archivo índice y un archivo de datos. Un archivo está organizado en forma secuencial indexada si: • El tipo de sus registros contiene un campo clave identificador. • Los registros están situados en un soporte direccionable por el orden de los valores indicados por la clave. • Un índice para cada posición direccionable, la dirección de la posición y el valor de la clave; en esencia, el índice contiene la clave del último registro y la dirección de acceso al primer registro del bloque. Un archivo en organización secuencial indexada consta de las siguientes partes: • Área de datos o primaria: contiene los registros en forma secuencial y está organizada en secuencia de claves sin dejar huecos intercalados. • Área de índices: es una tabla que contiene los niveles de índice, la existencia de varios índices enlazados se denomina nivel de indexación. • Área de desbordamiento o excedentes: utilizada, si fuese necesario, para las actualizaciones. El área de índices es equivalente, en su función, al índice de un libro. En ella se refleja el valor de la clave iden- tificativa más alta de cada grupo de registros del archivo y la dirección de almacenamiento del grupo. Los archivos secuenciales indexados presentan las siguientes ventajas: • Rápido acceso. • El sistema de gestión de archivos se encarga de relacionar la posición de cada registro con su contenido median- te la tabla de índices.
  • 347. Archivos (ficheros) 317 Y los siguientes inconvenientes: • Desaprovechamiento del espacio por quedar huecos intermedios cada vez que se actualiza el archivo. • Se necesita espacio adicional para el área de índices. Los soportes que se utilizan para esta organización son los que permiten el acceso directo —los discos magnéti- cos—. Los soportes de acceso secuencial no pueden utilizarse, ya que no disponen de direcciones para las posiciones de almacenamiento. 9.5. OPERACIONES SOBRE ARCHIVOS Tras la decisión del tipo de organización que ha de tener el archivo y los métodos de acceso que se van a aplicar para su manipulación, es preciso considerar todas las posibles operaciones que conciernen a los registros de un archivo. Las distintas operaciones que se pueden realizar son: • Creación. • Consulta. • Actualización (altas, bajas, modificación, consulta). CLAVE DIRECCIÓN Área de índices 15 010 24 020 36 030 54 040 . . . . . . 240 090 CLAVE DATOS Área principal 010 15 011 012 . . . 019 020 24 021 . . . 029 030 36 031 . . . 039 040 54 041 . . . 049 050 . . . 090 240 091 . . . 100 0 Figura 9.7. Organización secuencial indexada.
  • 348. 318 Fundamentos de programación • Clasificación. • Reorganización. • Destrucción (borrado). • Reunión, fusión. • Rotura, estallido. 9.5.1. Creación de un archivo Es la primera operación que sufrirá el archivo de datos. Implica la elección de un entorno descriptivo que permita un ágil, rápido y eficaz tratamiento del archivo. Para utilizar un archivo, éste tiene que existir, es decir, las informaciones de este archivo tienen que haber sido almacenadas sobre un soporte y ser utilizables. La creación exige organización, estructura, localización o reserva de espacio en el soporte de almacenamiento, transferencia del archivo del soporte antiguo al nuevo. Un archivo puede ser creado por primera vez en un soporte, proceder de otro previamente existente en el mismo o diferente soporte, ser el resultado de un cálculo o ambas cosas a la vez. La Figura 9.8 muestra un organigrama de la creación de un archivo ordenado de empleados de una empresa por el campo clave (número o código de empleado). DATOS CREACIÓN de un archivo en disco MAESTRO (desordenado) Número de empleado Maestro ordenado Operación de clasificación por número empleado Figura 9.8. Creación de un archivo ordenado de empleados. 9.5.2. Consulta de un archivo Es la operación que permite al usuario acceder al archivo de datos para conocer el contenido de uno, varios o todos los registros. Proceso de consulta Figura 9.9. Consulta de un archivo.
  • 349. Archivos (ficheros) 319 9.5.3. Actualización de un archivo Es la operación que permite tener actualizado (puesto al día) el archivo, de tal modo que sea posible realizar las si- guientes operaciones con sus registros: • Consulta del contenido de un registro. • Inserción de un registro nuevo en el archivo. • Supresión de un registro existente. • Modificación de un registro. Un ejemplo de actualización es el de un archivo de un almacén, cuyos registros contienen las existencias de cada artículo, precios, proveedores, etc. Las existencias, precios, etc., varían continuamente y exigen una actualización simultánea del archivo con cada operación de consulta. Proceso de actualización Figura 9.10. Actualización de un archivo (I). Inserción de un registro Fin Localizar posición de inserción No Sí Grabar nuevo registro Transferir áreas de entrada a salida Posición libre Figura 9.11. Actualización de un archivo (II). 9.5.4. Clasificación de un archivo Una operación muy importante en un archivo es la clasificación u ordenación (sort, en inglés). Esta clasificación se realizará de acuerdo con el valor de un campo específico, pudiendo ser ascendente (creciente) o descendente (decre- ciente): alfabética o numérica (véase Figura 9.12).
  • 350. 320 Fundamentos de programación Clasificación Copia Clasificación Figura 9.12. Clasificación de un archivo. 9.5.5. Reorganización de un archivo Las operaciones sobre archivos modifican la estructura inicial o la óptima de un archivo. Los índices, enlaces (pun- teros), zonas de sinónimos, zonas de desbordamiento, etc., se modifican con el paso del tiempo, lo que hace a la operación de acceso al registro cada vez más lenta. La reorganización suele consistir en la copia de un nuevo archivo a partir del archivo modificado, a fin de obtener una nueva estructura lo más óptima posible. 9.5.6. Destrucción de un archivo Es la operación inversa a la creación de un archivo (kill, en inglés). Cuando se destruye (anula o borra) un archivo, éste ya no se puede utilizar y, por consiguiente, no se podrá acceder a ninguno de sus registros (Figura 9.13). 9.5.7. Reunión, fusión de un archivo Reunión. Esta operación permite obtener un archivo a partir de otros varios (Figura 9.14). Fusión. Se realiza una fusión cuando se reúnen varios archivos en uno solo, intercalándose unos en otros, siguien- do unos criterios determinados. Proceso de reorganización Figura 9.13. Reorganización de un archivo. Reunión/ fusión Figura 9.14. Fusión de archivos.
  • 351. Archivos (ficheros) 321 9.5.8. Rotura/estallido de un archivo Es la operación de obtener varios archivos a partir de un mismo archivo inicial. Rotura Figura 9.15. Rotura de un archivo. 9.6. GESTIÓN DE ARCHIVOS Las operaciones sobre archivos se realizan mediante programas y el primer paso para poder gestionar un archivo mediante un programa es declarar un identificador lógico que se asocie al nombre externo del archivo para permitir su manipulación. La declaración se realizará con una serie de instrucciones como las que se muestran a continuación, cuya asociación permite establecer la organización del archivo y estructura de sus registros lógicos. tipo registro: tipo_registro tipo:nombre del campo .... fin_registro archivo_organización de tipo_de_dato:tipo_archivo var tipo_registro: nombre_registro tipo_archivo:identificador_archivo tipo registro: Rempleado cadena: nombre cadena: cod entero: edad real: salario fin_registro archivo_d de rempleado:empleado var Rempleado: Re Empleado: E Las operaciones, básicas para la gestión de archivos, que tratan con la propia estructura del archivo se conside- ran predefinidas y son: • Crear archivos (create). Consiste en definirlo mediante un nombre y unos atributos. Si el archivo existiera con anterioridad lo destruiría.
  • 352. 322 Fundamentos de programación • Abrir o arrancar (open) un archivo que fue creado con anterioridad a la ejecución de este programa. Esta ope- ración establece la comunicación de la CPU con el soporte físico del archivo, de forma que los registros se vuelven accesibles para lectura, escritura o lectura/escritura. • Incrementar o ampliar el tamaño del archivo (append, extend). • Cerrar el archivo después que el programa ha terminado de utilizarlo (close). Cierra la comunicación entre la CPU y el soporte físico del archivo. • Borrar (delete) un archivo que ya existe. Borra el archivo del soporte físico, liberando espacio. • Transferir datos desde (leer) o a (escribir) el dispositivo diseñado por el programa. Estas operaciones copian los registros del archivo sobre variables en memoria central y viceversa. En cuanto a las operaciones más usuales en los registros son: • Consulta: lectura del contenido de un registro. • Modificación: alterar la información contenida en un registro. • Inserción: añadir un nuevo registro al archivo. • Borrado: suprimir un registro del archivo. 9.6.1. Crear un archivo La creación de un archivo es la operación mediante la cual se introduce la información correspondiente al archivo en un soporte de almacenamiento de datos. Antes de que cualquier usuario pueda procesar un archivo es preciso que éste haya sido creado previamente. El proceso de creación de un archivo será la primera operación a realizar. Una vez que el archivo ha sido creado, la mayoría de los usuarios simplemente desearán acceder al archivo y a la información contenida en él. Para crear un nuevo archivo dentro de un sistema de computadora se necesitan los siguientes datos: • Nombre dispositivo: indica el lugar donde se situará el archivo cuando se cree. • Nombre del archivo: identifica el archivo entre los restantes archivos de una computadora. • Tamaño del archivo: indica el espacio necesario para la creación del archivo. • Organización del archivo: tipo de organización del archivo. • Tamaño del bloque o registro físico: cantidad de datos que se leen o escriben en cada operación de entrada/sali- da (E/S). Al ejecutar la creación de un archivo se pueden generar una serie de errores, entre los que se pueden destacar los siguientes: • Otro archivo con el mismo nombre ya existía en el soporte. • El dispositivo no tiene espacio disponible para crear otro nuevo archivo. • El dispositivo no está operacional. • Existe un problema de hardware que hace abortar el proceso. • Uno o más de los parámetros de entrada en la instrucción son erróneos. La instrucción o acción en pseudocódigo que permite crear un archivo se codifica con la palabra crear. crear(var_tipo_archivo, nombre_físico) 9.6.2. Abrir un archivo La acción de abrir (open) un archivo es permitir al usuario localizar y acceder a los archivos que fueron creados anteriormente. La diferencia esencial entre una instrucción de abrir un archivo y una instrucción de crear un archivo residen en que el archivo no existe antes de utilizar crear y se supone que debe existir antes de utilizar abrir.
  • 353. Archivos (ficheros) 323 La información que un sistema de tratamiento de archivos requiere para abrir un archivo es diferente de las listas de información requerida para crear un archivo. La razón para ello reside en el hecho que toda la información que realmente describe el archivo se escribió en éste durante el proceso de creación del archivo. Por consiguiente, la operación crear sólo necesita localizar y leer esta información conocida como atributos del archivo. La instrucción de abrir un archivo consiste en la creación de un canal que comunica a un usuario a través de un programa con el archivo correspondiente situado en un soporte. Los parámetros que se deben incluir en una instrucción de apertura (abrir) son: • Nombre del dispositivo. • Nombre del usuario o canal de comunicación. • Nombre del archivo. Al ejecutar la instrucción abrir se pueden encontrar los siguientes errores: • Archivo no encontrado en el dispositivo especificado (nombre de archivo o identificador de dispositivo erróneo). • Archivo ya está en uso para alguna otra aplicación del usuario. • Errores hardware. El formato de la instrucción es: Abrir (var_tipo_archivo,modo,nombre_físico) La operación de abrir archivos se puede aplicar para operaciones de lectura (l), escritura (e), lectura/escritura (l/e). abrir (id_archivo, l, nombre_archivo) Directorio Archivo Leer entrada al directorio Leer especificaciones del archivo Programa usuario Crear DEMO . . Abrir DEMO Escribir entrada directorio Escribir especificación archivo Especificaciones del archivo CREAR _ ARCHIVO Nombre del camino del archivo ABRIR _ ARCHIVO Figura 9.16. Abrir un archivo.
  • 354. 324 Fundamentos de programación Para que un archivo pueda abrirse ha de haber sido previamente creado. Cuando un archivo se abre para lectura colocamos un hipotético puntero en el primer registro del archivo y se permitirán únicamente operaciones de lectura de los registros del archivo. La apertura para escritura coloca dicho hipotético puntero detrás del último registro del archivo, y dispuesto para la adición de nuevos registros en él. Ambos modos se consideran propios de archivos se- cuenciales. Los archivos directos se abrirán en modo lectura/escritura, permitiéndose tanto la lectura como la escri- tura de nuevos registros. 9.6.3. Cerrar archivos El propósito de la operación de cerrar un archivo es permitir al usuario cortar el acceso o detener el uso del archi- vo, permitiendo a otros usuarios acceder al archivo. Para ejecutar esta función, el sistema de tratamiento de archivos sólo necesita conocer el nombre del archivo que se debe cerrar, y que previamente debía estar abierto. Formato: Estructura: cerrar (var_tipo-archivo Reg1 Reg2 Reg3 EOF 9.6.4. Borrar archivos La instrucción de borrar tiene como objetivo la supresión de un archivo del soporte o dispositivo. El espacio utili- zado por un archivo borrado puede ser utilizado para otros archivos. La información necesaria para eliminar un archivo es: • Nombre del dispositivo y número del canal de comunicación. • Nombre del archivo. Los errores que se pueden producir son: • El archivo no se puede encontrar bien porque el nombre no es válido o porque nunca existió. • Otros usuarios estaban actuando sobre el archivo y estaba activo. • Se detectó un problema de hardware. 9.7. FLUJOS Un archivo o fichero es una colección de datos relacionados. En esencia, C++ o Java visualizan cada archivo como un flujo (stream) secuencial de bytes. En la entrada, un programa extrae bytes de un flujo de entrada y en la salida, un programa inserta bytes en el flujo de salida. En un programa orientado a texto, cada byte representa un carácter; en general, los bytes pueden formar una representación binaria de datos carácter o numéricos. Los bytes de un flujo de entrada pueden venir del teclado o de un escáner, por ejemplo, pero también pueden venir de un dispositivo de almacenamiento, tal como un disco duro o un CD, o desde otro programa. De modo similar, en un flujo de salida, los bytes pueden fluir a la pantalla, a una impresora, a un dispositivo de almacenamiento o a otro programa. En re- sumen, un flujo actúa como un intermediario entre el programa y el destino o fuente del flujo. Este enfoque permite a un programa C++, Java,... tratar la entrada desde un archivo. En realidad el lenguaje tra- ta un archivo como una serie de bytes; muchos archivos residen en un disco, pero dispositivos tales como impresoras, discos magnéticos y ópticos, y líneas de comunicación se consideran archivos. Con este enfoque, por ejemplo, un programa C++ examina el flujo de bytes sin necesidad de conocer su procedencia, y puede procesar la salida de modo independiente adonde vayan los bytes. Un archivo es un flujo secuencial de bytes. Cada archivo termina con una marca final de archivo (EOF, end-of- file) o en un número de byte específico grabado en el sistema. Un programa que procesa un flujo de byte recibe una indicación del sistema cuando se alcanza el final del flujo con independencia de cómo estén representados los flujos o archivos.
  • 355. Archivos (ficheros) 325 9.7.1. Tipos de flujos Existen dos tipos de flujos en función del sentido del canal de comunicación: flujo de entrada y flujo de salida. Un flujo de entrada lee información como una secuencia de caracteres. Estos caracteres pueden ser tecleados en la consola de entrada, leídos de un archivo de entrada, o leídos de zócalo de una red. Un flujo de salida es una secuen- cia de caracteres que se almacenan como información. Estos caracteres se pueden visualizar en la consola, escribir en un archivo de salida o en zócalos de red. Un flujo de entrada envía datos desde una fuente a un programa. Un flujo de salida envía datos desde un pro- grama a un destino. Desde el punto de vista de la información que contienen, los flujos se clasifican en: • Flujos de bytes, se utilizan para manejar bytes, enteros y otros tipos de datos simples. Un tipo muy diverso se pueden expresar en formato bytes, incluyendo datos numéricos, programas ejecutables, comunicaciones de Internet, bytecode (archivos de clases ejecutados por una máquina virtual Java). Cada tipo de dato se puede expresar o bien como bytes individuales o como combinación de bytes. • Flujos de caracteres, manipulan archivos de texto y otras fuentes de texto. Se diferencian de los flujos de bytes en que soportan el conjunto de caracteres ASCII o Unicode. Cualquier tipo de datos que implique texto debe utilizar flujo de caracteres, incluyendo archivos de texto, páginas web o sitios comunes de texto. 9.7.2. Flujos en C++ La gestión de la entrada, implica dos etapas: • Asociación de un flujo con una entrada a un programa. • Conexión del flujo a un archivo. En otras palabras, un flujo de entrada necesita dos conexiones, una en cada extremo. La conexión fin de archivo proporciona una fuente para el flujo y la conexión fin de programa vuelca el flujo de salida al programa (la conexión final de archivo, pero también puede ser un dispositivo, tal como un teclado). De igual modo, la gestión de salida implica la conexión de un flujo de salida al programa y la asociación de un destino de salida con el flujo. Al igual que sucede en una tubería del servicio del agua corriente de su ciudad, fluyen bytes en lugar de agua. En C++ un flujo es un tipo especial de variable conocida como un objeto. Los flujos cin y cout se utilizan en entradas y salidas. La clase istream define el operador de extracción () para los tipos primitivos. Este operador convierte los datos a una secuencia de caracteres y los inserta en el flujo. Los flujos cin y cout se declaran en el lenguaje por usted, pero si desea que un flujo se conecte a un archivo, se debe declarar justo antes de que se pueda declarar cualquier otra variable. 9.7.3. Flujos en Java El procedimiento para utilizar bien un flujo de bytes o un flujo de caracteres en Java es, en gran medida, el mismo. Antes de comenzar a trabajar con las clases específicas de la biblioteca de clases java.io, es útil revisar el proceso de crear y utilizar flujos. Para un flujo de entrada, el primer paso es crear un objeto asociado con la fuente de datos. Por ejemplo, si la fuente es un archivo de su unidad de disco duro, un objeto FileInputStream se puede asociar con este archivo. Después que se tiene un objeto de flujo, se puede leer la información desde el flujo utilizando uno de los métodos del objeto FileInputStream incluye un método read que devuelve un byte leído desde el teclado. Cuando se termina de leer la información del flujo se llama al método close( ) para indicar que se ha termi- nado de utilizar el flujo. En el caso de un flujo de salida, se crea un objeto asociado con el destino de los datos. Tal objeto se puede crear de la clase BufferedWriter que representa un medio eficiente de crear archivos de texto.
  • 356. 326 Fundamentos de programación El método write( ) es el medio más simple para enviar información al destino del flujo de salida. Al igual que con los flujos de entrada, el método close( ) se llama en un flujo de salida cuando no se tiene más información que enviar. 9.7.4. Consideraciones prácticas en Java y C# Java y C# realizan las operaciones en archivos a través de flujos, manipulados por clases, que conectan con el me- dio de almacenamiento. De esta forma, para crear y abrir un archivo, se requiere utilizar una clase que defina la funcionalidad del flujo. Los flujos determinan el sentido de la comunicación (lectura, escritura, o lectura/escritura), la posibilidad de posicionamiento directo o no en un determinado registro y la forma de leer y/o escribir en el ar- chivo. Cerrar el archivo implica cerrar el flujo. Así la siguiente instrucción en Java crea un flujo que permite la lectura/escritura (rw) en un archivo donde se podrá efectuar posicionamiento directo y cuyo nombre externo es em- pleados.dat. RandomAccessFile e = new RandomAccessFile (empleados.dat, rw); Pueden utilizarse flujos de bytes, caracteres, cadenas o tipos primitivos. Por ejemplo, en Java la clase Fi- leInputStream permite crear un flujo para lectura secuencial de bytes desde un archivo, mientras FileReader lo crea para la lectura secuencial de caracteres y RandomAccessFile, como ya se ha comentado, admite posiciona- miento directo y permite la lectura/escritura de datos tipos primitivos. La personalización de flujos se consigue por asociación o encadenamiento de otros flujos sobre los flujos base de apertura de archivos. Una aplicación práctica de esta propiedad en Java puede ser permitir la lectura de una cade- na de caracteres desde un flujo de entrada BufferedReader f = new BufferedReader (new FileReader(datos.txt)); cadena = f.readLine(); //lee una cadena del archivo f.close(); // cierra el archivo En C# la situación es similar y sobre los flujos base, que conectan al medio de almacenamiento, pueden encade- narse otros para efectuar tratamientos especiales de la información. BinaryWriter f = new BinaryWriter (new FileStream(notas.dat, FileMode.OpenOrCreate, FileAccess.Write)); /* BinaryWriter proporciona métodos para escribir tipos de datos primitivos en formato binario */ f.Write (5.34 * 2); f.Close(); // Cerrar el archivo 9.8. MANTENIMIENTO DE ARCHIVOS La operación de mantenimiento de un archivo incluye todas las operaciones que sufre un archivo durante su vida y desde su creación hasta su eliminación o borrado. El mantenimiento de un archivo consta de dos operaciones diferentes: • actualización, • consulta. La actualización es la operación de eliminar o modificar los datos ya existentes, o bien introducir nuevos datos. En esencia, es la puesta al día de los datos del archivo.
  • 357. Archivos (ficheros) 327 Las operaciones de actualización son: • altas, • bajas, • modificaciones. Las operaciones de consulta tienen como finalidad obtener información total o parcial de los datos almacena- dos en un archivo y presentarlos en dispositivos de salida: pantalla o impresora, bien como resultados o como lis- tados. Todas las operaciones de mantenimiento de archivos suelen constituir módulos independientes del programa prin- cipal y su diseño se realiza con subprogramas (subrutinas o procedimientos específicos). Así, los subprogramas de mantenimiento de un archivo constarán de: Altas Una operación de alta en un archivo consiste en la adición de un nuevo registro. En un archivo de empleados, un alta consistirá en introducir los datos de un nuevo empleado. Para situar correctamente un alta, se deberá conocer la po- sición donde se desea almacenar el registro correspondiente: al principio, en el interior o al final de un archivo. El algoritmo del subprograma ALTAS debe contemplar la comprobación de que el registro a dar de alta no existe previamente. Bajas Una baja es la acción de eliminar un registro de un archivo. La baja de un registro se puede presentar de dos formas distintas: indicación del registro específico que se desea dar de baja o bien visualizar los registros del archivo para que el usuario elija el registro a borrar. La baja de un registro puede ser lógica o física. Una baja lógica supone el no borrado del registro en el archivo. Esta baja lógica se manifiesta en un determinado campo del registro con una bandera, indicador o “flag” —carácter *, $, etc.—, o bien con la escritura o rellenado con espacios en blanco de algún campo en el registro específico. Una baja física implica el borrado y desaparición del registro, de modo que se crea un nuevo archivo que no incluye el registro dado de baja. Modificaciones Una modificación en un archivo consiste en la operación de cambiar total o parcialmente el contenido de uno de sus registros. Esta fase es típica cuando cambia el contenido de un determinado campo de un archivo; por ejemplo, la dirección o la edad de un empleado. La forma práctica de modificar un registro es la visualización del contenido de sus campos; para ello se debe elegir el registro o registros a modificar. El proceso consiste en la lectura del registro, modificación de su contenido y escritura, total o parcial del mismo. Consulta La operación de consulta tiene como fin visualizar la información contenida en el archivo, bien de un modo comple- to —bien de modo parcial—, examen de uno o más registros. Las operaciones de consulta de archivo deben contemplar diversos aspectos que faciliten la posibilidad de con- servación de datos. Los aspectos más interesantes a tener en cuenta son: • opción de visualización en pantalla o listado en impresora, • detención de la consulta a voluntad del usuario, • listado por registros o campos individuales o bien listado total del archivo (en este caso deberá existir la posi- bilidad de impresión de listados, con opciones de saltos de página correctos).
  • 358. 328 Fundamentos de programación 9.8.1. Operaciones sobre registros Las operaciones de transferencia de datos a/desde un dispositivo a la memoria central se realizan mediante las ins- trucciones: leer (var_tipo_archivo, lista de entrada de datos) escribir (var_tipo_archivo, lista de salida de datos) organización directa lista de entrada de datos = numero_registro, nombre_registro lista de salida de datos = numero_registro, nombre_registro organización secuencial lista de entrada de datos = lista_de_variables lista de salida de datos = lista_de_expresiones Las operaciones de acceso a un registro y de paso de un registro a otro se realiza con las acciones leer y es- cribir. 9.9. PROCESAMIENTO DE ARCHIVOS SECUENCIALES (ALGORITMOS) En un archivo secuencial los registros se insertan en el archivo en orden cronológico de llegada al soporte, es decir, un registro de datos se almacena inmediatamente a continuación del registro anterior. Los archivos secuenciales terminan con una marca final de archivo (FDA o EOF). Cuando se tengan que añadir registros a un archivo secuencial se añadirán al final, inmediatamente por delante de las marcas fin de archivos. Las operaciones básicas que se permiten en un archivo secuencial son: escribir su contenido, añadir un registro al final del archivo y consultar sus registros. Las demás operaciones exigen una programación específica. Los archivos secuenciales son los que ocupan menos memoria y son útiles cuando se desconoce a priori el tama- ño de los datos y se requieren registros de longitud variable. También son muy empleados para el almacenamiento de información, cuyos contenidos sufran pocas modificaciones en el transcurso de su vida útil. Es característico de los archivos secuenciales el no poder ser utilizados simultáneamente para lectura y escri- tura. 9.9.1. Creación La creación de un archivo secuencial es un proceso secuencial, ya que los registros se almacenan consecutivamente en el mismo orden en que se introducen en el archivo. El método de creación de un archivo consiste en la ejecución de un programa adecuado que permita la entrada de datos al archivo desde el terminal. El sistema usual es el interactivo, en el que el programa solicita los datos al usuario que los introduce por teclado, al terminar se introduce una marca final de archivo, que supone el final físico del archivo. En los archivos secuenciales, EOF o FDA es una función lógica que toma el valor cierto si se ha alcanzado el final de archivo y falso en caso contrario. La creación del archivo requerirá los siguientes pasos: • abrir el archivo, • leer datos del registro, • grabar registro, • cerrar archivo.
  • 359. Archivos (ficheros) 329 El algoritmo de creación es el siguiente: algoritmo crea_sec tipo registro: datos_personales tipo_dato1: nombre_campo1 tipo_dato2: nombre_campo2 ........................... fin_registro archivo_s de datos_personales: arch var arch :f datos_personales :persona inicio crear (f,nombre_en_disco) abrir (f,e,nombre_en_disco) leer_reg (persona) { utilizamos un procedimiento para no tener que detallar la lectura} mientras no ultimo_dato(persona) hacer escribir_f_reg (f,persona) //la escritura se realizará campo a campo leer_reg(persona) fin_mientras cerrar(f) fin Se considera que se permite la lectura y escritura en el archivo de los datos tal y como se almacenan en memoria. Un archivo de texto es un archivo secuencial en el que sólo se leen y escriben series de caracteres y no sería nece- sario especificar en la declaración del archivo el tipo de registros que lo constituyen, pues siempre son líneas. 9.9.2. Consulta El proceso de búsqueda o consulta de una información en un archivo de organización secuencial se debe efectuar obligatoriamente en modo secuencial. Por ejemplo, si se desea consultar la información contenida en el registro 50, se deberán leer previamente los 49 primeros registros que le preceden en orden secuencial. En el caso de un archivo de personal, si se desea buscar un registro determinado correspondiente a un determinado empleado, será necesario recorrer —leer— todo el archivo desde el principio hasta encontrar el registro que se busca o la marca final de ar- chivos. Así, para el caso de un archivo de n registros, el número de lecturas de registros efectuadas son: • mínimo 1, si el registro buscado es el primero del archivo, • máximo n, si el registro buscado es el último o no existe dentro del archivo. Por término medio, el número de lecturas necesarias para encontrar un determinado registro es: n + 1 —-— 2 El tiempo de acceso será influyente en las operaciones de lectura/escritura. Así, en el caso de una lista o vector de n elementos almacenados en memoria central puede suponer tiempos de microsegundos o nanosegundos; sin em- bargo, en el caso de un archivo de n registros los tiempos de acceso son de milisegundos o fracciones/múltiples de segundos, lo que supone un tiempo de acceso de 1.000 a 100.000 veces más grande una búsqueda de información en un soporte externo que en memoria central.
  • 360. 330 Fundamentos de programación El algoritmo de consulta de un archivo requerirá un diseño previo de la presentación de la estructura de registros en el dispositivo de salida, de acuerdo al número y longitud de los campos. algoritmo consulta_sec tipo registro: datos_personales tipo_dato1: nombre_campo1 tipo_dato2: nombre_campo2 ............: ............. fin_registro archivo_s de datos_personales: arch var arch: f datos_personales: persona inicio abrir(f,l,nombre_en_disco) mientras no fda(f)hacer leer_f_reg(f,persona) fin_mientras cerrar(f) fin o bien: inicio abrir(f,l,nombre_en_disco) leer_f_reg(f, persona) mientras no fda(f) hacer escribir_reg(persona) leer_f_reg(f,persona) fin_mientras cerrar(f) fin El uso de uno u otro algoritmo depende de cómo el lenguaje de programación detecta la marca de fin de archivo. En la mayor parte de los casos el algoritmo válido es el primero, pues la marca se detecta automáticamente con la lectura del último registro. En el caso de búsqueda de un determinado registro, con un campo clave x, el algoritmo de búsqueda se puede modificar en la siguiente forma con Consulta de un registro Si el archivo no está ordenado: algoritmo consultal_sec tipo registro: datos_personales tipo_dato1:nombre_campo1 tipo_dato2:nombre_campo2 ........... : ............ fin_registro archivo_s de datos_personales: arch var arch :f datos_personales:persona
  • 361. Archivos (ficheros) 331 tipo_dato1 :clavebus lógico :encontrado inicio abrir(f,l,nombre en_disco) encontrado ← falso leer(clavebus) mientras no encontrado y no fda(f) hacer leer_f_reg(f, persona) si igual(clavebus, persona) entonces encontrado ← verdad fin_si fin_mientras si no encontrado entonces escribir ('No existe') si_no escribir_reg(persona) fin_si cerrar(f) fin Si el archivo está indexado en orden creciente por el campo por el cual realizamos la búsqueda se podría acelerar el proceso, de forma que no sea necesario recorrer todo el fichero para averiguar que un determinado registro no está: algoritmo consulta2_sec tipo registro: datos_personales tipo_dato1: nombre_campo1 tipo_dato2: nombre_campo2 ............: ............. fin_registro archivo_s de datos_personales: arch var arch : f datos_personales: persona tipo_dato1 : clavebus lógico : encontrado, pasado inicio abrir(f,l,nombre_en_disco) encontrado ← falso pasado ← falso leer(clavebus) mientras no encontrado y no pasado y no fda(f) hacer leer_f_reg(f, persona) si igual(clavebus, persona) entonces encontrado ← verdad si_no si menor(clavebus, persona) entonces pasado ← verdad fin_si fin_si fin_mientras si no encontrado entonces escribir ('No existe')
  • 362. 332 Fundamentos de programación si_no escribir_reg(persona) fin_si cerrar(f) fin 9.9.3. Actualización La actualización de un archivo supone: • añadir nuevos registros (altas), • modificar registros ya existentes (modificaciones), • borrar registros (bajas). Altas La operación de dar de alta un determinado registro es similar a la operación de añadir datos a un archivo. algoritmo añade_sec tipo registro: datos_personales tipo_dato1: nombre_campo1 tipo_dato2: nombre_campo2 ...........:............. fin_registro archivo_s de datos_personales:arch var arch : f datos_personales: persona inicio abrir(f, e,nombre_en_disco) leer_reg(persona) mientras no ultimo_dato(persona) hacer escribir_f_reg (f,persona) leer_reg (persona) fin_mientras cerrar fin Bajas Existen dos métodos para dar de baja un registro: 1. Se utiliza un archivo transitorio. 2. Almacenar en un array (vector) todos los registros del archivo, señalando con un indicador o bandera (flag) el registro que se desea dar de baja. Método 1 Se crea un segundo archivo auxiliar, también secuencial, copia del que se trata de actualizar. Se lee el archivo com- pleto registro a registro y en función de su lectura se decide si el registro se debe dar de baja o no. Si el registro se va a dar de baja, se omite la escritura en el archivo auxiliar o transitorio. Si el registro no se va a dar de baja, este registro se escribe en el archivo auxiliar.
  • 363. Archivos (ficheros) 333 Tras terminar la lectura del archivo original, se tendrán dos archivos: original (o maestro) y auxiliar. Archivo auxiliar Actualización Archivo original El proceso de bajas del archivo concluye cambiando el nombre del archivo auxiliar por el de maestro y borrando previamente el archivo maestro original. algoritmo bajas_s tipo registro: datos_personales tipo_dato1: nombre_campo1 tipo_dato2: nombre_campo2 ............:.............. fin_registro archivo_s de datos_peersonales:arch var arch :f, faux datos_personales: persona, personaaux lógico :encontrado inicio abrir(f,l, 'antiguo') crear(faux, 'nuevo') abrir(faux, e, 'nuevo') leer(personaaux.nombre_campo1) encontrado ← falso mientras no fda (f) hacer leer_f_reg (f, persona) si personaaux.nombre_campo1 = persona.nombre_campo1 entonces encontrado ← verdad si_no escribir_f_reg (faux, persona) fin_si fin_mientras si no encontrado entonces escribir ('no esta') fin_si cerrar (f, faux) borrar ('antiguo') renombrar ('nuevo', 'antiguo') fin Método 2 Este procedimiento consiste en señalar los registros que se desean dar de baja con un indicador o bandera; estos re- gistros no se graban en el nuevo archivo secuencial que se crea sin los registros dados de baja. Modificaciones El proceso de modificación de un registro consiste en localizar este registro, efectuar dicha modificación y a conti- nuación reescribir el nuevo registro en el archivo. El proceso es similar al de bajas:
  • 364. 334 Fundamentos de programación algoritmo modificacion_sec tipo registro: datos_personales tipo_dato1: nombre_campo1 tipo_dato2: nombre_campo2 ............:............. fin archivo_s de datos_personales: arch var arch : f, faux datos_personales: persona, personaaux lógico : encontrado inicio abrir(f, l, 'antiguo') crear(faux, 'nuevo') abrir(faux, e, 'nuevo') leer(personaaux.nombre_campo1) encontrado ← falso mientras_no fda(f) hacer leer_f_reg (f, persona) si personaaux.nombre_campo1=persona.nombre_campo1 entonces encontrado ← verdad modificar (persona) fin_si escribir_f_reg (faux, persona) fin_mientras si no encontrado entonces escribir ('no esta') fin_si cerrar(f, faux) borrar('antiguo') renombrar ('nuevo', 'antiguo') fin El subprograma de modificación de su registro consta de unas pocas instrucciones en las que se debe introducir por teclado el registro completo con indicación de todos sus campos o, por el contrario, el campo o campos que se desea modificar. El subprograma en cuestión podría ser: procedimiento modificar(E/S datos_personales: persona) var carácter: opcion entero : n inicio escribir('R.- registro completo) escribir('C.- campos individuales') escribir('elija opcion:') leer(opcion) según_sea opcion hacer 'R' visualizar(persona) leer_reg(persona) 'C' presentar(persona) solicitar_campo(n) introducir_campo(n, persona) fin_según fin_procedimiento
  • 365. Archivos (ficheros) 335 9.10. PROCESAMIENTO DE ARCHIVOS DIRECTOS (ALGORITMOS) Se dice que un archivo es aleatorio o directo cuando cualquier registro es directamente accesible mediante la especi- ficación de un índice, que da la posición del registro con respecto al origen del fichero. Los archivos aleatorios o directos tienen una gran rapidez para el acceso comparados con los secuenciales; los registros son fáciles de referen- ciar —número de orden del registro—, lo que representa una gran facilidad de mantenimiento. La lectura/escritura de un registro es rápida, ya que se accede directamente al registro y no se necesita recorrer los anteriores. 9.10.1. Operaciones con archivos directos Las operaciones con archivos directos son las usuales, ya vistas anteriormente. Creación El proceso de creación de un archivo directo o aleatorio consiste en ir introduciendo los sucesivos registros en el soporte que los va a contener y en la dirección obtenida, resultante del algoritmo de conversión. Si al introducir un registro se encuentra ocupada la dirección, el nuevo registro deberá ir a la zona de sinónimos o de excedentes. algoritmo crea_dir tipo registro: datos_personales tipo_dato1 : nombre_campo1 ........... : ............ tipo_datoN : nombre_campoN ........... : ............. fin_registro archivo_d de datos_personales: arch var arch : f datos_personales : persona inicio crear(f,nombre_en_disco) abrir(f,l/e,nombre_en_disco) .......................... { las operaciones pueden variar con arreglo al modo como pensemos trabajar posteriormente con el archivo (posicionamiento directo en un determinado registro, transformación de clave, indexación) } .......................... cerrar(f) fin En los registros de un archivo directo se suele incluir un campo —ocupado— que pueda servir para distinguir un registro dado de baja o modificado de un alta o de otro que nunca contuvo información. Dentro del proceso de creación del archivo podríamos considerar una inicialización de dicho campo en cada uno de los registros del archivo directo. algoritmo crea_dir const max = valor tipo registro: datos_personales tipo_dato1: cod
  • 366. 336 Fundamentos de programación tipo_dato2: ocupado ........... : ............. tipo_daton: nombre_campon ........... : ............. fin_registro archivo_d de datos_personales: arch var arch : f datos_personales : persona inicio crear(f,nombre_en_disco) abrir(f,l/e,nombre_en_disco) desde i ← 1 hasta Max hacer persona.ocupado ← ' ' escribir(f, i, persona) fin_desde cerrar(f) fin Altas La operación de altas en un archivo directo o aleatorio consiste en ir introduciendo los sucesivos registros en una determinada posición, especificada a través del índice. Mediante el índice nos posicionaremos directamente sobre el byte del fichero que se encuentra en la posición (indice - 1) * tamaño_de(tipo_registros_del_ar- chivo) y escribiremos allí nuestro registro. Tratamiento por transformación de clave El método de transformación de clave consiste en transformar un número de orden (clave) en direcciones de alma- cenamiento por medio de un algoritmo de conversión. Cuando las altas se realizan por el método de transformación de clave, la dirección donde introducir un determi- nado registro se conseguirá por la aplicación a la clave del algoritmo de conversión (HASH). Si encontráramos que dicha dirección ya está ocupada, el nuevo registro deberá ir a la zona de sinónimos o de excedentes. algoritmo altas_dir_trcl const findatos = valor1 max = valor2 tipo registro: datos_personales tipo_dato1: cod tipo_dato2: ocupado ........... : ............ tipo_daton: nombre_campon ........... : ............. fin_registro archivo_d de datos_personales: arch var arch : f datos_personales : persona, personaaux lógico : encontradohueco entero : posi inicio abrir(f,l/e,nombre_en_disco) leer(personaaux.cod) posi ← HASH(personaaux.cod)
  • 367. Archivos (ficheros) 337 leer(f, posi, persona) si persona.ocupado = '*' entonces encontradohueco ← falso posi ← findatos mientras posi Max y no encontradohueco hacer posi ← posi + 1 leer(f, posi, persona) si persona.ocupado '*' entonces encontradohueco ← verdad fin_si fin_mientras si_no encontradohueco ← verdad fin_si si encontradohueco entonces leer_otros_campos(personaaux) persona ← personaaux persona.ocupado ← '*' escribir(f, posi, persona) si_no escribir('no está') fin_si cerrar(f) fin Consulta El proceso de consulta de un archivo directo o aleatorio es rápido y debe comenzar con la entrada del índice corres- pondiente al registro que deseamos consultar. El índice permitirá el posicionamiento directo sobre el byte del fichero que se encuentra en la posición (indice - 1) * tamaño_de(var_de_tipo_registros_del_fichero) algoritmo consultas_dir const max = valor1 tipo registro: datos_personales {Cuando el código coincide con el índice o posición del registro en el archivo, no resulta necesario su almacenamiento } tipo_dato1: ocupado ........... : ............ tipo_daton: nombre_campon ........... : ............. fin_registro archivo_d de datos_personales: arch var arch : f datos_personales : persona lógico : encontrado entero : posi inicio abrir(f,l/e,nombre_en_disco) leer(posi)
  • 368. 338 Fundamentos de programación si (posi =1) y (posi = Max) entonces leer(f, posi, persona) {como al escribir los datos marcamos el campo ocupado con * } si persona.ocupado '*' entonces {para tener garantías en esta operación es por lo que debemos inicializar en todos los registros, durante el proceso de creación, el campo ocupado a un determinado valor, distinto de *} encontrado ← falso si_no encontrado ← verdad fin_si si encontrado entonces escribir_reg(persona) si_no escribir('no está') fin_si si_no escribir('Número de registro incorrecto') fin_si cerrar(f) fin Consulta. Por transformación de clave Puede ocurrir que la clave o código por el que deseamos acceder a un determinado registro no coincida con la posi- ción de dicho registro en el archivo, aunque guarden entre sí una cierta relación, pues al escribir los registros en el archivo la posición se obtuvo aplicando a la clave un algoritmo de conversión. En este caso es imprescindible el almacenamiento de la clave en uno de los campos del registro y las operaciones a realizar para llevar a cabo una consulta serían: — Definir clave del registro buscado. — Aplicar algoritmo de conversión clave a dirección. — Lectura del registro ubicado en la dirección obtenida. — Comparación de las claves de los registros leído y buscado y, si son distintas, exploración secuencial del área de excedentes. — Si tampoco se encuentra el registro en este área es que no existe. algoritmo consultas_dir_trcl const findatos = valor1 max = valor2 tipo registro: datos_personales tipo_dato1: cod tipo_dato2: ocupado ........... : ............ tipo_daton: nombre_campon ........... : ............. fin_registro archivo_d de datos_personales: arch var arch : f datos_personales : persona, personaaux
  • 369. Archivos (ficheros) 339 lógico : encontrado entero : posi inicio abrir(f,l/e,nombre_en_disco) leer(personaaux.cod) posi ← HASH(personaaux.cod) leer(f, posi, persona) si (persona.ocupado '*') o (persona.cod personaaux.cod) entonces encontrado ← falso posi ← Findatos mientras (posi Max ) y no encontrado hacer posi ← posi + 1 leer(f, posi, persona) si (persona.ocupado = '*' )y (persona.cod = personaaux.cod) entonces encontrado ← verdad fin_si fin_mientras si_no encontrado ← verdad fin_si si encontrado entonces escribir_reg(persona) si_no escribir('No está') fin_si cerrar(f) fin Bajas En el proceso de bajas se considera el contenido de un campo indicador, por ejemplo, persona.ocupado, que, cuando existe información válida en el registro está marcado con un *. Para dar de baja al registro, es decir, consi- derar su información como no válida, eliminaremos dicho *. Este tipo de baja es una baja lógica. Desarrollaremos a continuación un algoritmo que realice bajas lógicas y acceda a los registros a los que se desea dar la baja por el método de transformación de clave. algoritmo bajas_dir_trcl const findatos = valor1 max = valor2 tipo registro: datos_personales tipo_dato1: cod tipo_dato2: ocupado ........... : ............ tipo_daton: nombre_campon ........... : ............. fin_registro archivo_d de datos_personales: arch var arch : f datos_personales : persona, personaaux lógico : encontrado entero : posi
  • 370. 340 Fundamentos de programación inicio abrir(f,l/e,nombre_en_disco) leer(personaaux.cod) posi ← HASH(personaaux.cod) leer(f, posi, persona) si (persona.ocupado '*') o (persona.cod personaaux.cod) entonces encontrado ← falso posi ← findatos mientras (posi Max) y no encontrado hacer posi ← posi + 1 leer(f, posi, persona) si (persona.ocupado='*') y (persona.cod = personaaux.cod) entonces encontrado ← verdad fin_si fin_mientras si_no encontrado ← verdad fin_si si encontrado entonces persona.ocupado ← ' ' escribir(f, posi, persona) si_no escribir('No está') fin_si cerrar(f) fin Modificaciones En un archivo aleatorio se localiza el registro que se desea modificar —mediante la especificación del índice o apli- cando el algoritmo de conversión clave a dirección y, en caso necesario, la búsqueda en la zona de colisiones— se modifica el contenido y se reescribe. algoritmo modificaciones_dir_trcl const findatos = valor1 max = valor2 tipo registro: datos_personales tipo_dato1: cod tipo_dato2: ocupado ........... : ............ tipo_daton: nombre_campon ........... : ............. fin_registro archivo_d de datos_personales: arch var arch : f datos_personales : persona, personaaux lógico : encontrado entero : posi inicio abrir(f,l/e,nombre_en_disco) leer(personaaux.cod)
  • 371. Archivos (ficheros) 341 posi ← HASH(personaaux.cod) leer(f, posi, persona) if (persona.ocupado '*') o (persona.cod personaaux.cod) entonces encontrado ← falso posi ← findatos mientras posi max y no encontrado hacer posi ← posi + 1 leer(f, posi, persona) si (persona.ocupado = '*') y (persona.cod = personaaux.cod) entonces encontrado ← verdad fin_si fin_mientras si_no encontrado ← verdad fin_si si encontrado entonces leer_otros_campos(personaaux) personaaux.ocupado ← '*' escribir(f, posi, personaaux) si_no escribir('no está') fin_si cerrar(f) fin 9.10.2. Clave-dirección Con respecto a las transformaciones clave-dirección deberemos realizar aún algunas consideraciones. En un soporte direccionable —normalmente un disco—, cada posición se localiza por su dirección absoluta —núme- ro de pista y número de sector en el disco—. Los archivos directos manipulan direcciones relativas en lugar de absolutas, lo que hará al programa independiente de la posición absoluta del archivo en el soporte. Los algoritmos de conversión de clave transformarán las claves en direcciones relativas. Suponiendo que existen N posiciones disponibles para el archi- vo, los algoritmos de conversión de clave producirán una dirección relativa en el rango 1 a N por cada valor de la clave. Existen varias técnicas para obtener direcciones relativas. En el caso en que dos registros distintos produzcan la misma dirección, se dice que se produce una colisión o sinónimo. 9.10.3. Tratamiento de las colisiones Las colisiones son inevitables y, como se ha comentado, se originan cuando dos registros de claves diferentes pro- ducen la misma dirección relativa. En estos casos las colisiones se pueden tratar de dos formas diferentes. Supongamos que un registro e1 produce una dirección d1 que ya está ocupada. ¿Dónde colocar el nuevo registro? Existen dos métodos básicos: • Considerar una zona de excedentes y asignar el registro a la primera posición libre en dicha zona. Fue el méto- do aplicado en los algoritmos anteriores. • Buscar una nueva dirección libre en la zona de datos del archivo. 9.10.4. Acceso a los archivos directos mediante indexación La indexación es una técnica para el acceso a los registros de un archivo. En esta técnica el archivo principal de re- gistros está suplementado por uno o más índices. Los índices pueden ser archivos independientes o un array que se
  • 372. 342 Fundamentos de programación carga al comenzar en la memoria del ordenador, en ambos casos estarán formados por registros con los campos có- digo o clave y posición o número de registro. El almacenamiento de los índices en memoria permite encontrar los registros más rápidamente que cuando se trabaja en disco. Cuando se utiliza un archivo indexado se localizan los registros en el índice a través del campo clave y éste re- torna la posición del registro en el archivo principal, directo. Las operaciones básicas a realizar con un archivo indexado son: — Crear las zonas de índice y datos como archivos vacíos originales. — Cargar el archivo índice en memoria antes de utilizarlo. — Reescribir el archivo índice desde memoria después de utilizarlo. — Añadir registros al archivo de datos y al índice. — Borrar registros. — Actualizar registros en el archivo de datos. Consulta Como ejemplo veamos la operación de consulta de un registro algoritmo consulta_dir_ind const max = valor tipo registro: datos_personales tipo_dato1: cod tipo_dato2: nombre_campo2 ........... : ............ tipo_daton: nombre_campon ........... : ............. fin_registro registro: datos_indice tipo_dato1: cod entero : posi fin_registro archivo_d de datos_personales: arch archivo_d de datos_indice : ind array[1..max] de datos_indice: arr var arch : f ind : t arr : a datos_personales : persona entero : i, n, central tipo_dato1 : cod lógico : encontrado inicio abrir(f,l/e,nombre_en_disco1) abrir(t,l/e,nombre_en_disco2) n ← LDA(t)/tamaño_de(datos_indice) desde i ← 1 hasta n hacer leer(t,i,a[i]) fin_desde cerrar(t) {Debido a la forma de efectuar las altas el archivo índice siempre tiene sus registros ordenados por el campo cod } leer(cod) busqueda_binaria(a, n, cod, central, encontrado)
  • 373. Archivos (ficheros) 343 { el procedimiento de búsqueda_binaria en un array será desarrollado en capítulos posteriores del libro} si encontrado entonces leer(f, a[central].posi, persona) escribir_reg(persona) si_no escribir('no está') fin_si cerrar(f) fin Altas El procedimiento empleado para dar las altas en el archivo anterior podría ser el siguiente: procedimiento altas(E/S arr: a E/S entero: n) var reg : persona entero : p lógico : encontrado entero : num inicio si n = max entonces escribir('lleno') si_no leer_reg(persona) encontrado ← falso busqueda_binaria(a, n, persona.cod, p, encontrado) si encontrado entonces escribir('Clave duplicada') si_no num ← LDA(f)/tamaño_de(datos_personales) + 1 {Insertamos un nuevo registro en la tabla sin que pierda su ordenación } alta_indice(a, n, p, persona.cod, num) n ← n + 1 {Escribimos el nuevo registro al final del archivo principal } escribir(f, num, persona) fin_si fin_si { en el programa principal, al terminar, crearemos de nuevo el archivo índice a partir de los registros almacenados en el array a } fin_procedimiento 9.11. PROCESAMIENTO DE ARCHIVOS SECUENCIALES INDEXADOS Los archivos de organización secuencial indexada contienen tres áreas: un área de datos que agrupa a los registros, un área índice que contiene los niveles de índice y una zona de desbordamiento o excedentes para el caso de actua- lizaciones con adición de nuevos registros. Los registros han de ser grabados obligatoriamente en orden secuencial ascendente por el contenido del campo clave y, simultáneamente a la grabación de los registros, el sistema crea los índices. Una consideración adicional con respecto a este tipo de organización es que es posible usar más de una clave, hablaríamos así de la clave primaria y de una o más secundarias. El valor de la clave primaria es la base para la po-
  • 374. 344 Fundamentos de programación sición física de los registros en el archivo y debe ser única. Las claves secundarias pueden ser o no únicas y no afec- tan al orden físico de los registros. 9.12. TIPOS DE ARCHIVOS: CONSIDERACIONES PRÁCTICAS EN C/C++ Y JAVA Los archivos se pueden clasificar en función de determinadas características. Entre ellas las más usuales son: por el tipo de acceso o por la estructura de la información del archivo. Dirección del flujo de datos Los archivos se clasifican en función del flujo de los datos o por el modo de acceso a los datos del archivo. En fun- ción de la dirección del flujo de los datos son de: • Entrada. Aquellos cuyos datos se leen por parte del programa (archivos de lectura). • Salida. Archivos que escribe el programa (archivos de escritura). • Entrada/Salida. Archivos en los que se puede leer y escribir. La determinación del tipo de archivo se realiza en el momento de la creación del archivo. Tipos de acceso Los archivos se clasifican en: • Secuenciales. El orden de acceso a los datos es secuencial; primero se accede al primer elemento, luego al segundo y así sucesivamente. • Directos (aleatorios). El acceso a un elemento concreto del archivo es directo. Son similares a las tablas. Estructura de la información Los archivos guardan información en formato binario y se distribuye en una secuencia o flujo de bytes. Teniendo en cuenta la información almacenada los archivos se clasifican en: • Texto. En estos archivos se guardan solamente ciertos caracteres imprimibles, tales como letras, números y signos de puntuación, salto de línea, etc. Están permitidos ciertos rangos de valores para cada byte. En un archi- vo de texto no está permitido el byte de final de archivo y si existe no se puede ver más allá de la posición donde está el byte. • Binarios. Contienen cualquier valor que se pueda almacenar en un byte. El tipo de información almacenada en los archivos se define a la hora de abrirlos (para lectura, escritura). Con posterioridad, cada operación leerá los bytes correspondientes al tipo de datos. Un archivo de texto es un caso particular de archivo de organización secuencial y es una serie continua de carac- teres que se pueden leer uno tras otro. Cada registro de un archivo de texto es del tipo de cadena de caracteres. El tratamiento de archivos de texto es elemental y en el caso de lenguajes como Pascal es posible detectar lectu- ras de caracteres especiales como final de archivo o final de línea. 9.12.1. Archivos de texto Los archivos de texto también se denominan archivos ASCII y son legibles por los usuarios o programadores. Los terminales, los teclados y las impresoras tratan con datos carácter. Así, cuando se desea escribir un número como “1234” en la pantalla se debe convertir a cuatro caracteres (“1”, “2”, “3”, “4”) y ser escritos en el terminal.
  • 375. Archivos (ficheros) 345 De modo similar cuando se lee un número de teclado, los datos se deben convertir de caracteres a enteros. En el caso del lenguaje C++ esta operación se realiza con el operador . Las computadoras trabajan con datos binarios. Cuando se leen números de un archivo ASCII, el programa debe procesar los datos carácter a través de una rutina de conversión, lo que entraña grandes recursos. Los archivos binarios, por el contrario, no requieren conversión e inclu- so ocupan menos espacio que los archivos ASCII; su gran inconveniente es que los archivos binarios no se pueden imprimir directamente en una impresora ni visualizar en un terminal. Los archivos ASCII son portables (en la mayoría de los casos) y se pueden mover de una computadora a otra sin grandes problemas. Sin embargo, los archivos binarios son prácticamente no portables; a menos que sea un progra- mador experto es casi imposible hacer portable un archivo binario. 9.12.2. Archivos binarios Los archivos binarios contienen cualquier valor que se puede almacenar en un byte. En estos archivos el final del archivo no se almacena como un byte concreto. Los archivos binarios se escriben copiando una imagen del conteni- do de un segmento de la memoria al disco y por consiguiente los valores numéricos aparecen como unos caracteres extraños que se corresponden con la codificación de dichos valores en la memoria de la computadora, aunque apa- rentemente son prácticamente indescifrables para el programador o el usuario. Cuando se intenta abrir un archivo binario con el editor aparecerán secuencias de caracteres tales como: E#@%Âa^^... ¿Cuál es el archivo más recomendable para utilizar? En la mayoría de los casos, el ASCII es el mejor. Si se tienen pequeñas a medianas cantidades de datos el tiempo de conversión no afecta seriamente a su programa. Por otra parte los archivos ASCII también facilitan la verificación de los datos. Por el contrario, sólo cuando se utilizan grandes cantidades de datos los problemas de espacio y rendimiento, normalmente, aconsejarán utilizar formatos binarios. Los archivos de texto se suelen denominar con la extensión .txt, mientras que los archivos binarios suelen tener la extensión .dat. Los archivos de texto son muy eficientes para intercambiar datos entre aplicaciones y para pro- porcionar datos de entrada de programas que se deban ejecutar varias veces; por el contrario, son poco eficientes para manejar grandes volúmenes de información o bases de datos. Por otra parte, todos los archivos binarios permiten acceso directo, lo cual es muy útil para manejar grandes archivos o bases de datos, ya que se puede ir directamente a leer el registro n sin tener que leer antes el primero, el segundo,…, el n – 1 registros anteriores 9.12.3. Lectura y escritura de archivos Las operaciones típicas sobre un archivo son: creación, lectura y escritura. En el caso de C++ los archivos se mani- pulan mediante un tipo de objeto flujo. Normalmente los objetos que se usan para tratar con archivos se llaman ar- chivos lógicos y archivos físicos son aquellos que almacenan realmente la información en disco (o dispositivos de memoria secundaria correspondiente: disco duro, discos ópticos, memorias flash, etc.). En el caso del lenguaje C++, para todas las operaciones con archivo se necesita utilizar la biblioteca de cabecera fstream.h por lo que es preciso que los programas inserten la sentencia #include fstream.h o bien en el caso de ANSI C++ estándar #include fstream using namespace std; En general, todo tratamiento de un archivo consta de tres pasos importantes: • Apertura del archivo. El modo de implementar la operación dependerá de si un archivo es de lectura o escritura. • Acceso al archivo. En esta etapa se llega o imprimen los datos. • Cierre del archivo. Actualiza el archivo y se elimina la información no significativa.
  • 376. 346 Fundamentos de programación ACTIVIDADES DE PROGRAMACIÓN RESUELTAS 9.1. Escribir un algoritmo que permita la creación e introducción de los primeros datos en un archivo secuencial, PER- SONAL, que deseamos almacene la información mediante registros de siguiente tipo. tipo registro: datos_personales tipo_dato1 : nombre_campo1 tipo_dato2 : nombre_campo2 ............ : ............. fin_registro Análisis del problema Tras la creación y apertura en modo conveniente del archivo, el algoritmo solicitará la introducción de datos por teclado y los almacenará de forma consecutiva en el archivo. Se utilizará una función, ultimo_dato(persona), para determinar el fin en la introducción de datos. Diseño del algoritmo algoritmo Ejercicio_9_1 tipo registro: datos_personales tipo_dato1 : nombre_campo1 tipo_dato2 : nombre_campo2 ............ : ............. fin_registro archivo_s de datos_personales: arch var arch : f datos_personales : persona inicio crear (f, 'Personal') abrir (f,e,'Personal') llamar_a leer_reg (persona) // Procedimiento para la lectura de un // registro campo a campo mientras no ultimo_dato(persona) hacer llamar_a escribir_f_reg (f, persona) // Procedimiento auxiliar, no desarrollado, para la // escritura en el archivo del registro campo a campo llamar_a leer_reg(persona) fin_mientras cerrar (f) fin 9.2. Supuesto que deseamos añadir nueva información al archivo PERSONAL, anteriormente creado, diseñar el algoritmo correspondiente. Análisis del problema Al abrir el archivo, para escritura se coloca el puntero de datos al final del mismo, permitiéndonos, con un algoritmo simi- lar al anterior, la adición de nueva información al final del mismo. Diseño del algoritmo algoritmo Ejercicio_9_2 tipo registro: datos_personales tipo_dato1 : nombre_campo1
  • 377. Archivos (ficheros) 347 tipo_dato2 : nombre_campo2 ............ : ............. fin_registro archivo_s de datos_personales: arch var arch : f datos_personales : persona inicio abrir (f,e,'PERSONAL') llamar_a leer_reg (persona) mientras no ultimo_dato (persona) hacer llamar_a escribir_f_reg (f, persona) llamar_a leer_reg (persona) fin_mientras cerrar (f) fin 9.3. Diseñar un algoritmo que muestre por pantalla el contenido de todos los registros del archivo PERSONAL. Análisis del problema Se debe abrir el archivo para lectura y, repetitivamente, leer los registros y mostrarlos por pantalla hasta detectar el fin de fichero. Se considera que la función FDA(id_arch) detecta el final de archivo con la lectura de su último registro. Diseño del algoritmo algoritmo Ejercicio_9_3 tipo registro: datos_personales tipo_dato1: nombre_campo1 tipo_dato2: nombre_campo2 ............: ............. fin_registro archivo_s de datos_personales: arch var arch : f datos_personales : persona inicio abrir (f,l,'PERSONAL') mientras no fda (f) hacer llamar_a leer_f_reg (f, persona) llamar_a escribir_reg (persona) fin_mientras cerrar (f) fin Si se considera la existencia de un registro especial que marca el fin de archivo, la función FDA(id_arch) se activaría al leer este registro y es necesario modificar algo nuestro algoritmo. inicio abrir (f,l,'PERSONAL') llamar_a leer_f_reg (f, persona) mientras no fda (f) hacer llamar_a escribir_reg (persona) llamar_a leer_f_reg (f, persona) fin_mientras cerrar (f) fin
  • 378. 348 Fundamentos de programación 9.4. Una librería almacena en un archivo secuencial la siguiente información sobre cada uno de sus libros: CODIGO, TI- TULO, AUTOR y PRECIO. El archivo está ordenado ascendentemente por los códigos de los libros —de tipo cadena—, que no pueden re- petirse. Se precisa un algoritmo con las opciones: 1. Insertar: Permitirá insertar nuevos registros en el archivo, que debe mantenerse ordenado en todo mo- mento. 2. Consulta: Buscará registros por el campo CODIGO. Análisis del problema El algoritmo comenzará presentando un menú de opciones a través del cual se haga posible la selección de un procedimien- to u otro. Insertar: Para poder colocar el nuevo registro en el lugar adecuado, sin que se pierda la ordenación inicial, se necesita utilizar un archivo auxiliar. En dicho auxiliar se van copiando los registros hasta llegar al punto donde debe colocarse el nuevo, entonces se escribe y continua con la copia de los restantes registros. Consulta: Como el archivo está ordenado y los códigos no repetidos, el proceso de consulta se puede acelerar. Se recorre el archivo de forma secuencial hasta encontrar el código buscado, o hasta que éste sea menor que el código del registro que se acaba de leer desde el archivo, o bien, si nada de esto ocurre, hasta el fin del archivo. Cuando el código buscado es menor que el código del registro que se acaba de leer desde el archivo, se puede deducir que de ahí en adelante ese registro ya no podrá estar en el fichero, por tanto, se puede abandonar la búsqueda. Diseño del algoritmo algoritmo Ejercicio_9_4 tipo registro : reg cadena : cod cadena : titulo cadena : autor entero : precio fin_registro archivo_s de reg : arch var entero : op inicio repetir escribir( 'MENU') escribir( '1.- INSERTAR') escribir( '2.- CONSULTA') escribir( '3.- FIN') escribir( 'Elija opcion ') leer (op ) según_sea op hacer 1 : llamar_a insertar 2 : llamar_a consulta fin_según hasta_que op = 3 fin procedimiento insertar var arch : f, f2 reg : rf,r
  • 379. Archivos (ficheros) 349 lógico : escrito carácter : resp inicio repetir abrir (f,1,'Libros.dat') crear (f2, 'Nlibros.dat') abrir (f2,e, 'Nlibros.dat') escribir ('Deme el codigo') leer (r.cod) escrito ← falso mientras no FDA(f) hacer llamar_a leer_arch_reg ( f, rf) si rf.cod r.cod y no escrito entonces // si se lee del archivo un registro con codigo // mayor que el nuevo y este aun no se // ha escrito, es el momento de insertarlo escribir( 'Deme otros campos ') llamar_a completar ( r ) llamar_a escribir_arch_reg ( f2, r ) escrito ← verdad // Se debe marcar que se ha escrito // para que no siga insertandose, desde aqui // en adelante si_no si rf.cod = r.cod entonces escrito ← verdad fin_si fin_si llamar_a escribir_arch_reg ( f2, rf ) // De todas formas se escribe el que // se lee del archivo fin_mientras si no escrito entonces // Si el codigo del nuevo es mayor que todos los del // archivo inicial, se llega al final sin haberlo // escrito escribir ('Deme otros campos') llamar_a completar (r) llamar_a escribir_arch_reg ( f2, r ) fin_si cerrar (f, f2) borrar ( 'Libros.dat') renombrar ('Libros.dat', 'Libros.dat') escribir ('¿Seguir? (s/n) ') leer ( resp ) hasta_que resp = 'n' fin_procedimiento procedimiento consulta var reg: rf, r arch: f carácter: resp lógico: encontrado, pasado inicio resp ← 's' mientras resp 'n' hacer abrir (f, 1, 'Libros.dat') escribir ('Deme el codigo a buscar ')
  • 380. 350 Fundamentos de programación leer ( r.cod) encontrado ← falso pasado ← falso mientras no FDA (f) y no encontrado y no pasado hacer llamar_a leer_arch_reg (f, rf) si r.cod = rf.cod entonces encontrado ← verdad llamar_a escribir_reg ( rf ) si_no si r.cod rf.cod entonces pasado ← verdad fin_si fin_si fin_mientras si no encontrado entonces escribir ( 'Ese libro no esta') fin_si cerrar (f) escribir ('¿Seguir? (s/n)') leer ( resp ) fin_mientras fin_procedimiento 9.5. Diseñar un algoritmo que efectúe la creación de un archivo directo —PERSONAL—, cuyos registros serán del siguien- te tipo: tipo registro: datos_personales tipo_dato1 : cod // Campo clave ........... : ............. tipo_datoN : nombre_campoN fin_registro y en el que, posteriormente, vamos a introducir la información empleando el método de transformación de clave. Análisis del problema El método de transformación de claves consiste en introducir los registros, en el soporte que los va a contener, en la direc- ción que proporciona el algoritmo de conversión. Su utilización obliga al almacenamiento del código en el propio registro y hace conveniente la inclusión en el registro de un campo auxiliar —ocupado— en el que se marque si el registro está o no ocupado. Durante el proceso de creación se debe realizar un recorrido de todo el archivo inicializando el campo ocupa- do a vacío, por ejemplo, a espacio. Diseño del algoritmo algoritmo Ejercicio_9_5 const Max = valor tipo registro: datos_personales tipo_dato1 : cod // Podria no ser necesario // su almacenamiento, en el caso // de que coincidiera con el // indice ............ : ............. tipo_daton : nombre_campon fin_registro archivo_d de datos_personales: arch
  • 381. Archivos (ficheros) 351 var arch : f datos personales : persona entero : i inicio crear (f, 'PERSONAL') abrir (f,1/e, 'PERSONAL') desde i ← 1 hasta Max hacer persona.ocupado escribir (f, persona, i) fin_desde cerrar (f) fin 9.6. Se desea introducir información, por el método de transformación de clave, en el archivo PERSONAL creado en el ejercicio anterior, diseñar el algoritmo correspondiente. Análisis del problema Como anteriormente se ha explicado, el método de transformación de claves consiste en introducir los registros, en el so- porte que los va a contener, en la dirección que proporciona el algoritmo de conversión. A veces, registros distintos, sometidos al algoritmo de conversión, proporcionan una misma dirección, por lo que se debe tener previsto un espacio en el disco para el almacenamiento de los registros que han consolidado. Aunque se puede hacer de diferentes maneras, en este caso se reserva espacio para las colisiones en el propio fichero a continuación de la zona de datos. Se supone que la dirección más alta capaz de proporcionar el algoritmo de conversión es Findatos y se colocan las colisiones que se produzcan a partir de allí en posiciones consecutivas del archivo. La inicialización a espacio del campo ocupado se realiza hasta Max, dando por supuesto que Max es mayor que Fin- datos. Diseño del algoritmo algoritmo Ejercicio_9_6 const Findatos = valor1 Max = valor2 tipo registro: datos_peronales tipo_dato1 : cod // Podría no ser necesario // su almacenamiento, en el caso // de que coincidiera con el // indice ............ : ............. tipo_daton : nombre_campon fin_registro archivo_d de datos_personales: arch var arch : f datos personales : persona, personaaux lógico : encontradohueco entero : i inicio abrir (f,1/e, 'PERSONAL') leer (personaaux.cod) posi ← HASH (personaaux.cod) // HASH es el nombre de la funcion de transformacion de // claves. La cual devolvera valores // entre 1 y Findatos, ambos inclusive
  • 382. 352 Fundamentos de programación leer(f, persona, posi) si persona.ocupado ='*' entonces //El '*' indica que esta //ocupado encontradohueco ← falso posi ← Findatos mientras posi Max y no encontradohueco hacer posi ← posi + 1 leer(f, persona, posi) si persona.ocupado '*' entonces encontradohueco ← verdad fin_si fin_mientras si_no encontradohueco ← verdad fin_si si encontradohueco entonces llamar_a leer_otros_campos (personaaux) persona ← personaaux persona.ocupado ← '*' //Al dar un alta marcaremos //el campo ocupado escribir(f, persona, posi) si_no escribir ('No esta') fin_si cerrar (f) fin CONCEPTOS CLAVE • Archivos de texto. • Concepto de flujo. • Organización de archivos. • Organización directa • Organización secuencial. • Organización secuencial indexada. • Registro físico. • Registro lógico. RESUMEN Un archivo de datos es un conjunto de datos relacionados entre sí y almacenados en un dispositivo de almacenamien- to externo. Estos datos se encuentran estructurados en una colección de entidades denominadas artículos o registros, de igual tipo, y que constan a su vez de diferentes entidades de nivel más bajo denominadas campos. Un archivo de texto es el que está formado por líneas, constituidas a su vez por una serie de caracteres, que podrían representar los registros en este tipo de archivos. Por otra parte, los archivos pueden ser binarios y almacenar no sólo caracteres sino cualquier tipo de información tal y como se encuentra en memoria. 1. Java y C# realizan las operaciones en archivos a través de flujos, manipulados por clases, que co- nectan con el medio de almacenamiento. De forma que para crear, leer o escribir un archivo se requiere utilizar una clase que defina la funcionalidad del flujo. Los flujos determinan el sentido de la comunicación (lectura, escritura o lectura/escritura), el posicionamiento directo o no en un determinado registro y la forma de leer y/o escribir en el archivo. Pueden utilizarse flujos de bytes cadenas o tipos primitivos. La personalización de flujos se consigue por asociación o encadenamiento de otros flujos con los flujos base de apertura de archivos. 2. Registro lógico es una colección de información relativa a una entidad particular. El concepto de registro es similar al de estructura desde el punto de vista de que permiten almacenar datos de tipo heterogéneo.
  • 383. Archivos (ficheros) 353 3. Registro físico es la cantidad más pequeña de datos que pueden transferirse en una operación de entrada/salida entre la memoria central y los dis- positivos. 4. La organización de archivos define la forma en la que los archivos se disponen sobre el soporte de almacenamiento y puede ser secuencial, directa o secuencial-indexada. 5. La organización secuencial implica que los re- gistros se almacenan unos al lado de otros en el orden en el que van siendo introducidos y que para efectuar el acceso a un determinado registro es necesario pasar por los que le preceden. 6. Los archivos de texto se consideran una clase espe- cial de archivos secuenciales. 7. En la organización directa el orden físico de los registros puede no corresponderse con aquel en el que han sido introducidos y el acceso a un determi- nado registro no obliga a pasar por los que le prece- den. Para poder acceder a un determinado registro de esta forma se necesita un soporte direccionable y la longitud de los registros debe ser fija. 8. La organización secuencial-indexada requiere la existencia de un área de datos, un área de índices, un área de desbordamiento o colisiones y soporte direccionable. EJERCICIOS 9.1. Diseñar un algoritmo que permita crear un archivo AGENDA de direcciones cuyos registros constan de los siguientes campos: NOMBRE DIRECCION CIUDAD CODIGO POSTAL TELEFONO EDAD 9.2. Realizar un algoritmo que lea el archivo AGENDA e imprima los registros de toda la agenda. 9.3. Diseñar un algoritmo que copie el archivo secuencial AGENDA de los ejercicios anteriores en un archivo di- recto DIRECTO_AGENDA, de modo que cada registro mantenga su posición relativa. 9.4. Se dispone de un archivo indexado denominado DI- RECTORIO, que contiene los datos de un conjunto de personas y cuya clave es el número del DNI. Escribir un algoritmo capaz de realizar una consulta de un registro. Si no se encuentra el registro se emite el correspondiente mensaje de ERROR. 9.5. Se dispone de un archivo STOCK correspondiente a la existencia de artículos de un almacén y se desea se- ñalar aquellos artículos cuyo nivel está por debajo del mínimo y que visualicen un mensaje “hacer pedido”. Cada artículo contiene un registro con los siguientes campos: número del código del artículo, nivel míni- mo, nivel actual, proveedor, precio. 9.6. El director de un colegio desea realizar un programa que procese un archivo de registros correspondiente a los diferentes alumnos del centro a fin de obtener los siguientes datos: • Nota más alta y número de identificación del alum- no correspondiente. • Nota media por curso. • Nota media del colegio. NOTA: Si existen varios alumnos con la misma nota más alta, se deberán visualizar todos ellos. 9.7. Diseñar un algoritmo que genere un archivo secuen- cial BIBLIOTECA, cuyos registros contienen los si- guientes campos: TITULO AUTOR EDITORIAL AÑO DE EDICION ISBN NUMERO DE PAGINAS 9.8. Diseñar un algoritmo que permita modificar el con- tenido de alguno de los registros del archivo secuen- cial BIBLIOTECA mediante datos introducidos por teclado.
  • 385. CAPÍTULO 10 Ordenación, búsqueda e intercalación 10.1. Introducción 10.2. Ordenación 10.3. Búsqueda 10.4. Intercalación ACTIVIDADES DE PROGRAMACIÓN RESUELTAS CONCEPTOS CLAVE RESUMEN EJERCICIOS Las computadoras emplean una gran parte de su tiempo en operaciones de búsqueda, clasificación y mezcla de datos. Las operaciones de cálculo numérico y sobre todo de gestión requieren normalmente ope- raciones de clasificación de los datos: ordenar fichas de clientes por orden alfabético, por direcciones o por código postal. Existen dos métodos de ordenación: ordenación interna (de arrays, arreglos) y ordena- ción externa (archivos). Los arrays se almacenan en la memoria interna o central, de acceso aleatorio y di- recto, y por ello su gestión es rápida. Los archivos se sitúan adecuadamente en dispositivos de almacena- miento externo que son más lentos y basados en dis- positivos mecánicos: cintas y discos magnéticos. Las técnicas de ordenación, búsqueda y mezcla son muy importantes y el lector deberá dedicar especial aten- ción al conocimiento y aprendizaje de los diferentes métodos que en este capítulo se analizan. INTRODUCCIÓN
  • 386. 356 Fundamentos de programación 10.1. INTRODUCCIÓN Ordenación, búsqueda y, en menor medida, intercalación son operaciones básicas en el campo de la documentación y en las que, según señalan las estadísticas, las computadoras emplean la mitad de su tiempo. Aunque su uso puede ser con vectores (arrays) y con archivos, este capítulo se referirá a vectores. La ordenación (clasificación) es la operación de organizar un conjunto de datos en algún orden dado, tal como creciente o decreciente en datos numéricos, o bien en orden alfabético directo o inverso. Operaciones típicas de or- denación son: lista de números, archivos de clientes de banco, nombres de una agenda telefónica, etc. En síntesis, la ordenación significa poner objetos en orden (orden numérico para los números y alfabético para los caracteres) as- cendente o descendente. Por ejemplo, las clasificaciones de los equipos de fútbol de la liga en la 1.ª división española se pueden organizar en orden alfabético creciente/decreciente o bien por clasificación numérica ascendente/descendente. Los nombres de los equipos y los puntos de cada equipo se almacenan en dos vectores: equipo [1] = 'Real Madrid' puntos [1] = 10 equipo [2] = 'Barcelona' puntos [2] = 14 equipo [3] = 'Valencia' puntos [3] = 8 equipo [4] = 'Oviedo' puntos [4] = 12 equipo [5] = 'Betis' puntos [5] = 16 Si los vectores se ponen en orden decreciente de puntos de clasificación: equipo [5] = 'Betis' puntos [5] = 16 equipo [2] = 'Barcelona' puntos [2] = 14 equipo [4] = 'Oviedo puntos [4] = 12 equipo [1] = 'Real Madrid' puntos [1] = 10 equipo [3] = 'Valencia' puntos [3] = 8 Los nombres de los equipos y los puntos conseguidos en el campeonato de Liga anterior, ordenados de modo alfabético serían: equipo [1] = 'Barcelona' puntos [1] = 5 equipo [2] = 'Cádiz' puntos [2] = 13 equipo [3] = 'Málaga' puntos [3] = 12 equipo [4] = 'Oviedo' puntos [4] = 8 equipo [5] = 'Real Madrid' puntos [5] = 4 equipo [6] = 'Valencia' puntos [6] = 16 o bien se pueden situar en orden numérico decreciente: equipo [6] = 'Valencia' puntos [6] = 16 equipo [2] = 'Cádiz' puntos [2] = 13 equipo [3] = 'Málaga' puntos [3] = 12 equipo [4] = 'Oviedo' puntos [4] = 8 equipo [1] = 'Barcelona' puntos [1] = 5 equipo [5] = 'Real Madrid' puntos [5] = 4 Los vectores anteriores comienzan en orden alfabético de equipos y se reordenan en orden descendente de “pun- tos”. El listín telefónico se clasifica en orden alfabético de abonados; un archivo de clientes de una entidad bancaria normalmente se clasifica en orden ascendente de números de cuenta. El propósito final de la clasificación es facilitar la manipulación de datos en un vector o en un archivo. Algunos autores diferencian entre un conjunto o vector clasificado (sorted) y vector ordenado (ordered set). Un conjunto ordenado es aquel en el que el orden de aparición de los elementos afecta al significado de la estructura completa de datos: puede estar clasificado, pero no es imprescindible. Un conjunto clasificado es aquel en que los valores de los elementos han sido utilizados para disponerlos en un orden particular: es, probablemente, un conjunto ordenado, pero no necesariamente.
  • 387. Ordenación, búsqueda e intercalación 357 Es importante estudiar la clasificación por dos razones. Una es que la clasificación de datos es tan frecuente que todos los usuarios de computadoras deben conocer estas técnicas. La segunda es que es una aplicación que se puede describir fácilmente, pero que es bastante difícil conseguir el diseño y escritura de buenos algoritmos. La clasificación de los elementos numéricos del vector 7, 3, 2, 1, 9, 6, 7, 5, 4 en orden ascendente producirá 1, 2, 3, 4, 5, 6, 7, 7, 9 Obsérvese que pueden existir elementos de igual valor dentro de un vector. Existen muchos algoritmos de clasificación, con diferentes ventajas e inconvenientes. Uno de los objetivos de este capítulo y del Capítulo 11 es el estudio de los métodos de clasificación más usuales y de mayor aplicación. La búsqueda de información es, al igual que la ordenación, otra operación muy frecuente en el tratamiento de información. La búsqueda es una actividad que se realiza diariamente en cualquier aspecto de la vida: búsqueda de palabras en un diccionario, nombres en una guía telefónica, localización de libros en una librería. A medida que la información se almacena en una computadora, la recuperación y búsqueda de esa información se convierte en una tarea principal de dicha computadora. 10.2. ORDENACIÓN En un vector es necesario, con frecuencia, clasificar u ordenar sus elementos en un orden particular. Por ejemplo, clasificar un conjunto de números en orden creciente o una lista de nombres por orden alfabético. La clasificación es una operación tan frecuente en programas de computadora que una gran cantidad de algoritmos se han diseñado para clasificar listas de elementos con eficacia y rapidez. La elección de un determinado algoritmo depende del tamaño del vector o array (arreglo) a clasificar, el tipo de datos y la cantidad de memoria disponible. La ordenación o clasificación es el proceso de organizar datos en algún orden o secuencia específica, tal como creciente o decreciente para datos numéricos o alfabéticamente para datos de caracteres. Los métodos de ordenación se dividen en dos categorías: • Ordenación de vectores, tablas (arrays o arreglos). • Ordenación de archivos. La ordenación de arrays se denomina también ordenación interna, ya que se almacena en la memoria interna de la computadora de gran velocidad y acceso aleatorio. La ordenación de archivos se suele hacer casi siempre sobre soportes de almacenamiento externo, discos, cintas, etc., y, por ello, se denomina también ordenación externa. Estos dispositivos son más lentos en las operaciones de entrada/salida, pero, por el contrario, pueden contener mayor can- tidad de información. Ordenación interna: clasificación de los valores de un vector según un orden en memoria central: rápida. Ordenación externa: clasificación de los registros de un archivo situado en un soporte externo: menos rápido. EJEMPLO Clasificación en orden ascendente del vector. 7, 3, 2, 1, 9, 6, 7, 5, 4 se obtendrá el nuevo vector 1, 2, 3, 4, 5, 6, 7, 7, 9 Los métodos de clasificación se explicarán aplicados a vectores (arrays unidimensionales), pero se pueden exten- der a matrices o tablas (arrays o arreglos bidimensionales), considerando la ordenación respecto a una fila o columna.
  • 388. 358 Fundamentos de programación Los métodos directos son los que se realizan en el espacio ocupado por el array. Los más populares son: • Intercambio. • Selección. • Inserción. 10.2.1. Método de intercambio o de burbuja El algoritmo de clasificación de intercambio o de la burbuja se basa en el principio de comparar pares de elementos adyacentes e intercambiarlos entre sí hasta que estén todos ordenados. Supongamos que se desea clasificar en orden ascendente el vector o lista 50 A[1] 15 A[2] 56 A[3] 14 A[4] 35 A[5] 1 A[6] 12 A[7] 9 A[8] Los pasos a dar son: 1. Comparar A[1] y A[2]; si están en orden, se mantienen como están, en caso contrario se intercambian entre sí. 2. A continuación se comparan los elementos 2 y 3; de nuevo se intercambian si es necesario. 3. El proceso continúa hasta que cada elemento del vector ha sido comparado con sus elementos adyacentes y se han realizado los intercambios necesarios. El método expresado en pseudocódigo en el primer diseño es: desde I ← 1 hasta 7 hacer si elemento[I] elemento[I + 1] entonces intercambiar (elemento[I], elemento [I + 1]) fin_si fin_desde La acción intercambiar entre sí los valores de dos elementos A[I], A[I+1] es una acción compuesta que con- tiene las siguientes acciones, considerando una variable auxiliar AUX. AUX ← A[I] A[I] ← A[I+1] A[I+1] ← AUXI En realidad, el proceso gráfico es A[I] A[I + 1] AUX El elemento cuyo valor es mayor sube posición a posición hacia el final de la lista, al igual que las burbujas de aire en un depósito o botella de agua. Tras realizar un recorrido completo por todo el vector, el elemento menciona- do habrá subido en la lista y ocupará la última posición. En el segundo recorrido, el segundo elemento llegará a la penúltima, y así sucesivamente. En el ejercicio citado anteriormente los sucesivos pasos con cada una de las operaciones se muestran en las Fi- guras 10.1 y 10.2.
  • 389. Ordenación, búsqueda e intercalación 359 vector inicial A[1] A[2] A[3] A[4] A[5] A[6] A[7] A[8] 1.ª comp. 50 15 56 14 35 1 12 9 2.ª comp. 15 50 56 14 35 1 12 9 ... 15 50 56 14 35 1 12 9 15 50 14 56 35 1 12 9 15 50 14 35 56 1 12 9 15 50 14 35 1 56 12 9 15 50 14 35 1 12 56 9 15 50 14 35 1 12 9 56 Figura 10.1. Método de la burbuja (paso 1). Si se efectúa n – 1 veces la operación sobre una tabla de n valores se tiene ordenada la tabla. Cada operación requiere n – 1 comprobaciones o test y como máximo n – 1 intercambios. La ordenación total exigirá un máximo de (n – 1) * (n – 1) = (n – 1)2 intercambios de elementos. Los estados sucesivos del vector se indican en la Figura 10.2: Estado inicial Después de paso 1 Después de paso 2 50 15 56 14 35 1 12 9 15 50 14 35 1 12 9 56 15 14 35 1 12 9 50 56 Figura 10.2. Método de la burbuja (paso 2). EJEMPLO 10.1 Describir los diferentes pasos para clasificar en orden ascendente el vector 72 64 50 23 84 18 37 99 45 8 Las sucesivas operaciones en cada uno de los pasos necesarios hasta obtener la clasificación final se muestra en la Tabla 10.1 Tabla 10.1. Pasos necesarios de la ordenación por burbuja Vector desordenado Número de paso Fin de clasificación 1 2 3 4 5 6 7 8 9 72 64 50 23 84 18 37 99 45 8 64 50 23 72 18 37 84 45 8 99 50 23 64 18 37 72 45 8 84 99 23 50 18 37 64 45 8 72 84 99 23 18 37 50 45 8 64 72 84 99 18 23 37 45 8 50 64 72 84 99 18 23 37 8 45 50 64 72 84 99 18 23 8 37 45 50 64 72 84 99 18 8 23 37 45 50 64 72 84 99 8 18 23 37 45 50 64 72 84 99
  • 390. 360 Fundamentos de programación Método 1 El algoritmo se describirá, como siempre, con un diagrama de flujo y un pseudocódigo. Pseudocódigo algoritmo burbuja1 //incluir las declaraciones precisas// inicio //lectura del vector// desde i ← 1 hasta N hacer leer(X[I]) fin_desde //clasificación del vector desde I ← 1 hasta N-1 hacer desde J ← 1 hasta J ← N-1 hacer si X[j] X[J+1] entonces //intercambiar AUX ← X[J] X[J] ← X[J+1] X[J+1] ← AUXI fin_si fin_desde fin_desde //imprimir lista clasificada desde J ← 1 hasta N hacer escribir(X[J]) fin_desde fin Diagrama de flujo 10.1 Para clasificar el vector completo se deben realizar las sustituciones correspondientes (N-1) * (N-1) o bien N2 -2N+1 veces. Así, en el caso de un vector de cien elementos (N = 100) se deben realizar casi 10.000 iteraciones. El algoritmo de clasificación es: Inicio X[J] X[J + 1] fin No I ← 1 I N – 1 I ← I + 1 J ← 1 J N – 1 J ← J + 1 Sí AUX ← X[J] X[J] ← X[J + 1] X[J + 1] ← AUX No Sí No
  • 391. Ordenación, búsqueda e intercalación 361 Método 2 Se puede realizar una mejora en la velocidad de ejecución del algoritmo. Obsérvese que en el primer recorrido del vector (cuando I = 1) el valor mayor del vector se mueve al último elemento X[N]. Por consiguiente, en el siguien- te paso no es necesario comparar X[N – 1] y X[N]. En otras palabras, el límite superior del bucle desde puede ser N – 2. Después de cada paso se puede decrementar en uno el límite superior del bucle desde. El algoritmo sería: Pseudocódigo algoritmo burbuja2 //declaraciones inicio //... desde I ← 1 hasta N-1 hacer desde J ← 1 hasta N-I hacer si X[J] X[J+1] entonces AUX ← X[J] X[J] ← X[J+1] X[J+1] ← AUX fin_si fin_desde fin_desde fin Diagrama de flujo 10.2 AUX ← X[J] X[J] ← X[J + 1] X[J + 1] ← AUX Sí No Inicio repetir I = 1, N – 1 repetir J = 1, N – I X[J] X[J + 1] fin
  • 392. 362 Fundamentos de programación Método 3 (uso de una bandera/indicador) Mediante una bandera/indicador o centinela (switch) o bien una variable lógica, se puede detectar la presencia o ausencia de una condición. Así, mediante la variable BANDERA se representa clasificación terminada con un valor verdadero y clasificación no terminada con un valor falso. Diagrama de flujo 10.3 Sí No Inicio repetir K = 1, N – 1 BANDERA = 'F' fin BANDERA ← 'F' BANDERA ← 'V' X[K] X[K + 1] BANDERA ← 'F' F = falso V = verdadero Sí No inter cambio X[K], X[K + 1] Pseudocódigo algoritmo burbuja 3 //declaraciones inicio //lectura del vector BANDERA ← 'F' // F, falso; V, verdadero i ← 1 mientras (BANDERA = 'F') Y (i N ) hacer BANDERA ← 'V' desde K ← 1 hasta N-i hacer si X[K] X[K+1] entonces intercambiar(X[K],X[K + 1]) //llamada a procedimiento intercambio BANDERA ← 'F' fin_si
  • 393. Ordenación, búsqueda e intercalación 363 fin_desde i ← i+1 fin_mientras fin 10.2.2. Ordenación por inserción Este método consiste en insertar un elemento en el vector en una parte ya ordenada de este vector y comenzar de nuevo con los elementos restantes. Por ser utilizado generalmente por los jugadores de cartas se le conoce también por el nombre de método de la baraja. Así, por ejemplo, suponga que tiene la lista desordenada 5 14 24 39 43 65 84 45 Para insertar el elemento 45, habrá que insertarlo entre 43 y 65, lo que supone desplazar a la derecha todos aque- llos números de valor superior a 45, es decir, saltar sobre 65 y 84. 5 14 24 39 43 65 84 45 El método se basa en comparaciones y desplazamientos sucesivos. El algoritmo de clasificación de un vector X para N elementos se realiza con un recorrido de todo el vector y la inserción del elemento correspondiente en el lugar adecuado. El recorrido se realiza desde el segundo elemento al n-ésimo. desde i ← 2 hasta N hacer //insertar X[i] en el lugar //adecuado entre X[1]..X[i-1]) fin_desde Esta acción repetitiva —insertar— se realiza más fácilmente con la inclusión de un valor centinela o bandera (SW). Pseudocódigo algoritmo clas_insercion1 //declaraciones inicio ..... //ordenacion desde I ← 2 hasta N hacer AUXI ← X[I] K ← I-1 SW ← falso mientras no (SW) y (K = 1) hacer si AUXI X[K] entonces X[K+1] ← X[K] K ← K-1 si_no SW ← verdadero fin_si fin_mientras
  • 394. 364 Fundamentos de programación X[K+1] ← AUXI fin_desde fin Algoritmo inserción mejorado El algoritmo de inserción directa se mejora fácilmente. Para ello se recurre a un método de búsqueda binaria —en lugar de una búsqueda secuencial— para encontrar más rápidamente el lugar de inserción. Este método se conoce como inserción binaria. algoritmo clas_insercion_binaria //declaraciones inicio //... desde I ← 2 hasta N hacer AUX ← X[I] P ← 1 //primero U ← I-1 //último mientras P = U hacer C ← (P+U) div 2 si AUX X[C] entonces U ← C-1 si_no P ← C+1 fin_si fin_mientras desde K ← I-1 hasta P decremento 1 hacer X[K+1] ← X[K] fin_desde X[P] ← AUX fin_desde fin fin Sí AUX ← X[I] K ← I – 1 SW ← falso No NO (SW) y K = 1 X[K + 1] ← AUX SW ← verdadero AUX X [K] No Inicio I ← 2 I ← I + 1 I N X[K + 1] ← X[K] K ← K + 1
  • 395. Ordenación, búsqueda e intercalación 365 Número de comparaciones El cálculo del número de comparaciones F(n) que se realiza en el algoritmo de inserción se puede calcular fácilmente. Consideraremos el elemento que ocupa la posición X en un vector de n elementos, en el que los X – 1 elementos anteriores se encuentran ya ordenados ascendentemente por su clave. Si la clave del elemento a insertar es mayor que las restantes, el algoritmo ejecuta sólo una comparación; si la clave es inferior a las restantes, el algoritmo ejecuta X – 1 comparaciones. El número de comparaciones tiene por media X/2. Veamos los casos posibles. Vector ordenado en origen Comparaciones mínimas (n – 1) Vector inicialmente en orden inverso Comparaciones máximas n(n – 1) 2 ya que (n – 1) + (n – 2) +...+ 3 + 2 + 1 = (n – 1)n 2 es una progresión aritmética Comparaciones medias (n – 1) + (n – 1)n/2 2 = n2 + n – 2 4 otra forma de deducirlas sería: Cmedias = n – 1 + 1 2 + n – 2 + 1 2 + ... + 1 + 1 2 { n – 1 veces y la suma de los términos de una progresión aritmética es: Cmedias = (n – 1) (n/2) + 1 2 = (n – 1) n + 2 4 = n2 + 2n – n – 2 4 = n2 + n – 2 4 10.2.3. Ordenación por selección Este método se basa en buscar el elemento menor del vector y colocarlo en primera posición. Luego se busca el se- gundo elemento más pequeño y se coloca en la segunda posición, y así sucesivamente. Los pasos sucesivos a dar son: 1. Seleccionar el elemento menor del vector de n elementos. 2. Intercambiar dicho elemento con el primero. 3. Repetir estas operaciones con los n – 1 elementos restantes, seleccionando el segundo elemento; continuar con los n – 2 elementos restantes hasta que sólo quede el mayor. Un ejemplo aclarará el método.
  • 396. 366 Fundamentos de programación EJEMPLO 10.2 Clasificar la siguiente lista de números en orden ascendente: 320 96 16 90 120 80 200 64 El método comienza buscando el número más pequeño, 16. 320 96 16 90 120 80 200 64 La lista nueva será 16 96 320 90 120 80 200 64 A continuación se busca el siguiente número más pequeño, 64, y se realizan las operaciones 1 y 2. La nueva lista sería 16 64 320 90 120 80 200 96 Si se siguen realizando dos iteraciones se encontrará la siguiente línea: 16 64 80 90 120 320 200 96 No se realiza ahora ningún cambio, ya que el número más pequeño del vector V[4], V[5], ..., V[8] está ya en la posición más a la izquierda. Las sucesivas operaciones serán: 16 64 80 90 96 320 200 120 16 64 80 90 96 120 200 320 16 64 80 90 96 120 200 320 y se habrán terminado las comparaciones, ya que el último elemento debe ser el más grande y, por consiguiente, estará en la posición correcta. Desarrollemos ahora el algoritmo para clasificar el vector V de n componentes V[1], V[2], ..., V[n] con este método. El algoritmo se presentará en etapas y lo desarrollaremos con un refinamiento por pasos sucesivos. La tabla de variables que utilizaremos será: I, J X AUX N enteras y se utilizan como índices del vector V vector (array unidimensional) variables auxiliar para intercambio número de elementos del vector V Nivel 1 inicio desde I ← 1 hasta N-1 hacer Buscar elemento menor de X[I], X[I+1], ..., X[N] e intercambiar con X[I] fin_desde fin Nivel 2 inicio I ← 1 repetir
  • 397. Ordenación, búsqueda e intercalación 367 Buscar elemento menor de X[I], X[I+1], ..., X[N] e intercambiar con X[I] I ← I+1 hasta_que I = N fin La búsqueda e intercambio se realiza N – 1 veces, ya que I se incrementa en 1 al final del bucle. Nivel 3 Dividamos el bucle repetitivo en dos partes: inicio I ←1 repetir Buscar elemento más pequeño X[I], X[I+1], ..., X[N] //Supongamos que es X[K] Intercambiar X[K] y X[I] hasta_que I = N fin Nivel 4a Las instrucciones buscar e intercambiar se refinan independientemente. El algoritmo con la estructura re- petir es: inicio //... I ← 1 repetir AUXI ← X[I] //AUXI representa el valor más pequeño K ← I //K representa la posición J ← I repetir J ← J+1 si X[J] AUXI entonces AUXI ← X[J] //actualizar AUXI K ← J //K, posición fin_si hasta_que J = N //AUXI = X[K] es ahora el más pequeño X[K] ← X[I] X[I] ← AUXI I ← I+1 hasta_que I = N fin Nivel 4b El algoritmo con la estructura mientras. inicio //... I ← 1 mientras I N hacer AUXI ← X[I] K ← I J ← I
  • 398. 368 Fundamentos de programación mientras J N hacer J ← J+1 si X[J] AUXI entonces AUXI ← X[J] K ← J fin_si fin_mientras X[K] ← X[I] X[I] ← AUXI I ← I + 1 fin_mientras fin Nivel 4c El algoritmo de ordenación con estructura desde. inicio //... desde I ← 1 hasta N–1 hacer AUXI ← X[I] K ← I desde J ← I+1 hasta N hacer si X[J] AUXI entonces AUXI ← X[J] K ← J fin_si fin_desde X[K] ← X[I] X[I] ← AUXI fin_desde fin 10.2.4. Método de Shell Es una mejora del método de inserción directa que se utiliza cuando el número de elementos a ordenar es grande. El método se denomina “Shell” —en honor de su inventor Donald Shell— y también método de inserción con incre- mentos decrecientes. En el método de clasificación por inserción cada elemento se compara con los elementos contiguos de su izquier- da, uno tras otro. Si el elemento a insertar es más pequeño —por ejemplo—, hay que ejecutar muchas comparaciones antes de colocarlo en su lugar definitivamente. Shell modificó los saltos contiguos resultantes de las comparaciones por saltos de mayor tamaño y con eso se conseguía la clasificación más rápida. El método se basa en fijar el tamaño de los saltos constantes, pero de más de una posición. Supongamos un vector de elementos 4 12 16 24 36 3 en el método de inserción directa, los saltos se hacen de una posición en una posición y se necesitarán cinco compa- raciones. En el método de Shell, si los saltos son de dos posiciones, se realizan tres comparaciones. 4 12 16 24 36 3 El método se basa en tomar como salto N/2 (siendo N el número de elementos) y luego se va reduciendo a la mitad en cada repetición hasta que el salto o distancia vale 1.
  • 399. Ordenación, búsqueda e intercalación 369 Considerando la variable salto, se tendría para el caso de un determinado vector X los siguientes recorridos: Vector X [X[1], X[2], X[3], ..., X[N]] Vector X1 [X[1], X[1+salto], X[2+salto], ...] Vector XN [salto1, salto2, salto3, ...] EJEMPLO 10.3 Deducir las secuencias parciales de clasificación por el método de Shell para ordenar en ascendente la lista o vector 6, 1, 5, 2, 3, 4, 0 Solución Recorrido Salto Lista reordenada Intercambio 1 2 3 4 5 3 3 3 1 1 2,1,4,0,3,5,6 0,1,4,2,3,5,6 0,1,4,2,3,5,6 0,1,2,3,4,5,6 0,1,2,3,4,5,6 (6,2), (5,4), (6,0) (2,0) Ninguno (4,2), (4,3) Ninguno Sea un vector X X[1], X[2], X[3], ..., X[N] y consideremos el primer salto a dar que tendrá un valor de N 2 por lo que para redondear, se tomará la parte entera N DIV 2 y se iguala a salto salto = N div 2 El algoritmo resultante será: algoritmo shell const n = 50 tipo array[1..n] de entero:lista var lista : L entero : k, i, j, salto inicio llamar_a llenar(L) // llenado de la lista salto ← N DIV 2 mientras salto 0 hacer desde i ← (salto + 1) hasta n hacer j ← i – salto
  • 400. 370 Fundamentos de programación mientras j 0 hacer k ← j + salto si L[j] = L[k] entonces j ← 0 si_no llamar_a intercambio L[j], L[k] fin_si j ← j - salto fin_mientras fin_desde salto ← ent ((1 + salto)/2) fin_mientras fin 10.2.5. Método de ordenación rápida (quicksort) El método de ordenación rápida (quicksort) para ordenar o clasificar un vector o lista de elementos (array) se basa en el hecho de que es más rápido y fácil de ordenar dos listas pequeñas que una lista grande. Se denomina método de ordenación rápida porque, en general, puede ordenar una lista de datos mucho más rápidamente que cualquiera de los métodos de ordenación ya estudiados. Este método se debe a Hoare. El método se basa en la estrategia típica de “divide y vencerás” (divide and conquer). La lista a clasificar alma- cenada en un vector o array se divide (parte) en dos sublistas: una con todos los valores menores o iguales a un cierto valor específico y otra con todos los valores mayores que ese valor. El valor elegido puede ser cualquier valor arbitrario del vector. En ordenación rápida se llama a este valor pivote. El primer paso es dividir la lista original en dos sublistas o subvectores y un valor de separación. Así, el vector V se divide en tres partes: • Subvector VI, que contiene los valores inferiores o iguales. • El elemento de separación. • Subvector VD, que contiene los valores superiores o iguales. Los subvectores VI y VD no están ordenados, excepto en el caso de reducirse a un elemento. Consideremos la lista de valores. 18 11 27 13 9 4 16 Se elige un pivote, 13. Se recorre la lista desde el extremo izquierdo y se busca un elemento mayor que 13 (se encuentra el 18). A continuación, se busca desde el extremo derecho un valor menor que 13 (se encuentra el 4). 18 11 27 13 9 4 16 Se intercambian estos dos valores y se produce la lista 4 11 27 13 9 18 16 Se sigue recorriendo el vector por la izquierda y se localiza el 27, y a continuación otro valor bajo se encuentra a la derecha (el 9). Intercambiar estos dos valores y se obtiene 4 11 9 13 27 18 16 Al intentar este proceso una vez más, se encuentra que las exploraciones de los dos extremos vienen juntos sin encontrar ningún futuro valor que esté “fuera de lugar”. En este punto se conoce que todos los valores a la derecha son mayores que todos los valores a la izquierda del pivote. Se ha realizado una partición en la lista original, que se ha quedado dividida en dos listas más pequeñas: 4 11 9 [13] 27 18 16
  • 401. Ordenación, búsqueda e intercalación 371 Ninguna de ambas listas está ordenada; sin embargo, basados en los resultados de esta primera partición, se pue- den ordenar ahora las dos particiones independientemente. Esto es, si ordenamos la lista 4 11 9 en su posición, y la lista 27 18 16 de igual forma, la lista completa estará ordenada: 4 9 11 13 16 18 27 El procedimiento de ordenación supone, en primer lugar, una partición de la lista. EJEMPLO 10.4 Utilizando el procedimiento de ordenación rápida, dividir la lista de enteros en dos sublistas para poder clasificar posteriormente ambas listas. 50 30 20 80 90 70 95 85 10 15 75 25 Se elige como pivote el número 50. Los valores 30, 20, 10, 15 y 25 son más pequeños que 50 y constituirán la primera lista, y 80, 90, 70, 95, 85 y 75 se sitúan en la segunda lista. Se recorre la lista desde la izquierda para encontrar el primer número mayor que 50 y desde la derecha el primero menor que 50. 50 30 20 80 90 70 95 85 10 15 75 25 se localizan los dos números 80 y 25 y se intercambian 50 30 20 25 90 70 95 85 10 15 75 80 A continuación se reanuda la búsqueda desde la derecha para un número menor que 50, y desde la izquierda para un número mayor de 50. 50 30 20 25 90 70 95 85 10 15 75 80 Estos recorridos localizan los números 15 y 90, que se intercambian 50 30 20 25 15 70 95 85 10 90 75 80 Las búsquedas siguientes localizan 10 y 70. 50 30 20 25 15 70 95 85 10 90 75 80 El intercambio proporciona 50 30 20 25 15 10 95 85 70 90 75 80
  • 402. 372 Fundamentos de programación Cuando se reanuda la búsqueda desde la derecha para un número menor que 50, localizamos el valor 10 que se encontró en la búsqueda de izquierda a derecha. Se señala el final de las dos búsquedas y se intercambian 50 y 10. 10 30 20 25 15 50 95 85 70 75 80 { { Lista de números 50 Lista de números 50 Algoritmos El algoritmo de ordenación rápida se basa esencialmente en un algoritmo de división o partición de una lista. El mé- todo consiste en explorar desde cada extremo e intercambiar los valores encontrados. Un primer intento de algoritmo de partición es: algoritmo particion inicio establecer x al valor de un elemento arbitrario de la lista mientras division no este terminada hacer recorrer de izquierda a derecha para un valor = x recorrer de derecha a izquierda para un valor = x si los valores localizados no estan ordenados entonces intercambiar los valores fin_si fin_mientras fin La lista que se desea partir es A[1], A[2], ..., A[n]. Los índices que representan los extremos izquierdo y derecho de la lista son L y R. En el refinamiento del algoritmo se elige un valor arbitrario x, suponiendo que el valor central de la lista es tan bueno como cualquier elemento arbitrario. Los índices i, j exploran desde los extremos. Un refinamiento del algoritmo anterior, que incluye mayor número de detalles es el siguiente: algoritmo particion llenar (A) i ← L j ← R x ← A ((L+R) div 2) mientras i = j hacer mientras A[i] x hacer i ← i+1 fin_mientras mientras A[j] x hacer j ← j-1 fin_mientras si i = j entonces llamar_a intercambiar (A[i], a[j]) i ← i+1 j ← j-1 fin_si fin_mientras fin En los bucles externos y la sentencia si la condición utilizada es i = j. Puede parecer que i j funcionan de igual modo en ambos lugares. De hecho, se puede realizar la partición con cualquiera de las condiciones. Sin embargo, si se utiliza la condición i j, podemos terminar la partición con dos casos distintos, los cuales pueden diferenciarse antes de que podamos realizar divisiones futuras. Por ejemplo, la lista 1 7 7 9 9
  • 403. Ordenación, búsqueda e intercalación 373 y la condición i j terminará con i = 3, j = 2 y las dos particiones son A[L]..A[j] y A[i]..A[R]. Sin embargo, para la lista 1 1 7 9 9 y la condición i j terminaremos con i = 3, j = 3 y las dos particiones se solapan. El uso de la condición i = j produce también resultados distintos para estos ejemplos. La lista 1 7 7 9 9 y la condición i = j se termina con i = 3, j = 2 como antes. Para la lista 1, 1, 7, 9, 9 y la condición i = j se termina con i = 4, j = 2. En ambos casos las particiones que requieren ordenación posterior son A[L]..A[j] y A[i]..A[R]. En los bucles mientras internos la igualdad se omite de las condiciones. La razón es que el valor de partición actúe como centinela para detectar las exploraciones. En nuestro ejemplo se ha tomado como valor de partición o pivote el elemento cuya posición inicial es el ele- mento central. Este no es generalmente el caso. El ejemplo de la clasificación de la lista ya citado 50 30 20 80 90 70 95 85 10 15 75 25 utilizaba como pivote el primer elemento. El algoritmo de ordenación rápida en el caso de que el elemento pivote sea el primer elemento se muestra a con- tinuación: algoritmo particion2 //lista a evaluar de 10 elementos //IZQUIERDO, indice de búsqueda (recorrido) desde la izquierda //DERECHO, indice de búsqueda desde la derecha inicio llenar (X) //inicializar índice para recorridos desde la izquierda y derecha IZQUIERDO ← ALTO //ALTO parametro que indica principio de la sublista DERECHO ← BAJO //BAJO parametro que indica final de la sublista A - X[1] //realizar los recorridos mientras IZQUIERDO = DERECHO hacer //búsqueda o recorrido desde la izquierda mientras (X[IZQUIERDO] A) Y (IZQUIERDO BAJO) IZQUIERDO ← IZQUIERDO + 1 fin_mientras mientras X[DERECHO] A y (DERECHO ALTO) DERECHO ← DERECHO - 1 fin_mientras //intercambiar elemento si IZQUIERDO = DERECHO entonces AUXI -X[IZQUIERDO] X[IZQUIERDO] ← X[DERECHO] X[DERECHO] ← AUXI IZQUIERDO ← IZQUIERDO + 1 DERECHO ← DERECHO - 1 fin_si fin_mientras //fin busqueda; situar elemento seleccionado en su posicion si IZQUIERDO BAJO+1 entonces AUXI← X [DERECHO] X [DERECHO] ← X [1] X [1] ← AUXI
  • 404. 374 Fundamentos de programación si_no AUXI ← X [BAJO] X [BAJO] ← X[1] X[1] ← AUXI fin fin 10.3. BÚSQUEDA La recuperación de información, como ya se ha comentado, es una de las aplicaciones más importantes de las com- putadoras. La búsqueda (searching) de información está relacionada con las tablas para consultas (lookup). Estas tablas contienen una cantidad de información que se almacena en forma de listas de parejas de datos. Por ejemplo, un dic- cionario con una lista de palabras y definiciones; un catálogo con una lista de libros de informática; una lista de estudiantes y sus notas; un índice con títulos y contenido de los artículos publicados en una determinada revista, etc. En todos estos casos es necesario con frecuencia buscar un elemento en una lista. Una vez que se encuentra el elemento, la identificación de su información correspondiente es un problema menor. Por consiguiente, nos centraremos en el proceso de búsqueda. Supongamos que se desea buscar en el vector X[1].. X[n], que tiene componentes numéricos, para ver si contiene o no un número dado T. Si en vez de tratar sobre vectores se desea buscar información en un archivo, debe realizarse la búsqueda a partir de un determinado campo de información denominado campo clave. Así, en el caso de los archivos de empleados de una empresa, el campo clave puede ser el número de DNI o los apellidos. La búsqueda por claves para localizar registros es, con frecuencia, una de las acciones que mayor consumo de tiempo conlleva y, por consiguiente, el modo en que los registros están dispuestos y la elección del modo utilizado para la búsqueda pueden redundar en una diferencia sustancial en el rendimiento del programa. El problema de búsqueda cae naturalmente dentro de los dos casos típicos ya tratados. Si existen muchos registros, puede ser necesario almacenarlos en archivos de disco o cinta, externo a la memoria de la computadora. En este caso se llama búsqueda externa. En el otro caso, los registros que se buscan se almacenan por completo dentro de la me- moria de la computadora. Este caso se denomina búsqueda interna. En la práctica, la búsqueda se refiere a la operación de encontrar la posición de un elemento entre un conjunto de elementos dados: lista, tabla o fichero. Ejemplos típicos de búsqueda son localizar nombre y apellidos de un alumno, localizar números de teléfono de una agenda, etc. Existen diferentes algoritmos de búsqueda. El algoritmo elegido depende de la forma en que se encuentren orga- nizados los datos. La operación de búsqueda de un elemento N en un conjunto de elementos consiste en: • Determinar si N pertenece al conjunto y, en ese caso, indicar su posición en él. • Determinar si N no pertenece al conjunto. Los métodos más usuales de búsqueda son: • Búsqueda secuencial o lineal. • Búsqueda binaria. • Búsqueda por transformación de claves (hash). 10.3.1. Búsqueda secuencial Supongamos una lista de elementos almacenados en un vector (array unidimensional). El método más sencillo de buscar un elemento en un vector es explorar secuencialmente el vector o, dicho en otras palabras, recorrer el vector desde el primer elemento al último. Si se encuentra el elemento buscado, visualizar un mensaje similar a 'Fin de búsqueda'; en caso contrario, visualizar un mensaje similar a 'Elemento no existe en la lista'. En otras palabras, la búsqueda secuencial compara cada elemento del vector con el valor deseado, hasta que éste encuentra o termina de leer el vector completo.
  • 405. Ordenación, búsqueda e intercalación 375 La búsqueda secuencial no requiere ningún registro por parte del vector y, por consiguiente, no necesita estar ordenado. El recorrido del vector se realizará normalmente con estructuras repetitivas. EJEMPLO 10.5 Se tiene un vector A que contiene n elementos numéricos (n) = 1(A[1], A[2], A[3], ..., A[n]) y se desea buscar un elemento dado t. Si el elemento t se encuentra, visualizar un mensaje 'Elemento encontrado' y otro que diga 'posición = '. Si existen n elementos, se requerirán como media n/2 comparaciones para encontrar un determinado elemento. En el caso más desfavorable se necesitarán n comparaciones. Método 1 algoritmo busqueda_secuencial_1 //declaraciones inicio llenar (A,n) leer(t) //recorrido del vector desde i ← 1 hasta n hacer si A[i] = t entonces escribir('Elemento encontrado') escribir('en posicion', i) fin_si fin_desde fin Método 2 algoritmo busqueda_secuencial_2 //... inicio llenar (A,n) leer(t) i ← 1 mientras (A[i] t) y (i = n) hacer i ← i + 1 //este bucle se detiene bien con A[i] = t o bien con i n fin_mientras si A[i] = t entonces //condición de parada escribir('El elemento se ha encontrado en la posición', i) si_no //recorrido del vector terminado escribir('El numero no se encuentra en el vector') fin_si fin Este método no es completamente satisfactorio, ya que si t no está en el vector A, i toma el valor n + 1 y la comparación A[i] t producirá una referencia al elemento A[n + 1], que presumiblemente no existe. Este problema se resuelve sustituyen- do i = n por i n en la instrucción mientras, es decir, modificando la instrucción anterior mientras por mientras (A[i] t) y (i n) hacer
  • 406. 376 Fundamentos de programación Método 3 algoritmo busqueda_secuencial_3 //... inicio llenar (A,n) leer(t) i ← 1 mientras (A[i] t) y (i n) hacer i ← i+1 //este bucle se detiene cuando A[i] = t o i = n fin_mientras si A[i] = t entonces escribir('El numero deseado esta presente y ocupa el lugar',i) si_no escribir(t, 'no existe en el vector') fin_si fin Método 4 algoritmo busqueda_secuencial_4 //... inicio llamar_a llenar(A,n) leer(t) i ← 1 mientras i = n hacer si t = A[i] entonces escribir('Se encontró el elemento buscado en la posicion',i) i ← n + 1 si_no i ← i+1 fin_si fin_mientras fin Búsqueda secuencial con centinela Una manera muy eficaz de realizar una búsqueda secuencial consiste en modificar los algoritmos anteriores utilizan- do un elemento centinela. Este elemento se agrega al vector al final del mismo. El valor del elemento centinela es el del argumento. El propósito de este elemento centinela, A[n + 1], es significar que la búsqueda siempre tendrá éxi- to. El elemento A[n + 1] sirve como centinela y se le asigna el valor de t antes de iniciar la búsqueda. En cada paso se evita la comparación de i con N y, por consiguiente, este algoritmo será preferible a los métodos anteriores, con- cretamente el método 4. Si el índice alcanzase el valor n + 1, supondría que el argumento no pertenece al vector original y en consecuencia la búsqueda no tiene éxito. Método 5 algoritmo busqueda_secuencial_5 //declaraciones inicio llenar(A,n) leer(t)
  • 407. Ordenación, búsqueda e intercalación 377 i ← 1 A[n + 1] ← t mientras A[i] t hacer i ← i + 1 fin_mientras si i = n + 1 entonces escribir('No se ha encontrado elemento') si_no escribir('Se ha encontrado el elemento') fin_si fin Una variante del método 5 es utilizar una variable lógica (interruptor o switch), que represente la existencia o no del elemento buscado. Localizar si el elemento t existe en una lista A[i], donde i varía desde 1 a n. En este ejemplo se trata de utilizar una variable lógica ENCONTRADO para indicar si existe o no el elemento de la lista. Método 6 algoritmo busqueda_secuencia_6 //declaraciones inicio llenar (A,n) leer(t) i ← 1 ENCONTRADO ← falso mientras (no ENCONTRADO) y (i = n) hacer si A[i] = t entonces ENCONTRADO ← verdadero fin_si i ← i + 1 fin_mientras si ENCONTRADO entonces escribir('El numero ocupa el lugar', i - 1) si_no escribir('El numero no esta en el vector') fin_si fin Nota De todas las versiones anteriores, tal vez la más adecuada sea la incluida en el método 6. Entre otras razones, debido a que el bucle mientras engloba las acciones que permiten explorar el vector, bien hasta que t se en- cuentre o bien cuando se alcance el final del vector. Método 7 algoritmo busqueda_secuencia_7 //declaraciones inicio llenar (A,n) leer(t)
  • 408. 378 Fundamentos de programación i ← 1 ENCONTRADO ← falso mientras i = n hacer si A[i] = t entonces ENCONTRADO ← verdad escribir ('El número ocupa el lugar'; i) fin_si i ← i + 1 fin_mientras si_no (ENCONTRADO) entonces escribir('El numero no esta en el vector') fin_si fin Método 8 algoritmo busqueda_secuencial_8 //declaraciones inicio llenar (A,n) ENCONTRADO ← falso i ← 0 leer(t) repetir i ← i+1 si A[i] = t entonces ENCONTRADO ← verdad fin_si hasta_que ENCONTRADO o (i = n) fin Método 9 algoritmo busqueda_secuencial_9 //declaraciones inicio llenar (A,n) ENCONTRADO ← falso leer(t) desde i ← 1 hasta i ← n hacer si A[i] = t entonces ENCONTRADO ← verdad fin_si fin_desde si ENCONTRADO entonces escribir('Elemento encontrado') si_no escribir('Elemento no encontrado') fin_si fin Consideraciones sobre la búsqueda lineal El método de búsqueda lineal tiene el inconveniente del consumo excesivo de tiempo en la localización del elemen- to buscado. Cuando el elemento buscado no se encuentra en el vector, se verifican o comprueban sus n elementos.
  • 409. Ordenación, búsqueda e intercalación 379 En los casos en que el elemento se encuentra en la lista, el número podrá ser el primero, el último o alguno com- prendido entre ambos. Se puede suponer que el número medio de comprobaciones o comparaciones a realizar es de (n+1)/2 (aproxima- damente igual a la mitad de los elementos del vector). La búsqueda secuencial o lineal no es el método más eficiente para vectores con un gran número de elementos. En estos casos, el método más idóneo es el de búsqueda binaria, que presupone una ordenación previa en los ele- mentos del vector. Este caso suele ser muy utilizado en numerosas facetas de la vida diaria. Un ejemplo de ello es la búsqueda del número de un abonado en una guía telefónica; normalmente no se busca el nombre en orden secuencial, sino que se busca en la primera o segunda mitad de la guía; una vez en esa mitad, se vuelve a tantear a una de sus dos submitades, y así sucesivamente se repite el proceso hasta que se localiza la página correcta. 10.3.2. Búsqueda binaria En una búsqueda secuencial se comienza con el primer elemento del vector y se busca en él hasta que se encuentra el elemento deseado o se alcanza el final del vector. Aunque este puede ser un método adecuado para pocos datos, se necesita una técnica más eficaz para conjuntos grandes de datos. Si el número de elementos del vector es grande, el algoritmo de búsqueda lineal se ralentizaría en tiempo de un modo considerable. Por ejemplo, si tuviéramos que consultar un nombre en la guía telefónica de una gran ciudad como Madrid, con una cifra aproximada de un millón de abonados, el tiempo de búsqueda —según el nombre— se podría eternizar. Naturalmente, las personas que viven en esa gran ciudad nunca utilizarán un método de búsqueda secuencial, sino un método que se basa en la división sucesiva del espacio ocupado por el vector en sucesivas mita- des, hasta encontrar el elemento buscado. Si los datos que se buscan están clasificados en un determinado orden, el método citado anteriormente se deno- mina búsqueda binaria. La búsqueda binaria utiliza un método de “divide y vencerás” para localizar el valor deseado. Con este método se examina primero el elemento central de la lista; si este es el elemento buscado, entonces la búsqueda ha termina- do. En caso contrario se determina si el elemento buscado está en la primera o la segunda mitad de la lista y, a con- tinuación, se repite este proceso, utilizando el elemento central de esa sublista. Supongamos la lista 1231 1473 1545 1834 1892 1898 elemento central 1983 2005 2446 2685 3200 Si está buscando el elemento 1983, se examina el número central, 1898, en la sexta posición. Ya que 1983 es mayor que 1898, se desprecia la primera sublista y nos centramos en la segunda 1983 2005 2446 elemento central 2685 3200 El número central de esta sublista es 2446 y el elemento buscado es 1983, menor que 2446; eliminamos la se- gunda sublista y nos queda 1983 2005
  • 410. 380 Fundamentos de programación Como no hay término central, elegimos el término inmediatamente anterior al término central, 1983, que es el buscado. Se han necesitado tres comparaciones, mientras que la búsqueda secuencial hubiese necesitado siete. La búsqueda binaria se utiliza en vectores ordenados y se basa en la constante división del espacio de búsqueda (recorrido del vector). Como se ha comentado, se comienza comparando el elemento que se busca, no con el primer elemento, sino con el elemento central. Si el elemento buscado —t— es menor que el elemento central, entonces t deberá estar en la mitad izquierda o inferior del vector; si es mayor que el valor central, deberá estar en la mitad derecha o superior, y si es igual al valor central, se habrá encontrado el elemento buscado. El funcionamiento de la búsqueda binaria en un vector de enteros se ilustra en la Figura 10.3 para dos búsquedas: con éxito (localizado el elemento) y sin éxito (no encontrado el elemento). El proceso de búsqueda debe terminar normalmente conociendo si la búsqueda ha tenido éxito (se ha encontrado el elemento) o bien no ha tenido éxito (no se ha encontrado el elemento) y normalmente se deberá devolver la posi- ción del elemento buscado dentro del vector. (a) (b) CENTRAL I,S I CENTRAL S I (inferior) CENTRAL S (superior) Elemento más pequeño que CENTRAL. Búsqueda en subvector izquierdo 4 6 8 10 12 14 16 4 6 8 10 12 14 16 I CENTRAL S Elemento mayor que CENTRAL. Búsqueda en subvector derecho 12 14 16 4 6 8 8 8 8 11 11 11 12 8 Figura 10.3. Ejemplo de búsqueda binaria: (a) con éxito, (b) sin éxito EJEMPLO 10.6 Encontrar el algoritmo de búsqueda binaria para encontrar un elemento K en una lista de elementos X1, X2, ..., Xn previamente clasificados en orden ascendente.
  • 411. Ordenación, búsqueda e intercalación 381 El array o vector X se supone ordenado en orden creciente si los datos son numéricos, o alfabéticamente si son caracteres. Las variables BAJO, CENTRAL, ALTO indican los límites inferior, central y superior del intervalo de bús- queda. algoritmo busqueda_binaria //declaraciones inicio //llenar (X,N) //ordenar (X,N) leer(K) //inicializar variables BAJO ← 1 ALTO ← N CENTRAL ← ent ((BAJO + ALTO) / 2) mientras (BAJO = ALTO) y (X[CENTRAL] K) hacer si K X[CENTRAL] entonces ALTO ← CENTRAL - 1 si_no BAJO ← CENTRAL + 1 fin_si CENTRAL ← ent ((BAJO + ALTO) / 2) fin_mientras si K = X[CENTRAL] entonces escribir('Valor encontrado en', CENTRAL) si_no escribir('Valor no encontrado') fin_si fin EJEMPLO 10.7 Se dispone de un vector tipo carácter NOMBRE clasificado en orden ascendente y de N elementos. Realizar el algo- ritmo que efectúe la búsqueda de un nombre introducido por el usuario. La variable N indica cuántos elementos existen en el array. ENCONTRADO es una variable lógica que detecta si se ha localizado el nombre buscado. algoritmo busqueda_nombre {inicializar todas las variables necesarias} {NOMBRE array de caracteres N numero de nombres del array NOMBRE ALTO puntero al extremo superior del intervalo BAJO puntero al extremo inferior del intervalo CENTRAL puntero al punto central del intervalo X nombre introducido por el usuario ENCONTRADO bandera o centinela} inicio llenar (NOMBRE, N) leer (X) BAJO ← 1 ALTO ← N ENCONTRADO ← falso mientras (no ENCONTRADO) y (BAJO = ALTO) hacer CENTRAL ← ent (BAJO+ALTO) / 2 //verificar nombre central en este intervalo
  • 412. 382 Fundamentos de programación si NOMBRE[CENTRAL] = X entonces ENCONTRADO ← verdad si_no si NOMBRE[CENTRAL] X entonces ALTO ← CENTRAL - 1 si_no BAJO ← CENTRAL + 1 fin_si fin_si fin_mientras si ENCONTRADO entonces escribir('Nombre encontrado') si_no escribir('Nombre no encontrado') fin_si fin Análisis de la búsqueda binaria La búsqueda binaria es un método eficiente siempre que el vector esté ordenado. En la práctica esto suele suceder, pero no siempre. Por esta razón la búsqueda binaria exige una ordenación previa del vector. Para poder medir la velocidad de cálculo del algoritmo de búsqueda binaria se deberán obtener el número de comparaciones que realiza el algoritmo. Consideremos un vector de siete elementos (n = 7). El número 8 (N + 1 = 8) se debe dividir en tres mitades an- tes de que se alcance 1; es decir, se necesitan tres comparaciones. 1 2 3 4 5 6 7 El medio matemático de expresar estos números es: 3 = log2 (8) en general, para n elementos: K = log2 (n + 1) Recuerde que log2 (8) es el exponente al que debe elevarse 2 para obtener 8. Es decir, 3, ya que 23 = 8. Si n + 1 es una potencia de 2, entonces log2 (n + 1) será un entero. Si n + 1 no es una potencia de 2, el valor del logaritmo se redondea hasta el siguiente entero. Por ejemplo, si n es 12, entonces K será 4, ya que log2 (13) (que está entre 3 y 4) se redondeará hasta 4 (24 es 16). En general, en el mejor de los casos se realizará una comparación y, en el peor de los casos, se realizarán log2 (n + 1) comparaciones. Como término medio, el número de comparaciones es 1 + log2(n + 1) 2 Esta fórmula se puede reducir para el caso de que n sea grande a log2(n + 1) 2
  • 413. Ordenación, búsqueda e intercalación 383 Para poder efectuar una comparación entre los métodos de búsqueda lineal y búsqueda binaria, realicemos los cálculos correspondientes para diferentes valores de n. n = 100 En la búsqueda secuencial se necesitarán 100 + 1 2 50 comparaciones En la búsqueda binaria log2 (100) = 6... log2 (100) = x donde 2x = 100 y x = 6...: 27 = 128 100 7 comparaciones n = 1.000.000 En la búsqueda secuencial: 1.000.000 + 1 2 500.000 comparaciones En la búsqueda binaria log2 (1.000.000) = x 2x = 1.000.000 donde x = 20 y 220 1.000.000 20 comparaciones Como se observa en los ejemplos anteriores, el tiempo de búsqueda es muy pequeño, aproximadamente siete comparaciones para 100 elementos y veinte para 1.000.000 de elementos. (Compruebe el lector que para 1.000 ele- mentos se requiere un máximo de diez comparaciones.) La búsqueda binaria tiene, sin embargo, inconvenientes a resaltar: El vector debe estar ordenado y el almacenamiento de un vector ordenado suele plantear problemas en las inser- ciones y eliminaciones de elementos. (En estos casos será necesario utilizar listas enlazadas o árboles binarios. Véan- se Capítulos 12 y 13.) La Tabla 10.2 compara la eficiencia de la búsqueda lineal y búsqueda binaria para diferentes valores de n. Como se observará en dicha tabla, la ventaja del método de búsqueda binaria aumenta a medida que n aumenta. Tabla 10.2. Eficiencia de las búsquedas lineal y binaria Búsqueda secuencial Búsqueda binaria Número de comparaciones Número máximo de comparaciones n Elemento no localizado Elemento no localizado 7 100 1.000 1.000.000 7 100 1.000 100.000 3 7 10 20 10.3.3. Búsqueda mediante transformación de claves (hashing) La búsqueda binaria proporciona un medio para reducir el tiempo requerido para buscar en una lista. Este método, sin embargo, exige que los datos estén ordenados. Existen otros métodos que pueden aumentar la velocidad de bús- queda en el que los datos no necesitan estar ordenados, este método se conoce como transformación de claves (clave- dirección) o hashing. El método de transformación de claves consiste en convertir la clave dada (numérica o alfanumérica) en una di- rección (índice) dentro del array. La correspondencia entre las claves y la dirección en el medio de almacenamiento o en el array se establece por una función de conversión (función o hash).
  • 414. 384 Fundamentos de programación Así, por ejemplo, en el caso de una lista de empleados (100) de una pequeña empresa. Si cada uno de los cien empleados tiene un número de identificación (clave) del 1 al 100, evidentemente puede existir una correspondencia directa entre la clave y la dirección definida en un vector o array de 100 elementos. Supongamos ahora que el campo clave de estos registros o elementos es el número del DNI o de la Seguridad Social, que contenga nueve dígitos. Si se desea mantener en un array todo el rango posible de valores, se necesitarán 10ˆ10 elementos en la tabla de almacenamiento, cantidad difícil de tener disponibles en memoria central, aproximadamente 1.000.000.000 de registros o elementos. Si el vector o archivo sólo tiene 100, 200 o 1.000 empleados, cómo hacer para introducirlos en memoria por el campo clave DNI. Para hacer uso de la clave DNI como un índice en la tabla de bús- queda, se necesita un medio para convertir el campo clave en una dirección o índice más pequeño. En la figura se pre- senta un diagrama de cómo realizar la operación de conversión de una clave grande en una tabla pequeña. 345671234 Clave (DNI) Función de conversación claves Tabla de transformación de claves Clave = 453126034 Clave = 345671234 Clave = 110000345 Clave = 467123326 . . . . . . [0] [1] [j] [98] [99] Los registros o elementos del campo clave no tienen por qué estar ordenados de acuerdo con los valores del campo clave, como estaban en la búsqueda binaria. Por ejemplo, el registro del campo clave 345671234 estará almacenado en la tabla de transformación de claves (array) en una posición determinada; por ejemplo, 75. La función de transformación de clave, H(k) convierte la clave (k) en una dirección (d). Imaginemos que las claves fueran nombres o frases de hasta dieciséis letras, que identifican a un conjunto de un millar de personas. Existirán 26ˆ16 combinaciones posibles de claves que se deben transformar en 103 direcciones o índices posibles. La función H es, por consiguiente, evidentemente una función de paso o conversión de múltiples claves a direcciones. Dada una clave k, el primer paso en la operación de búsqueda es calcular su índice asociado d ← H(k) y el segundo paso —evidentemente necesario— es verificar sí o no el elemento con la clave k es identifi- cado verdaderamente por d en el array T; es decir, para verificar si la clave T[H(K)] = K se deben considerar dos preguntas: • ¿Qué clase de función H se utilizará? • ¿Cómo resolver la situación de que H no produzca la posición del elemento asociado? La respuesta a la segunda cuestión es que se debe utilizar algún método para producir una posición alternativa, es decir, el índice d', y si ésta no es aún la posición del elemento deseado, se produce un tercer índice d, y así su- cesivamente. El caso en el que una clave distinta de la deseada está en la posición identificada se denomina colisión; la tarea de generación de índices alternativos se denomina tratamiento de colisiones. Un ejemplo de colisiones puede ser: clave 345123124 clave 416457234 función de conversión H → dirección 200 función de conversión H → dirección 200
  • 415. Ordenación, búsqueda e intercalación 385 Dos claves distintas producen la misma dirección, es decir, colisiones. La elección de una buena función de con- versión exige un tratamiento idóneo de colisiones, es decir, la reducción del número de colisiones. 10.3.3.1. Métodos de transformación de claves Existen numerosos métodos de transformación de claves. Todos ellos tienen en común la necesidad de convertir claves en direcciones. En esencia, la función de conversión equivale a una caja negra que podríamos llamar calculador de direcciones. Cuando se desea localizar un elemento de clave x, el indicador de direcciones indicará en qué posición del array estará situado el elemento. . . . . 1 2 h – 1 h Calculador de direcciones x Truncamiento Ignora parte de la clave y se utiliza la parte restante directamente como índice (considerando campos no numéricos y sus códigos numéricos). Si las claves, por ejemplo, son enteros de ocho dígitos y la tabla de transformación tiene mil posiciones, entonces el primero, segundo y quinto dígitos desde la derecha pueden formar la función de conver- sión. Por ejemplo, 72588495 se convierte en 895. El truncamiento es un método muy rápido, pero falla para distribuir las claves de modo uniforme. Plegamiento La técnica del plegamiento consiste en la partición de la clave en diferentes partes y la combinación de las partes en un modo conveniente (a menudo utilizando suma o multiplicación) para obtener el índice. La clave x se divide en varias partes, x1, x2, ..., xn, donde cada parte, con la única posible excepción de la última parte, tiene el mismo número de dígitos que la dirección más alta que podría ser utilizada. A continuación se suman todas las partes h(x) = x1 + x2 + ... + xn En esta operación se desprecian los dígitos más significativos que se obtengan de arrastre o acarreo. EJEMPLO 10.8 Un entero de ocho dígitos se puede dividir en grupos de tres, tres y dos dígitos, los grupos se suman juntos y se truncan si es necesario para que estén en el rango adecuado de índices. Por consiguiente, si la clave es: 62538194 y el número de direcciones es 100, la función de conversión será 625 + 381 + 94 = 1100 que se truncará a 100 y que será la dirección deseada.
  • 416. 386 Fundamentos de programación EJEMPLO 10.9 Los números empleados —campo clave— de una empresa constan de cuatro dígitos y las direcciones reales son 100. Se desea calcular las direcciones correspondientes por el método de plegamiento de los empleados. 4205 8148 3355 Solución h(4205) = 42 + 05 = 47 h(8148) = 81 + 48 = 129 y se convierte en 29 (129 – 100), es decir, se ignora el acarreo 1 h(3355) = 33 + 55 = 88 Si se desea afinar más se podría hacer la inversa de las partes pares y luego sumarlas. Aritmética modular Convertir la clave a un entero, dividir por el tamaño del rango del índice y tomar el resto como resultado. La función de conversión utilizada es mod (módulo o resto de la división entera). h(x) = x mod m donde m es el tamaño del array con índices de 0 a m – 1. Los valores de la función —direcciones— (el resto) irán de 0 a m – 1, ligeramente menor que el tamaño del array. La mejor elección de los módulos son los números primos. Por ejemplo, en un array de 1.000 elementos se puede elegir 997 o 1.009. Otros ejemplos son 18 mod 6 19 mod 6 20 mod 6 que proporcionan unos restos de 0, 1 y 2 respectivamente. Si se desea que las direcciones vayan de 0 hasta m, la función de conversión debe ser h(x) = x mod (m + 1) EJEMPLO 10.10 Un vector T tiene cien posiciones, 0..100. Supongamos que las claves de búsqueda de los elementos de la tabla son enteros positivos (por ejemplo, número del DNI). Una función de conversión h debe tomar un número arbitrario entero positivo x y convertirlo en un entero en el rango 0..100, esto es, h es una función tal que para un entero positivo x. h(x) = n, donde n es entero en el rango 0..100 El método del módulo, tomando 101, será h(x) = x mod 101 Si se tiene el DNI número 234661234, por ejemplo, se tendrá la posición 56: 234661234 mod 101 = 56 EJEMPLO 10.11 La clave de búsqueda es una cadena de caracteres —tal como un nombre—. Obtener las direcciones de conver- sión. El método más simple es asignar a cada carácter de la cadena un valor entero (por ejemplo, A = 1, B = 2, ...) y sumar los valores de los caracteres en la cadena. Al resultado se le aplica entonces el módulo 101, por ejemplo.
  • 417. Ordenación, búsqueda e intercalación 387 Si el nombre fuese JONAS, esta clave se convertiría en el entero 10 + 15 + 14 + 1 + 19 = 63 63 mod 101 = 63 Mitad del cuadrado Este método consiste en calcular el cuadrado de la clave x. La función de conversión se define como h(x) = c donde c se obtiene eliminando dígitos a ambos extremos de x2 . Se deben utilizar las mismas posiciones de x2 para todas las claves. EJEMPLO 10.12 Una empresa tiene ochenta empleados y cada uno de ellos tiene un número de identificación de cuatro dígitos y el conjunto de direcciones de memoria varía en el rango de 0 a 100. Calcular las direcciones que se obtendrán al aplicar función de conversión por la mitad del cuadrado de los números empleados: 4205 7148 3350 Solución x 4205 7148 3350 x2 17 682 025 51 093 904 11 122 250 Si elegimos, por ejemplo, el cuarto y quinto dígito significativo, quedaría h(x) 82 93 22 10.3.3.2. Colisiones La función de conversión h(x) no siempre proporciona valores distintos, puede suceder que para dos claves diferentes x1 y x2 se obtenga la misma dirección. Esta situación se denomina colisión y se deben encontrar métodos para su correcta resolución. Los ejemplos vistos anteriormente de las claves DNI correspondientes al archivo de empleados, en el caso de cien posibles direcciones. Si se considera el método del módulo en el caso de las claves, y se considera el número prime- ro 101 123445678 123445880 proporcionarían las direcciones: h (123445678) = 123445678 mod 101 = 44 h (123445880) = 123445880 mod 101 = 44 Es decir, se tienen dos elementos en la misma posición del vector o array, [44]. En terminología de claves se dice que las claves 123445678 y 123445880 han colisionado. El único medio para evitar el problema de las colisiones totalmente es tener una posición del array para cada posible número de DNI. Si, por ejemplo, los números de DNI son las claves y el DNI se representa con nueve dígi- tos, se necesitaría una posición del array para cada entero en el rango 000000000 a 999999999. Evidentemente, sería necesario una gran cantidad de almacenamiento. En general, el único método para evitar colisiones totalmente es que el array sea lo bastante grande para que cada posible valor de la clave de búsqueda pueda tener su propia posición. Ya que esto normalmente no es práctico ni posible, se necesitará un medio para tratar o resolver las colisiones cuan- do sucedan.
  • 418. 388 Fundamentos de programación Resolución de colisiones Consideremos el problema producido por una colisión. Supongamos que desea insertar un elemento con número nacional de identidad DNI 12345678, en un array T. Se aplica la función de conversión del módulo y se determina que el nuevo elemento se situará en la posición T[44]. Sin embargo, se observa que T[44] ya contiene un elemen- to con DNI 123445779. h(12345678) ... ... 1 2 3 ... 44 ... 99 100 Array T Elemento con DNI 12345779 ya ocupa la posición T[44] Figura 10.4. Colisión. La pregunta que se plantea inmediatamente es ¿qué hacer con el nuevo elemento? Un método comúnmente utilizado para resolver una colisión es cambiar la estructura del array T de modo que pueda alojar más de un elemento en la misma posición. Se puede, por ejemplo, modificar T de modo que cada posi- ción T[i] sea por sí misma un array capaz de contener N elementos. El problema, evidentemente, será saber la mag- nitud de N. Si N es muy pequeño, el problema de las colisiones aparecerá cuando aparezca N + 1 elementos. Una solución mejor es permitir una lista enlazada o encadenada de elementos para formar a partir de cada posi- ción del array. En este método de resolución de colisiones, conocido como encadenamiento, cada entrada T[i] es un puntero que apunta al elemento del principio de la lista de elementos (véase Capítulo 12), de modo que la función de transformación de clave lo convierte en la posición i. 0 2 h – 2 h – 1 1 ... ... ... ... Figura 10.5. Encadenamiento. 10.4. INTERCALACIÓN La intercalación es el proceso de mezclar (intercalar) dos vectores ordenados y producir un nuevo vector ordenado. Consideremos los vectores (listas de elementos) ordenados: A: 6 23 34 B: 5 22 26 27 39 El vector clasificado es: C: 5 6 22 23 24 26 27 39
  • 419. Ordenación, búsqueda e intercalación 389 La acción requerida para solucionar el problema es muy fácil de visualizar. Un algoritmo sencillo puede ser: 1. Poner todos los valores del vector A en el vector C. 2. Poner todos los valores del vector B en el vector C. 3. Clasificar el vector C. Es decir, todos los valores se ponen en el vector C, con todos los valores de A seguidos por todos los valores de B. Seguidamente, se clasifica el vector C. Evidentemente es una solución correcta. Sin embargo, se ignora por comple- to el hecho de que los vectores A y B están clasificados. Supongamos que los vectores A y B tienen M y N elementos. El vector C tendrá M + N elementos. El algoritmo comenzará seleccionando el más pequeño de los dos elementos A y B, situándolo en C. Para poder realizar las comparaciones sucesivas y la creación del nuevo vector C, necesitaremos dos índices para los vectores A y B. Por ejemplo, i y j. Entonces nos referiremos al elemento i en la lista A y al elemento j en la lista B. Los pasos generales del algoritmo son: si elemento i de A es menor que elemento j de B entonces transferir elemento i de A a C avanzar i (incrementar en 1) si_no transferir elemento j de B a C avanzar j fin_si Se necesita un índice K que represente la posición que se va rellenando en el vector C. El proceso gráfico se muestra en la Figura 10.6. Comparar A[i] y B[j]. Poner el más pequeño en C[k]. Incrementar los índices apropiados . –15 0 13 15 78 90 94 96 Lista B 2 4 78 97 2 4 78 97 Lista A i –15 Lista C k j j se ha incrementado junto con k. –15 0 Lista B Lista A –15 Lista C 0 Figura 10.6. Intercalación (B[j] A[i], de modo que C[k] se obtiene de B[j]). El primer refinamiento del algoritmo. {estado inicial de los algoritmos} i ← 1 j ← 1 k ← 0 mientras (i = M) y (j = N) hacer //seleccionar siguiente elemento de A o B y añadir a C k ← k + 1 //incrementar K}
  • 420. 390 Fundamentos de programación si A[i] B[j] entonces C[k] ← A[i] i ← i + 1 si_no C[k] ← B[j] j ← j + 1 fin_si fin_mientras Si los vectores tienen elementos diferentes, el algoritmo anterior no requiere seguir haciendo comparaciones cuando el vector más pequeño se termine de situar en C. La operación siguiente deberá copiar en C los elementos que restan del vector más grande. Así, por ejemplo, supongamos: A = 6 23 24 i = 4 B = 5 22 26 27 39 j = 3 C = 5 6 22 23 24 k = 5 Todos los elementos del vector A se han relacionado y situado en el vector C. El vector B contiene los elementos no seleccionados y que deben ser copiados, en orden, al final del vector C. En general, será necesario decidir cuál de los vectores A o B tienen elementos no seleccionados y a continuación ejecutar la asignación necesaria. El algoritmo de copia de los elementos restantes es: si i = M entonces desde r ← i hasta M hacer k ← k + 1 C[k] ← A[r] fin_desde si_no desde r ← j hasta N hacer k ← k + 1 C[k] ← B[r] fin_desde fin_si El algoritmo total resultante de la intercalación de dos vectores A y B ordenados en uno C es: algoritmo intercalacion inicio leer(A, B) //A, B vectores de M y N elementos i ← 1 j ← 1 k ← 0 mientras (i = M) y (j = N) hacer //seleccionar siguiente elemento de A o B y añadirlo a C k ← k+1 si A[i] B[j] entonces C[k] ← A[i] i ← i + 1 si_no C[k] ← B[j] j ← j + 1 fin_si fin_mientras //copiar el vector restante si i = M entonces
  • 421. Ordenación, búsqueda e intercalación 391 desde r ← i hasta M hacer k ← k + 1 C[k] ← A[r] fin_desde si_no desde r ← j hasta N hacer k ← k + 1 C[k] ← B[r] fin_desde fin_si escribir(C) //vector clasificado fin ACTIVIDADES DE PROGRAMACIÓN RESUELTAS 10.1. Clasificar una serie de números X1, X2, ..., Xn en orden creciente por el método del intercambio o de la bur- buja. Análisis Se utiliza un indicador (bandera) igual a 0 si la serie está bien ordenada y a 1 en caso contrario. Como a priori la serie no está bien ordenada, se inicializa el valor de la bandera a 1 y después se repiten las siguientes acciones: • Se fija la bandera a 0. • A partir del primero se comparan dos elementos consecutivos de la serie; si están bien ordenados, se pasa al ele- mento siguiente, si no se intercambian los valores de los dos elementos y se fija el valor de la bandera a 1; si después de haber pasado revista —leído— toda la serie, la bandera permanece igual a 0, entonces la clasificación está ter- minada. BANDERA → 1 mientras BANDERA = 1 BANDERA = 0 no intercambiar X[I] y X[I + 1] BANDERA ← 1 Algoritmo clasificación Escribir Serie ordenada desde I = 1 a N – 1 si X[I] X[I + 1]
  • 422. 392 Fundamentos de programación 10.2. Clasificar los números A y B. Método 1 algoritmo clasificar inicio leer(A, B) si A B entonces permutar (A , B) fin_si escribir('Mas grande', A) escribir('Más pequeña', B) fin Método 2 algoritmo clasificar inicio leer(A) MAX ← A leer(B) MIN ← B si B A entonces MAX ← B MIN ← A fin_si escribir('Maximo =', MAX) escribir('Mínimo =', MIN) fin 10.3. Se dispone de una lista de números enteros clasificados en orden creciente. Se desea conocer si un número dado introducido desde el terminal se encuentra en la lista. En caso afirmativo, averiguar su posición, y en caso negati- vo, se desea conocer su posición en la lista e insertarlo en su posición. Análisis Como ya conoce el lector, existen dos métodos fundamentales de búsqueda: lineal y binaria. Resolvemos el problema con los dos métodos a fin de consolidar las ideas sobre ambos. Búsqueda lineal El método consiste en comparar el número dado en orden sucesivo con todos los elementos del conjunto de números, efec- tuando un recorrido completo del vector que representa la lista. El proceso termina cuando se encuentra un número igual o superior al número dado. El método de inserción o intercalación de un elemento en el vector será el descrito en el apartado 6.3.4. La tabla de variables es la siguiente: N número de elementos de la lista: entero. J posición del elemento en la lista: entero. K contador del bucle de búsqueda: entero. X número dado: entero. LISTA conjunto de números enteros. Búsqueda dicotómica La condición para realizar este método —más rápido y eficaz— es que la lista debe estar clasificada en orden creciente o decreciente. Se obtiene el número de elementos de la lista y se calcula el número central de la lista. Si el número dado es igual al número central de la lista, la búsqueda ha terminado. En caso contrario, pueden suceder dos casos:
  • 423. Ordenación, búsqueda e intercalación 393 • El número está en la sublista inferior. • El número está en la sublista superior. Tras localizar la sublista donde se encuentra, se consideran variables MIN y MAX que contienen los elementos menor y mayor de cada sublista —que coincidirán con los extremos al estar ordenada la lista—, así como el término central (CEN- TRAL), de acuerdo al siguiente esquema. Sublista inferior L[1] L[2] ...L[CENTRAL] Sublista superior L[CENTRAL + 1]...L[N] Los valores de las variables INF, SUP y CENTRAL serán: Primera búsqueda CENTRAL = (SUP – INF) 2 + INF = N – 1 2 + 1 = N – 1 2 SUP = N INF = 1 • Si el número X está en la sublista inferior, entonces INF = 1 SUP = CENTRAL - 1 y se realiza una segunda búsqueda entre los elementos de orden 1 y CENTRAL. • Si el número X está en la sublista superior, entonces INF = CENTRAL + 1 SUP = N y se realiza una segunda búsqueda entre los elementos de orden CENTRAL + 1 y N. El proceso de variables es: N número de elementos de la lista: entero. I contador del bucle de búsqueda: entero. SW interruptor o bandera para indicar si el número dado está en la lista: lógico. LISTA conjunto de números enteros: entero. X número buscado: entero. INF posición inicial de la lista o sublista: entero. SUP posición superior de la lista o sublista: entero. POSICION lugar del orden ocupado por el número buscado: entero. Pseudocódigo Búsqueda lineal algoritmo busqueda_1 var entero : I, K, X, N array[1..50] de entero : lista //se supone dimensión de la lista a 50 elementos y que se trata de una //lista ordenada inicio leer(N) //lectura de la lista
  • 424. 394 Fundamentos de programación desde I ← 1 hasta N hacer leer(LISTA[I]) fin_desde Ordenar (LISTA, N) leer(X) I ← 0 repetir I ← I + 1 hasta_que (LISTA[I] = X) o (I = 50) si LISTA[I] = X entonces escribir('se encuentra en',I) si_no escribir('El numero dado no esta en el lista') //insertar el elemento X en la lista si N 50 entonces desde K ← N hasta I decremento 1 hacer LISTA[K + 1] ← LISTA[K] fin_desde LISTA[I] ← X N ← N + 1 escribir('Insertado en',I) fin_si fin_si //escritura del vector LISTA desde I ← 1 hasta N hacer escribir(LISTA[I]) fin_desde fin Búsqueda dicotómica algoritmo busqueda_b var entero: I, N, X, K, INF, SUP, CENTRAL, POSICION lógico: SW array [1...50] de entero: LISTA inicio leer(N) desde I ← 1 hasta N hacer leer(LISTA[I]) //la lista ha de estar ordenada fin_desde Ordenar (LISTA, N) leer(X) SW ← falso INF ← 1 SUP ← N repetir CENTRAL ← (SUP - INF)DIV 2 + INF si LISTA[CENTRAL] = X entonces escribir('Numero encontrado en la lista') POSICION ← CENTRAL escribir(POSICION) SW ← verdad si_no si X LISTA[CENTRAL] entonces SUP ← CENTRAL si_no INF ← CENTRAL+1
  • 425. Ordenación, búsqueda e intercalación 395 fin_si si (INF = SUP) y (LISTA[INF] = X) entonces escribir('El numero esta en la lista') POSICION ← INF escribir(POSICION) SW ← verdad fin_si fin_si hasta_que (INF = SUP) o SW si no (SW) entonces escribir('Numero no existe en la lista') si X lista(INF) entonces POSICION ← INF si_no POSICION ← INF+1 fin_si escribir(POSICION) desde K ← N hasta POSICION decremento 1 hacer LISTA[K + 1] ← LISTA[K] fin_desde LISTA[POSICION] ← X N ← N + 1 fin_si //escritura de la lista desde I ← 1 hasta N hacer escribir(LISTA[I]) fin_desde fin 10.4. Ordenar de mayor a menor un vector de N elementos (N = 40), cada uno de los cuales es un registro con los campos día, mes y año de tipo entero. Utilice una función ESMENOR(fecha1,fecha2) que nos devuelva si una fecha es menor que otra. algoritmo ordfechas tipo registro: fechas inicio entero: dia entero: mes entero: año fin_registro array[1..40] de fechas: arr var arr : f entero : n inicio pedirfechas(f,n) ordenarfechas(f,n) presentarfechas(f,n) fin logico función esmenor(E fechas: fecha1,fecha2) inicio si (fecha1.añofecha2.año) o (fecha1.año=fecha2.año) y (fecha1.mesfecha2.mes) o (fecha1.año=fecha2.año) y (fecha1.mes=fecha2.mes) y (fecha1.díafecha2.día) entonces devolver(verdad) si_no devolver(falso) fin_si fin_función
  • 426. 396 Fundamentos de programación procedimiento pedirfechas(S arr:f; S entero:n) var entero:i entero:dia inicio i←1 escribir (Deme la ,i,ª fecha) escribir(Día: ) leer(dia) mientras (dia0) y (i=40) hacer f[i].dia ← dia escribir(Mes:) leer(f[i].mes) escribir(Año:) leer(f[i].año) n ← i i ← i+1 si i=40 entonces escribir (Deme la ,i,ª fecha) escribir (Día: ) leer(dia) fin_si fin_mientras fin_procedimiento procedimiento ordenarfechas(E/S arr:f; E entero:n) var entero:salto lógico:ordenada entero:j fechas:AUXI inicio salto ← n mientras salto 1 hacer salto ← salto div 2 repetir ordenada ← verdad desde j ← 1 hasta n-salto hacer si esmenor(f[j], f[j+salto]) entonces AUXI ← f[j] f[j] ← f[j+salto] f[j+salto] ← AUXI ordenada ← falso fin_si fin_desde hasta ordenada fin_mientras fin_procedimiento procedimiento presentarfechas(E arr:f; E entero:n) var entero:i inicio desde i←1 hasta n hacer escribir(f[i].día,f[i].mes,f[i].año) fin_desde fin_procedimiento Considere otras posibilidades, usando el mismo método de ordenación, para resolver el ejercicio.
  • 427. Ordenación, búsqueda e intercalación 397 10.5. Dada la lista de fechas ordenada en orden decreciente del ejercicio anterior, diseñar los procedimientos: 1. Buscar, que nos informará sobre si una determinada fecha se encuentra o no en la lista — si no está, indicará la posición donde correspondería insertarla, — si está, nos dirá la posición donde la hemos encontrado o, si estuviera repetida, a partir de qué posición y cuántas veces son las que aparece. 2. Insertar, que nos permitirá insertar una fecha en una determinada posición. Se deberá utilizar en un algoritmo haciendo uso previo de buscar; así, cuando una fecha no se encuentre en la lista, la insertará en el lugar adecua- do para que no se pierda la ordenación inicial. algoritmo buscar_insertar_fechas tipo registro: fechas inicio entero: dia entero: mes entero: año fin_registro array[1..40] de fechas: vector var vector : f entero : n fechas : fecha lógico : esta entero : posic, cont inicio pedirfechas(f,n) ordenarfechas(f,n) presentarfechas(f,n) escribir('Deme fecha a buscar (dd mm aa)') leer(fecha.dia,fecha.mes,fecha.año) buscar(f,n,fecha,esta,posic,cont) si esta entonces si cont 1 entonces escribir('Aparece a partir de la posición: ', posic, ' ', cont, ' veces') si_no escribir('Está en la posición: ', posic ) fin_si si_no si n=40 entonces escribir('No está. Array lleno') si_no insertar(f,n,fecha,posic) presentarfechas(f,n) fin_si fin_si fin logico función esmenor(E fechas: fecha1,fecha2) inicio .................... fin_función logico función esigual(E fechas: fecha1,fecha2) inicio si (fecha1.año=fecha2.año) y (fecha1.mes=fecha2.mes) y (fecha1.día=fecha2.día) entonces devolver(verdad)
  • 428. 398 Fundamentos de programación si_no devolver(falso) fin_si fin_función procedimiento pedirfechas(S vector: f; S entero n) var entero: i entero: dia inicio ... fin_procedimiento procedimiento ordenarfechas(E/S vector: f; E entero: n) var entero : salto lógico : ordenada entero : j fechas : AUXIi inicio ... fin_procedimiento procedimiento buscar(E vector: f; E entero:n; E fechas: fecha; S lógico:esta; S entero: posic, cont) var entero : primero,ultimo,central,i lógico : encontrado inicio primero ← 1 ultimo ← n esta ← falso mientras (primero=ultimo) y (no esta) hacer central ← (primero+ultimo) div 2 si esigual(f[central],fecha) entonces esta ← verdad si_no si esmenor(f[central],fecha) entonces ultimo ← central-1 si_no primero ← central+1 fin_si fin_si fin_mientras cont ← 0 si esta entonces i ← central-1 encontrado ← verdad mientras (i=1) y (encontrado) hacer si esigual(f[i],f[central]) entonces i ← i-1 si_no encontrado ← falso fin_si fin_mientras i ← i+1 encontrado ← verdad posic ← i mientras (i=40) y encontrado hacer si esigual(f[i],f[central]) entonces cont ← cont+1 i ← i+1
  • 429. Ordenación, búsqueda e intercalación 399 si_no encontrado ← falso fin_si fin_mientras si_no posic ← primero fin_si fin_procedimiento procedimiento insertar(E/S vector: f; E/S entero: n E fechas:fecha; E entero:posic) var entero:i inicio desde i ← n hasta posic decremento 1 hacer f[i+1] ← f[i] fin_desde f[posic] ← fecha n ← n+1 fin_procedimiento procedimiento presentarfechas(E vector:f; E entero:n) var entero:i inicio ... fin_procedimiento 10.6. Escriba el procedimiento de búsqueda binaria de forma recursiva algoritmo busqueda_binaria tipo array[1..10] de entero: arr var arr : a entero : num, posic, i inicio desde i ← 1 hasta 10 hacer leer(a[i]) fin_desde ordenar(a) escribir('Indique el número a buscar en el array ') leer(num) busqueda(a,posic,1,10,num) si posic 0 entonces escribir('Existe el elemento en la posición ', posic) si_no escribir('No existe el elemento en el array.') fin_si fin procedimiento ordenar(E/S arr: a) ... inicio ... fin_procedimiento procedimiento busqueda(E arr: a; S entero: posic E entero: primero,ultimo,num) //Este procedimiento devuelve 0 si no existe el elemento en el array, y si existe devuelve su posición var entero: central
  • 430. 400 Fundamentos de programación inicio si primero ultimo entonces posic ← 0 si_no central ← (primero+ultimo) div 2 si a[central] = num entonces posic ← central si_no si num a[central] entonces primero ← central + 1 si_no ultimo ← central - 1 fin_si busqueda(a,posic,primero,ultimo,num) fin_si fin_si fin_procedimiento 10.7. Partiendo de la siguiente lista inicial: 80 36 98 62 26 78 22 27 2 45 tome como elemento pivote el contenido del que ocupa la posición central y realice el seguimiento de los distintos pasos que llevarían a su ordenación por el método Quick-Sort. Implemente el algoritmo correspondiente. 1 2 3 4 5 6 7 8 9 10 80 36 98 62 26 78 22 27 2 45 2 80 22 36 26 98 j i 1 2 3 4 5 6 7 8 9 10 2 22 26 62 98 78 36 27 80 45 22 j i 1 2 3 4 5 6 7 8 9 10 2 22 26 62 98 78 36 27 80 45 27 62 36 98 j i 1 2 3 4 5 6 7 8 9 10 2 22 26 27 36 78 98 62 80 45 27 j i 1 2 3 4 5 6 7 8 9 10 2 22 26 27 36 78 98 62 80 45 45 78 62 98 j i 1 2 3 4 5 6 7 8 9 10 2 22 26 27 36 45 62 98 80 78 45 j i 1 2 3 4 5 6 7 8 9 10 2 22 26 27 36 45 62 98 80 78 78 98 80 j i 1 2 3 4 5 6 7 8 9 10 2 22 26 27 36 45 62 78 80 98
  • 431. Ordenación, búsqueda e intercalación 401 algoritmo quicksort tipo array[1..10] de entero: arr var arr : a entero : k inicio desde k ← 1 hasta 10 hacer leer (a[k]) fin_desde rápido (a,10) desde k ← 1 hasta 10 hacer escribir (a[k]) fin_desde fin procedimiento intercambiar (E/S entero: m,n) var entero: AUXI inicio AUXI ← m m ← n n ← AUXI fin_procedimiento procedimiento partir (E/S arr: a E entero: primero, ultimo) var entero: i,j,central inicio i ← primero j ← ultimo // encontrar elemento pivote, central, y almacenar su contenido central ← a[ (primero+ultimo) div 2 ] repetir mientras a[i] central hacer i ← i+1 fin_mientras mientras a[j] central hacer j ← j-1 fin_mientras si i = j entonces intercambiar( a[i],a[j] ) i ← i+1 j ← j-1 fin_si hasta_que i j si primero j entonces partir (a,primero,j) fin_si si i ultimo entonces partir (a,i,ultimo) fin_si fin_procedimiento procedimiento rapido (E/S arr: a; E entero: n) inicio partir (a,1,n) fin_procedimiento
  • 432. 402 Fundamentos de programación CONCEPTOS CLAVE • Búsqueda. • Eficiencia de los métodos de ordenación. • Intercalación. • Ordenación. • Tipos de búsqueda. RESUMEN La ordenación de datos es una de las aplicaciones más im- portantes de las computadoras. Dado que es frecuente que un programa trabaje con grandes cantidades de datos alma- cenados en arrays, resulta imprescindible conocer diversos métodos de ordenación de arrays y cómo, además, puede ser necesario determinar si un array contiene un valor que coincide con un cierto valor clave también resulta básico conocer los algoritmos de búsqueda. 1. La ordenación o clasificación es el proceso de organizar datos en algún orden o secuencia espe- cífica, tal como creciente o decreciente para datos numéricos o alfabéticamente para datos de caracte- res. La ordenación de arrays (arreglos) se denomi- na ordenación interna, ya que se efectúa con todos los datos en la memoria interna de computadora. 2. Es posible ordenar arrays por diversas técnicas, como burbuja, selección, inserción, Shell o Quick- Sort y, cuando el número de elementos a ordenar es pequeño, todos estos métodos son aceptables. 3. Para ordenar arrays con un gran número de ele- mentos debe tenerse en cuenta la diferente efi- ciencia en cuanto al tiempo de ejecución entre los métodos comentados. Entre los citados, QuickSort y Shell son los más avanzados. 4. El método de búsqueda lineal de un determinado valor clave en un array, que compara cada elemen- to con la clave buscada, puede ser útil en arrays pequeños o no ordenados. 5. El método de búsqueda binaria es mucho más efi- ciente pero requiere arrays ordenados. 6. Puesto que los arrays permiten el acceso directo a un determinado elemento o posición, la informa- ción en un array no tiene por qué ser colocada en forma secuencial. Es, por tanto, posible usar una función hash que transforme el valor clave en un número válido para ser utilizado como subíndice en el array y almacenar la información en la po- sición especificada por dicho subíndice. 7. Una función de conversión hash no siempre pro- porciona valores distintos, y puede suceder que para dos claves diferentes devuelva la misma dirección. Esta situación se denomina colisión y se deben encontrar métodos para su correcta resolución. 8. Entre los métodos para resolver las colisiones destacan: a) Reservar una zona especial en el array para colocar las colisiones. b) Buscar la primera posición libre que siga a aquélla donde se debiera haber colocado la información y en la que no se pudo situar por encontrarse ya ocupada debido a la colisión. c) Utilizar encadenamiento. 9. Si la información se coloca en un array apli- cando una función hash a determinado campo clave y estableciendo un método de resolución de colisiones, la consulta por dicho campo clave también se efectuará de forma análoga. 10. Cuando se tienen dos vectores ordenados y se ne- cesita obtener otro también ordenado, el proceso de intercalación o mezcla debe producirnos el resultado deseado, sin que sea necesario aplicar a continuación ningún método de ordenación.
  • 433. Ordenación, búsqueda e intercalación 403 EJERCICIOS 10.1. Realizar el diagrama de flujo y el pseudocódigo que permuta tres enteros: n1, n2 y n3 en orden cre- ciente. 10.2. Escribir un algoritmo que lea diez nombres y los pon- ga en orden alfabético utilizando el método de selec- ción. Utilice los siguientes datos para comprobación: Sánchez, Waterloo, McDonald, Bartolomé, Jorba, Clara, David, Robinson, Francisco, Westfalia. 10.3. Clasificar el array (vector): 42 57 14 40 96 19 08 68 por los métodos: 1) selección, 2) burbuja. Cada vez que se reorganice el vector, se debe mostrar el nuevo vector reformado. 10.4. Supongamos que se tiene una secuencia de n núme- ros que deben ser clasificados: 1. Utilizando el método de selección, cuántas com- paraciones y cuántos intercambios se requieren para clasificar la secuencia si: • Ya está clasificado. • Está en orden inverso. 2. Repetir el paso i para el método de selección. 10.5. Escribir un algoritmo de búsqueda lineal para un vector ordenado. 10.6. Un algoritmo ha sido diseñado para leer una lista de no más de 1.000 enteros positivos, cada uno menos de 100, y ejecutar algunas operaciones. El cero es la marca final de la lista. El programador debe obtener en el algoritmo. 1. Visualizar los números de la lista en orden cre- ciente. 2. Calcular e imprimir la mediana (valor central). 3. Determinar el número que ocurre más frecuen- temente. 4. Imprimir una lista que contenga: • Números menores de 30. • Números mayores de 70. • Números que no pertenezcan a los dos grupos anteriores. 5. Encontrar e imprimir el entero más grande de la lista junto con su posición en la lista antes de que los números hayan sido ordenados. 10.7. Diseñar diferentes algoritmos para insertar un nuevo valor en una lista (vector). La lista debe estar orde- nada en orden ascendente antes y después de la in- serción.
  • 435. CAPÍTULO 11 Ordenación, búsqueda y fusión externa (archivos) 11.1. Introducción 11.2. Archivos ordenados 11.3. Fusión de archivos 11.4. Partición de archivos 11.5. Clasificación de archivos ACTIVIDADES DE PROGRAMACIÓN RESUELTAS CONCEPTOS CLAVE RESUMEN EJERCICIOS Los sistemas de procesamiento de la información pro- cesan normalmente gran cantidad de información. En estos casos los datos se almacenan sobre soportes de almacenamiento masivo (cintas y discos magnéticos). Los algoritmos de ordenación presentados en el Ca- pítulo 10 no son aplicables si la masa de datos no cabe en la memoria central de la computadora y se encuentran almacenados en su soporte como una cin- ta. En estos casos se suelen colocar en memoria cen- tral las fichas que se procesan y a las que se pueda acceder directamente. Normalmente estas técnicas no son muy eficaces y se utilizan técnicas distintas de ordenación. La técnica más importante es la fusión o mezcla. Este capítulo realiza una introducción a las técnicas de ordenación, búsqueda y mezcla o fusión externas. INTRODUCCIÓN
  • 436. 406 Fundamentos de programación 11.1. INTRODUCCIÓN Cuando la masa de datos a procesar es grande y no cabe en la memoria central de la computadora, los datos se or- ganizan en archivos que, a su vez, se almacenan en dispositivos externos de memoria auxiliar (discos, cintas magné- ticas, etc.). Las operaciones básicas estudiadas en el Capítulo 10, ordenación, búsqueda e intercalación o mezcla, sufren un cambio importante en su concepción, derivado esencialmente del hecho físico de que los datos a procesar no caben en la memoria principal de la computadora. 11.2. ARCHIVOS ORDENADOS El tratamiento de los archivos secuenciales exige que éstos se encuentren ordenados respecto a un campo del registro, denominado campo clave. Supongamos un archivo del personal de una empresa, cuya estructura de registros es la siguiente: NOMBRE DIRECCION FECHA SALARIO CATEGORIA DNI tipo cadena tipo cadena tipo cadena tipo numérico tipo cadena tipo cadena (nombre del empleado) (dirección) (fecha de nacimiento) (salario) (categoría laboral) (número de DNI) La clasificación en orden ascendente o descendente se puede realizar con respecto a una clave (nombre, dirección, etc.). Sin embargo, puede ser interesante tener clasificado un fichero por categoría laboral y a su vez se puede tener por cada categoría laboral los registros agrupados por nombres o direcciones. Ello nos lleva a la conclu- sión de que un archivo puede estar ordenado por un campo clave o una jerarquía de campos. Se dice que un archivo (estructura del registro: campos C1, C2, ... Cn) está ordenado principalmente por el cam- po C1, en orden secundario 1 por el campo C2, en orden secundario 2 por el campo C3, etc., en orden secundario n por el campo Cn. Si el archivo tiene la siguiente organización: • Los registros aparecen en el archivo según el orden de los valores del campo clave C1. • Si se considera un mismo valor C1, los registros aparecen en el orden de los valores del campo C2. • Para un mismo valor de C(Ci) los registros aparecen según el orden de los valores del campo Ci + 1, siendo 1 = i = n. Si se desea ordenar un archivo principalmente por C1, y en orden secundario 1 por C2, se necesita: • Ordenar primero por C2. • Ejecutar a continuación una ordenación estable por el campo C1. La mayoría de los Sistemas Operativos actuales disponen de programas estándar (utilidad) que realizan la clasi- ficación de uno o varios archivos (sort). En el caso del Sistema Operativo MS-DOS existe la orden SORT, que per- mite realizar la clasificación de archivos según ciertos criterios específicos. Los algoritmos de clasificación externa son muy numerosos y a ellos dedicaremos gran parte de este capítulo. 11.3. FUSIÓN DE ARCHIVOS La fusión o mezcla de archivos (merge) consiste en reunir en un archivo los registros de dos o más archivos ordena- dos por un campo clave T. El archivo resultante será un archivo ordenado por el campo clave T. Supongamos que se dispone de dos archivos ordenados sobre dos cintas magnéticas y que se desean mezclar o fundir en un solo archivo ordenado. Sean los archivos F1 y F2 almacenados en dos cintas diferentes. El archivo F3 se construye en una tercera cinta.
  • 437. Ordenación, búsqueda y fusión externa (archivos) 407 El algoritmo de fusión de archivos será inicio //fusión de dos archivos 1. poner archivo 1 en cinta 1, archivo 2 en cinta 2 2. seleccionar de los dos primeros registros de archivo 1 y archivo 2 el registro de clave más pequeña y almacenarlo en un nuevo archivo 3 3. mientras (archivo 1 no vacio) y (archivo 2 no vacio) hacer 4. seleccionar el registro siguiente con clave mas pequeña y almacenarlo en el archivo 3 fin_mientras //uno de los archivos no está aún vacío 5. almacenar resto archivo en archivo 3 registro a registro fin EJEMPLO 11.1 Se dispone de dos archivos, F1 y F2, cuyos campos claves son F1 12 24 36 37 40 52 F2 3 8 9 20 y se desea un archivo FR ordenado, que contenga los dos archivos F1 y F2. La estructura de los archivos F1 y F2 es: F1 12 24 36 37 40 52 EOF(*) Fin archivo (eof) F2 3 8 9 20 Para realizar la fusión de F1 y F2 es preciso acceder a los archivos F1 y F2 que se encuentran en soportes mag- néticos en organización secuencial. En cada operación de acceso a un archivo sólo se puede acceder a un único ele- mento del archivo en un momento dado. Para realizar la operación se utiliza una variable de trabajo del mismo tipo que los elementos del archivo. Esta variable representa al elemento actual del archivo y denominaremos ventana, debido a que será la variable que nos permitirá ver el archivo, elemento tras elemento. El archivo se recorre en un único sentido y su final físico termina con una marca especial denominada fin de archivo (EOF, end of file); por ejemplo, un asterisco (*). 12 3 8 9 20 * 24 36 37 52 40 F1 Ventana Ventana F2 * Se comparan las claves de las ventanas y se sitúa la más pequeña 3(F2) en el archivo de salida. A continuación, se avanza un elemento el archivo F2 y se realiza una nueva comparación de los elementos situados en las ventanas. 3 8 9 20 * Ventana Ventana 12 24 36 40 * 52 F1 F2 3 F3
  • 438. 408 Fundamentos de programación Cuando uno u otro de los archivos de entrada se ha terminado, se copia el resto del archivo sobre el archivo de salida y el resultado final será: 3 8 9 12 20 24 36 37 40 52 * FR El algoritmo correspondiente de fusión de archivos será algoritmo fusion_archivo var entero:ventana1, ventana2, ventanaS archivo_s de entero: F1,F2,F3 //ventana1,ventana2 claves de los archivos F1,F2 ventanaS claves del archivo FR inicio abrir (F1, l, 'nombre') abrir (F2, l, 'nombre2') crear (FR, 'nombre3') abrir (FR, e, 'nombre3') leer (F1, ventana1) leer (F2, ventana2) mientras no FDA(F1) y no FDA (F2) hacer si ventana1 = ventana2 entonces ventanaS ← ventana1 escribir(FR,ventanaS) leer (F1, ventana1) si_no ventanaS ← ventana2 escribir (FR, ventanaS) leer (F2, ventana2) fin_si fin_mientras //lectura terminada de F1 o F2 mientras no FDA (F1) hacer ventanaS ← ventana1 escribir(FR, ventanaS) leer(F1, ventana1) fin_mientras mientras_no FDA(F2)hacer ventanaS ← ventana2 escribir (FR, ventanaS) leer(F2, ventana2) fin_mientras cerrar (F1,F2,FR) fin Se considera ahora el otro caso posible en los archivo secuenciales. El final físico del archivo se detecta al leer el último elemento (no la marca de fin de archivo) y los ficheros son de registros con varios campos. El algoritmo correspondiente a la fusión sería: tipo registro: datos_personales -: C //campo por el que estan ordenados -:- fin_registro archivo_s de datos_personales: arch
  • 439. Ordenación, búsqueda y fusión externa (archivos) 409 var datos_personales:r1, r2 arch: f1, f2, f //f es el fichero resultante lógico: fin1, fin2 inicio abrir (f1, l, 'nombre1') abrir (f2, l, 'nombre2') crear (f, 'nombre3') abrir (f, e, 'nombre3') fin1← falso fin2← falso si FDA (f1) entonces fin1← verdad si-no leer_reg (f1, r1) fin_si si FDA (f2) entonces fin2← verdad si_no leer_reg (f2, r2) fin_si mientras NO fin1 y NO fin2 hacer si r1.c r2.c entonces escribir_reg (f, r1) si FDA (f1) entonces fin1← verdad si_no leer_reg (f1, r1) fin_si si_no escribir_reg (f, r2) si FDA (f2) entonces fin2← verdad si_no leer_reg (f2,r2) fin_si fin_si fin_mientras mientras NO fin1 hacer escribir_reg (f, r1) si FDA (f1) entonces fin1← verdad si_no leer_reg (f1, r1) fin_si fin_mientras mientras NO fin2 hacer escribir_reg (f, r2) si FDA (f2) entonces fin2← verdad si_no leer_reg (f2, r2) fin_si fin_mientras cerrar (f1, f2, f) fin
  • 440. 410 Fundamentos de programación 11.4. PARTICIÓN DE ARCHIVOS La partición o división de un archivo consiste en repartir los registros de un archivo en otros dos o más archivos en función de una determinada condición. Aunque existen muchos métodos de producir particiones a partir de un archivo no clasificado, consideraremos sólo los siguientes métodos: • clasificación interna, • por el contenido, • selección por sustitución, • secuencias. Supongamos el archivo de entrada siguiente, en el que se indican las claves de los registros: 110 48 33 69 46 2 62 39 28 47 16 19 34 55 99 78 75 40 35 87 10 26 61 92 99 75 11 2 28 16 80 73 18 12 89 50 47 36 67 94 23 15 84 44 53 60 10 39 76 18 24 86 11.4.1. Clasificación interna El método más sencillo consiste en leer M registros a la vez de un archivo no clasificado, clasificarlos utilizando un método de clasificación interna y a continuación darles salida como partición. Obsérvese que todas las particiones producidas de este modo, excepto posiblemente la última, contendrán exactamente M registros. La figura muestra las particiones producidas a partir del archivo de entrada de la figura utilizada un tamaño de memoria (M) de cinco re- gistros. 33 46 48 69 110 2 28 39 47 62 16 19 34 55 99 35 40 75 78 87 10 26 61 92 99 2 11 16 28 75 12 18 73 80 89 36 47 50 67 94 15 23 44 53 84 10 18 39 60 76 24 86 11.4.2. Partición por contenido La partición del archivo de entrada se realiza en función del contenido de uno o más campos del registro. Así, por ejemplo, si se supone un archivo f que se desea dividir en dos archivos f1 y f2, tal que f1 contenga todos los registros que contengan en el campo clave c, el valor v y en el archivo f2 los restantes registros. El algoritmo de partición se muestra a continuación: algoritmo particionå_contenido .... inicio abrir (f, l,'nombre') crear (f1, 'nombre1') abrir (f1, e, 'nombre1')
  • 441. Ordenación, búsqueda y fusión externa (archivos) 411 crear (f2, 'nombre2') abrir ( f2, e, 'nombre2') leer(v) mientras NO FDA (f) hacer leer_reg (f, r) si v = r.c entonces escribir_reg (f1,r) si_no escribir_reg (f2, r) fin_si fin_mientras cerrar (f, f1, f2) fin 11.4.3. Selección por sustitución La clasificación interna vista en el apartado 11.4.1 no tiene en cuenta la ventaja que puede suponer cualquier orde- nación parcial que pueda existir en el archivo de entrada. El algoritmo de selección por sustitución tiene en cuenta tal ordenación. Los pasos a dar para obtener particiones ordenadas son: 1. Leer N registros del archivo desordenado, poniéndolos todos a no congelados. 2. Obtener el registro R con clave más pequeña de entre los no congelados y escribirlo en partición. 3. Sustituir el registro por el siguiente del archivo de entrada. Este registro se congelará si su clave es más pe- queña que la del registro R y no se congelará en otro caso. Si hay registro sin congelar volver al paso 2. 4. Comenzar nueva partición. Si se ha llegado a fin de fichero se repite el proceso sin leer. Nota: Al final de este método los ficheros con las particiones tienen secuencias ordenadas, lo que no quiere decir que ambos hayan quedado completamente ordenados. F: 3 31 14 42 10 15 8 13 63 18 50 F1 F2 3 31 14 42 3 13 50 8 18 8 10 31 14 42 10 13 50 8 18 13 15 31 14 42 14 13 50 8 18 18 15 31 8 42 15 13 50 8 18 50 13 31 8 42 31 13 50 8 18 13 63 8 42 42 13 63 8 18 63 13 50 8 18 algoritmo particion_s const n= valor tipo registro: datos_personales tipo_dato:c ... fin_registro registro: datos datos_personales: dp logico : congela fin_registro array[1..n] de datos: arr archivo_s de datos_personales: arch var
  • 442. 412 Fundamentos de programación datos_personales: r arr : a arch : f1,f2, f lógico : sw entero : numcongelados, y, posicionmenor inicio abrir(f, l, 'nombre') crear(f1, 'nombre1') abrir(f1, e, 'nombre1') crear(f2,'nombre2') abrir(f2, e, 'nombre32') numcongelados ← 0 desde i ← 1 hasta n hacer si no fda(f) entonces leer_reg(f, r) a[i].dp ← r a[i].congela ← falso si_no a[i].congela ← verdad numcongelados ← numcongelados + 1 fin_si fin_desde sw ← verdad mientras no fda(f) hacer mientras (numcongelados n) y no fda(f) hacer buscar_no_congelado_menor(a, posicionmenor) si sw entonces escribir_reg(f1, a[posicionmenor].dp) si_no escribir_reg(f2, a[posicionmenor].dp) fin_si leer_reg(f, r) si r.c. a[posicionmenor].dp.c entonces a[posicionmenor].dp ← r si_no a[posicionmenor].dp ← r a[posicionmenor].congela ← verdad numcongelados ← numcongelados + 1 fin_si fin_mientras sw ← no sw descongelar(a) numcongelados ← 0 fin_mientras mientras numcongelados n hacer buscar_no_congelado_menor(a, posicionmenor) si sw entonces escribir_reg(f1,a[posicionmenor].dp) si_no escribir_reg(f2, a[posicionmenor].dp) fin_si a[posicionmenor].congela ← verdad numcongelados ← numcongelados + 1 fin_mientras cerrar(f, f1, f2) fin
  • 443. Ordenación, búsqueda y fusión externa (archivos) 413 11.4.4. Partición por secuencias Los registros se dividen en secuencias alternativas con longitudes iguales o diferentes según los casos. Las secuencias pueden ser de diferentes diseños: • El archivo f se divide en dos archivos, f1 y f2, copiando alternativamente en uno y otro archivo secuencias de registros de longitud m. (Algoritmo particion_1.) • El archivo f se divide en dos archivos, f1 y f2, de modo que en f1 se copian los registros que ocupan las posiciones pares y en f2 los registros que ocupan las posiciones impares. (Algoritmo particion_2.) algoritmo particion_1 tipo registro: datos personales tipodato : C .............. fin_registro archivo_s de datos_personales : arch var datos_personales: r arch : f, f1, f2 lógico : SW entero : i, n inicio abrir (f, l, 'nombre') crear (f1, 'nombre1') abrir (f1, e, 'nombre1') crear (f2, 'nombre2') abrir (f2, e, 'nombre2') i← 0 leer (n) SW← verdad mientras NO FDA (f) hacer leer_reg (f,r) si SW entonces escribir_reg (f2, r) si_no escribir_reg (f2,r) fin_si i← i+1 si i = n entonces SW ← NO SW i ← 0 fin_si fin_mientras cerrar (f, f1, f2) fin algoritmo particion_2 tipo registro: datos_personales tipo_dato : C ............... fin_registro archivo_s de datos_personales : arch var datos_personales : r
  • 444. 414 Fundamentos de programación arch : f1, f2, f lógico : SW inicio abrir (f, l, 'nombre') crear (f1, 'nombre1') abrir (f1, e, 'nombre1') crear (f2, 'nombre2') abrir (f2, e, 'nombre2') SW← verdad mientras NO FDA (f) hacer leer_reg (f, r) si SW entonces escribir_reg (f1,r) si_no escribir_reg (f2,r) fin_si SW← NO SW fin_mientras cerrar (f, f1, f2) fin 11.5. CLASIFICACIÓN DE ARCHIVOS Los archivos están clasificados en orden ascendente o descendente cuando todos sus registros están ordenados en sentido ascendente o descendente respecto al valor de un campo determinado, denominado clave de ordenación. Si el archivo a ordenar cabe en memoria central, se carga en un vector y se realiza una clasificación interna, transfiriendo a continuación el archivo ordenado al soporte externo o copiando el resultado en el archivo original si no se desea conservar. En el caso de que el archivo no quepa en memoria central, la clasificación se realizará sobre el archivo almace- nado en un soporte externo. El inconveniente de este tipo de clasificación reside en el tiempo, que será mucho mayor debido especialmente a las operaciones entrada/salida de información que requiere la clasificación externa. Los algoritmos de clasificación son muy variados, pero muchos de ellos se basan en procedimientos mixtos con- sistentes en aprovechar al máximo la capacidad de la memoria central. Como métodos de clasificación de archivos que no utilizan la memoria central y son aplicables a archivos secuen- ciales, se tienen la mezcla directa y la mezcla natural. 11.5.1. Clasificación por mezcla directa El método más fácil de comprender es el denominado mezcla directa. Se analiza su aplicación a través de un breve ejemplo en el que se aplicará el método sobre un vector. Se puede pensar en los componentes del vector como las claves de los registros sucesivos del archivo. El procedimiento consiste en una partición sucesiva del archivo y una fusión que produce secuencias ordenadas. La primera partición se hace para secuencias de longitud 1 utilizando dos archivos auxiliares y la fusión produci- rá secuencias ordenadas de longitud 2. A cada nueva partición y fusión se duplicará la longitud de las secuencias ordenadas. El método terminará cuando la longitud de la secuencia ordenada exceda la longitud del archivo a or- denar. Consideremos el archivo: F: 19 27 2 8 36 5 20 15 6 El archivo F se divide en dos nuevos archivos F1 y F2: F1: 19 2 36 20 6 F2: 27 8 5 15
  • 445. Ordenación, búsqueda y fusión externa (archivos) 415 Ahora se funden los archivos F1 y F2, formando pares ordenados: F: 19 27 2 8 5 36 15 20 6 Se vuelve a dividir de nuevo en partes iguales y en secuencias de longitud 2 F1: 19 27 5 36 6 F2: 2 8 15 20 La fusión de los archivos producirá F: 2 8 19 27 5 15 20 36 6 La nueva partición será F1: 2 8 19 27 6 F2: 5 15 20 36 La nueva fusión será F: 2 5 8 15 19 20 27 36 6 Cada operación que trata por completo el conjunto de datos en su totalidad se denomina una fase y el proceso de ordenación se denomina pasada. F1: 2 5 8 15 19 20 27 36 F2: 6 F: 2 5 6 8 15 19 20 27 36 Evidentemente, la clave de la clasificación es disminuir el número de pasadas e incrementar su tamaño; una se- cuencia ordenada es una que contiene sólo una pasada que, a su vez, contiene todos los elementos de la pasada. EJEMPLO 11.2 Para la implementación de los siguientes algoritmos no se consideró la existencia de un registro especial que indi- cara el fin de archivo. La función FDA(id_arch) retorna cierto cuando se accede al último registro. Si se considerase la existencia del registro especial que marca el fin de archivo se podría prescindir del uso de las variables lógicas fin, fin1, fin2. algoritmo ord_mezcla_directa ... procedimiento ordmezcladirecta var datos_personales: r,r1,r2 arch : f,f1,f2 // El tipo arch es archivo_s de datos_personales entero : lgtud, long lógico : sw,fin1,fin2 entero : i,j inicio // calcularlongitud(f) es una función definida por el usuario que // devuelve el número de registros del archivo original
  • 446. 416 Fundamentos de programación long ← calcularlogitud(f) lgtud ← 1 mientras lgtud long hacer abrir(f,l,'fd') crear(f1,'f1d') crear(f2,'f2d') abrir(f1,e,'f1d') abrir(f2,e,'f2d') i ← 0 sw ← verdad mientras no FDA(f) hacer leer_reg(f,r) si sw entonces escribir_reg(f1,r) si_no escribir_reg(f2,r) fin_si i ← i + 1 si i=lgtud entonces sw ← no sw i ← 0 fin_si fin_mientras cerrar(f,f1,f2) abrir(f1,l,'f1d') abrir(f2,l,'f2d') crear(f,'fd') abrir (f,e,'fd') i ← 0 j ← 0 fin1 ← falso fin2 ← falso si FDA(f1) entonces fin1 ← verdad si_no leer_reg(f1,r1) fin_si si FDA(f2) entonces fin2 ← verdad si_no leer_reg(f2,r2) fin_si mientras no fin1 o no fin2 hacer mientras no fin1 y no fin2 y (ilgtud) y (jlgtud) hacer si menor(r1,r2) entonces escribir_reg(f,r1) si FDA(f1) entonces fin1 ← verdad si_no leer_reg(f1,r1) fin_si i ← i + 1 si_no escribir_reg(f,r2) si FDA(f2) entonces fin2 ← verdad
  • 447. Ordenación, búsqueda y fusión externa (archivos) 417 si_no leer_reg(f2,r2) fin_si j ← j + 1 fin_si fin_mientras mientras no fin1 y (i lgtud) hacer escribir_reg(f,r1) si FDA(f1) entonces fin1 ← verdad si_no leer_reg(f1,r1) fin_si i ← i + 1 fin_mientras mientras no fin2 y (j lgtud) hacer escribir_reg(f,r2) si FDA(f2) entonces fin2 ← verdad si_no leer_reg(f2,r2) fin_si j ← j + 1 fin_mientras i ← 0 j ← 0 fin_mientras // del mientras no fin1 o no fin2 cerrar(f,f1,f2) lgtud ← lgtud*2 fin_mientras // del mientras lgtud long borrar('f1d') borrar('f2d') fin_procedimiento 11.5.2. Clasificación por mezcla natural Es uno de los mejores métodos de ordenación de ficheros secuenciales. Consiste en aprovechar la posible ordenación interna de las secuencias del archivo (F), obteniendo con ellas particiones ordenadas de longitud variable sobre una serie de archivos auxiliares, en este caso dos, F1 y F2. A partir de estos ficheros auxiliares se escribe un nuevo F mezclando los segmentos crecientes máximos de cada uno de ellos. EJEMPLO 11.3 Clasificar el vector F: 19 27 2 8 36 5 20 15 6 Se divide F en dos vectores F1 y F2, donde se ponen alternativamente los elementos F1 y F2. F está ahora vacío. Etapa 1, fase 1: F1: 19 27/ 5 20/ 6 F2: 2 8 36/ 15 Se selecciona el elemento más pequeño de F1 y F2, que pasan a estar en F3.
  • 448. 418 Fundamentos de programación Etapa 1, fase 2: F1: 19 27/ 5 20/ 6 F2: 8 36/ 15 F3: 2 Ahora se comparan 8 y 19, se selecciona 8. De modo similar, 19 y 27: F1: 5 20/ 6 F2: 36/ 15 F3: 2 8 19 27 En F1 se ha interrumpido la secuencia creciente y se continúa con F2 hasta que también en él se termine la se- cuencia creciente. F1: 5 20/ 6 F2: 15 F3: 2 8 19 27 36 Ahora 5 y 15 son menores que 36. Finalmente se tendrá F3: 2 8 19 27 36/ 5 15 20/ 6 F1 y F2 están ahora vacíos. Etapa 2, fase 1: Dividir F3 en dos F1: 2 8 19 27 36/ 6 F2: 5 15 20 Etapa 2, fase 2: Se mezclan F1 y F2 F3: 2 5 8 15 19 20 27 36 6 Etapa 3, fase 1: F1: 2 5 8 15 19 20 27 36 F2: 6 Etapa 3, fase 2: F3: 2 5 6 8 15 19 20 27 36 y el archivo F3 ya está ordenado. Algoritmo algoritmo ord_mezcla_natural ... procedimiento ordmezclanatural var datos_personales: r,r1,r2,ant,ant1,ant2 arch : f,f1,f2 //El tipo arch es archivo_s de datos_personales
  • 449. Ordenación, búsqueda y fusión externa (archivos) 419 lógico : ordenado,crece,fin,fin1,fin2 entero : numsec inicio ordenado ← falso mientras no ordenado hacer // Partir abrir(f,l,'fd') crear(f1,'f1d') crear(f2,'f2d'); abrir(f1,e,'f1d') abrir(f2,e,'f2d') fin ← falso si FDA(f) entonces fin ← verdad si_no leer_reg(f,r) fin_si mientras no fin hacer ant ← r crece ← verdad mientras crece y no fin hacer si menorigual(ant,r) entonces escribir_reg(f1,r) ant ← r si FDA(f) entonces fin ← verdad si_no leer_reg(f,r) fin_si si_no crece ← falso fin_si fin mientras ant ← r crece ← verdad mientras crece y no fin hacer si menorigual(ant,r) entonces escribir_reg(f2,r) ant ← r si FDA(f) entonces fin ← verdad si_no leer_reg(f,r) fin_si si_no crece ← falso fin_si fin_mientras fin_mientras cerrar(f,f1,f2) //Mezclar abrir(f1,l,'f1d') abrir(f2,l.'f2d') crear(f,'fd') abrir(f,e,'fd') fin1 ← falso
  • 450. 420 Fundamentos de programación fin2 ← falso si FDA(f1) entonces fin1 ← verdad si_no leer_reg(f1,r1) fin_si si FDA(f2) entonces fin2 ← verdad si_no leer_reg(f2,r2) fin_si numsec ← 0 mientras NO fin1 y NO fin2 hacer ant1 ← r1 ant2 ← r2 crece ← verdad mientras NO fin1 y NO fin2 y crece hacer si menorigual(ant1,r1) y menorigual(ant2,r2) entonces si menorigual(r1,r2) entonces escribir_reg(f,r1) ant1 ← r1 si FDA(f1) entonces fin1 ← verdad si_no leer_reg(f1,r1) fin_si si_no escribir_reg(f,r2) ant2 ← r2 si FDA(f2) entonces fin2 ← verdad si_no leer_reg(f2,r2) fin_si fin_si si_no crece ← falso fin_si fin_mientras mientras NO fin1 y menorigual(ant1,r1) hacer escribir_reg(f,r1) ant1 ← r1 si FDA(f1) entonces fin1 ← verdad si_no leer_reg(f1,r1) fin_si fin_mientras mientras NO fin2 y menorigual(ant2,r2) hacer escribir_reg(f,r2) ant2 ← r2 si FDA(f2) entonces fin2 ← verdad si_no leer_reg(f2,r2) fin_si
  • 451. Ordenación, búsqueda y fusión externa (archivos) 421 fin_mientras numsec ← numsec + 1 fin_mientras // del mientras no fin1 y no fin2 si NO fin1 entonces numsec ← numsec+1 mientras NO fin1 hacer escribir_reg(f,r1) si FDA(f1) entonces fin1 ← verdad si_no leer_reg(f1,r1) fin_si fin_mientras fin_si si no fin2 entonces numsec ← numsec+1 mientras no fin2 hacer escribir_reg(f,r2) si FDA(f2) entonces fin2 ← verdad si_no leer_reg(f2,r2) fin_si fin_mientras fin_si cerrar(f,f1,f2) si numsec = 1 entonces ordenado ← verdad fin_si fin_mientras // del mientras no ordenado borrar('f1d') borrar('f2d') fin_procedimiento 11.5.3. Clasificación por mezcla de secuencias equilibradas Este método utiliza la memoria de la computadora para realizar clasificaciones internas y cuatro archivos secuencia- les temporales para trabajar. Supóngase un archivo de entrada F que se desea ordenar por orden creciente de las claves de sus elementos. Se dispone de cuatro archivos secuenciales de trabajo, F1, F2, F3 y F4, y que se pueden colocar m elementos en me- moria central en un momento dado en una tabla T de m elementos. El proceso es el siguiente: 1. Lectura de archivo de entrada por bloques de n elementos. 2. Ordenación de cada uno de estos bloques y escritura alternativa sobre F1 y F2. 3. Fusión de F1 y F2 en bloques de 2n elementos que se escriben alternativamente sobre F3 y F4. 4. Fusión de F3 y F4 y escritura alternativa en F1 y F2, de bloques con 4n elementos ordenados. 5. El proceso consiste en doblar cada vez el tamaño de los bloques y utilizando las parejas (F1, F2) y (F3, F4). Fichero de entrada 46 66 4 12 7 5 34 32 68 8 99 16 13 14 12 10 F1 4 12 46 66 8 16 68 99 F2 [5 7 32 34] [10 12 13 14] F3 vacio F4 vacio
  • 452. 422 Fundamentos de programación Fusión por bloques F1 vacío F2 vacío F3 4 5 7 12 32 34 46 66 /F4 8 10 12 13 14 16 68 99 La mezcla o fusión final es F1 4 5 7 8 10 12 12 13 14 16 32 34 46 66 68 99 F2 vacío F3 vacío F4 vacío ACTIVIDADES DE PROGRAMACIÓN RESUELTAS 11.1. Realizar el algoritmo de partición de un archivo F en dos particiones F1 y F2, según el contenido de un campo clave C. El contenido debe tener el valor v. algoritmo Partición_contenido ... inicio abrir(f, l, 'f0') //lectura crear (f1, 'f1') crear (f2, 'f2') abrir (f1, e, 'f1') //escritura abrir (f2, e, 'f2') //escritura mientras no fda(f) hacer leer_reg(f, r) si r.c = v entonces escribir_reg(f1, r) si_no escribir_reg(f2, r) fin_si fin_mientras cerrar( f1, f2, f) fin 11.2. Realizar el algoritmo de partición por secuencias alternativas de longitud n. • Entrada: Archivo F • Salida: Archivos F1, F2 • Secuencia: longitud n (n registros en cada secuencia) • Cada n registros se almacenan alternativamente en F1 y F2. algoritmo Partir_alternativa tipo registro: reg ... fin_registro archivo_s de reg : arch var logico: sw entero: i //contador de elementos de la secuencia arch: f, f1, f2 reg: r inicio abrir(f, l, 'f0') //lectura crear (f1, 'f1')
  • 453. Ordenación, búsqueda y fusión externa (archivos) 423 crear (f2, 'f2') abrir (f1, e, 'f1') //escritura abrir (f2, e, 'f2') //escritura sw ← falso i ← 0 mientras no fda(f) hacer leer_reg(f, r) si NO sw entonces escribir_reg(f1, r) si_no escribir_reg(f2, r) fin_si i ← i+1 si i= n entonces sw ← verdadero i ← 0 //se inicializa el contador de la secuencia fin_si fin_mientras cerrar(f, f1, f2) fin 11.3. Aplicar el algoritmo de mezcla directa al archivo F de claves. F: 9 7 2 8 16 15 2 10 1. Primera división (partición en secuencias de longitud 1) F1: 9 2 16 2 F2: 7 8 15 10 2. Mezcla de F1 y F2, formando pares ordenados F: 7 9 || 2 8 || 15 16 || 2 10 3. Segunda división (partición en secuencias de longitud 2) F1: 7 9 || 15 16 F2: 2 8 || 2 10 4. Mezcla de F1 y F2 F: 2 7 8 9 || 2 10 15 16 5. Tercera división (partición en secuencias de longitud 4) F1: 2 7 8 9 F2: 2 10 15 16 6. Mezcla de F1 y F2 (última) F: 2 2 7 8 9 10 15 16 11.4. Escribir el procedimiento de mezcla de dos archivos ordenados en secuencias de una determinada longitud. procedimiento fusion (E cadena: nombre1, nombre2, nombre3; E entero: lgtud) var arch : f1, f2, f //el tipo arch se supone definido en el programa principal reg: r1, r2 // el tipo reg se supone definido en el programa principal entero : i, j lógico : fin1, fin2 inicio {los nombres de los archivos en el dispositivo de almacenamiento se
  • 454. 424 Fundamentos de programación pasan al procedimiento de fusión a través de las variables nombre1, nombre2 y nombre3 } abrir(f1,l, nombre1) abrir(f2,l, nombre2) crear(f, nombre3) abrir (f, e, nombre3) leerRegYFin(f1, r1, fin1) { leerRegYFin es un procedimiento, desarrollado más adelante, que lee un registro y detecta la marca de fin de archivo} leerRegYFin(f2, r2, fin2) mientras no fin1 o no fin2 hacer i ← 0 j ← 0 mientras no fin1 y no fin2 y (ilgtud) y (jlgtud) hacer //lgtud es la longitud de la secuencia recibida como parámetro si menor(r1,r2) entonces escribir_reg(f,r1) leerRegYFin(f1, r1, fin1) i ← i+1 si_no escribir_reg(f,r2) leerRegYFin(f2, r2, fin2) j ← j+1 fin_si fin_mientras mientras no fin1 y (i lgtud) hacer escribir_reg(f,r1) leerRegYFin(f1, r1, fin1) i ← i+1 fin_mientras mientras no fin2 y (j lgtud) hacer escribir_reg(f,r2) leerRegYFin(f2, r2, fin2) j ← j+1 fin_mientras fin_mientras // del mientras no fin1 o no fin2 cerrar(f,f1,f2) fin_procedimiento procedimiento leerRegYFin(E/S arch: f; E/S reg: r; E/S lógico: fin) inicio si fda(f) entonces fin ← verdad si_no leer_reg(f, r) fin_si fin_procedimiento 11.5. Escribir el procedimiento de ordenación por mezcla directa de un archivo con long registros, utilizando el proce- dimiento fusión del ejercicio anterior. procedimiento ordenarDirecta(E cadena: nombref, nombref1, nombref2; E entero: long) var entero: lgtud inicio lgtud ← 1 mientras lgtud = long hacer partirAlternativoEnSec (nombref, nombref1, nombref2, lgtud) fusion(nombref1, nombref2, nombref, lgtud) lgtud ← lgtud * 2
  • 455. Ordenación, búsqueda y fusión externa (archivos) 425 fin_mientras borrar(nombref1) borrar(nombref2) fin_procedimiento procedimiento partirAlternativoEnSec (E cadena: nombref, nombref1, nombref2; E entero: lgtud) var lógico: sw entero: i // contador de elementos de la secuencia arch : f1, f2, f // tipo definido en el programa principal reg: r // tipo definido en el programa principal inicio abrir(f, l, nombref) //lectura crear (f1, nombref1) crear (f2, nombref2) abrir (f1, e, nombref1) //escritura abrir (f2, e, nombref2) //escritura sw ← falso i ← 0 mientras no fda(f) hacer leer_reg(f, r) si NO sw entonces escribir_reg(f1, r) si_no escribir_reg(f2, r) fin_si i ← i+1 si i= lgtud entonces sw ← verdadero i ← 0 //se inicializa el contador de la secuencia fin_si fin_mientras cerrar(f, f1, f2) fin 11.6. Escribir el procedimiento de ordenación por mezcla natural de un archivo, utilizando los procedimientos auxiliares partir y mezclar que se suponen implementados. El procedimiento partir aprovecha las secuencias ordenadas que pudieran existir en el archivo original y las coloca alternativamente sobre dos archivos auxiliares. El procedi- miento mezclar construye a partir de dos ficheros auxiliares un nuevo fichero, mezclando las secuencias crecientes que encuentra en los ficheros auxiliares para construir sobre el destino secuencias crecientes de longitud mayor. procedimiento ordenarNatural(E cadena: nombref, nombref1, nombref2) var entero: numsec lógico: ordenado inicio ordenado ← falso mientras NO ordenado hacer partir (nombref, nombref1, nombref2) numsec ← 0 mezclar(nombref1, nombref2, nombref, numsec) si numsec =1 entonces ordenado ← verdad fin_si fin_mientras borrar(nombref1) borrar(nombref2) fin_procedimiento
  • 456. 426 Fundamentos de programación CONCEPTOS CLAVE • Mezcla. • Mezcla directa. • Mezcla natural. • Ordenación externa. • Partición. RESUMEN La ordenación externa se emplea cuando la masa de datos a procesar es grande y no cabe en la memoria central de la computadora. Si el archivo es directo, aunque los registros se encuentran colocados en él de forma secuencial, servirá cualquiera de los métodos de clasificación vistos como mé- todos de ordenación interna, con ligeras modificaciones debido a las operaciones de lectura y escritura de registros en el disco. Si el archivo es secuencial, es necesario em- plear otros métodos basados en procesos de partición y medida. 1. La partición es el proceso por el cual los registros de un archivo se reparten en otros dos o más archi- vos en función de una condición. 2. La fusión o mezcla consiste en reunir en un archi- vo los registros de dos o más. Habitualmente los registros de los archivos originales se encuentran ordenados por un campo clave, y la mezcla ha de efectuarse de tal forma que se obtenga un archivo ordenado por dicho campo clave. 3. Los archivos están clasificados en orden ascen- dente o descendente cuando todos sus registros están ordenados en sentido ascendente o descen- dente respecto al valor de un campo determinado, denominado clave de ordenación. Los algoritmos de clasificación son muy variados: (1) si el archi- vo a ordenar cabe en memoria central, se carga en un vector y se realiza una clasificación interna, transfiriendo a continuación el archivo ordenado al soporte externo; (2) si el archivo a ordenar no cabe en memoria central y es secuencial son aplicables la mezcla directa y la mezcla natural; (3) si no es secuencial pueden aplicarse métodos similares a los vistos en la clasificación interna con ligeras modificaciones; (4) otros métodos se basan en procedimientos mixtos consistentes en aprovechar al máximo la capacidad de la memoria central. 4. La clasificación por mezcla directa consiste en una partición sucesiva del archivo y una fusión que produce secuencias ordenadas. La primera partición se hace para secuencias de longitud 1 y la fusión producirá secuencias ordenadas de longitud 2. A cada nueva partición y fusión se duplicará la longitud de las secuencias ordenadas. El método terminará cuando la longitud de la se- cuencia ordenada exceda la longitud del archivo a ordenar. 5. La clasificación por mezcla natural consiste en aprovechar la posible ordenación interna de las secuencias del archivo original (F), obteniendo con ellas particiones ordenadas de longitud va- riable sobre los ficheros auxiliares. A partir de estos ficheros auxiliares escribiremos un nuevo F mezclando los segmentos crecientes de cada uno de ellos. 6. La búsqueda es el proceso de localizar un registro en un archivo con un determinado valor en uno de sus campos. Los archivos de tipo secuencial obli- gan a efectuar búsquedas secuenciales, mientras que los archivos directos son estructuras de acceso aleatorio y permiten otros tipos de búsquedas. 7. La búsqueda binaria podría aplicarse a archivos directos con los registros colocados uno a conti- nuación de otro y ordenados por el campo por el que se desea efectuar la búsqueda.
  • 457. Ordenación, búsqueda y fusión externa (archivos) 427 EJERCICIOS 11.1. Se desea intercalar los registros del archivo P con los registros del archivo Q y grabarlos en otro archivo R. NOTA: Los archivos P y Q están clasificados en or- den ascendente por una determinada clave y se desea que el archivo R quede también ordenado en modo ascendente. 11.2. Los archivos M, N y P contienen todas las operaciones de ventas de una empresa en los años 1985, 1986 y 1987 respectivamente. Se desea un algoritmo que intercale los registros de los tres archivos en un solo archivo Z, teniendo en cuenta que los tres archivos están clasificados en orden ascendente por el campo clave ventas. 11.3. Se dispone de dos archivos secuenciales F1 y F2 que contienen cada uno de ellos los mismos campos. Los dos archivos están ordenados de modo ascendente por el campo clave (alfanumérico) y existen registros comunes a ambos archivos. Se desea diseñar un pro- grama que obtenga: a) un archivo C a partir de F1 y F2, que contenga todos los registros comunes, pero sólo una vez; b) un archivo que contenga todos los registros que no son comunes a F1 y F2. 11.4. Se desea intercalar los registros del archivo A con los registros del archivo B y grabarlos en un tercer ar- chivo C. Los archivos A y B están clasificados en orden ascendente por su campo clave. Y se desea también que el archivo C quede clasificado en orden ascendente. 11.5. El archivo A contiene los números de socios del Club Deportivo Esmeralda y el archivo B los códigos de los socios del Club Deportivo Diamante. Se desea crear un archivo C que contenga los números de los socios que pertenecen a ambos clubes. Asimismo, se desea saber cuántos registros se han leído y cuántos se han grabado. 11.6. Los archivos F1, F2 y F3 contienen todas las opera- ciones de ventas de una compañía informática en los años 1985, 1986 y 1987 respectivamente. Se desea un programa que intercale todos los registros de los tres archivos en un solo archivo F, suponiendo que todo registro posee un campo clave y que F1, F2 y F3 están clasificados en orden ascendente de ese campo clave. 11.7. Se desea actualizar un archivo maestro de la nómina de la compañía Aguas del Pacífico con un archivo MODIFICACIONES que contiene todas las incidencias de empleados (altas, bajas, modificaciones). Ambos archivos están clasificados en orden ascendente del código de empleado (campo clave). El nuevo archivo maestro actualizado debe conservar la clasificación ascendente por código de empleado y sólo debe exis- tir un registro por empleado. 11.8. Se tiene un archivo maestro de inventarios con los siguientes campos: CODIGO DE ARTICULO DESCRIPCION EXISTENCIAS Se desea actualizar el archivo maestro con los movi- mientos habidos durante el mes (altas/bajas). Para ello se incluyen los movimientos en un archivo OPE- RACIONES que contiene los siguientes campos: CODIGO DE ARTICULO CANTIDAD OPERACION (1-Alta, 2-Baja) Los dos archivos están clasificados por el mismo campo clave.
  • 459. CAPÍTULO 12 Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas) 12.1. Introducción a las estructuras de datos 12.2. Listas 12.3. Listas enlazadas 12.4. Procesamiento de listas enlazadas 12.5. Listas circulares 12.6. Listas doblemente enlazadas 12.7. Pilas 12.8. Colas 12.9. Doble cola ACTIVIDADES DE PROGRAMACIÓN RESUELTAS CONCEPTOS CLAVE RESUMEN EJERCICIOS Los datos estudiados hasta ahora se denominan está- ticos. Ello es debido a que las variables son direcciones simbólicas de posiciones de memoria; esta relación entre nombres de variables y posiciones de memoria es una relación estática que se establece por la decla- ración de las variables de una unidad de programa y que se establece durante la ejecución de esa unidad. Aunque el contenido de una posición de memoria asociada con una variable puede cambiar durante la ejecución, es decir, el valor de la variable puede cam- biar, las variables por sí mismas no se pueden crear ni destruir durante la ejecución. En consecuencia, las va- riables consideradas hasta este punto se denominan variables estáticas. En algunas ocasiones, sin embargo, no se conoce por adelantado cuánta memoria se requerirá para un programa. En esos casos es conveniente disponer de un método para adquirir posiciones adicionales de memoria a medida que se necesiten durante la ejecu- ción del programa y liberarlas cuando no se necesitan. Las variables que se crean y están disponibles durante la ejecución de un programa se llaman variables diná- micas. Estas variables se representan con un tipo de datos conocido como puntero. Las variables dinámicas se utilizan para crear estructuras dinámicas de datos que se pueden ampliar y comprimir a medida que se requieran durante la ejecución del programa. Una es- tructura de datos dinámica es una colección de ele- mentos denominados nodos de la estructura —nor- malmente de tipo registro— que son enlazados juntos. Las estructuras dinámicas de datos se clasifican en lineales y no lineales. El estudio de las estructuras li- neales, listas, pilas y colas, es el objetivo de este capí- tulo. INTRODUCCIÓN
  • 460. 430 Fundamentos de programación 12.1. INTRODUCCIÓN A LAS ESTRUCTURAS DE DATOS En capítulos anteriores se ha introducido a las estructuras de datos, definiendo tipos y estructuras de datos primitivos, tales como enteros, real y carácter, utilizados para construir tipos más complicados como arrays y registros, deno- minados estructuras de datos compuestos. Tienen una estructura porque sus datos están relacionados entre sí. Las estructuras compuestas, tales como arrays y registros, están soportadas en la mayoría de los lenguajes de programa- ción, debido a que son necesarias en casi todas las aplicaciones. La potencia y flexibilidad de un lenguaje está directamente relacionada con las estructuras de datos que posee. La programación de algoritmos complicados puede resultar muy difícil en un lenguaje con estructuras de datos limi- tados, caso de FORTRAN y COBOL. En ese caso es conveniente pensar en la implementación con lenguajes que soporten punteros como C y C++ o bien que no soporten pero tengan recolección de basura como Java o C#, o bien recurrir, al menos en el período de formación, al clásico Pascal. Cuando una aplicación particular requiere una estructura de datos no soportada por el lenguaje, se hace necesaria una labor de programación para representarla. Se dice que necesitamos implementar la estructura de datos. Esto na- turalmente significa más trabajo para el programador. Si la programación no se hace bien, se puede malgastar tiem- po de programación y —naturalmente— de computadora. Por ejemplo, supongamos que tenemos un lenguaje como Pascal que permite arrays de una dimensión de números enteros y reales, pero no arrays multidimensionales. Para implementar una tabla con cinco filas y diez columnas podemos utilizar type array[0..10] of real: FILA; var FILA: FILA1, FILA2, FILA3, FILA4, FILA5; La llamada al elemento de la tercera fila y sexta columna se realizará con la instrucción FILA3 [6] Un método muy eficaz es diseñar procedimientos y funciones que ejecuten las operaciones realizadas por las estructuras de datos. Sin embargo, con las estructuras vistas hasta ahora arrays y registros tienen dos inconvenientes: 1) la reorganización de una lista, si ésta implica movimiento de muchos elementos de datos, puede ser muy costosa, y 2) son estructuras de datos estáticas. Una estructura de datos se dice que es estática cuando el tamaño ocupado en memoria es fijo, es decir, siempre ocupa la misma cantidad de espacio en memoria. Por consiguiente, si se representa una lista como vector, se debe anticipar (declarar o dimensionar) la longitud de esa lista cuando se escribe un programa; es imposible ampliar el espacio de memoria disponible (algunos lenguajes permiten dimensionar dinámicamente el tamaño de un array du- rante la ejecución del programa, como es el caso de Visual BASIC). En consecuencia, puede resultar difícil repre- sentar diferentes estructuras de datos. Los arrays unidimensionales son estructuras estáticas lineales ordenadas secuencialmente. Las estructuras se con- vierten en dinámicas cuando los elementos pueden ser insertados o suprimidos directamente sin necesidad de algo- ritmos complejos. Se distinguen las estructuras dinámicas de las estáticas por los modos en que se realizan las inser- ciones y borrados de elementos. 12.1.1. Estructuras dinámicas de datos Las estructuras dinámicas de datos son estructuras que «crecen a medida que se ejecuta un programa». Una estruc- tura dinámica de datos es una colección de elementos —llamados nodos— que son normalmente registros. Al con- trario que un array, que contiene espacio para almacenar un número fijo de elementos, una estructura dinámica de datos se amplía y contrae durante la ejecución del programa, basada en los registros de almacenamiento de datos del programa. Las estructuras dinámicas de datos se pueden dividir en dos grandes grupos: lineales { pilas colas listas enlazadas
  • 461. Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas) 431 no lineales { árboles grafos Las estructuras dinámicas de datos se utilizan para almacenamiento de datos del mundo real que están cam- biando constantemente. Un ejemplo típico ya lo hemos visto como estructura estática de datos: la lista de pasaje- ros de una línea aérea. Si esta lista se mantuviera en orden alfabético en un array, sería necesario hacer espacio para insertar un nuevo pasajero por orden alfabético. Esto requiere utilizar un bucle para copiar los datos del re- gistro de cada pasajero en el siguiente elemento del array. Si en su lugar se utilizara una estructura dinámica de datos, los nuevos datos del pasajero se pueden insertar simplemente entre dos registros existentes sin un mínimo esfuerzo. Las estructuras dinámicas de datos son extremadamente flexibles. Como se ha descrito anteriormente, es relati- vamente fácil añadir nueva información creando un nuevo nodo e insertándolo entre nodos existentes. Se verá que es también relativamente fácil modificar estructuras dinámicas de datos, eliminando o borrando un nodo existente. En este capítulo examinaremos las tres estructuras dinámicas lineales de datos: listas, colas y pilas, dejando para el próximo capítulo las estructuras no lineales de datos: árboles y grafos. Una estructura estática de datos es aquella cuya estructura se especifica en el momento en que se escribe el programa y no puede ser modificada por el programa. Los valores de sus diferentes elementos pueden variar, pero no su estructura, ya que ésta es fija. Una estructura dinámica de datos puede modificar su estructura mediante el programa. Puede ampliar o limitar su tamaño mientras se ejecuta el programa. 12.2. LISTAS Una lista lineal es un conjunto de elementos de un tipo dado que pueden variar en número y donde cada elemento tiene un único predecesor y un único sucesor o siguiente, excepto el primero y último de la lista. Esta es una defini- ción muy general que incluye los ficheros y vectores. Los elementos de una lista lineal se almacenan normalmente contiguos —un elemento detrás de otro— en posi- ciones consecutivas de la memoria. Las sucesivas entradas en una guía o directorio telefónico, por ejemplo, están en líneas sucesivas, excepto en las partes superior e inferior de cada columna. Una lista lineal se almacena en la me- moria principal de una computadora en posiciones sucesivas de memoria; cuando se almacenan en cinta magnética, los elementos sucesivos se presentan en sucesión en la cinta. Esta asignación de memoria se denomina almacena- miento secuencial. Posteriormente se verá que existe otro tipo de almacenamiento denominado encadenado o enla- zado. Las líneas así definidas se denominan contiguas. Las operaciones que se pueden realizar con listas lineales con- tiguas son: 1. Insertar, eliminar o localizar un elemento. 2. Determinar el tamaño —número de elementos— de la lista. 3. Recorrer la lista para localizar un determinado elemento. 4. Clasificar los elementos de la lista en orden ascendente o descendente. 5. Unir dos o más listas en una sola. 6. Dividir una lista en varias sublistas. 7. Copiar la lista. 8. Borrar la lista. Una lista lineal contigua se almacena en la memoria de la computadora en posiciones sucesivas o adyacentes y se procesa como un array unidimensional. En este caso, el acceso a cualquier elemento de la lista y la adición de nuevos elementos es fácil; sin embargo, la inserción o borrado requiere un desplazamiento de lugar de los elementos que le siguen y, en consecuencia, el diseño de un algoritmo específico. Para permitir operaciones con listas como arrays se deben dimensionar éstos con tamaño suficiente para que contengan todos los posibles elementos de la lista.
  • 462. 432 Fundamentos de programación EJEMPLO 12.1 Se desea leer el elemento j-ésimo de una lista P. El algoritmo requiere conocer el número de elementos de la lista (su longitud, L). Los pasos a dar son: 1. conocer longitud de la lista L. 2. si L = 0 visualizar «error lista vacía». si_no comprobar si el elemento j-ésimo está dentro del rango permitido de elementos 1 = j = L; en este caso, asignar el valor del elemento P(j) a una variable B; si el elemento j-ésimo no está dentro del rango, visualizar un mensaje de error «elemento solicitado no existe en la lista». 3. fin. El pseudocódigo correspondiente sería: procedimiento acceso(E lista: P; S elementolista: B; E entero: L, J) inicio si L = 0 entonces escribir('Lista vacia') si_no si (j = 1) y (j = L) entonces B ← P[j] si_no escribir('ERROR: elemento no existente') fin_si fin_si fin EJEMPLO 12.2 Borrar un elemento j de la lista P. Variables L longitud de la lista J posición del elemento a borrar I subíndice del array P P lista Las operaciones necesarias son: 1. Comprobar si la lista es vacía. 2. Comprobar si el valor de J está en el rango I de la lista 1 = J = L. 3. En caso de J correcto, mover los elementos J+1, J+2, ..., a las posiciones J, J+1, ..., respectivamente, con lo que se habrá borrado el antiguo elemento J. 4. Decrementar en uno el valor de la variable L, ya que la lista contendrá ahora L – 1 elementos. El algoritmo correspondiente será: inicio si L = 0 entonces escribir('lista vacia') si_no leer(J) si (J = 1) y (J = L) entonces desde I ← J hasta L-1 hacer P[I] ← P[I+1] fin_desde
  • 463. Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas) 433 L ← L-1 si_no escribir('Elemento no existe') fin_si fin_si fin Una lista contigua es aquella cuyos elementos son adyacentes en la memoria o soporte direccionable. Tiene unos límites izquierdo y derecho o inferior/superior que no pueden ser rebajados cuando se le añade un elemento. La inserción o eliminación de un elemento, excepto en la cabecera o final de la lista, necesita una traslación de una parte de los elementos de la misma: la que precede o sigue a la posición del elemento modificado. Las operaciones directas de añadir y eliminar se efectúan únicamente en los extremos de la lista. Esta limi- tación es una de las razones por las que esta estructura es poco utilizada. Las listas enlazadas o de almacenamiento enlazado o encadenado son mucho más flexibles y potentes, y su uso es mucho más amplio que las listas contiguas. 12.3. LISTAS ENLAZADAS1 Los inconvenientes de las listas contiguas se eliminan con las listas enlazadas. Se pueden almacenar los elementos de una lista lineal en posiciones de memoria que no sean contiguas o adyacentes. Una lista enlazada o encadenada es un conjunto de elementos en los que cada elemento contiene la posición —o dirección— del siguiente elemento de la lista. Cada elemento de la lista enlazada debe tener al menos dos cam- pos: un campo que tiene el valor del elemento y un campo (enlace, link) que contiene la posición del siguiente ele- mento, es decir, su conexión, enlace o encadenamiento. Los elementos de una lista son enlazados por medio de los campos enlaces. Las listas enlazadas tienen una terminología propia que se suele utilizar normalmente. Primero, los valores se almacenan en un nodo (Figura 12.1). Dato (valor elemento) Enlace Figura 12.1. Nodo con dos campos. Una lista enlazada se muestra en la Figura 12.2. 5 4 1 7 18 19 9 7 45 … (a) (b) LISTA 5 4 7 18 19 9 7 45 1 Figura 12.2. (a) array representado por una lista; (b) lista enlazada representada por una lista de enteros. Los componentes de un nodo se llaman campos. Un nodo tiene al menos un campo dato o valor y un enlace (in- dicador o puntero) con el siguiente nodo. El campo enlace apunta (proporciona la dirección o referencia de) al siguien- te nodo de la lista. El último nodo de la lista enlazada, por convenio, se suele representar por un enlace con la palabra reservada nil (nulo), una barra inclinada (/) y, en ocasiones, el símbolo eléctrico de tierra o masa (Figura 12.3). 1 Las listas enlazadas se conocen también en Latinoamérica con el término «ligadas» y «encadenadas». El término en inglés es linked list.
  • 464. 434 Fundamentos de programación 4 4 nil 4 Figura 12.3. Representación del último nodo de una lista. La implementación de una lista enlazada depende del lenguaje. C, C++, Pascal, PL/I, Ada y Modula-2 utilizan simplemente como enlace una variable puntero, o puntero (apuntador). Java no dispone de punteros, por consi- guiente, resuelve el problema de forma diferente y almacena en el enlace la referencia al siguiente objeto nodo. Los lenguajes como FORTRAN y COBOL no disponen de este tipo de datos y se debe simular con una variable entera que actúa como indicador o cursor. En nuestro libro utilizaremos a partir de ahora el término puntero (apuntador) para describir el enlace entre dos elementos o nodos de una lista enlazada. Un puntero (apuntador) es una variable cuyo valor es la dirección o posición de otra variable. En las listas enlazadas no es necesario que los elementos de la lista sean almacenados en posiciones físicas adya- centes, ya que el puntero indica dónde se encuentra el siguiente elemento de la lista, tal como se indica en la Figu- ra 12.4. NULO INFO SIG INFO SIG INFO SIG INFO SIG PRIMERO Figura 12.4. Elementos no adyacentes de una lista enlazada. Por consiguiente, la inserción y borrado no exigen desplazamiento como en el caso de las listas contiguas. Para eliminar el 45.º elemento ('INÉS') de una lista lineal con 2.500 elementos [Figura 12.5 (a)] sólo es nece- sario cambiar el puntero en el elemento anterior, 44.º, y que apunte ahora al elemento 46.º [Figura 12.5 (b)]. Para insertar un nuevo elemento ('HIGINIO') después del 43.º ('GONZALO') elemento, es necesario cambiar el puntero del elemento 43.º y hacer que el nuevo elemento apunte al elemento 44.º [Figura 12.5 (c)]. GONZALO HORACIO INÉS IVÁN JUAN ZAYA NULO (a) GONZALO HORACIO INÉS IVÁN JUAN ZAYA NULO (b) (c) HIGINI O GONZALO HORACIO IVÁN JUAN ZAYA NULO Figura 12.5. Inserción y borrado de elementos.
  • 465. Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas) 435 Una lista enlazada sin ningún elemento se llama lista vacía. Su puntero inicial o de cabecera tiene el valor nulo (nil). Una lista enlazada se define por: • El tipo de sus elementos: campo de información (datos) y campo enlace (puntero o apuntador). • Un puntero de cabecera que permite acceder al primer elemento de la lista. • Un medio para detectar el último elemento de la lista: puntero nulo (nil). EJEMPLO 12.3 El director de un hotel desea registrar el nombre de cada cliente a medida de su llegada al hotel, junto con el nú- mero de habitación que ocupa —el antiguo libro de entradas—. También desea disponer en cualquier momento de una lista de sus clientes por orden alfabético. Ya que no es posible registrar los clientes alfabética y cronológicamente en la misma lista, se necesita o bien listas alfabéticas independientes o bien añadir punteros a la lista existente, con lo que sólo se utilizará una única lis- ta. El método manual en el libro requería muchos cruces y reescrituras; sin embargo, una computadora mediante un algoritmo adecuado lo realizará fácilmente. Por cada nodo de la lista el campo de información o datos tiene dos partes: nombre del cliente y número de ha- bitación. Si x es un puntero a uno de estos nodos, l[x].nombre y l[x].habitación representarán las dos partes del campo información. El listado alfabético se consigue siguiendo el orden de los punteros de la lista (campo puntero). Se utiliza una variable CABECERA(S) para apuntar al primer cliente. CABECERA ← 3 Así, CABECERA(S) es 3, ya que el primer cliente, Antolín, ocupa el lugar 3. A su vez, el puntero asociado al nodo ocupado por Antolín contiene el valor 10, que es el segundo nombre de los clientes en orden alfabético y éste tiene como campo puntero el valor 7, y así sucesivamente. El campo puntero del último cliente, Tomás, contiene el puntero nulo indicado por un 0 o bien una Z. Registro Nombre Habitación Puntero S(=3) 1 Tomás 324 z (final) 2 Cazorla 28 8 3 Antolín 95 10 4 Pérez 462 6 5 López 260 12 6 Sánchez 220 1 7 Bautista 115 2 8 García 105 9 9 Jiménez 173 5 10 Apolinar 341 7 11 Martín 205 4 12 Luzárraga 420 11 . . . . . . . . . . . . Figura 12.6. Lista enlazada de clientes de un hotel.
  • 466. 436 Fundamentos de programación 12.4. PROCESAMIENTO DE LISTAS ENLAZADAS Para procesar una lista enlazada se necesitan las siguientes informaciones: • Primer nodo (cabecera de la lista). • El tipo de sus elementos. Las operaciones que normalmente se ejecutan con listas incluyen: 1. Recuperar información de un nodo específico (acceso a un elemento). 2. Encontrar el nodo que contiene una información específica (localizar la posición de un elemento dado). 3. Insertar un nuevo nodo en un lugar específico de la lista. 4. Insertar un nuevo nodo en relación a una información particular. 5. Borrar (eliminar) un nodo existente que contiene información específica. 12.4.1. Implementación de listas enlazadas con punteros Como ya hemos visto, la representación gráfica de un puntero consiste en una flecha que sale del puntero y llega a la variable dinámica apufintada. Para declarar una variable de tipo puntero: tipo puntero_a tipo_dato: punt var punt : p, q El tipo_dato podrá ser simple o estructurado. Operaciones con punteros: Inicialización p ← nulo A nulo para indicar que no apunta a ninguna variable. Comparación p = q Con los operadores = o . p q p→ q→ Asignación p ← q Implica hacer que el puntero p apunte a donde apunta q.
  • 467. Estructuras dinámicas lineales de datos (pilas, colas y listas enlazadas) 437 Creación de variables dinámicas Reservar(p) Reservar espacio en memoria para la variable dinámica. Eliminación de variables dinámicas Liberar(p) Liberar el espacio en memoria ocupado por la variable dinámica. Variables dinámicas Variable simple o estructura de datos sin nombre y creada en tiempo de ejecución. p p → Para acceder a una variable dinámica apuntada, como no tiene nombre se escribe p → Las variables p → podrán intervenir en toda operación o expresión de las permitidas para una variable estática de su mismo tipo. Nodo Las estructuras dinámicas de datos están fo