SlideShare una empresa de Scribd logo
354
Lo más leído
355
Lo más leído
513
Lo más leído
MÉTODOS NUMÉRICOS.... -
APLICADOS A LA INGENIERÍA
Antonio Nieves
Federico C. Domínguez
MÉTODOS NUMÉRICOS
APLICADOS A LA INGENIERÍA
Antonio Nieves
Federico C. Domínguez
Métodos Numéricos
Aplicados a la Ingeniería
Antonio Nieves Hurtado
Federico C. Domínguez Sánchez
Profesores de la Academia de Matemáticas Aplicadas
ESIQIE-IPN
QUINTA REIMPRESIÓN
MÉXICO, 2006
-/
I
I
COMPAÑÍA EDITORIAL CONTINENTAL
Métodos NUDléricos
Aplicados a la Ingeniería
Antonio Nieves Hurtado
Federico C. Domínguez Sánchez
Profesores de la Academia de Matemáticas Aplicadas
ES/Q/E-/PN
QUINTA REIMPRESIÓN
MÉXICO,2006
COMPAÑÍA EDITORIAL CONTINENTAL
;:a
Para establecer comunicación
con nosotros puede hacerlo por:
correo:
Renacimiento 180, Col. San Juan
Tlihuaca, Azcapotzalco,
02400, México, D.F.
fax pedidos:
(01 55) 5561 4063·5561 5231
e-mail:
info@patriacultural.com.mx
home page:
www.patriacultural.com.mx
Dirección editorial: Javier Enrique Callejas
Coordinación editorial: Elisa Pecina Rosas
Diseño de interiores:Guillermo Rodríguez Luna
Diseño de portada: Perla Alejandra López Romo
Colaboración especial:
DI. Guillermo Marroquín Suárez
Profesor de la Academia de Matemáticas Aplicadas
ESIQIE - Instituto Politécnico Nacional
Revisión técnica:
M.C. José Luis Turriza
Profesor de Matemáticas
ESIME-IPN
Métodos Numéricos, aplicados a la ingeniería
Derechos reservados respecto a la segunda edición:
© 1995, 2002, Antonio Nieves Hurtado / Federico C. Donúnguez Sánchez
© 1995, COMPAÑÍA EDITORIAL CONTINENTAL, S.A. DE C.V.
© 2002, GRUPO PATRIA CULTURAL, S.A. DE C.V.
bajo el sello de Compañía Editorial Continental
Renacimiento 180, Colonia San Juan Tlihuaca,
Delegación Azcapotzalco, Código Postal 02400, México, D.F.
Miembro de la Cámara Nacional de la Industria Editorial
Registro núm. 43
ISBN 970-24-0258-1 (segunda edición)
(ISBN 968-26-1260-8 primera edición)
Queda prohibida la reproducción o transmisión total o parcial del conte-
nido de la presente obra en cualesquiera formas, sean electrónicas o
mecánicas, sin el consentimiento previo y por escrito del editor.
Impreso en México
Printed in Mexico
Primera edición: 1995
Segunda edición: 2002
Cuarta reimpresión: 2005
Quinta reimpresión: 2006
Para establecer comunicación
con nosotros puede hacerlo por:
correo:
Renacimiento 180, Col. San Juan
Tlihuaca, Azcapotzalco,
02400, México, D.F.
fax pedidos:
(01 55) 5561 4063·5561 5231
e-mail:
info@patriacultural.com.mx
home page:
www.patriacultural.com.mx
Dirección editorüü: Javier Enrique Callejas
Coordinación editorial: Elisa Pecina Rosas
Diseño de interiores:Guillermo Rodríguez Luna
Diseño de portada: Perla Alejandra López Romo
Colaboración especial:
Dr. Guillermo Marroquín Suárez
Profesor de la Academia de Matemáticas Aplicadas
ESIQIE - Instituto Politécnico Nacional
Revisión técnica:
M.C. José Luis Turriza
Profesor de Matemáticas
ESIME-IPN
Métodos Numéricos, aplicados a la ingeniería
Derechos reservados respecto a la segunda edición:
© 1995, 2002, Antonio Nieves Hurtado / Federico C. Dornínguez Sánchez
© 1995, COMPAÑÍA EDITORIAL CONTINENTAL, S.A. DE C.V.
© 2002, GRUPO PATRIA CULTURAL, S.A. DE C.V.
bajo el sello de Compañía Editorial Continental
Renacimiento 180, Colonia San Juan Tlihuaca,
Delegación Azcapotzalco, Código Postal 02400, México, D.F.
Miembro de la Cámara Nacional de la Industria Editorial
Registro núm. 43
ISBN 970-24-0258-1 (segunda edición)
(ISBN 968-26-1260-8 primera edición)
Queda prohibida la reproducción o transmisión total o parcial del conte-
nido de la presente obra en cualesquiera formas, sean electrónicas o
mecánicas, sin el consentimiento previo y por escrito del editor.
Impreso en México
Printed in Mexico
Primera edición: 1995
Segunda edición: 2002
Cuarta reimpresión: 2005
Quinta reimpresión: 2006
·"F'
A los Eggli:
Violet (Mom), Fred,
Josephine, Richard y David.
Gracias
Antonio
A mis hijos Alura,
Alejandra y Federico,
a mis hermanos, y a
la memoria de mis padres.
Federico
A los Eggli:
Violet (Mom), Fred,
Josephine, Richard y David.
A mis hijos Alura,
Alejandra y Federico,
a mis hermanos, y a
Gracias
Antonio
la memoria de mis padres.
Federico
CONTENIDO
PREFACIO xi
1 ERRORES 1
1.1 Sistema numérico 2
1.2 Manejo de números en la computadora 8
1.3 Errores 11
1.4 Algoritmos y estabilidad 19
Ejercicios 20
Problemas 24
2 SOLUCiÓN DE ECUACIONES NO LINEALES 29
2.1 Método de punto fijo 30
ALGORITMO 2. 1 Método de punto fUo 35
2.2 Método de Newton-Raphson 44
ALGORITMO 2.2 Método de Newton-Raphson 47
2.3 Método de la secante 47
ALGORITMO 2.3 Método de la secante 50
2.4 Métod~· de posición falsa 51
ALGORITMO 2.4 Método de posición falsa 54
2.5 Método de la bisecdón 54
2.6 Problemas de los métodos de dos puntos y
orden de convergencia 56
2.7 Aceleración de convergencia 59
ALGORITMO 2.5 Método de Steffensen 62
2.8 Búsqueda de valores iniciales 63
2.9 Raíces complejas 69
ALGORITMO 2.6 Método de Mü//er 76
2.10 Polinomios y sus ecuaciones 77
ALGORITMO 2.7 Método de Horner 79
ALGORITMO 2.8 Método de Horner iterado 82
Ejercicios 90
Problemas 117
viii Métodos numéricos aplicados a la ingeniería
3 MATRICES y SISTEMAS DE. ECUACIONES LINEALES 129
3.1 Matrices 130
ALGORITMO 3.1 Multiplicación de matrices 136
3.2 Vectores 141
3.3 Independencia y ortogonaUzación de vectores 149
ALGORITMO 3.2 Ortogonalización de Gram Schmidt 159
3.4 Solución de sistemas de ecuaciones lineales 162
ALGORITMO 3.3 Eliminación de Gauss 168
ALGORITMO 3.4 Eliminación de Gauss con pivoteo 172
ALGORITMO 3.5 Método de Thomas 181
ALGORITMO 3.6 Factorización directa 187
ALGORITMO 3.7 Factorización con pivoteo 188
ALGORITMO 3.8 Método de Doolitle 191
.ALGORITMO 3.9 Factorización de matrices simétricas 193
ALGORITMO 3.10 Método de Cholesky 196
3.5 Métodos iterativos 206
ALGORITMO 3.11 Métodos de Jacobi y Gauss-Seidel 216
3.6 Valores y vectores propios 222
Ejercicios 228
Problemas 238
4 SISTEMAS DE ECUACIONES NO L1NE.ALES 255
4 .• Dificultades en la solución de sistemas de
ecuaciones no lineales 256
4.2 Método de punto fijo multivariable 259
ALGORITMO 4.1 Método de punto fUo multivariable 265
4.3 Método de Newton-Raphson 266
ALGORITMO 4.2 Método de Newton-Raphson multivariable 273
4.4 Método de Newton-Raphson modificado 275
ALGORITMO 4.3 Método de Newton-Raphson modificado 278
4.5 Método de Broyden 279
ALGORITMO 4.4 Método de Broyden 283
4.6 Aceleración de convergencia 283
ALGORITMO 4.5 Método del descenso de máxima pendiente 297
4.7 Método de Bairstow 299
Ejercicios 304
Problemas 316
-----
Contenido ix
5 APROXIMACiÓN FUNCIONAL E INTERPOLACIÓN 332
s.r Aproximación pollnomlal simple e interpolación 325
ALGORITMO 5. 1 Aproximación polinomial simple 328
5.2 Polinomios de Lagrange 328
ALGORITMO 5.2 lnterpotactón de polinomios de Lagrange 333
5.3 Diferencias divididas 334
ALGORITMO 5.3 Tabla de diferencias divididas 338
5.4 Aproximación polinomial de Newton 338
ALGORITMO 5.4 Interpolación polinomial de Newton 342
5.5 Polinomio de Newton en diferencias finitas 343
5.6 Estimación de errores en la aproximación 352
5.7 Aproximación pollnomlal segmentaria 356
5.8 Aproximación (polinomial con mínimos cuadrados 362
ALGORITMO 5.5 Aproximación con mínimos cuadrados 369
5.9 Aproximación~ Jllul!iline~1 con ~ínimos _cuadr~dos 370
Ejercicios 373
Problemas 382
6 INTEGRACiÓN y DIFERENCIACiÓN NUMÉRICA 393
6.t Métodos de Newton Cotes 395
ALGORITMO 6.1 Método trapezoidal compuesto 403
ALGORITMO 6.2 Método de Simpson compuesto 406
6.2 Cuadratura de Gauss 415
ALGORITMO 6.3 Cuadratura de Gauss-Legrange 421
6.3 Integrales múltiples 422
ALGORITMO 6.4 Integración doble por Simpson 1/3 428
6.4 Diferenciación numérica 429
ALGORITMO 6.5 Derivación de polinomios de Lagrange 437
Ejercicios 437
Problemas 448
7 ECUACIONES DlfE.RENCIALES ORDINARIAS 457
7.t Formulación del problema de valor inicial 459
7.2 Método de Euler 460
ALGORITMO 7.1 Método de Euler 463
7.3 Método de Taylor 463
X Métodos numéricos aplicados a la ingeniería
7.4 Métodos de Euler modificado 466
ALGORITMO 7.2 Método de Euler modificado 468
7.5 Métodos de Runge-Kutta 469
ALGORITMO 7.3 Método de Runge-Kutta de cuarto orden 473
7.6 Métodos de predicción-corrección 474
ALGORITMO 7.4 Método predictor-corrector 484
7.7 Ecuaclones diferenciales ordinarias de orden superior y
sistemas de ecuaciones diferenciales ordinarias 485
ALGORITMO 7.5 Método de Runge-Kutta de cuarto orden para un
sistema de dos ecuaciones diferenciales ordinarias 491 01
7.8 formulación del problema de valores en la frontera 492
Ejercicios 496
Problemas 518
8 ECUACIONES DIFERENCIALES PARCIALES 527
8.• Obtención de ecuaclones diferenciales parciales a
partir de la modelación de fenómenos físicos
(ecuación de calor y ecuación de onda) 528
8.2 Aproximación de derivadas por diferencias finitas 532
8.3 Solución de problemas de calor unldlmenslonal 536 1.11
ALGORITMO 8.1 Método explícito 541
ALGORITMO 8.2 Método implícito 551
8.4 Convergencia (método explícito), estabilidad y
consistencia 553
8.5 Método de Crank-Nlcholson 556
ALGORITMO 8.3 Método de Crank-Nicholson 560
8.6 Otros métodos para resolver el problema de
conducción de calor en unidimensional 561
8.7 Solución de la ecuación de onda. unidimensional 563
8.8 Tipos de condiciones frontera en procesos físicos y
tratamientos de condiciones frontera irregulares 569
Ejercicios 573
Problemas 579
RESPUESTAS A PROBLEMAS SELECCIONADOS 585
,.#
INDICE ANALíTICO 597
PREFACIO
66
68
69
73
74
84
85
91
92
96
18
Objetivo del libro
27
El análisis numérico y sus métodos son una dialéctica entre el análisis matemático cualitati-
vo y el análisis matemático cuantitativo. El primero nos dice, por ejemplo, que bajo ciertas
condiciones algo existe, que es o no único, etcétera, mientras que el segundo complementa
al primero, permitiendo calcular aproximadamente el valor de aquello que existe.
El análisis numérico es pues: una reflexión sobre los cursos tradicionales de cálculo,
álgebra lineal, ecuaciones diferenciales entre otros, concretando en una serie de métodos o
algoritmos, cuya característica principal es la posibilidad de obtener resultados numéricos
de problemas matemáticos de cualquier tipo a partir de números y un número finito de
operaciones aritméticas. La finalidad de este libro es el estudio y uso racional de dichos
algoritmo s en diferentes áreas de ingeniería y ciencias.28
32
36
1
1
Enfoque del libro
6
o
La noción de algoritmo es un concepto clásico en las matemáticas. Es un concepto muy
anterior a la aparición de las computadoras yde las calculadoras. Por ejemplo, en el Papi-
ro de Ahmes o de Rhind (de hacia el año 1650 a. C.) se encuentra la técnica de posición
falsa aplicada a la solución de ecuaciones lineales y, en el Jiuzhang suanshu (el libro más
famoso de la matemática china del año 200 a. C.) se resolvían sistemas de ecuaciones li-
neales con el método conocido hoy en día como eliminación de Gauss.
En realidad, en la enseñanza básica tradicional todos aprendimos algoritmos como el
de la división, la multiplicación y la extracción de raíces cuadradas. Con el transcurso del
tiempo, los dos primeros se convierten generalmente en las operaciones más conocidas y
practicadas (aunque quizás también, en las más incomprendidas) y, el tercero, en la opera-
ción más fácilmente olvidada.
A fin de no caer en un curso más de recetas matemáticas desvinculadas y sin sentido,
hemos desarrollado el material de este libro en torno a tres ideas fundamentales: el punto
fijo, la eliminación de Gauss y la aproximación de funciones. Para instrumentarlas emplea-
mos como recursos didácticos, en cada método o situación, diferentes sistemas de repre-
sentación: el gráfico, el tabular y el algebraico, y promovemos el paso entre ellos. Con el
fin de que el lector vea claramente la relación entre los métodos que estudia en el libro
y su aplicación en el contexto real, se resuelven al final de cada capítulo alrededor de diez
o más problemas de diferentes áreas de aplicación. De igual manera, hacemos énfasis en
el uso de herramientas como la calculadora y la computadora así como la importancia de
la visualización en los problemas. Dada la importancia de cada uno de estos aspectos los
trataremos con cierto detalle a continuación.
3
9
3
9
5
7
PREFACIO
Objetivo del libro
El análisis numérico y sus métodos son una dialéctica entre el análisis matemático cualitati-
vo y el análisis matemático cuantitativo. El primero nos dice, por ejemplo, que bajo ciertas
condiciones algo existe, que es o no único, etcétera, mientras que el segundo complementa
al primero, permitiendo calcular aproximadamente el valor de aquello que existe.
El análisis numérico es pues: una reflexión sobre los cursos tradicionales de cálculo,
álgebra lineal, ecuaciones diferenciales entre otros, concretando en una serie de métodos o
algoritmos, cuya característica principal es la posibilidad de obtener resultados numéricos
de problemas matemáticos de cualquier tipo a partir de números y un número finito de
operaciones aritméticas. La finalidad de este libro es el estudio y uso racional de dichos
algoritmos en diferentes áreas de ingeniería y ciencias.
Enfoque del libro
La noción de algoritmo es un concepto clásico en las matemáticas. Es un concepto muy
anterior a la aparición de las computadoras yde las calculadoras. Por ejemplo, en el Papi-
ro de Ahmes o de Rhind (de hacia el año 1650 a. C.) se encuentra la técnica de posición
falsa aplicada a la solución de ecuaciones lineales y, en el Jiuzhang suanshu (el libro más
famoso de la matemática china del año 200 a. C.) se resolvían sistemas de ecuaciones li-
neales con el método conocido hoy en día como eliminación de GaU'ss.
En realidad, en la enseñanza básica tradicional todos aprendimos algoritmos como el
de la división, la multiplicación y la extracción de raíces cuadradas. Con el transcurso del
tiempo, los dos primeros se convierten generalmente en las operaciones más conocidas y
practicadas (aunque quizás también, en las más incomprendidas) y, el tercero, en la opera-
ción más fácilmente olvidada.
A fin de no caer en un curso más de recetas matemáticas desvinculadas y sin sentido,
hemos desarrollado el material de este libro en tomo a tres ideas fundamentales: el punto
fijo, la eliminación de Gauss y la aproximación de funciones. Para instrumentarlas emplea-
mos como recursos didácticos, en cada método o situación, diferentes sistemas de repre-
sentación: el gráfico, el tabular y el algebraico, y promovemos el paso entre ellos. Con el
fin de que el lector vea claramente la relación entre los métodos que estudia en el libro
y su aplicación en el contexto real, se resuelven al final de cada capítulo alrededor de diez
o más problemas de diferentes áreas de aplicación. De igual manera, hacemos énfasis en
el uso de herramientas como la calculadora y la computadora así como la importancia de
la visualización en los problemas. Dada la importancia de cada uno de estos aspectos los
trataremos con cierto detalle a continuación.
p
xii Métodos numéricos aplicados a la ingeniería
Los métodos numéricos y las herramientas
computaclonales
COMPUTADORA
Dado que cada algoritmo implica numerosas operaciones lógicas, aritméticas y en múlti-
ples casos graficaciones, la computadora es fundamental para el estudio de éstos. El bino-
mio computadora-lenguaje de alto nivel (Fortran, Basic, C y otros) ha sido utilizado
durante muchos años para la enseñanza y el aprendizaje de los métodos numéricos. Y si
bien esta fórmula ha sido exitosa y sigue aún vigente, también es cierto que la aparición
de paquetes comerciales como Mathcad, Maple, Matlab (por citar algunos de los más co-
nocidos) permiten nuevos acercamientos al estudio de los métodos numéricos. Por ejem-
plo, han permitido que la programación sea más sencilla y rápida y han facilitado además
la construcción directa de gráficas en dos y tres dimensiones, así como la exploración de
conjeturas y la solución numérica directa de problemas matemáticos.
En respuesta a estas dos vertientes, se acompaña el libro con un CD donde se han
mantenido los programas fuente de la primera edición (Fortran, Pascal y C) y se han in-
corporado programas en Visual Basic. En numerosos ejemplos, ejercicios y problemas uti-
lizamos o sugerimos además el empleo de los paquetes mencionados arriba.
Pr4
CALCULADORAS GRAFICADORAS
Las calculadoras graficadoras (como la TI-89, TI-92, HP-48 o HP-49) disponen hoy en día
de poderosos elementos como:
a) Un sistema algebraico computarizado (CAS por sus siglas en inglés) que permite ma-
nipulaciones simbólicas y soluciones analíticas de problemas matemáticos.
b) La graficación en dos y tres dimensiones con facilidades como el zoom y el trace.
c) La posibilidad de resolver numéricamente problemas matemáticos.
d) La posibilidad de programar y utilizar a través de dicha programación los recursos
mencionados en los incisos anteriores, convirtiéndose así el conjunto lenguaje-recur-
sos en una herramienta aún más poderosa que un lenguaje procedural como Basic o C.
Finalmente, su bajo costo, portabilidad y posibilidades de comunicación con sitios Web
donde es posible actualizar, intercambiar y comprar programas e información, permiten
plantear un curso de métodos numéricos sustentado en la calculadora o una combinación
de calculadora y computadora. A fin de apoyar esta acción hemos incorporado en muchos de
los ejemplos y ejercicios programas en la TI-92.
Se
Visualización
A raíz de las posibilidades gráficas que ofrecen las computadoras y las calculadoras, la vi-
sualización ( un recurso natural del ser humano) ha tomado mayor importancia y se ha po-
dido utilizar en las matemáticas de diferentes maneras como: en la aprehensión de los
conceptos, en la solución de problemas, en la ilustración de los métodos y en general en
darle un aspecto dinámico a diversas situaciones físicas. Así, hemos intentado aprovechar
cada uno de estos aspectos y aplicarlos a lo largo del libro siempre que fue posible. Por
ejemplo, en el capítulo 4, se presentan ilustraciones novedosas de los métodos para resol-
ver sistemas de ecuaciones no lineales (inclusive se han puesto en color varias de esas grá-
xii Métodos numéricos aplicados a la ingeniería
Los métodos numéricos y las herramientas
computacionales
COMPUTADORA
Dado que cada algoritmo implica numerosas operaciones lógicas, aritméticas y en múlti-
ples casos graficaciones, la computadora es fundamental para el estudio de éstos. El bino-
mio computadora-lenguaje de alto nivel (Fortran, Basic, C y otros) ha sido utilizado
durante muchos años para la enseñanza y el aprendizaje de los métodos numéricos. Y si
bien esta fórmula ha sido exitosa y sigue aún vigente, también es cierto que la aparición
de paquetes comerciales como Mathcad, Maple, Matlab (por citar algunos de los más co-
nocidos) permiten nuevos acercamientos al estudio de los métodos numéricos. Por ejem-
plo, han permitido que la programación sea más sencilla y rápida y han facilitado además
la construcción directa de gráficas en dos y tres dimensiones, así como la exploración de
conjeturas y la solución numérica directa de problemas matemáticos.
En respuesta a estas dos vertientes, se acompaña el libro con un CD donde se han
mantenido los programas fuente de la primera edición (Fortran, Pascal y C) y se han in-
corporado programas en Visual Basic. En numerosos ejemplos, ejercicios y problemas uti-
lizamos o sugerimos además el empleo de los paquetes mencionados arriba.
CALCULADORAS GRAFICADORAS
Las calculadoras graficadoras (como la TI-89, TI-92, HP-48 o HP-49) disponen hoy en día
de poderosos elementos como:
a) Un sistema algebraico computarizado (CAS por sus siglas en inglés) que permite ma-
nipulaciones simbólicas y soluciones analíticas de problemas matemáticos.
b) La graficación en dos y tres dimensiones con facilidades como el zoom y el trace.
c) La posibilidad de resolver numéricamente problemas matemáticos.
el) La posibilidad de programar y utilizar a través de dicha programación los recursos
mencionados en los incisos anteriores, convirtiéndose así el conjunto lenguaje-recur-
sos en una henamienta aún más poderosa que un lenguaje procedural como Basic o C.
Finalmente, su bajo costo, portabilidad y posibilidades de comunicación con sitios Web
donde es posible actualizar, intercambiar y comprar programas e información, permiten
plantear un curso de métodos numéricos sustentado en la calculadora o una combinación
de calculadora y computadora. A fin de apoyar esta acción hemos incorporado en muchos de
los ejemplos y ejercicios programas en la TI-92.
Visualización
A raíz de las posibilidades gráficas que ofrecen las computadoras y las calculadoras, la vi-
sualización ( un recurso natural del ser humano) ha tomado mayor importancia y se ha po-
dido utilizar en las matemáticas de diferentes maneras como: en la aprehensión de los
conceptos, en la solución de problemas, en la ilustración de los métodos y en general en
darle un aspecto dinámico a diversas situaciones físicas. Así, hemos intentado aprovechar
cada uno de estos aspectos y aplicarlos a lo largo del libro siempre que fue posible. Por
ejemplo, en el capítulo 4, se presentan ilustraciones novedosas de los métodos para resol-
ver sistemas de ecuaciones no lineales (inclusive se han puesto en color varias de esas grá-
Prefacio xiii
ficas a fin de tener una mejor apreciación de las intersecciones de superficies y de las raí-
ces), ilustraciones de conceptos abstractas como el criterio de convergencia del método de
punto fijo univariable y la ponderación de pendientes en los métodos de Runge-Kutta.
Además se incluyen varios ejercicios en Visual Basic donde se simula algún fenómeno co-
mo el de crecimiento de poblaciones (ejercicio 7.13), amortiguación en choques (ejercicio
7.11) y el desplazamiento de una cuerda vibrante (ejemplo 8.5). En estos últimos se pue-
den observar los resultados numéricos en tiempo real y la gráfica que van generando e in-
cluso modificar los parámetros para hacer exploraciones propias. Todos ellos aparecen en
el CD y se identifican con el icono correspondiente.
Prerrequlsftos
Generalmente los cursos de métodos numéricos siguen a los de cálculo en una variable, el
de ecuaciones diferenciales ordinarias y el' de programación. No obstante, consideramos
sólo los cursos de cálculo y de programación como prerrequisitos. Los conocimientos de
álgebra lineal requeridos así como los elementos básicos para estudiar las técnicas de la
ecuaciones diferenciales parciales, se exponen en los capítulos correspondientes. Si bien
los conceptos y técnicas analíticas de las ecuaciones diferenciales ordinarias serían bené-
ficos y complementarios con los métodos de este curso, no son, sin embargo, material in-
dispensable.
Secuencias sugeridas
Como se dijo antes, el libro se desarrolla alrededor de tres ideas matemáticas fundamen-
tales: punto fijo, eliminación de Gauss y aproximación de funciones. Las dos primeras se
estudian en los capítulos 2 y 3, respectivamente, y junto con el capítulo 4 constituyen la
parte algebraica del libro. Un primer curso (semestral) de métodos numéricos podría orga-
nizarse con los primeros cuatro capítulos del libro, seleccionando las secciones que corres-
pondan a su programa de estudios o a las necesidades específicas del curso.
La tercera idea matemática clave en el libro es la de aproximación de funciones, la
cual se presenta en el capítulo 5 y sustenta el material de análisis: integración y deriva-
ción numérica (capítulo 6), y más adelante será la base de la parte de dinámica: ecuacio-
nes diferenciales ordinarias y parciales (capítulos 7 y 8, respectivamente). De este modo
un curso semestral podría configurarse con los capítulos 1,5,6,7 o bien 1,5,6,7 Y 8 (ver
red de temas e interrelación).
Debido a esto y al hecho de que algunos tecnológicos y universidades sólo tiene un
curso de un semestre de métodos numéricos, podría elaborarse éste con una secuencia co-
mo capítulos 1,2,3,5 o bien 1,2,5,6, por ejemplo.
Finalmente, recomendamos al maestro que cualquiera que sea la secuencia y las sec-
ciones elegidas en cada una de ellas, se discuta y trabaje con los ejemplos resueltos de fi-
nal de cada capítulo.
Prefacio xiii
ficas a fin de tener una mejor apreciación de las intersecciones de superficies y de las raí-
ces), ilustraciones de conceptos abstractos como el criterio de convergencia del método de
punto fijo univariable y la ponderación de pendientes en los métodos de Runge-Kutta.
Además se incluyen varios ejercicios en Visual Basic donde se simula algún fenómeno co-
mo el de crecimiento de poblaciones (ejercicio 7.13), amortiguación en choques (ejercicio
7.11) y el desplazamiento de una cuerda vibrante (ejemplo 8.5). En estos últimos se pue-
den observar los resultados numéricos en tiempo real y la gráfica que van generando e in-
cluso modificar los parámetros para hacer exploraciones propias. Todos ellos aparecen en
el CD y se identifican con el icono correspondiente.
Prerrequisitos
Generalmente los cursos de métodos numéricos siguen a los de cálculo en una variable, el
de ecuaciones diferenciales ordinarias y el'de programación. No obstante, consideramos
sólo los cursos de cálculo y de programación como prerrequisitos. Los conocimientos de
álgebra lineal requeridos así como los elementos básicos para estudiar las técnicas de la
ecuaciones diferenciales parciales, se exponen en los capítulos correspondientes. Si bien
los conceptos y técnicas analíticas de las ecuaciones diferenciales ordinarias serían bené-
ficos y complementarios con los métodos de este curso, no son, sin embargo, material in-
dispensable.
Secuencias sugeridas
Como se dijo antes, el libro se desarrolla alrededor de tres ideas matemáticas fundamen-
tales: punto fijo, eliminación de Gauss y aproximación de funciones. Las dos primeras se
estudian en los capítulos 2 y 3, respectivamente, y junto con el capítulo 4 constituyen la
parte algebraica del libro. Un primer curso (semestral) de métodos numéricos podría orga-
nizarse con los primeros cuatro capítulos del libro, seleccionando las secciones que corres-
pondan a su programa de estudios o a las necesidades específicas del curso.
La tercera idea matemática clave en el libro es la de aproximación de funciones, la
cual se presenta en el capítulo 5 y sustenta el material de análisis: integración y deriva-
ción numérica (capítulo 6), y más adelante será la base de la parte de dinámica: ecuacio-
nes diferenciales ordinarias y parciales (capítulos 7 y 8, respectivamente). De este modo
un curso semestral podría configurarse con los capítulos 1,5,6,7 o bien 1,5,6,7 Y8 (ver
red de temas e interrelación).
Debido a esto y al hecho de que algunos tecnológicos y universidades sólo tiene un
curso de un semestre de métodos numéricos, podría elaborarse éste con una secuencia co-
mo capítulos 1,2,3,5 o bien 1,2,5,6, por ejemplo.
Finalmente, recomendamos al maestro que cualquiera que sea la secuencia y las sec-
ciones elegidas en cada una de ellas, se discuta y trabaje con los ejemplos resueltos de fi-
nal de cada capítulo.
-----------------_._--==~-------------------------------~¿..--------~
xiv Métodos numéricos aplicados a la ingeniería
Red de temas e interrelación
I
Capítulo 1
~Errores
~
Capítulo 2 Capítulo 3
Solución de ecuaciones no lineales Matrices y sistemas de ecuaciones lineales
~ ,
Capítulo 4
Sistemas de ecuaciones no lineales
t
Capítulo 5 Capítulo 6
Aproximación funcional e Integración y diferenciación
interpolación numérica
1
I
1t
Capítulo 8 Capítulo 7
Ecuaciones diferenciales parciales Ecuaciones diferenciales ordinarias
M.
___ Dependencia en requisitos básicos y mecánica de cálculo de los algoritmo s
.•. Dependencia solamente de la mecánica de cálculo de los algoritmos
Cambios esenciales en esta edición
La mayoría de estos cambios responden a sugerencias de profesores que imparten méto-
dos numéricos en diferentes instituciones del país.
• A dónde nos dirigimos. Se inicia cada capítulo con una introducción donde se descri-
be brevemente qué estudiaremos, cómo lo vamos a hacer, qué relación guarda el ma-
terial con el de los demás capítulos y, algunas veces, el tipo de problemas que pueden
resolverse.
Guiones de Matlab. Se incluyen en el libro y en la carpeta Software de cada capítulo
del CD guiones de Matlab para distintos ejercicios, ejemplos y problemas.
• Programas en la TI-92. A lo largo del libro se dan programas para la TI-92.
• Programas en Visual Basic. A fin de aprovechar los aspectos visuales de los lengua-
jes actuales, en el CD se proporcionan programas en Visual Basic que pueden ser mo-
dificados para adaptarlos a otras situaciones.
• Nuevos ejemplos, ejercicios y problemas. Se han adicionado ejercicios y problemas de
aplicación para darle mayor versatilidad al material.
• Soluciones a ejemplos y ejercicios en Matlab, Mathcad y Mathematica en el CD.
• Sección de valores y vectores propios. El material de valores y vectores propios que
aparecía originalmente disperso se ha organizado como la sección 3.6.
Prefacio XV
• Sección de problemas de valores a la frontera. Se ha incorporado la sección 7.7 don-
de se estudian ecuaciones diferenciales ordinarias con valores a la frontera.
• Método de Bairstow. Se ha incorporado el método de Bairstow para encontrar raíces
de ecuaciones polinomiales en la sección 4.7 como una aplicación de las técnicas de
solución de ecuaciones no lineales.
• Ecuación de onda unidimensional. En la nueva sección 8.7 se resuelve la ecuación de
onda de modo de trabajar con ecuaciones hiperbólicas y experimentar con el fenóme-
no de vibración de una cuerda.
• leonas utilizados en la segunda edición. El libro se rediseñó íntegramente para facilitar
su lectura. En particular, se incluyeron los iconos que aparecen a continuación para per-
mitir al lector identificar con rapidez los nuevos apoyos con los que cuenta el libro.
Guiones de Matlab.
liiiI
~
Programas para la calculadora TI-92.
Indica un programa en Visual Basic que se ha incluido el! el CD y que le ayudan
en la solución de ese ejercicio o ejemplo.
La solución se incluye en el CD (en Mathcad, Matlab y Mathematica).
Materiales adicionales
CD diseñado especialmente para la segunda edición con:
Programas fuente en Visual Basic y sus respectivos ejecutables que corren en Win-
dows 95 o posterior para la solución de ejemplos y ejercicios.
• Documentos de Mathcad y guiones de Matlab. Los documentos en Mathcad permiten
darle un sentido exploratorio a los métodos numéricos y los guiones segundos acceso
a uno de los paquetes más poderosos para resolver problemas matemáticos.
• Algoritrnos, descripción de los programas de cómputo y explicaciones detalladas de
su uso.
• Ligas a sitios donde el lector encontrará tutoriales de Mathcad, Matlab y Mathemati-
ea, en los que podrá aprender a usar estos paquetes.
• Sugerencias de empleo de software comercial (Mathcad y Matlab, Mathematica) para
resolver un gran número de ejemplos y ejercicios.
www. Sitio Web con:
• Actualizaciones del material del libro (nuevas soluciones, problemas, programas, etcé-
tera).
• Registro del usuario a fin de recibir las actualizaciones del material del libro y los pro-
gramas que se desarrollen más adelante (se están escribiendo los programas en For-
tran 90 y en Visual C++), así como poder enviar sus propias sugerencias o establecer
comunicación directa con los autores.
• Para tener acceso a este material, el lector sólo necesita entrar a la página de Grupo
Patria Cultural (http://www.patriacultural.com.mxJnieves/index.html) e ingresar los
datos de la obra.
Prefacio XV
• Sección de problemas de valores a la frontera. Se ha incorporado la sección 7.7 don-
de se estudian ecuaciones diferenciales ordinarias con valores a la frontera.
• Método de Bairstow. Se ha incorporado el método de Bairstow para encontrar raíces
de ecuaciones polinomiales en la sección 4.7 como una aplicación de las técnicas de
solución de ecuaciones no lineales.
• Ecuación de onda unidimensional. En la nueva sección 8.7 se resuelve la ecuación de
onda de modo de trabajar con ecuaciones hiperbólicas y experimentar con el fenóme-
no de vibración de una cuerda.
• Iconos utilizados en la segunda edición. El libro se rediseñó íntegramente para facilitar
su lectura. En patticular, se incluyeron lo~ iconos que aparecen a continuación para per-
mitir al lector identificar con rapidez los nuevos apoyos con los que cuenta el libro.
liiiI
~
Guiones de Matlab.
Programas para la calculadora TI-92.
Indica un programa en Visual Basic que se ha incluido en el CD y que le ayudan
en la solución de ese ejercicio o ejemplo.
La solución se incluye en el CD (en Mathcad, Matlab y Mathematica).
Materiales adicionales
tJ CD diseñado especialmente para la segunda edición con:
• Programas fuente en Visual Basic y sus respectivos ejecutables que corren en Win-
dows 95 o posterior para la solución de ejemplos y ejercicios.
• Documentos de Mathcad y guiones de Matlab. Los documentos en Mathcad permiten
darle un sentido exploratorio a los métodos numéricos y los guiones segundos acceso
a uno de los paquetes más poderosos para resolver problemas matemáticos.
• Algoritmos, descripción de los programas de cómputo y explicaciones detalladas de
su uso.
• Ligas a sitios donde el lector encontrará tutoriales de Mathcad, Matlab y Mathemati-
ca, en los que podrá aprender a usar estos paquetes.
• Sugerencias de empleo de software comercial (Mathcad y Matlab, Mathematica) para
resolver un gran número de ejemplos y ejercicios.
www. Sitio Web con:
• Actualizaciones del material del libro (nuevas soluciones, problemas, programas, ei¡;é-
tera).
• Registro del usuario a fin de recibir las actualizaciones del material del libro y los pro-
gramas que se desarrollen más adelante (se están escribiendo los programas en For-
tran 90 y en Visual C++), así como poder enviar sus propias sugerencias o establecer
comunicación directa con los autores.
• Para tener acceso a este material, el lector sólo necesita entrar a la página de Grupo
Patria Cultural (http://www.patriacultural.com.mxJnieves/index.html) e ingresar los
datos de la obra.
/
-------------------------------------------------------------'I!!<;"'I1"""""-----
I
XVI Métodos numéricos aplicados a la .ingeniería
eA
Agradecimientos
Esta obra tiene su origen en apuntes para los cursos de métodos numéricos en la carrera de
Ingeniero Químico Industrial del Instituto Politécnico Nacional, desarrollados durante una
estancia de año sabático en el Instituto Tecnológico de Celaya, y posteriormente, a raíz de
un certamen organizado por el propio IPN, se convirtieron en una propuesta de libro que
ganó el primer lugar en el Primer Certamen Editorial Politécnico en 1984. Desde enton-
ces, con actualizaciones continuas, ha sido utilizado como texto para estos cursos en dife-
rentes instituciones del país. Los autores agradece~ al Instituto Politécnico Nacional la'
facilidad que otorgó para que la Editorial CECSA lo publicara.
Agradecemos también a las muchas personas que en distintas formas colaboraron pa-
ra la realización de este libro. En, especial al Dr. Guillermo Marroquín Suárez por el ma-
terial, ideas y colaboración intensa que durante un año aportó a la elaboración de los
capítulos 5 a 8; su valiosa ayuda permitió darle un enfoque interesante de aplicación al
material matemático; sus observaciones a las soluciones enriquecieron el análisis de los
ejercicios. Al Ing. Arturo Javier López García por el programa del método de Müller y al
M. en C. Ramón Duarte Ramos por su asesoría en los problemas de vigas y columnas.
Nuestro agradecimiento especial al personal de la Editorial CECSA, y en particular a
Elisa Pecina Rosas, nuestra editora, por su interés constante en lograr una óptima presen-
tación técnica, de estilo y de diseño gráfico en el libro.
Intr
F
usa
XVI Métodos numéricos aplicados a la .ingeniería
Agradecimientos
Esta obra tiene su origen en apuntes para los cursos de métodos numéricos en la carrera de
Ingeniero Químico Industrial del Instituto Politécnico Nacional, desarrollados dumnte una
estancia de año sabático en el Instituto Tecnológico de Celaya, y posteriormente, a raíz de
un certamen organizado por el propio IPN, se convirtieron en una propuesta de libro que
ganó el primer lugar en el Primer Certamen Editorial Politécnico en 1984. Desde enton-
ces, con actualizaciones continuas, ha sido utilizado como texto para estos cursos en dife-
rentes instituciones del país. Los autores agradece~ al Instituto Politécnico Nacional la'
facilidad que otorgó para que la Editorial CECSA lo publicara.
Agradecemos también a las muchas personas que en distintas formas colaboraron pa-
ra la realización de este libro. En.especial al Dr. Guillermo Marroquín Suárez por el ma-
terial, ideas y colaboración intensa que durante un año aportó a la elaboración de los
capítulos 5 a 8; su valiosa ayuda permitió darle un enfoque interesante de aplicación al
material matemático; sus observaciones a las soluciones enriquecieron el análisis de los
ejercicios. Al Ing. Arturo Javier López García por el programa del método de Müller y al
M. en C. Ramón Duarte Ramos por su asesoría en los problemas de vigas y columnas.
Nuestro agradecimiento especial al personal de la Editorial CECSA, y en particular a
Elisa Pecina Rosas, nuestra editora, por su interés constante en lograr una óptima presen-
tación técnica, de estilo y de diseño gráfico en el libro.
rade
e una
íz de
que
nton-
dife-
al la
n pa-
ma-
e los
ón al
e los
yal
as.
lara
sen-
CP'PÍTULO t
ERRORES
A dónde nos dirigimos
"'
En este capítulo revisaremos tres de los sistemas numéricos posicionales másrelevan-
tes en el estudio de los métodos numéricos: binario, octal y decimal. Para esto analiza-
remos las conversiones entre ellos, la representación y manejo del sistema binario en la
computadora, así como los diversos errores que ello puede ocasionar y algunas formas
de evitados. Dada la naturaleza electrónica de las calculadoras y computadoras, los sis-
temas binario y octal resultan los más indicados a usarse en estos dispositivos; por lo
que, a fin de tener una idea de·los procesos numéricos internos en ellas, conviene hacer
un estudio de tales sistemas y su conversión al decimal, ya que éste es finalmente nues-
tro medio de enlace con las máquinas.
Por mi lado, dada la finititud de la palabra de memoria de las máquinas, es imfo-
sible representar a todos los números reales en ella. Así, números como Te, [2, :3 =
0.333 ..., números muy pequeños" (o muy grandes) se manejan usando números que son
aproximaciones de ellos o simplemente no se manejan. Por otro lado, una de las carac-
terísticas más sobresalientes de los métodos numéricos es el uso de los números reales
en cálculos extensos. Cabe entonces preguntarse qué efecto tienen tales aproximacio-
nes en los cálculos que hacemos con dichos números, en los resultados que obtenemos
e incluso qué números reales pueden representarse exactamente en la computadora.
El conocimiento de todo esto nos ayudará a evitar cierto tipo de errores, analizar
su propagación e incluso interpretar mejor los resultados dados por una máquina.
Introducción
En la antigüedad, los números naturales se representaban con distintos tipos de símbolos
o numerales. A continuación se presentan algunas muestras de numerales primitivos. (Fig.
1.1 Y 1.2).
~
• 11 •
3: •
m6
-• - 11
- 16
-1
- -• •
~
• •
I • •
~
7
- - 17
-2 •• ~
12
-- -..
~
•••
~
•••
E •••
~
8
-3 ••• - 13
- 18
-- -
a 9 ••••
~
••••
~
••••
~
4 •••• - 14
- 19
-- --~ 10 -11 mCERO
~~
5
-- - 15
--
Figura 1.1
Numerales
usados por los
mayas.
• En estos casos la computadora envía un mensaje indicando que el número es muy pequeño (underf/ow) o muy
grande ioverflow¡ para su capacidad.
2 Métodos numéricos aplicados a la ingeniería
UNO DOS TRES CUATRO
1 1 111 1111
• • • ••• • • • •Figura 1.2
~ ~ ~ ~Numerales -
primitivos.
En la figura 1.2 se puede observar que cada numeral es un conjunto de marcas sencillas e
iguales. ¡Imagínese si así se escribiera el número de páginas del directorio telefónico de
la Ciudad de México! No sería práctico por la enorme cantidad de tiempo y de espacio que
requeriría tal sucesión de marcas iguales. Más aún, nadie podría reconocer, a primera vis-
ta, el número representado. Por ejemplo, ¿podría identificar rápidamente el siguiente nu-
meral?
= ?
Los antiguos egipcios evitaron algunos de los inconvenientes de los numerales represen-
tados por medio de marcas iguales, usando un solo jeroglífico o figura. Por ejemplo, en lu-
gar de 1 1 1 1 1 1 11 ! 1, usaron el símbolo 11. Este jeroglífico representaba el hueso
del talón. En la Fig. 1.3 se muestran otros numerales egipcios básicos relacionados con
los del sistema decimal que les corresponden.
10 100 1,000 10,000 100,000 1'000,000
~ n © 1. r( P<CY ;y
Figura 1.3
Raya Hueso del Cuerda Flor de Dedo Pez Hombre
Números
egipcios
talón enrollada loto señalado sorprendido
antiguos.
1.1 Sistemas numéricos
NUMERACiÓN CON BASE DOS (SISTEMA BINARIO)
Dado el siguiente conjunto de marcas simples e iguales
1,
si se encierran en óvalos por parejas, a partir de la izquierda, se tiene.
se
de
ue
¡s-
u-
en-
lu-
eso
on
Errores 3
A continuación, también empezando por la izquierda, se encierra cada par de óvalos en
otro mayor.
~_I @)@_'_9
Finalmente, se encierra cada par de óvalos en uno mayor todavía, comenzando también
por la izquierda.
Nótese que el número de marcas dentro de cualquier óvalo es una potencia de 2.
El número representado por el numeral I I se
obtiene así
o también
Hay que observar que en esta suma no aparece 22. Como O X 22 = O,entonces la suma pue-
de escribirse así
Ahora puede formarse un nuevo símbolo para representar esta suma omitiendo los parén-
tesis, los signos de operación + y X, Y las potencias de 2, de la siguiente manera:
( 1 X 23 )
1
1
+ (O X 22
)
1
O
+ ( 1 X 21) + ( 1 X 2° )
1 1
Nuevo símbolo: 1 1
Ahora bien, ¿cómo interpretaremos este nuevo símbolo?
El significado de los números 1 en este nuevo símbolo depende del lugar que ocupan en
el numeral. Así pues, el primero de derecha a izquierda representa una unidad; el segun-
do, un grupo de dos (o bien 2'), el cuarto cuatro grupos de dos (8, o bien 23). El cero es el
medio de asignarle a cada "1" su posición correcta. A los números o potencias de 2 que re-
presentan el "1" según su posición en el numeral, se les llama valores de posición; se dice
que un sistema de numeración que emplea valores de posición es un sistema posicional.
El sistema de este ejemplo es un sistema de base dos, o sistema binario, porque em-
plea un grupo básico de dos símbolos: Oy 1. Los símbolos "1" y "O" utilizados para escri-
bir los numerales se denominan dígitos binarios o bits.
¿Qué número representa el numerallOlOlOdos?
(Se lee: "uno, cero, uno, cero, uno, cero, base dos").
Escríbanse los valores de posición debajo de los dígitos:
Dígitos binarios 1
Valores de posición
1 OO
Multiplicando los valores de posición por los dígitos binarios correspondientes y sumán-
dolos todos, se obtiene el equivalente en decimal.
Errores 3
A continuación, también empezando por la izquierda, se encierra cada par de óvalos en
otro mayor.
~_I _@>@_'_9
Finalmente, se encierra cada par de óvalos en uno mayor todavía, comenzando también
por la izquierda.
Nótese que el número de marcas dentro de cualquier óvalo es una potencia de 2.
El número representado por el numeral I I se
obtiene así
o también
Hay que observar que en esta suma no aparece 22. Como O X 22 =O, entonces la suma pue-
de escribirse así
Ahora puede formarse un nuevo símbolo para representar esta suma omitiendo los parén-
tesis, los signos de operación + y x, Ylas potencias de 2, de la siguiente manera:
( 1 X 23 ) + (O X 22 ) + (1 X 21 ) + ( 1 X 2° )
1 1 1 1
Nuevo símbolo: O 1 1
Ahora bien, ¿cómo interpretaremos este nuevo símbolo?
El significado de los números 1 en este nuevo símbolo depende del lugar que ocupan en
el numeral. Así pues, el primero de derecha a izquierda representa una unidad; el segun-
do, un grupo de dos (o bien 21), el cuarto cuatro grupos de dos (8, o bien 23). El cero es el
medio de asignarle a cada "1" su posición correcta. A los números o potencias de 2 que re-
presentan el "1" según su posición en el numeral, se les llama valores de posición; se dice
que un sistema de numeración que emplea valores de posición es un sistema posicional.
El sistema de este ejemplo es un sistema de base dos, o sistema binario, porque em-
plea un grupo básico de dos símbolos: Oy 1. Los símbolos "1" y "O" utilizados para escri-
bir los numerales se denominan dígitos binarios o bits.
¿Qué número representa el numerallOlOlOdos?
(Se lee: "uno, cero, uno, cero, uno, cero, base dos").
Escríbanse los valores de posición debajo de los dígitos:
Dígitos binarios 1
Valores de posición
O 1
Multiplicando los valores de posición por los dígitos binarios correspondientes y sumán-
dolos todos, se obtiene el equivalente en decimal.
4 Métodos numéricos aplicados a la ingeniería
10101Odos== (1 X 25) + (O X 24) + (1 X 23) + (O X 22) + (1 X 2') + (O X 2°)
42diez
(se lee: "cuatro, dos, base diez").
El sistema de numeración más difundido en la actualidad es el sistema decimal. Es un sis-
tema posicional que usa un grupo básico de diez (base diez).
Considérese por ejemplo el numeral 582diez
EjE
Dígitos decimales
Valores de posición
Forma desarrollada
8
lO'
(8 X 10') +
Al escribir números decimales se omite la palabra "diez" y se establece la convención de
que un numeral con valor de posición, es un número decimal, sin necesidad de indicar la
base. De ahí que siempre se anote 582 en lugar, de 582diez
'
El desarrollo y arraigo del sistema decimal, quizá se deba al hecho de tener siempre a
la vista, los diez dedos de las manos. El sistema binario se emplea en las computadoras di-
gitales, debido a que los alambres que forman los circuitos electrónicos presentan sólo dos
estados: magnetizados o no magnetizados, ya sea que pase o no corriente por ellos.
CONVERSiÓN DE NÚMEROS ENTEROS DEL SISTEMA DECIMAL A UN
SISTEMA DE BASE b y VICEVERSA
Para convertir un número n del sistema decimal a un sistema con base b, se divide el nú-
mero n entre la base b y se registra el cociente e, y el residuo rI
resultantes; se divide e,
entre la base b, y se anotan el nuevo cociente e2
y el nuevo residuo r2
. Este procedimien-
to se repite hasta oblener un cociente e¡ igual a cero con residuo ri
• El número equivalen-
te a n en el sistema con base b queda formado así: ri ri_' ri_2 ... r,.
Convierta 35810
al sistema octa!.
Solución La base del sistema octal" es 8, por tanto
~
358 == 8 X 44 + 632
e, r,
44 8 X 5 + 4
e2 r2
5 8 X O + 5
Así que el número equivalente en octal es 546
• El sistema octal usa un grupo básico de ocho símbolos: 0, 1,2,3,4,5,6,7.
sis-
de
la
ea
di-
dos
Errores 5
Convierta 35810 a binario (base 2).
Solución 358 2 x 179 + O
~
179 2 x 89 + 1
89 2 x 44 + 1
44 2 x 22 + O
22 2 x 11 + O
11 2 x 5 + 1
5 2 x 2 + 1
2 2 x 1 + O
1 2 x O + 1
Por tanto 3580 = 1011001102
Para convertir un entero m de un sistema con base b al sistema decimal, se multiplica ca-
da dígito de m por la base b elevada a una potencia igual a la posición del dígito, tomando
como posición cero la del dígito situado más a la derecha. De la suma resulta el equiva-
lente decimal. Así
2768 = 2 X 82 + 7 X 81 + 6 X 8° = 19010
10100012 = 1 X 26 + O X 25 + 1 X 24 + O X 23 + O X 22
+ O X 21 + 1 X 2° = 8110
CONVERSiÓN DE NÚMEROS ENTEROS DEL SISTEMA
OCTAL AL BINARIO y VICEVERSA
Dado un número del sistema octal, su equivalente en binario se obtiene sustituyendo ca-
da dígito del número octal con los tres dígitos equivalentes del sistema binario.
Base octal Equivalente binario en tres dígitos
O 000
1 001
2 010
3 011
4 100
5 101
6 110
7 111
6 Métodos numéricos aplicados a la ingeniería
Ejemplo 1.3 Convierta 5468
a binario. EjelT
Solución 5
101
4
100
6
110
Así que 5468
= 1011001102
Dado un número en binario, su equivalente en octal se obtiene formando temas de dígitos,
contando de derecha a izquierda y sustituyendo cada terna por su equivalente en octal. Así
Convertir 100110012
a octal
010 011 0012 Por tanto 100110012
= 2318
2 3 1
Dado que la conversión de octal a binario es simple y la de decimal a binario resulta muy
tediosa, se recomienda usar la conversión a octal como paso intermedio al convertir un nú-
mero decimal a binario.
I DECIMAL l+-o ----+0 I OCTAL l+-o ----+0 I BINARlO J
Las flechas tienen dos sentidos porque es válido en ambas direcciones lo dicho.
Ejemplo 1.4 Convierta 1011001102
a decimal.
Solución a) Conversión directa
1011001102 = 1 X 28 + O X 27 + 1 X 26 + 1 X 25 + O X 24 +
O X 23 + 1 X 22 + 1 X 2¡ + O X 20 = 35810
b) Usando la conversión a octal como paso intermedio:
1) Conversión a' octal 101
5
100
4
110
6
Por tanto 1011001102 = 5468
2) Cónversión de octal a decimal
5468 = 5 X 82 + 4 X 81 + 6 X 80 = 35810
CONVERSIÓN DE NÚMEROS FRACCIONARIOS DEL SISTEMA DECIMAL
A UN SISTEMA CON BASE b
Ej
Para convertir un número x¡o fraccionario a un número con base b, se multiplica dicho nú-
mero por la base b; el resultado tiene una parte entera el Yuna parte fraccionariaj.. Se mul-
tiplica ahora f por b y se obtiene un nuevo producto con parte entera e2
y fraccionaria j..
Este procedimiento se repite un número suficiente de veces o hasta que se presenta.t¡ = O.El
equivalente de xlO con base b queda así O. e¡ e2 e3 e4 .••
6 Métodos numéricos aplicados a la ingeniería
Ejemplo 1.3 Convierta 5468 a binario.
Solución 5
101
Así que 5468 = 1011001102
4
100
6
110
Dado un número en binario, su equivalente en octal se obtiene formando ternas de dígitos,
contando de derecha a izquierda y sustituyendo cada terna por su equivalente en octal. Así
Convertir 100110012 a octal
010 Oll 0012 Por tanto 100110012 = 231 8
2 3 1
Dado que la conversión de octal a binario es simple y la de decimal a binario resulta muy
tediosa, se recomienda usar la conversión a octal como paso intermedio al convertir un nú-
mero decimal a binario.
I DECIMAL I~----+'I OCTAL I~'---,I BINARIO J
Las flechas tienen dos sentidos porque es válido en ambas direcciones lo dicho.
Ejemplo 1.4 Convierta 1011001102 a decimal.
Solución a) Conversión directa
1011001102 = 1 X 28 + O X 27 + 1 X 26 + 1 X 25 + O X 24 +
O X 23 + 1 X 22 + 1 X 2] + O X 20 =358'0
b) Usando la conversión a octal como paso intermedio:
1) Conversión a' octal 101
5
100
4
Por tanto 1011001102 = 5468
2) Cónversión de octal a decimal
110
6
5468 = 5 X 82 + 4 X 8] + 6 X 80 = 35810
CONVERSIÓN DE NÚMEROS FRACCIONARIOS DEL SISTEMA DECIMAL
A UN SISTEMA CON BASE b
Para convertir un número x]O fraccionario a un número con base b, se multiplica dicho nú-
mero por la base b; el resultado tiene una parte entera e] y una parte fraccionaria!]. Se mul-
tiplica ahora!] por b y se obtiene un nuevo producto con parte entera e2 y fraccionaria!2'
Este procedimiento se repite un número suficiente de veces o hasta que se presentaj¡ = O. El
equivalente de xlO con base b queda así O. e] e2 e3 e4 ...
Errores 7
Ejemplo 1.5! Convierta 0.210
a octal y binario.
Solución a) Conversión a octal
tos,
Así
0.2
X 8
1.6
e.f,
0.8
X8
6.4
eJ3
0.2
X 8
1.6
esfs
Después de e4 se van a repetir el el e2 e3 e4 indefinidamente, por lo que 0.210
=
0.14631463"'8
b) Conversión a binario
uy
ú-
0.2 0.4 0.8 0.6 0.2
X2 X2 X2 X2 X2
- -- -- --
0.4 0.8 1.6 1.2 0.4
elJ; e2f2 e3f3 e4f4 esfs
Igual que en el inciso a), después de e4 se repite el e2 e3 e4 indefinidamente, por 10 que
0.210
= 0.001100110guatda.com/cmx.p011...2 I
Obsérvese que 0.210 pudo convertirse en binario simplemente tomando su equivalente en
octal, y sustituyendo cada número por su tema equivalente en binario. Así
0.210 = 0.1
0.001
463 1
100 110 011 001
463
100 110 011
y
0.210 = 0.0011001100110011001100110011"'2
De lo anterior se puede observar que
358.210 = 101100110.001100110011001100110011"'2
y cualquier número con parte entera y fraccionaria puede pasarse a otro sistema, cambian-
do su parte entera y fraccionaria de manera independiente, y al final integrándolos.
Para convertir números decimales enteros y fraccionario s a base 2,3, ... ,9 puede usar
el P~OGRAMA 1.1 del CD.
6
32
CONVERSiÓN DE UN NÚMERO FRACCIONARIO EN SISTEMA BINARIO
A SISTEMA DECIMAL
El procedimiento es similar al caso de números enteros, sólo hay que tomar en cuenta que
la posición inicia con -1, a partir del punto.
Convierta 0.0101011102 a decimal
Solución 0.010101110 = O X 2-1 + 1 X 2-2 + O X 2-3 + 1 X 2-4
+ O X 2-s + 1 X 2-6 + 1 X 2-7 + 1 X 2-8 +0 X 2-9
= 0.3398437510
8 Métodos numéri cos aplicados a la ingeniería
Convierta 0.0101011102
a decimal.
Solución a) Conversión a octal
0.010
2
110
6
101
5
y
0.0101011102 = 0.2568
b) Conversión a decimal
0.2568 = 2 X 8-1
+ 5 X 8-2
+ 6 X 8-3 = 0.33984375'0
1.2 Manejo de números en la computadora
Por razones prácticas, sólo puede manejarse una cantidad finita de bits para cada número
en una computadora, y esta cantidad o longitud varía de una máquina a otra. Por ejemplo,
cuando se realizan cálculos de ingeniería y ciencias, es mejor trabajar con una longitud
grande; por otro lado, una longitud pequeña es más económica y útil para cálculos y pro-
cesamientos administrativos.
Para una computadora dada, el número de bits generalmente se llama palabra. Las pa-
labras van desde ocho bits hasta 64 bits. Para facilitar su manejo, la palabra se divide en
partes más cortas denominadas bytes; por ejemplo, una palabra de 32 bits puede dividirse
en cuatro bytes (ocho bits cada uno).
d
NÚMEROS ENTEROS
Cada palabra, cualquiera que sea su longitud, almacena un número, aunque en ciertas cir-
cunstancias se usan varias palabras para contener un número. Por ejemplo, considérese
una palabra de 16 bits para almacenar números enteros. De los 16 bits, el primero repre-
senta el signo del número; un cero es un signo más y un uno un signo menos. Los 15 bits
restantes pueden usarse para guardar números binarios desde 000000000000000 hasta
111111111111111 (véase figura 1.1). Al convertir este número en decimal se obtiene
(l X 214) + (l X 213) + (1 X 212) + ... + (1 X 21) + (l X 2°)
que es igual a 32767 (215 -1). Por tanto, cada palabra de 16 bits puede contener un nú-
mero cualquiera del intervalo -32768 a + 32767 (véase Probo 1.10).
Figura 1.4
Esquema de
una palabra
de 16 bits para
un número
entero.
16 bits
:Iibit O bit 15
8 Métodos numéricos aplicados a la ingeniería
Convierta 0.0101011102 a decimal.
Solución a) Conversión a octal
y
0.010
2
101
5
110
6
0.0101011102 =0.2568
b) Conversión a decimal
0.2568
= 2 X 8-1 + 5 X 8-2 + 6 X 8-3 = 0.33984375 10
1.2 Manejo de números en la computadora
Figura 1.4
Esquema de
una palabra
de 16 bits para
un número
entero.
Por razones prácticas, sólo puede manejarse una cantidad finita de bits para cada número
en una computadora, y esta cantidad o longitud varía de una máquina a otra. Por ejemplo,
cuando se realizan cálculos de ingeniería y ciencias, es mejor trabajar con una longitud
grande; por otro lado, una longitud pequeña es más económica y útil para cálculos y pro-
cesamientos administrativos.
Para una computadora dada, el número de bits generalmente se llama palabra. Las pa-
labras van desde ocho bits hasta 64 bits. Para facilitar su manejo, la palabra se divide en
partes más cortas denominadas bytes; por ejemplo, una palabra de 32 bits puede dividirse
en cuatro bytes (ocho bits cada uno).
NÚMEROS ENTEROS
Cada palabra, cualquiera que sea su longitud, almacena un número, aunque en ciertas cir-
cunstancias se usan varias palabras para contener un número. Por ejemplo, considérese
una palabra de 16 bits para almacenar números enteros. De los 16 bits, el primero repre-
senta el signo del número; un cero es un signo más y un uno un signo menos. Los 15 bits
restantes pueden usarse para guardar números binarios desde 000000000000000 hasta
111111111111111 (véase figura 1.1). Al convertir este número en decimal se obtiene
(l X 214 ) + (1 X 213 ) + (1 X 212 ) + ... + (l X 21) + (l X 2°)
que es igual a 32767 (215 -1). Por tanto, cada palabra de 16 bits puede contener un nú-
mero cualquiera del intervalo -32768 a + 32767 (véase Probo 1.10).
16 bits
i bit O bit 15
era
plo,
itud
pro-
pa-
e en
irse
cir-
ese
re-
bits
sta
nú-
Errores 9
Ejemplo 1.8 Represente el número -26 en una palabra de 16 bits.
Solución -2610 = - 110102
, Y su almacenamiento en una palabra de 16 bits quedaria así
Represente el número 525¡0' en una palabra de 16 bits.
Solución 52510 = 10158 = 10000011012, Y su almacenamiento quedaria así
NÚMEROS REALES (PUNTO FLOTANTE)
Cuando se desea almacenar un número real, se emplea en su representación binaria, lla-
mada de punto flotante, la notación
0.d¡d2d3d4dsd6d7d8 X l',d'2
d
'3
d
'"d',d'6
d
'7
donde d¡ = 1 Y di Y d'j con i = 2, Oo., 8 Yj = 1,2, ... ,7 pueden ser ceros 0 unos, y se guar-
da en una palabra como se muestra en la figura 1.2
Figura 1.5
Esquema de
una palabra
de 16 bits para
un número de
punto flotante. Bit 15
Característica Mantisa I-------=--
iBit O
Igual que antes, el bit cero se usa para guardar el signo del número. En los bits del
uno al siete se almacena el exponente de la base 2 y en los ocho bits restantes la fracción."
Según el lenguaje de los logaritmos, la fracción es llamada mantisa y el exponente ca-
racterística. El número mayor que puede guardarse en una palabra de 16 bits usando la
notación de punto flotante es
O
1
Exponente
positivo
1
0111111 11111111
1
más Equivalente a 0.99 en decimal
• El exponente es un número binario de seis dígitos, ya que el bit uno se emplea para su signo. En algunas cornpu-
tadoras el exponente se almacena en base ocho (octal) o base 16 (hexadecimal) en lugar de base 2.
Errores 9
Represente el número -26 en una palabra de 16 bits.
Solución -2610 =- 110102, Ysu almacenamiento en una palabra de 16 bits quedaria así
Represente el número 52510, en una palabra de 16 bits.
Solución 525 10 = 10158= 10000011012, Ysu almacenamiento quedaria así
Figura 1.5
Esquema de
una palabra
de 16 bits para
un número de
punto flotante.
1010 ° ° ° ° ° ° ° ° °
NÚMEROS REALES (PUNTO FLOTANTE)
C:uando se desea almacenar un número real, se emplea en su representación binaria, lla-
mada de punto flotante, la notación
O.d1d2d3d4dsd6d7d8 X 2d
' Id' 2 d' 3 d'" d' 5 d'6 d'7
donde dI = 1 Ydi Yd ' j con i = 2, ..., 8 Yj = 1,2,... ,7 pueden ser ceros 0 unos, y se guar-
da en una palabra como se muestra en la figura 1.2
Característica Mantisa
¡Bit ° Bit 15
Igual que antes, el bit cero se usa para guardar el signo del número. En los bits del
uno al siete se almacena el exponente de la base 2 y en los ocho bits restantes la fracción.'"
Según el lenguaje de los logaritmos, la fracción es llamada mantisa y el exponente ca-
racterística. El número mayor que puede guardarse en una palabra de 16 bits usando la
notación de punto flotante es
°1
más
Exponente
positivo
1
0111111 11111111
1
Equivalente a 0.99 en decimal
• El exponente es un número binario de seis dígitos, ya que el bit uno se emplea para su signo. En algunas compu-
tadoras el exponente se almacena en base ocho (octal) o base 16 (hexadecimal) en lugar de base 2.
10 Métodos numéricos aplicados a la ingeniería
y los números que se pueden guardar en punto flotante binario van de alrededor de 2-64 (si
la característica es negativa) a cerca de 263; en decimal, de 10-19 a cerca de 1018 en mag-
nitud (incluyendo números positivos, negativos y cero).
Ejemplo 1.10 El número decimal-125.32 que en binario es
-1111101.010100011110101,
normalizado queda así
-.1111101010100011110101 X 2+111
I I
I
bits truncados en el almacenamiento
y la palabra de memoria de 16 bits donde se almacena este valor quedaría como
signo mantisa característica positiva
I
1 1
t.
característica mantisa
Nótese que primero se normaliza el número, después se almacenan los primeros ocho
bits y se truncan los restantes.
El número decimal + 0.2, que en binario es
0.0011001100110011 ...
y que normalizado queda
.1100110011001100 ... X 2-10
I I
I
bits truncados
se almacena así
DOBLE PRECISiÓN
La doble precisión es un esfuerzo para aumentar la exactitud de los cálculos adicionando
más bits a la mantisa. Esto se hace al utilizar dos palabras, la primera en la forma expues-
ta anteriormente, y los bits de la segunda para aumentar la mantisa de la primera. Enton-
ces, con una palabra de 16 bits puede usarse en doble precisión una mantisa de 8 + 16 =
24 bits. Los 24 bits de la mantisa permiten expresar alrededor de 7 dígitos de exactitud en
un número decimal, en lugar de 3 de la precisión sencilla.
La desventaja del uso de la doble precisión es que se emplean más palabras, con lo
cual se acrecenta el uso de memoria por un programa.
10 Métodos numéricos aplicados a la ingeniería
y los números que se pueden guardar en punto flotante binario van de alrededor de 2-64 (si
la característica es negativa) a cerca de 263 ; en decimal, de 10-19 a cerca de 1018 en mag-
nitud (incluyendo números positivos, negativos y cero).
El número decimal-125.32 que en binario es
-1111101.010100011110101,
normalizado queda así
-.1111101010100011110101 X 2+1J1
I I
bits truncados en el almacenamiento
y la palabra de memoria de 16 bits donde se almacena este valor quedaría como
signo mantisa
1 1
característica
característica positiva
I
mantisa
Nótese que primero se normaliza el número, después se almacenan los primeros ocho
bits y se truncan los restantes.
El número decimal + 0.2, que en binario es
0.0011001100110011 ...
y que normalizado queda
.1100110011001100... X 2-10
I I
bits truncados
se almacena así
DOBLE PRECISiÓN
La doble precisión es un esfuerzo para aumentar la exactitud de los cálculos adicionando
más bits a la mantisa. Esto se hace al utilizar dos palabras, la primera en la forma expues-
ta anteriormente, y los bits de la segunda para aumentar la mantisa de la primera. Enton-
ces, con una palabra de 16 bits puede usarse en doble precisión una mantisa de 8 + 16 =
24 bits. Los 24 bits de la mantisa permiten expresar alrededor de 7 dígitos de exactitud en
un número decimal, en lugar de 3 de la precisión sencilla.
La desventaja del uso de la doble precisión es que se emplean más palabras, con lo
cual se acrecenta el uso de memoria por un programa.
Errores 11
si ERROR DE REDONDEO
o.,
b
Para finalizar esta sección, se analizarán brevemente algunas consecuencias de utilizar el
sistema binario y una longitud de palabra finita.
Como no es posible guardar un número binario de longitud infinita o un número de
más dígitos de los que posee la mantisa de la computadora que se está empleando, se al-
macena sólo un número finito de estos dígitos; como consecuencia, se comete automática-
mente un pequeño error, conocido como error de redondeo, que al repetirse muchas veces
puede llegar a ser considerable. Por ejemplo, si se desea guardar la fracción decimal
0.0001 que en binario es la fracción infinita
0.000000000000011010001101101110001011101011000 ...
quedaría, después de normalizarse, almacenado en una palabra de 16 bits como
.11010001 X 2-1101
Si se desea sumar el número 0.0001 con él mismo diez mil veces, usando una computado-
ra, naturalmente que no se esperará obtener 1 como resultado, ya que los números que se
adicionen no serían realmente 0.0001 sino valores aproximados a él (véase Probo 1.16).
t.3 Errores
ERROR ABSOLUTO, ERROR RELATIVO Y ERROR EN POR CIENTO
Si p* es una aproximación a p, el error se define como
o
Sin embargo, para facilitar el manejo y el análisis se emplea el error absoluto defini-
do como
EA = IP* -p I
y el error relativo como
Ip* -p I
ER = ,sip =1= O
p
y como por ciento de error a
ERP = ER X 100
En otros libros las definiciones pueden ser diferentes; por ejemplo, algunos autores
definen el error E como p - p*; por tanto, sugerimos que al consultar las distintas biblio-
grafías se busquen las definiciones de error dadas.
Suponga que el valor para un cálculo debería ser
p = 0.10 X 102 pero se obtuvo el resultado p* = 0.08 X 102
, entonces
Errores 11
ERROR DE REDONDEO
Para finalizar esta sección, se analizarán brevemente algunas consecuencias de utilizar el
sistema binario y una longitud de palabra finita.
Como no es posible guardar un número binario de longitud infinita o un número de
más dígitos de los que posee la mantisa de la computadora que se está empleando, se al-
macena sólo un número finito de estos dígitos; como consecuencia, se comete automática-
mente un pequeño error, conocido como error de redondeo, que al repetirse muchas veces
puede llegar a ser considerable. Por ejemplo, si se desea guardar la fracción decimal
0.0001 que en binario es la fracción infinita
0.000000000000011010001101101110001011101011000.. .
quedaría, después de normalizarse, almacenado en una palabra de 16 bits como
.11010001 X 2-1101
Si se desea sumar el número 0.0001 con él mismo diez mil veces, usando una computado-
ra, naturalmente que no se esperará obtener 1 como resultado, ya que los números que se
adicionen no serían realmente 0.0001 sino valores aproximados a él (véase Probo 1.16).
t.3 Errores
ERROR ABSOLUTO, ERROR RELATIVO Y ERROR EN POR CIENTO
Si p* es una aproximación a p, el error se define como
IbE = p* - p ]
Sin embargo, para facilitar el manejo y el análisis se emplea el error absoluto defini-
do como
1,EA = I p* - P I ~
y el error relativo como
I p* -p I
ER = , sip::j:. O
P
y como por ciento de error a
IEERP = ERX 100 ~
En otros libros las definiciones pueden ser diferentes; por ejemplo, algunos autores
definen el error E como p - p*; por tanto, sugerimos que al consultar las distintas biblio-
grafías se busquen las definiciones de error dadas.
Suponga que el valor para un cálculo debería ser
p = 0.10 X 102 pero se obtuvo el resultado p* = 0.08 X 102, entonces
12 Métodos numéric os aplicados a la ingeniería
EA = 10.08 X 102 - 0.10 X 102 1= 0.2 X 101
10.08 X 102 - 0.10 X 1021
ER = ------=--::---,--:c;;------
0.10 X 102
ERP = ER X 100 = 20%
= 0.2 X 10°
Por lo general, interesa el error absoluto y no el error relativo; pero cuando el valor
exacto de una cantidad es "muy pequeño" o "muy grande", los errores relativos son más
significativos.
Por ejemplo si
p = 0.24 X 10-4 Y p* = 0.12 X 10-4,
entonces:
EA = 10.12 X 10-4 - 0.24 X 10-41 = 0.12 X 10-4
Sin reparar en las cantidades que se comparan, puede pensarse que el error absoluto
es muy pequeño y, lo más grave, aceptar p* como una buena aproximación a p.
Si, por otro lado, se calcula el error relativo
10.12 X 10-4 - 0.24 X 10-41 °ER = = 0.5 X 10
0.24 X 10-4
se observa que la "aproximación" es tan sólo la mitad del valor verdadero y, por tanto, es-
tá muy lejos de ser aceptable como aproximación a p. Finalmente
ERP= 50%
De igual manera puede observarse que si
p = 0.46826564 X 106 y p* = 0.46830000 X 106,
entonces:
EA = 0.3436 X 102
,
y si de nueva cuenta no se toman en consideración las cantidades en cuestión, puede
creerse que el EA es muy grande y que se tiene una mala aproximación a p. Sin embar-
go, al calcular el error relativo
ER = 0.7337715404 X 10-4,
se advierte que el error es muy pequeño, como en realidad ocurre.
ADVERTENCL4.: Cuando se manejan cantidades "muy grandes" o "muy pequeñas", el error absoluto
puede ser engañoso, mientras que el error relativo es más significativo en esos casos.
Ip* -p 1
< 5 X 10-1
P
DEFINICiÓN
Se dice que el número p* aproxima a p con t dígitos significativos si t es el entero más
grande no negativo para el cual se cumple
12 Métodos numéricos aplicados a la ing eniería
EA =10.08 X 102 - 0.10 X 102 1=0.2 X 101
10.08 X 102 - 0.10 X 102 1
ER =- - --- -..,-,....,,-----::-;:------
0.10 X 102
ERP = ER X 100 = 20%
=0.2 X 10°
Por lo general, interesa el error absoluto y no el error relativo; pero cuando el valor
exacto de una cantidad es "muy pequeño" o "muy grande", los errores relativos son más
significativos.
Por ejemplo si
p =0.24 X 10-4 Y p* =0.12 X 10-4,
entonces:
EA = 10.12 X 10-4 - 0.24 X 10-41 =0.12 X 10-4
Sin reparar en las cantidades que se comparan, puede pensarse que el error absoluto
es muy pequeño y, lo más grave, aceptar p* como una buena aproximación a p.
Si, por otro lado, se calcula el error relativo
10.12 X 10-4 - 0.24 X 10-4 1 °ER = = 0.5 X 10
0.24 X 10-4
se observa que la "aproximación" es tan sólo la mitad del valor verdadero y, por tanto, es-
tá muy lejos de ser aceptable como aproximación a p. Finalmente
ERP= 50%
De igual manera puede observarse que si
p = 0.46826564 X 106 y p* =0.46830000 X 106,
entonces:
EA = 0.3436 X 102,
y si de nueva cuenta no se toman en consideración las cantidades en cuestión, puede
creerse que el EA es muy grande y que se tiene una mala aproximación a p. Sin embar-
go, al calcular el error relativo
ER = 0.7337715404 X 10-4,
se advierte que el error es muy pequeño, como en realidad ocurre.
ADVERTENCL<.: Cuando se manejan cantidades "muy grandes" o "muy pequeñas", el error absoluto
puede ser engañoso, mientras que el error relativo es más significativo en esos casos.
DEFINICiÓN
Se dice que el número p* aproxima a p con t dígitos significativos si t es el entero más
grande no negativo para el cual se cumple
Ip* -p 1
< 5 X 10-1
P
or
ás
to
e
Errores 13
Supóngase, por ejemplo, el número 10. Para que p* aproxime a 10 con dos cifras sig-
nificativas, usando la definición, p* debe cumplir con
Ip* - 10 I < 5 X 10-2
10
p* -10
-5 X 10-2 < < 5 X 10-2
10
10 - 5 X 10-1 < p* < 5 X 10-1 + 10
9.5 < p* < 10.5
esto es, cualquier valor de p* en el intervalo (9.5, 10.5) cumple la condición.
En general para t dígitos significativos
IP* -p I
p
<5XlO-1
sip > O
Ip* - p I < 5 p X 10-1
P - 5 p X 10-1 < p* < p + 5 p X 10-1
Si, por ejemplo, p = 1000 Y t = 4
1000 - 5 X 1000 X 10-4 < p* < 1000 + 5 X 1000 X 10-4
999.5 < p* < 1000.5
CAUSAS DE ERRORES GRAVES EN COMPUTACiÓN
Existen muchas causas de errores en la ejecución de un programa de cómputo, de las cua-
les se discutirán ahora algunas de las más serias. Para esto, vamos a pensar en una compu-
tadora imaginaria que. trabaja con números en el sistema decimal, en forma tal que tiene una
mantisa de cuatro dígitos decimales, y una característica de dos dígitos decimales, el prime-
ro de los cuales es usado para el signo. Sumados estos seis al bit empleado para el signo del
número, se tendrá una palabra de siete bits. Los números que se van a guardar deben nor-
malizarse primero en la siguiente forma
3.0 = .3000 X 101
7956000 = .7956 X 107
-0.0000025211 = -.2521 X 10-5
Empleando esta computadora imaginaria, podemos estudiar algunos de los errores
más serios que se cometen en su empleo.
a) Suma de números muy distintos en magnitud
-.
Vamos a suponer que se trata de sumar 0.002 a 600 en la computadora decimal imaginaria.
0.002 = .2000 X 10-2
600 = .6000 X 103
Estos números normalizados no pueden sumarse directamente y, por tanto, la compu-
tadora debe desnormalizarlos antes de efectuar la suma.
Errores 13
Supóngase, por ejemplo, el número 10. Para que p* aproxime a 10 con dos cifras sig-
nificativas, usando la definición, p* deue cumplir con
Ip* - 10 I < 5 X 10-2
10
- 5 X 10-2 < p* - 10 < 5 X 10-2
10
10 - 5 X 10-1 < p* < 5 X 10-1 + 10
9.5 < p* < 10.5
esto es, cualquier valor de p* en el intervalo (9.5, 10.5) cumple la condición.
En general para t dígitos significativos
IP* -p I
p
<5 X lO-1
sip > O
I p* - p I < 5 p X 10-1
P - 5 p X 10-1
< p* < p + 5 p X 10-1
Si, por ejemplo, p = 1000 Yt =4
1000 - 5 X 1000 X 10-4 < p* < 1000 + 5 X 1000 X 10-4
999.5 < p* < 1000.5
CAUSAS DE ERRORES GRAVES EN COMPUTACiÓN
Existen muchas causas de errores en la ejecución de un programa de cómputo, de las cua-
les se discutirán ahora algunas de las más serias. Para esto, vamos a pensar en una compu-
tadora imaginaria que.trabaja con números en el sistema decimal, en forma tal que tiene una
mantisa de cuatro dígitos decimales, y una característica de dos dígitos decimales, el prime-
ro de los cuales es usado para el signo. Sumados estos seis al bit empleado para el signo del
número, se tendrá una palabra de siete bits. Los números que se van a guardar deben nor-
malizarse primero en la siguiente forma
3.0 = .3000 X 101
7956000 = .7956 X 107
-0.0000025211 = - .2521 X 10-5
Empleando esta computadora imaginaria, podemos estudiar algunos de los errores
más serios que se cometen en su empleo.
a) Suma de números muy distintos en magnitud
Vamos a suponer que se trata de sumar 0.002 a 600 en la computadora decimal imaginaria.
0.002 = .2000 X 10-2
600 =.6000 X 103
Estos números normalizados no pueden sumarse directamente y, por tanto, la compu-
tadora debe desnormalizarlos antes de efectuar la suma.
14 Métodos numéricos aplicados a la ingeniería
.000002 X 103
+ .600000 X 103
.600002 X 103
Como sólo puede manejar cuatro dígitos, los últimos dos son eliminados y la respues-
ta es .6000 X 103 o 600. Por el resultado, la suma nunca se realizó.
Este tipo de errores, cuyo origen es el redondeo, es muy común y se recomienda, de ser
posible, no sumar o restar dos números muy diferentes (véase ejercicio 1.2).
b) Resta de números casi iguales
Supóngase que la computadora decimal va a restar 0.2144 de 0.2145 .
.2145 X 10°
- .2144 X 10°
.0001 X 10°
Como la mantisa de la respuesta está desnormalizada, la computadora automática-
mente la normaliza y el resultado se almacena como .1000 X 10-3.
Hasta aquí no hay error, pero en la respuesta sólo hay un dígito significativo; por tan-
to, se sugiere no confiar en su exactitud, ya que un pequeño error en alguno de los núme-
ros originales produciría un error relativo muy grande en la respuesta de un problema que
involucrara este error, como se ve a continuación.
Supóngase que la siguiente expresión aritmética es parte de un programa
x = (A -B) * e
Considérese ahora que los valores de A, B Y e son
A = 0.2145 X 10°, B = 0.2144 X 10°, e = 0.1000 X 105
Al efectuarse la operación se obtiene el valor de X = 1, que es correcto. Sin embar-
go, supóngase que A fue calculada en el programa con un valor de 0.2146 X 10° (error
absoluto 0.0001, error relativo 0.00046 y ERP = 0.046%). Usando este valor de A en el
cálculo de X, se obtiene como respuesta X = 2. Un error de 0.046% de pronto provoca un
error de 100%. Aun más, este error puede pasar desapercibido.
e) Overflow y Underflow
Con frecuencia una operación aritmética con dos números válidos da como resultado un
número tan grande o tan pequeño que la computadora no puede manejarlo; como conse-
cuencia se produce un overflow o un underflow, respectivamente.
Por ejemplo, al multiplicar 0.5000 X 108 por 0.2000 X 109 se tiene
0.5000 X 108
X 0.2000 X 109
0.1000 X 1017
Cada uno de los números que se multiplican puede guardarse en la palabra de la compu-
tadora imaginaria; sin embargo, su producto es muy grande y no puede almacenarse
porque la característica requiere tres dígitos. Entonces se dice que ha llevado a cabo un
overflow.
Otro caso de overflow puede ocurrir en la división; por ejemplo
2000000
0.000005
0.2000 X 10
7
= 0.4000 X 1012
0.5000 X 10-5
14 Métodos numéricos aplicados a la ingeniería
.000002 X 103
+ .600000 X 103
.600002 X 103
Como sólo puede manejar cuatro dígitos, los últimos dos son eliminados y la respues-
ta es .6000 X 103 o 600. Por el resultado, la suma nunca se realizó.
Este tipo de errores, cuyo origen es el redondeo, es muy común y se recomienda, de ser
posible, no sumar o restar dos números muy diferentes (véase ejercicio 1.2).
b) Resta de números casi iguales
Supóngase que la computadora decimal va a restar 0.2144 de 0.2145.
.2145 X 10°
- .2144 X 10°
.0001 X 10°
Como la mantisa de la respuesta está desnormalizada, la computadora automática-
mente la normaliza y el resultado se almacena como .1000 X 10-3.
Hasta aquí no hay error, pero en la respuesta sólo hay un dígito significativo; por tan-
to, se sugiere no confiar en su exactitud, ya que un pequeño error en alguno de los núme-
ros originales produciría un error relativo muy grande en la respuesta de un problema que
involucrara este error, como se ve a continuación.
Supóngase que la siguiente expresión aritmética es parte de un programa
x =(A -B) * e
Considérese ahora que los valores de A, B Ye son
A = 0.2145 X 10°, B =0.2144 X 10°, e = 0.1000 X 105
Al efectuarse la operación se obtiene el valor de X = 1, que es correcto. Sin embar-
go, supóngase que A fue calculada en el programa con un valor de 0.2146 X 10° (error
absoluto 0.0001, error relativo 0.00046 y ERP =0.046%). Usando este valor de A en el
cálculo de X, se obtiene como respuesta X = 2. Un error de 0.046% de pronto provoca un
error de 100%. Aun más, este error puede pasar desapercibido.
e) Overflow y Underflow
Con frecuencia una operación aritmética con dos números válidos da como resultado un
número tan grande o tan pequeño que la computadora no puede manejarlo; como conse-
cuencia se produce un overflow o un underflow, respectivamente.
Por ejemplo, al multiplicar 0.5000 X 108 por 0.2000 X 109 se tiene
0.5000 X 108
X 0.2000 X 109
0.1000 X 1017
Cada uno de los números que se multiplican puede guardarse en la palabra de la compu-
tadora imaginaria; sin embargo, su producto es muy grande y no puede almacenarse
porque la característica requiere tres dígitos. Entonces se dice que ha llevado a cabo un
overflow.
Otro caso de overflow puede ocurrir en la división; por ejemplo
2000000
0.000005
0.2000 X 10
7
=0.4000 X 1012
0.5000 X 10-5
s-
e
Errores 15
Las computadoras por lo general reportan esta circunstancia con un mensaje que va-
ría dependiendo de cada máquina.
El underflow puede aparecer en la multiplicación o división, y por lo general no es tan
serio como el overflow; las computadoras casi nunca envían mensaje de underflow. Por
ejemplo:
( 0.3000 X 10-5 ) X ( 0.02000 X 10-3) = 0.006 X 10-8 = 0.6000 X 10-10
Como el exponente -10 está excedido en un dígito, no puede guardarse en la compu-
tadora y este resultado se expresa como valor cero. Este error expresado como error rela-
tivo es muy pequeño y a menudo no es serio. No obstante, puede ocurrir, por ejemplo:
A = 0.3000 X 10-5, B = 0.0200 X 10-3, C = 0.4000 X 107,
y que se desee en algún punto del programa calcular el producto de A, B Y C
X=A*B*C
Se multiplican primero A y B. El resultado parcial es cero. La multiplicación de este
resultado por C da también cero. Si, en cambio, se arregla la expresión como
X=A* C*B
se multiplica A por C y se obtiene 0.1200 X 102. La multiplicación siguiente da la respues-
ta correcta: 0.2400 X 10-3. De igual manera, un arreglo en una divisón puede evitar un-
derflow.
d) División entre un número muy pequeño
Como se dijo, la división entre un número muy pequeño puede causar overflow.
Supóngase que se realiza en la computadora una división válida y que no se comete
error alguno en la operación; pero considérese que ocurrió un pequeño error de redondeo
previamente en el programa, cuando se calculó el denominador. Si el numerador es grande
y el denominador pequeño, puede presentarse un error absoluto considerable en el cocien-
te. Si éste se resta después, de otro número del mismo tamaño relativo, puede presentarse
un error mayor en la respuesta final.
Como ejemplo considérese la siguiente instrucción en un programa
X=A -B/C
donde:
A = 0.1120 X 109 = 112000000
B = 0.1000 X 106 = 100000
C = 0.900 X 10-3 = 0.0009
/
I
Si el cálculo se realiza en la computadora decimal de cuatro dígitos, el cociente B / C
es 0.1111 X 109, Y X es 0.0009 X 109 o, después de ser normalizado, X = 0.9000 X 106.
Nótese que sólo hay un dígito significativo.
Vamos a imaginar ahora que se cometió un pequeño error de redondeo al calcular C
en algún paso previo y resultó un valor C* = 0.9001 X 10-3 (EA = 0.0001 X 10-3; ER =
10-4 YERP = 0.01 %).
Si se calcula B / C* se obtiene como cociente 0.111 O X 109 YX* = 0.1000 X 107. El
valor correcto de X es 0.9000 X 106.
./
I
Errores 15
Las computadoras por lo general reportan esta circunstancia con un mensaje que va-
ría dependiendo de cada máquina.
El underflow puede aparecer en la multiplicación o división, y por lo general no es tan
serio como el overflow; las computadoras casi nunca envían mensaje de underflow. Por
ejemplo:
( 0.3000 X 10-5 ) X ( 0.02000 X 10-3 ) =0.006 X 10-8 =0.6000 X 10-10
Como el exponente -10 está excedido en un dígito, no puede guardarse en la compu-
tadora y este resultado se expresa como valor cero. Este error expresado como error rela-
tivo es muy pequeño y a menudo no es serio. No obstante, puede ocurrir, por ejemplo:
A = 0.3000 X 10-5, B =0.0200 X 10-3, C = 0.4000 X 107,
y que se desee en algún punto del programa calcular el producto de A, B YC
X=A*B*C
Se multiplican primero A y B. El resultado parcial es cero. La multiplicación de este
resultado por C da también cero. Si, en cambio, se arregla la expresión como
X=A * C*B
se multiplica A por C y se obtiene 0.1200 X 102. La multiplicación siguiente da la respues-
ta correcta: 0.2400 X 10-3. De igual manera, un arreglo en una divisón puede evitar un-
derflow.
d) División entre un número muy pequeño
Como se dijo, la división entre un número muy pequeño puede causar overflow.
Supóngase que se realiza en la computadora una división válida y que no se comete
error alguno en la operación; pero considérese que ocurrió un pequeño error de redondeo
previamente en el programa, cuando se calculó el denominador. Si el numerador es grande
y el denominador pequeño, puede presentarse un error absoluto considerable en el cocien-
te. Si éste se resta después, de otro número del mismo tamaño relativo, puede presentarse
un error mayor en la respuesta final.
Como ejemplo considérese la siguiente instrucción en un programa
donde:
X = A -B/C
A =0.1120 X 109 =112000000
B =0.1000 X 106 = 100000
C =0.900 X 10-3 =0.0009
Si el cálculo se realiza en la computadora decimal de cuatro dígitos, el cociente B / C
es 0.1111 X 109, YX es 0.0009 X 109 o, después de ser normalizado, X =0.9000 X 106.
Nótese que sólo hay un dígito significativo.
Vamos a imaginar ahora que se cometió un pequeño error de redondeo al calcular C
en algún paso previo y resultó un valor C* = 0.9001 X 10-3 (EA = 0.0001 X 10-3; ER =
10-4 YERP = 0.01 %).
Si se calcula B / C* se obtiene como cociente 0.111O X 109 YX* =0.1000 X 107
. El
valor correcto de X es 0.9000 X 106.
16 Métodos numéricos aplicados a la ingeniería
Entonces:
EA = I 1000000 - 900000 I = 100000
ER = 11000000 - 900000 I = 0.11
900000
ERP = 0.11 X 100 = 11%
El error relativo se ha multiplicado cerca de 1100 veces. Como ya se dijo, estos cálcu-
los pueden conducir a un resultado final carente de significado o sin relación con la res-
puesta verdadera.
e) Error de discretización
Dado que un número específico no se puede almacenar exactamente como número bina-
rio de punto flotante, el error generado se conoce como error de discretización (error de
cuantificación), ya que los números expresados exactamente por la máquina (números má-
quina) no forman un conjunto continuo sino discreto.
Ejemplo 1.12 Cuando se suma 10000 veces 0.0001 con él mismo, debe resultar 1; sin embargo, el nú-
mero 0.0001 en binario resulta en una sucesión infinita de ceros y unos, que se trunca al
ser almacenada en una palabra de memoria, con lo que se perderá información y el re-
sultado de la suma ya no será 1. Se obtuvieron los siguientes resultados que corroboran
10 anterior, utilizando una PC, precisión sencilla y Visual Basic.
Solución
10000
a) L 0.0001 = 1.000054
i= 1
10000
b) 1 + L 0.0001 = 2.000166
i= 1
10000
e) 1000 + L 0.0001 = 1001.221
i= 1
10000
d) 10000 + L 0.0001 = 10000
i= 1
Nótese que en los tres últimos incisos, además del error de discretización, se generó
el error de sumar un número muy grande con un número muy pequeño (véase Probo 1.16
y 1.17). El programa se ejecutó iniciando primero a una variable con el valor entero O, 1,
1000 Y 10000; después se fue acumulando a esa variable 0.0001 diez mil veces.
f) Errores de salida
Aun cuando no se haya cometido error alguno durante la fase de cálculos de un programa,
puede presentarse un error al imprimir resultados.
Por ejemplo, supóngase que la respuesta de un cálculo particular es exactamente
0.015625. Cuando este número se imprime con un formato tal como FlO.6 o E14.6 (de FOR-
TRAN), se obtiene la respuesta correcta. Si, por el contrario, se decide usar F8.3, se impri-
16 Métodos numéricos aplicados a la ingeniería
Entonces:
EA = I 1000000 - 900000 I = 100000
ER = I 1000000 - 900000 I = 0.11
900000
ERP =0.11 X 100 = 11%
El error relativo se ha multiplicado cerca de 1100 veces. Como ya se dijo, estos cálcu-
los pueden conducir a un resultado final carente de significado o sin relación con la res-
puesta verdadera.
e) Error de discretización
Dado que un número específico no se puede almacenar exactamente como número bina-
rio de punto flotante, el error generado se conoce como error de discretización (error de
cuantificación), ya que los números expresados exactamente por la máquina (números má-
quina) no forman un conjunto continuo sino discreto.
Ejemplo 1.12 Cuando se suma 10000 veces 0.0001 con él mismo, debe resultar 1; sin embargo, el nú-
mero 0.0001 en binario resulta en una sucesión infinita de ceros y unos, que se trunca al
ser almacenada en una palabra de memoria, con lo que se perderá información y el re-
sultado de la suma ya no será 1. Se obtuvieron los siguientes resultados que COIToboran
lo anterior, utilizando una PC, precisión sencilla y Visual Basic.
Solución
10000
a) L 0.0001 = 1.000054
i= I
10000
b) 1 + L 0.0001 = 2.000166
i= I
10000
e) 1000 + L 0.0001 = 1001.221
i= I
10000
d) 10000 + L 0.0001 = 10000
i= I
Nótese que en los tres últimos incisos, además del error de discretización, se generó
el error de sumar un número muy grande con un número muy pequeño (véase Probol.16
y 1.l7). El programa se ejecutó iniciando primero a una variable con el valor entero 0,1,
1000 Y 10000; después se fue acumulando a esa variable 0.0001 diez mil veces.
f) Errores de salida
Aun cuando no se haya cometido error alguno durante la fase de cálculos de un programa,
puede presentarse un error al imprimir resultados.
Por ejemplo, supóngase que la respuesta de un cálculo particular es exactamente
0.015625. Cuando este número se imprime con un formato tal como FlO.6 o E14.6 (de FOR-
TRAN), se obtiene la respuesta correcta. Si, por el contrario, se decide usar F8.3, se impri-
u-
s-
Error-es 17
mirá el número 0.016 (si la computadora redondea), o bien 0.015 (si la computadora trunca),
con lo cual se presenta un elTOr.
PROPAGACiÓN DE ERRORES
Una vez que se sabe cómo se producen los errores en un programa de cómputo, podría
pensarse en tratar de determinar el error cometido en cada paso, y conocer de esa manera
el error total en la respuesta final. Sin embargo, esto no es práctico. Resulta más adecua-
do analizar las operaciones individuales realizadas por la computadora para ver cómo se
propagan los errores de dichas operaciones.
a) Suma
Se espera que al sumar a y b, se obtenga el valor correcto de e = a + b; no obstante, se tie-
ne en general un valor de e incorrecto debido a la longitud finita de palabra que se emplea.
Puede considerarse que este error fue causado por una operación incorrecta de la compu-
tadora -+- (el punto indica que es suma con error). Entonces el error es:
Error = (a -+-b) - (a + b)
La magnitud de este error depende de las magnitudes relativas, de los signos de a y b,
Y de la forma binaria en que a y b son almacenados en la computadora. Esto último varía
dependiendo de la computadora, y por tanto es un error muy difícil de analizar y no lo es-
tudiaremos aquí.
Si por otro lado a y b de entrada son inexactos, hay un segundo error posible. Por
ejemplo, considérese que en lugar del valor verdadero de a, la computadora tiene el valor
a", el cual presenta un error Ea
a* = a + Ea
y de igual forma para b
Como consecuencia se tendría, aun si no se cometiera error en la adición, un error en
el resultado:
Error = (a* + b*) - (a + b)
= (a + Ea + b + Eb) - (a + b) = Ea + Eb = Ec
o sea c* = e + Ec
El error absoluto es:
I ( a* + b* ) - ( a + b ) I = I Ea + Eb I ::; I Ea I + I Eb I
o bien
Se dice que los errores Ea y Eb se han extendido a e, y Ec se conoce como el error
de propagación.
Dicho error es causado por valores inexactos de los valores iniciales y se propaga en
los cómputos siguientes, con lo cual causa un error en el resultado final.
Errores 17
mirá el número 0.016 (si la computadora redondea), o bien 0.015 (si la computadora tmnca),
con lo cual se presenta un elTOr.
PROPAGACiÓN DE ERRORES
Una vez que se sabe cómo se producen los errores en un programa de cómputo, podría
pensarse en tratar de determinar el error cometido en cada paso, y conocer de esa manera
el error total en la respuesta final. Sin embargo, esto no es práctico. Resulta más adecua-
do analizar las operaciones individuales realizadas por la computadora para ver cómo se
propagan los errores de dichas operaciones.
a) Suma
Se espera que al sumar a y b, se obtenga el valor correcto de e = a + b; no obstante, se tie-
ne en general un valor de e incorrecto debido a la longitud finita de palabra que se emplea.
Puede considerarse que este error fue causado por una operación incorrecta de la compu-
tadora .¡. (el punto indica que es suma con error). Entonces el error es:
Error = Ca .¡. b) - Ca + b)
La magnitud de este error depende de las magnitudes relativas, de los signos de a y b,
Yde la forma binaria en que a y b son almacenados en la computadora. Esto último varía
dependiendo de la computadora, y por tanto es un error muy difícil de analizar y no lo es-
tudiaremos aquí.
Si por otro lado a y b de entrada son inexactos, hay un segundo error posible. Por
ejemplo, considérese que en lugar del valor verdadero de a, la computadora tiene el valor
a*, el cual presenta un error E a
a* = a + Ea
y de igual forma para b
Como consecuencia se tendría, aun si no se cometiera error en la adición, un error en
el resultado:
Error = (a* + b*) - (a + b)
= (a + E a + b + E b ) - (a + b) =Ea + Eb =E c
o sea c* = e + E c
El error absoluto es:
I ( a* + b* ) - Ca + b ) I = I E a + Eb I ~ I Ea I + I E bI
o bien
Se dice que los errores E a y Eb se han extendido a e, y E c se conoce como el error
de propagación.
Dicho error es causado por valores inexactos de los valores iniciales y se propaga en
los cómputos siguientes, con lo cual causa un error en el resultado final.
18 Métodos numéricos aplicados a la ingeniería
b) Resta
El error de propagación ocasionado por valores inexactos iniciales a* y b", puede darse de
manera similar que en la adición, con un simple cambio de signo (véase Probo 1.24).
e) Multiplicación
Si se multiplican los números a* y b", se obtiene (ignorando el error causado por la ope-
ración misma):
( a* X b*) = ( a + Ea) X (b + Eb )
= ( a X b ) + ( a X Eb) + ( b X Ea) + ( Ea X Eb)
Si Ea y Eb son suficientemente pequeños, puede considerarse que su producto es muy
pequeño en comparación con los otros términos y, por tanto, eliminar el último término.
Se obtiene entonces el error del resultado final
( a* X b* ) - ( a X b ) '" ( a X Eb) + ( b X Ea )
Esto hace posible encontrar el valor absoluto del error relativo del resultado dividien-
do ambos lados entre a X b.
1_( a_~_'X_b'_i' )_-_(_a_X_b_) 1 '" 1 _Eb + _Ea 1 ~ 1 _E/) 1 + 1 _Ea 1
(aXb) b a b a
El error de propagación relativo en valor absoluto en la multiplicación es aproxima-
damente igualo menor a la suma de los errores relativos de a y b en valor absoluto.
d) División
Puede considerarse la división de a* y b* como sigue:
a* / b" = ( a + Ea ) / ( b + Eb)
1
= (a + Ea)
(b + Eb)
Multiplicando numerador y denominador por b - Eb
a* / b* = (a + Ea) (b - Eb )
( b + Eb) (b - Eb )
ab - aE/) + Eab - EaEb
b2
- EE
Si, como en la multiplicación, se considera el producto Ea Eb muy pequeño y, por las
mismas razones, a EE y se desprecian, se tiene.
a" / b* '" !!!!.... + Eab _ aEb
b2
b2
b2
Fi
Gráfi
fu
deri:
b
1.4a
"'- +
El error es entonces:
a E
a*lb* __ '" _a _
b b
18 Métodos numéri cos aplicados a la ingeniería
b) Resta
El error de propagación ocasionado por valores inexactos iniciales a':' y b*, puede darse de
manera similar que en la adición, con un simple cambio de signo (véase Probo1.24).
c) Multiplicación
Si se multiplican los números a* y b':', se obtiene (ignorando el error causado por la ope-
ración misma):
( a* X b*) = ( a + Ea) X (b + Eb )
= ( a X b ) + ( a X E b ) + ( b X E a) + ( E a X E b )
Si E ay Eb son suficientemente pequeños, puede considerarse que su producto es muy
pequeño en comparación con los otros términos y, por tanto, eliminar el último término.
Se obtiene entonces el error del resultado final
ea* X b* ) - ( a X b ) '" ( a X E b ) + ( b X Ea )
Esto hace posible encontrar el valor absoluto del error relativo del resultado dividien-
do ambos lados entre a X b.
1_(a_*_X_b':_')_-_(_a_X_b_) 1 '" 1 _Eb + _E a 1 ~ 1 _E/) 1 + 1 _Ea 1
(aXb) b a b a
El error de propagaciúi1 relativo en valor absoluto en la multiplicación es aproxima-
damente igualo menor a la suma de los errores relativos de a y b en valor absoluto.
d) División
Puede considerarse la división de a* y b* como sigue:
a* / b* =(a + E a ) / ( b + E b )
1
= (a + Ea)
(b + E b )
Multiplicando numerador y denominador por b - E b
( a + E ) eb-E )
a* / b* = a b
eb + E b ) (b - E /) )
ab - aE/) + Eab - E aEb
b2
- EE
Si, como en la multiplicación, se considera el producto Ea Eb muy pequeño y, por las
mismas razones, a EE y se desprecian, se tiene.
El error es entonces:
a* / b* '" ~ + E a
b
_ aE b
b2 b2 b2
a
"' - +
b
a Ea*Ib* _ _ ",_a
b b
e
Errores 19
Dividiendo entre aIb se obtiene el error relativo. Al tomar el valor absoluto del error
relativo, se tiene
Se concluye que el error de propagación relativo del cociente en valor absoluto es apro-
ximadamente igualo menor a la suma de los errores relativos en valor absoluto de a y b.
e) Evaluación de funciones
Por último, se estudiará la propagación del error (asumiendo operaciones básicas +, -, X
Y/ ideales o sin errores), cuando se evalúa una función f (x) en un punto x = a. En gene-
ral, se dispone de un valor de a aproximado: a*; la intención es determinar el error resul-
tante
E¡=f(a*)-f(a)
La figura 1.3 muestra la gráfica de la funciónf ( x ) en las cercanías de x = a. A con-
tinuación se determina la relación entre Ea y E¡-
Si Ea es pequeño, puede aproximarse la curvaf( x) por su tangente en un entorno de
x = a. Se sabe que la pendiente de esta tangente es f' (a) o aproximadamente E¡ / Ea;
esto es:
y
En valor absoluto
I E¡I ""lEal' (a*) 1""lEa I 11' (a*) I
El error al evaluar una función en un argumento inexacto es proporcional a la prime-
ra derivada de la función en el punto donde se ha evaluado.
y
f'(a)
f(x)
f(a*) I---....---------~;;;........------~
f(a) I----'-------~
E = a*-aII
Figura 1.6
Gráfica de una
función y su
primera
derivada en a. a a* x
t .4 Algoritmos y estabilidad
El tema fundamental de este libro es el estudio, selección y aplicación de algoritmos, que se
definen como secuencias de operaciones algebraicas y lógicas para obtener la solución de
un problema. Por lo general, se dispone de varios algoritmos para resolver un problema par-
Figura 1.6
Gráfica de una
función y su
primera
derivada en a.
Errores 19
Dividiendo entre aIb se obtiene el error relativo. Al tomar el valor absoluto del error
relativo, se tiene
Se concluye que el error de propagación relativo del cociente en valor absoluto es apro-
ximadamente igualo menor a la suma de los errores relativos en valor absoluto de a y b.
e) Evaluación de funciones
Por último, se estudiará la propagación del error (asumiendo operaciones básicas +, -, X
Y/ ideales o sin errores), cuando se evalúa una función f (x) en un punto x = a. En gene-
ral, se dispone de un valor de a aproximado: a*; la intención es determinar el error resul-
tante
E f = f(a*)-f(a)
La figura 1.3 muestra la gráfica de la funciónf ( x ) en las cercanías de x =a. A con-
tinuación se determina la relación entre E a y E¡-
Si Ea es pequeño, puede aproximarse la curvaf( x) por su tangente en un entorno de
x = a. Se sabe que la pendiente de esta tangente es!, (a) o aproximadamente E f / Ea;
esto es:
y
En valor absoluto
I Ef l "" l Eal' (a*) 1"" l Ea I 11' (a*) I
El error al evaluar una función en un argumento inexacto es proporcional a la prime-
ra derivada de la función en el punto donde se ha evaluado.
y
f'(a)
Ef =f(a*) - f(a)
f(a*) I----.---------~;;......-------
f(a)
a a*
E = a* -aII
f(x)
x
t.4 Algoritmos y estabilidad
El tema fundamental de este libro es el estudio, selección y aplicación de algoritmos, que se
definen como secuencias de operaciones algebraicas y lógicas para obtener la solución de
un problema. Por lo general, se dispone de varios algoritmos para resolver un problema par-
20 Métodos numéricos aplicados a la ingeniería
ticular; uno de los criterios de selección es la estabilidad del algoritmo; esto es, que a peque-
ños errores de los valores manejados se obtengan pequeños errores en los resultados finales.
Supóngase que un error E se introduce en algún paso en los calculos.y que el error
de propagación de n operaciones subsiguientes se denota por EIl' En la práctica, por lo ge-
neral se presentan dos casos.
a) En I '" n e E, donde e es una constante independiente de 11; se dice entonces
que la propagación del error es lineal.
b) I EIl I '" k" E, para k » 1; se dice entonces que la propagación del error es ex-
ponencial.
La propagación lineal de los errores suele ser inevitable; cuando e y E son peque-
ños, los resultados finales normalmente son aceptables. Por otro lado, la propagación expo-
nencial debe evitarse, ya que el término k" crece con rapidez para valores relativamente
pequeños de n. Esto conduce a resultados finales muy poco exactos, sea cual sea el tamaño
de E. Como consecuencia, se dice que un algoritmo con crecimiento lineal del error es esta-
ble, mientras que un algoritmo con una propagación exponencial es inestable (véase Fig. 1.4).
En
(
Propagación exponencial
En= k'IE
0
Figura 1.7 0
Propagación lineal
Propagación
0 E,/= nce
[
lineal y G G
0 G G
propagación
f,'!J [!]
[!] G
exponencial de E
errores. 2 3 4 5 6 7 8 9 10
n
Ejercicios
1.1 Error de redondeo al restar dos números casi iguales.
Vamos a considerar las ecuaciones
31.69x + 14.31 Y = 45.00 (1)
13.05x + 5.89 Y = 18.53 (2)
La única solución de este sistema de ecuaciones es (redondeando a cinco cifras deci-
males) x = 1.25055, Y = 0.37527. Un método para resolver este tipo de problemas es mul-
tiplicar la ecuación (1) por el coeficiente de x de la ecuación (2), multiplicar la ecuación
peque-
finales.
el error
r lo ge-
Errores 21
(2) por el coeficiente de x de la ecuación (1) y después restar las ecuaciones resultantes.
Para este sistema se obtendría (como los coeficientes tienen dos cifras decimales, todas las
operaciones intermedias se efectúan redondeando a dos cifras decimales):
ntonces
[13.05 (14.31) - 31.69 (5.89)] Y
(186.75 - 186.65) Y
0.10 Y
13.05 (45.00) - 31.69 (18.53)
587.25 - 587.22
0.03
res ex-
de donde y = 0.3, luego
peque-
n expo-
amente
tamaño
es esta-
ig. 1.4).
x = _(_18_.5_3_)_-_5._89--,-(0_.3_)= 18.53 - 1.77 = 16.76 = l.28
13.05 13.05 13.05
Para la variable x
EA = 1 1.28 - l.25 l = 0.03; ER = 0.03/.1.25 = 0.024; ERP = 2.4%
Para la variable y
EA = l 0.3 - 0.38 l = 0.08; ER = 0.08/0.38 = 0.21; ERP = 21%
1.2 Error de redondeo al sumar un número grande y uno pequeño.
Considere la sumatoria infinita
s=f J..=~+~+~+~+~+ ... +_1_+ ...
11 = 1 n2 1 4 9 16 25 100
resulta (usando precisión sencilla y 5000 como valor final de n) 1.644725 si se suma de iz-
quierda a derecha, pero resulta 1.644834 si se suma de derecha a izquierda, a partir de
n = 5000.
Debe notarse que el resultado de sumar de derecha a izquierda es más exacto, ya que
en todos los términos se suman valores de igual magnitud.
Por el contrario, al sumar de izquierda a derecha, una vez que se avanza en la suma-
toda, se sumarán números cada vez más grandes con números más pequeños.
Lo anterior se corrobora si se realiza la suma en ambos sentidos, pero ahora con do-
ble precisión. El resultado obtenido es 1.64473408684689 (estos resultados pueden variar
de máquina a máquina).
1.3 Reducción de errores.
Para resolver la ecuación cuadrática
100 x2 - 10011 x + 10.011 = O,
el método común sería usar la fórmula
- b ±.) b2 - 4 a e
x= ,
2a
después de dividir la ecuación entre 100.
x2 -100.11 x + 0.10011 = O
100.11 ± .)(-100.11)2-4(0.10011)
x = -----'-----'-----'------'-
2
Errores 21
(2) por el coeficiente de x de la ecuación (1) y después restar las ecuaciones resultantes.
Para este sistema se obtendría (como los coeficientes tienen dos cifras decimales, todas las
operaciones intermedias se efectúan redondeando a dos cifras decimales):
[13.05 (14.31) - 31.69 (5.89) ] Y
(186.75 - 186.65) Y
0.10 Y
13.05 (45.00) - 31.69 (18.53)
587.25 - 587.22
0.03
de donde y = 0.3, luego
x = -,(_18_.5_3-,-)-_5._89_(-,--0_.3-,-) = 18.53 - 1.77 = 16.76 = 1.28
13.05 13.05 13.05
Para la variable x
EA =I 1.28 - 1.25 I=0.03; ER =0.0311.25 = 0.024; ERP =2.4%
Para la variable y
EA = I0.3 - 0.38 I=0.08; ER =0.08/0.38 = 0.21; ERP =21%
1.2 Error de redondeo al sumar un número grande y uno pequeño.
Considere la sumatoria infinita
s = i: ~ = J...+~+~+~+~+ ... +_1_+ ...
tl = 1 n2 1 4 9 16 25 100
resulta (usando precisión sencilla y 5000 como valor final de n) 1.644725 si se suma de iz-
quierda a derecha, pero resulta 1.644834 si se suma de derecha a izquierda, a partir de
n = 5000.
Debe notarse que el resultado de sumar de derecha a izquierda es más exacto, ya que
en todos los términos se suman valores de igual magnitud.
Por el contrario, al sumar de izquierda a derecha, una vez que se avanza en la suma-
toria, se sumarán números cada vez más grandes con números más pequeños.
Lo anterior se corrobora si se realiza la suma en ambos sentidos, pero ahora con do-
ble precisión. El resultado obtenido es 1.64473408684689 (estos resultados pueden variar
de máquina a máquina).
1.3 Reducción de errores.
Para resolver la ecuación cuadrática
100 X2 - 10011 x + 10.011 =O,
el método común sería usar la fórmula
- b +.)b2 - 4 a e
x = ,
2a
después de dividir la ecuación entre 100.
X2 - 100.11 x + 0.10011 = O
100.11 ± .)(-100.11)2 - 4(0.10011)
x = - - -- - - - -- --'-------'-
2
.,
22 Métodos numéricos apl icados a la ingeniería
Trabajando con aritmética de cinco dígitos
100.11 ± -J 10022 - 0.40044 100.11 ± -J 10022
x= = -------
2 2
= 100.11 ± 100.11 ={ 200.22 = 100 11
22'
O
Las soluciones verdaderas, redondeadas a cinco dígitos decimales son 100.11 y 0.00100.
El método empleado fue adecuado para la solución mayor, pero no del todo para la
solución menor. Si las soluciones fueran divisores de otras expresiones, la solución x = O
hubiese causado problemas serios.
Se restaron dos números "casi iguales" (números iguales en aritmética de cinco dígi-
tos) y sufrieron pérdida de exactitud.
¿Cómo evitar esto? Una forma sería reescribir la expresión para la solución de una
ecuación cuadrática a fin de evitar la resta de números "casi iguales".
El problema, en este caso, se da en el signo negativo asignado a la raíz cuadrada; esto es
-b - -J b2 - 4 a e
2a
Multiplicando numerador y denominador por -b + .Jb2 - 4a e, queda
(-b - .Jb2 - 4 a e) (-b + .Jb2 - 4 a e)
2a (-b +.J b2 - 4 a e )
(-b)2 - (b2 - 4ae)
2a (-b + .Jb2 - 4 a e )
4ae 2e
Usando esta expresión con a = 1, b = -100.11, y e = 0.10011, se obtiene
2 (0.10011 ) 0.20022 0001 ( .,' d . dí )--- =. en antmenca e CInCO 19ltOS
200.22100.11 + .J10022
que es el valor verdadero, redondeado a cinco dígitos decimales.
Esta forma alternativa para calcular una raíz pequeña de una ecuación cuadrática, ca-
si siempre produce una respuesta más exacta que la de la fórmula usual (véase Probo 2.31).
1.4 Más sobre reducción de errores.
Se desea evaluar la expresión A / ( 1 - sen x ), en x = 89° 41'. En tablas con cinco cifras
decimales, sen 89° 41' = 0.99998. Con aritmética de cinco dígitos y redondeando se tiene
sen x = 0.99998 y 1 - sen x = 0.00002
El valor de sen x sólo tiene cuatro dígitos exactos (confiables). Por otro lado, el úni-
co dígito que no es cero en 1 - sen x se ha calculado con el dígito no confiable de sen x,
por lo que se pudo perder la exactitud en la resta.
Esta situación de arriba puede mejorarse observando que
1 + sen x
1 - sen2 x
1 + sen x
cos2
X
1 + sen x
( 1- sen x ) ( 1 + sen x )
1 - sen x = ----------
22 Métodos numéricos aplicados a la in gen iería
Trabajando con aritmética de cinco dígitos
100.11 ± -J10022 - 0.40044
x = 2 =
100.11 ± ..J1Oo22
2
= 100.11 ± 100.11 = { 200.22 = 100.11
2 2
O
.,
Las soluciones verdaderas, redondeadas a cinco dígitos decimales son 100.11 y 0.00100.
El método empleado fue adecuado para la solución mayor, pero no del todo para la
solución menor. Si las soluciones fueran divisores de otras expresiones, la solución x = O
hubiese causado problemas serios.
Se restaron dos números "casi iguales" (números iguales en aritmética de cinco dígi-
tos) y sufrieron pérdida de exactitud.
¿Cómo evitar esto? Una forma sería reescribir la expresión para la solución de una
ecuación cuadrática a fin de evitar la resta de números "casi iguales".
El problema, en este caso, se da en el signo negativo asignado a la raíz cuadrada; esto es
-b -.Jb2 - 4 a e
2a
Multiplicando numerador y denominador por -b + .Jb2 - 4a e, queda
(-b - .Jb2 - 4 a e) (-b + .Jb2 - 4 a e)
2a (-b +.Jb2 - 4 a e )
(-b)2 - (b2 - 4 a e )
2a (-b + .Jb2 - 4 ae )
4ac 2e
Usando esta expresión con a = 1, b =-100.11 , y e =0.10011, se obtiene
2 (0.10011 ) 0.20022 0001 ( . , . d . d'· )- --- = . en antmetlca e Cll1CO 19ltOS
100.11 + .J10022 200.22
que es el valor verdadero, redondeado a cinco dígitos decimales.
Esta forma alternativa para calcular una raíz pequeña de una ecuación cuadrática, ca-
si siempre produce una respuesta más exacta que la de la fórmula usual (véase Probo 2.31).
1.4 Más sobre reducción de errores.
Se desea evaluar la expresión A / ( 1 - sen x ), en x = 89° 41 '. En tablas con cinco cifras
decimales, sen 89° 41' = 0.99998. Con aritmética de cinco dígitos y redondeando se tiene
sen x =0.99998 y 1 - sen x =0.00002
El valor de sen x sólo tiene cuatro dígitos exactos (confiables). Por otro lado, el úni-
co dígito que no es cero en 1 - sen x se ha calculado con el dígito no confiable de sen x,
por lo que se pudo perder la exactitud en la resta.
Esta situación de arriba puede mejorarse observando que
( 1 - sen x ) ( 1 + sen x )
1 - sen x = - -- - - - - -- -
1 + sen x
1 - sen2 x
1 + sen x
cos2 X
1 + sen x
100.
arala
x=o
dígi-
e una
to es
a, ea-
2.31).
cifras
tiene
lúni-
senx,
Errores 23
Por esto, es posible escribir 1 - sen x de una forma que no incluye la resta de dos nú-
meros casi iguales.
1.5 Comparaciones seguras.
En los métodos numéricos, a menudo la comparación de igualdad de dos números en no-
tación de punto flotante permitirá terminar la repetición de un conjunto de cálculos (pro-
ceso cíclico o iterativo). En vista de los errores observados, es recomendable comparar la
diferencia de los dos números en valor absoluto contra una tolerancia E apropiad", usando
por ejemplo el operador de relación menor o igual ( ::;). Esto se ilustra enseguida.
En lugar de
SI X = Y ALTO; En caso contrario REPETIR las instrucciones 5 a 9
Deberá usarse:
SI ABS (X - Y)::; E ALTO; en caso contrario REPETIR las instrucciones 5 a 9.
En lugar de
REPETIR
{ Pasos de un ciclo }
HASTA QUE X = Y
Deberá usarse
REPETIR
{ Pasos de un ciclo}
HASTA QUE ABS ( X - Y)::; E
donde E es un número pequeño (generalmente menor que uno, pero puede ser mayor, de-
pendiendo el contexto en que se trabaje) e indicará la cercanía de X con Y que se aceptará
como "igualdad" de X y Y.
1.6 Análisis de resultados.
Al ejecutar las siguientes instrucciones en Visual Basic con doble precisión y en Matlab,
se tiene, respectivamente:
Dim Y As Double, A as Double
Y=lOOO.2
A=Y-IOOO
Print A
format long
Y=lOOO.2;
A=Y-IOOO
Se obtiene:
0.200000000000045
Se obtiene:
0.20000000000005
Ejecute las mismas instrucciones pero usando Y = 1000.25. Los resultados ahora son
conectas. Explíquelo.
.v"
Errores 23
Por esto, es posible escribir 1 - sen x de una forma que no incluye la resta de dos nú-
meros casi iguales.
1.5 Comparaciones seguras.
En los métodos numéricos, a menudo la comparación de igualdad de dos números en no-
tación de punto flotante permitirá terminar la repetición de un conjunto de cálculos (pro-
ceso cíclico o iterativo). En vista de los errores observados, es recomendable comparar la
diferencia de los dos números en valor absoluto contra una tolerancia E apropiad", usando
por ejemplo el operador de relación menor o igual ( :s; ). Esto se ilustra enseguida.
En lugar de
SI X = Y ALTO; En caso contrario REPETIR las instrucciones 5 a 9
Deberá usarse:
SI ABS (X - Y):S; E ALTO; en caso contrario REPETIR las instrucciones 5 a 9.
En lugar de
REPETIR
{ Pasos de un ciclo }
HASTA QUE X = Y
Deberá usarse
REPETIR
{ Pasos de un ciclo}
HASTA QUE ABS ( X - Y):S; E
donde E es un número pequeño (generalmente menor que uno, pero puede ser mayor, de-
pendiendo el contexto en que se trabaje) e indicará la cercanía de X con Y que se aceptará
como "igualdad" de X y Y.
1.6 Análisis de resultados.
Al ejecutar las siguientes instrucciones en Visual Basic con doble precisión y en Matlab,
se tiene, respectivamente:
Dim Y As Double , A as Double
Y=lOOO . 2
A=Y-IOOO
Print A
Se obtiene:
0.200000000000045
format long
Y=lOOO . 2;
A=Y- IOOO
Se obtiene:
0.20000000000005
Ejecute las mismas instrucciones pero usando Y = 1000.25. Los resultados ahora son
correctos. Explíquelo.
24 Métodos numéricos ap licados a la ingeniería
En doble precisión pueden manejarse alrededor de quince dígitos decimales de exac-
titud, de modo que la resta de arriba se representa
1000.200 - 1000.000
La computadora convierte Y a binario dando un número infinito de ceros y unos, y al-
macena un número distinto a 1000.2 (véase Probo 1.6 b),
Por otro lado, 1000 sí se puede almacenar o representar exactamente en la compu-
tadora en binario en punto flotante (los números con esta característica se llaman números
máquina). Al efectuarse la resta se obtiene un número diferente de 0.2. Esto muestra por
qué deberá analizarse siempre un resultado de un dispositivo digital antes de aceptarlo.
1.7 Más sobre análisis de resultados.
El método de posición falsa (véase sección 2.4) obtiene su algoritmo al encontrar el pun-
to de corte de la línea recta que pasa por los puntos ( xo'.Yo ), (xi' Y¡ ) y el eje x. Pueden
obtenerse dos expresiones para encontrar el punto de corte xM
Si (xo' Yo) ==( 2.13, 4.19 ) Y ( x¡ , Y¡ ) == (1.96, 6.87 ) Y usando aritmética de tres dígi-
tos y redondeando, ¿cuál es la mejor expresión y por qué?
Solución Sustituyendo en i) y en ii)
i) x
M
==1.96 (4.19) - 2.13 (6.87) == 2.38
4.19-6.87
x ==2.13- (2.13-1.96)4.19==2.40
M 4.19 - 6.87
ii)
Al calcular los errores absoluto y relativo, y .omando como valor verdadero a 2.395783582,
el cual se calculó con aritmética de 13 dígitos, se tiene:
i) EA ==2.395783582 - 2.38 ==0.015783582
0.015783582
2.395783582
ER 0.006588066
ii) EA ==2.395783582 - 2.40 ==0.004216418
ER == 0.004216418 ==0.001759932
2.395783582
de donde es evidente que la forma ii) es mejor. Se sugiere al lector reflexionar sobre el por
qué.
Problemas
1.1 Proporcione los símbolos o numerales romanos correspondientes a los siguientes símbo-
los arábigos
10, 100, 1000, 10000, 100000, 1000000
24 Métodos numéricos aplicados a la ingeniería
En doble precisión pueden manejarse alrededor de quince dígitos decimales de exac-
titud, de modo que la resta de arriba se representa
1000.200 - 1000.000
La computadora convierte Y a binario dando un número infinito de ceros y unos, y al-
macena un número distinto a 1000.2 (véase Probo 1.6 b).
Por otro lado, 1000 sí se puede almacenar o representar exactamente en la compu-
tadora en binario en punto flotante (los números con esta característica se llaman númeíOs
máquina). Al efectuarse la resta se obtiene un número diferente de 0.2. Esto muestra por
qué deberá analizarse siempre un resultado de un dispositivo digital antes de aceptarlo.
1.7 Más sobre análisis de resultados.
El método de posición falsa (véase sección 2.4) obtiene su algoritmo al encontrar el pun-
to de corte de la línea recta que pasa por los puntos ( xo..)'o ), ( x/' YI) Y el eje X . Pueden
obtenerse dos expresiones para encontrar el punto de corte xM
.) . XI Yo - Xo YI ..) _ (xo - xI) Yú
1 XM = II XM - XD - -=-----'---'''
~ - ~ ~-~
Si (xD , Yo) = (2.13,4.19) Y ( "'(1' YI) = (1.96, 6.87) Y usando aritmética de tres dígi-
tos y redondeando, ¿cuál es la mejor expresión y por qué?
Solución Sustituyendo en i) y en ii)
i)
ii)
X
M
= 1.96 (4.19) - 2.13 (6.87) = 2.38
4.19-6.87
x
M
=2.13 _ (2.13 - 1.96) 4.19 =2.40
4.19 - 6.87
Al calcular los errores absoluto y relativo, y lomando como valor verdadero a 2.395783582,
el cual se calculó con aritmética de 13 dígitos, se tiene:
i) EA = 2.395783582 - 2.38 = 0.015783582
ER
0.015783582
0.006588066
2.395783582
ii) EA = 2.395783582 - 2.40 =0.004216418
ER = 0.004216418 = 0.001759932
2.395783582
de donde es evidente que la forma ii) es mejor. Se sugiere a11ector reflexionar sobre el por
qué.
Problemas
1.1 Proporcione los símbolos o numerales romanos correspondientes a los siguientes símbo-
los arábigos
10, 100, 1000, 10000, 100000, 1000000
y al-
pu-
eras
por
o.
Errores 25
1.2 Convierta" los siguientes números decimales a los sistemas con base 2 y base 8, y viceversa.
a) 536 b) 923 e) 1536 d) 8 e) 2 f) 10 g)
1.3 Convierta los siguientes números enteros del sistema octal a binario y viceversa.
1.5
un-
den
1.6
ígi- 1.7
82,
01"
0-
a) 777 b) 573 e) 7 d) 2 e) 10 f) O
1.4 Resuelva las siguientes preguntas.
a) ¿El número 101121 pertenece al sistema binario?
b) ¿El número 3852 pertenece al sistema octal?
Si su respuesta es NO en alguno de los incisos, explique por qué; si es sÍ, conviértalo(s) a
decimal.
Convierta los siguientes números dados en binario a decimal y viceversa, usando la con-
versión a octal como paso intermedio
a) 1000 b) 10101 e) 111111
Convierta los siguientes números fraccionarios dados en decimal, a binario y octal
a) 0.8 b) 0.2 e) 0.973 d) 0.356 e) 0.713 f) 0.10
Convierta los siguientes números fraccionarios, dados en binario, a decimal
a) 0.1 b) 0.010101 e) 0.0001 d) 0.11111 e) 0.00110011
f) 0.0110111
1.8 Repita los incisos a) af) del problema 1.7, pero pasando a octal como paso intermedio.
1.9 Convierta los siguientes números, dados en decimal, a octal y binario.
a) 985.34
g) 0.9389
b) 10.1 e) 888.222 d) 3.57
h) -0.9389
e) 977.93 j) 0.357
1.10 En la sección 1.2 se dijo que cada palabra de 16 bits puede contener un número entero
cualquiera del intervalo -32768 a +32767. Investigue por qué se incluye al-32768, o bien
por qué el intervalo no inicia en -32767.
Considere una computadora con una palabra de 8 bits. ¿Qué rango de números enteros
puede contener dicha palabra?
Represente el número -26 en una palabra de 8 bits.
Dados los siguientes números máquina en una palabra de 16 bits
1.11
1.12
1.13
a)
b)
e) o~
¿Qué decimales representan?
1.14 Normalice los siguientes números
a) 723.5578 e) 0.003485 d) 8 X 103b) -15.324
, Puede usar el Programa 1.1 del disco para comprobar sus resultados.
o
--------------------------_._---------
26 Métodos numéricos aplicados a la ingeniería
SUGERENCIA: Pasar los números a binario y despúes normalizados.
1.15 Represente en doble precisión el número decimal del ejemplo 1.10
1.16 Elabore un programa para la calculadora o el dispositivo de cálculo con el que se cuente,
de modo que el número 0.0001 se sume diez mil veces consigo mismo
0.0001 + 0.0001 + ... + 0.0001
1 2 10000
El resultado deberá imprimirse. Interprete este resultado de acuerdo con los siguientes li-
neamientos
a) Si es 1, ¿cómo es posible si se sumaron diez mil valores que no son realmente
0.0001 ?
b) En caso de obtener 1, explore con el valor 0.00001,0.000001, etc., hasta obtener un
resultado diferente de l.
e) ¿Es posible obtener un resultado menor de 1? ¿Por qué?
1.17 Con el programa del problema l.16 efectúe los cálculos de los incisos a) a d) del ejemplo
l.12 y obtenga los resultados de la siguiente manera
a) Inicialice la variable SUMA con O, 1, 1000 Y 10000 en los incisos a), by, e) y d), res-
pectivamente, y luego en un ciclo súmese a ese valor diez mil veces el 0.000l. Anote
sus resultados.
b) Inicialice la variable SUMA con Opara los cuatro incisos y al final del ciclo donde
se habrá sumado 0.0001 consigo mismo 10000 veces, sume a ese resultado los nú-
meros O, 1, 1000 Y 10000 e imprima los resultados.
Interprete las diferencias de los resultados.
1.18 La mayoría de las calculadoras científicas almacenan dos o tres dígitos de seguridad más de
los que despliegan. Por ejemplo, una calculadora que despliega ocho dígitos puede almace-
nar realmente diez (dos dígitos de seguridad); por tanto, será un dispositivo de diez dígitos.
Para encontrar la exactitud real de su calculadora, realice las siguientes operaciones.
Divida 10 entre 3, al resultado réstele 3.
Divida 100 entre 3, al resultado réstele 33.
Divida 1000 entre 3, al resultado réstele 333.
Divida 10000 entre 3, al resultado réstele 3333.
Notará que la cantidad de los números 3 desplegados se va reduciendo.
La cantidad de 3 desplegada en cualquiera de las operaciones anteriores, sumada al núme-
ro de ceros utilizados con el 1, indica el número de cifras significativas que maneja su cal-
culadora. Por ejemplo, si con la segunda operación despliega 0.3333333 la calculadora
maneja nueve cifras significativas de exactitud (7 + 2 ceros que tiene 100).
NOTA: Si su calculadora es del tipo intérprete BASIC, no realice las operaciones como
1000/3-333porque obtendrá otros resultados.
1.19 Evalúe la expresión A / ( 1-cos x ), en un valor de x cercano a O°. ¿Cómo podría evitar la
resta de dos números casi iguales en el denominador?
1.20 Determine en su calculadora o microcomputadora si muestra un mensaje de overflow o no.
1.21 Deduzca las expresiones para xM
dadas en el ejercicio l.7.
1.22 Un número máquina para una calculadora o computadora es un número real que se almace-
na exactamente (en forma binaria de punto flotante). El número -125.32 del ejemplo l.1O,
26 Métodos numéricos aplicados a la ingeniería
SUGERENCIA: Pasar los números a binario y despúes normalizarlos.
1.15 Represente en doble precisión el número decimal del ejemplo 1.10
1.16 Elabore un programa para la calculadora o el dispositivo de cálculo con el que se cuente,
de modo que el número 0.0001 se sume diez mil veces consigo mismo
0.0001 + 0.0001 + ... + 0.0001
1 2 10000
El resultado deberá imprimirse. Interprete este resultado de acuerdo con los siguientes li-
neamientos
a) Si es 1, ¿cómo es posible si se sumaron diez mil valores que no son realmente
0.0001 ?
b) En caso de obtener 1, explore con el valor 0.00001,0.000001, etc., hasta obtener un
resultado diferente de l .
e) ¿Es posible obtener un resultado menor de 1? ¿Por qué?
1.17 Con el programa del problema l.16 efectúe los cálculos de los incisos a) a d) del ejemplo
l.12 y obtenga los resultados de la siguiente manera
a) Inicialice la variable SUMA con O, 1, 1000 Y 10000 en los incisos a), by, e) y d), res-
pectivamente, y luego en un ciclo súmese a ese valor diez mil veces el 0.0001. Anote
sus resultados.
b) Inicialice la variable SUMA con Opara los cuatro incisos y al final del ciclo donde
se habrá sumado 0.0001 consigo mismo 10000 veces, sume a ese resultado los nú-
meros O, 1, 1000 Y 10000 e imprima los resultados.
Interprete las diferencias de los resultados.
1.18 La mayoría de las calculadoras científicas almacenan dos o tres dígitos de seguridad más de
los que despliegan. Por ejemplo, una calculadora que despliega ocho dígitos puede almace-
nar realmente diez (dos dígitos de seguridad); por tanto, será un dispositivo de diez dígitos.
Para encontrar la exactitud real de su calculadora, realice las siguientes operaciones.
Divida 10 entre 3, al resultado réstele 3.
Divida 100 entre 3, al resultado réstele 33.
Divida 1000 entre 3, al resultado réstele 333.
Divida 10000 entre 3, al resultado réstele 3333.
Notará que la cantidad de los números 3 desplegados se va reduciendo.
La cantidad de 3 desplegada en cualquiera de las operaciones anteriores, sumada al núme-
ro de ceros utilizados con el 1, indica el número de cifras significativas que maneja su cal-
culadora. Por ejemplo, si con la segunda operación despliega 0.3333333 la calculadora
maneja nueve cifras significativas de exactitud (7 + 2 ceros que tiene 100).
NOTA: Si su calculadora es del tipo intérprete BASIC, no realice las operaciones como
1000/3-333 porque obtendrá otros resultados.
1.19 Evalúe la expresión A / ( 1-cos x), en un valor de x cercano a O°. ¿Cómo podría evitar la
resta de dos números casi iguales en el denominador?
1.20 Determine en su calculadora o microcomputadora si muestra un mensaje de overflow o no.
1.21 Deduzca las expresiones para xM dadas en el ejercicio 1.7.
1.22 Un número máquina para una calculadora o computadora es un número real que se almace-
na exactamente (en forma binaria de punto flotante). El número -125.32 del ejemplo l.1O,
Errores 27
ente,
evidentemente no es un número de máquina (si el dispositivo de cálculo tiene una palabra de
16 bits). Por otro lado, el número -26 del ejemplo 1.8 sí lo es, empleando una palabra de 16
bits. Determine 10 números de máquina en el intervalo [10-19, 1018] cuando se emplea una
palabra de 16 bits.
1.23 Investigue cuántos números máquina positivos es posible representar en una palabra de
16 bits.
1.24 Haga el análisis de la propagación de errores para la resta (véase análisis de la suma, en la
sección 1.3).
1.25 Se desea evaluar la función e5x en el punto x = 1.0; sin embargo, si el valor de x se calcu-
ló en un paso previo con un pequeño error y se tiene x* = 1.01; determine Ef con las ex-
presiones dadas en la evaluación de funciones de la sección 1.3. Luego determine Ef co-
mo f (1) - f (l.01) Y compare los resultados.
1.26 Resuelva el siguiente sistema de ecuaciones, usando dos cifras decimales para guardar los
resultados intermedios y finales.
21.76x + 24.34y = 1.24 14.16x + 15.84y = 1.15
nde
nú-
y determine el error cometido. La solución exacta (redondeada a 5 cifras decimales es) x =
-347.89167, Y = 311.06667.
1.27 Codifique el siguiente algoritmo en su microcomputadora (use precisión sencilla)
PASO l. Leer A.
PASO 2. Mientras A>O, repetir los pasos 3 y 4.
PASO 3. IMPRIMIR Ln(Exp(A))-A, Exp(Ln(A))-A
PASO 4. Leer A.
PASO 5. TERMINAR.
de
ce-
itos,
Ejecútelo con diferentes valores de A, por ejemplo 0.2, 0.25, 1, l.5, 1.8, 2.5, 3.14159,
0.008205, etc., y observe los resultados.
1.28 Modifique el programa del problema del ejemplo 1.27 usando doble precisión para A y
compare los resultados.
1.29 Modifique el paso 3 del programa del problema 1.27 para que quede así
IMPRIMIR SQR(A fI 2) - A, SQR(A) fI 2 - A
y vuelva a ejecutarlo con los mismos valores.
e-
al-
ora
1.30 Realice la modificación indicada en el problema 1.29 al programa del problema 1.28.
Compare los resultados.
1.31 Repita los problemas l.27 a l.30 con lenguaje Pascal (puede usar Delphi, por ejemplo),
con lenguaje Visual C++ y compare los resultados con los obtenidos en Basic.
la
no.
ce-
lO,
Errores 27
evidentemente no es un número de máquina (si el dispositivo de cálculo tiene una palabra de
16 bits). Por otro lado, el número -26 del ejemplo 1.8 sí lo es, empleando una palabra de 16
bits. Determine 10 números de máquina en el intervalo [10-19, 1018 ] cuando se emplea una
palabra de 16 bits.
1.23 Investigue cuántos números máquina positivos es posible representar en una palabra de
16 bits.
1.24 Haga el análisis de la propagación de errores para la resta (véase análisis de la suma, en la
sección 1.3).
1.25 Se desea evaluar la función e5x en el punto x = 1.0; sin embargo, si el valor de x se calcu-
ló en un paso previo con un pequeño error y se tiene x* = 1.01 ; determine E¡ con las ex-
presiones dadas en la evaluación de funciones de la sección 1.3. Luego determine E¡ co-
mo f (1) - f (1.01) Ycompare los resultados.
1.26 Resuelva el siguiente sistema de ecuaciones, usando dos cifras decimales para guardar los
resultados intermedios y finales.
21.76x + 24.34y = 1.24 14.16x + 15.84y = 1.15
y determine el error cometido. La solución exacta (redondeada a 5 cifras decimales es) x =
-347.89167, Y =311.06667.
1.27 Codifique el siguiente algoritmo en su microcomputadora (use precisión sencilla)
PASO l . Leer A.
PASO 2. Mientras A>O, repetir los pasos 3 y 4.
PASO 3. IMPRIMIR Ln(Exp(A»-A, Exp(Ln(A»-A
PASO 4. Leer A.
PASO 5. TERMINAR.
Ejecútelo con diferentes valores de A, por ejemplo 0.2, 0.25, 1, 1.5, 1.8, 2.5, 3.14159,
0.008205, etc., y observe los resultados.
1.28 Modifique el programa del problema del ejemplo 1.27 usando doble precisión para A y
compare los resultados.
1.29 Modifique el paso 3 del programa del problema 1.27 para que quede así
IMPRIMIR SQR(A A 2) - A, SQR(A) A 2 - A
y vuelva a ejecutarlo con los mismos valores.
1.30 Realice la modificación indicada en el problema 1.29 al programa del problema 1.28.
Compare los resultados.
1.31 Repita los problemas 1.27 a 1.30 con lenguaje Pascal (puede usar Delphi, por ejemplo),
con lenguaje Visual C++ y compare los resultados con los obtenidos en Basic.
CAPÍTULO 2
SOLUCiÓN DE ECUACIONES
NO LINEALES
A dónde nos dirigimos
En este Y.'lPítuloestudiaremos diversos métodos para resolver ecuaciones no lineales en
una incógnita,f(x) = O, aprovechando los conceptos básicos del cálculo y las posibili-
dades gráficas y de cómputo de la tecnología modema. A lo largo del texto, recurrire-
mos sistemáticamente a la interpretación gráfica de los métodos, a fin de mostrar
visualmente su funcionamiento y d~ enriquecer las imágenes asociadas con ellos; de
iguai máriera, se generan tablas en la aplicación de cada técnica para analizar el com-
portamiento numérico y eventualmente detener el proceso.
Se ha organizado el material como métodos de uno y de dos puntos, usando como
prototipo de los primeros el de punto fijo, y de los segundos el de posición falsa. Esto,
junto con el concepto de orden de convergencia, nos permitirá tener los elementos su-
ficientes para seleccionar la técnica más adecuada para una situación dada. Finalizamos
el capítulo con las técnicas para resolver ecuaciones polinomiales. Algunas de ellas son
adaptaciones de las que estudiamos anteriormente y otras particulares para esta familia;'
El propósito de este capítulo es que el lector cuente con los elementos básicos, com-
putácionales y de criterio, apropiados para resolver el problema algebraico clásico de en-
contra¡' las raíces reales y complejas de la ecuación f (x)=O, en donde las técnicas
algebraicas de "despejar" la incógnita no sean aplicables, como es el caso de cos x - 3x
= Oo e' - 3x = O, o bien resulten imprácticas. Por último, es importante señalar lo difícil
que resulta pensar en un tópico de matemáticas o ingeniería que no involucre ecuaciones
de esta naturaleza.
Introducción
Uno de los problemas más frecuentes en ingeniería es encontrar las raíces de ecuaciones de
la formaf(x) = O,dondef(x) es una función real de una variable x, como un polinomio en x
f (x) = 4 x5 + X 3 - 8 x + 2
o una función trascendente'
f (x) = e' sen x + In 3x + x3
Existen distintos algoritmos para encontrar las raíces o ceros de f (x) = O,pero ningu-
no es general. es decir, no hay un algoritmo que funcione con todas las ecuaciones; por
ejemplo, se puede pensar en un algoritmo que funcione perfectamente para encontrar las
raíces de fl (x) = O,pero al aplicarlo no se pueden encontrar los ceros de una ecuación dis-
tinta j, (x) = O.
, Las funciones trascendentes contienen términos trigonométricos, exponenciales o logarítmicos de la variable
independiente.
CAPiTULO 2
SOLUCiÓN DE ECUACIONES
NO LINEALES
A dónde nos dirigimos
En este capítulo estudiaremos diversos métodos para ~esolver ecua<;iones no lineales en
una incógnita,f(x) = O, aprovechando los conceptos básicos del cálculo y las posibili-
dades gráficas y de cómputo de la técnología modema. A lq largo del texto, recunire-
mos sistetnáticámente a la interpretación gráfica de los métodos, a fin de mostrar
visualmente su fu,ncionamiento y de enriquecer las imágenes asociadas con ellos;. de
igúiti máriera, se generan tablas en la aplicación cte cada técnica para analizar el com-
portamiento numérico y eventualmente detener el proceso.
Se ha organizado el material como métodos de uno y de dos puntos, usando como
prototipo de los primeros el de punto fijo, y de los segundos el de posición falsa. Esto,
junto con el concepto de orden de convergencia, nos permitirá tener los elementos su-
ficientes para seleccionar la técnica más adecuada para una situación dada. Finalizamos
el capítulo con las técnicas para resolver ecuaciones polinomiales. Algunas de ellas son
adaptaciones de las que estudiamos anteriormente y otras particulares para esta familia.
El propósito de este capítulo es que el lector cuente con los elementos básicos, com-
putacionales y de critello, apropiados para resolver el problema algebraico clásico de en-
contra¡' las raíces reales y complejas de la ecuación f (x)=O, en donde las técnicas
algebraicas de "despejar" la incógnita no sean aplicables, como es el caso de cos x - 3x
= Oo eX - 3x = O, o bien resulten imprácticas. Por último, es importante señalar lo difícil
que resulta pensar en un tópico de matemáticas o ingeniería que no involucre ecuaciones
de esta naturaleza.
Introducción
Uno de los problemas más frecuentes en ingeniería es encontrar las raíces de ecuaciones de
la formaf(x) =O, dondef(x) es una función real de una variable x, como un polinomio en x
f(x) = 4 x5 + X 3 - 8 x + 2
o una función trascendente'
f (x) = eT
sen x + In 3x + x3
Existen distintos algoritmos para encontrar las raíces o ceros def (x) =O, pero ningu-
no es general. es decir, no hay un algoritmo que funcione con todas las ecuaciones; por
ejemplo, se puede pensar en un algoritmo que funcione perfectamente para encontrar las
raíces def l (x) = O, pero al aplicarlo no se pueden encontrar los ceros de una ecuación dis-
tintaf2 (x) =O.
, Las funciones trascendentes contienen términos trigonométricos, exponenciales o logarítmicos de la variable
independiente.
30 Métodos numéricos aplicados a la ingeniería
Sólo en muy pocos casos será posible obtener las raíces exactas de f (x) = O, como
cuando f (x) es un polinomio factorizable, tal como
f(x) = (x-xI) (x-x2) ... (X-XII)'
donde Xi' 1 ::::;i ::::;n denota la i-ésima raíz de f (x) = O. Sin embargo, se pueden obtener so-
luciones aproximadas al utilizar algunos de los métodos numéricos de este capítulo. Se
empezará con el método de punto fijo (también conocido como de aproximaciones suce-
sivas, de iteración funcional, etc.), por ser el prototipo de todos ellos.
2.1 Método de punto fijo
Sea la ecuación general
f(x) =0, (2.1)
de la cual se desea encontrar una raíz real" X.
El primer paso consiste en transformar algebraicamente la ecuación 2.1 a la forma
equivalente
X = g (x) (2.2)
Por ejemplo para la ecuación
f (x) = 2x2 - X - 5 = O (2.3)
cuyas raíces son 1.850781059 y -1.350781059, algunas posibilidades de x = g (x) son
a) x=2x2-5 "despejando" el segundo término.
b) x=JX;5 "Despejando" x del primer término. (2.4)
e)
5
Factorizando x y "despejándola".x=--
2x- 1
el) x=2x2-5 Sumando x a cada lado.
e)
2x2-x-5
Véase sección 2.2x=x-
4x- 1
Una vez que se ha determinado una forma equivalente (Ec. 2.2), el siguiente paso es
tantear una raíz; esto puede hacerse por observación directa de la ecuación (por ejemplo
en la Ec. 2.3 se ve directamente que x = 2 es un valor cercano a una raíz)." Se denota el
valor de tanteo o valor de inicio como xo' Otros métodos de tanteo se estudiarán en la sec-
ción 2.8.
Una vez que se tiene xo, se evalúa g (x) en xo, denotándose el resultado de esta eva-
luación como xl; esto es, .
g (xo) = XI
El valor de xI comparado con X
o presenta los dos siguientes casos:
* En las secciones 2.9 y 2.10 se analizará el caso de raíces complejas .
•• Puede graficar usando un paquete comercial.
omo
so-
. Se
uce-
2.1)
rma
2.2)
2.3)
2.4)
o es
plo
a el
ec-
va-
Solución de ecuaciones no lineales 31
CASO 1. QUE x, =xO
Esto indica que se ha elegido como valor inicial una raíz y el problema queda concluido.
Para aclararlo, recuérdese que si x es raíz de la ecuación 2.1, se cumple que
f(x) = O,
y como la ecuación 2.2 es sólo un rearreglo de la ecuación 2.1, también es cierto que
g (x ) = x .
Si se hubiese elegido como X
o = 1.850781059 para la ecuación 2.3, el lector puede ve-
rificar que cualquiera que sea la g (x) seleccionada, g (1.850781059) = 1.850781059; esto
se debe a que 1.850781059 es una raíz de la ecuación 2.3. Esta característica de g (x) de
fijar su valor en una raíz x ha dado a este método el nombre que lleva.
Es el caso más frecuente e indica que x, y X
o son distintos de x, Esto es fácil de explicar,
ya que si x no es una raíz de 2.1, se tiene que
f(x)=FO,
y por otro lado, evaluando g (x) en x, se tiene
g (x) =Fx .
En estas circunstancias se procede a una segunda evaluación de g (x), ahora en x" deno-
tándose el resultado como x2
Este proceso se repite y se obtiene el siguiente esquema iterativo
Valor inicial:
Primera iteración:
Segunda iteración:
Tercera iteración:
f(xo)
f(x,)
f(x2
)
f(x3
)
(2.5)
g (x¡_,)
= g (x)
i-ésima iteración:
i + l-ésima iteración:
Aunque hay excepciones, generalmente se encuentra que los valores xo, x" x2
' ... se van
acercando a x de manera que x¡ está más cerca de x que x¡_" o bien se van alejando de x
de modo que cualquiera está más lejos que el valor anterior.
Si para la ecuación 2.3 se emplea X
o = 2.0 como valor inicial y las g (x) de los incisos
a) y b) de la ecuación 2.4 se obtiene, respectivamente:
Solución de ecuaciones no lineales 31
CASO 1. QUE XI =xo
Esto indica que se ha elegido como valor inicial una raíz y el problema queda concluido.
Para aclararlo, recuérdese que si x es raíz de la ecuación 2.1 , se cumple que
f(x) = O,
y como la ecuación 2.2 es sólo un rearreglo de la ecuación 2.1 , también es cierto que
g (x)=x .
Si se hubiese elegido como X
o=1.850781059 para la ecuación 2.3, el lector puede ve-
rificar que cualquiera que sea la g (x) seleccionada, g (1 .850781059) = 1.850781059; esto
se debe a que 1.850781059 es una raíz de la ecuación 2.3. Esta característica de g (x) de
fijar su valor en una raíz x ha dado a este método el nombre que lleva.
Es el caso más frecuente e indica que XI y X
oson distintos de x. Esto es fácil de explicar,
ya que si xno es una raíz de 2.1, se tiene que
f(x)*O,
y por otro lado, evaluando g (x) en x,se tiene
g (x) *x .
En estas circunstancias se procede a una segunda evaluación de g (x), ahora en x" deno-
tándose el resultado como x2
Este proceso se repite y se obtiene el siguiente esquema iterativo
Valor inicial: xo f(xo)
Primera iteración: xI g (xo) f(x l)
Segunda iteración: x2 g (xI) f(x2)
Tercera iteración: x3 g (x2) f(x3)
(2.5)
i-ésima iteración: Xi g (Xi_l
) f(x)
i + l-ésima iteración: xi+ I = g (x) f(xi+ l)
Aunque hay excepciones, generalmente se encuentra que los valores xo, x" x2' ... se van
acercando a x de manera que Xi está más cerca de x que xi_ " o bien se van alejando de x
de modo que cualquiera está más lejos que el valor anterior.
Si para la ecuación 2.3 se emplea X
o = 2.0 como valor inicial y las g (x) de los incisos
a) y b) de la ecuación 2.4 se obtiene, respectivamente:
32 Métodos numéricos aplica dos a la ingeniería
xo=2;g(x)=2x2-5 Xo = 2; g (x) = JX;5
Xi g (Xi) Xi g (Xi)
O 2 3 O 2.00000 1.87083
3 13 1.87083 1.85349
2 13 333 2 1.85349 1.85115
3 333 221773 3 l.85115 1.85083
Puede apreciarse que la sucesión diverge con la g (x) del inciso a), y converge a la raíz
1.850781059 con la g (x) del inciso b).
Finalmente, para determinar si la sucesión xo' x [, x2, ... está convergiendo o divergien-
do de una raíz X, cuyo valor se desconoce, puede calcularse en el proceso 2.5 la sucesión
f (xo)' f (x 1)' f (x2),· .. Si dicha sucesión tiende a cero, el proceso 2.5 converge a x y dicho
proceso se continuará hasta que If (x) I < el' donde e[ es un valor pequeño e indicativo de '
la exactitud o cercanía de Xi con x. Se toma a Xi como la raíz y el problema de encontrar
una raíz real queda concluido. Si por el contrario f (xo)'! (XI)'! (x2
), ... no tiende a cero, la
sucesión xo, xl' x2' ... diverge de x, y el proceso deberá detenerse y ensayarse uno nuevo
con una g (x) diferente.
Fi
Gráfic
Encuentre una aproximación a una raíz real de la ecuación
cos x - 3 x = O
Solución Dos posibilidades de g (x) = x son
a) x = cos x - 2 x b)x = cos x / 3
Graficando por separado las funciones cos x y 3x, se obtiene la figura 2.1
(Para graficar puede usar: el guión (script) de Matlab, las indicaciones para la TI-92
Plus o algún otro software comercial).
,~J
o' .AA
x= -4: O. 1 : 4;
y=cos (x);
z= 3~x;
t=zeros (size (x));
plot (x,y)
axis([-4 4 -2 2])
hold on
plot (x,z)
plot (x, t)
Invoque el editor Y=+W
Escriba en yl = la primera función a graficar: cos (x)
Escriba en y2 = la segunda función a grafiear: 3*x
Grafique con zoom estándar (F2 6)
Lleve el cursar gráfico al punto donde se cruzan las
dos funciones.
Haga un acercamiento(F2 2)~
Use el trazador (F3) para ubicar la raíz.
De donde un valor cercano a x es X
o = (n/2) /4*. Iterando se obtiene para la forma del
inciso a).
• En el caso de funciones trigonométricas x debe estar en radianes.
a la raíz
ergien-
ucesión
y dicho
ativo de
contrar
cero, la
nuevo
a TI-92
a del
Solución de ecuaciones no lineales 33
0.5
O
-0.5
-1
-1.5
Figura 2.1
Gráfica de cos x -2
y de 3x. -4 -3 -2 ~l O 2 3 4
Xi g (Xi) If(Xi) I
O Tr/8 0.13848 0.25422
1 0.13848 0.71346 0.57498
2 0.71346 -0.67083 1.38429
3 -0.67083 2.12496 2.79579
4 2.12496 -4.77616 6.90113
Se detiene el proceso en la cuarta iteración, porque f (xo),f (x I),f (x2
), ... no tiende a
cero. Se emplea el valor absoluto de f (x) para manejar la idea de distancia.
Se inicia un nuevo proceso con X
o :=: (TrI2)/4 y la forma equivalente del inciso b).
Xi g (x;) If(Xi) I
O Tr/8 0.30796 0.25422
0.30796 0.31765 0.02907
2 0.31765 0.31666 0.00298
3 0.31666 0.31676 0.00031
4 0.31676 0.31675 0.00003
Yla aproximación de la raíz es:
.i ""x4
:=: 0.31675
Para llevar a cabo los cálculos que se muestran en la tabla anterior, puede usar Matlab o la
TI-92 Plus:
~7t--------------------------------------------~=======-=------------------------------------------
34 Métodos numéricos aplicados a la ingeniería
E2_1 ()
Prgm
ClrIO : 3.1416/B-+xO
For i, 1, 5
eos (xO) /3-+ x
abs (eos (xO) -::rxO)-+ f
string (xO) s" "&string(x)-+a
a&" "string (f) -+ a
Disp a: Pause : x+ xO
EndFor
EndPgrm
ALG
format long
xO=pi / B ;
for i = 1 : 5
x=eos (xO) / 3;
f=abs (eos (xO) - :Ji'xO);
disp ( [xO, x, f] )
xO=x;
end
Para er
Matlab posee una función que resuelve ecuaciones no lineales, suministrando la función y
un valor inicial. Para este caso la instrucción quedaría:
DA'
RE
fzero('cos(x) -3*x', pi/8)
PASO
PASO
con lo que se obtiene:
ans = 0.3168
y en formato largo (format long)
ans = 0.31675082877122
PASO
La calculadora TI-92 Plus también tiene una función que resuelve ecuaciones no lineales.
La instrucción es:
nSolve(cos(x) = 3*x, x)
y el resultado es 0.316751
CRITERIO DE CONVERGENCIA
Se estudiará un criterio más de convergencia del proceso iterativo 2.5, basado en que
g (x) = .e ,
por lo cual puede suponerse que si la sucesión xo, xl' x2' ... converge a x , los valores con-
secutivos xi y X
i
+
1
irán acercándose entre sí conforme el proceso iterativo avanza, como
puede verse enseguida
-
x
-H+---I-1I---Kt1I--------x
Un modo práctico de saber si los valores consecutivos se acercan es ir calculando la dis-
tancia entre ellos
di = I Xi + 1 - Xi I
Si la sucesión di' d2
, d3
, ... tiende a cero, puede pensarse que el proceso 2.5 está conver-
giendo a una raíz x y debe continuarse hasta que di < E, Ytomar a xi+ 1 como la raíz busca-
da. Si di' d2
, d3
, ... no converge para un número "grande" de iteraciones (llámense
34 Métodos numéricos aplicados a la ingeniería
format long
xO=pi / B ;
for i = 1 : 5
x=eos (xO) / 3;
E2_1 ()
Prgm
CIrIO : 3 . 1416/B-> xO
For i , 1, 5
eos (xO) / 3->x
abs (eos (xO) -3~xO) -> ff=abs (eos (xO) - YxO) ;
disp ( [xO, x, f] )
xO=x;
string (xO) &" " &string(x) -> a
a&" "string(f)->a
end Disp a: Pause : x-> xO
EndFor
EndPgrm
Matlab posee una función que resuelve ecuaciones no lineales, suministrando la función y
un valor inicial. Para este caso la instrucción quedaría:
fzero('cos(x) -3*x', pi/8)
con lo que se obtiene:
ans =0.3168
y en formato largo (format long)
ans = 0.31675082877122
La calculadora TI-92 Plus también tiene una función que resuelve ecuaciones no lineales.
La instrucción es:
nSolve(cos(x) =3*x, x)
y el resultado es 0.316751
CRITERIO DE CONVERGENCIA
Se estudiará un criterio más de convergencia del proceso iterativo 2.5, basado en que
g (x) = x ,
por lo cual puede suponerse que si la sucesión xo' xI ' x2' . .. converge a x, los valores con-
secutivos xi y Xi+1 irán acercándose entre sí conforme el proceso iterativo avanza, como
puede verse enseguida
-
x
I I I I I I x
Un modo práctico de saber si los valores consecutivos se acercan es ir calculando la dis-
tancia entre ellos
di =I xi + 1 - xi I
Si la sucesión di' d2, d3,... tiende a cero, puede pensarse que el proceso 2.5 está conver-
giendo a una raíz x y debe continuarse hasta que di < 8, Ytomar a Xi+1 como la raíz busca-
da. Si dI' d2, d3, . .. no converge para un número "grande" de iteraciones (llámense
ción y
neales..
ue
s con-
como
la dis-
Solución de ecuaciones no lineales 35
MAXIT), entonces xo, Xl' x2' ... diverge de x , y se detiene el proceso para iniciar uno nue-
vo, modificando la función g (x), el valor inicial o ambos.
Este criterio de convergencia se utiliza ampliamente en el análisis numérico y resulta
más sencillo de calcular que el que emplea la sucesiónf(xo),f(x1
),f(x2
), ... pero también
es menos seguro, como se verá más adelante.
Para finalizar esta sección se da un algoritmo del método de punto fijo en forma pro-
pia para lenguajes de programación.
ALGORITMO 2. 1 Método de punto fUo
Para encontrar una raíz real de la ecuación g (x) = x proporcionar la función G (X) Ylos
DATOS: Valor inicial XO, criterio de convergencia EPS y número máximo de iteraciones MAXIT.
RESULTADOS: La raíz aproximada X o un mensaje de falla.
PASO l.
PASO 2.
Hacer I = 1
Mientras I <MAXIT, realizar los pasos 3 a 6.
PASO 3. Hacer X = G(XO) (calcular (Xi ».
PASO 4. Si ABS (X - XO) ::;EPS entonces IMPRIMIR X Y TERMINAR. De otro modo CONTINUAR.
PASO 5. Hacer I = I + 1.
PASO 6. Hacer XO = X (actualiza XO).
IMPRIMIR mensaje de falla: "EL MÉTODO NO CONVERGE A UNA RAÍZ" Y TERMINAR.PASO 7.
EL CRITERIO I g' (x) I < 1
Es importante analizar por qué algunas formas equivalentes x = g (x) de f (x) = O condu-
cen a una raíz en el método de punto fijo y otras no, aun empleando el mismo valor inicial
en ambos casos.
Se inicia el análisis aplicando el teorema del punto medio" a la función g (x) en el in-
tervalo comprendido entre x¡_l y Xi'
(2.6)
donde:
Como
sustituyendo se obtiene:
Xi+1- Xi = g' (~¡) (x¡ - x¡_l)
Tomando valor absoluto en ambos miembros
1 x¡+l - x¡ 1 = 1 g' (~¡) 11 x¡ - x¡_l 1
Para i = 1,2,3, ... la ecuación 2.7 queda así:
(2.7)
* Se supone que g (x) satisface las condiciones de aplicabilidad de este teorema.
Solución de ecuaciones no lineales 35
MAXIT), entonces xo' Xl' X2, ... diverge de x, y se detiene el proceso para iniciar uno nue-
vo, modificando la función g (x), el valor inicial o ambos.
Este criterio de convergencia se utiliza ampliamente en el análisis numérico y resulta
más sencillo de calcular que el que emplea la sucesiónj(xo),f(xl),f(x2), ... pero también
es menos seguro, como se verá más adelante.
Para finalizar esta sección se da un algoritmo del método de punto fijo en forma pro-
pia para lenguajes de programación.
ALGORITMO 2.1 Método de punto fUo
Para encontrar una raíz real de la ecuación g (x) = x proporcionar la función G (X) Ylos
DATOS: Valor inicial XO, criterio de convergencia EPS y número máximo de iteraciones MAXIT.
RESULTADOS: La raíz aproximada X o un mensaje de falla.
PASO 1.
PASO 2.
PASO 7.
Hacer 1 = 1
Mientras 1 <MAXIT, realizar los pasos 3 a 6.
PASO 3. Hacer X = G(XO) (calcular (Xi ».
PASO 4. Si ABS (X - XO) ::; EPS entonces IMPRIMIR X YTERMINAR. De otro modo CONTINUAR.
PASO 5. Hacer 1 = 1 + 1.
PASO 6. Hacer XO = X (actualiza XO).
IMPRIMIR mensaje de falla: "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR.
EL CRITERIO Ig' (x) I< 1
Es importante analizar por qué algunas formas equivalentes x = g (x) dej(x) = Ocondu-
cen a una raíz en el método de punto fijo y otras no, aun empleando el mismo valor inicial
en ambos casos.
Se inicia el análisis aplicando el teorema del punto medio* a la función g (x) en el in-
tervalo comprendido entre xi_1 y Xi'
donde:
Como
sustituyendo se obtiene:
Xi+ 1 - Xi = g' (~¡) (Xi - xi_1)
Tomando valor absoluto en ambos miembros
1xi+1 - Xi 1 =1g' (~¡) 11 Xi - xi_1 1
Para i = 1,2,3,... la ecuación 2.7 queda así:
* Se supone que g (x) satisface las condiciones de aplicabilidad de este teorema.
(2.6)
(2.7)
36 Métodos numéri cos aplicados a la ingeniería
1g' (~2) 1 1X2 - XI 1
= 1g' (~3) 1 1X3 - X2 1
~2 E (X2, XI)
~3 E (X3, X2)
(2.8)
Supóngase ahora que en la región que comprende a xo' xI"" y en x misma, la función g'
(x) está acotada; esto es
1g' (x) I:S; M,
para algún número M. Entonces:
1x2 - XI 1 :s; M 1Xl - Xo 1
1x3 - x2 1 :s; M 1x2 - xII
1x4 - x3 1 :s; M 1x3 - x2
1
(2.9)
Si se sustituye la primera desigualdad en la segunda, se tiene
1x3 - x2 1:s; MI x2 - XI 1:s; MM 1XI - Xo 1
o bien
1x3 - x2
1:s; M2 1XI - Xo 1
Si se sustituye este resultado en la tercera desigualdad de la ecuación 2.9 se tiene
1x4 - x3 1:s; M 1x3 - x2
1:s; MM2 1XI - Xo 1
1x4 - x3 1:s; M3 1XI - Xo 1o
Procediendo de igual manera se llega a
(2.10)
El proceso 2.5 puede converger por razones muy diversas, pero es evidente que si M <
1, dicho proceso convergirá, ya que Mi tenderá a cero al tender i a un número grande.
En conclusión, el proceso 2.5 puede converger si M es grande y convergirá si M < 1
en un entorno de X que incluya xo, XI' x2
, ... Entonces M < 1 es urja condición
suficiente, pero no necesaria para la convergencia.
Un método práctico de emplear este resultado es obtener distintas formas X = g (x) def (x) =
O,Ycalcular 1g' (x) 1;las que satisfagan el criterio 1g' (xo) 1< 1 prometerán convergencia al
aplicar el proceso 2.5.
Ejemplo 2.2 Calcule una raíz real de la ecuación"
f (x) = x3 + 2x2
+ 10x - 20 = O,
empleando como valor inicial X
o = l.
*Resuelta por Leonardo de Pisa en 1225.
36 Métodos numéricos aplicados a la ingeniería
1X3 - X2 1 1g' (~2) 1 1X2 - XI 1
1X4 - X3 1 = 1g' (~3) 1 1X3 - X2 1
~2 E (X2, X I)
~3 E (X3, X2)
(2.8)
Supóngase ahora que en la región que comprende a X
o' Xi' .. . yen x misma, la función g'
(x) está acotada; esto es
1g' (x) 1s M,
para algún número M. Entonces:
1x2 - X I 1 s M 1xl - X
o1
1x3 - x2 1 s M 1x2 - xII
1x4 - x3
1 s M 1x3
- x2
1
Si se sustituye la primera desigualdad en la segunda, se tiene
1x3 - x2 1s M Ix2 - XI 1s MM 1xI - Xo 1
o bÍen
1x3 - x2 1S M2 1xI - Xo 1
Si se sustituye este resultado en la tercera desigualdad de la ecuación 2.9 se tiene
1x4 - x3
1s M 1x3
- x2 1S MM2 1X I - X
o 1
o
Procediendo de igual manera se llega a
(2.9)
(2.10)
El proceso 2.5 puede converger por razones muy diversas, pero es evidente que si M <
1, dicho proceso convergirá, ya que Mi tenderá a cero al tender i a un número grande.
En conclusión, el proceso 2.5 puede converger si M es grande y convergirá si M < 1
en un entorno de X que incluya xo, X I ' x2, . .. Entonces M < 1 es uria condición
suficiente, pero no necesaria para la convergencia.
Un método práctico de emplear este resultado es obtener distintas formas X = g (x) def (x) =
O, Ycalcular 1g' (x) 1; las que satisfagan el criterio 1g' (xo) 1< 1 prometerán convergencia al
aplicar el proceso 2.5.
Ejemplo 2.2 Calcule una raíz real de la ecuación*
f (x) =x3 + 2x2 + 10x - 20 =O,
empleando como valor inicial X
o=1.
*Resuelta por Leonardo de Pisa en 1225.
(2.8)
nción g'
(2.9)
Solución de ecuaciones no lineales 37
Solución Dos formas x = g (x) de esta ecuación son
20
a) x=----
x2
+ 2x + 10
de donde
, ( ) -20(2x + 2)
g x =
(x2 + 2x + 10)2
Sustituyendo X
o = l.
I g' (1) 1=1 -80 1=0.47
169
y b) x = x3 + 2,¿ + llx - 20
y g' (x) = 3x2
+ 4x + 11
y I g' (1) I = 8
De donde la forma a) promete convergencia y la forma b) no.
Aplicando el proceso 2.5 y el criterio e = 10-3 a I X¡+l - x¡ I en caso de convergencia,
se tiene:
Xi IXi+1 -Xi I Ig' (X) I
O 1.00000 '.. 0.47337
L 1.53846 , 0.53-846 0.42572
2 1.29502 0.24344 0.45100
3 1.40183 0.10681 0.44047
4 1.35421 0.04762 0.44529
5 1.37530 0.02109 0.44317
6 1.36593 0.00937 0.44412
(2.10) 7 1.37009 0.00416 0.44370
8 1.36824 0.00184 0.44389
9 1.36906 0.00082 0.44380
ef(x) =
encia al
Para llevar a cabo los cálculos que se muestran en la tabla anterior, puede usarse Ma-
tlab o la TI-92 Plus.
format long
xO=l;
for i=l : 9
x=20/ (xO~2+2*xO+10);
dist=abs (x - xO) ;
dg=abs (- 2(J1' (2*x+2) l ..
(x"2+2*x + 10) "2) ;
disp ([x, dist, dg])
xü-x:
end
e2_2 ( )
Prgm
Define g(x)=20/(x~2+2*x+10)
CirIO: 1-t xO
For i, 1, 9
g (xO) -t x: abs (x - xO) -t d
Disp string (x) &" "&string (d)
Pause: x-txO
EndFor
EndPrgm
38 Métodos numéricos aplicados a la ingeniería
Obsérvese que Ig'(x) I se mantiene menor de uno. Una vez que IXi
+¡ - xi I < 10-3, se
detiene el proceso y se toma como raíz a x9
X"'- 1.36906
Si se hubiese tomado la forma equivalente
_x3 - 2x2 + 20
x=-----
10
para la cual, se tiene
, () -3x2
- 4x
g x =----
10
y con X
o = 1
Ig'(1)1=1-
7
1=0.7,
10
Fi
Inte
geor
19lo cual indica posibilidad de convergencia, pero al aplicar el proceso 2.5 se tiene
Xi IXi+1 -Xi I Ig' (Xi) I
O 1.00000 0.70000
1.70000 0.70000 1.54700
2 0.93070 0.76930 0.63214
3 1.74614 0.81544 1.61316
4 0.85780 0.88835 0.56386
5 1.78972 0.93192 1.67682
Una divergencia lenta, ya que I g' (x) I toma valores mayores de 1 en algunos puntos.
La condición de que el valor absoluto de g' (x) sea menor que 1en la región que com-
prende la raíz buscada x y los valores xi' se interpreta geométricamente a continuación.
En caso de contar con software comercial pueden graficarse las funciones g' (x) co-
rrespondientes a los incisos a) y b) y la recta y = x, y observar los valores de g' (x) en
las Xi del proceso iterativo.
INTERPRETACIÓN GEOMÉTRICA DE I g' (X) 1<1
Al graficar los dos miembros de la ecuación 2.2 como las funciones y = x y y = g (x), la
raíz buscada x es la abscisa del punto de cruce de dichas funciones (véase Fig. 2.2).
El proceso 2.5 queda geométricamente representado en la figura 2.2, la cual muestra
un caso de convergencia, ya que I g' (x) I es menor que 1 en xo, xl"" X .
Para ver esto se trazan las tangentes a g (x) en (xo, xl)' (xl' x2), ... y se observa que to-
das tienen un ángulo de inclinación menor que la función y = x cuya pendiente es 1.
Fi
eL
conv
díve,
L
10-3, se
tos.
ue com-
ción.
x) co-
(x) en
(x), la
).
uestra
que ta-
l.
Figura 2.2
Interpretación
geométrica de
I g' (x) 1> 1. y
Solución de ecuaciones no lineales 39
y
y=x
y = g(x)
y
A continuación se presentan geométricamente los casos posibles de convergencia y diver-
gencia.
y
y
Figura 2.3
Cuatro casos
posibles de
convergencia y
divergencia en
la iteración
x= 9 (x).
y=X
y = g(x)
xo x
a) Convergencia monotónica
y = g(x)
y
y=x
x X
o XI x3
X
e) Divergencia mono tónica
y
y=x
y = g(x)
b) Convergencia oscilatoria
x3
xI i X
o x2
d) Divergencia oscilatoria
X
X
Figura 2.2
Interpretación
geométrica de
I g' (x) 1> 1.
Figura 2.3
Cuatro casos
posibles de
convergencia y
divergencia en
la iteración
x= 9 (x) .
Solución de ecuaciones no lineales 39
y
y = x
y =g(x)
y r y
A continuación se presentan geométricamente los casos posibles de convergencia y diver-
gencia.
y y
y = X
y = X
y =g(x)
"
x x
a) Convergencia monotónica b) Convergencia oscilatoria
y =g(x)
y
y
y=x
, ,
, ,
, ,
I I
I I
, ,
, ,
x X
o
XI x 2 x 3 X x3 X I X Xo x2
X
c) Divergencia monotónica d) Divergencia oscilatoria
40
Solución
Métodos numéricos aplicados a la ingeniería
Caso 1. La figura 2.3a ilustra qué ocurre si g' (x) se encuentra entre Oy l. Incluso
si X
o esta lejos de la raíz x -que se encuentra en el cruce de las curvas y =
x, y = g (x)- los valores sucesivos Xi se acercan a la raíz por un solo lado.
Esto se conoce como convergencia monotónica.
Caso 2. La figura 2.3b muestra la situación en que g' (x) está entre -1 y O.Aun si
X
o está alejada de la raíz x ,los valores sucesivos xi se aproximan por el
lado derecho e izquierdo de la raíz. Esto se conoce como convergencia
oscilatoria.
Caso 3. En la figura 2.3c se ve la divergencia cuando s' (x) es mayor que 1. Los
valores sucesivos Xi se alejan de la raíz por un solo lado. Esto se conoce
como divergencia monotónica.
Caso 4. La figura 2.3d presenta la divergencia cuando g' (x) es menor que -1. Los
valores sucesivos Xi se alejan de la raíz oscilando alrededor de ella. Esto se
conoce como divergencia oscilatoria.
Un excelente ejercicio es crear ecuaciones f (x) = O, obtener para cada una de ellas varias
alternativas de x = g(x) y graficarlas para obtener el punto de intersección (aproximación
de la raíz); obtener las correspondientes g' (x) y graficarlas alrededor del punto de inter-
sección. Una vez hecho esto se puede ver si alrededor de la raíz la gráfica de g' (x) queda
dentro de la banda y = -1 YY = 1;de ser así, un valor inicial cercano a la raíz prometería
convergencia. Si la gráfica de g' (x) queda fuera de la banda y = -1, Y = 1no sería reco-
mendable iniciar el proceso iterativo.
Utilizando la ecuación del ejemplo 2.2 elabore las gráficas de las g' (x) de los incisos a
y b. Agregue a las gráficas la banda constituida por y = -1 YY = 1.
20
a) g (x) = ----
x2
+ 2x + 10
g' (x) = -20(2x + 2)
(x2 + 2x + 10)2
Las gráficas de y = g (x) y y = x se intersectan alrededor de x = 1.
Utilizando Matlab o la TI-92 Plus se obtiene la gráfica de s' (x) y la banda y = -1, Y = 1.
x=0 : O . 05 : 2;
dg=-2(f~ (zt'x+2).j(x. ~2+Z;'x+10). ~2;
y=ones (size (x) ) ;
z=-ones (size (x) ) ;
ymin=nanmin (dg)
ymax=nanmax (dg)
Invoque el edi tor Y= • W
Escriba en y1= la expresión de g' (x):
Y1=-2~ (Z;'x+2)/ (x~2+zt'x+10) ~2
Escriba en y2= la cota inferior: y2=-1
Escriba en y3= la cota inferior: y3= 1
MUestre la gráfica con acercamiento
nonnal (F2 6).
Haga un acercamiento (F2 2.J)if ymin > -1
40
Solución
Métodos numéricos aplicados a la ingeniería
Caso 1. La figura 2.3a ilustra qué ocurre si g' (x) se encuentra entre Oy 1. Incluso
si X
oesta lejos de la raíz x -que se encuentra en el cruce de las curvas y =
x, y = g (x)-los valores sucesivos Xi se acercan a la raíz por un solo lado.
Esto se conoce como convergencia monotónica.
Caso 2. La figura 2.3b muestra la situación en que g' (x) está entre -1 y O. Aun si
X
o está alejada de la raíz x , los valores sucesivos xi se aproximan por el
lado derecho e izquierdo de la raíz. Esto se conoce como convergencia
oscilatoria.
Caso 3. En la figura 2.3c se ve la divergencia cuando g' (x) es mayor que 1. Los
valores sucesivos Xi se alejan de la raíz por un solo lado. Esto se conoce
como divergencia monotónica.
Caso 4. La figura 2.3d presenta la divergencia cuando g' (x) es menor que -1. Los
valores sucesivos X i se alejan de la raíz oscilando alrededor de ella. Esto se
conoce como divergencia oscilatoria.
Un excelente ejercicio es crear ecuacionesf (x) = O, obtener para cada una de ellas varias
alternativas de x = g(x) y graficarlas para obtener el punto de intersección (aproximación
de la raíz); obtener las correspondientes g' (x) y graficarlas alrededor del punto de inter-
sección. Una vez hecho esto se puede ver si alrededor de la raíz la gráfica de g' (x) queda
dentro de la banda y = -1 YY = 1; de ser así, un valor inicial cercano a la raíz prometería
convergencia. Si la gráfica de g' (x) queda fuera de la banda y =-1, Y = 1 no sería reco-
mendable iniciar el proceso iterativo.
Utilizando la ecuación del ejemplo 2.2 elabore las gráficas de las g' (x) de los incisos a
y b. Agregue a las gráficas la banda constituida por y = - 1 YY = 1.
20
a) g (x) = - - --
x2 +2x+1O
g' (x) = -20(2x + 2)
(x2 + 2x + 10)2
Las gráficas de y =g (x) y y =x se intersectan alrededor de x = 1.
Utilizando Matlab o la TI-92 Plus se obtiene la gráfica de g' (x) y la banda y =-1, Y =1.
x=0 : O . 05 : 2;
dg= -2(J~ (zt'x+2). / (x. ~2+Z;'x+10) . ~2;
y=ones (size (x) ) ;
z~ones (size (x) ) ;
ymin=nanmin (dg) ;
ymax=nanmax (dg)
if ymin > - 1
Invoque el eJi tor Y= • W
Escriba en yl= la expresión de g ' (x):
Yl=-2~ (zt'x+2) / (x ~2+Z;'x+lO) ~2
Escriba en y2= la cota inferior: y2=-1
Escriba en y3= la cota inferior: y3= 1
MUestre la gráfica con acercamiento
normal (F2 6).
Haga un acercamiento (F2 2.J )
c1uso
as y =
lado.
. Los
sto se
as varias
irnación
de inter-
x) queda
ometería
ría reco-
isos a
I,y = 1.
(x) :
y2=-1
y3= 1
to
Solución de ecuaciones no lineales 41
ymin= -1.1;
end
if ymax < 1
ymax=1.1 ;
end
plot (x, dg, 'k')
hold on
plot (x, y, 'k')
plot (x, z, 'k')
axis ([O 2 ymin ymax])
0.8
0.6
004
0.2
O
-0.2
~A~ ----------------¡
-0.6
-0.8
-1L-~ __ ~ __ -L __ -L __ J-__~ __ L-~ __ ~ __ ~
O 0.2 004 0.6 0.8 1.2 lA 1.6 1.8 2
Como puede verse, la gráfica de g' (x) alrededor de Xo = 1 queda dentro de la banda y =
1, Y = -1, por lo que un valor inicial dentro del intervalo (0, 2) prometería convergencia, la
cual se daría en caso de que la sucesión XÜ' xi' x2' ... xi"" sea tal que g' (x) se mantenga
en dicha banda.
b) g (x) = x3 + 2x2 + llx - 20
g' (x) = 3x2
+ 4x + 11
Xo = 1
Utilizando el guión de Matlab anterior con el cambio (o el correspondiente para la TI-92
Plus)
dg = 3*x.
A
2 + 4*x + 11
se obtiene:
ymin= - 1 . 1 ;
end
if ymax < 1
ymax=1 . 1 ;
end
plot (x, dg, 'k ')
hold on
plot (x , y , 'k ' )
plot (x, z, 'k ' )
axis ( [O 2 ymin ymax])
0.8
0.6
0.4
0.2
O
- 0.2
Solución de e cuaciones no lineales 41
-O.4 r--_ _ __ _ __ - ------1
- 0.6
-0.8
- 1
O 0.2 0.4 0.6 0.8 1.2 1.4 1.6 1.8 2
Como puede verse, la gráfica de g' (x) alrededor de X
o == 1 queda dentro de la banda y ==
1, Y == -1, por lo que un valor inicial dentro del intervalo (O, 2) prometería convergencia, la
cual se daría en caso de que la sucesión XO' xl' x2' ... Xi''' ' sea tal que g' (x) se mantenga
en dicha banda.
b) g (x) == x3 + 2x2 + llx - 20
g' (x) == 3x2 + 4x + 11
Xo== 1
Utilizando el guión de Matlab anterior con el cambio (o el cOtTespondiente para la TI-92
Plus)
dg == 3*x.
A
2 + 4*x + 11
se obtiene:
42 Métodos numéricos aplicados a la ingeniería
30
25
20
15
10
5
O
O 0.2 0.4 0.6 0.8 1.2 1.4 1.6 1.8 2
Como se puede observar, la gráfica de g' (x) queda totalmente fuera de la banda y = -1, Y =
1, por lo que no es recomendable utilizar esta g(x).
Si por otro lado ensayamos la forma equivalente
_x3 - 2x2 + 20
g(x) = con
10
, () -3x2
- 4x
g x =----
10
La gráfica queda ahora:
0.5
O
-1
0.2 0.4 0.6 0.8 1.2 1.4 1.6 1.8 2
--0.5
-1.5
Solución de ecuaciones no lineales 43
Podría pensarse que al tomar un valor inicial dentro de la banda, por ejemplo X
o = 1
tendríamos posibilidades de convergencia. No obstante, en el proceso iterativo (ver ejem-
plo 2.2), se observa una divergencia oscilatoria. Explíquela utilizando la segunda tabla del
ejemplo 2.2 y la gráfica anterior. I
ORDEN DE CONVERGENCIA
Ahora se verá que la magnitud de g' (x) no sólo indica si el proceso converge o no, sino
que además puede usarse como indicador de cuán rápida es la convergencia.
Sea E i el error en la i-ésima iteración; esto es
Ei =xi-x
Si se conoce el valor de la función g (x) y sus derivadas en X, puede expanderse g (x) al-
rededor de x en serie de Taylor y encontrar así el valor de g (x) en Xi
( - )2 (- )3
() ()
'() ( ) 11 ( ) Xi - X + '" (x-) Xi - X
g Xi = g x + g X Xi - X + g x 2! g 31 + oo.
o bien
, ,, (x¡ - x ? '" _ (x¡ - X )3
g (x) - g (x ) = g (x) (x¡ - x) + g (x ) + g (x ) + ...
2! 3!
Como
X¡+I = g (x)
y
x = g (x),
también puede escribirse la última ecuación como
E2 E3
X. -x=g' (x) E + gil (X)_l_+g"' (X)_l_+ oo.
1+1 , 2! 3!
El miembro de la izquierda es el error en la (i + 1) -ésima iteración y, por tanto, se expre-
sa como E i+ 1 de modo que
E2 E3
E '+1= g' (x) E.+ g" (x) -'-+ gil' (x) -'-+ oo.
1 , 2! 3!
(2.11)
donde puede observarse que si después de las primeras iteraciones E i tiene un valor pe-
queño ( 1 E ¡ 1 < 1), entonces El, 1 E? 1, E ¡4,... serán valores más pequeños que 1 E i 1, de
modo que si g' (x) 7:- O, la magnitud del primer término de la ecuación 2.11 generalmente
domina las de los demás términos y E i+1 es proporcional a E ¡; en cambio si g' (x) = OYg"
(x) 7:- O, la magnitud del segundo término de la ecuación 2.11 predomina sobre la de los
términos restantes y Ei+1es proporcional a El. Si g' (x) = gil (x) = OY gil' (x):t;: O, E¡+I
es proporcional a E ?, etcétera.
Se dice entonces que en caso de convergencia, el proceso 2.5 tiene orden uno si g' (x)
7:- O, orden dos si g' (x) = O Yg" (x) 7:- O, orden tres si g' (x) = g" (x) = O Y g'" (x) 7:- O,
etc. Una vez determinado el orden n se tiene que E i+1 oc E t y el error E ¡+Iserá más peque-
ño que E ¡entre más grande sea n y la convergencia por tanto más rápida.
Soluc ión de ecuaciones no lineale s 43
Podría pensarse que al tomar un valor inicial dentro de la banda, por ejemplo X
o= 1
tendríamos posibilidades de convergencia. No obstante, en el proceso iterativo (ver ejem-
plo 2.2), se observa una divergencia oscilatoria. Explíquela utilizando la segunda tabla del
ejemplo 2.2 y la gráfica anterior. I
ORDE N DE CONVE RGENCIA
Ahora se verá que la magnitud de g' (x) no sólo indica si el proceso converge o no, sino
que además puede usarse como indicador de cuán rápida es la convergencia.
Sea E i el error en la i-ésima iteración; esto es
E; = xi-x
Si se conoce el valor de la función g (x) y sus derivadas en X, puede expanderse g (x) al-
rededor de x en serie de Taylor y encontrar así el valor de g (x) en x;
( - )2 ( - )3
g (x) - g ( x- ) + g' (x- ) (x x-) + g" (x- ) Xi - X + g'" (x- ) Xi - X
i - i - 2! 31 + ...
o bien
, ,, (Xi - X )2 '" _ (Xi - X )3
g (x) - g (x ) =g (x) (Xi - x) + g (x) + g (x) + ...
2! 3!
Como
Xi+1 = g (x)
y
x =g (x),
también puede escribirse la última ecuación como
E 2 E 3
x· -x = g' (X)E + g" (x) - '- +g'" (x) - ' -+ ...
,+ 1 , 2! 3!
El miembro de la izquierda es el error en la (i + 1) -ésima iteración y, por tanto, se expre-
sa como E i+ 1 de modo que
E 2 E 3
E .+1 =g' (x ) E . + g" (x ) - ' - + g'" (x) - '- + ...
, , 2! 3!
(2.11)
donde puede observarse que si después de las primeras iteraciones E i tiene un valor pe-
queño ( 1 E i 1< 1), entonces El, 1 E? 1, E i4,... serán valores más pequeños que 1 E i 1, de
modo que si g' (x) 7:- O, la magnitud del primer término de la ecuación 2.11 generalmente
domina las de los demás términos y E i+l es proporcional a E i; en cambio si g' (x) = OYg"
(x) 7:- O, la magnitud del segundo término de la ecuación 2.11 predomina sobre la de los
términos restantes y E i+l es proporcional a E l. Si g' (x) =g" (x) =OYg'" (x) 7'7 O, E ;+ 1
es proporcional a E ?, etcétera.
Se dice entonces que en caso de convergencia, el proceso 2.5 tiene orden uno si g' (x)
7:- O, orden dos si g' (x) = OYg" (x) 7:- O, orden tres si g' (x) = g" (x) = OYg'" (x) 7:- O,
etc. Una vez determinado el orden n se tiene que E i+1 oc E t y el error E i+1 será más peque-
ño que E i entre más grande sea n y la convergencia por tanto más rápida.
44 Métodos n uméricos aplicados a la ingeniería
Obsérvese que en los ejemplos resueltos g' (x) *- O, Y el orden ha sido uno. Como al ini-
ciar el proceso sólo se cuenta con X
o y algunas formas g (x), puede obtenerse g' (x) para ca-
da forma y las que satisfagan la condición I e' (xo) I < 1 prometerán convergencia. Dicha
convergencia será más rápida para aquéllas donde I s' (xo) I sea más cercano a cero y más
lenta entre más próximo esté dicho valor a 1. Así pues, para la ecuación 2.3, las formas 2.4
y el valor inicial X
o = 2 se obtiene, respectivamente:
a) g' (x) = 4x
b) g'(x)~ 4(0r
-10
c) g' (x) = (2x _ 1) 2
d) g' (x) = 4x
, x -1 (4x-l)(4x-1)-(2x2-x-S)4
e) g ( ) - - (4x _ 1)2
y I g' (2) 1=8
y I g' (2) 1=0.1336
y I s' (2) I = 1.111
y I g' (2) I = 8
y I g' (2) I =0.08163
Las formas de los incisos b) y e) quedan con posibilidades de convergencia, y la e) como
la mejor opción porque su valor está más cercano a cero.
Se deja al lector encontrar una raíz real de la ecuación 2.3 con el método de punto fi-
jo, con la forma e) y detener la iteración una vez que If(x) I ~ 10-4,en caso de convergen-
cia, o desde un principio si observa divergencia en las primeras iteraciones.
2.2 Método de Newton-Raphson
Ahora se estudiará un método de segundo orden de convergencia cuando se trata de raíces
reales no repetidas. Consiste en un procedimiento que lleva la ecuación f (x) = O a la for-
ma x = g (x), de modo que g' (x) = O. Su deducción se presenta enseguida.
En la figura 2.4 se tiene la gráfica de f (x) cuyo cruce con el eje x es una raíz real x .
y
pendiente =f'(xo)
r-~~--------------
11
Figura 2.4
Derivación del
método de
Newton-
Raphson. x X
2
x
44 Métodos numéricos aplicados a la ingeniería
Obsérvese que en los ejemplos resueltos g' (x)"* O, Yel orden ha sido uno. Como al ini-
ciar el proceso sólo se cuenta con X
o y algunas formas g (x), puede obtenerse g' (x) para ca-
da forma y las que satisfagan la condición I g' (xo) I < 1 prometerán convergencia. Dicha
convergencia será más rápida para aquéllas donde I g' (xo) I sea más cercano a cero y más
lenta entre más próximo esté dicho valor a 1. Así pues, para la ecuación 2.3, las formas 2.4
y el valor inicial X
o=2 se obtiene, respectivamente:
a) g' (x) = 4x
b) g' (x) = 4 ( x:5)'"
-10
c) g' (x) =(2x-l) 2
d) g' (x) = 4x
, x -1 (4x-1)(4x-l)-(2x2 -x -S)4
e) g ( ) - - (4x _ 1)2
y Ig' (2) 1=8
y I g' (2) 1=0.1336
y I g' (2) I = Ull
y I g' (2) I =8
y I g' (2) I =0.08163
Las formas de los incisos b) y e) quedan con posibilidades de convergencia, y la e) como
la mejor opción porque su valor está más cercano a cero.
Se deja al lector encontrar una raíz real de la ecuación 2.3 con el método de punto fi-
jo, con la forma e) y detener la iteración una vez que If(x) I ~ 10-4, en caso de convergen-
cia, o desde un principio si observa divergencia en las primeras iteraciones.
2.2 Método de Newton-Raphson
Figura 2.4
Derivación del
método de
Newton-
Raphson.
Ahora se estudiará un método de segundo orden de convergencia cuando se trata de raíces
reales no repetidas. Consiste en un procedimiento que lleva la ecuaciónf(x) = Oa la for-
ma x =g (x), de modo que g' (x) =O. Su deducción se presenta enseguida.
y
En la figura 2.4 se tiene la gráfica de f (x) cuyo cruce con el eje x es una raíz real x .
pendiente =!'(xo)
~~~--------------
x
i.
Solución de ecuaciones no lineales 45
Vamos a suponer un valor inicial X
o que se sitúa en el eje horizontal. Trácese una tan-
gente a la curva en el punto (xo'J (xo») y a partir de ese punto sígase por la tangente hasta
su intersección con el eje x; el punto de corte xI es una nueva aproximación a x (hay que
observar que se ha reemplazado la curva j'(x) por su tangente en (xo,J(xo))' El proceso se
repite comenzando con XI' se obtiene una nueva aproximación x2 y así sucesivamente, has-
ta que un valor XI satisfaga If(x) I ::;;El' I X¡+I- X¡ 1< E o ambos. Si lo anterior no se cum-
pliera en un máximo de iteraciones (MAXIT), debe reiniciarse con un nuevo valor xo'
La ecuación central del algoritmo se obtiene así
Xl = X
o - L1x
La pendiente de la tangente a la curva en el punto (xo,J (xo)) es:
así que
y sustituyendo
en general
f(x)
x. I =x.---=g (x)
1+ 1 f' (x) 1
(2.12)
Este método es de orden 2, porque g' (x) = O Yg" (x) i= O (véase Probo 2.11).
Encuentre una raíz real de la ecuación
f(x) =x3 + 2x2 + lOx- 20
mediante ~l método de Newton-Raphson, X
o = 1, con E = 10-3 aplicado a I x¡+1- Xi I
Solución Se sustituyenf(x) yf' (x) en (2.12)
 1/ X? + 2 x? + 10 Xi - 20
3x? + 4x¡ + 10
Primera iteración
X = 1 _ ( 1 )3 + 2( 1 )2 + 1O( 1 ) - 20 = 1.41176
I 3( 1 )2 + 4( 1 ) + 10
Como XI i= xo' se calcula x2
Segunda iteración
X = 1.41176 ~",-(1.41176)3+ 2(1.41176)2 + 10(1.41176) - 20)= 1.36934
2 3 (1.41176)2 + 4(1.41176) + 10
Solución de ecuaciones no lineales 45
Vamos a suponer un valor inicial X
oque se sitúa en el eje horizontal. Trácese una tan-
gente a la curva en el punto (xo' J (xo») y a partir de ese punto sígase por la tangente hasta
su intersección con el eje x; el punto de corte xI es una nueva aproximación a x (hay que
observar que se ha reemplazado la curvaf(x) por su tangente en (xo,f(xo))' El proceso se
repite comenzando con XI' se obtiene una nueva aproximación x2 y así sucesivamente, has-
ta que un valor X I satisfaga If (x) I::;; El ' Ix¡+ I - x¡ I< E o ambos. Si lo anterior no se cum-
pliera en un máximo de iteraciones (MAXIT), debe reiniciarse con un nuevo valor xo'
La ecuación central del algoritmo se obtiene así
XI =Xo- Llx
La pendiente de la tangente a la curva en el punto (xo,f (xo)) es:
así que
y sustituyendo
en general
(2.12)
f(x)
x· I = x.---= g (x)
1+ 1 f' (x) 1
Este método es de orden 2, porque g' (x) = Oy gil (x) *' O(véase Probo 2.11).
Encuentre una raíz real de la ecuación
f (x) = x3 + 2x2 + lOx - 20
mediante ~l método de Newton-Raphson, X
o = 1, con E = 10-3 aplicado a Ix¡+1 - Xi I
Solución Se sustituyenf (x) yf' (x) en (2.12)
Primera iteración
x? + 2 xl +10 x¡ - 20
3x? + 4x¡ + 10
x = 1 _ ( 1 )3 + 2( 1 )2 + 1O( 1 ) - 20 = 1.41176
I 3( 1 )2 + 4( 1 ) + 10
Como XI *'xo' se calcula x2
Segunda iteración
x = 1.41176 _J1.41176)3+ 2(1.41176)2 + 1O(l.41176) - 20) = l.36934
2 3 (l.41176)2 + 4(1.41176) + 10
46 Métodos numéricos aplicados a la ingeniería
Con este proceso se obtiene la tabla 2.1
Tabla 2.1 Resultados del ejemplo 2.3.
i Xi IXi+1-xil 1 g' (Xi) 1
O 1.00000 0.24221
1.41176 0.41176 0.02446
2 1~ 0.04243 0.00031
3 l.36881 0.00053 4.6774 X 10-8
4 l.36881 0.00000 9.992 X 10-16
Para llevar a cabo los cálculos que se muestran en la tabla anterior, se puede emplear
Matlab o la TI-92 Plus.
Fonnat long
xO=l ;
for I=l : 4
f=xO-3+2i'xO-2+10"xO - 20 ;
df=3*xO-2+4*xO+10;
x=xO - f/df;
dist = abs (x - xO) ;
dg=abs (1 - ((3*x-2+4*x+10) -2 -
(x-3+2i'x-2+10*x-20) * (6*x+4))/
(3*x-2+4*x+ 10) -2);
disp ([x, dist, dg])
xO=x;
end
e2_4 ()
Prgm
Define f (x)=x-3+Zl'x-2+10*x -20
Define df (x) = 3*x-2+4*x+10
Define dg (x) = 1 - (df(x) -2-f
(x) * (6*x+4) ) / df (x)-2
ClrIO: 1.-+xO
For i, 1, 4
xO-f (xO) / df (xO)-+x
abs (x -xO)-+dist
Disp string (x) &" "&string (dist) &"
"&string (abs (dg (x)))
x-+xO
EndFor
EndPrgm
Se requirieron sólo tres iteraciones para satisfacer el criterio de convergencia; además, se
obtuvo una mejor aproximación a x que en el ejemplo 2.2, ya que f (1.36881) se encuen-
tra más cercana a cero que f (1.36906), como se ve a continuación
f(l.36881) = (l.36881)3 + 2(l.36881)2 + 1O(l.36881)-20 = -0.00004
If(1.36881) 1=0.00004 y If(l.36906) I = 0.00531
Hay que observar que x4 ya no cambia con respecto a x3
en cinco cifras decimales y que
g' (x4
) es prácticamente cero.
En el CD encontrará el PROGRAMA 2.7 (Raíces de Ecuaciones), escrito para la versión
6 de Visual Basic. Con este programa se pueden resolver diferentes ecuaciones y obtener
una visualización gráfica de los métodos de Newton-Raphson, de Bisección y de Posición
Falsa; los últimos dos se verán más adelante.
Pan
PAS
PAS
PM
2.
lear
, se
en-
ue
ión
ner
ión
Solución de ecuaciones no lineales 47
ALGORITMO 2.2 Método de Newton-Raphson
Para encontrar una raíz real de la ecuación f (x) = O, proporcionar la función F (X) Y su derivada DF (X) Ylos
DATOS: Valor inicial XO, criterio de convergencia EPS, criterio de exactitud EPSl y número máximo de ite-
raciones MAXIT.
RESULTADOS: La raíz aproximada X o un mensaje de falla.
PASO l. Hacer 1= 1
PASO 2. Mientras 1 < MAXIT, repetir los pasos 3 a 7.
PASO 3. Hacer X = XO - F(XO) / DF (XO) (calcula x.),
PASO 4. Si ABS (X - XO) < EPS, entonces IMPRIMIR X Y TERMINAR. De otro modo CONTINUAR.
PASO S. Si ABS (F (X» < EPS1, entonces IMPRIMIR X Y TERMINAR. De otro modo CONTINUAR.
PASO 6. Hacer 1= 1+ 1.
PASO 7. Hacer XO = X.
PASO 8. IMPRIMIR mensaje de falla "EL MÉTODO NO CONVERGE A UNA RAÍZ" Y TERMINAR.
FALLAS DEL MÉTODO DE NEWTON-RAPHSON
Cuando el método de Newton-Raphson converge se obtienen los resultados en relativa-
mente pocas iteraciones, ya que para raíces no repetidas este método converge con orden
2 y el error E ;+1 es proporcional al cuadrado del error anterior' E r Para precisar más, su-
póngase que el error en una iteración es l O:" , el error siguiente -que es proporcional al
cuadrado del error anterior- es entonces aproximadamente 1O-2n, el que sigue será apro-
ximadamente lO-4n, etc. De esto puede afirmarse que cada iteración duplica aproximada-
. mente el número de dígitos correctos.
Sin embargo, algunas veces el método de Newton-Raphson no converge sino que os-
cila. Esto puede ocurrir si no hay raíz real como se ve en la figura 2.Sa; si la raíz es un pun-
to de inflexión como en la figura 2.Sb, o si el valor inicial está muy alejado de la raíz
buscada y alguna otra parte de la función "atrapa" la iteración, como en la figura 2.Sc.
El método de Newton-Raphson requiere la evaluación de la primera derivada de!(x).
En la mayoría de los problemas de los textos este requisito es trivial, pero éste no es el ca-
so en problemas reales donde, por ejemplo, la función! (x) está dada en forma tabular.
Es importante discutir algunos métodos para resolver! (x) = Oque no requieran el cálcu-
lo de! I (x), pero que retengan algunas de las propiedades favorables de convergencia del
método de Newton-Raphson. A continuación se estudian algunos métodos que tienen es-
tas características y que se conocen como métodos de dos puntos.
2.3 Método de la secante
El método de la secante consiste en aproximar la derivada! I (x) de la ecuación 2.12 por
el cociente"
* Véase Probo 2.13.
*. Nótese que este cociente es la derivada numérica de f (x).
Solución de ecuacion es no lineales 47
ALGORITMO 2.2 Método de Newton-Raphson
Para encontrar una raíz real de la ecuación! (x) = O, proporcionar la función F (X) Ysu derivada DF (X) Ylos
DATOS: Valor inicial XO, criterio de convergencia EPS, criterio de exactitud EPSl y número máximo de ite-
raciones MAXIT.
RESULTADOS: La raíz aproximada X o un mensaje de falla.
PASO l . Hacer 1 = 1
PASO 2. Mientras 1 < MAXIT, repetir los pasos 3 a 7.
PASO 3. Hacer X = XO - F(XO) / DF (XO) (calcula x¡).
PASO 4. Si ABS (X - XO) < EPS, entonces IMPRIMIR X YTERMINAR. De otro modo CONTINUAR.
PASO s. Si ABS (F (X» < EPS1, entonces IMPRIMIR X YTERMINAR. De otro modo CONTINUAR.
PASO 6. Hacer 1= 1 +1.
PASO 7. Hacer XO = X.
PASO 8. IMPRIMIR mensaje de falla "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR.
FALLAS DEL MÉTODO DE NEWTON-RAPHSON
Cuando el método de Newton-Raphson converge se obtienen los resultados en relativa-
mente pocas iteraciones, ya que para raíces no repetidas este método converge con orden
2 y el error E i+l es proporcional al cuadrado del error anterior' E i. Para precisar más, su-
póngase que el error en una iteración es 1O-1l
, el error siguiente -que es proporcional al
cuadrado del error anterior- es entonces aproximadamente 10-2/1 , el que sigue será apro-
ximadamente lO-4n, etc. De esto puede afirmarse que cada iteración duplica aproximada-
.. mente el número de dígitos correctos.
Sin embargo, algunas veces el método de Newton-Raphson no converge sino que os-
cila. Esto puede ocurrir si no hay raíz real como se ve en la figura 2.Sa; si la raíz es un pun-
to de inflexión como en la figura 2.Sb, o si el valor inicial está muy alejado de la raíz
buscada y alguna otra parte de la función "atrapa" la iteración, como en la figura 2.Sc.
El método de Newton-Raphson requiere la evaluación de la primera derivada def(x).
En la mayoría de los problemas de los textos este requisito es trivial, pero éste no es el ca-
so en problemas reales donde, por ejemplo, la funciónf(x) está dada en forma tabular.
Es importante discutir algunos métodos para resolverf(x) =Oque no requieran el cálcu-
lo def I (x) , pero que retengan algunas de las propiedades favorables de convergencia del
método de Newton-Raphson. A continuación se estudian algunos métodos que tienen es-
tas características y que se conocen como métodos de dos puntos.
2.3 Método de la secante
El método de la secante consiste en aproximar la derivadaf I (x) de la ecuación 2.12 por
el cociente**
*VéaseProb.2.13.
*. Nótese que este cociente es la derivada numérica de/ex).
- - - - - - - - - - - - - - - - - - -
48 Métodos numéric os aplicados a la ingeniería
Figura 2.5.
Funciones
donde puede
fallar el método de
Newton-Raphson.
y
f(x)
a) Raíces complejas
y
f(x)
»>
x
b) rcx) = O
y
f(x)
c) Valor inicial muy lejos de la raíz
formado con los resultados de las dos iteraciones anteriores x¡_, y xi. De esto resulta la
fórmula
(x-x,)f(x)
1 1- 1 = g (x)
f(x) - f(x¡_l)
(2.13)
Para la primera aplicación de la ecuación 2.13 e iniciar el proceso iterativo, se requerirán
dos valores iniciales: X
o y x,: La siguiente aproximación, x2
' está dada por:
• Que pueden obtenerse por el método de punto fijo.
48 Métodos numéricos aplicados a la ingeniería
f (x)
y
y
Figura 2.5.
Funciones
donde puede
fallar el método de
Newton-Raphson.
f(x)
----
x
a) Raíces complejas b) rCx) =O
f(x )
y
c) Valor inicial muy lejos de la raíz
formado con los resultados de las dos iteraciones anteriores X¡_ I Yxi. De esto resulta la
fórmula
(x - X _ I ) f (x)
1 1 1 = g (x)
f(x) - f(x¡_,)
(2.13)
Para la primera aplicación de la ecuación 2.13 e iniciar el proceso iterativo, se requerirán
dos valores iniciales: Xoy xI : La siguiente aproximación, x2' está dada por:
• Que pueden obtenerse por el método de punto fijo.
f(x)
esulta la
(2.13)
querirán
Solución de ecuaciones no lineales 49
y así sucesivamente hasta que g (x) "" x¡+1 o una vez que
o
Use el método de la secante para encontrar una raíz real de la ecuación polinominal
.f (x) = x3 + 2x2
+ lOx - 20 = O
Solución Con la ecuación 2.13 se obtiene
X¡+I = Xi - (3 2 2 10 20) (3 2 2 10 20)Xi + Xi + X¡ - - X i-I + X ¡_I + X¡_I-
Mediante Xo = OYXI = 1 se calcula x2
x
2
=1- (1-0)(13
+2(1)2+10(1)-20) =1.53846
(13 + 2(1)2 + 10 (1) - 20) - (03 + 2 (0)2 + 10(0) - 20)
Los valores de las iteraciones subsecuentes se encuentran en la tabla 2.2. Si bien no se con-
vergió a la raíz tan rápido como en el caso del método de Newton-Raphson, la velocidad
de convergencia no es tan lenta como en el método de punto fijo (véase ejemplo 2.2); enton-
ces se tiene para este ejemplo una velocidad de convergencia intermedia.
Tabla 2.2 Resultados del ejemplo 2.4.
X¡ IX¡+I -Xi I
O 0.00000
1 1.00000 1.00000
2 1.53846 0.53846
3 1.35031 0.18815
4 1.36792 0.01761
5 1.36881 0.00090
IX¡+ 1 - X¡ I ~ E = 10-3

Para llevar a cabo los cálculos que se muestran en la tabla anterior, puede emplearse el si-
guiente guión de Matlab.
50 Métodos numéricos aplicados a la ingeniería
format long
xO=O ; xl=l;
for i=l : 4
fO = xO-3+2"xO-2+l(Ji'xO-20;
fl = xl-3+2"xl-2+10*xl - 20;
x2 = xl - (xl - xO) *fl / (fl - fO) ;
dist=abs (x2-xl);
disp ([x2, dist))
xO=xl ; xl =x2 ;
end
In
ALGORITMO 2.3 Método de la secante gel
rr
Para encontrar una raíz real de la ecuaciónf(x) = O, dadaf(x) analíticamente, proporcionar la función F (X) Ylos
DATOS: Valores iniciales XO, Xl; criterio de convergencia EPS, criterio de exactitud EPSl y número máxi-
mo de iteraciones MAXIT.
RESULTADOS: La raíz aproximada X o un mensaje de falla.
PASO l. Hacer I = l.
PASO 2. Mientras I < MAXIT, repetir los pasos 3 a 8.
PASO 3. Hacer X=XO - (Xl-XO)*F(XO)/(F(Xl)-F(XO».
PASO 4. Si ABS (X - Xl) < EPS entonces IMPRIMIR X YTERMINAR.
PASO 5. Si ABS (F (X» < EPSI entonces IMPRIMIR X YTERMINAR.
PASO 6. Hacer XO = Xl.
PASO 7. Hacer Xl = X.
PASO 8. Hacer I = I + 1.
PASO 9. IMPRIMIR mensaje de falla "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR.
INTERPRETACiÓN GEOMÉTRICA DEL MÉTODO DE LA SECANTE
Los dos miembros de la ecuación x = g (x) se grafican por separado, como se ve en la fi-
gura 2.6.
Se eligen dos puntos del eje x: X
o y XI como primeras aproximaciones a x .
Se evalúa g (x) en X
o y en XI' Yse obtienen los puntos A y B de coordenadas (xo' g (xo))
y (xl' g (XI))' respectivamente.
Los puntos A y B se unen con una línea recta [secante a la curva y = g (x)] y se sigue
por la secante hasta su intersección con la recta y = x. La abscisa correspondiente al pun-
to de intersección es x2' la nueva aproximación a x .
Para obtener x
3
se repite el proceso comenzando con XI y x2 en lugar de Xo y Xl'
Este método no garantiza la convergencia a una raíz, lo cual puede lograrse con cier-
tas modificaciones que dan lugar a los métodos de posición falsa y de bisección.
F
I
pos
50
iiI
Métodos n u méricos aplicados a la ingeniería
format long
xO=O ; xl=l;
for i=l : 4
fO = xO-3+2"xO-2+1CJ!'xO-20;
fl = xl-3+2"xl-2+1Gt.xl - 20;
x2 = xl - (xl - xO) *fl / (fl - fO) ;
dist=abs (x2-xl);
disp ([x2, dist))
xO=xl ; xl=x2 ;
end
ALGORITM O 2.3 Método de la secante
Para encontrar una raíz real de la ecuación! (x) = 0, dada! (x) analíticamente, proporcionar la función F (X) Ylos
DATOS: Valores iniciales XO, Xl ; criterio de convergencia EPS, criterio de exactitud EPSl y número máxi-
mo de iteraciones MAXIT.
RESULTADOS: La raíz aproximada X o un mensaje de falla.
PASO l. Hacer I = l.
PASO 2. Mientras I < MAXIT, repetir los pasos 3 a 8.
PASO 3. Hacer X=XO - (Xl-XO)*F(XO)/(F(Xl)-F(XO».
PASO 4. Si ABS (X - Xl) < EPS entonces IMPRIMIR X YTERMINAR.
PASO 5. Si ABS (F (X» < EPSI entonces IMPRIMIR X YTERMINAR.
PASO 6. Hacer XO = Xl.
PASO 7. Hacer Xl = X.
PASO 8. Hacer I = I + l.
PASO 9. IMPRIMIR mensaje de falla "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR.
INTERPRETACiÓN GEOMÉTRICA DEL MÉTODO DE LA SECANTE
Los dos miembros de la ecuación x =g (x) se grafican por separado, como se ve en la fi-
gura 2.6.
Se eligen dos puntos del eje x: X
oy XI como primeras aproximaciones a x .
Se evalúa g (x) en Xoy en XI' Yse obtienen los puntos A y B de coordenadas (xo' g (xo))
y (xl' g (XI))' respectivamente.
Los puntos A y B se unen con una línea recta [secante a la curva y = g (x)] y se sigue
por la secante hasta su intersección con la recta y = x. La abscisa correspondiente al pun-
to de intersección es x2' la nueva aproximación a x .
Para obtener x3 se repite el proceso comenzando con XI y x2 en lugar de Xo y XI '
Este método no garantiza la convergencia a una raíz, lo cual puede lograrse con cier-
tas modificaciones que dan lugar a los métodos de posición falsa y de bisección.
los
ero rnáxi-
en la fi-
se sigue
al pun-
Xl'
on cier-
Figura 2.6
Interpretación
geométrica del
método de la
secante.
Solución de ecuaciones no lineales 51
y
y = g(x)
x
2.4 Método de posición falsa
y
Figura 2.7
Método de
posición falsa. A
El método de posición falsa, también llamado de Regula-Palsi, al igual que el algoritmo
de la secante, aproxima la derivada f' (x) de la ecuación 2.12 por el cociente
f (x) - f (x¡_l )
pero en este caso los valores de x¡ y X¡_l se encuentran en lados opuestos de la raíz buscada,
de modo tal que sus valores funcionales correspondientes tienen signos opuestos, esto es:
Se denotan Xi y x¡+l como xD y xi' respectivamente.
Para ilustrar el método se utilizará la figura 2.7 y se partirá del hecho que se tienen
dos valores iniciales xD y x] definidos arriba, y de que la función es continua en (x], xD
).
y
x x
Figura 2.6
Interpretación
geométrica del
método de la
secante.
y
Solución de ecuaciones no lineales 51
y = g(x)
x
2.4 Método de posición falsa
y
Figura 2.7
Método de
posición falsa. A
El método de posición falsa, también llamado de Regula-Falsi, al igual que el algoritmo
de la secante, aproxima la derivada!, (x) de la ecuación 2.12 por el cociente
f(x) - f(Xi
_
1)
pero en este caso los valores de Xi y X i_ 1 se encuentran en lados opuestos de la raíz buscada,
de modo tal que sus valores funcionales correspondientes tienen signos opuestos, esto es:
Se denotan Xi y xi+1 como xD y Xl' respectivamente.
Para ilustrar el método se utilizará la figura 2.7 y se partirá del hecho que se tienen
dos valores iniciales xD y xl definidos arriba, y de que la función es continua en (x/, xD).
y
x x
52 Métodos numéricos aplicados a la ingeniería
Se traza una línea recta que une los puntos A y B de coordenadas (XI,f(XI)) y (xD, f(xD)),
respectivamente. Se reemplazaf(x) en el intervalo (Xl' XD) con el segmento de recta AB yel
punto de intersección de este segmento con el eje X, X
w será la siguiente aproximación a x .
Se evalúaf (xM) y se compara su signo con el de f (xD). Si son iguales, se actualiza xD
sustituyendo su valor con el de xM
; si los signos son diferentes, se actualiza x, sustituyen-
do su valor con el de xM. Nótese que el objetivo es mantener los valores descritos (xD
y Xl)
cada vez más cercanos entre sí y la raíz entre ellos.
Se traza una nueva línea secante entre los puntos actuales A y B, Y se repite el proce-
so hasta que se satisfaga el criterio de exactitud If(XM) I < El tomándose como aproxima-
ción a X el valor último de xM. Para terminar el proceso también puede usarse el criterio
I xD
- Xl I < E. En este caso se toma como aproximación a:i la media entre xD
y xl"
Para calcular el valor de xM
se sustituye xD
por Xi y Xl por xi
_
l
en la ecuación 2.13, con
lo que se llega a
(XD - Xl) f (XD)
f (XD) - f (Xl)
xrf (xD) - xDf (X,)
f (xD) - f (Xl)
(2.14)
el algoritmo de posición falsa.
Ejemplo 2.6 Utilice el método de posición falsa para obtener una raíz real del polinomio
f(x) = x3 + 2x2
+ lOx - 20
Solución Para obtener x, y xD
se puede, por ejemplo, evaluar la función en algunos puntos donde'
este cálculo sea fácil o bien se grafica. Así:
feO) = -20
f(l) =-7
f(-l) = -29
f(2) = 16
De acuerdo con el teorema de Bolzano hay una raíz real, por lo menos, en el intervalo (1,
2); por tanto,
Xl = 1;f(x) =-7
xD = 2 ;f(xD) = 16
Al aplicar la ecuación 2.14 se obtiene xM
X
M
= 2 _ (2 -1) (16) = 1.30435
16 - (-7)
y
f (xM
) = (1.30435)3 + 2(1.30435)2 + 10(1.30435) - 20 = -1.33476
Como f (xM
) < O(igual signo que f (x), se reemplaza el valor de Xl con el de Xw con lo cual
queda el nuevo intervalo como (1.30435, 2). Por tanto:
-Xl = 1.30435 ;f(xl) = -1.33476
xD
= 2;f(xD
) = 16
52 Métodos n u méricos aplicados a la ingeniería
Se traza una línea recta que une los puntosA y B de coordenadas (xl,f(x¡) Y(xD, f(xD»,
respectivamente. Se reemplazaf(x) en el intervalo (xI' xD) con el segmento de recta AB yel
punto de intersección de este segmento con el eje x, xM' será la siguiente aproximación a x .
Se evalúaf(xM) y se compara su signo con el def (xD). Si son iguales, se actualiza xD
sustituyendo su valor con el de xM ; si los signos son diferentes, se actualiza XI sustituyen-
do su valor con el de xM . Nótese que el objetivo es mantener los valores descritos (xD y XI)
cada vez más cercanos entre sí y la raíz entre ellos.
Se traza una nueva línea secante entre los puntos actuales A y B, Yse repite el proce-
so hasta que se satisfaga el criterio de exactitud If(xM) I< cl tomándose como aproxima-
ción a X el valor último de xM. Para terminar el proceso también puede usarse el criterio
IxD - XI I< c. En este caso se toma como aproximación a x la media entre xD y xI"
Para calcular el valor de xM se sustituye xD por Xi y XI por xi_1 en la ecuación 2.13, con
lo que se llega a
el algoritmo de posición falsa.
(XD - XI) f (xD)
f(xD) - f(xl)
X¡j (xD) - xDf (xI)
f (xD ) - f (XI)
Ejemplo 2.6 Utilice el método de posición falsa para obtener una raíz real del polinomio
f(x) =x3 + 2x2 + lOx - 20
(2.14)
Solución Para obtener XI y xD se puede, por ejemplo, evaluar la función en algunos puntos donde '
este cálculo sea fácil o bien se grafica. Así:
feO) = - 20
f(l) =-7
f(-l) = - 29
f(2) = 16
De acuerdo con el teorema de Bolzano hay una raíz real, por lo menos, en el intervalo (1,
2); por tanto,
XI = 1 ;f(x¡) = -7
xD =2 ;f(xD) =16
Al aplicar la ecuación 2.14 se obtiene xM
y
X
M
=2 _ (2 - 1) (16) = 1.30435
16 - (-7)
f (xM
) = (1.30435)3 + 2(1.30435)2 + 10(1.30435) - 20 =-1.33476
Comof(xM) < O(igual signo quef(x¡), se reemplaza el valor de XI con el de xM' con lo cual
queda el nuevo intervalo como (1.30435, 2). Por tanto:
-XI = 1.30435 ;f(xl) =-1.33476
xD =2;f (xD) = 16
(X
D
)),
B yel
nax.
izaxD
tuyen-
D y XI)
proce-
xima-
riterio
3,con
(2.14)
nde
alo (1,
o cual
Solución de ecuaciones no lineales 53
Se calcula una nueva xM
(2 - 1.30435) 16
xM
= 2 = 1.35791 ,
16 - (-1.33476)
f(xM
) = (1.35791)3 + 2(1.35791)2 + 10(1.35791) - 20 = -0.22914
Como f (xM
) < O, el valor actual de XI se reemplaza con el último valor de xM; así el inter-
valo queda reducido a (1.35791, 2). La tabla 2.3 muestra los cálculos llevados a cabo has-
ta satisfacer el criterio de exactitud
If(XM) I < 10-3
Tabla 2.3 Resultados del ejemplo 2.5.
Xl XD XM If(XM} I
O 1.00000 2.00000
1 1.00000 2.00000 1.30435 1.33476
2 1.30435 2.00000 1.35791 0.22914
3 1.35791 2.00000 1.36698 0.03859
4 1.36698 2.00000 1.36850 0.00648
5 1.36850 2.00000 1.36876 0.00109
6 1.36876 2.00000 1.36880 0.00018
Para llevar a cabo los cálculos que se muestran en la tabla anterior puede emplearse Ma-
tlab o la TI-92 Plus.
e2_6 ( )
Prgm
Define f (x)= x"3+2*x"2+10*x-20
ClrIO: 1.-+xi: 2.-+xd: O.OOl-+Eps
Disp " xi xd xm I f(xm) 1"
Loop
xd-f (xd) * (xd-xi) / (f (xd) -f (xi))-+ xm
format (xi, "f5") &" "&format (xd, "f5")-+a
a&" "&forrnat (xm, "f5") &" "-+ a
a&format (abs (f (xm), "f6")-+a
disp a
If abs (f (xm)) < Eps
Exit
,.;tf F(xd) *F(xm) > O Then
xnr-->xi : El se : xrrr+ xd
EndIf
EndLoop
EndPrgm
. format long
xi=l; xd= 2; Eps= 0.001 ;
fi=xi "3+2*xi "2+10*xi-20;
Ed=xd"3+2*xd"2+ 10*xd-20;
fm=l;
while abs (im) > Eps
xm=xd-fd* (xd-xi) / (fd-fi);
fm=xm "3+2*xm"2+1 0*xm-20;
disp ( [xi, xd, xm, abs (fm) ] )
if fd*fm > O xd=xm; fd=fm;
else xi=xm; fi=fm;
end
54 Métodos numéricos aplicados~ª la ingeniería
NOTA El GC proporciona los métodos de punto fijo, Newton-Raphson, posición falsa y bisección,
de modo tal que pueden verse las iteraciones gráfica y numéricamente al resolver una
ecuación dada. También hay calculadoras que disponen de algunos de estos métodos con
los cuales auxiliarse.
ALGORITMO 2.4 Método de posición falsa
Para encontrar una raíz real de la ecuaciónf(x) = 0, dadaf(x) analíticamente, proporcionar la función F (X) Ylos
DATOS:
RESULTADOS:
Valores iniciales XI y XD que forman un intervalo, en donde se halla una raíz x (F (XI) * F
(XD) < O), criterio de convergencia EPS, criterio de exactitud EPSl y número máximo de ite-
raciones MAXIT.
La raíz aproximada X o un mensaje de falla.
PASO 1. Hacer 1 = 1; FI = F (XI); FD = F (XD).
PASO 2. Mientras 1 < MAXIT, repetir los pasos 3 a 8.
PASO 3. Hacer XM = (XI*FD - XD*FI) / (FD - FI); FM = F (XM).
PASO 4. Si ABS (FM) < EPSl, entonces IMPRIMIR XM y TERMINAR.
PASO 5. Si ABS (XD-XI) < EPS, entonces hacer XM = (XD + XI) / 2; IMPRIMIR "LA RAÍZ BUSCADA
ES", IMPRIMIR XM y TERMINAR.
PASO 6. Si FD * FM > 0, hacer XD = XM (actualiza XD) y FD = FM (actualiza FD).
PASO 7. Si FD * FM <0, pacer XI = XM (actualiza XI) y FI = FM (actualiza FI).
PASO 8. Hacer 1 = 1 + 1.
PASO 9. IMPRIMIR mensaje de falla "EL MÉTODO NO CONVERGE A UNA RAÍz" y TERMINAR.
2.5 Método de la bisección
El método de la bisección es muy similar al de posición falsa, aunque algo más simple. Co-
mo en el método de posición falsa también se requieren dos valores iniciales para ambos la-
dos de la raíz, y que sus valores funcionales correspondientes sean de signos opuestos.
En este caso, el valor de xM se obtiene como el punto medio entre XI y xD.
xM = (XI + xD) / 2
Dependiendo de la función que se tenga en particular, el método de la bisección puede con-
verger ligeramente más rápido o más lentamente que el método de posición falsa. Su gran
ventaja sobre el método de posición falsa es que proporciona el tamaño exacto del interva-
lo en cada iteración (en ausencia de errores de redondeo). Para aclarar esto, nótese que en
este método después de cada iteración el tamaño del intervalo se reduce a la mitad; después
de n interaciones, el intervalo original se habrá reducido 2" veces. Por lo anterior, si el in-
tervalo original es de tamaño a y el criterio de convergencia aplicado al valor absoluto de
la diferencia de dos xM consecutivas es E, entonces se requerirán n iteraciones, donde n se
calcula con la igualdad de la expresión
a
-:s: E,
2/1
54 Métodos numéricos aplicados_ª- la ingeniería
NOTA El GC proporciona los métodos de punto fijo, Newton-Raphson, posición falsa y bisección,
de modo tal que pueden verse las iteraciones gráfica y numéricamente al resolver una
ecuación dada. También hay calculadoras que disponen de algunos de estos métodos con
los cuales auxiliarse.
ALGORITMO 2.4 Método de posición falsa
Para encontrar una raíz real de la ecuación f (x) = 0, dadaf(x) af1alíticamente, proporcionar la función F (X) Ylos
DATOS:
RESULTADOS:
Valores iniciales XI y XD que forman un intervalo, en donde se halla una raíz x (F (XI) * F
(XD) < O), criterio de convergencia EPS, criterio de exactitud EPSl y número máximo de ite-
raciones MAXIT.
La raíz aproximada X o un mensaje de falla.
PASO 1. Hacer I =1; PI =F (XI); FD =F (XD).
PASO 2. Mientras I < MAXIT, repetir los pasos 3 a 8.
PASO 3. Hacer XM = (XI*FD - XD*FI) / (FD - FI); FM = F (XM).
PASO 4. Si ABS (FM) < EPSl, entonces IMPRIMIR XM y TERMINAR.
PASO 5. Si ABS (XD-XI) < EPS, entonces hacer XM = (XD + XI) / 2; IMPRIMIR "LA RAÍZ BUSCADA
ES", IMPRIMIR XM y TERMINAR.
PASO 6. Si FD * FM > 0, hacer XD = XM (actualiza XD) y FD = FM (actualiza FD).
PASO 7. Si PO * FM <0, pacer XI =XM (actualiza XI) y PI =FM (actualiza FI).
PASO 8. Hacer 1 = I + 1.
PASO 9. IMPRIMIR mensaje de falla "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR.
2.5 Método de la bisección
El método de la bisección es muy similar al de posición falsa, aunque algo más simple. Co-
mo en el método de posición falsa también se requieren dos valores iniciales para ambos la-
dos de la raíz, y que sus valores funcionales correspondientes sean de signos opuestos.
En este caso, el valor de xM se obtiene como el punto medio entre XI y xD.
xM = (XI + xD) / 2
Dependiendo de la función que se tenga en particular, el método de la bisección puede con-
verger ligeramente más rápido o más lentamente que el método de posición falsa. Su gran
ventaja sobre el método de posición falsa es que proporciona el tamaño exacto del interva-
lo en cada iteración (en ausencia de errores de redondeo). Para aclarar esto, nótese que en
este método después de cada iteración el tamaño del intervalo se reduce a la mitad; después
de n interaciones, el intervalo original se habrá reducido 211
veces. Por lo anterior, si el in-
tervalo original es de tamaño a y el criterio de convergencia aplicado al valor absoluto de
la diferencia de dos xM consecutivas es E, entonces se requerirán n iteraciones, donde n se
calcula con la igualdad de la expresión
a
-:s: E,
2"
bisección,
una
os con
los
(XI) * F
o de ite-
SCADA
pIe. Co-
bas la-
stos.
ede con-
Su gran
interva-
que en
después
si el in-
oluto de
de n se
Solución de ecuaciones no lineales 55
de donde:
In a -In E
n=----
In 2
(2.15)
Por esto se dice que se puede saber de antemano cuántas iteraciones se requieren.
Ejemplo 2.7 Utilice el método de la bisección para obtener una raíz real del polinomio
I(x) = x3 + 2x2 + lOx - 20
Solución Con los valores iniciales obtenidos en el ejemplo 2.6
Xl = 1 ;f(xl) = -7,
xD
= 2 ;f(x~) = 16,
Si E = 10-3, el número de iteraciones n será
n=
lna-lnE
In 2
In (2 - 1) -In 10-3
= 9.96
In 2 .
o bien
n"" 10
Primera iteración
1+2
xM
=--= 1.5
2
f(1.5) = 2.88
Como I(xM) > O (distinto signo de I(Xl»' se remplaza el valor de Xl con el de xM' con lo
cual queda un nuevo intervalo (1, 1.5). Entonces:
XD = l;l(xD) =-7
xD
= l.5 ;f (xD
) = 2.88
Segunda iteración
1 + 1.5 = 1.25
2
y
I(xM
) = -2.42
Como ahora I(xM
) < O (igual signo que I(x), se reemplaza el valor de xD
con el valor de
la nueva xM
; de esta manera queda como intervalo (1.25, 1.5).
La tabla 2.4 muestra los cálculos, llevados a cabo trece veces, a fin de hacer ciertas
observaciones.
El criterio 1xi
+! - Xi' 1~ 10-3
se satisface en diez iteraciones.
Nótese que si E se hubiese aplicado sobre 1I (xM) 1,se habrían requerido 13 iteracio-
nes en lugar de 10. En general, se necesitarán más iteraciones para satisfacer un valor de
E sobre 1I(xM) 1que cuando se aplica a 1x¡+1 - x¡ 1.
Solución d e ecuaciones no lineales 55
de donde:
In a -In E
n=----
In 2
Por esto se dice que se puede saber de antemano cuántas iteraciones se requieren.
Ejemplo 2.7 Utilice el método de la bisección para obtener una raíz real del polinomio
I (x) = x3 + 2x2 + lOx - 20
Solución Con los valores iniciales obtenidos en el ejemplo 2.6
Xl = 1 ;f(xl) =-7,
xD = 2 ;f(x~) = 16,
Si E = 10-3, el número de iteraciones n será
n=
o bien
Primera iteración
lna-lnE
In 2
In (2 - 1) -In 10-3
= 9.96
In 2 .
n"" 10
1+2
xM =-- = l.5
2
I(1.5) = 2.88
(2.15)
Como I (xM ) > O(distinto signo de I (Xl»' se remplaza el valor de Xl con el de xM' con lo
cual queda un nuevo intervalo (1, l.5). Entonces:
Segunda iteración
y
XD = l;f(xD) = -7
xD = 1.5 ;1(xD) = 2.88
1 + 1.5 = l.25
2
I (xM) =-2.42
Como ahoraI (xM) < O(igual signo queI (x¡), se reemplaza el valor de xD con el valor de
la nueva xM
; de esta manera queda como intervalo (l.25, l.5).
La tabla 2.4 muestra los cálculos, llevados a cabo trece veces, a fin de hacer ciertas
observaciones.
El criterio 1xi+! - Xi' 1~ 10-3 se satisface en diez iteraciones.
Nótese que si E se hubiese aplicado sobre 1I (XM) 1, se habrían requerido 13 iteracio-
nes en lugar de 10. En general, se necesitarán más iteraciones para satisfacer un valor de
E sobre 1I (XM) 1 que cuando se aplica a 1 X¡+ ! - X¡ 1.
56 Métodos numéricos aplicados a la ingeniería
Tabla 2.4 Resultados del ejemplo 2.7
i Xl XD XM IXMi -XMi+11 If(XM) I
O 1.00000 2.00000
1 1.00000 2.00000 1.50000
v
2.87500
2 1.00000 1.50000 1.25000 0.25000 2.42188
3 1.25000 1.50000 1.37500 0.12500 0.13086
4 1.25000 1.37500 1.31250 0.06250 1.16870
5 1.31250 1.37500 1.34375 0.03125 0.52481
6 1.34375 1.37500 1.35938 0.01563 0.19846
7 1.35938 1.37500 1.36719 0.00781 0.03417
8 1.36719 1.37500 1.37109 0.00391 0.04825
9 1.36719 1.37109 1.36914 0.00195 0.00702
10 1.36719 1.36914 1.36816 0.00098 0.01358
R
11 1.36816 1.36914 1.36865 0.00049 0.00329
12 1.36865 1.36914 1.36890 0.00025 0.00186
13 1.36865 1.36890 1.36877 0.00013 0.00071
Utilizando el guión de Matlab del ejemplo 2.6, con la modificación apropiada, puede ob-
tenerse la tabla anterior.
2.6 Problemas de los métodos de dos puntos y
orden de convergencia
A continuación se mencionan algunos problemas que se presentan en la aplicación de los
métodos de dos puntos.
1. El hecho de requerir dos valores iniciales. Esto resulta imposible de satisfacer (en
bisección y posición falsa) si se tienen raíces repetidas por parejas (Xl y x2), Q muy
difícil si la raíz buscada se encuentra muy cerca de otra (x3 y x4) (véase Fig. 2.8).
En el último caso, uno de los valores iniciales debe estar entre las dos raíces o de
otra manera no se detectará ninguna de ellas. *
2. Debido a los errores de redondeo f (xM
) se calcula con un ligero error. Esto no es
un problema sino hasta que xM
está muy cerca de la raíz x, y f (xM
) resulta ser po-
sitiva cuando debería ser negativa o viceversa, o bien resulta ser cero.
3. En el método de la secante no hay necesidad- de tener valores iniciales para ambos
lados de la raíz que se busca. Esto constituye una ventaja, pero puede ser peligro-
so, ya que en la ecuación 2.13
.• Para estos casos un graficador con capacidad de acercamiento (zoom) y rastreo (trace) puede ser de ayuda .
. ,
edeob-
ión de los
sfacer(en
2)' o muy
Fig.2.8).
íces o de
a ambos
r peligro-
Solución de ecuaciones nQ lineales 57
la diferencia
y
x
Figura 2.8
Raíces repetidas
por parejas y
muy cercanas
entre sí.
puede causar problemas al evaluar xi_l' pues f (x) y f (Xi_l) no tienen necesariamente sig-
nos opuestos y su diferencia al ser muy cercana a cero producir overflow. Por último, de-
be decirse que en el método de la secante no hay certeza de convergencia.
ORDEN DE CONVERGENCIA
Se determinará el orden de convergencia del método de la secante solamente, ya que para
los demás métodos de dos puntos vistos, se siguen las mismas ideas.
Si, como antes, E i representa el error en la i-ésima iteración
E i-I = Xi_1 - X
E i = Xi-X
Ei+1=Xi+1-X
Al sustituir en la ecuación 2.13 xi+l' Xi' xi_1despejadas de las ecuaciones de arriba, se
tiene:
x + E ¡+1 = X + E i -
(x + E i - X - E i-I) f (E i + X )
f(E¡+x)-f(E¡_1 +x)
o bien
(E¡ - Ei_l)f(E¡ + x)
E. 1 = E . - ----=---'--=----'---
,+ 'f(E¡+x)-f(Ei_l +x)
Si se expande en serie de Taylor af (E i + X ) y f (E ¡-l + x) alrededor de x se tiene:
E
2
f (E i + X ) =f (x ) + E J' (x ) + -' f" (x ) + ...
2!
(2.17)
Figura 2.8
Raíces repetidas
por parejas y
muy cercanas
entre sí.
Solución de ecuaciones nQ lineales 57
la diferencia
y
x
puede causar problemas al evaluar Xi_' puesf (X) Yf (Xi_1) no tienen necesariamente sig-
nos opuestos y su diferencia al ser muy cercana a cero producir overflow. Por último, de-
be decirse que en el método de la secante no hay certeza de convergencia.
ORDEN DE CONVERGENCIA
Se determinará el orden de convergencia del método de la secante solamente, ya que para
los demás métodos de dos puntos vistos, se siguen las mismas ideas.
Si, como antes, Ei representa el error en la i-ésima iteración
E i-l =Xi_1 - X
E; =xi-x
Ei+1=Xi+1-X
Al sustituir en la ecuación 2.13 x¡+, Xi' x¡_l despejadas de las ecuaciones de arriba, se
tiene:
x + Ei+1= X + Ei -
o bien
(x + Ei -x - Ei_1)f(E i + X)
f(E¡+X)-f(E¡_1+ X)
Si se expande en serie de Taylor afeE ¡ + x) Yf(E ;-1 + x ) alrededor de x se tiene:
E 2
f (E ¡ + X ) =f (x ) + EJ f (x ) + -'f ff (x ) + ...
2!
(2.17)
58 Métodos numéricos aplicado s a la ingeniería
E
2
f(E¡_I+x)=f(x)+E¡_¡/'(X)+ 2¡~1 f"(x)+ ...
Sustituyendo estas expansiones en la ecuación 2.17 y como f (x) = O, queda:
(E¡ - E¡_I) (EJ' (x) + E2J" (x )/2! + ... )
E ;+1 = E ¡- --"'----''--'----'-------'---------
(E¡-Ei_I)f' (x)+ ~! (E2¡-E2¡_I)f" (x)+ ...
-.... Factorizando a (E ¡- E ¡_I) en el denominador y cancelándolo con el mismo factor del nu-
merador queda:
(EJ' (x) + E2J" (x )/2! + ... )
E i+1 = E i - --'-------''---------
f' (x) + ~! (Ei + Ei_l)f" (x) + ...
(EJ' (x) + E2J" (x )/2! + ... ) 1 f" (x)
=E- (l+-(Eo+Eo1) + .. .tl
, f' (x ) 2! ' ¡- f' (x )
2.]
Por el teorema binomial:
1 , _ E2if" _ 1 f" (x)
Ei+I=E¡- f'(x-) (EJ (x)+- (x)+ ... )(l--(Ei+E¡) + ... )
2! 2! - f' (x)
1 1 E o
=E¡---(EJ' (X)+-E2J" (x)+ ... --' (E.+E¡ I)f" (x)+ ... )
f' (x) 2! 2! ' -
1 1
= E o- -- (E f' (x) - - E oE o1f" (x) + ... )
, f' (x)' 2!' ,-
1 f" (x)
= 2!E ¡ E ¡-I f' (x) + ...
o bien:
E i E i-i'
f" (x)
f' (x)
1
E =:-
i+1 2!
donde se aprecia que el error en la (i + l)-ésima iteración es proporcional al producto de
los errores de las dos iteraciones previas.
El error en el método de Newton-Raphson está dado así (véase Probo 2.13)
f" (x)
E ,·+1=: E2
2!f' (x) "
donde por comparación puede observarse que el error en el método de la secante es lige-
ramente mayor que en el de Newton-Raphson; por tanto, su orden de convergencia será li-
geramente menor, pero con la ventaja de que no hay que derivar la funciónf(x).
Por otro lado, en los métodos de primer orden el error en la iteración (i + l)-ésima es
proporcional al error de la iteración previa solamente, por lo que puede decirse que los mé-
todos de dos puntos son superlineales (orden de convergencia mayor de uno pero menor
de dos).
58 Métodos numéricos aplicados a la ingeniería
E 2
f( E i_I+X) = f(x)+E¡_¡/'(X)+ 2'~1 f"(x)+ ...
Sustituyendo estas expansiones en la ecuación 2.17 y comof (x) = 0, queda:
(E¡ - E i_ l) (EJ ' (x) + E2J " (x )/2! + ...)
E i+1= E ¡ - ---'-----':.....:...--'-----,-------'---------
(E¡-E¡_¡)f' (x)+ ~! (E 2¡-E 2¡_I)f" (x) + ...
.... Factorizando a (E ¡ - E ¡_ I) en el denominador y cancelándolo con el mismo factor del nu-
merador queda:
(EJ' (x) + E2J" (x )/2! + ...)
E i+1 = E i - ---'----:----'''------ - -
f' (x) + ~! (E i + Ei_l)f" (x) + ...
(EJ' (x) + E2J" (x )/2! + ...) 1 f" (x)
=E- (1+-(Eo+Eo 1) j "(x-) + .. .tl
, f' (x) 2! ' ,-
Por el teorema binomial:
1 , _ E 2if" _ 1 f" (x)
Ei+I=E¡- f'(x-) (EJ (x) +- (x) + ... )(I--(E i +E ¡ I) + ... )
2! 2! - f' (x)
1 1 E o
=E ¡ ---(EJ ' (X)+-E 2J" (x)+ ... --' (E.+E¡ ,)f" (x) + ... )
f' (x) 2! 2! ' -
o bien:
1 1
= E " - - - (E "f' (x) - - E E o1f" (x) + ... )
f' (x) 2! ' ,-
1
E " ' -
i+ 1 2!
f" (x)
f' (x)
donde se aprecia que el error en la (i + 1)-ésima iteración es proporcional al producto de
los errores de las dos iteraciones previas.
El error en el método de Newton-Raphson está dado así (véase Probo 2.13)
f" (x)
E ,.+ 1 '" -'----- E 2
2!f' (x) "
donde por comparación puede observarse que el error en el método de la secante es lige-
ramente mayor que en el de Newton-Raphson; por tanto, su orden de convergencia será li-
geramente menor, pero con la ventaja de que no hay que derivar la funciónf(x) .
Por otro lado, en los métodos de primer orden el error en la iteración (i + 1)-ésima es
proporcional al error de la iteración previa solamente, por lo que puede decirse que los mé-
todos de dos puntos son superlineales (orden de convergencia mayor de uno pero menor
de dos).
.o.)
de
ge-
ti-
es
Solución de ecuaciones no lineales 59
2.7 Aceleración de convergencia
Se han visto métodos cuyo orden de convergencia es uno y dos, o bien un valor interme-
dio (superlineales). Existen métodos de orden 3 (véase Probo 2.14) y de orden superior; sin
embargo, es importante dar otro giro a la búsqueda de raíces reales y averiguar si la con-
vergencia de los métodos vistos se puede acelerar.
MÉTODOS DE UN PUNTO
/
Si en alguno de los métodos vistos se tiene que la sucesión xo' x" x2, ... , converge muy len-
tamente a la raíz buscada, pueden tomarse, entre otras, las siguientes decisiones:
a) Continuar el proceso hasta satisfacer alguno de los criterios de convergencia
prestablecidos.
b) Ensayar con una g (x) distinta; es decir, buscar una nueva g (x) en punto fijo o
cambiar de método.
e) Utilizar la sucesión de valores xo, x" x2, ... para generar otra sucesión: xo', XI"
='....que converja más rápidamente a la raíz x que se busca.
Los incisos a) y b) son suficientemente claros, mientras que la succesión xo', XI" x2', ... de
la parte e) se basa en que en ciertas condiciones de g , (x)," se tiene que
E· I
lím _1+_ = g , (x )
j-+oo E i
(2.18)
donde: E ¡= x¡ - x es el error en la i-ésima iteración.
Para valores finitos de i, la ecuación 2.18 puede escribirse como:
E· I
1+ , (- )
--""g X
E¡
o
(2.19)
o también:
Xi+2 - X "" g , (x) (x¡+1 - x)
Restando la ecuación 2.19 de la 2.20 se tiene:
(2.20)
de donde:
X¡+2 -x¡+1
x¡+1 =».
g' (x) "" (2.21)
Despejando x de la ecuación 2.19
1 - g , (x)
* Véase Problema 2.22.
Solución de ecuaciones no lineales 59
2.7 Aceleración de convergencia
Se han visto métodos cuyo orden de convergencia es uno y dos, o bien un valor interme-
dio (superlineales). Existen métodos de orden 3 (véase Probo 2.14) y de orden superior; sin
embargo, es importante dar otro giro a la búsqueda de raíces reales y averiguar si la con-
vergencia de los métodos vistos se puede acelerar.
MÉTODOS DE UN PUNTO
/
Si en alguno de los métodos vistos se tiene que la sucesión xo' xl' x2, ... , converge muy len-
tamente a la raíz buscada, pueden tomarse, entre otras, las siguientes decisiones:
a) Continuar el proceso hasta satisfacer alguno de los criterios de convergencia
prestablecidos.
b) Ensayar con una g (x) distinta; es decir, buscar una nueva g (x) en punto fijo o
cambiar de método.
e) Utilizar la sucesión de valores xo, xl' x2' ... para generar otra sucesión: xo', XI"
x2', ... que converja más rápidamente a la raíz x que se busca.
Los incisos a) y b) son suficientemente claros, mientras que la succesión xo', XI" x2', ... de
la parte e) se basa en que en ciertas condiciones de g , (x),* se tiene que
E· I
lím _ 1+_ = g , (x )
i-+oo E j
donde: E ¡ = X¡ - x es el error en la i-ésima iteración.
Para valores finitos de i, la ecuación 2.18 puede escribirse como:
E · I
1+ ' ( - )
- - ""g X
E¡
o
X¡+l - X"" g , (x) (x¡ - x)
o también:
X i+2 - X"" g , (x) (x¡+1 - x)
Restando la ecuación 2.19 de la 2.20 se tiene:
de donde:
g' (x) ""
Despejando x de la ecuación 2.19
* Véase Problema 2.22.
X¡+2 - x¡+1
Xi+1 - xi
1 - g , (x)
(2.18)
(2.19)
(2.20)
(2.21)
60 Métodos numér icos aplicados a la ingeniería
E,
sustituyendo la ecuación 2.21 en la última ecuación, se llega a:
x"",x.- (x¡+l-xY
I X¡+2 - 2xi+1 + xi
que da aproximaciones a x a partir de los valores ya obtenidos en alguna sucesión. Lláme-
se a esta nueva sucesión x' o' x' i- x' 2' ...
i:2: O (2.22)
Por ejemplo, x' o requiere de xo' XI' x2, ya que
(Xl - xO)2
X' o = X
o - ----''-----''--
x2 - 2xl + X
o
y así sucesivamente.
Este proceso conducirá, en la mayoría de los casos, a la solución buscada x más rápi-
do que si se siguiera el inciso a); asimismo, evita la búsqueda de una nueva g (x) y el ries-
go de no obtener convergencia con esa nueva g (x). A este proceso se le conoce como
aceleración de convergencia y se presenta como algoritmo de Aitken.
ALGORITMO DE AITKEN
Dada una sucesión de número xo, xi' x2' ... a partir de ella se genera una nueva sucesión
x' o' x' l' x' 2" .. con la ecuación 2.22.
Si se emplea la notación
b.x¡ = Xi+l -Xi' i = 0,1,2, ...
donde b. es un operador" de diferencias cuyas potencias (o más propiamente su orden) se
pueden obtener así
o
la ecuación 2.22 adquiere la forma simplificada
(2.23)
• Véase capítulo 5.
60 Métodos numéricos aplicados a la ingeniería
sustituyendo la ecuación 2.21 en la última ecuación, se llega a:
_ (X¡+I -xix "" x· - ---=--'-'---'--
, X¡+2 - 2x¡+ 1 + X¡
que da aproximaciones a x a partir de los valores ya obtenidos en alguna sucesión. Lláme-
se a esta nueva sucesión x' o' x' l' x'2' ...
x ' ¡ = X¡ ___(x-"c.:.·+:.-l_-_x-,-¡)_2_
X¡+2 - 2x¡+1 + X¡
i;::: ° (2.22)
Por ejemplo, x' orequiere de x o' XI' x 2' ya que
(XI - x O)2
x'o=X
o- --'----"--
x2 - 2x¡ + Xo
y así sucesivamente.
Este proceso conducirá, en la mayoría de los casos, a la solución buscada x más rápi-
do que si se siguiera el inciso a); asimismo, evita la búsqueda de una nueva g (x) y el ries-
go de no obtener convergencia con esa nueva g (x). A este proceso se le conoce como
aceleración de convergencia y se presenta como algoritmo de Aitken.
ALGORITMO DE AITKEN
Dada una sucesión de número X
o' x" X
2
, ... a partir de ella se genera una nueva sucesión
x' o' x' J' x' 2' .. . con la ecuación 2.22.
Si se emplea la notación
i =0,1,2,...
donde Ll es un operador' de diferencias cuyas potencias (o más propiamente su orden) se
pueden obtener así
o
la ecuación 2.22 adquiere la forma simplificada
(2.23)
• Véase capítulo 5.
Solución de ecuaciones no lineales 61
Ejemplo 2.8 Acelerar la convergencia de !~sucesión del ejemplo 2.2, mediante el algoritmo de Aitken.
Solución Con la ecuación 2.22 o 2.23 con X
o = 1, XI = 1.53846, x2
= 1.29502 se tiene:
x' = 1 _ (1.53846 - 1)2 = 1.37081
o 1.29502 - 2(1.53846) + 1
Ahora, con la ecuación 2.22 y con XI = 1.53846, x2 = 1.29502 Yx3 = 1.40183, resulta:
x' = 1.53846 _ (1.29502 -1.53846)2 = 1.36566
I 1.40183 - 2(1.29502) + 1.53846
En una tercera iteración se obtiene:
X' 2 = 1.36889
Obsérvese que x' 1 está prácticamente tan cerca de la raíz real de la ecuación como el
valor de x6
del ejemplo 2.2, y x' 2 mejora tanto la aproximación que es preciso compa-
rar este valor con el de x3 del ejemplo 2.4. La comparación puede establecerse median-
te If(x') Iy If(x) 1.
Se ha encontrado que el método de Aitken es de segundo orden' y se emplea normal-
mente para acelerar la convergencia de cualquier sucesión de valores que converge li-
nealmente, cualquiera que sea su origen. La aplicación del método de Aitken a la
iteración de punto fijo da el procedimiento conocido como método de Steffensen, que se
ilustra a continuación.
Encuentre una raíz real de la ecuación
f(x)=x3
+ 2x2+ 10x-20=0
con el método de Steffensen, usando e = 10-3 aplicado a If (x' i) 1.
Solución Se pasa primero la ecuación f (x) = O a la forma g (x) = x. Al igual que en el ejemplo 2.2,
se factoriza x en la ecuación y luego se "despeja".
20
x=-----
x2+2x+1O
Primera iteración
Se elige un valor inicial X
o = 1 Y se calcula Xl y x2
Xl = 1.53846
x2 = 1.29502
Se aplica ahora la ecuación 2.22 para acelerar la convergencia:
x' = 1 _ (1.53846 - 1)2 = 1.37081
o 1.29502 - 2(1.53846) + 1
Como If(x' o) I = (1.37081)3 + 2(1.37081)2 + 10(1.37081) - 20 =
0.04234> 10-3, se pasa a la
• Henrici, P., Elements of Numerical Analysis. John Wiley & SOIlS, lnc. (1964). pp. 91-92.
Solución de ecuaciones no lineales 61
Ejemplo 2.8 Acelerar la convergencia de !~ :;ucesión del ejemplo 2.2, mediante el algoritmo de Aitken.
Solución Con la ecuación 2.22 o 2.23 con Xo=1, xl = 1.53846, x2 = 1.29502 se tiene:
x' = 1 _ (1.53846 - 1)2 = 1.37081
o 1.29502 - 2(1.53846) + 1
Ahora, con la ecuación 2.22 y con XI =1.53846, x2 =1.29502 Yx3 = 1.40183, resulta:
x' = 1.53846 _ (1.29502 _ i1.53846)2 = 1.36566
I 1.40183 - 2(1.29502) + 1.53846
En una tercera iteración se obtiene:
x'2 = 1.36889
Obsérvese que x' I está prácticamente tan cerca de la raíz real de la ecuación como el
valor de x6
del ejemplo 2.2, y x'2 mejora tanto la aproximación que es preciso compa-
rar este valor con el de x3 del ejemplo 2.4. La comparación puede establecerse median-
te If(x') I y If(xi
) 1.
Se ha encontrado que el método de Aitken es de segundo orden' y se emplea normal-
mente para acelerar la convergencia de cualquier sucesión de valores que converge li-
nealmente, cualquiera que sea su origen. La aplicación del método de Aitken a la
iteración de punto fijo da el procedimiento conocido como método de Steffensen, que se
ilustra a continuación.
Encuentre una raíz real de la ecuación
f(x) = x3 + 2x2 + 10x-20 = 0
con el método de Steffensen, usando e = 10-3 aplicado a If (x' ¡) 1.
Solución Se pasa primero la ecuaciónf (x) = Oa la forma g (x) = x. Al igual que en el ejemplo 2.2,
se factoriza x en la ecuación y luego se "despeja".
20
x =-- -- -
x2+ 2x + 1O
Primera iteración
Se elige un valor inicial X
o= 1 Yse calcula X l y x2
XI = 1.53846
x2 = 1.29502
Se aplica ahora la ecuación 2.22 para ace-Ierar la convergencia:
x' = 1 _ (1.53846 - 1)2 = 1.37081
o 1.29502 - 2(1.53846) + 1
Como If(x' o) I=(1.37081)3 + 2(1.37081)2 + 10(1.37081) - 20 =
0.04234> 10-3, se pasa a la
• Henrici, P., Elements ofNumerical Analysis. John Wiley & Sons, lnc. (1964). pp. 91-92.
62
l
Métodos numéricos aplicados a la ingeniería
Segunda iteración
Con el valor de x' o que ahora se denota como x3
y con la g(x) que se tiene, resulta:
x4 = 1.36792
X
s = 1.36920
PA
Aplicando nuevamente la ecuación 2.22 a x3' xt{Y Xs se llega a:
(1.36792 - 1.37081)2
x' I = x6
= 1.37081 - ---'-----------'---
1.36920 - 2(1.36792) + 1.37081
=1.36881
Luego, con el criterio de exactitud se tiene:
If (x6
) I = 0.0000399 < 10-3
y el problema queda resuelto.
Para llevar a cabo los cálculos, puede usarse Matlab o la TI-92 Plus, con los siguien-
tes programas basados en el algoritmo 2.5
format long
xO=l;eps=O.OOl;
for i=l:lO
xl=20/(xO~2+2*xO+10);
x2=20/(xl~2+2*xl+10);
x=xO-(xl-xO)~2/(x2-2*xl+xO) ;
dist=abs(x-xO) ;
disp ( [xl, x2, xl )
if dist < eps
breek
end
xO=x;
end
e2_9(
Prgm
Define g(x)=20/(x~2+2*x+10)
CirIO: 1.-->xO : li e-Ar+epe
Loop
g (xO) +xl : g (xl) +x?
xO- (xl-xO) ~2/ (x2-2*x1+xO) -->x
Disp format (x, "f5")
If abs (x-xO)<eps
Exit
x-->xO
EndLoop
EndPrgm
2
A continuación se da el algoritmo de Steffensen.
ALGORITMO 2.5 Método de Steffensen
Para encontrar una raíz real de la ecuación g (x) = x, proporcionar la función G(X) y los
DATOS:
RESULTADOS:
Valor inicial XO, criterio de convergencia EPS y número máximo de iteraciones MAXIT.
La raíz aproximada X o un mensaje de falla.
PASO l. Hacer 1 = l.
PASO 2. Mientras 1 < MAXIT, repetir los pasos 3 a 6.
PASO 3. Hacer:
Xl = G(XO)
62 Métodos numéricos aplicados a la ingeniería
Segunda iteración
Con el valor de x'oque ahora se denota como x3 y con la g(x) que se tiene, resulta:
x4 = 1.36792
X
s = 1.36920
Aplicando nuevamente la ecuación 2.22 a x3' x4'Y Xs se llega a:
(1.36792 - 1.37081)2
x' I = x6
= 1.37081 - ---'-------- --'-----
1.36920 - 2(1.36792) + 1.37081
=1.36881
Luego, con el criterio de exactitud se tiene:
If (x6
) I = 0.0000399 < 10-3
y el problema queda resuelto.
Para llevar a cabo los cálculos, puede usarse Matlab o la TI-92 Plus, con los siguien-
tes programas basados en el algoritmo 2.5
format long
xO=l ;eps=O.OOl ;
for i=l :lO
xl=20/(xO~2+2*xO+10);
x2=20/(xl~2+2*xl+10);
x=xO- (xl -xO)~2/(x2-2*xl+xO) ;
dis t=abs (x-xO) ;
disp ( [xl , x2, xl)
if dist < eps
break
end
xO=x;
end
e2_9(
Prgm
Define g(x)=20/(x~2+2*x+10)
CirIO: 1.""'xO : 1.e-4-+eps
Loop
g(xO) -+xl: g(xl) -+x2
xO- (xl -xO) ~2/ (x2-2*xl+xO) -+x
Disp format (x, "f5")
If abs (x-xO)<eps
Exit
x->xO
EndLoop
EndPrgm
A continuación se da el algoritmo de Steffensen.
ALGORITMO 2.5 Método de Steffensen
Para encontrar una raíz real de la ecuación g (x) = x, proporcionar la función G(X) y los
DATOS:
RESULTADOS:
Valor inicial XO, criterio de convergencia EPS y número máximo de iteraciones MAXIT.
La raíz aproximada X o un mensaje de falla.
PASO l . Hacer 1 = l.
PASO 2. Mientras 1 < MAXIT, repetir los pasos 3 a 6.
PASO 3. Hacer:
Xl = G(XO)
Solución de ecuaciones no lineales 63
X2 = G(Xl).
X = XO - (XI-XO) '2/ (X2-2*Xl+XO).
PASO 4. SI ABS (X-XO) < EPS, IMPRIMIR X YTERMINAR. De otro modo CONTINUAR.
PASO 5. Hacer 1 = 1 + 1
PASO 6. Hacer XO = X (actualiza XO)
PASO 7. IMPRIMIR mensaje de falla: "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR.
/
MÉTODOS DE DOS PUNTOS
Los métodos de dos puntos bisección y posición falsa garantizan convergencias, pero ya
que puede ser muy lenta en algunos casos, conviene acelerarla. Enseguida se estudia una
modificación de posición falsa que cumple con este cometido.
MÉTODO ILLlNOIS*
Esta técnica difiere del método de posición falsa (véase algoritmo 2.4) en que los valores
(X¡, F¡), (XD, FD) de las sucesivas iteraciones se determinan de acuerdo con las siguientes
reglas:
a) Si FD*FM > O, hacer XD = Xl' FD = F¡
b) Si FD*FM < O,hacer FD = Fd2
Y en ambos casos se sustituye a X¡ con XM y F¡ con FM.
El empleo de FD/2 en lugar de FD evita que uno de los extremos X¡ o XD se manten-
ga fijo (caso frecuente en posición falsa). Esta modificación acelera considerablemente la
convergencia del método. Los valores funcionales Fl' FD empleados conservan sus signos
opuestos. El algoritmo correspondiente puede obtenerse sustituyendo los pasos 6 y 7 en el
algoritmo 2.4 con los incisos (a) y (b), respectivamente, y además un paso donde se susti-
tuye a X¡ con XM y F¡ con FM.
2.8 Búsqueda de valores iniciales
El uso de cualquier algoritmo numérico para encontrar las raíces de f (x) = O,requiere uno
o más valores iniciales; además, en métodos como el de la bisección y el de posición fal-
sa, los dos valores iniciales requeridos deben estar a los lados de la raíz buscada y sus va-
lores funcionales correspondientes tienen que ser de signos opuestos.
A continuación se dan algunos lineamientos generales para obtener valores aproxima-
dos a las raíces de f (x) = O.
1. Por lo general, la ecuación cuyas raíces se buscan tiene algún significado físico;
entonces, a partir de consideraciones físicas pueden estimarse valores aproximados
a las raíces. Este razonamiento es particular para cada ecuación. A continuación se
presenta un ejemplo para ilustrar esta idea .
• Dowel M. and Jarrat P., A Modified Regula Falsi Method for Computing the Root of an Equation. BIT. Vol. II
p. 168 (1971).
Solución de ecuaciones no lineales 63
X2 = G(Xl).
X = XO - (XI-XO) ' 2/ (X2-2*Xl+XO).
PASO 4. SI ABS (X-XO) < EPS, IMPRIMIR X YTERMINAR. De otro modo CONTINUAR.
PASO 5. Hacer 1 = 1 + 1
PASO 6. Hacer XO = X (actualiza XO)
PASO 7. IMPRIMIR mensaje de falla: "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR.
/
MÉTODOS DE DOS PUNTOS
Los métodos de dos puntos bisección y posición falsa garantizan convergencias, pero ya
que puede ser muy lenta en algunos casos, conviene acelerarla. Enseguida se estudia una
modificación de posición falsa que cumple con este cometido.
MÉTODO ILLlNOIS*
Esta técnica difiere del método de posición falsa (véase algoritmo 2.4) en que los valores
(XI' F¡), (XD, FD) de las sucesivas iteraciones se determinan de acuerdo con las siguientes
reglas:
a) Si FD*FM > 0, hacer X D = X I' FD = FI
b) Si FD*FM < 0, hacer FD = FJ2
Yen ambos casos se sustituye a XI con X M y FI con FM.
El empleo de FD/2 en lugar de FD evita que uno de los extremos XI o X D se manten-
ga fijo (caso frecuente en posición falsa). Esta modificación acelera considerablemente la
convergencia del método. Los valores funcionales FI' FD empleados conservan sus signos
opuestos. El algoritmo correspondiente puede obtenerse sustituyendo los pasos 6 y 7 en el
algoritmo 2.4 con los incisos (a) y (b), respectivamente, y además un paso donde se susti-
tuye a XI con X M y FI con FM.
2.8 Búsqueda de valores iniciales
El uso de cualquier algoritmo numérico para encontrar las raíces def (x) = 0, requiere uno
o más valores iniciales; además, en métodos como el de la bisección y el de posición fal-
sa, los dos valores iniciales requeridos deben estar a los lados de la raíz buscada y sus va-
lores funcionales correspondientes tienen que ser de signos opuestos.
A continuación se dan algunos lineamientos generales para obtener valores aproxima-
dos a las raíces def(x) =O.
1. Por lo general, la ecuación cuyas raíces se buscan tiene algún significado físico;
entonces, a partir de consideraciones físicas pueden estimarse valores aproximados
a las raíces. Este razonamiento es particular para cada ecuación. A continuación se
presenta un ejemplo para ilustrar esta idea.
• Dowel M. and Jarrat P., A Modified Regula Falsi Methodfor Computing the Root ofan Equation. BIT. Vol. II
p. 168 (1971).
64 Métodos numéricos aplicados a la ingeniería
Determine el valor inicial en la solución de una ecuación de estado.
Solución El cálculo del volumen molar de un gas dado, a cierta presión y temperatura también dadas,
es un problema común en termodinámica. Para realizar dicho cálculo se emplea alguna de
las ecuaciones de estado conocidas. Una de ellas es la ecuación de Beattie-Bridgeman:
RT j3 y 8
P=-+-+-+-
Y y2 v» y4
(2.24)
donde los parámetros j3, y, y 8 quedan determinados al fijar el gas de que se trata, su
temperatura T y su presión P.
En las condiciones expuestas, el problema se reduce a encontrar el o los valores de
y que satisfagan la ecuación 2.24, o en otros términos, a determinar las raíces del poli-
nomio en V.
E
!(Y) = P y4 - R T y3 - j3 y2 - Y Y - 8 = O, (2.25)
que resulta de multiplicar por Y4 la ecuación 2.24 y pasar todos sus términos a un solo
miembro.
La solución de la ecuación 2.25 tiene como primer problema encontrar cuando me-
nos un valor inicial Yocercano al volumen buscado V. Este valor Yo,se obtiene a partir
de la ley de los gases ideales; así:
RT
Yo=-'
P
que generalmente es una primera aproximación razonable.
Como puede verse, el razonamiento es sencillo y se basa en el sentido común y las le-
yes básicas del fenómeno involucrado.
2. Otra manera de conseguir información sobre la función, que permita determinar
valores iniciales "adecuados", consiste en obtener su gráfica aproximada median-
te un análisis de! (x), a la manera clásica del cálculo diferencial e integral, o bien
como se ha venido sugiriendo, con algún software comercial y, en el mejor de los
casos, empleando ambos. A continuación se presentan los pasos del análisis de la
función! (x) y de la construcción de su gráfica en la forma clásica.
a) Determinar el dominio de definición de la función.
b) Determinar un subintervalo de a), que puede ser a) mismo. Es un intervalo donde
se presupone que es de interés analizar la función. Evalúese la función en los si-
guientes puntos de ese subintervalo: puntos extremos y aquéllos donde sea fácil el
cálculo de! (x). En los siguientes pasos todo estará referido a este subintervalo.
e) Encontrar los puntos singulares de la función (puntos en los cuales es infinita o
no está definida).
ti) La primera y la segunda derivadas dan información muy útil sobre la forma de
la función, aun más útil que información de valores computados; por ejemplo,
dan los intervalos de crecimiento y decrecimiento de la función. Por esto, ob-
téngase la primera derivada y evalúese en puntos apropiados, en particular en
puntos cercanos a aquéllos donde la función ya está evaluada y en los que es fá-
cil esta evaluación.
e) Encontrar los puntos máximo y mínimo, así como los valores de la función en
esos puntos.
64 Métodos numéricos aplicados a la ingeniería
Determine el valor inicial en la solución de una ecuación de estado.
Solución El cálculo del volumen molar de un gas dado, a cierta presión y temperatura también dadas,
es un problema común en termodinámica. Para realizar dicho cálculo se e;nplea alguna de
las ecuaciones de estado conocidas. Una de ellas es la ecuación de Beattie··Blidgeman:
RT jJ y 8
P=-+-+-+-
Y y2 y3 y 4
(2.24)
donde los parámetros jJ, y, y 8 quedan determinados al fijar el gas de que se trata, su
temperatura T y su presión P.
En las condiciones expuestas, el problema se reduce a encontrar el o los valores de
y que satisfagan la ecuación 2.24, o en otros términos, a determinar las raíces del poli-
nomio en V.
(2.25)
que resulta de multiplicar por Y4 la ecuación 2.24 y pasar todos sus términos a un solo
miembro.
La solución de la ecuación 2.25 tiene como primer problema encontrar cuando me-
nos un valor inicial Yo cercano al volumen buscado V. Este valor Yo' se obtiene a partir
de la ley de los gases ideales; así:
RT
Yo =- '
P
que generalmente es una primera aproximación razonable.
Como puede verse, el razonamiento es sencillo y se basa en el sentido común y las le-
yes básicas del fenómeno involucrado.
2. Otra manera de conseguir información sobre la función, que permita determinar
valores iniciales "adecuados", consiste en obtener su gráfica aproximada median-
te un análisis de! (x), a la manera clásica del cálculo diferencial e integral, o bien
como se ha venido sugiriendo, con algún software comercial y, en el mejor de los
casos, empleando ambos. A continuación se presentan los pasos del análisis de la
función! (x) y de la construcción de su gráfica en la forma clásica.
a) Determinar el dominio de definición de la función.
b) Determinar un subintervalo de a), que puede ser a) mismo. Es un intervalo donde
se presupone que es de interés analizar la función. Evalúese la función en los si-
guientes puntos de ese subintervalo: puntos extremos y aquéllos donde sea fácil el
cálculo de!(x). En los siguientes pasos todo estará referido a este subintervalo.
e) Encontrar los puntos singulares de la función (puntos en los cuales es infinita o
no está definida).
d) La primera y la segunda derivadas dan información muy útil sobre la forma de
la función, aun más útil que infoffi1ación de valores computados; por ejemplo,
dan los intervalos de crecimiento y decrecimiento de la función. Por esto, ob-
téngase la primera derivada y evalúese en puntos apropiados, en particular en
puntos cercanos a aquéllos donde la función ya está evaluada y en los que es fá-
cil esta evaluación.
e) Enco'1trar los puntos máximo y mínimo, así como los valores de la función en
esos puntos.
Solución de ecuaci ones no lineales 65
f) Los dominios de concavidad y convexidad de la curva, y los puntos de inflexión
es información cualitativa y cuantitativa, que se obtienen a partir de la segunda
derivada y son imprescindibles para este análisis.
g) Obtener las asíntotas de la función. Éstas, en caso de existir, indican cierta re-
gularidad en los comportamientos de la gráfica de y =f (x) al tender x o y hacia
infinito.
h) Descomponer la función en sus partes más sencillas que se sumen o se multipli-
quen. Graficar cada parte y construir la gráfica de la función original, combinan-
do las gráficas de las partes y la información conseguida en los pasos anteriores.
Ejemplo 2.11 Análisis de una función. A continuación se presenta el análisis clásico de la función
f(x) = x - e1-x (1 + In x)
hecho por Pizer.*
Nótese que In x está definida sólo para x> O, así que f (x) está definida sólo en (O, 00).
En este ejemplo ilustrativo, se analiza la función en todo el dominio de definición; es
decir, el intervalo de interés será (O, 00).
Un punto donde es fácil evaluar la función es en x = 1, ya que la parte exponencial y
la parte logarítmica se determinan fácilmente en ese punto.
f(l) = 1 - e1
-
1
(l + In 1) = O
De esta forma, se ha encontrado una raíz de la ecuación Xl = 1.
En x = 10
f(lO) = 10 - e" (l + In 10) "" 10
Enx = 100
f(100) = 100 - e-99
(l + In 100) "" 100
Con esta información puede adelantarse que la función tiene la asíntota y = x, la función
identidad.
Un punto donde la función no está definida es en el extremo x = O. Al analizarlo se ad-
vierte que cuando x -+ O, el In x -+ - 00 y f (x) -+ 00 y se encuentra una asíntota más de la
función, que es la parte positiva del eje y. Por un lado, x -+ 00, In x -+ 00, pero e1-x se acer-
ca más rápidamente a cero y, por tanto, el producto e1-x (l + In x ) tiende a cero, dejando
como resultado global que f (x) -+ =. Se concluye que f (x) -+ 00 cuando x -+ O, o cuando x
-+ =.Comof(x) no tiene otros puntos singulares, se da por terminado el inciso e).
Al calcular la primera y segunda derivadas def(x), se tiene que
f' (x) = 1- e1-x (l/x - 1-In x)
y
f " (x) = e1-x (2/x + l/x2 - 1- In x)
Al evaluar f' (x) en x = 1, se obtiene f' (1) = 1.
Cuando x -+ oo,f' (x) -+ 1.
Lo que se sabe hasta aquí de la función, se muestra en la figura 2.9 a. Como f (x) es
continua (todas las funciones sencillas que la forman lo son) en (O, 00), deberá haber por
lo menos otra raíz de f (x) en (O, 1).
• Stephen, M. Pizer. Numerical Computing and Mathematical Analysis. S.R.A., (1975) pp. 176-179.
Ejemplo 2.11
Solución d e ecuaciones no lineales 65
j) Los dominios de concavidad y convexidad de la curva, y los puntos de inflexión
es información cualitativa y cuantitativa, que se obtienen a partir de la segunda
derivada y son imprescindibles para este análisis.
g) Obtener las asíntotas de la función. Éstas, en caso de existir, indican cierta re-
gularidad en los comportamientos de la gráfica de y = f (x) al tender x o y hacia
infinito.
h) Descomponer la función en sus partes más sencillas que se sumen o se multipli-
quen. Graficar cada parte y construir la gráfica de la función original, combinan-
do las gráficas de las partes y la información conseguida en los pasos anteriores.
Análisis de una función. A continuación se presenta el análisis clásico de la función
f(x) = x - e1- x (1 + In x)
hecho por Pizer.*
Nótese que In x está definida sólo para x> O, así que f (x) está definida sólo en (O, 00).
En este ejemplo ilustrativo, se analiza la función en todo el dominio de definición; es
decir, el intervalo de interés será (O, 00).
Un punto donde es fácil evaluar la función es en x = 1, ya que la parte exponencial y
la parte logarítmica se determinan fácilmente en ese punto.
f (1) = 1 - e1- 1 (l + In 1) = O
De esta forma, se ha encontrado una raíz de la ecuación Xl = l.
En x = 10
f (lO) = 10 - e-9 (1 + In 10) "" 10
Enx = 100
f(lOO) = 100 - e-99 (1 + In 100) "" 100
Con esta información puede adelantarse que la función tiene la asíntota y = x, la función
identidad.
Un punto donde la función no está definida es en el extremo x =O. Al analizarlo se ad-
vierte que cuando x -+ O, el In x -+ - 00 y f (x) -+ 00 y se encuentra una asíntota más de la
función, que es la parte positiva del eje y. Por un lado, x -+ 00, In x -+ 00, pero e1- x se acer-
ca más rápidamente a cero y, por tanto, el producto e1- x (1 + In x) tiende a cero, dejando
como resultado global que f (x) -+ oo. Se concluye que f (x) -+ 00 cuando x -+ O, o cuando x
-+ oo. Comof(x) no tiene otros puntos singulares, se da por terminado el inciso c).
Al calcular la primera y segunda derivadas def(x), se tiene que
f' (x) = 1 - e1- x (l/x - 1 - In x)
y
f" (x) = e1- x (2/x + lIx2 - 1 -In x)
Al evaluarf' (x) en x = 1, se obtienef' (1) = 1.
Cuando x -+ oo,f' (x) -+ l.
Lo que se sabe hasta aquí de la función, se muestra en la figura 2.9 a. Comof (x) es
continua (todas las funciones sencillas que la forman lo son) en (O, 00), deberá haber por
lo menos otra raíz de f (x) en (O, 1).
• Stephen, M. Pizer. Numerical Computing and Mathematical Analysis. S.R.A., (1975) pp. 176-179.
..
66 Métodos nu méricos aplicados a la ingeniería
y

a)
y
e)
y
/
/
/
/
/
/
/
/
/
/
/
/
/
/
Figura 2.9
Construcción
de la gráfica de
f[x) = x - e1-x
(1 + In x). e)
(
x
b)
x
y
y=x
y = x-el
-
x (1 + lnx)
x
El inciso e) del análisis de la función no procede en este caso, ya que sería tan com-
plejo como encontrar las raíces de f (x). En su lugar se analiza la forma de la curva con la
segunda derivada. Evaluando f" (x) en valores muy grandes de x, se tiene que f' I (x) < O,
o sea que la función es convexa para valores muy grandes de x (también se dice que la cur-
va gira su convexidad hacia la parte positiva del eje y). Además, se tienef" (1) = 2, lo que
indica que la función es cóncava en x = 1 (o en otras palabras gira su convexidad hacia la
parte negativa del eje y). La información se muestra en la figura 2.9 b.
Se puede obtener aún más información def(x), analizando las funciones elementales
que la componen, como x, el-x, y 1 + In x. La familiaridad con las gráficas de las funcio-
nes elementales es útil cuando se consideran funciones más complejas. Las partes en que
se puede descomponer f (x) se muestran en la figura 2.9 c. Primero nótese que la gráfica de
1 + In x es la de In x aumentada en una unidad, y que la gráfica de el-x es la de e-X llevada
66
Figura 2.9
Construcción
de la gráfica de
f[x) = x - el - x
(1 + In x).
Métodos numéricos aplicados a la ingeniería
y
 (
a)
x
b)
x
y
y
y=x
e)
y
y =x-el - x (1 + Inx)
x
El inciso e) del análisis de la función no procede en este caso, ya que sería tan com-
plejo como encontrar las raíces def (x). En su lugar se analiza la forma de la curva con la
segunda derivada. Evaluando f // (x) en valores muy grandes de x, se tiene que f // (x) < O,
o sea que la función es convexa para valores muy grandes de x (también se dice que la cur-
va gira su convexidad hacia la parte positiva del eje y). Además, se tiene!, / (1) = 2, lo que
indica que la función es cóncava en x = 1 (o en otras palabras gira su convexidad hacia la
parte negativa del eje y). La información se muestra en la figura 2.9 b.
Se puede obtener aún más información def(x) , analizando las funciones elementales
que la componen, como x, el-x, y 1 + In x. La familiaridad con las gráficas de las funcio-
nes elementales es útil cuando se consideran funciones más complejas. Las partes en que
se puede descomponerf(x) se muestran en la figura 2.9 c. Primero nótese que la gráfica de
1 + In x es la de In x aumentada en una unidad, y que la gráfica de el- x es la de e-X llevada
Solución de ecuaciones no lineales 67
una unidad a la derecha. Multiplicando e1-x y 1 + In x entre sí (Fig. 2.9 d), se ve que este
producto es negativo entre cero y algún valor menor que 1, tiende a cero cuando x aumen-
ta y permanece debajo de y = x para x > 1.
Como la derivada del producto es cero en x = 1, la curva del producto tiene ahí un má-
ximo y el resto de la gráfica puede obtenerse como se ilustra en la figura 2.9 e).
Nótese que los ceros de f (x) son los puntos donde el producto e1-x (1 + In x) y la fun-
ción identidad y = x se intersectan. Esto significa que sólo hay dos raíces de la función.
También puede concluirse que hay una raíz en x = 1 Yotra cerca de x = 0.5, por lo que 0.5
sería un valor. inicial adecuado para calcular esta segunda raíz.
Actualmente se puede recurrir a programas comerciales con facilidades de graficación
para visualizar funciones matemáticas; no obstante, es necesario verlos como auxiliares en
esta tarea y no como algo que permita sustituir el análisis tradicional y mucho menos los
conceptos. Por ejemplo, si graficamos con Matlab la función en el intervalo [-3, 3] obten-
dríamos la figura 2.10.
20
O
-20
-40
-60
-80
-100
-120
Figura 2.10 -3 -2 -1 O 2 3
x = -3:0.1:3;
f = x - exp(l' - x) .*(l+log(x));
plot (x, f, 'k')
Lo cual ciertamente es algo que requiere una lectura en términos de lo que se "ve", de lo
que el programa hace, de los mensajes de error que pudieran darse y de los conceptos in-
volucrados. En este caso, Matlab muestra las siguientes advertencias:
Warning: Log of zero.
> In D: Archivos de programaMatlabbine2_10.m at line 2
Warning: Imaginary parts of complex X and/or y arguments ignored.
> In D: Archivos de programaMatlabbine2_10.m at line 3
La primera significa que se está evaluando la función en x = O,Ycomo ya es sabido, In (O)
no está definido y de ahí la interrupción de la gráfica alrededor de ese punto; de igual ma-
nera, el logaritmo de números negativos genera valores complejos, sin embargo, Matlab
ignora la parte imaginaria de los valores de la función y con la parte real continúa la gra-
ficación. De no haber hecho estas consideraciones pensaríamos que existe gráfica a la iz-
quierda y a la derecha de cero, y además que hay una raíz negativa.
Si se elige el intervalo (O, 5) se obtiene la gráfica de la figura 2.1l.
68 Métodos nu méricos aplicados a la ingeniería
5
4
3
2
o
-1 ~~--~--~~~~--~--~~--~~
Figura 2.11 O 0.5 ~5 2 ~5 3 3.5 4 ~5 5
x=0.05:0.l: 5;
f=x-exp (l-x) .* (l+log (x));
plot (x, f, 'k')
La cual, aunque ya es muy parecida a la mostrada en la figura 2.9 e, no revela por sí mis-
ma, por ejemplo, que es cóncava hacia arriba en el intervalo comprendido entre x = O Y
x '" 1.6, y que es cóncava hacia abajo después de x = 1.6. Lo anterior se puede comprobar
obteniendo la segunda derivada y observando el signo de dicha derivada. En este caso
f 11 (x) = e1-x ( ~ +..!.- - 1 - In x)
x x2
donde puede observarse que en O< x :s; 1 la segunda derivada es positiva; y para algún va-
lor de x alrededor de 1.6, la segunda derivada es negativa y se mantiene con ese signo al
aumentar x. El valor de x, donde la segunda derivada es cero, es el punto donde la curva
cambia de concavidad, y encontrar este valor implica resolver una ecuación no lineal en
una incógnita:f" (x) = O.Resolviendo esta ecuación utilizando como valor inicial 1.6 ob-
servado en la gráfica y con la instrucción
fzero ('exp (l-x) * (2/x+ 1/x-2-1-1og (x)) , ,1.6)
Matlab reporta ans = l. 6952
Podemos apreciar también en la gráfica de la figura 2.11 dos raíces; sin embargo, ¿có-
mo podríamos saber que son las únicas? Una forma sería extender el intervalo de graficación
en el sentido positivo del eje x y/o ver si la función es creciente o si tiene asíntotas. Una for-
ma de auxiliarnos con un graficador sería graficar para valores de x muy grandes, por ejem-
plo [O,200], con lo que se obtiene la gráfica de la figura 2.12.
200r-----~------~------_r----~
150
100
50
-50L-----~------~------~----~
Figura 2.12 O 50 100 150 200
x=O.Ol:O.l: 200;
f=x-exp(l-x) .*(l+log(x));
plot (x, r, 'k')
2.9
Eje
68
Figura 2.11
Figura 2.12
Métodos numéricos aplicados a la ingeniería
x=0.05:0.1: 5;
f=x- exp(l-x) .*(l +log(x));
plot (x, f, 'k')
o 0.5 0.5 2 2.5 3 3.5 4 4.5 5
La cual, aunque ya es muy parecida a la mostrada en la figura 2.9 e, no revela por sí mis-
ma, por ejemplo, que es cóncava hacia arriba en el intervalo comprendido entre x = OY
x '" 1.6, y que es cóncava hacia abajo después de x = 1.6. Lo anterior se puede comprobar
obteniendo la segunda derivada y observando el signo de dicha derivada. En este caso
x =e -+-- -n xf " () l-x (2 1 1 1 )
x x2
donde puede observarse que en O< x :s; 1 la segunda derivada es positiva; y para algún va-
lor de x alrededor de 1.6, la segunda derivada es negativa y se mantiene con ese signo al
aumentar x. El valor de x, donde la segunda derivada es cero, es el punto donde la curva
cambia de concavidad, y encontrar este valor implica resolver una ecuación no lineal en
una incógnita:f" (x) = O. Resolviendo esta ecuación utilizando como valor inicial 1.6 ob-
servado en la gráfica y con la instrucción
fzero( 'exp (l - x)* (2/x+1 /x~2-1-1og(x))' ,1.6)
Matlab reporta ans = l. 6952
Podemos apreciar también en la gráfica de la figura 2.11 dos raíces; sin embargo, ¿có-
mo podríamos saber que son las únicas? Una forma sería extender el intervalo de graficación
en el sentido positivo del eje x y/o ver si la función es creciente o si tiene asíntotas. Una for-
ma de auxiliamos con un graficador sería graficar para valores de x muy grandes, por ejem-
plo [O, 200], con lo que se obtiene la gráfica de la figura 2.12.
200
150
100
50
50
-50
O 50 100 150 200
x=O.Ol:O.l: 200;
f=x- exp (l-x). * (l+log (x));
plot (x, f , 'k')
m
Solución de ecuaciones no lineales 69
Nuevamente una lectura de esta gráfica revela que la función es creciente y que se
acerca a la función y = x; no obstante, es necesario precisar esto como lo hicimos en el aná-
lisis clásico.
Una vez que hayamos determinado las dos asíntotas de las funciones, podemos ase-
gurar que sólo hay dos raíces reales en el intervalo (O, 1.5), cuya obtención puede hacerse
con alguno de los métodos vistos. Con la instrucción Matlab.
fzero('x - exp(1-x).*(1+log(x));0.3)
Se obtiene
ans 0.4967
2.9 Raíces complejas
Hasta ahora se han discutido sólo técnicas para encontrar raíces reales de ecuaciones de la
forma f (x) = O. Sin embargo, a menudo se presentan ecuaciones polinomiales con coefi-
cientes reales, cuyas raíces son complejas, o bien polinomios complejos, y ecuaciones tras-
cendentes con raíces reales y complejas.
Generalmente, dichas ecuaciones pueden resolverse por el método de Newton-Raphson
(Sec. 2.2), pero proponiendo un valor inicial X
o complejo o bien por algún otro método.
MÉTODO DE NEWTON-RAPHSON
Supóngase que se tiene
(2.26)
con todos los coeficiente a¡ reales. f I (x) es un polinomio de grado (n - 1) Y de coeficien-
tes también reales
f I (x) = n anxn
-
l
+ (n - 1) all
_
lxn-2
+ ... + 2a~ + al
Si el valor inicial X
o es real, entonces
(2.27)
también será real y todos los valores xi siguientes. Consecuentemente no se puede encon-
trar una raíz compleja de la ecuación 2.26 si se inicia con un valor X
o real.
Si por el contrario, el valor inicial X
o es complejo, Xl entonces será complejo, x2
tam-
bién, y así sucesivamente. De esta manera, si el proceso converge, puede encontrarse una
raíz x compleja.
Ejemplo 2.12 Encuentre las raíces complejas de la ecuación
f (x) = x2
+ 4 = O,
con el método de Newton-Raphson.
Solución Al derivar f (x) se tiene
f'(x)=2x
Solución de ecuaciones no lineales 69
Nuevamente una lectura de esta gráfica revela que la función es creciente y que se
acerca a la función y = x; no obstante, es necesario precisar esto como lo hicimos en el aná-
lisis clásico.
Una vez que hayamos determinado las dos asíntotas de las funciones, podemos ase-
gurar que sólo hay dos raíces reales en el intervalo (O, 1.5), cuya obtención puede hacerse
con alguno de los métodos vistos. Con la instrucción Matlab.
fzero('x - exp(1-x).*(1+1og(x));0.3)
Se obtiene
ans 0.4967
2.9 Raíces complejas
Hasta ahora se han discutido sólo técnicas para encontrar raíces reales de ecuaciones de la
forma f (x) = O. Sin embargo, a menudo se presentan ecuaciones polinomiales con coefi-
cientes reales, cuyas raíces son complejas, o bien polinomios complejos, y ecuaciones tras-
cendentes con raíces reales y complejas.
Generalmente, dichas ecuaciones pueden resolverse por el método de Newton-Raphson
(Sec. 2.2), pero proponiendo un valor inicial X
ocomplejo o bien por algún otro método.
MÉTODO DE NEWTON-RAPHSON
Supóngase que se tiene
(2.26)
con todos los coeficiente a¡ reales. f I (x) es un polinomio de grado (n -1) y de coeficien-
tes también reales
f I (x) =n anxn
-
l + (n - 1) an
_
lxn-2 + ... + 2a~ + al
Si el valor inicial X
oes real, entonces
(2.27)
también será real y todos los valores Xi siguientes. Consecuentemente no se puede encon-
trar una raíz compleja de la ecuación 2.26 si se inicia con un valor X
oreal.
Si por el contrario, el valor inicial X
oes complejo, Xl entonces será complejo, x2
tam-
bién, y así sucesivamente. De esta manera, si el proceso converge, puede encontrarse una
raíz x compleja.
Ejemplo 2.12 Encuentre las raíces complejas de la ecuación
f (x) =x2 + 4 =O,
con el método de Newton-Raphson.
Solución Al derivarf (x) se tiene
f'(x)=2x
-------~--------------------------------:-----
70 Métodos numéricos aplicados a la ingeniería
Sea X
o = j el valor inicial propuesto. Aplicando la ecuación 2.12 con este valor inicial,
se tiene:
(j2 + 4)
xI = j - 2 (j)
-1 + 4 3
pero (j)2 = -1, entonces: xI = j - = j - -
2j 2j
Multiplicando y dividiendo por j el término 3/(2j), se obtiene:
xI = j - (-1.5 j) = 2.5 j
. (2.5 j)2 + 4 .
x2 = 2.5) - = 2.05 )
2(2.5 j)
(2.5 j)2 + 4 = 2.001 .
x3 = 2.5 j - 2(2.05 j) )
La sucesión de valores complejos xo' xi' ... , va acercándose rápidamente a la raíz x l = 2j
f (x 1) = f (2 j) = (2 j)2 + 4 = -4 + 4 = O
Para evaluar la distancia entre dos valores complejos consecutivos, se utiliza
donde las barras representan el módulo del número complejo xi+1 - xi" Esto es, si
xi+1 - Xi = a + b j
Entonces
I xi+1 - Xi I = Ja2
+ b2
Por lo que se tiene para la sucesión previa
IXI - X
o I= I2.5 j - j I= J 02 + (1.5)2 = 1.5
IX
2
- xI 1=1 2.05 j - 2.5 j I = J 02 + (-0.45)2 = 0.45
IX
3
- X
2
I = 2.001 j - 2.05 j = J02 + (-0.049)2 = 0.049
y la convergencia es notoria.
En caso de tener raíces complejas una ecuación polinomial con coeficientes reales; és-
tas aparecen en parejas; es decir, si X = a + b j es raíz, también lo será X = a - b j (toda vez
que al multiplicarlos deben producir los coeficientes reales).
Por esto:
x2
= -2j
es la segunda raíz que se busca.
f(x 2) =f(-2j) = (_2j)2 + 4 = -4 + 4 = O
El problema queda terminado.
Para realizar los cálculos de este ejemplo, puede usar el guión de Matlab dado en
el Ejemplo 2.4, con el valor inicial xO=li, con lo que Matlab realiza los cálculos con
aritmética compleja. El lector puede apreciar aún más la utilidad de Matlab con este
ejemplo.
70 Métodos numéricos aplicados a la ingeniería
Sea X
o= j el valor inicial propuesto. Aplicando la ecuación 2.12 con este valor inicial,
se tiene:
(j2 + 4)
xI = j - 2 (j)
-1 + 4 3
pero (j)2 = -1, entonces: xI = j - = j - -
2j 2j
Multiplicando y dividiendo por j el término 3/(2j), se obtiene:
xI =j - (-1.5 j) =2.5 j
. (2.5 j)2 + 4 .
x2 =2.5) - =2.05 )
2(2.5 j)
(2.5 N + 4 = 2.001 .
x3 = 2.5 j - 2(2.05 j) )
La sucesión de valores complejos xo' xl' ... , va acercándose rápidamente a la raíz x I = 2j
f (x 1) =f (2 j) = (2 N + 4 = -4 + 4 = O
Para evaluar la distancia entre dos valores complejos consecutivos, se utiliza
donde las barras representan el módulo del número complejo x i+1 - xi" Esto es, si
xi+1 - Xi = a + b j
Entonces
I xi+1 - Xi I = Ja2
+ b2
Por lo que se tiene para la sucesión previa
IXl - X
oI= I2.5 j - j I= J02 + (1.5)2 = 1.5
IX2 - XI 1=1 2.05 j - 2.5 ji = J02 + (-0.45)2 = 0.45
IX
3
- X
2
I= 2.001 j - 2.05 j = J02 + (-0.049)2 = 0.049
y la convergencia es notoria.
En caso de tener raíces complejas una ecuación polinomial con coeficientes reales, és-
tas aparecen en parejas; es decir, si X = a + b j es raíz, también lo será X = a - b j (toda vez
que al multiplicarlos deben producir los coeficientes reales).
Por esto:
es la segunda raíz que se busca.
f(x 2) =f(-2j) = (_2j)2 + 4 = -4 + 4 = O
El problema queda terminado.
Para realizar los cálculos de este ejemplo, puede usar el guión de Matlab dado en
el Ejemplo 2.4, con el valor inicial xO=li, con lo que Matlab realiza los cálculos con
aritmética compleja. El lector puede apreciar aún más la utilidad de Matlab con este
ejemplo.
¡=2j
es, és-
a vez
oen
con
este
Solución de ecuaciones no lineales 71
Si bien se resolvió una ecuación cuadrática que no representa dificultad, el método
también puede emplearse para un polinomio de mayor grado, siguiendo los mismos pasos.
El lector puede crean un programa para el algoritmo en algún lenguaje de alto nivelo en
un pizarrón electrónico como Mathcad.
MÉTODO DE MÜLLER
Un método deducido por Müller, * se ha puesto en práctica en las computadoras con éxito
sorprendente. Se puede usar para encontrar cualquier tipo de raíz, real o compleja, de una
función arbitraria. Converge casi cuadráticamente en un intervalo cercano a la raíz y, a di-
ferencia del método de Newton-Raphson, no requiere la evaluación de la primera derivada
de la función, y obtiene raíces reales y complejas aun cuando estas raíces sean repetidas.
La aplicación del método requiere valores iniciales y es una extensión del método de
la secante, el cual aproxima la gráfica de la función f (x) por una línea recta que pasa por
los puntos (Xi_l,J (Xi_1)) y (xi,J (x¡)). El punto de intersección de esta línea con el eje x da
la nueva aproximación xi+ ¡.
En lugar de aproximar f (x) por una función lineal (línea recta o polinomio de grado 1),
resulta natural tratar de obtener una convergencia más rápida aproximandof(x) por un poli-
nomio p (x) de grado n > 1que coincida conf(x) en los puntos de abscisas xi' xi_I"'" xi_ll
' y
determinar X
i
+
l
como una de las raíces de p (x).
A continuación se describe el caso n = 2, donde el estudio detallado de Müller encon-
tró que la elección de n da resultados satisfactorios.
Se toman tres valores iniciales xo, xi' x2
y se halla el polinomio p (x) de segundo gra-
do que pasa por los puntos (xo,J (xo))' (xl,J (XI)) y (x2,J (x2)), y se toma una de las raíces
de p (x), la más cercana a x2 como la siguiente aproximación x3
. Se repite la operación con
los nuevos valores iniciales xi' x2' x3, y se termina el proceso tan pronto como se satisfa-
ga algún criterio de convergencia. La figura 2.13 ilustra este método.
Sean x.; Xi_l' xi_2' tres aproximaciones distintas a una raíz de f (x) = O. Usando la si-
guiente notación:
t,=f(x¡)
kl=f(xi_¡)
k2 =f(xi_2)
en el capítulo 5 se demostrará que con
(2.28)
(2.29)
la función
(2.30)
• Müller, D.E. "A Method of Solving Algebraic Equations Using an Automatic Cornputer". Mathematical Tables
and Other Aids to Computation (MTAC), 10. pp. 208-215 (1956).
Solución de ecuaciones no lineales 71
Si bien se resolvió una ecuación cuadrática que no representa dificultad, el método
también puede emplearse para un polinomio de mayor grado, siguiendo los mismos pasos.
El lector puede crean un programa para el algoritmo en algún lenguaje de alto nivelo en
un pizarrón electrónico como Mathcad.
MÉTODO DE MÜLLER
Un método deducido por Müller,* se ha puesto en práctica en las computadoras con éxito
sorprendente. Se puede usar para encontrar cualquier tipo de raíz, real o compleja, de una
función arbitraria. Converge casi cuadráticamente en un intervalo cercano a la raíz y, a di-
ferencia del método de Newton-Raphson, no requiere la evaluación de la primera derivada
de la función, y obtiene raíces reales y complejas aun cuando estas raíces sean repetidas.
La aplicación del método requiere valores iniciales y es una extensión del método de
la secante, el cual aproxima la gráfica de la función/(x) por una línea recta que pasa por
los puntos (Xi_l,f (Xi_I)) y (xi,f (x)). El punto de intersección de esta línea con el eje x da
la nueva aproximación xi+ l'
En lugar de aproximar/ex) por una función lineal (línea recta o polinomio de grado 1),
resulta natural tratar de obtener una convergencia más rápida aproximando/ (x) por un poli-
nomio p (x) de grado n > 1 que coincida con/(x) en los puntos de abscisas Xi' Xi_P "" Xi_n' y
determinar Xi+1 como una de las raíces de p (x).
A continuación se describe el caso n = 2, donde el estudio detallado de Mül1er encon-
tró que la elección de n da resultados satisfactorios.
Se toman tres valores iniciales xo, xl' x2 Yse halla el polinomio p (x) de segundo gra-
do que pasa por los puntos (xo,f (xo))' (xl,f (XI)) y (x2,f(x2)), y se toma una de las raíces
de p (x), la más cercana a x2 como la siguiente aproximación x3. Se repite la operación con
los nuevos valores iniciales x" x2' x3, y se termina el proceso tan pronto como se satisfa-
ga algún criterio de convergencia. La figura 2.13 ilustra este método.
Sean Xi' Xi_1' X i_2' tres aproximaciones distintas a una raíz de / (x) = O. Usando la si-
guiente notación:
/¡ = /(x)
h-I =/(xi_ ,)
h-2 =!(xi_2)
en el capítulo 5 se demostrará que con
la función
(2.28)
(2.29)
(2.30)
• Müller. D.E. "A Method of Solving Algebraic Equations Using an Automatic Computer". Mathematical Tables
and Other Aids to Computation (MTAC). 10. pp. 208-215 (1956).
72
Figura 2.13
Interpretación
. gráfica del
método de
Müller.
r
Métodos numéricos aplicados a la ingeniería
es la parábola única que pasa por los puntos (x¡,f), (x¡_i'kl) y (x¡_2,k2). El lector recor-
dará que la manera usual de escribir un polinomio de segundo grado o parábola es:
p(x) = ao + a1x + ar2
y
xI
I
I
I
I
: y = p(x)
Al comparar esta última expresión con la ecuación 2.30 se establece la siguiente identifi-
cación:
a2 =f [Xi' X¡_¡, X¡_2]
a¡ =f [Xi' X¡_¡] - (X¡ + x¡_¡)a2
ao =¡;- X¡ (j [Xi' X¡_¡] - X¡_I a2)
Una vez calculados los valores de ao' a¡ y a2, las raíces de p (x) se determinan a partir de
la fórmula cuadrática
2aoxi
+
1
= -----=-----
- a¡ ± (a2¡ - 4aOa2) 1/2
cuya explicación se encuentra en el problema 2.31, Y en el ejercicio 1.3 del capítulo 1.
Se selecciona el signo que precede al radical de manera que el denominador sea má-
ximo en magnitud,* y la raíz correspondiente es la siguiente aproximación xi
+
l
. La razón
para escribir la fórmula cuadrática de esta manera es obtener mayor exactitud (véase Probo
2.31), ya disminuida por las diferencias de las ecuaciones 2.28 y 2.29, que se utilizan en
el cálculo de ao' a¡ Y a2, Yque son aproximaciones a las derivadas de la funciónf(x).
Puede ocurrir que la raíz cuadrada en la ecuación 2.31 sea compleja. Si f (x) no está
definida para valores complejos, el algoritmo deberá reiniciarse con nuevos valores inicia-
les. Si f (x) es un polinomio, la posibilidad de raíces complejas es latente y el valor de x
puede considerarse como aproximación a alguna de estas raíces y, por tanto, deberá em-
plearse en la siguiente iteración .
(2.31)
• Con esto se encuentra el valor más cercano a x;.
72
Figura 2.13
Interpretación
. gráfica del
método de
Müller.
Métodos numéricos aplicados a la ingeniería
es la parábola única que pasa por los puntos (x¡,f), (x¡_l'k¡) y (Xi- 2,k2). El lector recor-
dará que la manera usual de escribir un polinomio de segundo grado o parábola es:
p(x) = ao + a¡x + ar 2
y
x
: y = p(x)
Al comparar esta última expresión con la ecuación 2.30 se establece la siguiente identifi-
cación:
a2 = f [Xi' X¡_l' Xi_2]
al =f [Xi' Xi_¡] - (X¡ + x¡_I)a2
ao =1; - Xi (j [Xi' X i_¡] - X¡_l a2)
Una vez calculados los valores de ao, al Ya2, las raíces de p (x) se determinan a partir de
la fórmula cuadrática
(2.31)
cuya explicación se encuentra en el problema 2.31, Yen el ejercicio 1.3 del capítulo 1.
Se selecciona el signo que precede al radical de manera que el denominador sea má-
ximo en magnitud,* y la raíz correspondiente es la siguiente aproximación xi+l . La razón
para escribir la fórmula cuadrática de esta manera es obtener mayor exactitud (véase Probo
2.31), ya disminuida por las diferencias de las ecuaciones 2.28 y 2.29, que se utilizan en
el cálculo de ao' al Ya2, Yque son aproximaciones a las derivadas de la funciónf(x).
Puede ocurrir que la raíz cuadrada en la ecuación 2.31 sea compleja. Sif (x) no está
definida para valores complejos, el algoritmo deberá reiniciarse con nuevos valores inicia-
les. Si f (x) es un polinomio, la posibilidad de raíces complejas es latente y el valor de x
puede considerarse como aproximación a alguna de estas raíces y, por tanto, deberá em-
plearse en la siguiente iteración.
• Con esto se encuentra el valor más cercano a x;.
Solución de e cuaciones no lineales 73
Ejemplo 2.13 Encuentre una raíz real de la ecuación polinomial
f (x) = x3
+ 2x2 + lOx - 20 = O,
con el método de Müller.
•
Solución Primera iteración
Al seleccionar como valores iniciales a
xo=O; x¡=l;
y evaluar la función f (x) en estos puntos, se tiene
x2 = 2
fo = -20; t.=-7; f2 = 16
Se calculan ahora los coeficientes del polinornio de segundo grado
f[ ]
f¡-fo
. xl' X
o = -"----=-
x¡ -xo
-7 + 20
---=13
1-0
23 -13
---=5
2-0
Por tanto
a2 =j[x2, xl' xo] = 5
al = j[x2, Xl] - (X2 + Xl) a2 = 23 - (2 + 1)5 = 8
40 = f2 - X2 (f [X2, Xl] - x¡a2) = 16 - 2 (23 - 1(5» = -20
Se calculan los denominadores de la ecuación 2.31
-al +(a2¡ - 4aOa2)l/2 = -8 + (64 + 400)1/2 = 13.54066
-al _(a2] - 4aOa2)1I2 = -8 - (64 + 400)112= -29.54066
Como el segundo es mayor en valor absoluto, se usa en la ecuación 2.31, de donde
2(-20)
----= 1.35407
-29.54066
Segunda iteración
Recorriendo ahora los subíndices de x, se tiene:
Xo = 1; XI =2; X
2
= 1.35407
f2 = -0.30959fo = -7; t,= 16;
En consecuencia:
16 + 7
{[xl' xo] = = 23
. 2-1
-0.30959 - 16
f [x2, x¡] = = 25.24978
1.35407 - 2
Solución de ecuaciones no lineales 73
Ejemplo 2.13 Encuentre una raíz real de la ecuación polinomial
J(x) =x3
+ 2x2
+ lOx - 20 =O,
con el método de Müller.
•
Solución Primera iteración
Al seleccionar como valores iniciales a
Xo =O; x l =l ;
y evaluar la función J(x) en estos puntos, se tiene
Jo = -20;
Se calculan ahora los coeficientes del polinomio de segundo grado
Por tanto
a2 = f[x2, xl' xo] = 5
23 -13
- - - = 5
2-0
a¡ = f[x2, Xl ] - (X2 + Xl) a2 =23 - (2 + 1)5 =8
ao =J2 - x2 (j [X2, Xl] - x¡a2) =16 - 2 (23 - 1(5)) =-20
Se calculan los denominadores de la ecuación 2.31
-al +(a2¡ - 4aO
a2)1/2 = -8 + (64 + 400)112 = 13.54066
-al -(a2¡ - 4aO
a2)I/2 =-8 - (64 + 400)¡/2 =-29.54066
Como el segundo es mayor en valor absoluto, se usa en la ecuación 2.31, de donde
Segunda iteración
2(-20) = 1.35407
-29.54066
Recorriendo ahora los subíndices de x, se tiene:
En consecuencia:
Xo= 1;
Jo =-7;
X¡ = 2;
JI = 16;
16 + 7
f[xl' xo] = 2 _ 1 = 23
X2 =1.35407
J2 = -0.30959
-0.30959 - 16
f[x2, x ¡] = =25.24978
1.35407 - 2
74 Métodos numéricos aplicados a la ingeniería
25.24978 - 23
f[x2, xI' xo] = = 6.35405
1.35407 - 1
De donde:
a2 =1[x2' X¡, xo] = 6.35405
a¡ =1[x2' Xl] - (X2' + x¡)a2 =
25.24978 - (1.35407 + 2)6.35405 = 3.87077
ao =12 -x2 ({[x2' Xl] -x¡a2) =
-0.30959 - 1.35407 (25.24978 - 2 (6.35405)) = - 17.29190
Calculando los denominadores de la ecuación 2.31
-al + (a2¡ - 4aOa2)1I2 = 17.39295
-al - (a - 4aOa2)J/2 = -25.26855
Como el segundo es mayor en valor absoluto, se usa en la ecuación 2.31, de donde
2aox3
= = 1.36865
-al - (a2¡ - 4aOa2)1I2
La tabla 2.5 se obtiene repitiendo el procedimiento.
Tabla 2.5
s. I Xi+¡ -Xi I
O O
1 1 1.00000
2 2 1.00000
3 1.35407 0.64593
4 1.36865 0.01458
5 1.36881 0.00016
Para llevar a cabo los cálculos que se muestran en la tabla anterior, puede emplearse Ma-
tlab o la TI-92 Plus.
eps=O.OOl;eps1=O.OOOl;
xO=O; x1=1; x2=2;
for i=l z: 5
fO=xO~3+2*xO~2+10*xO-20;
fl=x1 ~3+2*x1~2+1(J~xl-20;
f2=x2~3+2*x2~2+10*x2-20;
f10=(f1-fO)/(xl-xO);
f21=(f~-f1)/(x2-x1);
f21Ó=(f21-flO) / (x2-xO);
a2=f21O;
a1=f21- (X2+xl) *a2;
aO=f2-x2*(f21-x1*a2);
e2_13 ( ) -,
Prgm
Define F(x)=x~3+2*x-2+10*x-20
.OOl->eps: .Oüi+epsl : O.->xO
1.->x1 : 2.->x2
For i, 1, 5
f (xO)-+fO : f (x1)->fl
f (x2)->f2 : (fl-fO)/(x1-xO)->flO
(f2-f1)/(x2-x1)->f21
(f21-flO)/(x2-xO)->f210 : f210->a2
f21- (x2+x1)*a2-+a1
f2-x2* (f21-x1*a2) -+aO
dl=-al+ (al A2-4*aO~a2)AO.5;
d2=-al-(alA2-4*a~a2)AO.5;
if abs (dl) >abs (d2)
x3=2*aO/dl;
el se
x3=2'aO/d2;
end
f3=x3A3+2*x3A2+l~x3-20;
dist=abs (x3-x2) ;
disp ([x3, dist))
if or ( (dist<eps) , (abs (f3)~<epsl) )
break
else
xO=xl;xl=x2;x2=x3;
end
end
!7Z5:3 ZTITrrmr:
Solución de ecuaciones no lineales 75
-al +-Y (al A2-4*a~a2) +cü
-al--Y (al A2-4*a~a2)->d2
If abs (dl) >abs (d2) then
Z.'aO/dl->x3
Else
2*aO/d2->x3
EndIf
abs (x3-x2) +diet:
fonnat (x3, "f5") &" ''->d
d&fonnat (dist, "f5")->d
Disp d
If dist<eps or abs (f (x3) ) <epsl
Exit
x i+ xO : x2->xl : x3-> x2
EndFor
EndPrgm
Encuentre las raíces complejas de la ecuación polinomial del ejemplo 2.12
f (x) = x2
+ 4 = O,
con el método de Müller.
Solución Primera iteración
Al elegir como valores iniciales:
Xo = O; x¡ = 1;
y evaluar la función en estos puntos, se tiene
t.=5;fo=4;
Se calculan ahora los coeficientes del polinomio de segundo grado
f[ ]
f¡ - fo __ 5 - 4 -_ 1
xi' Xo = 1 _ Ox¡ -xo
Por tanto
0-1
--=1
-1- O
a2 =f[x2, xi' xo] = 1
a¡ =f[x2, xl] - (X2 +x¡)a2 = 0- (-1 + 1)(1) = O
ao =f2 - x2 (f [x2, x¡] - x¡a2) = 5 - (-1)(0 - 1(1» = 4
Calculando los denominadores de la ecuación 2.31
-al + (a2¡ - 4aOa2)¡/2 = O+ (O- 4(4)(1»¡/2 = (_16)112= 4 j
-al - (a2¡ - 4aOa2)1I7 = O- (O- 4(4)(1»112 = ....{-16)1I2 = - 4 j
dl=-al+ (al A2-4*aa~a2) AO. 5;
d2=-al - (al A2- 4*aO*a2) AO.5;
if abs (dl) >abs (d2)
x3=2*aO/dl;
else
x3=2'aO/d2;
end
f3=x3 A3+2*x3A2+lO*x3- 20;
dist=abs (x3-x2) ;
disp ([x3, distJ)
Solución de ecuaciones no lineales 75
-al +..J (al A2-4*aO*a2) ---'dl
- al - ..J (al A2- 4*aO*a2)---'d2
If abs (dl) >abs (d2) then
2"aO/dl---'x3
Else
2*aO/d2---'x3
EndIf
abs (x3-x2)---'dist
if ar ( (dist<eps) , (abs (f3).<epsl) )
break
fannat (x3, "f5") &" "---'d
d&fannat (dist, "f5")---'d
Disp d
If dist<eps ar abs (f (x3) ) <epsl
else
end
end
xO=xl;xl=x2; x2=x3;
Exit
xl---'xO : x2---'xl : x3---'x2
EndFar
EnclPrgm
Encuentre las raíces complejas de la ecuación polinomial del ejemplo 2.12
f (x) = x2 + 4 = O,
con el método de Müller.
Solución Primera iteración
Al elegir como valores iniciales:
Xo=O; X¡ = 1;
y evaluar la función en estos puntos, se tiene
fo =4; f¡ = 5;
Se calculan ahora los coeficientes del polinomio de segundo grado
Por tanto
f[ ] fl - fo __ 5 - 4 -_ 1
xl' X o = 1 _ O
X I - xo
a2 =f[x2, xi' xo] = 1
0-1
- - = 1
-1- 0
a¡ =f[x2, x ¡] - (x2 +xl)a2 =0- (-1 + 1)(1) =O
ao =f2 - x2 (f [x2, x¡] - x la2) =5 - (-1)(0 - 1(1» =4
Calculando los denominadores de la ecuación 2.31
- al + (a2
1
- 4aOa2
) 1/2 =O+ (O - 4(4)(1»1/2 =(_ 16)112 =4 j
- al - (a2
1 - 4aOa2)1I7 =O- (O - 4(4)(1»1/2 =-{- 16)1/2 =- 4 j
-----------------------------------------------------------------~--------
76 Métodos numéricos aplicados a la ingeniería
Como son de igual magnitud se usa cualquiera, por ejemplo 4j. Entonces:
_ 2ao _ 2(4) _ 2
x3 - -------
-al + (a2¡ - 4aOa2)l!2 4j j
al multiplicar numerador y denominador por j, queda
2 . 2'
x
3
= -:- ..!.. = _J = - 2j
J j -1
Hay que observar que aun cuando xo, x ¡ y x2 son números reales, x3 ha resultado un núme-
ro complejo y además es la raíz buscada, lo cual resulta lógico, ya que la ecuación polino-
mi"l
es una parábola y el método de Müller consiste, en el caso n = 2, en usar una parábola pa-
ra sustituir la función.
La otra raíz es el complejo conjugado de x3
' o sea 2j.
Para realizar los cálculos de este ejemplo, puede usar el guión de Matlab dado en el
ejemplo 2.13, con los valores iniciales xO = O; xl = 1; x2 = -1 Y los cambios correspon-
dientes de la función. I
A continuación se proporciona el algoritmo del método de Müller para el caso n = 2.
Para encontrar una raíz real o compleja de la ecuaciónf(x) = O, incluir la funciónf(x) y los
DATOS: Valores iniciales XO, Xl, X2; criterio de convergencia EPS, criterio de exactitud EPSI y núme-
ro máximo de iteraciones MAXIT.
La raíz aproximada X o un mensaje de falla.RESULTADOS:
PASO 1. Hacer I = 1
PASO 2. Mientras I < MAXIT, repetir los pasos 3 a 7.
PASO 3. Hacer FlO = (F(XI)-F(XO» / (XI-XO).
F21 = (F(X2)-F(XI» / (X2-XI).
F210 = (F21-FlO) / (X2-XO).
A2 = F21O.
Al = F21-(X2+XI)*A2.
AO = F (X2)-X2*(F21-XI *A2).
DI = -AI+(AI **2-4*AO*A2)**0.5.
D2 = -AI-(AI **2-4* AO*A2)**0.5.
PASO 4. Si ABS (DI) > ABS (D2) hacer X3 = 2*AOIDI En caso contrario hacer X3 = 2*AOID2.
PASO 5. Si ABS (X3-XO) < EPS OABS (F (X3» < EPS1.
IMPRIMIR X3 y TERMINAR.
De otro modo, continuar.
PASO 6. Hacer XO = Xl.
Xl = X2 (actualización de valores iniciales).
X2 =X3.
PASO 7. Hacer I = I + 1.
PASO 8. IMPRIMIR mensaje de falla: "EL MÉTODO NO CONVERGE A UNA RAíz" y TERMINAR.
76 Métodos numéricos aplicados a la ingeniería
Como son de igual magnitud se usa cualquiera, por ejemplo 4j. Entonces:
2aox3 = ------"----
-al + (a2¡ - 4aOa2)l!2
al multiplicar numerador y denominador por j, queda
2(4)
4j
2 . 2'
x3
=---:- ~ =_J =- 2j
J j -1
2
j
Hay que observar que aun cuando xo, x ¡ y x2 son números reales, x3 ha resultado un núme-
ro complejo y además es la raíz buscada, lo cual resulta lógico, ya que la ecuación polino-
mial
es una parábola y el método de Müller consiste, en el caso n =2, en usar una parábola pa-
ra sustituir la función.
La otra raíz es el complejo conjugado de x3, o sea 2j.
Para realizar los cálculos de este ejemplo, puede usar el guión de Matlab dado en el
ejemplo 2.13, con los valores iniciales xO =O; xl = 1; x2 =-1 Ylos cambios correspon-
dientes de la función. I
A continuación se proporciona el algoritmo del método de Müller para el caso n =2.
a: ID li ;" ;- ' .,4;... ''''.;ALGORITMO 2.6 Metodode Müller
Para encontrar una raíz real o compleja de la ecuaciónf(x) = O, incluir la funciónf(x) y los
DATOS:
RESULTADOS:
Valores iniciales XO, Xl, X2; criterio de convergencia EPS, criterio de exactitud EPSI y núme-
ro máximo de iteraciones MAXIT.
La raíz aproximada X o un mensaje de falla.
PASO 1. Hacer I = l
PASO 2. Mientras I < MAXIT, repetir los pasos 3 a 7.
PASO 3. Hacer FlO = (F(XI)-F(XO» / (XI- XO).
F21 = (F(X2)-F(XI» / (X2-XI).
F210 = (F21-FlO) / (X2-XO).
A2 = F21O.
Al = F21-(X2+XI)*A2.
AO = F (X2)-X2*(F21-XI *A2).
DI = -AI+(AI **2-4*AO*A2)**0.5.
D2 = -AI-(AI**2-4*AO*A2)**0.5.
PASO 4. Si ABS (DI) > ABS (D2) hacer X3 = 2*AOIDI En caso contrario hacer X3 = 2*AOID2.
PASO 5. Si ABS (X3-XO) < EPS OABS (F (X3» < EPSl.
IMPRIMIR X3 y TERMINAR.
De otro modo, continuar.
PASO 6. Hacer XO = Xl.
Xl = X2 (actualización de valores iniciales).
X2 =X3.
PASO 7. Hacer I = I + 1.
PASO 8. IMPRIMIR mensaje de falla: "EL MÉTODO NO CONVERGE A UNA RAíz" y TERMINAR.
Solución de ecuaciones no lineales 77
La siguiente sección puede omitirse sin pérdida de continuidad en el resto del material.
2.10 Polinomios y sus ecuaciones
EVALUACiÓN DE POLlNOMIOS
Método de Horner
Se desea evaluar un polinomio p(x) en un valor particular de x. Por ejemplo, sea el poli-
nomio
p (x) = 4 .0 + 3 x3 - 2 x2 + 4 x - 8, (2.32)
que se desea evaluar en x = 2.
Factorícese x en los primeros cuatro términos
p (x) = (4 x3 + 3 x2 -2 x + 4) x - 8
Dentro de los paréntesis, factorizar x en los primeros tres términos
p (x) = «4 x2
+ 3 x - 2) x + 4) x-8
Dentro de los paréntesis interiores, factorícese x en los primeros dos términos
p (x) = ( ( (4 x + 3 ) x - 2) x + 4) x - 8
El método de Homer consiste en evaluar, secuencialmente, los paréntesis en esta expre-
sión:
Paso 1. Evaluar (4 x + 3) en x = 2: 4(2) + 3 =11
Paso 2. Evaluar ( (l1)x - 2) en x = 2: (11) 2 - 2 = 20
Paso 3. Evaluar ( (20) x + 4 ) enx = 2: (20) 2 + 4 = 44
Paso 4. Evaluar (44 ) x - 8 en x = 2: (44)2-8 = 80
Así, p (2) = 80.
Este proceso puede llevarse a cabo sin las factorizaciones.
Escribase P4 (x) = a4.0 + a3 x3 + a2 x2 + aJ
x + ao
Para la ecuación 2.32, a4 = 4, a3 = 3, a2 = -2, al = 4 Yao = -8
Conviene almacenar los valores intermedios de la evaluación de esta ecuación: 11, 20, 44
Y 80, como b3, b2, bl Ybo' respectivamente. Sea además, por conveniencia, b4 = a4 (= 4).
Ahora dispónganse los coeficientes, el valor de x donde se desea evaluar el polinomio
y b4 en la siguiente forma:
x=2 4 3 -2 4 -8
En la columna de a3
, se desarrolla el paso 1: 4(2) +3 = 11. Esto puede verse como multipli-
car b4
por el valor de x (= 2) Y sumar el producto a a3
. Llámese este resultado b3
. Esto es:
----~------------------------------~'"1'T-----
78 Métodos numéricos aplicados a la ingeniería
x=2
4 (2) = 8
4 3 -2 4 -8
+
En la columna de a2, se desarrolla el Paso 2: (11)2 - 2 = 20. Esto es, multiplíquese b3
por
el valor de x (= 2) Ysúmese el producto a a2
. Llámese este resultado b2
. Lo anterior se ilus-
tra así
x=2
11(2) = 22
4 3 -2 4 -8
+
b2 = 20
Repitiendo este proceso hasta calcular bo se tiene
x=2
44(2) = 88
4 3 -2 4 -8
+ +
20(2) = 40
b, = 4
El valor p (2) resulta en bo.
b2 = 20 b¡ =44 bo = 80
Evalúe el polinomio
enx = 3,
mediante el método de Horner.
Solución La no aparición de los términos en x4 y en x2 del polinomio significa que sus coeficientes
son cero; para fines del método en estudio, dichos ceros deben aparecer en el arreglo
Coeficientes de:
Para
Término
xs x4
x3 x2
x independiente
as = 1 a4 = O a3
=-4 a2 = O a¡ = 2 ao = 3
x=3 + + + + PAS
1(3) = 3 3(3) = 9 5(3) = 15 15(3) = 45 47(3) = 141
PAS
bs = 1 b4 = 3 b3 = 5 b2 = 15 b, = 47 bo = 144 PA~
De aquí p (3) = 144.
Solución de ecuaciones n o lineales 79
Se generaliza este método con polinornios de cuarto grado; sin embargo la extensión
a cualquier grado, es inmediata. Así:
x
+ + + +
x x x x
donde puede verse que:
b4 = a4,
esto es
(2.33)
Mediante una sustitución regresiva puede verse con claridad por qué p (x) = bo'
Sustituyendo en bo = ao + blx a b, por al + bZX, se tiene:
bo = ao + (al + b2x)x
y ahora se reemplaza en la última expresión b2
con a2
+ b3
x y así sucesivamente, con lo
cual se obtiene:
bo = ( ( (a4x + a3)x + a2)x + al)x + ao = p (x)
Las ecuaciones 2.33 representan un algoritmo programable y, como se verá más adelante,
de elevada eficiencia para evaluar un polinornio p (x) en algún valor particular de x.
Se describe enseguida el algoritmo de Horner.
ALGORITMO 2.7 Método de Horner
Para evaluar el polinomio
p (x) = a"x" + a,,_lx,,-1 + ... + a1x + ao proporcionar los
DATOS: n: Grado del polinornio.
a", all
_
I, ... , ao: Coeficientes del polinornio.
t: Valor de x en donde se desee evaluar p (x)
p (t) en bo'RESULTADOS:
PASO l. Hacer b" = «;
PASO 2. Para k = n-l, n-2, ... , O realizar el paso 3.
PASO 3. Hacer bk = bk+1 t + ak•
PASO 4. IMPRIMIR bo'
Solución de ecuaciones no lineales 79
Se generaliza este método con polinomios de cuarto grado; sin embargo la extensión
a cualquier grado, es inmediata. Así:
x
x
donde puede verse que:
b4 = a4,
b3 = a3 + b4x,
esto es
+
x
+ + +
x x
Mediante una sustitución regresiva puede verse con claridad por qué p (x) =bo'
Sustituyendo en bo = ao + blx a bl por al + b2x, se tiene:
bo = ao + (al + b2x)x
(2.33)
y ahora se reemplaza en la última expresión b2 con a2 + b3x y así sucesivamente, con lo
cual se obtiene:
bo = ( ( (a4x + a3)x + a2)x + al)x + ao = p (x)
Las ecuaciones 2.33 representan un algoritmo programable y, como se verá más adelante,
de elevada eficiencia para evaluar un polinomio p (x) en algún valor particular de x.
Se describe enseguida el algoritmo de Homer.
ALGORITMO 2.7 Método de Horner
Para evaluar el polinomio
DATOS:
RESULTADOS:
PASO 1. Hacer bll
= all
p (x) = allx" + all_1x"-1+ ... + a,x + ao proporcionar los
n: Grado del polinomio.
all' a
ll
_
l ,· .. , ao: Coeficientes del polinomio.
t: Valor de x en donde se desee evaluar p (x)
p (t) en bo'
PASO 2. Para k = n-l, n-2,..., Orealizar el paso 3.
PASO 3. Hacer bk = bk+l t + ak•
PASO 4. IMPRIMIR bo'
80 Métodos numéricos ap licados a la ingeniería
Método de Horner iterado
El método de Homer tiene otras características, que se analizarán enseguida.
Tómese de nuevo el polinomio general de cuarto grado P4 (x) y divídase entre (x - t),
donde t es un valor particular de x, lo que se expresa como:
P4 (x) = (x - t) q (x) + R, (2.34)
donde q (x) es el polinomio cociente (en este caso de tercer grado) y R una constante lla-
mada residuo.
Sustituyendo x con t se obtiene P4 (t) = R, de modo que el polinomio evaluado en un
valor particular de x es igual al residuo R de la división, R = bo.
Al derivar la ecuación 2.34 con respecto a x (recuérdese que t y R son constantes), se
tiene:
P4' (x) = (x - t)q' (x) + q (x)
Haciendo x = t resulta
(2.35)
esto es, la derivada del polinomio P4 (x) evaluada en x = t es el cociente q (x) evaluado en
t, toda vez que
y en general
(2.36)
donde b4, b3
, b2 Yb, son los valores intermedios que resultan en la evaluación de P4 (x) en
t por el método de Homer (véase Ej. 2.15). Así pues, si después de evaluar P4 (x) en t se
desea evaluar también p,' (x) en t, puede aplicarse una vez más el método de Homer a los
valores intermedios b4, b3, b2 Y bl' como se ilustra enseguida.
E
Sea P (x) = 3x3 - 4x - 1. Evalúe
a) P (2) b) P' (2)
Solución a) Para evaluar P (2), se tiene
x=2
al ao
-4 -1
+ +
6(2) = 12 8(2) = 16
b¡ = 8 bo = 15
3 o
+
3(2) = 6
y P (2) = 15.
b) Como se dijo
entre (x - t),
(2.34)
constante lla-
al~do en un
nst~ntes), se
(2.35)
evaluado en
(2.36)
deP4 (x) en
4 (x) en t se
Horner a los
Solución de ecuaciones no lineales 81
Para evaluar p' (2) se emplea de nuevo el método de Horner. Esto se logra eficiente-
mente, repitiendo los pasos de los cálculos descritos; esto es bajo b3, b2 Y b, del arreglo
anterior. Para almacenar los nuevos valores intermedios de esta evaluación se emplean e3
,
e2
y e,. Nótese que como b, es el término independiente de p' (x), el proceso de evalua-
ción termina una vez que se obtuvo e" y éste es el valor buscado de p' (2).
x=2 3
a2 al ao
O -4 -1
+ + +
3 (2) = 6 6 (2) = 12 8 (2) = 16
b2 = 6 b, = 8 bo =15
+ +
3 (2) =6 12 (2) = 24
e2 = 12 el = 32
x=2
De esto, p' (2) = 32. El lector puede verificar el resultado derivando p (x) y evaluando la
derivada en x = 2.
En la práctica, los cálculos suelen disponerse sin tantos comentarios.
Evalúe 5x3 - 2x2 + 10 Y su primera derivada en x = 0.5
Solución
0.5 5
a2 al ao
-2 O 10
+ + +
2.5 0.25 0.125
b2 bl bo
0.5 0.25 10.125
+ +
2.5 1.50
e2
l.3 1.75
0.5
5
De esto p (0.5) = 10.125 Yp' (0.5) = 1.75.
En este punto conviene presentar el algoritmo de Horner iterado para evaluar un polino-
mio y su primera derivada en un valor t.
82 Métodos numéricos aplicados a la ingeniería
ALGORITMO 2.8 Método de Horner iterado
Para evaluar el polinomio
p (x) = anx" + an_Ix"-1 + ... + alx + ao
y su primera derivada p' (x) en x = t, proporcionar los
DATOS: n: Grado del polinomio,
an, an_l, ... , ao: Coeficientes del polinomio.
t: Valor de x en donde se desea evaluar p (x) y p' (x).
p (t) en bo y p' (t) en el'RESULTADOS:
PASO l. Hacer bn = an y en = bn·
PASO 2. Para k = n-l, n-2, ... , 1 realizar los pasos 3 y 4.
PASO 3. Hacer bk = bk+1 t + ak.
PASO 4. Hacer ek = ek+1 t + bk.
PASO 5. Hacer bo = bit + ao'
PASO 6. IMPRIMIR bo y eI:
CUENTA DE OPERACIONES
Si bien la implementación del método de Horner en una computadora es una de sus ven-
tajas, no lo es menos su eficiencia, que se verá a continuación, contando las operaciones
en el método de evaluación usual y comparando su número con el del método de Horner.
Tomando de nuevo el polinomio general de cuarto grado
P4 (x) = a4x4 + a3 x3 + a2 x2 + a¡ x + aa
a) Método usual
a4x4 requiere cuatro multiplicaciones
a3
x3 requiere tres multiplicaciones
a2
x2 requiere dos multiplicaciones
a¡x requiere una multiplicación
a4x4 + a3x3 + a2x2 + alx + aa necesita cuatro sumas/restas.
En total se realizan 10 multiplicaciones y cuatro sumas/restas.
b) Método de Horner
»,= a4
b3 = b4 X + a3
b2 = b3 X + a2
b, = b2 X + a¡
ba = b, x + aa
Se requiere una multiplicación y una suma para cada b.
En total cuatro multiplicaciones y cuatro sumas/restas.
Hay una reducción de 60% en el número de multiplicaciones requeridas y, consecuen-
temente, un error de redondeo menor.
Eje
82 Métodos numéricos aplicados a la ingeniería
ALGORITMO 2.8 Método de Horner iterado
Para evaluar el polinomio
p (x) = all:;;" + al _lx"- 1
+ ... + a¡x + ao
y su primera derivada p' (x) en x = t, proporcionar los
DATOS:
RESULTADOS:
n: Grado del polinomio,
all' all_l , •• •, ao: Coeficientes del polinomio.
1: Valor de x en donde se desea evaluar p (x) y p' (x).
p (t) en bo y p' (t) en el'
PASO 1. Hacer bn = all y ell
= bn·
PASO 2. Para k = n-l, n- 2,... , 1 realizar los pasos 3 y 4.
PASO 3. Hacer bk = bk+1 t + ak•
PASO 4. Hacer ek
= ehl t + bk .
PASO 5. Hacer bo= bIt + ao'
PASO 6. IMPRIMIR boy el'
CUENTA DE OPERACIONES
Si bien la implementación del método de Horner en una computadora es una de sus ven-
tajas, no lo es menos su eficiencia, que se verá a continuación, contando las operaciones
en el método de evaluación usual y comparando su número con el del método de Horner.
Tomando de nuevo el polinomio general de cuarto grado
P4 ex) =a4x4 + a3 x3 + a2 x2 + a¡ x + ao
a) Método usual
a4
x4 requiere cuatro multiplicaciones
a3x3 requiere tres multiplicaciones
a2x2 requiere dos multiplicaciones
a¡x requiere una multiplicación
a4x4 + a3x3 + a2x2 + a lx + aonecesita cuatro sumas/restas.
En total se realizan 10 multiplicaciones y cuatro sumas/restas.
b) Método de Horner
b4 = a4
b3 =b4 X + a3
b2 = b3 X + a2
bl = b2 X + a¡
bo= b¡ x + ao
Se requiere una multiplicación y una suma para cada b.
En total cuatro multiplicaciones y cuatro sumas/restas.
Hay una reducción de 60% en el número de multiplicaciones requeridas y, consecuen-
temente, un error de redondeo menor.
Solución de ecuaciones no lineales 83
A continuación se verá una aplicación del método de Homer en la búsqueda de raíces
reales de ecuaciones de la formaf(x) = O, dondef(x) es un polinomio de grado n.
Combinando las ecuaciones 2.34 y 2.36 Y el resultado R = bo.
f(x) = (x - t) (b4x3
+ b3
x2
+ b2x + b¡) + bo
y como f (t) = bo'
f(x) = (x - t) (b4x3
+ b3x2
+ b2x + b¡) +f(t)
Si t es una raíz de f (x) = O, se tiene f (t) = O Y la expresión resultante
f(x) = (x - t) (b4x3 + b3x2
+ b~ + b¡)
indica que x = t es una raíz (lo cual ya se sabía), pero lo más importante es que las raíces
restantes de f (x) = O son las raíces de
b4x3
+ b3x2
+ b~ + b¡ = O, (2.37)
una ecuación polinomial de tercer grado y, por tanto, más fácil de manejar que la ecuación
original; además, sus coeficientes son los valores ya citados b4' b3
, b2 Y b ¡.
Si se sospecha que la raíz t se repite (es decir t es raíz de la ecuación 2.37), véase el
valor de e¡ del método de Homer iterado, ya que éste será muy cercano a cero si así fue-
ra; esto es p' (t) = O en ese caso.
Ahora, desarróllese el método de Newton-Raphson con el método de Homer iterado,
llamado método de Birge- Vieta.
RAíCES DE UNA ECUACiÓN POLlNOMIAL Pn(x) = O
Método de Birge-Vieta"
De los métodos vistos para encontrar raíces, el de Newton-Raphson resulta el más adecua-
do para ser empleado en conjunción con el método de Homer iterado. Se resuelve a con-
tinuación un ejemplo con esta combinación.
Aproxime las raíces reales del polinomio
p (x) = 4x4 + 3x3 - 2x2 + 4x - 8
Solución
PASO 1. Al analizar gráficamente la función se advierte que tiene dos raíces reales, una
alrededor de 1, y la otra alrededor de -2.
PASO 2. Se elige O como valor inicial para encontrar la primera raíz.
PASO 3. Con el método de Homer bo = -8 Y e¡ = 4
PASO 4. Con el método de Newton-Raphson t¡ = to - bofe¡ = O- (-8) /4 = 2
PASO 5. Al repetir los pasos 3 y 4 se tiene
t2 t¡ bofe¡ 2 - 8/16 = 1.5
t3
t2 bofe¡ 1.5 - 23.875/72.25 = 1.1696
t4 t3 bo/e¡ 1.1696 - 6.2258/37.2287 = 1.0023
* Este método también se conoce como Newton-Raphson-Horner.
84 Métodos numéricos aplicados a la ingeniería
Este proceso converge al valor 0.9579
PASO 6. Se toma 0.9579 como primera raíz del polinomio.
PASO 7. El polinomio de menor grado que se obtiene con esta raíz conduce a p (x) = 4x3
+ 6.831315x2
+ 4.5435x + 8.3518
PASO 2. Se elige nuevamente O como valor inicial para encontrar la segunda raíz.
PASO 3. Con el método de Horner bo = 8.3518 Y e, = 4.5435
PASO 4. Con el método de Newton-Raphson
t[ = to - bofe, = O- 8.3518/4.5435 = -1.8382
PASO 5. Al repetir los pasos 3 y 4 se tiene
11
t2
= t, - bofe, = -1.8382 - (-1.7623) /19.9772 = -U500
t3
= t2
- bofe¡ = -1.7500 - (-1.1575) /17.3841 = -1.7434
Este proceso converge al valor -1.7433
PASO 6. Se toma -1.7433 como segunda raíz del polinomio.
PASO 7. El polinomio disminuido con esta raíz conduce a p (x) = 4x2 - 0.141885x +
4.79085
Que tiene las raíces: 0.01774 ± 1.09426j
Matlab posee una función que calcula to-
das las raíces de ecuaciones polinornia-
les, suministrando los coeficientes del
polinomio.
Para este caso la instrucción quedaría:
La calculadora TI-92 Plus también obtie-
ne estas raíces; las reales las obtiene con
la instrucción
Roots([4 3 -2 4 -8])
y las complejas con
y se obtiene como respuesta:
ans =
-1.74332500029465
0.01773561271143 + 1. 09425660030108i
0.01773561271143 - 1.09425660030108i
0.95785377487178
En el CD se encuentra el PROGRAMA 2.1 para este algoritmo.
En cada etapa se ha calculado una aproximación a cada una de las raíces reales de p
(x) = O; conforme se avanza en las etapas, los coeficientes b" b2, ... , », de cada etapa se
alejan de los valores verdaderos, debido a la propagación de errores, y las aproximaciones
a las raíces correspondientes también son más inexactas. Para disminuir la pérdida de
Eje
84 Métodos numéricos aplicados a la ingeniería
Este proceso converge al valor 0.9579
PASO 6. Se toma 0.9579 como primera raíz del polinomio.
PASO 7. El polinomio de menor grado que se obtiene con esta raíz conduce a p (x) = 4x3
+ 6.831315x2 + 4.5435x + 8.3518
PASO 2. Se elige nuevamente Ocomo valor inicial para encontrar la segunda raíz.
PASO 3. Con el método de Horner bo=8.3518 Ye, =4.5435
PASO 4. Con el método de Newton-Raphson
t[ =to- bofe, =O- 8.3518/4.5435 =- 1.8382
PASO 5. Al repetir los pasos 3 y 4 se tiene
t2 =t, - bofe, =-1.8382 - (-1.7623) /19.9772 =-1.7500
t3 =t2 - bofe, =-1.7500 - (-1.1575) / 17.3841 =-1.7434
Este proceso converge al valor -1.7433
PASO 6. Se toma -1.7433 como segunda raíz del polinomio.
PASO 7. El polinomio disminuido con esta raíz conduce a p (x) = 4x2 - 0.141885x +
4.79085
Que tiene las raíces: 0.01774 ± 1.09426j
Matlab posee una función que calcula to-
das las raíces de ecuaciones polinomia-
les, suministrando los coeficientes del
polinomio.
Para este caso la instrucción quedaría:
Roots([4 3 -2 4 -8])
y se obtiene como respuesta:
ans =
-1 .74332500029465
0.01773561271143 + 1 . 09425660030108i
0 . 01773561271143 - 1. 09425660030108i
0 . 95785377487178
La calculadora TI-92 Plus también obtie-
ne estas raíces; las reales las obtiene con
la instrucción
y las complejas con
En el CD se encuentra el PROGRAMA 2.1 para este algoritmo.
En cada etapa se ha calculado una aproximación a cada una de las raíces reales de p
(x) =O; conforme se avanza en las etapas, los coeficientes b" b2, . . . , bn de cada etapa se
alejan de los valores verdaderos, debido a la propagación de errores, y las aproximaciones
a las raíces correspondientes también son más inexactas. Para disminuir la pérdida de
Solución de ecuaciones no lineales 85
exactitud se ha sugerido trabajar primero con la raíz más pequeña en valor absoluto, lue-
go con la raíz real restante más pequeña en magnitud, y así sucesivamente.
(2.40)
Método de Lin *
En 1941, S.N. Lin publicó un procedimiento que se fundamenta en el resultado
y en que si t es una raíz de P« (x) = O, entonces:
R = O = bIt + ao
o
t = - arJb, (t) (2.38)
Se ha escrito b¡ (t) en lugar de b ; para hacer énfasis en que el valor de b, (y de las demás
b) depende del valor t donde se evalúa f (x) y así ver el lado derecho de la ecuación 2.38
como una función de t. Lo que puede escribirse como:
~ t = - arJb, (t) = g (t) (2.39)
Y se le puede aplicar el método de punto fijo, empezando con un valor inicial to cercano a
la raíz t, de modo que:
Restando en ambos lados to
o
y se obtiene el algoritmo de Lin. Este método no requiere el cálculo de las e como el de
Birge- Vieta, por lo que el trabajo por iteración se reduce a la mitad. Esta reducción contras-
ta con un orden bajo de convergencia y la inestabilidad propia del método de punto fijo.
Ejemplo 2.19 Encuentre una raíz real de la ecuación
.0 -.3x3 + 2x -1 = O,
con el método de Lin y un valor inicial to = 2.8
Solución Primera iteración
R ( 2.8 ) = 0.2096; b¡ (2.8) = 0.432;
t¡ = to - R (to) / b, (to) = 2.8 - 0.2096 / 0.432 = 2.3148
• En el capítulo 4 se desarrolla el método de Bairstow.
Solución de ecuaciones no lineales 85
exactitud se ha sugerido trabajar primero con la raíz más pequeña en valor absoluto, lue-
go con la raíz real restante más pequeña en magnitud, y así sucesivamente.
Método de Lin*
En 1941, S.N. Lin publicó un procedimiento que se fundamenta en el resultado
R =f(t) = bo = bit + ao
y en que si t es una raíz de PI1 (x) = O, entonces:
R =O=bit + ao
o
t = - arJb, (t) (2.38)
Se ha escrito b¡ (t) en lugar de b l para hacer énfasis en que el valor de b¡ (y de las demás
b) depende del valor t donde se evalúaf (x) y así ver el lado derecho de la ecuación 2.38
como una función de f. Lo que puede escribirse como:
'~ t = - arJb, (t) = g (t) (2.39)
y s'e-ie puede aplicar el método de punto fijo, empezando con un valor inicial tocercano a
la raíz t, de modo que:
Restando en ambos lados to
o
(2.40)
y se obtiene el algoritmo de Lin. Este método no requiere el cálculo de las e como el de
Birge-Vieta, por lo que el trabajo por iteración se reduce a la mitad. Esta reducción contras-
ta con un orden bajo de convergencia y la inestabilidad propia del método de punto fijo.
Ejemplo 2.19 Encuentre una raíz real de la ecuación
x4 -3x3 + 2x -1 = O,
con el método de Lin y un valor inicial fo = 2.8
Solución Primera iteración
R ( 2.8 ) =0.2096; b¡ (2.8) = 0.432;
t i =to - R (to) / b, (to) =2.8 - 0.2096 / 0.432 =2.3148
• En el capítulo 4 se desarrolla el método de Bairstow.
86 Métodos numéricos aplicados a la ingeniería
Segunda iteración
R (2.3148) = -4.8692; bl
(2.3148) = -1.6715;
t2
= ti - R (ti) / b, (ti) = 2.3148 - (-4.8692) / (-1.6715) = -0.5983
Al continuar las iteraciones se advierte que el método es inestable y no llega a la raíz
2.78897. I
La estabilidad" del método puede mejorarse en una raíz xk' si se conoce una buena apro-
ximación a xk
. Para esto se incorpora el parámetro A a la ecuación 2.40 de Lin y queda
R
ti = to - A-
bl
donde:
A=- feO)
to!' (to)
Con to = 2.8, A = 0.018555 Y la fórmula modificada de Lin, en general es
R
t=t-A-
bl
(2.41)
Ejemplo 2.20 Con la fórmula modificada de Lin, aproxime una raíz real de la ecuación
f(x) =.0 - 3x3 + 2x -1 = O,
use como valor inicial to = 2.8
Solución
feO) = -1; t'(2.8) = 19.248
A = - (-1) / 2.8 / 19.248 = 0.018555
Primera iteración
R ( 2.8 ) = 0.2096; bl
(2.8) = 0.432;
ti = to - A R (to) / b, (to) = 2.8 - 0.018555 (0.2096) /0.432
= 2.791
Segunda iteración
R (2.791) = 0.03808; », (2.791 ) = 0.37194;
t2 = ti - A R (tI) / bl(tl)
= 2.791 - 0.018555 (0.03808) / (0.37194) = 2.7891
Al continuar las iteraciones se encuentra la raíz 2.78897
* Hildebrand. lntroduction to Numerical Analysis. McGraw Hill, 2a. Ed., pp. 591-595.
86 Métodos numéricos aplicados a la ingeniería
Segunda iteración
R (2.3148) =-4.8692; bl (2.3148) =- 1.6715;
t2 = ti - R (ti) / b l (ti) = 2.3148 - (-4.8692) / (-1.6715) = -0.5983
Al continuar las iteraciones se advierte que el método es inestable y no llega a la raíz
2.78897. I
La estabilidad* del método puede mejorarse en una raíz xk' si se conoce una buena apro-
ximación a xk. Para esto se incorpora el parámetro Aa la ecuación 2.40 de Lin y queda
donde:
R
ti = to- A-
bl
A=- feO)
to!' (to)
Con to= 2.8, A= 0.018555 Yla fórmula modificada de Lin, en general es
R
t = t-A-
bl
(2.41)
Ejemplo 2.20 Con la fórmula modificada de Lin, aproxime una raíz real de la ecuación
Solución
f(x) =.0 - 3x3 + 2x -1 = O,
use como valor inicial to=2.8
feO) = -1 ; !' (2.8) = 19.248
A= - (-1) / 2.8 / 19.248 = 0.018555
Primera iteración
R ( 2.8 ) = 0.2096; bl (2.8) = 0.432;
ti = to- AR (to) / b¡ (to) = 2.8 - 0.018555 (0.2096) / 0.432
= 2.791
Segunda iteración
R (2.791) = 0.03808; b¡ (2.791 ) = 0.37194;
t2 = ti - AR (tI) / b¡(t¡)
= 2.791 - 0.018555 (0.03808) / (0.37194) =2.7891
Al continuar las iteraciones se encuentra la raíz 2.78897
* Hildebrand. Introduction fo Nurnerical Analysis. McGraw Hill, 2a. Ed., pp. 591-595.
Solución de ecuaciones no lin eales 87
Los métodos anteriores son válidos para raíces reales y complejas. Sin embargo, para
las segundas deberá inicializarse con un número complejo y llevar a cabo las operaciones
complejas correspondientes. Cuando los coeficientes de P" (x) = Oson reales, las raíces com-
plejas aparecen en pares conjugados
x k = a + bj, X k+¡ = a - bj,
lo que se puede aprovechar buscando en P, (x) = O el factor cuadrático
(x - x k) (x - x k+l) = x2 - 2ax + (a2 + b2)
de coeficientes reales que genera X k YX k+!
Factores cuadráticos. Método de Lin
Sea el polinomio
f(x) = xn + an_¡x,,-l + ... + a2x2 + a¡x + aa
Si an no es uno,f(x) puede dividirse entre a" para obtener la ecuación 2.42.
Al dividir la ecuación 2.42 entre la expresión cuadrática
x2
+ px + q
f (x) = x" + an_¡xn-¡ + ... + a2x2 + a¡x + aa
= (x2 + px + q) (xn-2 + bn_3
xn-3 + ... + b¡x + ba) + Rx + S,
(2.42)
(2.43)
(2.44)
donde Rx + S es el residuo lineal de la división, y R Y S dependen de p y q.
Para que la ecuación 2.43 sea un factor cuadrático de la 2.42 (es decir, que la divida
exactamente) es necesario que el residuo lineal sea cero o simbólicamente que
R (p, q) = O S (p, q) = O (2.45)y
De donde nuestro objetivo será encontrar p y q, tales que se cumplan las ecuaciones 2.45.
Conviene tener un método que permita calcular R y S sin verificar la división de la
2.42 por la 2.43. Para obtenerlo, se igualan los coeficientes de las mismas potencias de x
en los dos miembros de la ecuación 2.44
a,,_¡ = b"_3 + P
an_2 bn-4 + p b"_3 + q
an
_
3
bn_
5
+ p bn-4 + q bn_
3
(2.46)
a¡ = p ba + q b, + R
aa = q ba + S
Despejando bk de la expresión general (usando para ello ak+2 = bk + P bk+¡ + q bk+2) se ob-
tiene
para k = n-3, n-4, ... , O (2.47)
con
(2.48)y
Solución de ecuaciones no lineales 87
Los métodos anteriores son válidos para raÍCes reales y complejas. Sin embargo, para
las segundas deberá inicializarse con un número complejo y llevar a cabo las operaciones
complejas correspondientes. Cuando los coeficientes de Pn (x) = Oson reales, las raíces com-
plejas aparecen en pares conjugados
x k = a + bj, X k+¡ = a - bj,
lo que se puede aprovechar buscando en P" (x) = Oel factor cuadrático
(x - x k) (x - x k+ 1) =x2 - 2ax + (a2 + b2)
de coeficientes reales que genera X k YX k+!
Factores cuadráticos. Método de Lin
Sea el polinomio
¡(x) = xn + an_¡xn-I + ... + a2x2 + a )x + aa
Si an no es uno,f(x) puede dividirse entre an para obtener la ecuación 2.42.
Al dividir la ecuación 2.42 entre la expresión cuadrática
X2 + px + q
¡(x) =Xl + an_)xn- ) + ... + a2x2 + a)x + aa
=(x2 + px + q) (xn
-
2 + bn
_
3xn-3 + ... + b¡x + ba ) + Rx + S,
donde Rx + S es el residuo lineal de la división, y R YS dependen de p y q.
(2.42)
(2.43)
(2.44)
Para que la ecuación 2.43 sea un factor cuadrático de la 2.42 (es decir, que la divida
exactamente) es necesario que el residuo lineal sea cero o simbólicamente que
R (p, q) = O y S (p, q) = O (2.45)
De donde nuestro objetivo será encontrar p y q, tales que se cumplan las ecuaciones 2.45.
Conviene tener un método que permita calcular R y S sin verificar la división de la
2.42 por la 2.43. Para obtenerlo, se igualan los coeficientes de las mismas potencias de x
en los dos miembros de la ecuación 2.44
all
_¡ = bn_3 + p
an_2 bn-4 + p bll
_
3 + q
an_3 bn_5 + p bn-4 + q bn
_
3
a¡ = p ba + q b¡ + R
aa = q ba + S
(2.46)
Despejando bk de la expresión general (usando para ello ak+2 =bk + p bk+) + q bk+2) se ob-
tiene
para k = n-3, n-4,... , O (2.47)
con
y (2.48)
88 Métodos numéricos aplicados a la ingeniería
el algoritmo buscado para obtener los coeficientes del polinomio cociente de la 2.44 y
además
R = a¡ - p ba - q b¡
S = aa - qba
Al emplear las condiciones de la ecuación 2.45
a¡ - p ba - q b¡ = O
aa - q ba = O
se pueden obtener, despejando, valores de p y q para formar una nueva expresión 2.43, qui-
zás más cercana al factor cuadrático que andamos buscando.
El método de Lin consiste en:
(2.49)
(2.50)
(2.51)
PASO l. Proponer aproximaciones iniciales de los valores desconocidos p y q (pueden
llamarse Pa y qa)'
PASO 2. Emplear las ecuaciones 2.47 para obtener aproximaciones de bll
_
3, bn-4'" , b¡, ba.
PASO 3. Calcular R y S. Si son cero o suficientemente cercanas a éste, el problema está
terminado. En caso contrario, se estiman nuevos valores de P y q (pueden llar-
marse e, y q¡)
y
para volver al paso 2.
Encuentre los factores cuadráticos de la ecuación polinomial de grado cuatro
f (x) = .0 - 8x3 + 39x2 - 62x + 50 = O
Solución
PASO 1.
PASO 2.
Se propone P = O Y q = O.
b3 = O; b2 =1;
b¡ = a3 - P b2 - q b3 = -8;
R = a¡ - P ba - q b ; = -62PASO 3.
ba = a2 - p b, - q b2 = 39.
S = aa - q ba = 50
a - q b -62
p¡ = ¡ ¡ =--=-1.5897;
ba 39
q¡ = aa / ba = 50/39 = 1.2821
Al repetir los pasos 2 y 3 se encuentra la siguiente sucesión de valores:
p q R S
-1.9358 1.8164 -10.0204 14.7086
-2.0109 1.9708 -1.4494 3.9l71
-2.0090 2.0011 0.0469 0.7586
-2.0034 2.0030 0.l396 0.0458
-2.0009 2.00l3 0.0632 -0.0410
-2.0001 2.0004 0.0187 -0.0235
Solución de ecuaciones no lineales 89
44 Y Por lo que el factor cuadrático es
.49)
.sO)
Para llevar a cabo los cálculos que se muestran en la tabla anterior, puede usar Matlab
o la TI-92 Plus.
.s1) )
qui-
% Método de Lin
format short
% Datos
n=5; a=[50 -62 39 -8 1J;
p=0; q=0;
b(n-1)=0; b(n-2)=1; i=l; R=l; S=l;
whiIe or (and(abs(R»=O.Ol,abs(S»=O.Ol),i>lO)
for L=l: n-3
k=n-L-2;
b(k)=a(k+2)-Ff-b(k+l)-q*b(k+2);
end
R=a(2) -Ff-b (1) -q"b (2) ;
S=a(1) -q*b (1) ;
p= (a (2) -q*b (2)) /b (1); q=a (1) /b (1) ;
disp ([p,q,R,SJ)
i=i+l;
end
den
, bo'
está
llar-
e2_21( )
Prgm
5->n : so-ein -62->a[2J 39--+a[3J: -8->a[4J
1->a[5J : o-un, : ()-->b[2J 1->b[n-2J
O+bl n-L]
()-->p : O+q l->i: Lr+r : I+s : CIrIO
Disp" p q R S"
Loop
For L, 1, n-3
tr-Ir-Zr+k:
a [k+2J -p'b [k+1J-q"b [k+2J->b [kJ
EndFor
a[2J-Ff-b[lJ-cf'b [2J->r
a[lJ-clb[lJ->s
(a [2J -q*b[2J) /b[lJ->p
a[lJ/b[lJ->q
format (p, "f4") s" "&format (q, "f4") &" "r+d
d&fo:anat(r, "f4")&" "&format(s,"f4") ->d
Disp d
If abs(r)<.Ol or abs(s)<.Ol
Exit
EndLoop
EndPrgm
Solución de ecuaciones no lineale s 89
Por lo que el factor cuadrático es
Para llevar a cabo los cálculos que se muestran en la tabla anterior, puede usar Matlab
o la TI-92 Plus.
% Método de Lin
fonnat short
% Datos
n=5; a=[50 -62 39 -8 lJ;
p=0; q=0;
b(n-l)=O; b(n-2)=1; i=l; R=l; S=l;
while or (and(abs(R»=O.Ol,abs(S»=O.Ol),i>lO)
for L=l: n-3
k=n-L-2;
b(k)=a(k+2)-¡f-b(k+l)-q*b(k+2);
end
R=a (2) -¡f-b (1) -q"'b (2) ;
S=a (1) -cfb (1) ;
p= (a (2) -cfb (2)) lb (1); q=a (1) lb (1) ;
disp ([p,q,R,SJ)
i=i+l;
end
e2_2l( )
Prgm
5->n : 50->a[lJ
1->a[5J : O->b[lJ
O->b[n-l]
-62->a[2J
: O->b[2J
39->a[3J : -8->a[4J
1-+b[n-2J
O->p : O->q l->i: l->r : l->s : ClrIO
Disp" p q R S"
Loop
For L, 1, n-3
n-L-2->k
a [k+2J -p~b [k+lJ -q""b [k+2J->b [kJ
EndFor
a [2J -¡f-b[lJ -cfb [2J->r
a[lJ-cfb[lJ->s
(a [2J -cfb[2J) Ib[lJ-+p
a[lJ/b[lJ->q
fonnat (p, "f4") &" "&fonnat (q, "f4") &" "->d
d&fo.rmat (r, "f4") &" "&fonnat (s, "f4") ->d
Disp d
If abs(r)<.Ol or abs(s)<.Ol
Exit
EndLoop
EndPrgm
90 Métodos numéricos aplicados a la ingeniería
Ejercicios
/ 6
32 2.1 La ecuación de estado de Van der Walls para un gas real es:
a
( P + V2)( V - b ) = RT (1)
donde:
P = presión en atm
T = temperatura en K
R = constante universal de los gases en atm-L / (gmol K) = 0.08205
V = volumen molar del gas en L/gmol
a, b = constantes particulares para cada gas
Para los siguientes gases, calcule Va 80°C para presiones de 10,20, 30 Y 100 atm.
Gas a b
C02 3.599 0.04267
Dimetilarnina 37.49 0.19700
He 0.03412 0.02370
Óxido nítrico 1.34 0.02789
Solución La ecuación 1 también puede escribirse como
pV3 - bPV2 - RTV2 + a V - a b = O (2)
que es un polinornio cúbico en el volumen molar V; entonces, para una P y una T dadas,
puede escribirse como una función de la variable V
f(V) = p V3 - (P b + R T) V2 + a V - a b = O (3)
Esta ecuación se resuelve con el método de posición falsa para encontrar el volumen
molar.
VALORES INICIALES
El PROGRAMA 2.2 del CD realiza los cálculos necesarios para resolver esta ecuación, usan-
do como intervalo inicial: VI = 0.8 v y VD = 1.2 v, donde v = RT / P, el volumen molar
ideal. (Se resuelve sólo el caso del CO2 a 10 atm y 80°C, dejando como ejercicio para el
lector los demás casos.)
Los valores obtenidos para las diferentes iteraciones son los siguientes:
Solución de ecuaciones no lineales 91
iteración VM
(L/ gmol) If(V M) I
1 2.603856 0.1362 X 102
2 2.734767 0.5711 X 101
3 2.785884 0.2141 X 101
4 2.804528 0.7685
5 2.811156 0.2716
6 2.813489 0.9546 X 10-1
7 2.814309 0.3348 X 10-1
8 2.814596 0.1173 X 10-1
9 2.814697 0.4113 X 10-2
10 2.814732 0.1441 X 10-2
11 2.814744 0.5050 X 10-3
12 2.814749 0.1769 X 10-3
13 2.814750 0.6200 X 10-4
Se utilizó el criterio de exactitud
If(V) I < 10-4
aunque puede verse que desde la iteración 7, el cambio en los valores de VM son solamen-
te en la cuarta cifra decimal, que en este caso representan décimas de mililitro.
Resultado: el volumen molar del CO2
a una presión de 10 atm y una temperatura de
80°C (= 353.2 K) es 2.81475 Llgmol.
Los cálculos pueden realizarse con el siguiente guión de Matlab:
P=10; R=O.08205; ~80+273.2;
a=3.599; b=O.04267;
v-=R"'T/P;
vi=O.8*v; vd=l.2*v; Eps=O.OOOl;
fi=F"vi "3- (F"b+R"T}*vi "2+a*vi -a*b;
fd=pI'vd" 3- (F"b+R"'T)*vd"2+a*vd-a* b;
fm=l; k=O;
while abs (fm) > Eps
k=k+l;
vm=(vi*fd-vd*fi)/(fd-fi);
fm=pI'vm"3- (pI'b+R"T) vm"2+a*vm-a*b;
fprintf ('%3d %8.6f %8. 4en' .k, vm,abs (fm))
if fd*fm > O
vd=vm; fd=fm;
else
vi=vm; fi=fm;
end
end
92 Métodos numéricos aplicados a la ingeniería
También puede resolverse este problema con la función fzero de Matlab, para lo cual
es necesario escribir la siguiente función y grabarla en el área de trabajo de Matlab con el
nombre Vander.m:
function f=Vander (V)
P=lO; R=0.08205; T=80+273.2;
a=3.599; b=0.04267;
f=P*V/3- (P*b+R*T) *V/2+a*V-a*b;
Ahora use:
P=10; R=0.08205; T=80+273.2;
fzero ('Vander', R*T/P)
-- ~.
En este caso el resultado que proporciona Matlab es:
ans = 2.8148
Dado que la función de este problema es un polinornio de tercer grado en el volumen, tam-
bién puede usarse la función roots que calcula todas las raíces de un polinornio. Para
ello use el guión que se proporciona enseguida:
P=10; R=0.08205; T=80+273.2;
a=3:599; b=0.04267;
roots ( [P - (P*b+R*T) a -a*b]
En este caso el resultado que proporciona Matlab es:
ans =
2.8148
0.0630 + 0.0386i
0.0630 - 0.0386i
Dado que el polinornio es de tercer grado, siempre tendremos tres raíces. Las posibilida-
des matemáticas son: tres raíces reales distintas, tres raíces reales iguales, dos raíces rea-
les iguales y una distinta, una raíz real y dos complejas conjugadas. En cada uno de estos
casos, ¿cuál de las tres correspondería al volumen buscado y qué significado tendrían las
dos restantes?
En el caso de la TI-92 Plus puede usar:
Al usar
Solve (10vA3-(.4267+. 08205*353.2) vA2+3.5Q9v-3.599*. 04267= O,v)
se obtiene:
v=2.81475
y al usar
cSolve(10vA3-(.4267+.08205*353.2)vA2+3.599v-3.59~'.04267=0, v)
se obtiene:
v=.062962+.038622i or v=.062962-.038622i or v=2.81475
92 Méto dos n u méricos aplicados a la ingeniería
También puede resolverse este problema con la función fzero de Matlab, para lo cual
es necesario escribir la siguiente función y grabarla en el área de trabajo de Matlab con el
nombre Vander.m:
Ahora use:
function f=Vander (V)
P=10; R=0.08205; T=80+273.2;
a=3.599; b=0.04267;
f=P*V/ 3- (P*b+R*T) *V/2+a*V-a*b;
P=10; R=0.08205; T=80+273.2;
fzero ( 'Vander', R*T/P)-- -.
En este caso el resultado que proporciona Matlab es:
ans = 2.8148
Dado que la función de este problema es un polinomio de tercer grado en el volumen, tam-
bién puede usarse la función roots que calcula todas las raíces de un polinomio. Para
ello use el guión que se proporciona enseguida:
P=10; R=0.08205; T=80+273.2;
a=3 : 599; b=0.04267;
roots ( [P - (P*b+R*T) a -a*b] )
En este caso el resultado que proporciona Matlab es:
ans =
2.8148
0.0630 + 0.0386i
0.0630 - 0.0386i
Dado que el polinomio es de tercer grado, siempre tendremos tres raíces. Las posibilida-
des matemáticas son: tres raíces reales distintas, tres raíces reales iguales, dos raíces rea-
les iguales y una distinta, una raíz real y dos complejas conjugadas. En cada uno de estos
casos, ¿cuál de las tres correspondería al volumen buscado y qué significado tendrían las
dos restantes?
En el caso de la TI-92 Plus puede usar:
Al usar
Solve (10vA3-(.4267+. 08205*353.2) v A2+3.5Q9v-3.599*. 04267=O, v)
se obtiene:
v=2.81475
y al usar
cSolve(10vA3- (.4267+.08205*353.2)vA2+3.599v-3.59~'.04267=0, v)
se obtiene:
v=.062962+.038622i or v=.062962-.038622i or v=2.81475
.:;0cual
con el
,tam-
. Para
ilida-
s rea-
estos
las
E
93Solución de ecuaciones no lineales
2.2 La fórmula de Bazin para la velocidad de un fluido en canales abiertos está dada por:
v = c (re)l/2
con
87
c=------
m
0.552+--
(r)I/2
donde:
m = coeficiente de rugosidad
r = radio hidráulico en pies (área dividida entre el perímetro mojado)
e = pendiente de la superficie del fluido
v = velocidad del fluido en pies/segundos
Calcule el radio hidráulico correspondiente a los siguientes datos (dados en unidades con-
sistentes) por el método de Steffensen.
m = 1.1; e = 0.001; v=5
Solución
87 (re)I/2
Sustituyendo c en v: v = ------
m
0.552+--
(r)I/2
o bien
m
(0.552 + --) v = 87 (r)I/2 (e)l/2
(r) l/2
multiplicando ambos lados por (r)I/2
[0.552(r)l/2 + m] v = 87 (e)I/2r
y "despejando" r se llega a:
[0.552(r)I/2 + m] v
r=-------
87 (e)l/2
una de las formas de g (r) = r, necesaria para el método de Steffensen. Sin embargo, antes
de usar el método, conviene averiguar el comportamiento de g' (r)
, 0.552 v
g (r)= 174 (r) 112 (e) 1/2
sustituyendo valores:
, 0.5
g (r) = (r)l/2
Como el radio hidráulico debe ser mayor de cero, ya que un valor negativo o cero no ten-
dría significado físico y como Ig' (r) I < 1 para (r)l/2 > 0.5, o r » 0.7, se selecciona como
valor inicial de raLO. Con esto:
g' (1) = 0.5
Solución de ecuaciones no lineales 93
2.2 La fórmula de Bazin para la velocidad de un fluido en canales abiertos está dada por:
v = c (re)l/2
Solución
con
87
c= - - - - - -
m
0.552+--
(r)I/2
donde:
m = coeficiente de rugosidad
r = radio hidráulico en pies (área dividida entre el perímetro mojado)
e = pendiente de la superficie del fluido
v =velocidad del fluido en pies/segundos
Calcule el radio hidráulico correspondiente a los siguientes datos (dados en unidades con-
sistentes) por el método de Steftensen.
o bien
m = 1.1; e =0.001; v = 5
87 (re)I/2
Sustituyendo c en v: v = - - - - - -
m
0.552 +--
(r)I/2
m
(0.552 + - - ) v = 87 (r)I /2 (e)1I2
(r) 1/2
multiplicando ambos lados por (r)I/2
[0.552(r)1I2 + m] v = 87 (e)I/2r
y "despejando" r se llega a:
[0.552(r)I/2 + m] v
r=----...".....--
87 (e)l/2
una de las formas de g (r) =r, necesaria para el método de Steffensen. Sin embargo, antes
de usar el método, conviene averiguar el comportamiento de g' (r)
, 0.552 v
g (r) = 174 (r) 112 (e)I/2
sustituyendo valores:
, 0.5
g (r) = (r)l/2
Como el radio hidráulico debe ser mayor de cero, ya que un valor negativo o cero no ten-
dría significado físico y como I g' (r) I < 1 para (r)I/2 > 0.5, o r> 0.7, se selecciona como
valor inicial de raLO. Con esto:
g' (1) = 0.5
94 Métodos numéricos aplicados a la ingeniería
y el método puede aplicarse con cierta garantía de convergencia:
Primera iteración
"o = 1
[0.552 (1)1/2+ 1.1] (5)
rl = g (ro) = = 3.00235
87 (0.001)1/2
[0.552 (3.00235)1/2 + 1.1] (5)
r2 = g (rl) = 87 (0.001)1/2 3.73742
(rl - ro)2 (3.00235 - 1)2
r3=rO- =1- =4.16380
r2 - 2rl + ro 3.73742 - 2 (3.00235) + 1
Segunda iteración
Tomando ahora como nuevo valor inicial r3
= 4.16380, se tiene:
'o = 4.16380
[0.552 (4.16380)1/2 + 1.1] (5)
rl = g (ro) = = 4.04622
87 (0.001)1/2
[0.552 (4.04622)1/2 + 1.1] (5)
r2 = g (rl) = = 4.01711
87 (0.001)1/2
6
(4.04622 - 4.16380)2
r =4.1 380------------
3 4.01711 - 2(4.04622) + 4.16380
= 4.00753
Dado que la sucesión es convergente y que se trata del radio de un canal abierto, donde la
exactitud después del primer decimal no es necesaria, se toma como valor a r = 4 pies.
Los cálculos pueden realizarse con Matlab o con la TI-92 Plus.
m=l.l; e=O.OOl; v=5;
rO=l;
for i=1:4
rl=(O.552*rOAO.5+m)*v/(87*eAO.5);
r2=(O.552*rlAO.5+m)*v/(87~eAO.5);
r=rO- (rl-rO) A2/ (r2-2~rl+rO);
fprintf ('%2d %8.5f %8.5f %8.5fn', i , rl, r2, r)
rO=r;
end
94 Métodos numéricos aplicados a la ingeniería
y el método puede aplicarse con cierta garantía de convergencia:
Primera iteración
ro = 1
[0.552 (1)1/2 + 1.1] (5)
rl = g (ro) = = 3.00235
87 (0.001)1/2
[0.552 (3.00235)1/2 + 1.1] (5) ~
r2 = g (rl ) = = 3.7-,742
87 (0.001)1/2
r
3
= ro _ (rl - ro)2 = 1 _ (3.00235 -1)2 = 4.16380
r2- 2rl + ro 3.73742 - 2 (3.00235) + 1
Segunda iteración
Tomando ahora como nuevo valor inicial r3 = 4.16380, se tiene:
ro = 4.16380
[0.552 (4.16380)1/2 + 1.1] (5)
rl = g (ro) = = 4.04622
87 (0.001)1/2
[0.552 (4.04622)1/2 + 1.1] (5)
r2 = g (rl ) = = 4.01711
87 (0.001)1/2
6
(4.04622 - 4.16380)2
r = 4.1 380- - -- - - - - - - --
3 4.01711 - 2(4.04622) + 4.16380
= 4.00753
Dado que la sucesión es convergente y que se trata del radio de un canal abierto, donde la
exactitud después del primer decimal no es necesaria, se toma como valor a r =4 pies.
Los cálculos pueden realizarse con Matlab o con la TI-92 Plus.
m=l.l; e=O.OOl; v=5;
rO=l;
for i=1:4
rl=(O .552*rOAO.5+m)*v/(87*eAO.5};
r2=(O.552*rl AO.5+m}*v/(87*eAO.5);
r=rO- (rl -rO) A2/ (r2-2~rl+rO);
fprintf ('%2d %8.5f %8.5f %8.5fn', i, rl, r2, r)
rO=r;
end
(
a
Solución de ecuaci ones no lineales 95
P2_2(
Prgm
1.1 ...•m : .OOl ...•e : 5....• v : 1....• rO ClrIO
For i, 1, 4
(.55?-Y(rO) +m)*v / (87'-'-Y(e) ) ...•x
(.55?-Y(x) +m)*v / (87*-Y(e) ) ...•Y
rO- (x-rO) /''2/ (y-?x+rO) ...•r
fonnat (i, "It)") &" "&format (x, "f5") ...•d
ds" "&fonnat (y, "f5") &" "&format (r, "f5") ...•d
Disp d
r+rt)
EndFor
EndPrgm
2.3 La siguiente fórmula es atribuida a Francis" y se aplica a un vertedor con contracciones
Q = 3.33(B - 0.2 H)(H3)1I2,
donde:
Q = cantidad de agua que pasa por el vertedor en piesi/s
B = ancho del vertedor en pies
H = carga sobre la cresta del vertedor en pies
Si se sabe que B varía de Oa 5 y Q de Oa 33, calcule los valores de H correspondien-
tes a las siguientes parejas de valores de By Q (las unidades son consistentes), con el mé-
todo de Newton-Raphson.
B 3 2 4 3.6
Q 12 20 13 30
Solución Se escribe la ecuación en la forma
f(H) = 3.33 (B - 0.2 H) (H3)112- Q = O
Se deriva
ff (H) = 3.33 (B - 0.2 H) (1.5 )H1I2 + (H3)1I2 (3.33) (-0.2)
Y sustituyendo en la férmula de Newton-Raphson af (H) y f ' (H), se tiene:
3.33(B - 0.2H) (H3yl2 - Q
H¡+l = H¡ - 4.995(B _ 0.2H) HII2¡ _ 0.666 (H3)1I2
Para elegir un valor inicial de H en cada caso, se considera que por cuestión de diseño H
debe ser menor que B. Por lo anterior, se sugiere utilizar como valor inicial Ho = B/2.
Para la pareja B = 3, Q = 12
Primera iteración
Ho = B/2 = 3/2 = l.5
* J. Lipka. Computaciones gráficas y mécanicas. CECSA (1972) pp. 139·141.
Solución de ecuaciones no lineales 95
P2_2 (
Prgm
1.1 -+m : .OOl-+e : 5. -+v : 1. -+r O CirIO
For i , 1, 4
( . 552*"l(rO) +m) * v / (87""'; (e) ) -+x
(. 552*"';(x) +m)*v / (87*"'; (e) ) -+y
r O- (x- r O) /''2/ (y - 2*x +rO) -+r
fonnat (i, "f O") &" "&format (x, "f5")-+d
d&" " &f ormat (y, "f5") &" " &f onnat (r, " f5")-+d
Disp d
r-+rO
EndFor
EndPrgm
2.3 La siguiente fórmula es atribuida a Francis' y se aplica a un vertedor con contracciones
Q = 3.33(B - 0.2 H)(H3)1/2,
donde:
Q = cantidad de agua que pasa por el vertedor en pies3/s
B = ancho del vertedor en pies
H = carga sobre la cresta del vertedor en pies
Si se sabe que B varía de Oa 5 y Qde Oa 33, calcule los valores de H correspondien-
tes a las siguientes parejas de valores de By Q (las unidades son consistentes), con el mé-
todo de Newton-Raphson.
B 3 2 4 3.6
Q 12 20 13 30
Solución Se escribe la ecuación en la forma
f(H) = 3.33 (B - 0.2 H) (H3)112 - Q = O
Se deriva
f' (H) = 3.33 (B - 0.2 H) (1.5 )HII2 + (H3)1I2 (3.33) (-0.2)
Ysustituyendo en la férmula de Newton-Raphson af (H) y f I (H), se tiene:
3.33(B - 0.2H) (H3yl2 - Q
H¡+I =H¡ - 4.995(B _ 0.2H) H1I2¡ _ 0.666 (H3)1I2
Para elegir un valor inicial de H en cada caso, se considera que por cuestión de diseño H
debe ser menor que B. Por lo anterior, se sugiere utilizar como valor inicial Ho = BI2.
Para la pareja B =3, Q =12
Primera iteración
Ho = B/2 = 3/2 = 1.5
* J. Lipka. Computaciones gráficas y mécanicas. CECSA (1972) pp. 139-141.
96 Métodos numéricos aplicados a la ingeniería
H = 1.5 _ 3.33 [3 - 0.2 (1.5) ] (1.53
)112 - 12 = 1.2046
1 4.995[3 _ 0.2 (1.5) ] (1.5)112 - 0.666 (1.53)1/2
Segunda iteración
6
3.33 [3 - 0.2 (1.2046)](1.20463)112 - 12
H2 = 1.204 - = 1.1942
4.995[3 - 0.02 (1.2046)] (1.2046)1/2 - 0.666 (1.20463)1/2
Tercera iteración
9
3.33 [3 - 0.2 (1.1942)](1.19423)112 - 12
H = 1.1 42 - = 1.1942
3 4.995[3 - 0.2 (1.1942) ] (1.1942)1/2 - 0.666 (1.19423)1/2
El método ha convergido al valor 1.1942 y se toma como carga sobre la cresta del vertedor
1.2 pies; las demás cifras significativas no interesan, por el sentido físico que tiene H.
Los resultados para las siguientes parejas de B y Q se dan a continuación:
B 3.62 4
Q
H
20
2.5
30
2.0
13
1.0
Los cálculos pueden realizarse con Matlab o con la Tl92-Plus.
~
B=3; Q=12;
H=B/2; Eps=O.Ol; dist=l;
While dist > Eps
F=3.33*(B-0.2*H)*HA
1.5-Q;
DF=4.995* (B-O. 2*H)*WO. 5-0. 66fi!'W1.5;
H1=H-F/DF;
dist=abs (H1-H) ;
disp([H1,dist] ) ;
H=H1;
end
P2_3(
Prgm
Define f(h) =3.33 (b-.2h) hA
1.5-q
Define df(h) =4.995 (b-.2h) ,J(h) -.66hA
1.5
3.->b : 12.->q : b/2->h : .Ol.+eps : ClrIO
Loop
h-f(h) /df (h)->h1
abs (h1-h) ->dist
fonnat (h, "f3") s« "&fonnat (dist, "f5")->d
Disp d
h1->h
If Dist<eps
Exit
EndLoop
EndPrgm
96 Métodos numéricos aplicados a la ingeniería
H = 1.5 _ 3.33 [3 - 0.2 (1.5) ] (1.5
3
)112 - 12 1.2046
1 4.995[3 _ 0.2 (1.5) ] (1.5)112 - 0.666 (1.53)1/2
Segunda iteración
3.33 [3 - 0.2 (1.2046)](1.20463)112 - 12 .
H2 = 1.2046 - = 1.1942
4.995[3 - 0.02 (1.2046)] (1.2046)112 - 0.666 (1.20463)1/2
Tercera iteración
3.33 [3 - 0.2 (1.1942)](1.19423)112 - 12
H = 1.1942 - = 1.1942
3 4.995[3 - 0.2 (1.1942) ] (1.1942)1/2 - 0.666 (1.19423)112
El método ha convergido al valor 1.1942 y se toma como carga sobre la cresta del vertedor
1.2 pies; las demás cifras significativas no interesan, por el sentido físico que tiene H.
Los resultados para las siguientes parejas de B y Q se dan a continuación:
B
Q
H
2
20
2.5
4
13
1.0
3.6
30
2.0
Los cálculos pueden realizarse con Matlab o con la TI92-Plus.
B=3; Q=12;
H=BI2; Eps=O.Ol; dist=l ;
While dist > Eps
F=3 . 33'" (B- O. 2!'H)*W1 . 5- Q;
DF=4 . 995* (B-O.2!'H)*WO . 5- 0. 6661'W'1.5;
H1=H- FIDF;
dist=abs (H1-H) ;
disp ( [H1 , dist] ) ;
H=H1 ;
end
P2_3 ( )
Prgm
Define f(h) =3.33 (b-.2h) h"1 . 5- q
Define df (h) =4 .995 (b-.2h) --./(h) - .66h"1.5
3 .->b : 12.->q : bl2->h : . Ol->eps : ClrIO
Loop
h-f(h) Idf (h)->h1
abs (hl - h) ->dist
format (h, "f3") &" " &format (dist, "f5")->d
Disp d
hl->h
If Dist<eps
Exit
EndLoop
EndPrgm
En la solución de problemas de valor inicial en ecuaciones diferenciales por transforma-
das de Laplace" se presentan funciones racionales del tipo
Solución de ecuaciones no lineales 97
( 2.4
F (s) = p¡ (s)
P2 (s)
42 donde PI YP2 son polinomios con: grado p¡ ~ grado P2·
La expresión deF (s) en fracciones parciales es parte importante del proceso de solu-
ción y se realiza descomponiendo primero P2 (s) en sus factores más sencillos posibles.
En la solución de un problema de valor inicial'" (PVI) que modela un sistema de
control lineal, la función de transferencia es (obtenida al aplicar la transformada de La-
place al PVI)
e (s) 24040 (s + 25)
F (s) = -- = ----,-----,,-------
R (s) s4 + 125 s3 + 5100 S2 + 65000 s + 598800
Para expresar en términos más sencillos a F (s) se resuelve primero la ecuación polinomial
S4 + 125 s3 + 5100 S2 + 65000 s + 598800 = O
Con el método de Müller (programa 2.3 del disco), se tiene
SI = -6.6 + 11.4 i
S2 = -6.6 - 11.4 i
s3 = -55.9 + 18 i
S4 = -55.9 -18 i
Para obtener estos resultados se puede usar la siguiente instrucción de Matlab
roots ( [1 125 5100 65000 598800] )
Con lo que se obtiene:
ans -55.8899 + 18.0260i
-55.8899 - 18.0260i
-6.6101 + 11.3992i
-6.6101 - 11.3992i
..
y los factores buscados son: 1;
"
(s + 6.6 - 11.4i):(s + 6.6 + 11.4i) (s + 55.9 - 18i) (s + 55.9 + 18i)
con lo que F (s) queda
24040 (s + 25)
F(s)=-----
FI F2 F3 F4
donde:
• Spiegel, Murray R., Applied Differential Equations. 2nd Ed Prentice Hall, Inc (1967), pp. 263-270 .
•• Véase capítulo 7.
Solución de ecuaciones no lineales 91
2.4 En la solución de problemas de valor inicial en ecuaciones diferenciales por transfonna-
das de Laplace*se presentan funciones racionales del tipo
F (s) = PI (s)
P2 (s)
donde PI YP2 son polinomios con: grado PI :S; grado P2·
La expresión de.F (s) en fracciones parciales es parte importante del proceso de solu-
ción y se realiza descomponiendo primero P2 (s) en sus factores más sencillos posibles.
En la solución de un problema de valor inicial** (PVI) que modela un sistema de
control lineal, la función de transferencia es (obtenida al aplicar la transformada de La-
place al PVI)
. e (s) 24040 (s + 25)
F (s) = - - = -----,----.....,-- - - - - -
R (s) S4 + 125 s3 + 5100 s2 + 65000 s + 598800
Para expresar en términos más sencillos a F (s) se resuelve primero la ecuación polinomial
S4 + 125 s3 + 5100 S2 + 65000 s + 598800 =O
Con el método de Müller (programa 2.3 del disco), se tiene
S I = - 6.6 + 11.4 i
S2 = -6.6 - 11.4 i
s3 =- 55.9 + 18 i
S4 = -55.9 -18 i
Para obtener estos resultados se puede usar la siguiente instrucción de Matlab
roots ( [1 125 5100 65000 598800] )
Con lo que se obtiene:
ans - 55.8899 + 18.0260i
-55.8899 - 18 . 0260i
-6.6101 + 11.3992i
- 6 .6101 - 11.3992i
.. .
y los factores buscados son: l'
"
(s + 6.6 - 11.4i)"(s + 6.6 + 11.4i) (s + 55.9 - 18i) (s + 55.9 + 18i)
con lo que F (s) queda
donde:
24040 (s + 25)
F(s) = - - - - -
F¡ F2 F3 F4
• Spiegel, Murray R., Applied Differential Equations. 2nd Ed Prentice Hall, lnc (1967), pp. 263-270.
•• Véase capítulo 7.
98 Métodos numéricos aplicados a la ingeniería
• I
El segundo paso que completa la descomposición pedida es encontrar los valores de
A" A2' A3' A4 que 'satisfagan la ecuación
. ..l
/., A A A A
F(S)=_I +_2 +_3 +_4
FI F2 F3 F4
Esto se logra pasando el denominador de F (s) al lado derecho
24040 (s +.,25) = AIF2F3F4 + A2F¡F3F4 + A3FIF2F4 + A4FIF2F3
Ydando valores a s, por ejemplo s = s l' Así
24040 (-6.6 + 11.4i + 25 ) =
Al (-6.6 + llAi + 6.6 + 11.4i)(-6.6 + llAi + 55.9 - 18i)(-6.6 + llAi + 55.9 + 18i),
ya que: A2FIF3F4 = A3F¡F2F4 = A4FIF2F3 = O.
Al despejar Al y realizar operaciones, se encuentra su valor
Fi
Com;
de I
Al = 1.195 -7.904i
Procediendo de igual manera, se calcula A2' A3' YA4 con s = s2' S = s3 Ys = S4' respectiva-
mente.
Esto se deja como ejercicio para el lector.
ar
2.5 Una vez descompuesto F (s) = e (s) / R(s) en fracciones parciales (véase ejercicio ante-
rior), se les aplica el proceso de "transformación" inversa de Laplace, que da como resul-
tado la solución del problema de valor inicial.
Sea esta solución
F (t) = 1.21e-6.6t sen (llAt - 111.7°) + 0.28e-55.9t sen (18t + 26.1°)
La solución obtenida debe analizarse matemáticamente e interpretarse físicamente si pro-
cede.
BREVE ANÁLISIS CLÁSICO
Si t es el tiempo, el intervalo de interés es t » O.
En los términos primero y segundo deF (t) aparece la función seno, que es oscilato-
ria, afectada de la función exponencial. Ésta tiende a cero cuando t tiene valores superio-
res al; se lleva tanto sus factores como la función F (t) a dicho valor, con lo cual la gráfica
F (t) se confunde con el eje t para t :::::1.
Estas funciones son conocidas como oscilatorias amortiguadas y sus gráficas son del
tipo mostrado en la figura 2.14.
Si, por el contrario, el exponente de e es positivo, al tender t a infinito, la función es
creciente y tiende rápidamente a infinito; lo cual se conoce como función oscilatoria no
amortiguada.
Por otro lado, obsérvese que la contribución numérica del segundo término de F (t) es
despreciable, y que el análisis y la gráfica de F (t) pueden obtenerse sin menoscabo de
exactitud con el primer término.
Si se dan algunos valores particulares a t se obtiene:
0.0 0.2 004 0.6 0.8 1.0
F (t) -1.124 0.105 0.044 -0.023 0.005 -4.22 X 10-5
98 Métodos numéricos aplicados a la ingeniería
, I
El segundo paso que completa la descomposición pedida es encontrar los valores de
A" A2, A3, A4 que satisfagan la ecuación
,j.',., A A A A
F(s)=-¡ +_2 + _ 3 +_4
FI F2 F3 F4
Esto se logra pasando el denominador de F (s) alIado derecho
24040 (s +,25) =A¡F2F3F4 + A2F¡F3F4 + A3FIF2F4 + A4FIF2F3
Ydando valores a s, por ejemplo s = sl' Así
24040 (-6.6 + 11.4i + 25 ) =
Al (-6.6 + 11Ai + 6.6 + 11.4i)(- 6.6 + 11Ai + 55.9 - 18i)(-6.6 + 11Ai + 55.9 + 18i),
ya que: A2FIF3F4 =A3F¡F2F4 =A4FIF2F3 =O.
Al despejar A l y realizar operaciones, se encuentra su valor
Al =1.195 -7.904i
Procediendo de igual manera, se calcula A2, A3, YA4 con s =s2' S =s3 Ys =S4' respectiva-
mente.
Esto se deja como ejercicio para el lector.
2.5 Una vez descompuesto F (s) = e (s) / R(s) en fracciones parciales (véase ejercicio ante-
rior), se les aplica el proceso de "transformación" inversa de Laplace, que da como resul-
tado la solución del problema de valor inicial.
Sea esta solución
F (t) = 1.21e-6.6t sen (lIAt - 111.7°) + 0.28e-55.9t sen (l8t + 26.1°)
La solución obtenida debe analizarse matemáticamente e interpretarse físicamente si pro-
cede.
BREVE ANÁLISIS CLÁSICO
Si t es el tiempo, el intervalo de interés es t> O.
En los términos primero y segundo deF (t) aparece la función seno, que es oscilato-
ria, afectada de la función exponencial. Ésta tiende a cero cuando t tiene valores superio-
res al; se lleva tanto sus factores como la función F (t) a dicho valor, con lo cual la gráfica
F (t) se confunde con el eje t para t :::: 1.
Estas funciones son conocidas como oscilatorias amortiguadas y sus gráficas son del
tipo mostrado en la figura 2.14.
Si, por el contrario, el exponente de e es positivo, al tender t a infinito, la función es
creciente y tiende rápidamente a infinito; lo cual se conoce como función oscilatoria no
amortiguada.
Por otro lado, obsérvese que la contribución numérica del segundo término de F (t) es
despreciable, y que el análisis y la gráfica de F (t) pueden obtenerse sin menoscabo de
exactitud con el primer término.
Si se dan algunos valores particulares a t se obtiene:
0.0 0.2 004 0.6 0.8 1.0
F (l) -1.124 0.105 0.044 -0.023 0.005 -4.22 X 10-5
(as de
i),
tiva-
ante-
esul-
ipro-
ilato-
erio-
áfica
n del
ón es
a no
(t) es
o de
Solución de ecuaciones no lineales
F(t)
Figura 2.14
Comportamiento
de una función
oscilatoria
amortiguada.
Estos valores señalan claramente la presencia de raíces reales en los intervalos (0,0.2),
(0.4,0.6), (0.6,0.8), (0.8,1.0): (véase Fig. 2.15). Utilizando como valores iniciales 0.1, 0.5,
0.7, Y 0.9 Y el método de Newton-Raphson se obtiene, respectivamente:
ti = 0.171013; t2
= 0.44659; t3 = 0.72217; r, = 0.99775
Los posibles máximos y mínimos de esta función se consiguen resolviendo la ecuación
que resulta de igualar con cero la primera derivada de F (t)
F' (t) = 13.794e-6.6t cos (11.4t-111.7°) -7.986e-6.6t sen (l1.4t - 111.7")
+ 5.04e-55.9/ cos (18t + 26.1°) -15.652 e-55.9/ sen (18t + 26.1°) = O
Aprovechando las evaluaciones que se hicieron de F ' (t) en el método de Newton-Raph-
son, se tiene:
0.0 0.3 0.6 0.9 1.00.1
F' (t) -0.040 7.849 -0.900 0.196 -0.035 -0.00184
Con los valores iniciales dados a la izquierda, se obtuvieron las raíces anotadas a la de-
recha
to = O
to = 0.2
to = 0.45
to = 0.75
ti = 0.00175
t2 = 0.26277
t3 = 0.53834
t,= 0.81399
Con los valores de la función en diferentes puntos, sus raíces y puntos máximos y míni-
mos, la gráfica aproximada de F (t) se muestra en la figura 2.12
Este análisis se puede comprobar con el PROGRAMA 2.2 del CD o el Matlab, por
ejemplo.
99
Figura 2.14
Comportamiento
de una función
oscilatoria
amortiguada.
Solución de ecuaciones no lineale s 99
F(t)
Estos valores señalan claramente la presencia de raíces reales en los intervalos (0,0.2),
(0.4,0.6), (0.6,0.8), (0.8,1.0): (véase Fig. 2.15). Utilizando como valores iniciales 0.1, 0.5,
0.7, Y0.9 Yel método de Newton-Raphson se obtiene, respectivamente:
ti = 0.171013; t2 = 0.44659; t3 = 0.72217; t4 = 0.99775
Los posibles máximos y mínimos de esta función se consiguen resolviendo la ecuación
que resulta de igualar con cero la primera derivada de F (1)
F I (l) =13.794e-6.6t cos (11.41-111.7°) -7.986e-6.6/ sen (l1.4t - 111.7°)
+ 5.04e-55.9/ cos (l8t + 26.1°) - 15.652 e-55.9/ sen (18t + 26.1°) = O
Aprovechando las evaluaciones que se hicieron de F I (t) en el método de Newton-Raph-
son, se tiene:
0.0 0.1 0.3 0.6 0.9 1.0
F I (t) - 0.040 7.849 - 0.900 0.196 -0.035 -0.00184
Con los valores iniciales dados a la izquierda, se obtuvieron las raíces anotadas a la de-
recha
to= O
lo =0.2
lo = 0.45
to= 0.75
ti = 0.00175
12 =0.26277
t3 =0.53834
t4 = 0.81399
Con los valores de la función en diferentes puntos, sus raíces y puntos máximos y míni-
mos, la gráfica aproximada de F (t) se muestra en la figura 2.12
Este análisis se puede comprobar con el PROGRAMA 2.2 del CD o el Matlab, por
ejemplo.
100 Métodos numéricos aplicados a la ingeniería
0.2
O
0.44
0.72
-0.2
-0.2
-0.2
-0.2
-1
Figura 2.15
Gráfica de la -1.2
función F (~. O 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
u
ml
6 2.6
32
Determine la cantidad de vapor V (moles/hr) y la cantidad de líquido L (moleslhr) que se
generan en una vaporización instantánea continua a una presión de 1600 psia y una tem-
peratura de 120 o F de la siguiente mezcla.
Componente Composición z¡ K¡ =yJx¡
CO2 0.0046 1.65
CH4 0.8345 1.80
C2H6 0.0381 0.94
C3HS 0.0163 0.55
i-C4
HIO 0.0050 0.40
n-C4H,o 0.0074 0.38
CSH'2 0.0287 0.22
C6H'4 0.0220 0.14
C7H'6 0.0434 0.09
Solución Con base en la figura 2.16
Un balance total de materia da F = L + V
Un balance de materia para cada componente da:
(1)
i = 1,2, ... , n (2)
Las relaciones de equilibrio líquido-vapor establecen
K=~1
Xi
i = 1,2,..., n (3)
Solución de e cuaciones no lineales 101
Vapor Generado
V (moles/h), Y¡
Alimentación
F(mollh)
Figura 2.16
Esquema de
una vaporización
instantánea
(flash) de una
mezcla
multicomponente.
Z¡
Líquido
Sustituyendo la ecuación 3 en la 2 se obtiene
Fz, = L.x, + VK,x¡ i = 1,2, ..., n (4)
L (moles/h), x¡
o bien
Fz, = x¡ (L + VK) i = 1,2, ..., n
de donde
Fz¡
x¡=--'--
L+ VK¡
Sustituyendo la ecuación 1 en esta útlima se obtiene:
i = 1,2, ..., n
Fz¡
x· = ----'----
I F + V (K¡ -1)
Las restricciones de composición establecen
i = 1,2, ..., n (5)
11
L x¡= 1
i= 1
11
L Y¡= 1
i= 1
fl 11
I. s,», - I.
¡= 1 ¡= 1
x.=O1.
Por lo que puede escribirse:
n
L Y¡
¡= 1
o bien:
o simplemente:
n
L xi (Ki - 1) = O
i= 1
(6)
sustituyendo la ecuación 5 en la 6 se obtiene:
f Fz¡ (K¡ - 1) = O
i= 1 F + V(K¡ - 1)
(7)
Figura 2.16
Esquema de
una vaporización
instantánea
(flash) de una
mezcla
multicomponente.
Solución d e ecuaciones no lineales
Alimentación
F(mollh)
Z¡
Sustituyendo la ecuación 3 en la 2 se obtiene
Fz¡=Lx¡ + VK.xi
o bien
Fz¡= x¡ (L + VK)
de donde
Fz¡
x¡=----'~
L+ VK¡
i = 1,2,.. " n
i = 1, 2,.. " n
i = 1,2" ," n
Sustituyendo la ecuación 1 en esta útlima se obtiene:
Vapor Generado
V(moles/h), Yi
Líquido
L (moles/h), Xi
Fz¡
x· =----'-- -
1 F + V (K¡ -1)
i = 1,2,.. " n
Las restricciones de composición establecen
Por lo que puede escribirse:
o bien:
o simplemente:
11 11
L x¡ = 1 L Y¡= 1
i~ I i= 1
n 11
L Y¡ - L x¡ = O
¡~ I i= I
11
¡= 1 ¡= 1
11
x. = OL
L x¡ (K¡ - 1) = O
i = 1
sustituyendo la ecuación 5 en la 6 se obtiene:
11 Fz . (K. - 1)
L 1 1 = 0
¡~ I F + V(K¡ - 1)
101
(4)
(5)
(6)
(7)
102 Métodos numérico s aplicados a la ingeniería
VALORES INICIALES
El valor de V que satisface la ecuación 7 está comprendido en el intervalo O :::;;V:::;;F, por
10 que la estimación de un valor inicial de Ves difícil, ya que el valor de F puede ser muy
grande. Esta dificultad se reduce normalizando el valor de V; esto es, dividiendo numera-
dor y denominador de la ecuación 7 entre F, para obtener
11 z. (K - 1)
L "
i=ll+lfI(K¡-I)
(8)
donde lfI = V/F
La ecuación 8 equivale a la 7, pero expresada en la nueva variable lfI cuyos límites son:
La ecuación 8 es no lineal en una sola variable (lfI), que se resolverá con el método de New-
ton-Raphson. Hay que observar que esta ecuación es monotónica decreciente, por lo que el
valor inicial puede ser cualquier número dentro del intervalo [O, 1], por ejemplo lfIo = O.
El PROGRAMA 2.4~ del CD emplea lfIo = Ocomo estimado inicial y
I! -z.(K - 1)2
l' (lfI) = i~1 [1 + 'lfI (Ki _ 1)]2
A continuación se muestran los valores que adquiere lfI y f (lfI) a lo largo de las iteracio-
nes realizadas.
Iteración lfI f (1p)
1 0.9328799 -8.79 X 10-2
2 0.8968149 -1.29 X 10-2
3 0.8895657 -3.5 X 10-4
4 0.8893582 -2.68 X 10-7
5 0.8893580 -1.5 X 10-13
RESULTADOS
Para F = 1 moles/h
Vapor generado: V = 0.889358 moles/h
Líquido generado: L = 0.11 0642 moles/h
Composiciones del líquido y del vapor generados:
Componente Vapor (y)Líquido (x)
CO2
CH4
C2H6
C3Hg
i-C4HIO
n-C4HIO
CSH12
C6Hl4
C7HI6
0.00291
0.48759
0.04025
0.02718
0.01072
0.01650
0.09370
0.09356
0.22760
0.00481.
0.87766
0.03783
0.01495
0.00429
0.00627
0.02061
0.01310
0.02048
Solución de ecuaciones no lineales 103
Los cálculos de este problema pueden realizarse con Matlab o con la TI-92 Plus.
or
uy
ra-
n:
Z=[0.0046 0.8345 0.0381 0.0163 0.0050 ...
0~·0074 0.0287 0.0220 0.0434];
K=[1.65 1.80 0.94 0.55 0.40 ...
0.38 0.22 0.14 0.09];
Eps=le-3; f=l; Fi=O; i =0;
fprintf(' Fi f(Fi) n')
whi1e and(abs(f»Eps,i<10)
f=sum ((Z. * (K-1)) ./ (1+Fi * (K-J))) ;
df=sum ((-Z. * (K-1) . -2) ./(l+Fi*(K-1)). -2);
FiJ=Fi-f/df;
fprintf('%10.6f %8.2en' ,Fi,f)
Fi=FiJ; i=i+J;
end
fprintf('Fi= %10.6fn',Fi)
fprintf('x(i) y(i) n')
for i=1:9
X(i) =Z (i) / (l+Fi* (K(i) -1));
y (i) =K (i) *x (i) ;
fprintf ('%10.5f %10.5fn' .x (i) ,Y (i))
end
(8)
IV-
el
p2_6( )
Prgm
.0046-+z[1] . 8345-+z[2]
.0163-+z [4] .0050-+z [5]
.0287-+z[7] .0220-+z[8]
1.65-+ k [1] 1. Br+k: [2]
. 55-+k[4] . 40-+k [5]
. 22-+k [7] . 14-k[8]
.001-+eps J-+f : O-+fi:
WhiJe ebs (f) >eps or i <10
O-+f : (r+d
For i,l,9
f+z [i]* (k [i] -1) / (1+fi* (k [i] -1) -t f
ci-z [i]* (k [i] -1) A2/ (1+fi* (k [i] -1)) -2-+d
EndFor
fi-f/d-->fi
Disp fi
EndWhiJe
EndPrgm
.0381-+z[3]
.0074-+z[6]
.0434-+z[9]
. 94-+k [3]
. 38-+k[6]
.09-+k[9]
Or+i : C1rIO
También puede utilizarse la función fzero de Matlab:
Con su editor de texto escriba el siguiente guión y grábelo con el nombre Flash. m
en el directorio de trabajo de Matlab:
Solución de ecuaciones no lineales 103
Los cálculos de este problema pueden realizarse con Matlab o con la TI-92 Plus.
Z= [0 . 0046 0 . 8345 0 . 0381 0 . 0163 0 . 0050 ...
0 . 0074 0 . 0287 0. 0220 0 . 0434] ;
K= [1 . 65 1.80 0 . 94 0 . 55 0 . 40...
0.38 0 .22 0 . 14 0 . 09] ;
Eps=le-3; f =l ; Fi=O; i =0;
fprintf(' Fi f(Fi) n')
whi1e and(abs (f»Eps , i<10)
f=sum ((Z . *(K- 1)) . / (1 +Fi *(K- J))) ;
df=sum((-Z .* (K- 1) . -2) . /(1+Fi*(K-1)) . -2) ;
Fil=Fi - f/df;
fprintf ('%10 . 6f %8.2en' , Fi , f)
Fi=Fil ; i=i+1;
end
fprintf('Fi= %10.6fn',Fi)
fprintf('x(i) y(i) n')
for i=1 : 9
X (i) =Z (i) / (l+Fi* (K(i) - 1)) ;
y (i) =K(i) *x(i) ;
fprintf ('%10 . 5f %10 . 5fn' , X (i) , Y(i))
end
p2_6( )
Prgm
. 0046-+z [1]
. 0163-+ z[4]
. 0287-+z[7J
1 . 65-+k[1]
. 55-+k[4J
.22-+k[7J
. 8345-+z[2]
. 0050-+ z [5J
. 0220-+z[8J
1 . 8-+k[2]
.40-+k[5]
. 14- k[8]
. 0381-+z[3J
.0074-+ z[6]
. 0434-+z [9]
. 94-+k[3J
. 38-+k[6J
. 09-+k[9]
. 00l-+eps 1-+f : 0-+fi : 0-+i : C1rIO
While abs (f » eps or i <10
O-+f : O-+d
For i , 1, 9
f+z [i]* (k [i] -1) / (1+fi* (k [i] - 1)-+f
d- z [iJ* (k[iJ - 1) "2/ (l+fi* (k[iJ - 1) ) -2-+d
EndFor
fi-f/d-+fi
Disp fi
EndWhile
EndPrgm
También puede utilizarse la función fzero de Matlab:
Con su editor de texto escriba el siguiente guión y grábelo con el nombre F1a sh . m
en el directorio de trabajo de Matlab:
104 Métodos num éricos aplicados a la ingeniería
function f=Flash (Fi)
Z=[0.0046 0.8345 0.0381 0.0163 0.0050 ...
0.0074 0.0287 0.0220 0.0434J;
K=[1.65 1.80 0.94 0.55 0.40 ...
0.38 0.22 0.14 0.09J;
f =sum ( (Z . * (K -1) ) . / (1 +Fi.* (K - 1) ) ) ;
Ahora use el guión dado enseguida para resolver el problema:
l'
Z=[0.0046 0.8345 0.0381 0.0163 0.0050 ...
0.0074 0.0287 0.0220 0.0434J;
K=[1.65 1.80 0.94 0.55 0.40 ...
0.38 0.22 0.14 0.09J;
Fi=fzero ('Flash',O)
for i=1:9
X (i)=Z (i)/ (1+Fi * (K (i)-1) ) ;
Y(i)=K(i)*X(i) ;
fprintf('%10.5f %10.5fn',X(i),Y(i))
end
~ 2.7 Considere un líquido en equilibrio con su vapor. Si el líquido está formado por los com-
ponentes 1,2,3 Y4, con los datos dados a continuación calcule la temperatura y la compo-
sición del vapor en el equilibrio a la presión total de 75 psia.
1
2
3
4
Composición del Presión de vapor de
líquido % mol componente puro (psia)
a 150°F a 200°F
10.0 25.0 200.0
54.0 14.7 60.0
30.0 4.0 14.7
6.0 0.5 5.0
Componente
Utilice la siguiente ecuación para la presión de vapor:
i = 1,2, 3,4;
n
Solución La presión total del sistema será: PT = L P¡
i= 1
(1)
Si se considera que la mezcla de estos cuatro componentes, a las condiciones de
presión y temperatura de este sistema, ob~ece las leyes de Raoult y de Dalton
4
PT= L PiQ
X¡
¡= 1
(2)
donde:
p¡Q = presión de vapor de cada componente.
PT = presión total del sistema.
Solución de ecuaci ones no lineales 105
P¡ = presión parcial de cada componente
X¡ = fracción mol de cada componente en el líquido
De la ecuación de presión de vapor se tiene que
p¡O = exp (A¡ + B¡ /T)
de las ecuaciones 1 y 2 resulta
i = 1,2, 3, 4 (3)
4
PT = L X¡ exp (A¡ + BJT)
¡= 1
(4)
de donde puede establecerse
4
f(l) = PT- L X¡ exp (A¡ + BJT) = O
¡= 1
(5)
A¡ Y B¡ pueden obtenerse como sigue
Si se hace pt = presión de vapor del componenete ia TI = 150 °P = 609.56 °R
pg,¡ = presión de vapor del componente i a T2
= 200 "F = 659.56 °R
entonces
in (po¡ ) = A + B./T¡,lit
i = 1,2,3,4 (6)
y
1n (p02 . ) = A + B./ T,2,1 l 1
i = 1,2,3,4 (7)
restando la ecuación 7 de la 6 se tiene
de donde
pO
ln(~)
P2,i
B¡ = -:-1------=1"'-
- --
TI T2
Conociendo B¡ se puede obtener A¡ de la ecuación 6
(8)
A = In (pOI ) - B/T¡t ,1 1
i = 1,2, 3,4 (9)
VALORES INICIALES
Para estimar un valor inicial de T para resolver la ecuación 5, se considera el compo-
nente dominante de la mezcla, en este caso el componente 2, y se usa PT en lugar de pg
en la ecuación de presión de vapor
de donde
(lO)
Solución de ecuaciones no lineales 105
p¡ = presión parcial de cada componente
X¡ = fracción mol de cada componente en el líquido
De la ecuación de presión de vapor se tiene que
p¡o = exp (A¡ + B¡ /T)
de las ecuaciones 1 y 2 resulta
i = 1,2, 3, 4
4
PT = I, X¡ exp (A¡ + B¡lT)
¡= ,
de donde puede establecerse
4
f(T) =PT - I, X¡ exp (A¡ + B¡lT) =O
¡= ,
A¡ YB¡ pueden obtenerse como sigue
Si se hace p~,¡ =presión de vapor del componenete i a TI = 150°F =609.56 °R
pg,¡ =presión de vapor del componente i a T2 =200°F =659.56 °R
entonces
In (po,.) = A + B/T,,1 , 1
i =1,2, 3,4
y
1n ( p~ ) =A + B/ T2_ .1 1 I
i = 1,2,3,4
restando la ecuación 7 de la 6 se tiene
°In ( p~,¡ ) =B¡ (1 / T, - 1/ T2
)
de donde
P2,i
pO
In (--f!-)
P2,¡
B¡ =-1----"1"-
- - -
T, T2
Conociendo B¡ se puede obtener A¡ de la ecuación 6
A = In (pO, ) - B./T,I ,1 l
i =1,2,3,4
VALORES INICIALES
(3)
(4)
(5)
(6)
(7)
(8)
(9)
Para estimar un valor inicial de T para resolver la ecuación 5, se considera el compo-
nente dominante de la mezcla, en este caso el componente 2, y se usa PT en lugar de pg
en la ecuación de presión de vapor
de donde
(10)
I '
106 Métodos numéricos aplicados a la ingeniería
Con este resultado inicial y las consideraciones ya anotadas, el PROGRAMA 2.5 del
CD, utiliza el método de Newton-Raphson con
4
l' (T) = - L x¡ exp (A¡ + B¡ IT) (-B¡ I T 2)
¡= 1
(11)
y reporta los siguientes resultados después de cuatro iteraciones
Temperatura del sistema = 209.07 °F = 668.63 °R
(temperatura de burbuja)
Composición del vapor en equilibrio E:
Componente (i ) Yi
1
2
3
4
0.3761
0.5451
0.0729
0.0059
(e
Los cálculos de este problema pueden realizarse con el siguiente guión de Matlab:
P1=[25 14.74 0.5);
P2=[200 60 14.7 5};
T1=150+459.56;
T2=200+459.56;
B=log(P1./P2)/(1/T1-1/T2);
A=log(P1) -B/Tl;
X=[0.10 0.54 0.30 0.06};
PT=75; i=O; f=l; Eps=O.OOOOOl;
T=B(2) / (log (PT)-A (2)) ;
fprintf (' T f (T) n' , T, f)
while and (abs (f»Eps,i<lO)
f=PT-sum (X.*exp (A+B/T) ) ;
df=sum (X.*exp (A+B/T) . * (B/T/''2) ) ;
Tl=T-f/df;
fprintf('%10.2f %8.2en' ,T,f)
T=Tl;
i=i+l;
end
fprintf (' y (i) n' )
for i=1:4
y (i) = (X (i)*exp (A(i) +B(i) /T)) /PT;
fprintf('%10.4f n',Y(i))
end
~ 2.8 Se emplea un intercambiador de calor (Fig. 2.17) para enfriar aceite. Encuentre la tempe-
ratura de salida del aceite y del agua enfriadora (TH2
y TC2
, respectivamente), para gastos
de aceite de 105,000; 80,000; 50,000; 30,000 y 14,000 lbmlh.
106
~ 2.8
~
Métodos numéricos aplicados a la ingeniería
Con este resultado inicial y las consideraciones ya anotadas, el PROGRAMA 2.5 del
CD, utiliza el método de Newton-Raphson con
4
f' (7) = - L X¡ exp (A¡ + BJ7) (-B¡ / T 2)
¡ = 1
y reporta los siguientes resultados después de cuatro iteraciones
Temperatura del sistema = 209.07 °F = 668.63 °R
(temperatura de burbuja)
Composición del vapor en equilibrio
Componente (i) Yi
2
3
4
0.3761
0.5451
0.0729
0.0059
Los cálculos de este problema pueden realizarse con el siguiente guión de Matlab:
P1=[25 14 . 74 0.5} ;
P2=[200 60 14. 7 5};
T1=150+459 . 56;
T2=200+459.56;
B=log(P1 . /P2)/(1/T1 -1/T2) ;
A=log(P1) -B/T1;
X=[0 . 10 0.54 0. 30 0. 06} ;
PT=75; i=O ; f=1 ; EPs=0.000001;
T=B (2) / (log (PT) -A(2) ) ;
fprintf (' T f (T) n' , T, f)
while and(abs (f»EPs,i<10)
f=PT- sum (X.*exp (A+BIT)) ;
df=sum (X. *exp (A+BIT) .* (BIT/''2)) ;
T1=T-fldf;
fprintf('%10 .2f %8 . 2en' , T, f )
T=T1;
i=i+1;
end
fprintf (' y (i) n')
for i=1 : 4
y (i) = (X (i)*exp (A (i) +B (i) /T)) /PT;
fprintf(' %10. 4f n' , Y(i))
end
(11)
Se emplea un intercambiador de calor (Fig. 2.17) para enfriar aceite. Encuentre la tempe-
ratura de salida del aceite y del agua enfriadora (TH2 y Te2, respectivamente), para gastos
de aceite de 105,000; 80,000; 50,000; 30,000 y 14,000 lbmlh.
Solución de ecuaciones no lineales 107
agua: 300 gal/min (fluido 2)
I TC,=80FCp,=)BTu/()bF)
r---------------------------~-----,
A = 879ft2
aceite TH, = 250 F
U= 120 BTU
hft'FCp, = 0.5 BTU/(I b F)
(fluido i)
Figura 2.17
Esquema de un
intercambiador
de calor con
flujo a
contracorriente. TC =?
2
Solución Un balance de calor para el aceite da:
Q¡ = w¡CP¡ (TH¡ - TH2)
Un balance de calor para el agua da:
La ecuación que rige la transferencia de calor a través de este equipo es:
Q = U A I1Tm
donde:
U = coeficiente global de transferencia de calor
A = área total de tranferencia de calor
(TH¡ - TC2
) - (TH2
- TC¡ )
I1Tm = ---'---=----=-----=---
in ( TH) - TC2 )
TH2-TC)
Para encontrar TH2 y TC2 debe cumplirse que Q) = Q2 = Q, o bien:
Q
- -1=0
Q¡
Pero Q sólo podrá calcularse cuando se conozcan todas las temperaturas. Para resolver es-
te problema se propone el siguiente procedimiento.
Establecer que TH2
sea la única variable; entonces, Q2 puede escribirse en función
de TH2 como sigue
Q2 = Q) = w¡ Cp; (TH¡ - TH2) = w2 CP2 (TC2 - TC))
de donde puede despejarse TC2
w¡ Cp .
TC2 = -- (TH¡ -TH2) + Te)
w2CP2
Con todo esto ya puede establecerse Q en función de TH2
, y así escribir la ecuación 5 tam-
bién en función de dicha variable única:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
Figura 2.17
Esquema de un
intercambiador
de calor con
flujo a
contracorriente.
Solución
Solución de ecuaciones no lineales 107
agua: 300 gal/min (fluido 2)
I TC,= 80F Cp, =IBTU/( lbF)
r----------------------------L-----,
aceite TH = 250 F,
---~]
Cp, = 0.5 BTU/(I b F)
(fluido ])
U= 120 BTU
hft'F
A = 879fe
TC = ?,
Un balance de calor para el aceite da:
Un balance de calor para el agua da:
La ecuación que rige la transferencia de calor a través de este equipo es:
Q= U A I1Tm
donde:
U = coeficiente global de transferencia de calor
A = área total de tranferencia de calor
(TH] - TC2) - (TH2 - TC[ )
I1Tm = - ----'---""------'=---------"--
ln ( TH I - TC2 )
TH2- TC]
Para encontrar TH2 y TC2 debe cumplirse que Q] = Q2 = Q, o bien:
Q
- - 1 =0
Q[
TH, = ?
(1)
(2)
(3)
(4)
(5)
Pero Qsólo podrá calcularse cuando se conozcan todas las temperaturas. Para resolver es-
te problema se propone el siguiente procedimiento.
Establecer que TH2 sea la única variable; entonces, Q2 puede escribirse en función
de TH2 como sigue
Q2 = Q¡ = w] Cp] (TH] - TH2) = w2 CP2 (TC2- TC¡)
de donde puede despejarse TC2
w] Cp]
TC2 =- - (TH I -TH2) + TC¡
w2CP2
(6)
(7)
Con todo esto ya puede establecerse Q en función de TH2, y así escribir la ecuación 5 tam-
bién en función de dicha variable única:
/
l'
- .
108 Métodos numéricos aplicados a la ingeniería
VALORES INICIALES
Para estimar un valor inicial de TH2
cabe apoyarse en la figura 2.18, la cual muestra una
gráfica de temperaturas en este tipo de intercambiadores de calor.
De acuerdo con esta gráfica, se tienen las siguientes restricciones
y
Te¡ < Te2 < TH¡
Como en este caso no se dispone de mayor información, el PROGRAMA 2.6 del CD em-
plea el método de la bisección con TH2! = Te¡ + 0.5 Y TH2D
= TH¡ - 0.5 para resolver la
ecuación 8.
T
TH,
Figura 2.18
Gráfica de
temperaturas TH2
contra longitud
en un TC2
intercambiador
TC,
de calor con
flujo a
contracorriente. O L x
Para un gasto de aceite de 105,000 lbmlh
RESULTADOS
TH2 =113 Te2 = 128
Los cálculos de este problema pueden realizarse con el siguiente guión de Matlab:
Solución de ecuaciones no lineales 109
wl=105000; w2=300*6(J1'2.2i'3.785;
cpl=0.5; CP2=1; 0=120; A=879;
TH1=250; TC1=80; EPs=O.OOOl;
TH2i=TC1+O.5; TH2d=TH1-O.5; fm=l;
Ql=wl*cpl* (THl-TH2i); TC2=Q1I (w2i'CP2)+TC1;
DTm=((TH1-TC2)-(TH2i-TC1))/log((THl-TC2)/(TH2i-TC1));
fi=[J!'A*!YI'm/Ql-l;
Ql=wl*CP1*(THl-~~d); TC2=Ql/(w2"CP2)+TC1;
!YI'm=((TH1-TC2)-(TH2d-TC1))/log((TH1-TC2)/(TH2d-TC1));
fd=[J!'!f"DTm/Ql-l;
if fi*fd<O
while abs (fm) > EPs
TR2m=(TH2i+TH2d)/2;
Ql=wl*CP1* (TH1-TH2m) ;TC2=Ql/ (w2*CP2)+TC1;
lYI'm=((THl-TC2)-(TH2m-TC1))/log((THl-TC2)/(TH2m-TC1));
fm=LFA*DTm/Ql-l;
if fi*fm < O
TH2d=TH2m; fd=fm;
else
TH2i=TH2m; fi=fm;
end
end
else
disp ('TH2iy TH2d no encierran una raíz')
break
end
TH2=(TH2i+TH2d)/2;
Ql=wl*cpl* (THl-TH2); TC2=Ql/ (w2"CP2)+TC1;
fprintf('TH2= %8.2f TC2= %8.2fn',TH2,TC2)
2.9 El siguiente circuito representa en forma muy simplificada un generador de impulsos pa-
ra probar el aislamiento de un transformador en circuito abierto.
Considérese el gap como un interruptor.
Las condiciones iniciales en el transformador y la inductancia son cero. Use los si-
guientes datos para encontrar v2
(t):
Figura 2.19
Circuito
representativo
de un
generador de
impulsos.
CI = 12.5 X 10-9 Id,
RI = 2 Kohms,
C2 = 0.3 X 10-9 Id,
R2 = 3 Kohms,
gap L¡
+~
I
______________________________ J
GENERADOR DE IMPULSOS
L¡ = 0.25 X 10-3 Hy
VI = 300 Kv
TRANSFORMADOR
Solución de ecuaciones no lineales 109
wl=105000; w2=300;'6(J1'2.2"3.785;
cpl=0.5; CP2=1; U=120; A=879;
TH1=250; TCl=80; EPs=O . OOOl;
TH2i=TC1+0.5; TH2d=TH1-0.5; fm=l;
Ql=wl*cpl* (THl-TH2i); TC2=Ql/(w2"CP2) +TC1;
DTm=((TH1- TC2) -(TH2i-TC1))/log((THl-TC2)/(TH2i -TC1))¡
fi=[JI'A*DTm/Ql- l;
Ql=wl*cpl*(TH1-~Y2d); TC2=Ql/(w2"CP2)+TC1¡
DTm=((THl-TC2)-(TH2d-TC1))/log((TH1-TC2)/(TH2d-TC1))¡
fd=[JI'lf"DTm/Ql-l;
if fi*fd<O
while abs (fm) > EPs
TH2m=(TH2i+TH2d)/2;
Ql=wl*CP1* (TH1-TH2m) ; TC2=Ql/ (w2*CP2) +TC1;
DTm=((THl-TC2)-(TH2m-TC1))/log((THl- TC2)/(TH2m- TC1)) ¡
fm=[j'A*DTm/Ql-l ;
if fi*fm < O
TH2d=TH2m; fd=fm ;
else
TH2i=TH2m¡ fi=fm;
end
end
else
disp ('TH2i y TH2d no encierran una raíz')
break
end
TH2=(TH2i+TH2d)/2¡
Ql=wl*CP1* (TH1-TH2); TC2=Ql/ (w2'CP2) +TC1;
fprintf('TH2= %8.2f TC2= %8.2fn' , TH2,TC2)
2.9 El siguiente circuito representa en forma muy simplificada un generador de impulsos pa-
ra probar el aislamiento de un transformador en circuito abierto.
Figura 2.19
Circuito
representativo
de un
generador de
impulsos.
Considérese el gap como un interruptor.
Las condiciones iniciales en el transformador y la inductancia son cero. Use los si-
guientes datos para encontrar v2 (t):
CI = 12.5 X 10-9 fd,
RI = 2 Kohms,
C2 = 0.3 X 10-9 fd,
R2 = 3 Kohms,
----- - ------------ - ------------
gap I
+~o------:-r
I
______________________________ J
GENERADOR DE IMPULSOS
L¡ =0.25 X 10-3 Hy
VI = 300 Kv
TRANSFORMADOR
110 Métodos numéri cos aplicados a la ingeniería
Solución Estableciendo las ecuaciones para el circuito.
Figura 2.20
Circuito.
di (t) 1
v¡ (t) = (R¡ + R2)i¡ (t) + L, ¡ + - J i,(t) dt - R2i2(t)
dt e¡
(1)
I •
(2)
1
v2 (t) = - J i2 (t) dt
e2
Aplicando la transformada de Laplace y considerando que las condiciones iniciales son
cero, se tiene:
(3)
V¡ 1 I¡ (s)
- = (R¡ + R2)I¡ (s) + L, sl, (s) + - -- - Ri2 (s)
S e, s
(4)
1 12
(s)
o = - R2I¡ (s) + Ri2 (s) + - ---
e2
(s)
(5)
Despejando I¡ (s) de la ecuación 5 y sustituyendo en la ecuación cuatro se tiene:
V¡
12
(s) = -------!...------
(R¡ + LIS + l/e¡s)(s + lIR2e2) + l/e2
al aplicar la transformada inversa de Laplace a la ecuación 3 y recordando que las condi-
ciones iniciales son cero
(6)
1 12
(s)
V2
(s)=- --
e2
(s)
(7)
Se sustituye la ecuación 6 en la 7
~
e2
V2(s)=--------~-------
s ((R¡ + L¡s + _l_)(s + __ 1_) + _1_ )
e¡s R2
e2
e2
y simplificando se llega a:
V2
(s) = ---------
s3 + P ¡ S 2 + P2S + P3
v (8)
110 Métodos numéricos aplicados a la ingeniería
Solución Estableciendo las ecuaciones para el circuito.
Figura 2.20
Circuito.
(1)
(2)
1
v? (t) =- I i2 (t) dt
- C2
(3)
Aplicando la transformada de Laplace y considerando que las condiciones iniciales son
cero, se tiene:
(4)
1 /2 (s)
0= - R2 /, (s) + R?/2 (s) + - - --
- C2
(s)
(5)
Despejando J, (s) de la ecuación 5 y sustituyendo en la ecuación cuatro se tiene:
V,
J2
(s) = - - - - - - - - " - - - - - -
(R, + L,s + I/C,s)(s + lIR2C2) + lIC2
(6)
al aplicar la transformada inversa de Laplace a la ecuación 3 y recordando que las condi-
ciones iniciales son cero
Se sustituye la ecuación 6 en la 7
y simplificando se llega a:
V
2
(s) = _1_ /2 (s)
C2 (s)
(7)
(8)
•
Solución de ecuaciones no lineales 111
con
La ecuación 8 puede escribirse:
V
V? (s) = --------
- (s + a) (s + b) (s + e)
cuya transformada inversa de Laplace es
(
e:" e !" e-c1
v2 (t) = V + + -----
(b-a) (e-a) (e-b) (a-b) (a-e) (b-e)
donde a, b y e son las raíces de la ecuación
s3 + PI
s2 + P2
S + P3
= O
La primera raíz, obtenida con el programa 2.3 del apéndice, es
a = - 1.5874547 X 104
Se reduce el grado del polinomio y aplicando la fórmula cuadrática, se tiene
b = -4.547618 X 106 + l.310346 X 106 i
e = -4.547618 X 106 - l.310346 X 106 i
Recuerde que puede utilizar la función roots de Matlab.
Estos valores se sustituyen en la ecuación 9 y se tiene:
v
2
(t) = 300 ( 0.6e-1.5874547 x ¡O"¡
_e-4·547618 x 10
6
1 [ 0.6 cos (1.310346 X 106t)
+ 2.072102 sen (l.310346 X 106t) ])
donde t está en segundos y v2
(t) en Kvolts.
2.10 Se tiene una columna articulad a en ambos extremos (véase Fig. 2.21a). Aplicando una car-
ga vertical pequeña P (de modo que no se pandee), se obtiene una reacción R de igual mag-
nitud y de sentido contrario en la base. Si ahora se aplica una carga horizontal PH se
obtiene un pandeo infinitesimal (imperceptible a la vista), que se ha magnificado en la fi-
gura 2.2Ib, con fines de ilustración. Si se empieza a "jugar" aumentando P y disminuyen-
do PH' de modo que se mantenga el mismo pandeo en la columna, va a llegar un momento
(9)
Solución de ecuaciones no lineales 111
con
v =_ V_1_ =__V_1'------_
C2
L1
75 X 10- 15
La ecuación 8 puede escribirse:
V
V? (s) =--------
- (s + a) (s + b) (s + e)
cuya transformada inversa de Laplace es
v2 (t) = V + + - - - -
(
e-at e-bt e-GI
(b-a) (e-a) (e-b) (a-b) (a-e) (b-e)
donde a, b y e son las raíces de la ecuación
s3 + PI s2 + P2 S + P3 = O
La primera raíz, obtenida con el programa 2.3 del apéndice, es
a = - 1.5874547 X 104
Se reduce el grado del polinomio y aplicando la fórmula cuadrática, se tiene
b = -4.547618 X 106 + 1.310346 X 106 i
e = -4.547618 X 106 - 1.310346 X 106 i
Recuerde que puede utilizar la función roots de Matlab.
Estos valores se sustituyen en la ecuación 9 y se tiene:
v2
(t) = 300 ( 0.6e-1.5874547 x 10
4
(
_e-4·547618 x 106( [ 0.6 cos (1.310346 X 106t)
+ 2.072102 sen (1.310346 X 106
t) ])
donde t está en segundos y v2 (t) en Kvolts.
(9)
2.10 Se tiene una columna articulada en ambos extremos (véase Fig. 2.2Ia). Aplicando una car-
ga vertical pequeña P (de modo que no se pandee), se obtiene una reacción R de igual mag-
nitud y de sentido contrario en la base. Si ahora se aplica una carga horizontal PH se
obtiene un pandeo infinitesimal (imperceptible a la vista), que se ha magnificado en la fi-
gura 2.2Ib, con fines de ilustración. Si se empieza a "jugar" aumentando P y disminuyen-
do PH' de modo que se mantenga el mismo pandeo en la columna, va a llegar un momento
~~_.~~----~~--------~----------------------------------------------------~----------------~--~--
112 Métodos numéricos aplicados a la ingeniería
P P
y..,¿.----+y
Figura 2.21
Columna
articulada. Res
la reacción de
la carga.
x! R=P
e)
e
en que PH
valga cero y el valor de P correspondiente será llamado la carga crítica de pan-
deo Pc. Para obtener esta carga crítica se hace un análisis de la estabilidad de la columna,
usando la proposición de Jacobo Bernoulli: la curvatura producida en una viga debida a la
flexión es directamente proporcional al momento flexionante e inversamente proporcional
a la rigidez, es decir:
K=~
El'
donde K es la curvatura, M el momento flexionante, E es el módulo de elasticidad del ma-
terial e 1el momento de inercia que depende de la forma de la sección transversal de la co-
lumna. El producto El se conoce como la rigidez a la flexión de la columna. Por otro lado
I
I .
K=---¡::::::.==:==-
11+ ( dy )2
Y dx
y ya que el pandeo es infinitesimal 2 (las pendientes de las tangentes a la curva elásti-
ca) son muy pequeñas, despreciándose y quedando entonces la curvatura aproximada por
d2
y
K""--
dx?
De igual modo se tiene que M = -Py, donde el signo es convencional.
Sustituyendo se tiene
Py
-o
El'
Haciendo A = ~ y observando que el desplazamiento y de la columna en ambos extro-
El
mos es nulo se tiene el siguiente problema de valores en la frontera:
d2
y
--+A2
y=0
dx2
y (O) = O
Y (L) = O
112
Figura 2.21
Columna
articulada. Res
la reacción de
la carga.
Métodos numéricos aplicados a la ingeniería
p p
";NJ----+y
b) e)
en que PH valga cero y el valor de P correspondiente será llamado la carga crítica de pan-
deo Pc. Para obtener esta carga crítica se hace un análisis de la estabilidad de la columna,
usando la proposición de Jacobo Bernoulli: la curvatura producida en una viga debida a la
flexión es directamente proporcional al momento flexionante e inversamente proporcional
a la rigidez, es decir:
K = ~
El'
donde K es la curvatura, M el momento flexionante, E es el módulo de elasticidad del ma-
terial e 1el momento de inercia que depende de la forma de la sección transversal de la co-
lumna. El producto El se conoce como la rigidez a la flexión de la columna. Por otro lado
K=--¡::::== = =-
11+ ( dy )2
Y dx
y ya que el pandeo es infinitesimal:; (las pendientes de las tangentes a la curva elásti-
ca) son muy pequeñas, despreciándose y quedando entonces la curvatura aproximada por
d2y
K"" - -
dx2
De igual modo se tiene que M = - Py, donde el signo es convencional.
Sustituyendo se tiene
Py
- o
El'
Haciendo A=~ y observando que el desplazamiento y de la columna en ambos extro-
El
mos es nulo se tiene el siguiente problema de valores en la frontera:
d 2y
--+A2
y=0
dx 2
y (O) = O
Y (L) =O
z= =EZ
;
Solución de ecuaciones no lineales 113
')()---+) Y
Figura 2.22
Columna
articulada y
empotrada en
'la base. x
R=P
cuya solución analítica da lugar a
Si ahora se tiene una columna articulada por arriba y empotrada en el piso (véase Fig.
2.22) Y se quiere conocer la carga crítica de pandeo correspondiente, el análisis de la esta-
bilidad de la columna conduce al problema de valores en la frontera siguierite:
d2y HA__ +~2y= X
dx? f, El
y (O) ~ O
Y (L) = O
y' (L) = O
La solución analítica de este tipo de problemas produce, en pasos intermedios, ecua-
ciones no lineales en una incógnita. Así, para nuestro problema, se tiene:
'AL = tan 'AL
que habrá que resolver para encontrar y en función de x.
Solución Con el objeto de simplificar, haremos, x = 'AL con lo que la ecuación anterior queda:
tan x = x
Resolviendo con el método de Newton-Raphson se obtiene x = 4.493409.
~ 2.11 La respuesta de un sistema de control de retroalimentación simple, mostrado en la figura
2.23, está dada por la expresión"
c= G1G2R+~U
l+G l+G
donde G = G¡G2
H. Cuando el factor del denominador, 1 + G, se Iguala a cero, se obtiene
la ecuación característica del sistema de lazo cerrado. Las raíces de la ecuación caracterís-
tica determinan la forma o tipo de la respuesta C(t) a cualquier función forzante particular
R(t) o U(t) .
• Cughanowr, Process Systems Analysis and Control, Second Edition, McGraw Hill Intemational Editions.
Figura 2.22
Columna
articulada y
empotrada en
' la base.
Solución de ecuaciones no lineales 113
-----+) Y
R=P
x
cuya solución analítica da lugar a
Si ahora se tiene una columna articulada por arriba y empotrada en el piso (véase Fig.
2.22) Yse quiere conocer la carga crítica de pandeo correspondiente, el análisis de la esta-
bilidad de la columna conduce al problema de valores en la frontera siguierite:
d2y HA
dx 2 + ')..} y = El x
y (O) ~ O
Y (L) = O
y' (L) = O
La solución analítica de este tipo de problemas produce, en pasos intermedios, ecua-
ciones no lineales en una incógnita. Así, para nuestro problema, se tiene:
AL =tan AL
que habrá que resolver para encontrar y en función de x.
Solución Con el objeto de simplificar, haremos, x = AL con lo que la ecuación anterior queda:
tan x =x
Resolviendo con el método de Newton-Raphson se obtiene x = 4.493409.
6 2.11 La respuesta de un sistema de control de retroalimentación simple, mostrado en la figura
2.23, está dada por la expresión*
c= G1G2R+~U
l+G l+G
donde G = G¡G2H. Cuando el factor del denominador, 1 + G, se Iguala a cero, se obtiene
la ecuación característica del sistema de lazo cerrado. Las raíces de la ecuación caracterís-
tica determinan la forma o tipo de la respuesta C(t) a cualquier función forzante particular
R(t) o U(t) .
• Cughanowr, Process Systems Analysis and Control, Second Edition, McGraw Hill Intemational Editions.
114 Métodos num éricos aplicados a la ingeniería
Figura 2.23 R
Sistema
de control de
retroalimentación
simple.
I---r-- ..•.C
El método de lugar geométrico de las raíces es un procedimiento gráfico para encon-
trar las raíces de 1 + G = O, cuando uno de los parámetros de G varía continuamente. En
este caso el parámetro que variará es la ganancia (o sensitividad) Kc del controlador. En el
diagrama de bloques de la figura 2.23
G¡=Kc
1
G2
=------
("r¡s + 1)("r2
s + 1)
1
H=--
"r3s+ 1
Para este caso, la función de transferencia de lazo abierto es:
K
G(s) = -------
(s - p¡)(s - P2)(S - P3)
va
raíces;
incre
0.1 pa
con ir
que puede escribirse en la forma
b) Di;
lugar I
de
Se llama a los términos p¡, P2 YP310s polos de la función de transferencia de lazo abier-
to. Un polo de G(s) es cualquier valor de s para el cual G(s) es infinito. Por tanto p¡ = -llr¡
es un polo de G(s).
La ecuación característica del sistema de lazo cerrado es:
K
1 + -------- = O
(s - p¡)(s - P2)(S - P3)
Esta expresión puede escribirse:
(s - p¡)(s - P2)(s - P3) + K = O
Si por ejemplo, los polos fueran -1, -2 Y-3, respectivamente, tendríamos:
(s + l)(s + 2)(s + 3) + K = O
donde K = 6Kc.
Expandiendo el producto de esta ecuación resulta:
s3 + 6s2 + lIs + (K + 6) = O,
114 Métodos numéricos aplicados a la ingeniería
Figura 2.23 R
Sistema
de control de
retroalimentación
simple.
El método de lugar geométrico de las raíces es un procedimiento gráfico para encon-
trar las raíces de 1 + G = O, cuando uno de los parámetros de G varía continuamente. En
este caso el parámetro que variará es la ganancia (o sensitividad) Kc del controlador. En el
diagrama de bloques de la figura 2.23
G¡ =Kc
1
G2
= - - -- - -
('r¡s + 1)('r2s + 1)
1
H =--
'r3s + 1
Para este caso, la función de transferencia de lazo abierto es:
que puede escribirse en la forma
K
G(s) = - - - - - - -
(s - p¡)(s - P2)(S - P3)
Se llama a los términos p¡, P2 YP310s polos de la función de transferencia de lazo abier-
to. Un polo de G(s) es cualquier valor de s para el cual G(s) es infinito. Por tanto p¡ =-111"¡
es un polo de G(s).
La ecuación característica del sistema de lazo cerrado es:
K
1 + - - - - - - - - = O
(s - p¡)(s - P2)(S - P3)
Esta expresión puede escribirse:
(s - p¡)(s - P2)(S - P3) + K =O
Si por ejemplo, los polos fueran -1, -2 Y-3, respectivamente, tendríamos:
(s + l)(s + 2)(s + 3) + K = O
donde K = 6Kc.
Expandiendo el producto de esta ecuación resulta:
s3 + 6s2 + lIs + (K + 6) =O,
¡er-
-!lr¡
una ecuación polinomial de tercer grado en s. Para cualquier valor particular de la ganan-
cia del controlador Kc' podemos obtener las raíces de la ecuación característica. Por ejem-
plo, si K, = 4.41 (K = 26_5), tenemos:
s3 + 6s2 + l l s + 32.5 = O
- - -K Raíz real 1 a 1 b ..•.
0.000 -1.00000 -2.00000 -3.00000
h
0.100 -1.05435 -1.89897 -3.04668
~ 0.200 -1.12111 -1.79085 -3.08803
0.300 -1.21352 -1.66106 -3.12542
0.11.00 _<'1<;070 _1 d?01<; -o no<?o-
._1" crvv 1) -oin'i Af-... n ~~ AnA'lC __ " nCAAI")
K Raíz real 1 a 1 b ....I0.381 -1.37583 -1.47078 -3.15340
0.382 -1.38220 -1.46407 -3.15373
O:lR:l -1.38984 -1.45610 -3.15407-
• 0.384 -l.4UUUU -1.44!JtiU -::l.1!J44U
• 0.386 -3.15507 -1.42247 -0.02520
o.ss. w,;~,.I!J!J4L - .4ZZ::lL -U.U::l4tll
K Raíz real 1. a I b ..•.
t59.996 -5.99991 -0.00004 3.31655 -59.997 -5.99994 -0.00003-- 3.31657 -
59.998 -5.99996 -0.00002 3.31659
59.999 -5.99998 -0.60001
---
3.31661
~ tJU.UUL -tJ.uuuuu ; -UoUUUUU ~.~ltJtJ¿
60.001 -6.00002 -0.00001 3.31664
er oo~ _~ 0000.11. -o OOOO? q q1~~~
60.003 -6.00006 -0.00003 3.31668
~OOOA _~ 00((0 _(((((.11. q'H~7(
-
Solución de ecuaciones no lineales 115
3.958
v.l/
I K3=60 I1- .../ 1/
/
I
1/
I K2=0.384 ~



1
Resolviendo por el método de Newton Raphson se encuentra una raíz real; posteriormen-
te se degrada el polinomio con división sintética y se resuelve la ecuación cuadrática re-
sultante, dando en este caso:
a)
Figura 2.24
a) Tabla de
valores de las
raíces; arriba con
incrementos de
0.1para K; abajo
con incrementos
de 0.001.
b) Diagrama del
lugar geométrico
de las raíces.
3.166
2.375
1.583
0.792
0.000
-0.79
-1.58
-2.37
-3.16
-3.95
-6.713 -5.299 -3.885 -2.471 -1.057 0.357
-6.006 -4.592 -3.178 -1.764 -0.350
b)
r¡ = -5.10, r2 = -0.45 - 2.5}, r3= -0.45 + 2.5j.
Seleccionando otros valores de K, se obtienen otros conjuntos de raíces. Para facilitar los
cálculos se elaboró el PROGRAMA 2.8 (lugar geométrico de las raíces) que permite obte-
ner estos conjuntos de raíces para diferentes valores de K, desde un valor inicial K = O,
hasta algún valor seleccionado y con incrementos también seleccionados. El programa
también grafica estos conjuntos de raíces, con lo que puede verse el lugar geométrico de
las raíces. A continuación mostramos un segmento de la tabla generada por el programa
para un valor máximo de K = 100 con incrementos de 0.1 y la gráfica respectiva. Las cel-
das con fondo blanco representan raíces reales; las celdas con fondo amarillo representan
la parte real y las azules la parte imaginaria de las raíces complejas, que aparecen siempre
conjugadas a ± bj. Para simplificar la presentación, el programa escribe en la tabla sólo los
valores de a y b.
Nótese que hay tres ramas correspondientes a las tres raíces y que dichas ramas
"emergen" o empiezan (para K = O) en los polos de la función de transferencia de lazo
abierto (-1, -2, -3). El diagrama del lugar geométrico de las raíces es simétrico con res-
pecto al eje real para cualquier sistema. Esto se debe al hecho de que la ecuación caracte-
rística para un sistema físico tiene coeficientes reales y, por tanto, las raíces complejas de
dicha ecuación aparecen en pares conjugados.
El diagrama del lugar geométrico de las raíces tiene la ventaja de dar una idea a pri-
mera vista del tipo de respuesta cuando se cambia continuamente la ganancia del contro-
'r~-----------------------------------------------------------------------------------------------=------=-=--
116 Métodos numéricos aplicados a la ingeniería
lador. Por ejemplo, el diagrama de la figura 2.24b revela dos valores críticos de K; uno es
donde se hacen iguales dos de las raíces, y el otro es donde dos de las raíces son imagina-
rios puros. Por tanto, si las raíces son todas reales, lo cual ocurre para K < K2
= 0.384 (Fig.
2.24b), la respuesta será no oscilatoria. Si dos de las raíces son complejas y tienen partes
reales negativas (K2 < K < K3), la respuesta comprende términos senoidales amortiguados,
que produce una respuesta oscilatoria. Si K> K3 dos de las raíces son complejas y tienen
partes reales positivas, y la respuesta es senoidal creciente.
2.12 Es difícil situar el origen de los métodos numéricos; sin embargo, se conocía ya en
Babilonia el método para calcular aproximaciones de raíces cuadradas, que contiene todos
los elementos que caracterizan los métodos numéricos de hoy en día, excepto quizás por
el uso de la computadora. Veamos por ejemplo cómo aproximaban ti.
Tomaban un primer valor inicial: ~ = 1;30* [ ~ = 1;5]
Como resultaba una aproximación mayor que el valor correcto ya que
(~r = ~ = 2;15 > 2**, [ ( ~ r= ~ = 2.25].
Obtenían un segundo valor inicial que quedaba por abajo del valor correcto, dividiendo 2
por 3/2. El resultado es:
2 4 2 4
-- = -- = 1;20 [ -- = -- = 1.333333 ... ] (el resultado no es un decimal exacto)
3 3 3 3
2 2
Ahora se tienen dos valores, uno mayor y uno menor que el valor correcto; se obtiene una
mejor aproximación de ti sacando la media artimética de ellos: media de 1;30 Y
1.5 + 1.333333 ...
1;20 es 1;25 [ = 1.416666 ... ], que resultaba mayor al valor correcto:
2
(1:25)2 =2;0,25 [(1.416666 ... )2 = 2.006943 ... ]
Por tanto, 2 dividido por 1;25 da 1;24,42,21 [ 2 =1.411765 ... ], que es más peque-
1.416666 .
ño que el valor correcto: [(1.411765 ... )2 = 1.993080 ]. El valor medio de estas dos últi-
mas aproximaciones que encierran el valor correcto es:
[
1.416666 ... + 1.411765 ... ]
1;25 y 1;24,42,21 es 1;24,51,10 2 = 1.414215 ... ],
(1.414215 ... )2 = 2.000004066225
este valor resulta ser la aproximación encontrada en nuestros textos.[2 = 1.414213562373
en calculadoras modernas.
Comentarios. Conviene destacar varios aspectos, como por ejemplo:
a) Se emplea un sistema numérico posicional (base 60) desarrollado por los babilo-
nios para sus trabajos astronórnicos y matemáticos .
• Nótese el uso del sistema sexagesimal (base 60): horas; minutos, segundos o grados; minutos, segundos y que
la fracción 30 viene de multiplicar la fracción decimal 0.5 por 60. Entre [ lse escriben los valores en el siste-
madecimal.
•• La fracción sexagesimal 15 viene de multiplicar 0.25 por 60.
116 Métodos numéricos aplicados a la ingeniería
lador. Por ejemplo, el diagrama de la figura 2.24b revela dos valores críticos de K; uno es
donde se hacen iguales dos de las raíces, y el otro es donde dos de las raíces son imagina-
rios puros. Por tanto, si las raÍCes son todas reales, lo cual ocurre para K < K2 = 0.384 (Fig.
2.24b), la respuesta será no oscilatoria. Si dos de las raÍCes son complejas y tienen partes
reales negativas (K2 < K < K3), la respuesta comprende términos senoidales amortiguados,
que produce una respuesta oscilatoria. Si K> K3 dos de las raíces son complejas y tienen
partes reales positivas, y la respuesta es senoidal creciente.
2.12 Es difícil situar el origen de los métodos numéricos; sin embargo, se conocía ya en
Babilonia el método para calcular aproximaciones de raíces cuadradas, que contiene todos
los elementos que caracterizan los métodos numéricos de hoy en día, excepto quizás por
el uso de la computadora. Veamos por ejemplo cómo aproximaban ti.
Tomaban un primer valor inicial: ~ = 1;30* [ ~ = 1;5]
Como resultaba una aproximación mayor que el valor correcto ya que
(~ r= ~ = 2;15 > 2**, [ ( ~r= ~ = 2.25].
Obtenían un segundo valor inicial que quedaba por abajo del valor correcto, dividiendo 2
por 3/2. El resultado es:
2 4 2 4
- = - = 1;20 [ - = - = 1.333333...] (el resultado no es un decimal exacto)
3 3 3 3
2 2
Ahora se tienen dos valores, uno mayor y uno menor que el valor correcto; se obtiene una
mejor aproximación de ti sacando la media artimética de ellos: media de 1;30 Y
1.5 + 1.333333...
1;20 es 1;25 [ = 1.416666.. .], que resultaba mayor al valor correcto:
2
(1:25)2 =2;0,25 [(1.416666...)2 = 2.006943...]
Por tanto, 2 dividido por 1;25 da 1;24,42,21 [ 2 =1.411765 ...], que es más peque-
1.416666...
ño que el valor correcto: [(1.411765 ...)2 = 1.993080...]. El valor medio de estas dos últi-
mas aproximaciones que encierran el valor correcto es:
[
1.416666... + 1.411765... ]
1;25 y 1;24,42,21 es 1;24,51,10 2 = 1.414215...],
(1.414215 ...)2 = 2.000004066225
este valor resulta ser la aproximación encontrada en nuestros textos.[2 = 1.414213562373
en calculadoras modernas.
Comentarios. Conviene destacar varios aspectos, como por ejemplo:
a) Se emplea un sistema numérico posicional (base 60) desarrollado por los babilo-
nios para sus trabajos astronómicos y matemáticos.
• Nótese el uso del sistema sexagesimal (base 60): horas; minutos, segundos o grados; minutos, segundos y que
la fracción 30 viene de multiplicar la fracción decimal 0.5 por 60. Entre [ 1se escriben los valores en el siste-
ma decimal.
•• La fracción sexagesimal 15 viene de multiplicar 0.25 por 60.
/ Solución de ecuaciones no lineales 117
b) Es un método de dos puntos que encierran el valor buscado para luego tomar el
punto medio (bisección).
e) El orden de convergencia parece ser cuadrático porque el riúmero de cifras signi-
ficativas correctas se duplica en cada iteración.
d) Hay un criterio de terminación sustentado en la exactitud requerida por ellos pa-
ra sus cálculos.
e) Este método puede extenderse para resolver cierto tipo de ecuaciones polinómi-
cas (véase Probo 2.19).
f) Es un algoritmo que puede programarse fácilmente en una computadora.
Problemas
2.1 Dadas las siguientes expresiones para x = g (x), obtenga g/ex) y dos valores iniciales que
satisfagan la condición I g/ (x) I < 1
1
a) x=---
(x + 1)2 (
X - 1 )b)x=4+ --
x+I
e) x = sen x
d) tan x = In x
(
6 - X _X
3
)1/2
e) x =
4
sec x
j) x=--
2
2.2 Determine una g (x) y un valor inicial X
o tales que I g/ (x) I < 1 en las siguientes ecuaciones:
e) sen x + In x = O
d) e-tanx=O e) )x3sen x - In (cos x) = 3
2.3 Resuelva por el método de punto fijo las ecuaciones de los problemas anteriores.
2.4 Generalmente hay muchas maneras de pasar de f (x) = O a x = g (x) e incluso se pueden
obtener distintas formas de g (x) al "despejar" x de un mismo término de f (x).
Por ejemplo, en la ecuación polinomial
al "despejar" x del primer término se puede llegar a:
a) x = 3) 2x + 2 2 2
e) X=-+-
x x2
b) x = h + 2/x
¿Cuál g (x) sería más ventajosa para encontrar la raíz que está en el intervalo (1, 2)?
Calcule con un mismo valor inicial dicha raíz emplenado las tres g (x) y compare resul-
tados.
2.5 Utilice la fórmula de Francis (véase ejercicio 2.3)
a) Encuentre una expresión H = g (H) tal que usando como valor inicial H = B/2, el
método de punto fijo prometa convergencia (quizá sea necesaria una g (H) distinta
para cada pareja B, Q dada).
b) Con los valores de B y Q dados en el ejercicio 2.3 y los resultados del inciso a), calcu-
le los respectivos valores de H que satisfacen la ecuación de Francis.
/ Solución de ecuaciones no lineales 117
b) Es un método de dos puntos que encierran el valor buscado para luego tomar el
punto medio (bisección).
e) El orden de convergencia parece ser cuadrático porque el riúmero de cifras signi-
ficativas correctas se duplica en cada iteración.
d) Hay un criterio de terminación sustentado en la exactitud requerida por ellos pa-
ra sus cálculos.
e) Este método puede extenderse para resolver cierto tipo de ecuaciones polinómi-
cas (véase Probo 2.19).
f) Es un algoritmo que puede programarse fácilmente en una computadora.
Problemas
2.1 Dadas las siguientes expresiones para x = g (x), obtenga g'(x) y dos valores iniciales que
satisfagan la condición I g'(x) I < 1
1
a) x= - - -
(x + 1)2
d) tan x = In x
b) x=4+ - -
(
X - 1 )
x+1
(
6 - X_X3)1I2
e) x =
4
e) x = sen x
sec x
j) x = - -
2
2.2 Determine una g (x) y un valor inicial X
otales que I g' (x) I < 1 en las siguientes ecuaciones:
e) sen x + In x = O
d) e' -tanx=O e) ) x3sen x - In (cos x) = 3
2.3 Resuelva por el método de punto fijo las ecuaciones de los problemas anteriores.
2.4 Generalmente hay muchas maneras de pasar de f (x) = O a x = g (x) e incluso se pueden
obtener distintas formas de g (x) al "despejar" x de un mismo término de f (x).
Por ejemplo, en la ecuación polinomial
al "despejar" x del primer término se puede llegar a:
a) x = 3) 2x + 2 b) x = h + 2/x
2 2e) X=-+-
x x2
¿Cuál g (x) sería más ventajosa para encontrar la raíz que está en el intervalo (1, 2)?
Calcule con un mismo valor inicial dicha raíz emplenado las tres g (x) y compare resul-
tados.
2.5 Utilice la fórmula de Francis (véase ejercicio 2.3)
a) Encuentre una expresión H = g (H) tal que usando como valor inicial H = B/2, el
método de punto fijo prometa convergencia (quizá sea necesaria una g (H) distinta
para cada pareja B, Qdada).
b) Con los valores de B y Q dados en el ejercicio 2.3 y los resultados del inciso a), calcu-
le los respectivos valores de H que satisfacen la ecuación de Francis.
118 Métodos numéricos aplicados a la ingeniería
2.6 Sea el polinomio de grado n en su forma más general
f (x) = a,¡x" + an_l xn-l + an
_
2 x',-2 + ... + al x + ao
a) Calcule el número de multiplicaciones y sumas algebraicas necesarias para evaluar
f (x) en un punto dado mediante el método de Homer.
b) Calcule el número de multiplicaciones y sumas algebraicas requeridas para evaluar
f (x) en un punto dado usando la forma tradicional. Al comparar las cantidades de los
incisos (a) y (b), encontrará que el número de multiplicaciones y sumas algebraicas en
el arreglo de Homer se reduce prácticamente a la mitad. Como cada multiplicación in-
volucra errores de redondeo, este método de evaluación es más exacto y rápido.
2.7 Elabore un programa que evalúe polinomios según la regla de Homer.
2.8 Resuelva las siguientes ecuaciones por medio del método de Newton-Raphson,
a) In x - x + 2 = O
e) x - 2 cos x = O
b) xex-2=0
d) x3 - 5x =-1
2.9 Resuelva los siguientes sistemas de ecuaciones por medio del método de Newton-Raphson
a) 2x3-y=0 b) 2x2_y=0
x3-2-y3=0 x=2_y2
e) x2 + 5X y2 -3z + 1 = O d) (x_l)1/2 + y x -5 = O
x - sen y = 1 Y - sen x2 = O
y-e-z=O
2.10 La manera más simple de evitar el cálculo de f' (x) en el método de Newton-Raphson es
remplazarf'(x) en la ecuación 2.12 con un valor constante m. La fórmula resultante
f(x)
x.+l=x.- --
"m
define un método de convergencia lineal para m en cierto intervalo de valores.
a) Utilice este algortimo, conocido como el método de Wittaker, para encontrar una
raíz real de la ecuación
l '
f (x ) = x3 + 2 x2 +10 x - 20 = O
b) Con este algoritmo encuentre una raíz en el intervalo (1.5, 2.5) de la ecuación
f(x) = x3 - 12 x2 + 36 x - 32 = O
2.11 Demuestre que en el método de Newton-Raphson g' (x) = OYg " (x) ::f:. Opara raíces rea-
les no repetidas.
2.12 Dado un polinomio de grado n
(1)
elabore un programa para encontrar todas las raíces reales y complejas de P" (x), median-
te el método de Newton-Raphson.
El programa deberá tener incorporada la división sintética para:
a) Evaluar polinomios.
b) Degradar polinomios cada vez que se encuentre una raíz (véase Seco 2.10).
Solución de ecuac iones no lineales 119
2.13 Demuestre que en el método de Newton-Raphson
f" (x)
2!1' (x)
SUGERENCIA: Utilice la ecuación
E2 E3
E = g' (x) E + g" (x) -' + g'" (x) -' + ...
,+1 1 2! 3!
y los resultados del problema 2.11
2.14 El siguiente algoritmo se conoce como método de Richmond y es de tercer orden
2f(x)f' (x¡)
Xi+1 =x¡- 2rJ/(x)]2_f(x)f" (x)
Resuelva las ecuaciones de los problemas 2.8 y 2.9 con este algoritmo y compare los re-
sultados con los obtenidos con el método de Newton Raphson; por ejemplo, la velocidad
de convergencia y el número de cálculos por iteración.
2.15 Obtenga la expresión 2.14 del algoritmo de posición falsa, utilizando la semejanza de los
triángulos rectángulos cuyos vértices son: A XI X
M
y BX
D
X
w en la figura 2.7
2.16 La expresión 2.13, puede escribirse también
X
i
_1 f (x) - xJ (xi
_
1
)
x· 1 =1+ f(x)-f(xi
_
1
)
Explique por qué, en general, es más eficiente la ecuación 2.13 que la ecuación anterior en
la aplicación del método de la secante.
2.17 Resuelva por el método de la secante, posición falsa o bisección las siguientes ecuaciones
a) x log x-lO = O
b) sen x - ese x + 1 = O
e) e' + 2-X
+ 2 cos x - 6 = O
á) eX + x3 + 2x2 + lOx - 20 = O
l
SUGERENCIA: Utilice un análisis preliminar de estas funciones para obtener valores iniciales
apropiados.
2.18 Elabore un programa para encontrar una raíz de f (x) = O, por el método de posición falsa,
dada f (x) como una tabla de valores.
2.19 Encuentre una aproximación a 3[2 y a f3 mediante el método de la bisección.
El cálculo deberá ser correcto en cuatro dígitos significativos.
Sugerencia: considere f (x) = x3 - 2 = O Yf (x) = x2 - 3 = O, respectivamente.
2.20 Utilice la expresión 2.15 para hallar el número aproximado de iteraciones n a fin de en-
contar una raíz de
x2
+ 10 cos x = O
con una aproximación de 10-3. Encuentre además dicha raíz.
2.21 Aplique el método de bisección y el de posición falsa a la ecuación
7x-3
----=0
(x - 0.45)2
Use los intervalos (0.4, 0.5) Y (0.39, 0.53). Explique gráficamente los resultados.
2.22 Demuestre que en el caso de convergencia de una sucesión de valores xo' xi' x2' •.. a una
raíz x en el método de punto fijo se cumple que
Solución de ecuacion es no lineales 119
2.13 Demuestre que en el método de Newton-Raphson
SUGERENCIA: Utilice la ecuación
f 11 (x)
2!1' (x)
E 2 E 3
E . = g' (x) E + gil (x) _ ' + gil' (x) - ' + ...
1+1 1 2! 3!
y los resultados del problema 2.11
2.14 El siguiente algoritmo se conoce como método de Richmond y es de tercer orden
2f(x)f' (x¡)
Xi + 1
= x¡- 2rJ'(x)]2 _ f(x)f" (x)
Resuelva las ecuaciones de los problemas 2.8 y 2.9 con este algoritmo y compare los re-
sultados con los obtenidos con el método de Newton Raphson; por ejemplo, la velocidad
de convergencia y el número de cálculos por iteración.
2.15 Obtenga la expresión 2.14 del algoritmo de posición falsa, utilizando la semejanza de los
triángulos rectángulos cuyos vértices son: A XI XM y Bxo Xw en la figura 2.7
2.16 La expresión 2.13, puede escribirse también
Xi
_1 f (x) - xJ (xi
_
J
)
x· 1 =1 + f(x) - f(xi
_
1
)
Explique por qué, en general, es más eficiente la ecuación 2.13 que la ecuación anterior en
la aplicación del método de la secante.
2.17 Resuelva por el método de la secante, posición falsa o bisección las siguientes ecuaciones
a) x log x-lO = O
b) sen x - csc x + 1 = O
e) eX + 2-x + 2 cos x - 6 =O
á) eX + x3 + 2x2 + lOx - 20 = O
SUGERENCIA: Utilice un análisis preliminar de estas funciones para obtener valores iniciales
apropiados.
2.18 Elabore un programa para encontrar una raíz def (x) =O, por el método de posición falsa,
dadaf (x) como una tabla de valores.
2.19 Encuentre una aproximación a 3f2 y a f3 mediante el método de la bisección.
El cálculo deberá ser correcto en cuatro dígitos significativos.
Sugerencia: considere f (x) =x3- 2 =OYf (x) =x2 - 3 =O, respectivamente.
2.20 Utilice la expresión 2.15 para hallar el número aproximado de iteraciones n a fin de en-
contar una raíz de
X2 + 10 cos x = O
con una aproximación de 10-3. Encuentre además dicha raíz.
2.21 Aplique el método de bisección y el de posición falsa a la ecuación
7x-3
---~ = O
(x - 0.45)2
Use los intervalos (0.4, 0.5) Y(0.39, 0.53). Explique gráficamente los resultados.
2.22 Demuestre que en el caso de convergencia de una sucesión de valores xo' xi' x2' ... a una
raíz x en el método de punto fijo se cumple que
120 Métodos numéricos aplicados a la ingeniería
E· 1
lím _,+_ = g' (x)
,-+0-:. E.
1
2.23 Las siguientes sucesiones convergen y los límites de convergencia de cada una se dan al
lado derecho
(_ 1 ) k
a) xk=---
k
lím {xk
} = O
k->oc
b) xn
= n In ( 1 + lIn)
2k+1 + ( _ l)k
e) xk = -----,----
2k
ti) xk=l+e-k
lím {xn } = 1
k->oc
lím {xk } = 2
k->oc
lím {xk
} = 1
k->e<
Genere en cada inciso la sucesión finita: xl' x2' x3, ... , XJO
Aplique después el algoritmo de Aitken a estas sucesiones para generar las nuevas suce-
siones x' l' x' 2' X' 3' ... observe qué ocurre y dé sus conc1uisiones.
2.24 Modifique el algoritmo 2.5 de Steffensen, incorporando una prevención para el caso en
que el denominador de la ecuación 2.22 sea muycercano a cero.
2.25 Encuentre una aproximación 3[2 Y a f3 con el método de Sú~ffensen. El cálculo deberá
ser correcto en cuatro dígitos significativos. Compare los resultados con los obtenidos en
el problema 2.19.
2.26 Aproxime una solución para cada una de las siguientes ecuaciones con una aproximación
de 10-5, usando el método de Steffensen con X
o = O.
a) 3x-x2+ex-2=0 b) 4.1x2-1.3eX=0 e) x2+2xeX-e2x
=0
2.27 Encuentre la gráfica aproximada de las siguientes funciones en los intervalos indicados
2
a) f(x) = eX + X - 1000; (1, 10)
b) f(x) = Xl- 2x + 10; (-=,00)
e) f(x) = 4 (x - 2)l/3 + sen (3x); [0,00)
ti) f(x) = he-x2/2
; - 00 < X < 00
e) f (x) = x2 - 4 + In 3x + 5 sen x
2.28 Utilizando el método del Newton-Raphson con valores iniciales complejos (a + bi), en-
cuentre las raíces complejas del polinomio
f (x) = x3
+ 4x + 3x2 + 12
2.29 Utilizando el método de Müller con valores iniciales reales, encuentre las raíces comple-
jas del polinomio del problema 2.28.
2.30 Encuentre las raíces faltan tes de la ecuación polinomial usada a lo largo del capítulo para
ilustrar los distintos métodos
f(x) = x3 + 2X2+ 10 x - 20 = O,
pero usando ahora el método de Newton-Raphson con valores iniciales complejos.
2.31 La solución general de la ecuación polinomial
p (x) = ao + al x + a2 x2
120 Métoc;los numérico s aplicados a la ingeniería
E · I
lím _ ,+_ = g' (x)
, -+0:: E .
1
2.23 Las siguientes sucesiones convergen y los límites de convergencia de cada una se dan al
lado derecho
(_ 1 ) k
a) xk = - --
k
b) xn
= n In ( 1 + lIn)
2k+1 + ( _ l)k
e) xk = ----,---- -
2k
d) xk = l+e-k
lím {xk } =O
k-> oc
lím {xn
} = 1
k ->oc
lím {xk } = 2
k-> oc
lím {xk } = 1
k-> cx
Genere en cada inciso la sucesión finita: x I' x2' x3, .. . , xlO
Aplique después el algoritmo de Aitken a estas sucesiones para generar las nuevas suce-
siones x' l' x'2' X' 3' ... observe qué ocurre y dé sus conc1uisiones.
2.24 Modifique el algoritmo 2.5 de Steffensen, incorporando una prevención para el caso en
que el denomiQador de la ecuación 2.22 sea muy·cercano a cero.
2.25 Encuentre una aproximación 3[2 y a f3 con el método de Stf:ffensen. El cálculo deberá
ser correcto en cuatro dígitos significativos. Compare los resultados con los obtenidos en
el problema 2.19.
2.26 Aproxime una solución para cada una de las siguientes ecuaciones con una aproximación
de 10-5, usando el método de Steffensen con X
o=O.
a) 3x-x2 + ex -2 = 0 b) 4.1x2 - 1.3eX=0 e) x2 + 2xeX - e2x =0
2.27 Encuentre la gráfica aproximada de las siguientes funciones en los intervalos indicados
2
a) f (x) = eX + x - 1000; (1 , 10)
b) f(x) =:x!< - 2x + 10; (-=,00)
e) f(x) =4 (x - 2)l/3 + sen (3x); [0,00)
d) f(x) = he-x2/2
; - 00 < x < 00
e) f (x) =x2 - 4 + In 3x + 5 sen x
2.28 Utilizando el método del Newton-Raphson con valores iniciales complejos (a + bi), en-
cuentre las raÍCes complejas del polinomio
f (x) = x3 + 4x + 3x2 + 12
2.29 Utilizando el método de Müller con valores iniciales reales, encuentre las raíces comple-
jas del polinomio del problema 2.28.
2.30 Encuentre las raíces faltantes de la ecuación polinomial usada a lo largo del capítulo para
ilustrar los distintos métodos
f(x) =x3 + 2x2 + 10 x - 20 =O,
pero usando ahora el método de Newton-Raphson con valores iniciales complejos.
2.31 La solución general de la ecuación polinomial
p (x) = ao+ al x + a2 x2
Solución de ecuactories no lineales 121
es
a) Demuestre que Xlx2 =ac!a2
b) Utilizando a), demuestre que una forma alterna para encontrar las raíces de
p (x) = ao + al x + a2 x2 = O
es
2 ao
Xl=----~~====~
-al + J a'[ - 4aOa2
e) Calcule la raíz x2
de
p (x) = x2
+ 81 x - 0.5 = O
usando aritmética de cuatro dígitos con las dos formas presentadas y sustituya ambos re-
sultados en p (x). Compare la exactitud de los resultados y explique la diferencia. Puede
usar Mathematica o Fortan.
d) Calcule la raíz Xlde
p (x) = x2 + 81 x - 0.5 = O
2.32 Elabore un programa de propósito general para encontrar todas las raíces reales y comple-
jas de una ecuación polinomial de la forma
Pn (x) = ao + al x + a2 x2 + ... + anxn
con el método de Müller.
2.33 El siguiente algortimo, de orden tres, es conocido como método de Laguerre
np(x) .
X
i
+
1
= Xi - ------':==_ , t = O, 1, 2, ...
p' (x) ± JH (x)
donde n es el grado de la ecuación polinornial p ( x ) = O, cuyas raíces se desea encontrar
H (x) = (n-1) [(n-1) (P'(xi
))2 - np (x) p" (x)]
y el signo del radical queda determinado por el signo de p' (x).
Este método, que funciona con orden 3 para polinornios CUyáSraíces son todas reales y dis-
tintas, converge sólo linealmente para raíces múltiples. En el caso de raíces complejas poco
se sabe del orden de convergencia; no obstante, ésta es alta para raíces complejas simples. Fi-
nalmente, se hace la observación de que un valor de Xi real pude producir una H (x) nega-
tiva y, por tanto, generar un valor de xi
+
l
complejo y eventualmente levar a una raíz compleja
de la ecuación p (x) = O.
Resuelva las siguientes ecuaciones con el método de Laguerre
a) x4 - 8.2 x3 + 39.41 x2 - 62.26 x + 30.25 = O
b) x4 - 15.2 x3 + 59.7 x2 - 81.6 x + 36 = O
e) x5 - 10 x4 + 40 x3 - 80 x2 + 79 x - 30 = O
á) x5 - 3.7 x4 + 7.4 x3 - 10.8 x2 +10.8 x - 6.8 = O
2.34 Se ha encontrado una simplificación" al algoritmo de Müller (véase algoritmo 2.6), y es
• Hildebrand, B. Introduction lo Numerical Analysis. 2a. ed. McGraw-Hill (1974) pp. 580-581.
Solución de ecuaciones no lineales 121
es
a) Demuestre que xlxl =ar!al
b) Utilizando a), demuestre que una forma alterna para encontrar las raíces de
p (x) = ao + al x + al xl = O
es
e) Calcule la raíz xl de
p (x) = xl + 81 x - 0.5 = O
usando aritmética de cuatro dígitos con las dos formas presentadas y sustituya ambos re-
sultados en p (x). Compare la exactitud de los resultados y explique la diferencia. Puede
usar Mathematica o Fortan.
d) Calcule la raíz xl dt;
p (x) =xl + 81 x - 0.5 =O
2.32 Elabore un programa de propósito general para encontrar todas las raíces reales y comple-
jas de una ecuación polinomial de la forma
Pn (x) = ao + al x + al xl + ... + anxn
con el método de Müller.
2.33 El siguiente algortimo, de orden tres, es conocido como método de Laguerre
np(x) .
Xi+1 =xi - ------'--- , l =O, 1, 2, ...
p' (x) ± JH (x)
donde n es el grado de la ecuación polinomial p ( x ) = O, cuyas raíces se desea encontrar
H (x) = (n-l) [(n-l) (P'(x¡))l - np (x) p" (x)]
y el signo del radical queda determinado por el signo de p' (x).
Este método, que funciona con orden 3 para polinomios CUyáS raíces son todas reales y dis-
tintas, converge sólo linealmente para raíces múltiples. En el caso de raíces complejas poco
se sabe del orden de convergencia; no obstante, ésta es alta para raíces complejas simples. Fi-
nalmente, se hace la observación de que un valor de Xi real pude producir una H (x) nega-
tiva y, por tanto, generar un valor dexi+l complejo y eventualmente levar a una raíz compleja
de la ecuación p (x) = O.
Resuelva las siguientes ecuaciones con el método de Laguerre
a) x4 - 8.2 x3 + 39.41 xl - 62.26 x + 30.25 = O
b) x4 - 15.2 x3 + 59.7 xl - 81.6 x + 36 =O
e) x5 - 10 x4 + 40 x3 - 80 xl + 79 x - 30 =O
d) x5 - 3.7 x4 + 7.4 x3 - 10.8 Xl +10.8 x - 6.8 = O
2.34 Se ha encontrado una simplificación* al algoritmo de MüIler (véase algoritmo 2.6), y es
• Hildebrand, B. lnlroduction lo Numerical Analysis. 2a. ed. McGraw-Hill (1974) pp. 580-581.
122 Métodos numéricos aplicados a la ingeniería
2A¡
Xi+ = xi - ----;::.=====
1 + J 1 - 4 A¡ + Il¡
i = 2,3,4 ... (1)
donde:
1; f[x¡,x¡_,x¡_2]
A¡ = - , f.1¡ = ----''---'--''----'--=-
w¡ w¡
y
=f[ x, x. ] + (+. _ F. ) f[ Xi' xi-!' X¡_2 ]
1 1- i¡ Ji-I f[ ]
Xi,Xi_1
Para esta modificación el orden de convergencia está dado por:
f "'(x)
E i+ "" - 6f' (x) E i E i-l E i-2
Resuelva las ecuaciones dadas en los problemas 2.17, 2.26 Y 2.33 con estealgoritmo.
2.35 Con la fórmula 1 del problema 2.34 y algunas consideraciones teóricas que se omiten por
ser más bien tema del análisis numérico, se llega a modificaciones del método de la secan-
te, con lo cual se consigue en éstas un orden de convergencia mayor de 2.
a) La primera modificación está dada por la ecuación
i = 1,2,... (1)
1 + J 1 - 4 Il¡ Ai
pero ahora
k=1;
1 f/'
y
La interpretación geométrica de este método consiste en reemplazar la funciónf(x) en cier-
to intervalo con una parábola que pasa por el punto (Xi_, h-l) y es tangente a la curva de f
(x) en (Xi' 1;). Para la ecuación 1 se tiene que
f" '(x)
E.¡""- E
2
E·1
1+ 61' (x) 1 1-
Y se ha encontrado que es aproximadamente de orden 2.41
b) La segunda modificación está dada por la expresión
2(fJ 1;')
xi+1 =xi_1 + --r===========
1 + h -2 rJ;1;" / ({¡')2]
(2)
y en ésta el orden de convergencia es 3, y se sabe que:
f "'(x)
E "" - ---- E3
i+l 6f'(x) 1
122 Métodos numéricos aplicados a la ingeniería
i = 2, 3, 4 ...
1 + J1 - 4 A¡ + 11;
donde:
y
Para esta modificación el orden de convergencia está dado por:
f "'(x)
E i+1 "" - 6f' (x) E i E ;-1 E ;-2
(1)
Resuelva las ecuaciones dadas en los problemas 2.17, 2.26 Y2.33 con estealgoritmo.
2.35 Con la fórmula 1 del problema 2.34 y algunas consideraciones teóricas que se mniten por
ser más bien tema del análisis numérico, se llega a modificaciones del método de la secan-
te, con lo cual se consigue en éstas un orden de convergencia mayor de 2.
a) La primera modificación está dada por la ecuación
i = 1, 2,... (1)
pero ahora
A. = 1;
1 f/'
y
La interpretación geométrica de este método consiste en reemplazar la funciónf(x) en cier-
to intervalo con una parábola que pasa por el punto (x;_I' h-I) y es tangente a la curva de f
(x) en (Xi' 1;). Para la ecuación 1 se tiene que
f'" (x)
E. 1 ""- E
2
E' 11+ 6l' (x) 1 1-
Yse ha encontrado que es aproximadamente de orden 2.41
b) La segunda modificación está dada por la expresión
2(fJ1;')
x;+1 = x i_1 + - --¡==========
1 + JI - 2 rJ;1;" / ({¡')2]
y en ésta el orden de convergencia es 3, y se sabe que:
f "'(x)
E "" - - - - - E 3
;+1 61'(x) ,
(2)
(l)
Solución de ecuaciones no lineales 123
Aquí, la curva que reemplaza a f (x) en cierto intervalo es una parábola que coincide con
la curva de f (x) en Xi y tiene la misma pendiente y curvatura que f (x) en Xi'
Resuelva las ecuaciones dadas en los problemas 2.17, 2.26 Y2.33, usando las modificacio-
nes de los incisos (a) y (b).
e) De estas fórmulas pueden obtenerse otras más simples mediante aproximaciones.
Por ejemplo, si}'¡ es pequeña, puede hacerse
(
}'¡}'¡")1/2 }'¡}'¡"
1-2 -- "",1---
(J¡')2 (j '¡ )2
en la ecuación 2 y obtener la fórmula simplificada
!;/}'¡'
Xi + 1 = Xi - 1 _}'¡it /2 (J¡')2
para la cual
[(
f"(X))2 f"'(X)] 3
E¡+I"'" 2f'(x) - 6f'(x) E¡
obsérvese que también es de tercer orden, pero sin raíz cuadrada. Esta fórmula se atribu-
ye a Halley. Los métodos iterativos basados en esta expresión algunas veces se denominan
métodos de Bailey o métodos de Lambert.
el) Si se aproxima
[
1_ }'¡}'¡" ]-1 "'" 1 + }'¡}'¡"
2 (J¡, )2 2(J¡ ')2
en la fórmula de Halley, se obtiene la iteración
}'¡[1 }'¡!;"]
Xi + 1 = Xi - J: + 2 (J¡')2
con
[ (
f "(X))2 f'" (x) ]
Ei+l"'" 2 2f'(x) - 6f'(x) E?
cuyo orden es tres también y se llama fórmula de Chebyshev.
Resuelva las ecuaciones dadas en los problemas 2.17, 2.26 y 2.33, empleando los algorit-
mos de Halley y Chebyshev cuando sean aplicables y compare los resultados obtenidos
con los algoritmo s de los incisos (a) y (b).
2.36 La ecuación de estado de Beattie-Bridgeman en su forma virial es:
PV = RT + vf3 + L + --ª-V2 V3
donde:
P = presión de atm
T = temperatura en K
V = volumen molar en Ugmol
R = Constante universal de los gases en atm U(gmol K)
f3 = R T Ba -Aa - Re /T2
y= -R T Ba b + Aaa -R Ba c/T2
(4)
Solución de ecuaciones no lineales 123
Aquí, la curva que reemplaza af (x) en cierto intervalo es una parábola que coincide con
la curva def(x) en x¡ y tiene la misma pendiente y curvatura quef(x) en Xi'
Resuelva las ecuaciones dadas en los problemas 2.17, 2.26 Y2.33, usando las modificacio-
nes de los incisos (a) y (b).
e) De estas fórmulas pueden obtenerse otras más simples mediante aproximaciones.
Por ejemplo, si1; es pequeña, puede hacerse
1 - 2 - - =1-
(
1;1;" )1/2 _ 1;1;"
(J¡')2 (j'y
en la ecuación 2 y obtener la fórmula simplificada
1; /1;'
x¡+ 1 = xi - 1 _1;1;" / 2 (J¡')2
para la cual
[ (
f" (x) )2 f'" (x) ]
E¡+I '" 2f'(x) - 6f'(x) E [
obsérvese que también es de tercer orden, pero sin raíz cuadrada. Esta fórmula se atribu-
ye a Halley. Los métodos iterativos basados en esta expresión algunas veces se denominan
métodos de Bailey o métodos de Lambert.
d) Si se aproxima
[
1 _ 1;1; " ]-1 '" 1 + 1;1; "
2 (J¡ , )2 2(J¡ ')2
en la fórmula de Halley, se obtiene la iteración
1; [1 1;1;" 1Xi + 1 =Xi - J: + 2 (J¡ ')2
con
[ (
f "(X))2 f'" (x) 1
E¡+l'" 2 2f'(x) - 6f'(x) E?
cuyo orden es tres también y se llama fórmula de Chebyshev.
(4)
Resuelva las ecuaciones dadas en los problemas 2.17, 2.26 y 2.33, empleando los algorit-
mos de Halley y Chebyshev cuando sean aplicables y compare los resultados obtenidos
con los algoritmos de los incisos (a) y (b).
2.36 La ecuación de estado de Beattie-Bridgeman en su forma virial es:
PV = RT + .Ji + ...L + ~V V2 V3
donde:
P = presión de atm
T = temperatura en K
V = volumen molar en Ugmol
R = Constante universal de los gases en atm U(gmol K)
f3 = R T Bo -Ao- Re/T2
y= - RTBob+Aoa-RBoc/T2
124 Métodos numéricos aplicados a la ingeniería
8= RBobc/T2,y
Ao' Bo' a, b, e = constantes particulares para cada gas.
Calcule el volumen molar V a 50 atm y 100°C para los siguientes gases
Gas Ao a Bo b e X 10-4
He 0.0216 0.05984 0.01400 0.000000 0.0040
H2 0.1975 -0.00506 0.02096 -0.43590 0.0504
°2 1.4911 0.02562 0.04624 0.004208 4.8000
·2.37 La ecuación de estado de Redlich-Kwong es:
[a]P + V-b = RT
TII2V(V+b) ( )
donde:
P = presión en atm
T = temperatura en K
V = volumen molar en Ugmol
R = constante universal de los gases en atm-U(gmol K)
R2 Te2.5
a = 0.4278 ---
Pe
RTc
b=0.0867--
Pe
Calcule el volumen molar V a 50 atm y 100°C para los siguientes gases
Gas Pe (atm) Te (K)
He 2.26 5.26
H2 12.80 33.30
°2 49.70 154.40
Compare los resultados obtenidos con los del problema 2.36.
2.38 Mediante la ecuación de estado de Van der Walls (véase ejercicio 2.1), encuentre el volu-
men molar V del CO2 a 80°C y 10 atm, utilizando los métodos de Newton-Raphson y de
Richmond (véase Probl. 2.14).
2.39 Descomponga en fracciones parciales las siguientes funciones racionales
52.5 s (s + 1) (s + 1.5) (s + 5)
a) F (s) = ---,--------::------:---
s4 + 20.75 s3 + 92.6 s2 + 73.69 s
lOA
b) F (s) = ---,---------,------
s3 + 101.4 S2+ 142.7 s + 100
0.47 KG(S3 + 4.149s2 + 6.362 s + 4.255)
e) F (s) = ---=-----------
s4+7s3+11s2+5s
100 (s2 + 3.4s + 2.8)
el) F (s) = --::------,-----:,-----::---
SS+10 s4 + 32 s3 + 38 s2+ 15s
Solución de ecuaciones no lineales 125
2.40 Una forma alterna para resolver el problema de vaporización instantánea (véase ejercicio
2.6) es:
Tomando en cuenta que I. x¡ = 1 Y que I. Y¡ = 1, o bien I. K¡x¡ = 1, puede escribirse
(todas las sumatorias sobre i son de 1 a n )
o también
I. K¡x.
ln---' =0
I. s,
Siguiendo la secuencia mostrada en el ejercicio 2.6, se llega a la expresión:
s.«I. 1 1
1 + lf/(K¡ - 1)
In ----'---'---- = O
I. z¡ .
l+lf/(K¡-l)
Utilice el método de posición falsa y los datos del ejercicio 2.6 para resolver esta última
ecuación.
2.41 Para el cálculo de la temperatura de burbuja de una mezcla multicomponente a la presión
total P se utiliza la ecuación
n
f( T) = L
¡= 1
K¡ x¡ -1 = O
donde x¡ y K¡, i = 1, 2, ... n son la fracción mol en la fase líquida y la relación de equilibrio
del componente i, respectivamente, y T (la raíz de la ecuación 1) es la temperatura de bur-
buja.
Determine la temperatura de burbuja a 10 atm de presión total de una mezcla cuya com-
posición en la fase líquida es 45% mal de n-butano, 30% mal de n-pentano y 25% mal de
n-hexano. Los valores de K¡ a 10 atm son
Componente
n-butano
K (T) con T en °C para 35 :S;T:S; 205°C
-0.17809 + 1.2479 X 10-2 T + 3.7159 X 10-5 T2
0.13162 - 1.9367 X 10-3 T + 7.1373 X 10-5 T2
0.13985 - 3.8690 X 10-3 T + 5.5604 X 10-5 T2
n-pentano
n-hexano
2.42 Para el cálculo de la temperatura de rocío de una mezcla multicompnente a la presión to-
tal P se utiliza la ecuación.
n
f( T) = L
¡= 1
donde Y¡y K¡, i = 1,2,..., n son la fracción mal en la fase vapor y la relación de equilibrio del
componente i; respectivamente, y T (la raíz de la ecuación) es la temperatura de rocío.
Determine la temperatura de rocío a 10 atm de presión total de una mezcla cuya composi-
ción en la fase líquida es 45% mal de n-butano, 30% mal de n-pentano y 25% mal, de n-he-
xano. Los valores de K¡ a 10 atm se proporcionan en el problema 2.41.
2.43 Para obtener la temperatura de burbuja de una solución líquida de CC14 y CF4 en equili-
brio con su vapor, se llegó a la ecuación:
(1)
(1)
S o lución de ecuaciones no lineales 125
2.40 Una forma alterna para resolver el problema de vaporización instantánea (véase ejercicio
2.6) es:
Tomando en cuenta que I x¡ = 1 Yque I Y¡ = 1, o bien I Kr:; = 1, puede escribirse
o también
(todas las sumatorias sobre i son de 1 a n )
IKx.
ln - -' -' =0
I x¡
Siguiendo la secuencia mostrada en el ejercicio 2.6, se llega a la expresión:
K.z·I 1 1
1 + l¡t(K¡ - 1)
In - ---'-- -'----- = O
I z¡
1+l¡t(K¡ - I)
Utilice el método de posición falsa y los datos del ejercicio 2.6 para resolver esta última
ecuación.
2.41 Para el cálculo de la temperatura de burbuja de una mezcla multicomponente a la presión
total P se utiliza la ecuación
n
f(T) = L. K¡ x¡ - 1 = O (1)
¡= 1
donde x¡ y K¡, i = 1, 2, ... n son la fracción mol en la fase líquida y la relación de equilibrio
del componente i, respectivamente, y T (la raíz de la ecuación 1) es la temperatura de bur-
buja.
Determine la temperatura de burbuja a 10 atm de presión total de una mezcla cuya com-
posición en la fase líquida es 45% mol de n-butano, 30% mol de n-pentano y 25% mol de
n-hexano. Los valores de K¡ a 10 atm son
Componente
n-butano
n-pentano
n-hexano
K (T) con T en oC para 35 ~ T ~ 205 oC
-0.17809 + 1.2479 X 10-2T + 3.7159 X 10-5 T2
0.13162 - 1.9367 X 10-3 T + 7.1373 X 10-5 T2
0.13985 - 3.8690 X 10-3 T + 5.5604 X 10-5 T2
2.42 Para el cálculo de la temperatura de rocío de una mezcla multicompnente a la presión to-
tal P se utiliza la ecuación.
n
f(T) = L. (1)
¡ = 1
donde Y¡ y K¡, i = 1, 2,..., n son la fracción mol en la fase vapor y la relación de equilibrio del
componente i, respectivamente, y T (la raíz de la ecuación) es la temperatura de rocío.
Determine la temperatura de rocío a 10 atm de presión total de una mezcla cuya composi-
ción en la fase líquida es 45% mol de n-butano, 30% mol de n-pentano y 25% mol, de n-he-
xano. Los valores de K¡ a 10 atm se proporcionan en el problema 2.41.
2.43 Para obtener la temperatura de burbuja de una solución líquida de CC14 y CF4 en equili-
brio con su vapor, se llegó a la ecuación:
126 Métodos numéricos aplicados a la ingeniería
760 = 0.75 [ 106.898-1221.8/ (T +227.4)] + 0.25 [ 106.195-376.7]/ (T+241.2)]
Aplicando un método iterativo de dos puntos, encuentre la temperatura de burbuja T con
una aproximación de 10-2 aplicado a f (T).
2.44 En la solución de ecuaciones diferenciales ordinarias con coeficientes constantes, es nece-
sario resolver la " ecuación auxiliar asociada", que resulta ser un polinomio cuyo grado es
igual al orden de la ecuación diferencial. ASÍ, si la ecuación diferencial está dada por
ylv+2yl/-8y=0 (1)
la ecuación auxiliar asociada es
m4
+ 2 m2
- 8 = O
cuyas cuatro raíces: mi' m2
, m3
y m4
se emplean de la siguiente manera
para dar la solución general de la ecuación l.
Encuentre la solución general de la ecuación 1 y de las siguientes ecuaciones diferenciales
yVI+2yIV+yl/=0
yl/'-4yl/+4y'=0
2.45 La ecuación 4 del ejercicio 2.8 se aplica para calcular la ~Tm, cuando
TC1 - TC2 *TH2 - TC]
Cuando el gradiente TH] - TC2
es muy cercano al gradiente TH2
- TC] se deberá utilizar
la siguiente expresión para el cálculo de ~ Tm
Modifique el programa 2.6 del ejercicio 2.8 de modo que se utilice la ~Tm dada arriba
cuando
o 2.46
I ( TH¡ - TC2
) - ( TH2
- TC¡ ) I < 10-2
y la ecuación (4) del ejercicio 2.8 en caso contrario.
Si el cambiador de calor del ejercicio 2.8, se opera en paralelo, esto es:
aceite TH] '" 250°F
agua Te¡ '" 80°F
o 2.47
Encuentre TH2 Y TC2 en estas nuevas condiciones de operación.
Suponga que el fenómeno de la transmisión de calor en un cierto material obedece en for-
ma aproximada al modelo
T=To+ i(J3( <Xi t2
e-:X
2
/(4<Xt»)
Calcule el tiempo requerido para que la temperatura a la distancia x alcance un valor da-
do. Use la siguiente información
126 Métodos numéricos aplicados a la ingeniería
760 = 0.75 [ 106.898-1221.8/ (T +227.4)] + 0.25 [ 106.195-376.7]/ (T+241.2)]
Aplicando un método iterativo de dos puntos, encuentre la temperatura de burbuja T con
una aproximación de 10-2 aplicado af (T).
2.44 En la solución de ecuaciones diferenciales ordinarias con coeficientes constantes, es nece-
sario resolver la " ecuación auxiliar asociada", que resulta ser un polinomio cuyo grado es
igual al orden de la ecuación diferencial. Así, si la ecuación diferencial está dada por
ylv+2y"-8y=0 (1)
la ecuación auxiliar asociada es
m4 + 2 m2 - 8 =O
cuyas cuatro raíces: mi' m2, m3 y m4 se emplean de la siguiente manera
para dar la solución general de la ecuación l.
Encuentre la solución general de la ecuación 1 y de las siguientes ecuaciones diferenciales
yVI+2 yIV+ y "=0
y"'-4y"+4y'=0
2.45 La ecuación 4 del ejercicio 2.8 se aplica para calcular la ~Tm, cuando
TC1 - TC2 *TH2 - TC]
o 2.46
o 2.47
Cuando el gradiente TH1 - TC2 es muy cercano al gradiente TH2 - TC] se deberá utilizar
la siguiente expresión para el cálculo de ~Tm
Modifique el programa 2.6 del ejercicio 2.8 de modo que se utilice la ~Tm dada arriba
cuando
I ( TH¡ - TC2 ) - ( TH2 - TC¡ ) I< 10-2
y la ecuación (4) del ejercicio 2.8 en caso contrario.
Si el cambiador de calor del ejercicio 2.8, se opera en paralelo, esto es:
agua Te¡ = 80 0p
I
aceite TH] = 250 0p ---~
Encuentre TH2 YTC2 en estas nuevas condiciones de operación.
Suponga que el fenómeno de la transmisión de calor en un cierto material obedece en for-
ma aproximada al modelo
T=To+ i (t3( <Xi t2
e-X
2
/(4<X t
»)
Calcule el tiempo requerido para que la temperatura a la distancia x alcance un valor da-
do. Use la siguiente información
Solución de ecuacione s no lineales 127
To = 25°C; q = 300 BTU/h ft2;
a = 0.04 ft2/h; x = 1 ft;
k = 1 BTU/h ft2 °F
T = 120°F
f3 = 2 °Fft °C1/2
h1/2
2.48 El factor de fricciónfpara fluidos pseudoplásticos que siguen el modelo de Ostwald-De-
Waele se calcula mediante la siguiente ecuación
1 4 0.4
- = --log (RefI-O.5n) --
f nO.75 n1.2
Encuentre el factor de fricción f, si se tiene un número de Reynolds Re de 6000 y un va-
lor de n = 0.4.
2.49 La siguiente relación entre el factor de fricción f y el número de Reynolds Re se cumple
cuando hay flujo turbulento de un fluido en un tubo liso
1
- = - 0.4 + 1.74 In (Re.J 1)
f
Construya una tabla de valores de f correspondientes a números de Reynolds de 104 hasta
106 con intervalos de 104.
2.50 Para determinar la constante de nacimientos de una población se necesita calcular A en la
siguiente ecuación
0.435 X 106
1.546 X 106 = 106 eA + (eA - 1)
A,
. con una aproximación de 10-3.
2.51 Graficar por separado las funciones y = x y y = tan x (véase ejercicio 2.10). Encuentre las
raíces en el intervalo (O, 35) ¿nota usted alguna relación entre ellas? ¿Podría explicar esta
relación?
Solución de ecuaciones no lineales 127
To= 25 oC; q = 300 BTU/h ft2;
a =0.04 ft2/h; x =1 ft;
k = 1 BTU/h ft2 °F
T = 120 °F
f3 = 2 °Fft °C1/2
hl /2
2.48 El factor de fricciónfpara fluidos pseudoplásticos que siguen el modelo de Ostwald-De-
Waele se calcula mediante la siguiente ecuación
1 4 0.4
- = --log (Refl -O.Sn) - -
f nO.7S n1.2
Encuentre el factor de fricción f, si se tiene un número de Reynolds Re de 6000 y un va-
lor de n = 0.4.
2.49 La siguiente relación entre el factor de fricción f y el número de Reynolds Re se cumple
cuando hay flujo turbulento de un fluido en un tubo liso
1
- = - 0.4 + 1.74 In (Re"'¡1)
f
Construya una tabla de valores def correspondientes a números de Reynolds de 104 hasta
106 con intervalos de 104.
2.50 Para determinar la constante de nacirnlentos de una población se necesita calcular le en la
siguiente ecuación
0.435 X 106
1.546 X 106 = 106 eA + (eA - 1)
A,
. con una aproximación de 10-3.
2.51 Graficar por separado las funciones y =x y y =tan x (véase ejercicio 2.10). Encuentre las
raíces en el intervalo (O, 35) ¿nota usted alguna relación entre ellas? ¿Podría explicar esta
relación?
CAPÍTULO 3
MATRICES y SISTEMAS DE
ECUACIONES LINEALES
A dónde nos dirigimos
En este capítulo estudiaremos las técnicas de solución de sistemas de ecuaciones linea-
les cuadrados Ax = b. Para ello, primero realizaremos un repaso de álgebra de matrices
y, para sustentar teóricamente los métodos, revisaremos las ideas de ortogonalización
de vectores.
Posteriormente se exponen las dos ideas sobre las que se desarrollan, en los métodos
numéricos, las soluciones de los sistemas: la eliminación de Gauss para los métodos di-
rectos y la iteración de Jacobi para los iterativos.
Para establecer la velocidad de cálculo y el "trabajo computacional" en los métodos
directos, se analiza el número de operaciones de éstos y con base en ello se determinan
sus necesidades de memoria. Como consecuencia de lo anterior, se da particular aten-
ción a los sistemas especiales: simétricos, bandeados y dispersos, entre otros. Así, estu-
diaremos los métodos que aprovechan estas características para lograr reducir con esto
el número de operaciones y los requerimientos de máquina.
Los métodos iterativos se vinculan con el método de punto fijo del capítulo 2, apro-
vechando las ideas ahí desarrolladas como la de aceleración de la convergencia,
Al final del capítulo, se presenta una comparación entre ambas familias para brin-
darle al lector los elementos necesarios para seleccionar la más adecuada a su proble-
ma en particular.
Dado que el mundo real puede verse como grupos de objetos o partes trabajando
en conjunto o bien conectadas de alguna manera que forman un todo, creemos que con
estos conocimientos lograremos brindarle al lector una mejor comprensión de la ex-
traordinaria cantidad de situaciones que pueden representarse con los sistemas o grupos
de ecuaciones donde cada una de ellas corresponde a alguna de sus partes, por ejemplo:
en circuitos, estructuras, columnas de destilación a régimen permanente.
Introducción
La solución de sistemas de ecuaciones lineales es un tema clásico de las matemáticas, ri-
co en ideas y conceptos, y de gran utilidad en ramas del conocimiento tan diversas como
economía, biología, física, psicología, etc. La resolución de sistemas casi de cualquier nú-
mero de ecuaciones (lO, 100, 1000, etc.) es una realidad hoy día gracias a las computado-
ras, lo cual proporciona un atractivo especial a las técnicas de solución directas e iterativas:
su programación, la cuenta de los cálculos necesarios, la propagación de errores, etcétera.
Sin embargo, todo lo anterior requiere una revisión de los conceptos básicos sobre
matrices, ortogonalización de vectores, y la existencia y unicidad de las soluciones; por
tanto, estos conceptos dan inicio al capítulo.
MATRICES y SISTEMAS DE
ECUACIONES LINEALES
A dónde nos dirigimos
En este capítulo estudiaremos las técnicas de solución de sistemas de ecuaciones linea-
les cuadrados Ax =b. Para ello, primero realizaremos un repaso de álgebra de matrices
y, para sustentar teóricamente los métodos, revisaremos las ideas de ortogonalización
de vectores.
Posteriormente se exponen las dos ideas sobre las que se desarrollan, en los métodos
numéricos, las soluciones de los sistemas: la eliminación de GauSs para los métodos di-
rectos y la iteración de Jacobi para los iterativos.
Para establecer la velocidad de cálculo y el "trabajo computacional" en los métodos
directos, se analiza el número de operaciones de éstos y con base en ello se determinan
sus necesidades de memoria. Como consecuencia de lo anterior, se da particular aten-
ción a los sistemas especiales: simétricos, bandeados y dispersos, entre otros. Así, estu-
diaremos los métodos que aprovechan estas características para lograr reducir con esto
el número de operaciones y los requerimientos de máquina.
Los métodos iterativos se vinculan con el método de punto fijo del capítulo 2, apro-
vechando las ideas ahí desarrolladas como la de aceleración de la convergencia.
Al final del capítulo, se presenta una comparación entre ambas familias para brin-
darle al lector los elementos necesarios para seleccionar la más adecuada a su proble-
ma en particular. .
Dado que el mundo real puede verse como grupos de objetos o partes trabajando
en conjunto o bien conectadas de alguna manera que forman un todo, creemos que con
estos conocimientos lograremos brindarle al lector una mejor comprensión de la ex-
traordinaria cantidad de situaciones que pueden representarse con los sistemas o grupos
de ecuaciones donde cada una de ellas corresponde a alguna de sus partes, por ejemplo:
en circuitos, estructuras, columnas de destilación a régimen pe~·manente.
Introducción
La solución de sistemas de ecuaciones lineales es un tema clásico de las matemáticas, ri-
co en ideas y conceptos, y de gran utilidad en ramas del conocimiento tan diversas como
economía, biología, física, psicología, etc. La resolución de sistemas casi de cualquier nú-
mero de ecuaciones (10, 100, 1000, etc.) es una realidad hoy día gracias a las computado-
ras, lo cual proporciona un atractivo especial a las técnicas de solución directas e iterativas:
su programación, la cuenta de los cálculos necesarios, la propagación de errores, etcétera.
Sin embargo, todo lo anterior requiere una revisión de los conceptos básicos sobre
matrices, ortogonalización de vectores, y la existencia y unicidad de las soluciones; por
tanto, estos conceptos dan inicio al capítulo.
130 Métodos numéricos aplicados a la ingeniería
3.1 Matrices
Una matriz es un conjunto de elementos ordenados en filas y columnas como:
al,l al,2 al,3 al,n
a2,1 a2,2 a2,3 a2,n
a3,1 a3,2 a3,3 a3,1l
am,1 am,2 am,3 am.n
Los elementos zz. .son números reales o complejos, o funciones de una o varias variables.l,}
En este libro sólo se tratarán matrices cuyos elementos son números reales.
Para denotar matrices se utilizarán las primeras letras mayúsculas del alfabeto en cur-
sivas A, B, e, etc. Cuando se hace referencia a una matriz es conveniente especificar su
número de filas y columnas. Así, la expresión A de m X n, indica que se trata de una ma-
triz de m filas y n columnas o de m X n elementos. A "m X n" se le conoce como las di-
mensiones de A. Si el número de filas y de columnas es el mismo; esto es m = n, se tiene
una matriz cuadrada de orden n o simplemente una matriz de orden n.
Para ciertas demostraciones es más conveniente la notación [ai,j l, [bi,j l,etc., en lugar
de A, B, etcétera.
Dos matrices son iguales cuando tienen el mismo número de filas y columnas (las
mismas dimensiones) y, además, los elementos correspondientes son iguales.
Por ejemplo, las matrices
y
son de orden tres y tienen los mismos elementos. Aun así son distintas, ya que los elemen-
tos correspondientes no son todos iguales. El elemento de la segunda fila y la segunda co-
lumna de A, a
22
es 5 y el correspondiente de B, b22
es 5; pero el elemento de la segunda
fila y la primera columna de A, a2 1 es 4 y el correspondiente a B, b2 l' es 2., ,
OPERACIONES ELEMENTALES CON MATRICES Y SUS PROPIEDADES
Se definirán dos operaciones en el conjunto establecido de las matrices.
SUMA DE MATRICES
Para sumar dos matrices A y B han de ser de las mismas dimensiones; si esto es cierto, la
suma es una matriz e de iguales dimensiones que A y que B, y sus elementos se obtienen
sumando los elementos correspondientes de A y B. Para mayor claridad
Matrices y sistemas de ecuaciones lineales 131
A + B e
al,l al,2 al,!! bl,l bl,2 bl,11 al,l + bl,l al,2 + bl,2 ... al,!! + bl,!!
a2,! a2,2 a2,!! b2,l b2,2 b2,n a2,l + b2,l a2,2 + b2,2 ... a2,1l + b2,!!
+
bm,!!am,11
el,l el,2'" el,1l
c2,lel,2'" e2,1l
(3.1)
o también
[ a, .]+ [ b, ,] = [a, ,+ b. ] = [ e, , ]1,] 1,] 1,] 1,] 1,]
(3.2)
Sumar las matrices
[~8.5
-~J [-~ 2
~J-1.3 Y 8
Solución
[4 8.5 -3J [-1 2 ~J
[4-1 8.5 + 2
-3-~J
D 10.5 -7J
2 -1.3 7 + 5 8 3 2+5 -1.3 + 8 7+3 6.7 10
2X3 2 x 3 2X3 2 x 3
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
A=[4 8.5 -3; 2 -1.3 7J
B=[-1 2 -4; 5 8 3J
C=A+B
[4, 8.5, -3; 2, -1.3, 7J...•a
[-1, 2, -4; 5, 8, 3J ....•b
e+b+c
La conmutatividad y asociatividad de la suma de matrices son propiedades heredadas de
las propiedades de la suma de los números reales. Así, la conmutatividad puede verse cla-
ramente en la ecuación 3.1, ya que:
a, ,+ b" = b, ,+ a, ,= e, ,1,] j,j 1,] 1,] l,j
donde a ' representa un elemento cualquiera de A y bl'J' su correspondiente en B. Por tan-~ ,
to, es cierto que
De igual manera puede verse la asociatividad
(ai,j + bi) + di) = ai,j + (bi,j + di)
132 Métodos numéricos aplicados a la ingeniería
o bien
(A + B) + D = A + (B + D)
donde D es una matriz de las mismas dimensiones que A y que B.
Además, si se denota con O a la matriz cuyos elementos son todos cero (matriz cero);
es decir,
o
O
O
O
O
O
O
O
O
O O O O
y por -A la matriz cuyos elementos son los mismos que A, pero de signo contrario
-A
-al,l -al,2
-a2,1 -a2,2
l'
-am,n
se tiene:
A + O =A,
A + (-A) = O
(3.3)
(3.4)
A partir de la ecuación 3.4, puede definirse la resta entre A y B como
A + (-B)
o más simple
A-B
PRODUCTO DE MATRICES POR UN ESCALAR
Así Como se ha definido la suma de matrices, también se puede formar el producto de un
número real a y una matriz A. El resultado, denotado por AA, es la matriz cuyos elemen-
tos son los componentes de A multiplicados por a. Así, se tiene
al,l a¡,2 al,1l aal,l aal,2 aal,11
a2,1 a2,2 a2,n aa2,1 aa2,2 aa2,n
a A=a (3.5)
am,l am,2 am,n aam,l aam,2 ... aam,n
o bien
a [a . .] = [ a a .] (3.6)1,] 1,]
Matrices y sistemas de ecuaciones lineales 133
Ejemplo 3.2
~o][548 -2.3
Multiplique la matriz 7.2 por 2.
43 -13
Solución
[5.8 -2.32] [2(58)2(-2.3) 2(2)J [16 -4.6
2~J2 4 7.2 10 = 2(4) 2(7.2) 2(10) = 8 14.4
43 -13 5 2(43) 2(-13) 2(5) 86 -26 10
Las principales propiedades algebraicas de esta multiplicación son:
a (A + B)
(a+f3)A
(af3) A
lA A,
a A + aB , distributividad respecto a la suma de matrices.
aA + f3A, distributividad respecto a la suma de escalares.
a (f3A ), asociatividad.
(3.7)
(3.8)
(3.9)
(3.10)
donde a y f3son dos escalares cualesquiera, y A YB dos matrices sumables (con igual nú-
mero de filas e igual número de columnas).
Las ecuaciones 3.7 a 3.10, se comprueban con facilidad a partir de las definiciones de
suma de matrices y multiplicación por un escalar. Sólo se demostrará la 3.9; las otras que-
dan como ejercicio para el lector.
De la definición (Ec. 3.5), aplicada allado izquierdo de la ecuación 3.9.
(af3) A =
(a f3) a""n
(a f3) a¡,¡ (a f3) a¡,2
(a f3) a2,¡ (a f3) a2,2
De la asociatividad de la multiplicación de los números reales se tiene:
(af3) A =
a (f3 am,n)
a (f3al) a (f3a¡,2)
a (f3a2,¡) a (f3a2,2)
Al aplicar la ecuación 3.5 en sentido inverso dos veces:
f3a¡,¡ f3a1,2 f3a¡,n
(af3) A = a
f3a2,l f3a2,2 f3a2,n
f3«; 1 f3am,2 f3am,n
"
134 Métodos numéricos aplicados a la ingeniería
al,1 al,2
(a{J) A = a f3
a21 a2,2
am,1 a""2
se llega al lado derecho de la ecuación 3.9, con lo cual concluye la demostración.
MULTIPLICACiÓN DE MATRICES
Dos matrices A y B son conformes en ese orden (primero A y después B ), si A tiene el mis-
mo número de columnas que B tiene de filas.
Se definirá la multiplicación sólo para matrices conformes. Dada una matriz A de m
X n y una matriz B de n X p, el producto es una matriz C de m X p cuyo elemento gene-
ral cij se obtiene por la suma de los productos de los elementos de la i-ésima fila de A y la
j-ésima columna de B. Si:
al,l a1,2
a2,1 a2,2
A=
a¡,l a¡,2
b . bn.j n,p
CI,I cI,2 c
lJ
"'lC2,1 C2,2 c
2J c2,p
AB=C=
C¡,I C¡,2
G..
c¡,pi.j
donde:
o bien:
11
C . = L a k bk
. para i = 1,2, ... , m y j = 1,2, ... , p
l,] k= l 1, ,]
Multiplicar 1., matrices A = [~
2
-~]Y B = [-! 1
-~]3 2
--4 2
Solución
A B C
D
2
!][-~1
-2] [0-2+12 1+4+6
-2+6+3J [101I
-2~]
3 2 3 = 0-3+16 2+6+8 --4+9+4 = 13 16
--4 -5 4 2 1 0+4-20 3-8-10 -6-12-5 -16 -15
En orden inverso
B A C
t!
1
-n [~
2
3] [0+2-6 0+3+8 0+4+IOJ = [~
11 I~]2 3 4 = -1+4+9 -2+6-12 -3+8-15 -8 -10
2 --4 -5 4+4+3 8+6--4 12+8-5 11 10 15
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus
...---------------------------~~~====-iIIi
Matrices y sistemas de ecuaciones lineales 135
A=[1 2 3; 2 3 4; 3 -4 -5]
B=[O 1 -2; -1 2 3; 4 2 1]
disp( 'e = A':' B')
e=A*B
disp ('e = B * A')
e=B*A
[1,2,3; 2,3,4; 3, -4, -5]--+ a
[0,1, -2;-1,2,3;4,2, l I=b
a*b--+c
b*a--+c
Obsérvese que A B ;é B A; es decir, la multiplicaci6n de matrices no es conrnutativa. Este
hecho deberá tenerse siempre en cuenta al multiplicar matrices.
A continuación se verán las propiedades de distributividad y asociatividad del produc-
to de matrices.
A (B + C) AB+AC (3.11)
(3.12)
Con la notación de sumatoria se comprobará la ecuación 3.11; la 3.12 queda como ejerci-
cio para el lector.
Demostración de la ecuación 3.11. Sea ei,j un elemento cualquiera de la matriz producto A
B, esto es:
136 Métodos numéricos aplicados a la ingeniería
y di,j el elemento correspondiente del producto A e
n
d= L akck·
1,] k = 1 1, -l
Al sumarios se obtiene el elemento correspondiente del lado derecho de la ecuación 3.11
el cual es igual al elemento de la i-ésima fila y la j-ésima columma del lado izquierdo de
la ecuación 3.11, con lo que finaliza la demostración.
A continuación se da el algoritmo para multiplicar matrices.
Para multiplicar las matrices A y B, proporcionar los
DATOS: Número de filas y columnas de A y B; N, M, NI, MI, respectivamente, y sus elementos.
RESULTADOS: La matriz producto e de dimensiones N X MI o el mensaje "LAS MATRICES A Y B NO PUEDEN
MULTIPLICARSE" .
PASO 2.
PASO 3.
Si M = NI continuar, de otro modo IMPRIMIR "LAS MATRICES A Y B NO SE PUEDEN MULTIPLICAR"
y TERMINAR.
Hacer 1 = l.
Mientras 1 ~ N, repetir los pasos 4 a 12.
PASO 4. HacerJ = 1.
PASO 5. Mientras J ~ MI, repetir los pasos 6 a 11.
PASO 6. Hacer e (1, J) = O.
PASO 7. Hacer K = 1.
PASO 8. Mientras K ~ M, repetir los pasos 9 y 10.
PASO 9. Hacer
e (1, J) = e (l, J) + A (1, K) * B (K, J).
PASO 10. Hacer K = K + 1.
PASO 11. Hacer J = J + 1.
PASO 12. Hacer 1 = 1 + 1.
IMPRIMIR las matrices A, B Y e y TERMINAR.
PASO 1.
PASO 13.
Elaborar un programa para multiplicar matrices, utilizando el algoritmo 3.1
Solución Ver el 'PROGRAMA
6
32
del CD.
SUGERENCIA: Este material puede complementarse e incluso enriquecerse si se cuenta con un
pizarrón electrónico, por ejemplo el Mathcad, ya que permite, una vez entendida
la mecánica de las operaciones matriciales, averiguar sus propiedades e incluso
motivar algunas demostraciones. En adelante se hará referencia al Mathcad y a
Matlab, pero puede usarse un software equivalente.
136 Métodos numéricos aplicados a la ingeniería
ydi,j el elemento correspondiente del producto A e
n
d=Lakck ·
1,] k = 1 1, ,}
Al sumarlos se obtiene el elemento correspondiente del lado derecho de la ecuación 3.11
n n n
e·· + d.. = L a k bk + L a· k Ck = L a k (bk · + Ck .),1,] 1,] k = 1 1, ,] " = 1 1, ,] k = 1 1, ,] ,]
el cual es igual al elemento de la i-ésima fila y la j-ésima columma del lado izquierdo de
la ecuación 3,11, con lo que finaliza la demostración.
A continuación se da el algoritmo para multiplicar matrices.
Para multiplicar las matrices A y B, proporcionar los
DATOS: Número de filas y columnas de A y B; N, M, NI, MI, respectivamente, y sus elementos.
RESULTADOS: La matriz producto e de dimensiones N X MI o el mensaje "LAS MATRICES A Y B NO PUEDEN
MULTIPLICARSE".
PASO 1. Si M = NI continuar, de otro modo IMPRIMIR "LAS MATRICES A Y B NO SE PUEDEN MULTIPLICAR"
y TERMINAR.
PASO 2. Hacer 1 = l .
PASO 3. Mientras 1:<:; N, repetir los pasos 4 a 12.
PASO 4. Hacer J = 1.
PASO 5. Mientras J:<:; MI, repetir los pasos 6 a 11.
PASO 6. Hacer e (1, J) = O.
PASO 7.
PASO 8.
Hacer K = l.
Mientras K:<:; M, repetir los pasos 9 y 10.
PASO 9. Hacer
e (1, J) = e (I, J) + A (1, K) * B (K, J).
PASO 10. Hacer K = K + 1.
PASO 11. Hacer J =J + 1.
PASO 12. Hacer 1= 1+ 1.
PASO 13. IMPRIMIR las matrices A, B Y e y TERMINAR.
Elaborar un programa para multiplicar matrices, utilizando el algoritmo 3.1
Solución Ver el P~QG,~lfA 3~IJ del CD.
6
32
SUGERENCIA: Este material puede complementarse e incluso enriquecerse si se cuenta con un
pizarrón electrónico, por ejemplo el Mathcad, ya que permite, una vez entendida
la mecánica de las operaciones matriciales, averiguar sus propiedades e incluso
motivar algunas demostraciones. En adelante se hará referencia al Mathcad y a
Matlab, pero puede usarse un software equivalente.
Matrices y sistemas de ecuaciones lineales 137
MATRICES ESPECIALES
En una matriz cuadrada A, el conjunto de elementos en donde el primero y el segundo su-
bíndices son iguales -es decir, i = j- forman la diagonal principal. Por ejemplo, en la
matriz de 4 X 4 que se da a continuación, los elementos dentro de la banda constituyen la
diagonal principal.
[ a"
al,2 al,3
a'A la2,1 a2,2 a2,3 a2,4
a3,1 a3,2 a3,3 a34
a4,1 a4,2 a4,3 a4,4
Una matriz de orden n con todos sus elementos debajo de la diagonal principal iguales a ce-
ro se llama matriz triangular superior. Si todos los elementos por encima de la diagonal
principal son cero en una matriz, entonces será una matriz triangular inferior; en caso de
que una matriz tenga únicamente ceros arriba y abajo de la diagonal principal, se tiene una
matriz diagonal y, si en particular, todos los elementos de la diagonal son 1, entonces se
obtiene la matriz unitaria o matriz identidad.
Matriz triangular superior Matriz triangular inferior
o o
O
o
O
a1,2
a2,2
o O an_l,n O
O O O an,n an.l an.2 an.3 an.II
_
1 al/,n
Matriz diagonal Matriz unitaria o identidad
al,1 O O O 1 O O O
O a2,2 O O O 1 O O
O O a3,3 O O O 1 O
O O O all,n O O O 1
A continuación se dan algunos casos particulares de matrices cuadradas especiales
Triangular Triangular
superior inferior Diagonal Unitaria
1 3 -4 4 O O 2 O O 1 O O
O 6 2 -2 -1 O O -6 O O 1 O
O O -5 7 5 3 O O 8 O O 1
138 Métodos numéricos aplicados a la ingeniería
La matriz unitaria se denota, independientemente de su orden, como I.
Dada una matriz A de m X n, la matriz de n X m que se obtiene de A intercambiando
sus filas por sus columnas se denomina matriz transpuesta de A y se denota por AT . Es-
to es
A=
a1•1 al,2 al,n
a2,1 a2,2 a2,n
al,1 a2,1 am,1
al,2 a2,2 am,2
AT=
al,,. a2,1I
a
m,n
Ejemplo 3.5 Dada la matriz A, encuentre su transpuesta.
[ ,
o
3
6
3
5
2
4
7
5 ~]
3 X 5
Solución
5 X 3
Una matriz cuadrada para la que AT = A, recibe el nombre de matriz simétrica. Por
ejemplo
2
3
1 !J y
son iguales, y por tanto A es simétrica.
Si A YB son dos matrices cuadradas, tales que
AB = 1 = BA,
se dice que B es la inversa de A y se representa generalmente como A-l.
Ejemplo 3.6 Demuestre que B es la inversa de A, si:
3
4
3
y B = [-~ -i -~]-1 O 1
Matrices y sistemas de ecuaciones lineales 139
Solución
AB" D 3
!] [-~-3
-~] [~
O
~] "1
4 1 1
3 -1 O O
Por tanto,
A-l = B
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus
A=[l 3 3; 1 4 3; 1 3 4J
B=[7 -3 -3; -1 1 O; -1 O 1J
disp('I=A*B')
I=A*B
[1,3,3;1,4,3;1,3,4J-ta
[7,-3,-3;-1,1,0;-1,0,lJ-tb
a*b-tI
En particular si A es diagonal; es decir,
al,l O O O l/al,l O O O
O a2,2 O O O l/a2,2 O O
A= , entonces A-l =
O O «: O O l/a m,n
La demostración se deja como ejercicio para el lector.
Es importante señalar que no todas las matrices tienen inversa. Si una matriz la tiene,
se dice también que es no singular, y singular en caso contrario.
Más adelante se ven métodos para encontrar la inversa de una matriz.
MATRIZ PERMUTADORA
Una matriz, cuyos elementos son ceros y unos, y donde sólo hay un uno por cada fila o co-
lumna, se conoce como matriz permutadora o intercambiadora; por ejemplo, las ma-
trices
1
O
O
son casos particulares de matrices intercambiadoras.
El efecto de multiplicar una matriz permutadora P por una matriz A en ese orden es
intercambiar las filas de A; al multiplicar en orden inverso, se intercambian las columnas
deA.
140 Métodos numéricos aplicados a la ingeniería
Multiplique la matriz A del ejemplo 3.6 por la matriz permutadora P de 3 X 3 dada
arriba.
Solución a) Cálculo de P A:
D
1
[ [¡ 3
!] [¡ 4
!lO 4 3
O 3 3
P A e 3.
Obsérvese que la matriz producto ees la matriz A con la primera y segunda filas inter-
cambiadas
b) Cálculo de A P
[¡ 3
!] [!
1
~][; 1
;]4 O 1
3 O 1
A P D
Obsérvese que la matriz producto D es la matriz A con la primera y segunda columnas in-
tercambiadas.
Para realizar los cálculos puede usarse el siguiente guión de Matlab o la TI-92 Plus:
[1,3,3; 1,4,3; 1,3, 4]~ a
{0,1,0;1,0,O;0,0,1]~p
p*a~c
a*~d
A={1 3 3; 1 4 3; 1 3 4]
P={O 1 O; 1 O O; O O 1]
disp ('C=P * A')
C=P*A
disp ('D=A * P')
D=A*P
La matriz identidad es un caso particular de matriz permutadora y su efecto es dejar igual la
matriz por la que se multiplica (ya sea por la derecha o por la izquierda). Este hecho, jun-
to con el ejemplo 3.7, manifiesta que cuando aparece un 1 en la diagonal principal de una
matriz permutadora, la fila o columna correspondiente de la matriz por la que se multipli-
que no sufre cambio alguno.
Véase que hay un 1 en la posición (3, 3) de la matriz P y que la fila 3 y la columna 3
deA no sufrieron intercambio en los incisos a) y b), respectivamente, en el ejemplo 3.7.
rEi~'~tJ:S' Sin multiplicar diga qué efecto tendrá sobre una matriz cualquiera A de 4 X 4 la siguiente
matriz:
O
O
O
1
O
O
1
O ~l E
Matrices y sistemas de ecuaciones lineales 141
Solución Análisis de la multiplicación P A . Los unos en las posiciones (1, 1) Y (3, 3) indican que
las filas 1 y 3 de A no sufrirán efecto alguno. Por otro lado, los unos de la segunda y cuarta
filas cuyas posiciones son (2, 4) y (4, 2) indican que las filas 2 y 4 de A se intercambiarán
(nótese que en el ejemplo 3.7, los unos fuera de la diagonal ocupan las posiciones (1, 2) Y
(2, 1) y las filas 1 y 2 se intercambian).
El lector puede generalizar estos resultados de manera muy sencilla.
3.2 Vectores
Las matrices donde m > 1 y n = 1 (es decir, están formadas por una sola columna) son lla-
madas matrices columna o vectores. De igual manera, si m = 1 Yn >1, se tiene una matriz
fila o vector. Los vectores se denotarán con las letras minúsculas en negritas: a, b, x, etc.
En estos casos no será necesaria la utilización de doble subíndice para la identificación de
sus elementos y un vector x de m elementos (en columna) queda simplemente como:
x=
Un vector y de n elementos (en fila) queda como:
Por ejemplo, los siguientes vectores están en columna:
y estos en fila
o
O
O
O
O
[ O 1 Ol, [ 3 5 7 2 ], [ O O O O Ol.
Obsérvese que si se tiene un vector columna, la transpuesta será un vector fila y vice-
versa.
Dado x =
Obtener la transpuesta de los vectores columna y fila dados arriba.
Matrices y sistemas de ecuaciones lineales 141
Solución Análisis de la multiplicación P A . Los unos en las posiciones (1, 1) Y (3, 3) indican que
las filas 1 y 3 de A no sufrirán efecto 3.1guno. Por otro lado, los unos de la segunda y cuarta
filas cuyas posiciones son (2, 4) y (4, 2) indican que las filas 2 y 4 de A se intercambiarán
(nótese que en el ejemplo 3.7, los unos fuera de la diagonal ocupan las posiciones (1, 2) Y
(2, 1) y las filas 1 y 2 se intercambian).
El lector puede generalizar estos resultados de manera muy sencilla.
3.2 Vectores
Las matrices donde m > 1 y n = 1 (es decir, están formadas por una sola columna) son lla-
madas matrices columna o vectores. De igual manera, si m =1 Yn >1, se tiene una matriz
fila o vector. Los vectores se denotarán con las letras minúsculas en negritas: a, b, x, etc.
En estos casos no será necesaria la utilización de doble subíndice para la identificación de
sus elementos y un vector x de m elementos (en columna) queda simplemente como:
x =
Un vector y de n elementos (en fila) queda como:
Por ejemplo, los siguientes vectores están en columna:
y estos en fila
o
O
O
O
O
[010],[3572],[00000].
Obsérvese que si se tiene un vector columna, la transpuesta será un vector fila y vice-
versa.
Dado x =
Obtener la transpuesta de los vectores columna y fila dados arriba.
142 Métodos numéricos aplicados a la ingeniería
Solución
mr = [100],
13~llT
lJ = [3 105]
El
o
o
o
o
o
[O 1 O]' = [!l[3 5 7 2]' = m
= [00000]
T
[00000]'= m
Como en el texto resulta generalmente difícil expresar un vector en columna, se usará al-
gunas veces su transpuesta.
MULTIPLICACiÓN DE VECTORES
Dado que los vectores son sólo casos particulares de las matrices, siguen las mismas re-
glas de multiplicación que éstas. Sea por ejemplo a = [al a2 ... an] y b" = [bl b2 ••• bn], el
producto a b es:
Ej~
a b = [al a2 ... all
]
1 X n
= al bl + a2 b2 + ... + an bll
1 X 1
bn
n X 1
El producto de a por b es el número real al bl + a2 b2 + ... + an bn, que también puede
verse como una matriz de 1 X 1.
Multiplicando en orden inverso
bl bl al bl
a2 bl <
b2 b2 al b2
a2 b2 «:
ba= [al a2 ... an] =
bll
1 X n
bn al bn a2 bn =;
n X 1 nXn
se obtiene una matriz de n X n.
e
Matrices y sistemas de ecuaciones lineales 143
Ejemplo 3.10 Dados a = [ 1 57] Y bT
= [O -2 3], obtener ab y ba
Solución
ab= = 1(0) + 5(-2) + 7(3) = 11
1 x 1
[1 57]
1 x 3
3 x 1
y
[
0] [ 0(1)
b a = -2 [1 5 7] = -2(1)
3 3(1)
0(7)] [ °-2(7) = -2
3(7) 3
° 0J-10 -14
15 21
0(5)
-2(5)
3(5)
Puede multiplicarse también un vector por una matriz y viceversa si las dimensiones son
adecuadas.
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
a=[l 5 7]
b=[O; -2; 3]
ab=a*b
ba=b*a
[l,5,7] ....•a
[O;-2,3] ....•b
a*b ....•ab
b*a ....•ba
Ejemplo 3.11
. [0Multiplique el vector a = [1 -23] por la matriz B= -~
4
8
1 ~]
Solución
a B e
[-!
4
~][1 -2 3] 8 [11 -9 14]
1 X 3 1 1 X 3
3 X 3
los elementos de e se calculan como:
1(0) + (-2) (-1) + 3(3) = 11
1(4) + (-2) (8) + 3(1)= -9
1(3) + (-2) (2) + 3(5) = 14
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
144 Métodos numéricos aplicados a la ingeniería
[1,-2,3]--->a
[0,4,3;-1,8,2;3,1,5] ·"D
a*b--->e
a=[l -2 3]
B=[O 4 3; -1 8 2; 3 1 5]
c=a*B
Efectuar la multiplicación en orden inverso (B a) no es posible, por no ser conformes en
ese orden. En cambio, sí puede multiplicarse B por algún vector columna d de tres elemen-
tos. Así:
4
8
1
3 X 3
[
0(1) + 4(0) + 3(2)]
-1(1) + 8(0) + 2(2)
3(1) + 1(0) + 5(2)
3 X 1 3 X 1
PRODUCTO PUNTO DE VECTORES
Definición. Dados dos vectores a y b con igual número de elementos, por ejemplo n, su
producto punto (o escalar), denotado por a . b, es un número real obtenido de la siguiente
manera
al b¡
a2 b2
a· b= a¡ s, + a2 b2+ ... + an bn (3.13)
an bll
Si a =
[!] y b=
[
-~] , obtenga el producto punto.
2.5
Solución a . b = 2(-3) + 1(0) + 6(2.5) = 9
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
I
In!
e
Ion:
[2,1,6]--->a
[-3;0;2.5]--->b
a*b--->ab
a=[2 1 6]
b=[-3; O; 2.5]
ab=a*b
Matrices y sistemas de ecuaciones lineales 145
Este producto punto así definido tiene las siguientes propiedades
a) a . b = b . a conmutatividad.
b) (a + b) . e = a . e + b . e distributividad.
e) (a. a) . b = a. (a . b) para cualquier número real (l. Asociatividad.
d) a- a ;::O ya· a = O si y sólo si a = O. Positividad de la definición.
(3.14)
(3.15)
(3.16)
(3.17)
Sólo se demostrará la propiedad (a) y se dejarán las restantes como ejercicio para el
lector.
Demostración de (a)
y
b· a = b¡ a¡ + b2a2 + ... + bpn
Por la conmutatividad de la multiplicación de los números reales se tiene que
y por tanto
a v b = b v a
Enseguida se definirán conceptos tan importantes como la longitud de un vector, el ángulo
entre dos vectores cualesquiera y distancia entre vectores en función del producto punto.
Cada una de estas ideas tiene un significado bien definido en los vectores de dos ele-
mentos en la geometría analítica, y es razonable pedir que cualquier definición que se
adopte se reduzca a la ya conocida. Con esto en mente, se pueden obtener definiciones
aceptables extendiendo las fónriulas correspondientes de la geometría analítica a vectores
de n elementos.
LONGITUD DE UN VECTOR
La noción de longitud para vectores de dos elementos está dada por la siguiente definición:
Sea x un vector cualquiera de dos elementos, sil longitud denotada por Ixl es el nú-
mero real no negativo"
I~Gráficamente se representa así
(3.18)
Figura 3.1
Interpretación
gráfica de la
longitud de un
vector.
• Se dice que un número real es no negativo cuando s610 puede ser cero o positivo.
Figura 3.1
Interpretación
gráfica de la
longitud de un
vector.
Matrices y sistemas de ecuaciones lineales 145
Este producto punto así definido tiene las siguientes propiedades
a) a· b =b . a conmutatividad.
b) (a + b) . e =a . e + b . e distributividad.
e) (a. a) . b =a. (a . b) para cualquier número real a . Asociatividad.
d) a· a ;:: Oya· a = Osi y sólo si a =O. Positividad de la definición.
(3.14)
(3.15)
(3.16)
(3.17)
Sólo se demostrará la propiedad (a) y se dejarán las restantes como ejercicio para el
lector.
Demostración de (a)
y
b· a = b¡ a¡ + b2a2 + ... + bpn
Por la conmutatividad de la multiplicación de los números reales se tiene que
y por tanto
a·b = b·a
Enseguida se definirán conceptos tan importantes como la longitud de un vector, el ángulo
entre dos vectores cualesquiera y distancia entre vectores en función del producto punto.
Cada una de estas ideas tiene un significado bien definido en los vectores de dos ele-
mentos en la geometría analítica, y es razonable pedir que cualquier definición que se
adopte se reduzca a la ya conocida. Con esto en mente, se pueden obtener definiciones
aceptables extendiendo las fórmulas correspondientes de la geometría analítica a vectores
de n elementos.
LONGITUD DE UN VECTOR
La noción de longitud para vectores de dos elementos está dada por la siguiente definición:
Sea x un vector cualquiera de dos elementos, sil longitud denotada por Ixl es el nú-
mero real no negativo*
I.:.:.=!.:.!l (3.18)
Gráficamente se representa así
• Se dice que un número real es no negativo cuando s6lo puede ser cero o positivo.
146 Métodos numéricos aplicados a la ingeniería
La ecuación 3.18 puede escribirse en términos del producto punto como:
Ixl= ¡-x:x (3.19)
lo cual está bien definido para vectores de n elementos y puede, por tanto, tomarse como lon-
gitud de estos últimos.
Definición. La longitud (o norma) de un vector x de n componentes, con n ;::::1, está
dada por el número real no negativo.*
Ixl = J xl + xi ...+ x,;
(3.20)
Ixl=~
Ejel
Ejemplo 3.13
Si a = , encuentre su norma.
Solución
la I = J 25 + 9 +16 = 7.0711
Para realizar los cálculos puede usarse el siguiente guión de'Matlab o la TI-92 Plus.
I
[5,3,4]-4a
. norm (a) -4 norma
a=[5 3 4]
Norma=norm (a)
ÁNGULO ENTRE VECTORES
Hay que recordar que si se tienen dos vectores de dos componentes, ambos distintos del
vector cero, la fórmula'
cos e
x • y
Ixl I Y I
(3.21)
es una consecuencia inmediata de la ley de los cosenos. Como la expresión
x·y
Ixl I Y r '
está bien definida para vectores distintos del vector cero, de n componentes, parece con-
veniente usarla como definición del ángulo entre vectores de más de dos componentes.
Sin embargo, sería necesario probar primero que el rango o codo minio de esta expresión
-usando vectores x, y de n componentes- es el intervalo cerrado [-1, 1], para que así se
guarde consistencia con el primer miembro de la ecuación 3.21.**
F
vec
• Se conoce también como norma eucIideana y algunos autores la representan por Lz.
•• Recuérdese que la función cos tiene como rango el intervalo [-1, 1].
146
Ejemplo 3.13
Solución
Métodos numéricos aplicados a la ingeniería
La ecuación 3.18 puede escribirse en términos del producto punto como:
I x l= ¡-X;X (3.19)
lo cual está bien definido para vectores de n elementos y puede, por tanto, tomarse como lon-
gitud de estos últimos.
Definición. La longitud (o norma) de un vector x de n componentes, con n ;::: 1, está
dada por el número real no negativo.*
Ixl= ~
Ixl = Jxt + xi ... + x,;
(3.20)
Si a = , encuentre su norma.
I a I = J25 + 9 +16 = 7.0711
Para realizar los cálculos puede usarse el siguiente guión de'Matlab o la TI-92 Plus.
a=[5 3 4]
Norma=norm (a)
ÁNGULO ENTRE VECTORES
I
[5 ,3, 4] ->a
~ norm (a ) -> norma
Hay que recordar que si se tienen dos vectores de dos componentes, ambos distintos del
vector cero, la fórmula'
cos e
x • y
Ixl I Y I
es una consecuencia inmediata de la ley de los cosenos. Como la expresión
x'y
I x l I Y l '
(3.21)
está bien definida para vectores distintos del vector cero, de n componentes, parece con-
veniente usarla como definición del ángulo entre vectores de más de dos componentes.
Sin embargo, sería necesario probar primero que el rango o codominio de esta expresión
-usando vectores x, y de n componentes- es el intervalo cerrado [-1 , 1], para que así se
guarde consistencia con el primer miembro de la ecuación 3.21.**
• Se conoce también como norma eucIideana y algunos autores la representan por Lz'
•• Recuérdese que la función cos tiene como rango el intervalo [- 1, 1].
2l)
Matrices y sistemas de ecuaciones lineales 147
La demostración está fuera de los objetivos de este libro, pero el lector interesado pue-
de encontrarla en Kreider et. al.*
Definición. Si x y y son vectores distintos del vector O, con n componentes, el cose-
no del ángulo entre ellos se define como:
x'y
cos ()=---
Ixl I Y I
Si alguno de los vectores es el vector cero, se hace cos ()igual a cero.
Ejemplo 3.14 Si x" = [2 -34 1 ] YyT = [ -1 242], calcule el ángulo entre ellos.
Solución
cos ()= 2(-1) + (-3) (2) + 4(4) + 1(2) = 0.3651
J 4 + 9 + 16 + 1 J 1 + 4 + 16 + 4
de donde ()= 68.58
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
x=[2 -3 4 1J
y=[ -1 2 4 2J
ct=(x*y')/(norm(x)*norm(y))
teta=acos(ct)/pi*180
[2,-3,4,lJ-+x
[-1,2,4,2J-+y
dotp (x,y) / (norm (x) *norm (y)) -+ct
cos-1 (ct)/JtI'180-+teta
DISTANCIA ENTRE DOS VECTORES
Uno de los tres conceptos que aún no se analiza es el de distancia entre dos vectores de n
componentes. De nueva cuenta esto se hará "copiando" la definici0ñ dada en la geometría
analítica, donde la distancia entre x y y es la longitud del vector ( x - y ) (véase Fig. 3.2).
Definición. La distancia entre dos vectores x y y de n componentes es
d(x, y) = I x - y I (3.22)
definición que satisface las siguientes propiedades
y
Figura 3.2
Resta de
vectores en el
plano. x
* Kreider, Kuller, Ostberg, Perkins. An Introduction 10 Linear Analysis. Addison-Wesley (1966).
Matrices y sistemas de ecuaciones lineales 147
La demostración está fuera de los objetivos de este libro, pero el lector interesado pue-
de encontrarla en Kreider et. al.*
Definición. Si x y y son vectores distintos del vector O, con n componentes, el cose-
no del ángulo entre ellos se define como:
x'y
cos ()=---
Ixl I Y I
Si alguno de los vectores es el vector cero, se hace cos () igual a cero.
Ejemplo 3.14 Si xT
= [2 -34 1 ] Yy T = [-1 242], calcule el ángulo entre ellos.
Solución
Figura 3.2
Resta de
vectores en el
plano.
cos () =
de donde () = 68.58
2(-1) + (-3) (2) + 4(4) + 1(2) = 0.3651
J4 + 9 + 16 + 1 J1 + 4 + 16 + 4
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
x=[2 - 3 4 1J [2 , -3 , 4 , lJ ->x
[-1 , 2 , 4 , 2J ->yy=[ -1 2 4 2J
c t=(x*y') / (norm(x)*n orm (y ))
t eta=acos (ct)/pi*180
dotp (x,y) / (norm(x)*norm(y)) -> ct
cos-1 (ct)/Jtl'180->t e ta
DISTANCIA ENTRE DOS VECTORES
Uno de los tres conceptos que aún no se analiza es el de distancia entre dos vectores de n
componentes. De nueva cuenta esto se hará "copiando" la definicióii dada en la geometría
analítica, donde la distancia entre x y y es la longitud del vector ( x - y ) (véase Fig. 3.2).
Definición. La distancia entre dos vectores x y y de n componentes es
d(x, y) = I x - y I (3.22)
definición que satisface las siguientes propiedades
y
x
* Kreider, Kuller, Ostberg, Perkins. An lntroduction to Linear Analysis. Addison- Wesley (1966).
lipa
148 Métodos numéricos aplicados a la ingeniería
a) La distancia entre dos vectores es un número real no negativo que es cero si y só-
lo si se trata del mismo vector; es decir, 3.3
d( x, y ) ~ O Y d( x, y) = O si y sólo si x = y (3.23)
b) Es independiente del orden en que se tomen los vectores; esto es
d(x, y) = d(y, x)
e) Finalmente, satisface la desigualdad del triángulo, conocida en la geometría en
los términos: la suma de las longitudes de los catetos de un triángulo es ma-
yor o igual a la longitud de la hipotenusa: esto es
d(x, y) + d(y, z) ~ d(x,z) Eje
para tres vectores cualesquiera x, y y z.
Calcule la distancia entre x y y dadas por:
x" = [O 35 1 ], yT = [ -2 1 -3 1 ]
Solución Primero se obtiene x - y
x-y= m-UJ = m
La norma de este vedar es:
Ix - y I = J 22 + 22 + 82 + 02
= [Ti = 8.4853,
y, por tanto, la distancia entre x y y es 8.4853 unidades de longitud.
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
X=[O 3 5 1J
y=[-2,l,-3,lJ
dist=norm (x-yL
[O,3,5,lJ ....•x
[-2,l,-3,l} ....•y
norm (x-y) ....•dist
Obsérvese que ninguno de estos tres conceptos tiene representación geométrica cuando el
número de componentes de los vectores es mayor de tres.
SUGERENCIA: Explore con Mathcad, Matlab o algún software disponible, las operaciones vistas y
sus propiedades. Ejer
148 Métodos numéricos aplicados a la ingeniería
a) La distancia entre dos vectores es un número real no negativo que es cero si y só-
lo si se trata del mismo vector; es decir,
d( x, y ) ~ OYd( x, y) = Osi y sólo si x = y (3.23)
b) Es independiente del orden en que se tomen los vectores; esto es
d(x, y) = d(y, x)
e) Finalmente, satisface la desigualdad del triángulo, conocida en la geometría en
los términos: la suma de las longitudes de los catetos de un triángulo es ma-
yor o igual a la longitud de la hipotenusa; esto es
d(x, y) + d(y, z) ~ d(x,z)
para tres vectores cualesquiera x, y y z.
Calcule la distancia entre x y ydadas por:
xT
= [O 3 5 1 ], yT = [ -2 1 - 3 1 ]
Solución Primero se obtiene x - y
x-y= m-UJ = m
La norma de este vector es:
I x - y I = J22 + 22 + 82 + 02 = [7i =8.4853,
y, por tanto, la distancia entre x y y es 8.4853 unidades de longitud.
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
x=[O 3 5 l}
y=[-2,l,-3,l]
dist=norm (x-y)
[O,3,5,l}-+x
[-2,l,-3,l]-+y
norm (x-y) -+dist
Obsérvese que ninguno de estos tres conceptos tiene representación geométrica cuando el
número de componentes de los vectores es mayor de tres.
SUGERENCIA: Explore con Mathcad, Matlab o algún software disponible, las operaciones vistas y
sus propiedades.
Matrices y sistemas de ecuaciones lineale s 149
3.3 Independencia y ortogonalización de vectores
Una expresión de la forma
(3.26)
donde a" ~, ... , an son números re~es y xi' x2'... , Xn son vectores de m elementos cada
uno, se llama combinación lineal de los vectores xi' x2'··· , xn.
¿La expresión
es una combinación lineal?
Solución Sí; es una combinación lineal de [ 1 043 ]T, [ -42 1.65 F y [ 5 -2 O 1] T, con los esca-
lares 2.5,3 Y-7, respectivamente. I
A menudo los elementos de un vector Xi de una combinación lineal, tendrán dos subíndi-
ces; el primero indica la fila a que pertenece y el segundo se refiere al vector a que corres-
ponde, así
Xli
X2i
Xi =
Se dice que un vector x = [xi' X2' .•• xmF, depende linealmente de un conjunto de vectores
de m elementos xi' x2' ... xn' si se pueden encontrar escalares al a2, ... an
, tales que se
cumpla la siguiente ecuación vectorial
(3.27)
Si, por el contrario, no existen escalares que satisfagan tal ecuación, x es un vector lineal-
mente independiente de Xl x2' ... , x¡¡'En otras palabras, X es linealmente dependiente de
xl, x2'··· xn si y sólo si X es una combinación lineal de xi' x2'··· xll
'
Dado el conjunto de dos vectores de dos elementos:
y
demuestre que el vector xT = [O 8]T es linealmente dependiente de dicho conjunto.
Solución Es suficiente encontrar dos escalares al y a2 tales que la combinación al Xl + a2
x2
repro-
duzca a x. Por observación se advierte que los números al = 1 Y a2 = 2 cumplen este re-
quisito.
M at rices y s istemas de ecuaciones lineales 149
3.3 Independencia y ortogonalización de vectores
Una expresión de la forma
(3.26)
donde al' az,... ,a n son números reales y X" x2' ... , Xn son vectores de m elementos cada
uno, se llama combinación lineal de Íos vectores x" x2'··· , Xn
'
¿La expresión
es una combinación lineal?
Solución Sí; es una combinación lineal de [ 1 043 ]T, [ -42 1.65 JT y [ 5 - 2 O 1] T, con los esca-
lares 2.5, 3 Y-7, respectivamente. I
A menudo los elementos de un vector Xi de una combinación lineal, tendrán dos subíndi-
ces; el primero indica la fila a que pertenece y el segundo se refiere al vector a que corres-
ponde, así
Xi =
Se dice que un vector X = [x" x2' ... xmF, depende linealmente de un conjunto de vectores
de m elementos xl' x2' ... xn' si se pueden encontrar escalares al a2, . . . an
, tales que se
cumpla la siguiente ecuación vectorial
(3.27)
Si, por el contrario, no existen escalares que satisfagan tal ecuación, x es un vector lineal-
mente independiente de Xl x2' ... , xn
' En otras palabras, X es linealmente dependiente de
Xl, x2'··· xn si y sólo si X es una combinación lineal de x" x2'··· xll
'
Dado el conjunto de dos vectores de dos elementos:
y
demuestre que el vector xT = [O 8]T es linealmente dependiente de dicho conjunto.
Solución Es suficiente encontrar dos escalares al y a 2 tales que la combinación al Xl + a 2 x2 repro-
duzca a x. Por observación se advierte que los números al = 1 Ya2= 2 cumplen este re-
quisito.
150 Métodos numéricos aplicados a la ingeniería
Generalmente, encontrar los escalares o la demostración de que no existen es un problema
difícil que requiere una técnica específica, misma que se desarrolla más adelante.
INDEPENDENCIA DE CONJUNTOS DE VECTORES
Un conjunto de vectores dado Yl' Y2"" Yn' es linealmente dependiente si por lo menos uno
de ellos es combinación lineal de alguno o todos los vectores restantes. Si ninguno lo es,
se dice que es un conjunto linealmente independiente.
Sea el siguiente conjunto de cuatro vectores de tres elementos cada uno.
Determine si es linealmente dependiente o independiente.
Solución Este conjunto es linealmente dependiente, ya que Y3 se obtiene de la combinación
YY4 se obtiene de combinar Y¡ y Y2 en la siguiente forma
[
O.03~
-0.9
O
o m + 0.3
Ir
gl
in
Si se considera el conjunto formado sólo por Y, y Y2' se tiene que es linealmente indepen-
diente, ya que ninguno se obtiene multiplicando al otro por algún escalar.
Cualquier conjunto que tenga el vector cero (vector cuyos componentes son todos ce-
ro) como uno de sus elementos, es linealrnente independiente, ya que dicho vector podrá
obtenerse siempre de cualquier otro vector del conjunto por la combinación
Un conjunto formado por un solo vector (distinto de O) es linealmente independiente.
o x',i
O X2,i
0= =0
O Xn,i Ir
gl
Matrices y sistemas de ecuaciones line ales 151
INTERPRETACiÓN GEOMÉTRICA DE LA INDEPENDENCIA LINEAL
Es conveniente estudiar la independencia lineal desde el punto de vista geométrico, aun-
que esto sólo valga para vectores de dos y tres componentes. Considérense los tres vecto-
res del ejemplo 3.17 en el plano x-y (Fig. 3.3). Por la geometría se sabe que dos vectores
que se cortan forman un plano (por ejemplo XI y x2
forman el plano x-y). Por tanto, es na-
tural pensar que si se tiene un tercer vector del plano x-y, éste pueda obtenerse de alguna
combinación de los que se cortan, por ejemplo x3
de XI y x2' aplicando la ley del parale-
logramo.
Si, por otro lado, se tienen dos vectores de dos componentes linealmente dependien-
tes, esto se manifiesta geométricamente como paralelismo (véanse los vectores XI y x2 de la
Fig. 3.4). Es evidente que estos vectores paralelos no forman un plano y un tercer vector x3
que no sea paralelo a ellos no podrá generarse con una combinación lineal de XI y x2.
En conclusión, la característica geométrica de dos vectores linealmente independien-
tes es que se cortan en un punto. En cambio, dos vectores linealmente dependientes son
paralelos.
y
10
Figura 3.3
Interpretación
geométrica de
independencia
lineal en el
plano. 2 4 6 8
x
y
Figura 3.4
Interpretación
geométrica de
dependencia
lineal en el
plano. x
Figura 3.3
Interpretación
geométrica de
independencia
lineal en el
plano.
Figura 3.4
Interpretación
geométrica de
dependencia
lineal en el
plano.
Matrices y sistemas de ecuaciones lineales 151
INTERPRETACiÓN GEOMÉTRICA DE LA INDEPENDENCIA LINEAL
Es conveniente estudiar la independencia lineal desde el punto de vista geométrico, aun-
que esto sólo valga para vectores de dos y tres componentes. Considérense los tres vecto-
res del ejemplo 3.17 en el plano x-y (Fig. 3.3). Por la geometría se sabe que dos vectores
que se cortan forman un plano (por ejemplo XI y x2 forman el plano x-y). Por tanto, es na-
tural pensar que si se tiene un tercer vector del plano x-y, éste pueda obtenerse de alguna
combinación de los que se cortan, por ejemplo x3 de XI y x2' aplicando la ley del parale-
logramo.
Si, por otro lado, se tienen dos vectores de dos componentes linealmente dependien-
tes, esto se manifiesta geométricamente como paralelismo (véanse los vectores XI y x2 de la
Fig. 3.4). Es evidente que estos vectores paralelos no forman un plano y un tercer vector x3
que no sea paralelo a ellos no podrá generarse con una combinación lineal de XI y x2.
En conclusión, la característica geométrica de dos vectores linealmente independien-
tes es que se cortan en un punto. En cambio, dos vectores linealmente dependientes son
paralelos.
y
10
2 4 6 8
x
y
x
152 Métodos numéricos apl icados a la ingeniería
CONJUNTOS ORTOGONALES DI';: VECTORES
Ejel
Dos vectores de igual número de componentes son ortogonales o perpendiculares si el co-
seno del ángulo entre ellos es cero. De acuerdo con esta definición, el vector cero es orto-
gonal con cualquier otro vector; en general, x y y son ortogonales si y sólo si
x o y = XI Yl + x2 Y2 + ... + xn YIl
= O,
derivada esta expresión del hecho que
cos () = _x_o .:....Y_
Ixl I Y I
A continuación se generaliza la definición de ortogonalidad.
Un conjunto de vectores Xl' x2
' ... xn forma un conjunto ortogonal si Xi:# Opara 1 ~
:{n, y
1~j:{n (3.28)
siempre que i ;f. j.
Determine si los vectores Xl y x2
del ejemplo 3.17 son ortogonales.
Solución
Son perpendiculares en el sentido usual del término (véase Fig. 3.3) Yesto es 10que sig-
nifica la definición, dada para cualquier número de componentes.
¿El conjunto siguiente es ortogonal?
x, ltl ~= m, ~= m
Solución Sí, ya que
XI o x2 = Xl o x3 = x2 o x3 = O
En cambio, si se adiciona a este conjunto el vector
el conjunto resultante xl' x2' x3' x4 no es ortogonal, pues
x4
o x2
= 1 ;f. O
Fi
Ortogo
en el,
152
Solución
Métodos numéricos aplicados a la ingeniería
CONJUNTOS ORTOGONALES DE VECTORES
Dos vectores de igual número de componentes son ortogonales o perpendiculares si el co-
seno del ángulo entre ellos es cero. De acuerdo con esta definición, el vector cero es orto-
gonal con cualquier otro vector; en general, x y y son ortogonales si y sólo si
x o y = XI YI + X2Y2 + .. . + Xn YIl
= O,
derivada esta expresión del hecho que
cos () = _x_o_Y_
Ixl I Y I
A continuación se generaliza la definición de ortogonalidad.
Un conjunto de vectores XI' X2' ... xn
forma un conjunto ortogonal si Xi :# Opara 1 ~
:5n, y
l~j :5 n (3.28)
siempre que i :f; j.
Determine si los vectores x I y x2 del ejemplo 3.17 son ortogonales.
Son perpendiculares en el sentido usual del término (véase Fig. 3.3) Yesto es 10 que sig-
nifica la definición, dada para cualquier número de componentes.
¿El conjunto siguiente es ortogonal?
x, m· ~= m· ~= m
Solución Sí, ya que
XI o x2 =XI o x3 =x2 o x3 = O
En cambio, si se adiciona a este conjunto el vector
el conjunto resultante xl' x2' x3' x4 no es ortogonal, pues
x4 o x2 = 1 :f; O
Matrices y sistemas de ecuaciones lineales 153
Corrobore si el siguiente conjunto de vectores es ortogonal
Solución
Xl • x2 = (-3) (2) + 4(2) + 1(-2.0003) = -0.0003
Obsérvese que los vectores son "casi" ortogonales. Esto ocurre con frecuencia y en los
cálculos prácticos será preciso decidir con qué cercanía a cero se aceptará que un produc-
to punto de dos vectores "es cero" y, por tanto, que los vectores son ortogonales. De nue-
vo e denotará el límite de aceptación o de rechazo. El valor que tome e estaría en función
del instrumento con que se lleven a cabo los cálculos. Por ejemplo, para una calculado-
ra de nueve dígitos de exactitud e puede ser 10-4. Con e = 10-4 los vectores de este ejem-
plo no son ortogonales. Así pues, E usado de esta manera puede llamarse criterio de
ortogonalidad.
ORTOGONALlZACIÓN
Se ha llegado al punto central de esta sección, donde es posible construir un conjunto de vec-
tores ortogonales (ortogonalización) a partir de un conjunto de vectores linealmente indepen-
dientes. Enseguida se considerará uno de los métodos más difundidos, la ortogonalización
de Gram-Schmidt, aunque pueda representar ciertas dificultades computacionales.
MÉTODO DE GRAM-SCHMIDT
En lugar de empezar con el caso más general, se introducirá el proceso de ortogonaliza-
ción con dos ejemplos; el primero se tiene cuando se toman dos vectores Xl y x2 del pla-
no x-y, linealmente independientes y a partir de ellos se forma el conjunto ortogonal el y
e
2
. La figura 3.5 muestra la manera natural de resolver este caso; simplemente se toma el
= Xl Y e2 como la "componente" de x2 perpendicular a Xl' Así, se escribe e2
en la forma
(3.29)
y sólo queda determinar (X,1,2 de manera que la condición el • e2 = O se cumpla. Esto da la
ecuación
(3.30)
Figura 3.5
Ortogonalización
en el plano x-y.
Solución
Figura 3.5
Ortogonalización
en el plano x-y.
Matrices y sistemas de ecuaciones lineales 153
Corrobore si el siguiente conjunto de vectores es ortogonal
Xl • x2 = (- 3) (2) + 4(2) + 1(-2.0003) = -0.0003
Obsérvese que los vectores son "casi" ortogonales. Esto ocurre con frecuencia y en los
cálculos prácticos será preciso decidir con qué cercanía a cero se aceptará que un produc-
to punto de dos vectores "es cero" y, por tanto, que los vectores son ortogonales. De nue-
vo E denotará el límite de aceptación o de rechazo. El valor que tome E estaría en función
del instrumento con que se lleven a cabo los cálculos. Por ejemplo, para una calculado-
ra de nueve dígitos de exactitud E puede ser 10-4. Con E =10-4 los vectores de este ejem-
plo no son ortogonales. Así pues, E usado de esta manera puede llamarse criterio de
ortogonalidad.
ORTOGONALlZACIÓN
Se ha llegado al punto central de esta sección, donde es posible construir un conjunto de vec-
tores ortogonales (ortogonalización) a partir de un conjunto de vectores linealmente indepen-
dientes. Enseguida se considerará uno de los métodos más difundidos, la ortogonalización
de Gram-Schmidt, aunque pueda representar ciertas dificultades computacionales.
MÉTODO DE GRAM-SCHMIDT
En lugar de empezar con el caso más general, se introduCirá el proceso de ortogonaliza-
ción con dos ejemplos; el primero se tiene cuando se toman dos vectores XI y x2 del pla-
no x- y, linealmente independientes y a partir de ellos se forma el conjunto ortogonal el y
e2. La figura 3.5 muestra la manera natural de resolver este caso; simplemente se toma el
= XI Y e2 como la "componente" de x2 perpendicular a XI' Así, se escribe e2 en la forma
(3.29)
y sólo queda determinar (X1.2 de manera que la condición e l • e 2 = Ose cumpla. Esto da la
ecuación
(3.30)
"
154 Métodos numéricos aplicados a la ingeniería
y finalmente:
X2• el
0.
12
=---
, el· el
De este modo e2
queda determinado en función de XI y x2' y el conjunto Xl' X2 se ha
ortogonalizado.
(3.31)
Ortogonalice xl = [2 2]T Yx2 = [3 O]T
Solución
y
1, ' con
[2 2F· [3 O]T
a - ---=---_=_
1,2 - [2 2]T. [2 2]T
6 3
4 + 4 4
Sustituyendo queda:
e2
= [3 O]T- ~ [2 2F = [3 O]T- [~ ~]T = [1.5 -1.5F
Al graficar estos vectores se obtiene la siguiente figura
y
Figura 3.6
Ortogonalización
de vectores.
x
x,= [:]
- [1.5]e2 -
-1.5
Ort
Obsérvese la perpendicularidad de el y e2·
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
~
xl=[2; 2J
x2=[3; OJ
el=xl
alfa12=(el'*x2)/(el'*el)
e2=x2-alfa:{.2*el
[2;2J~xl
[3;OJ~x2
x l=+e I
dotP(el,x2)/dotP(el,el)~a12
x2-a12*el~e2
154 Métodos numéricos aplicados a la ingeniería
y finalmente:
X2 ' el
Ct.1 2 =---
, el • e l
(3.3 1)
De este modo e2 queda determinado en función de XI y x2' y el conjunto xI' x2 se ha
ortogonalizado.
Ejemplo 3.22 Ortogonalice xI =[2 2]T Yx 2 =[3 O]T
Solución
Figura 3.6
Ortogonalización
de vectores.
y
con
[2 2]T. [3 Of
Ct. - -- -- - -
1,2 - [2 2]T. [2 2]T
6
4+4
3
4
Sustituyendo queda:
e2 = [3 O]T - ~ [2 2]T = [3 O]T - [~ ~]T = [1.5 - 1.5]T
Al graficar estos vectores se obtiene la siguiente figura
y
x
Obsérvese la perpendicularidad de el y e2.
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
xl=[2; 2J
x2=[3; OJ
el=xl
alfa12=(el '*x2) / (el ' *el)
e2=x2- alfa¡2*el
[2 ; 2J ....xl
[3 ; OJ ....x2
xl"" el
dotP (el , x2) / dotP (el, el) ....a12
x2- a12*el ....e2
Matrices y sistemas de ecuaciones lineales 155
Como segundo ejemplo se ortogonalizará el conjunto arbitrario xl' x2' x3 de vectores
lineales independientes de tres componentes. El procedimiento es esencialmente igual al
que se usó antes, y se empieza escogiendo e¡ = Xl' El segundo paso es determinar e2 de
acuerdo con el par de ecuaciones
e2 • el = O, e2 = x2 - a¡,2 e¡
de las que se obtiene nuevamente que
X2' el
a¡,2=---
el • el
Obsérvese que e2
:;:. O; de lo contrario se cumpliría la primera de las ecuaciones 3.32 y en
la segunda se tendría que x2 = al,2el = al,2 xl' O sea que x2 estaría en función de xl' lo
cual es imposible por la independencia lineal de XI y x2
.
Para el tercer vector se recurre nuevamente a una representación geométrica, en don-
de se verá que el proceso de ortogonalización puede completarse tomando e3
como la com-
ponente de x3 perpendicular al plano formado por los vectores el y e2 (Fig.3.7).*
De esto se tiene
e3 = x3 - al,3e¡ - ~,3e2
y se puede encontrar al,3 y ~,3 por medio de las condiciones de ortogonalidad
e¡ • e2 = el • e3 = e2 • e3 = O
Figura 3.7
Ortogonalización
en el espacio
x-y-z.
I
I
I
I
- - -~--=ii-l
/'
Multiplicando en forma punto los dos miembros de la ecuación 3.34 por el Y después por
e2
, se obtiene el par de ecuaciones
e3 el O x3 e¡ a1,3e¡ e¡ ~,3e2 e¡
e3 e2 O x3 e2 al,3e¡ e2 a2,3e2 e2
o bien
x3 el = al,3 el • el
x3 e2 = a2,3 e2 • e2
• Recuérdese que dos líneas que se cortan solamente en un punto forman un plano.
r:x:--
(3.32)
(3.33)
(3.34)
(3.35)
(3.36)
156 Métodos nu méricos aplicados a la ingeniería
resolviendo para <x1,3 y para <X2,3' se tiene
x3• el
<Xl,3 =e-:e'1 1
y con esto termina la ortogonalización del conjunto xl' x2' x3'
Ortogonalice los vectores
Solución
el = Xl' e2 = x2 - al,2 el' Y
e3 = x3 - al,3el - az,3e2'
/
,,--~- - - - - -/o
/ I
/ I
// I
x3
='11, 1, l]T I
/
J I T
.11 e~= [-0.5,0.5, O]
/ I I
/ -'-
~ ~- T
I / x2 = [O, 1, O]
/
I
/
I /
/
/
Figura 3.8
Ortogonalización
en el espacio.
/
/
/
/
/
I /
LI'_
/
/
/
Xl = el = [1, 1, OF
donde a¡,2 al,3' y az,3
se obtienen de las ecuaciones
x2• el
a¡,2=~'
¡ 1
. x3• el
a ----1,3 - el· el '
Al verificar los cálculos se llega a
al,2 = 1/2, a¡,3 = 1, az,3 = O
y sustituyendo
e¡ =[11 O]T, e2 =[-1/21/2 O]T, e3 =[O 01 ]T
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
156
Solución
Figura 3.8
Ortogonalización
en el espacio.
Méto d os n u m é rico s aplic a dos a la in geniería
resolviendo para <x1,3 y para <X2,3' se tiene
x 3 • el
<Xl,3 = e-;e-'
1 1
y con esto termina la ortogonalización del conjunto xl' x2' x3.
Ortogonalice los vectores
/
L"_
/
/
/
/
/
/
/
/
/
- .../
1I
el =Xl' e 2 =x2 - al ,2 el' y
e 3 = x3 - al ,3e l - ~,3e2'
- - - -'1
/
/ I
/
I
I T
e~ = [-0.5,0.5, O]
I
~r-
/~ T
/ x2
= [O, 1, O]
/
/
/
/
donde a l ,2 a l ,3' y ~,3
se obtienen de las ecuaciones
x2 • el
a ----1,2 - el. el '
Al verificar los cálculos se llega a
. x3 • el
a - - --l,3 - el · el '
al ,2 = 1/2, al ,3 = 1, ~,3 =O
y sustituyendo
el =[11 O]T, e 2 =[-1/21/2 O]T, e 3 =[O 01 ]T
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
Matrices y sistemas de ecuaciones lineales 157
.:;.
xl=[1; 1; OJ
x2=[0; 1; O]
x3=[l; 1; lJ
el=xl
alfa12=(el'*x2)/(el'*el)
e2=x2-alfa12*el
alfa13=(el'*x3)/(el'*el)
alfa23= (e2'*x3) / (e2'*e2)
e3=x3-alfa13*el-alfa23*e2
xl->el
dotP(el,x2) /dotP(el,el) ->a12
x2-a12*el->e2
dotP(el ,x3) /dotP(el ,el) ->al3
dotP(e2,x3)/dotP(e2,e2j->a23
x3-a13*el-a23*e2->e3
[l;l;OJ->xl
[O; 1;OJ->x2
[1; 1; 1]->x3
Una vez realizado lo anterior, se pude pasar el caso general de ortogonalizar un conjunto
de n vectores linealmente independientes xl' x2' ... , x" de n componentes cada uno. Pri-
mero se efectuará el = xl' después e2= x2 -al,2 el' donde al,2 se escoge de manera que el
. e2
= O.
De aquí que
X2 • el
al,2 = --e-:-e 'I I
Yla independencia lineal de XI y x2
implica que e2
-:f. O.
Unicamente queda por demostrar que este proceso puede continuar hasta obtener un
conjunto ortogonal el' e2, ... e". Para ello, supóngase que se llegó al conjunto ortogonal el'
e2, .•• , em con m < n. Para continuar un paso más efectúese
y determínese al m+l' ~ m+1... , am m+l' de manera que em+1sea ortogonal a cada elemen-
to del conjunto e'l' e2
, ... ',em. Consecuentemente el conjunto de ecuaciones es
Xm+1 • el
xm+l • e2
al,m+1 (el· el) = O,
~,m+1 (e2 • e2) = O,
am,m+1 (em• em) = O,
y por tanto:
que determinan em+ l' De nuevo, la independencia lineal de XI' x2'· .. , xm+ 1, implica que em+ I
-:f. O.Por tanto, el proceso de ortogonalización se ha aumentado en un paso y con el mismo
argumento puede continuarse hasta tener m = n. Lo anterior queda condensado en el si-
guiente teorema.
TEOREMA 3.1 Sean XI' x2' •.. , x"' un conjunto de vectores linealmente independientes de n
componentes cada uno. A partir de ellos se puede construir un conjunto
ortogonal el' e2,··· , en de la siguiente manera
(3.37)
Matrices y sistemas de ecuaciones lineales 157
xl=[l; 1; OJ
x2=[0; 1; O]
x3=[l; 1 ; 1]
el=xl
alfa12=(el'*x2)/(el'*el)
e2=x2- alfa12*el
alfa13=(el'*x3)/(el '*el)
alfa23= (e2'*x3) / (e2'*e2)
e3=x3-alfa13~el-alfa23*e2
xl-+el
[l ; l ; O]-+xl
[O ; 1 ; 0]-+x2
[1 ; 1; 1] -+x3
dotP (el , x2) /dotP (el , el) -+a12
x2- a12*el-+ e2
dotP(el ,x3) /dotP(el ,el) -+a13
dotP(e2,x3)/dotP(e2,e2j-+a23
x3-al3*el - a23*e2-+e3
Una vez realizado lo anterior, se pude pasar el caso general de ortogonalizar un conjunto
de n vectores linealmente independientes xl' x2' ... , xI! de n componentes cada uno. Pri-
mero se efectuará el =Xl' después e2=x2 -al ,2 el' donde al ,2 se escoge de manera que el
. e2 =O.
De aquí que
y la independencia lineal de XI y x2 implica que e2 ::f:. O.
Unicamente queda por demostrar que este proceso puede continuar hasta obtener un
conjunto ortogonal el' e2, .. . en' Para ello, supóngase que se llegó al conjunto ortogonal el'
e2, .. • , em
con m < n. Para continuar un paso más efectúese
y determínese al m+l' ~ m+1 . . . , am m+l' de manera que em+1 sea ortogonal a cada elemen-
to del conjunto e'l' e2, •.. " em. Consecuentemente el conjunto de ecuaciones es
y por tanto:
Xm+1 • el
xm+l • e2
a l•m+1 (el · el) = O,
~.m+l (e2 • e2) = O,
am•m+1 (em • em) =O,
Xm+1 • el x m+1 • e2 x m+1 • e",
al.m+1 = e e ,~. m+1 = e e ,... , am, m+ 1 = e e
l· I 2· 2 m· m
que determinan em+ I. De nuevo, la independencia lineal de XI' x2'· .. , xm+ l. implica que em+ I
::f:. O. Por tanto, el proceso de ortogonalización se ha aumentado en un paso y con el mismo
argumento puede continuarse hasta tener m = n. Lo anterior queda condensado en el si-
guiente teorema.
T EOREMA 3.1 Sean XI' x2' . . . , x"' un conjunto de vectores linealmente independientes de n
componentes cada uno. A partir de ellos se puede construir un conjunto
ortogonal el ' e2,... , ende la siguiente manera
(3.37)
XI=
m X2 =
[H X3 =
mSolución
el = xi' e2 = X2 - al,2 el'
~~"
donde:
x2• el m m 6
aI2=---
m [~J
-
, el • el 5
Sustituyendo
e2 =
m ~m PJ_6/5
e3 = X3 - al,3 el - a2,3 e2, donde
x3 • el m·m 3 x
3
• e
2
m ·[tJ 35
a1,3 =
el· el
m [~J
5 ' a2,3 = e2• e2 145
[~]['~~_6/5 _6/5
Sustituyendo
e, = [:] [2J [ ~J [-"''']3 O - ~ 2 - 15/29--
5 1 145 _6/5 - 20/29
158 Métodos numéricos aplicados a la ingeniería
y
1 :s; t s: n-l
donde
x. 1· e.a - 1+ I
i, i+l - e¡. e¡
(3.38)
Pa
Ortogonalice el siguiente conjunto de vectores lineal mente independientes
PA
PA
PA
PA
N(
Para los cálculos puede auxiliarse del guión del ejemplo 3,23, con los cambios perti-
nentes,
Matrices y sistemas de ecuacione s lineales 159
A continuación se presenta un algoritmo para ortogonglizar un conjunto de n vectores
de n componentes cada uno por el método visto.
ALGORITMO 3.2 Ortoqobanzación de Gram-Schmidt
Para ortogonalizar un conjunto de N vectores lineal mente independientes de N componentes cada uno, proporcionar los
DATOS: El número N y los vectores xl,x2, ... ,xN.
RESULTADOS: El conjunto de vectores ortogonales el, e2, ... ,eN.
PASO 1. Hacer e1=xl.
P.~_SO2. Hacer 1=1.
PASO 3. Mientras I ::;N - 1, repetir los pasos 4 a 10.
PASO 4. Hacer e (1 +1) = x (1 + 1).
PASO 5. Hacer J = 1.
PASO 6. Mientras J ::;1, repetir los pasos 7 a 9.
PASO 7. Hacer ex (J, I + 1) =
(x (1 +1) • e (J))/(e (J) . e (J)).
PASO 8. Hacer e (1 + 1 ) = e (1 + 1)
- ex (J, I + 1 ) * e (J).
PASO 9. Hacer J = J + 1.
PASO 10. Hacer I = I +1
PASO ll.lMPRIMIR los vectores el, e2, ... , eN y TERMINAR.
NOTA: En el paso 7, el punto indica producto escalar de dos vectores.
En el 8, ex ( J, 1 + 1) es un escalar que multiplica al vector e (J) y la resta es vectorial.
En los pasos 1,4, 7 Y 8 se trata de asignaciones de todos los componentes de un vector a otro.
SUGERENCIA: Es recomendable trabajar con un programa desarrollado en un lenguaje de alto nivel
(véase Probo 3.14) basado en el algoritmo 3.2 o en un pizarrón electrónico
(Mathcad, por ejemplo) para evitar cálculos y analizar la ortogonalización más
finamente.
Una aplicación importante de los resultados obtenidos es determinar la independencia o de-
pendencia lineal de un conjunto dado de vectores. Para esto se partirá de un conjunto lineal-
mente dependiente particular, obsérvese qué ocurre en el proceso de ortogonalización.
Sean XI = [1 2]T Y x2
= [- 2 -4] T. Obviamente ~ = -2 XI
Efectuando el= XI = [1 2] T Y
X
2
• el . [-2 -4F' [1 2F
e2 = x2 - ~ el = [-2 -4] r - [1 2F' [1 2F [1 2F
= l- 2 - 4 F- (-2 ) [1 2]T = [O O]T
y, por tanto, e2 = O
Si XI Yx2
son vectores linealmente dependientes cualesquiera, al aplicar el proceso de
ortogonalización se tiene:
Matrices y sistemas de ecuaciones lineales 159
A continuación se presenta un algoritmo para ortogon~lizar un conjunto de n vectores
de n componentes cada uno por el método visto.
ALGORITMO 3.2 Ortogonaliz8ción de Gram-Schmidt
Para ortogonalizar un conjunto de N vectores linealmente independientes de N componentes cada uno, proporcionar los
DATOS: El número N y los vectores xl,x2,... ,xN.
RESULTADOS: El conjunto de vectores ortogonales el, e2,... ,eN.
PASO 1. Hacer el=x1.
P.'SO 2. Hacer 1=1.
PASO 3. Mientras 1S N - 1, repetir los pasos 4 a 10.
PASO 4. Hacer e (1 +1) = x (1 + 1).
PASO 5. Hacer J = 1.
PASO 6. Mientras J S 1, repetir los pasos 7 a 9.
PASO 7. Hacer a (J, 1+ 1) =
(x (1 +1) . e (J))/(e (J) • e (J)).
PASO 8. Hacer e (1 + 1 ) = e (1 + 1)
- a (J, 1 + 1 ) * e (J).
PASO 9. Hacer J = J + 1.
PASO 10. Hacer 1 = 1+1
PASO II.IMPRIMIR los vectores el, e2,... , eN y TERMINAR.
NOTA: En el paso 7, el punto indica producto escalar de dos vectores.
En el 8, a ( J, I + 1) es un escalar que multiplica al vector e (J) y la resta es vectorial.
En los pasos 1,4, 7 Y8 se trata de asignaciones de todos los componentes de un vector a otro.
SUGERENCIA: Es recomendable trabajar con un programa desarrollado en un lenguaje de alto nivel
(véase Probo 3.14) basado en el algoritmo 3.2 o en un pizarrón electrónico
(Mathcad, por ejemplo) para evitar cálculos y analizar la ortogonalización más
finamente.
Una aplicación importante de los resultados obtenidos es determinar la independencia o de-
pendencia lineal de un conjunto dado de vectores. Para esto se partirá de un conjunto lineal-
mente dependiente particular, obsérvese qué ocurre en el proceso de ortogonalización.
Sean Xl = [1 2]T Y x2 =[- 2 -4] T. Obviamente ~ =- 2 Xl
Efectuando el =Xl = [1 2] T Y
_ x2 • el _ T [-2 -4]T' [1 2P T
e2 - x2 - ~ el - [-2 -4] - [1 2]T. [1 2F [1 2]
= [- 2 - 4 F - (-2 ) [1 2]T = [O O]T
y, por tanto, e2 =O
Si XI Yx2 son vectores linealmente dependientes cualesquiera, al aplicar el proceso de
ortogonalización se tiene:
160 Métodos numéricos aplicados a la ingeniería
el' el
pero -- = 1, por tanto, e2
= O Y I e2 I= O.
el' el
Generalmente, para determinar si un conjunto dado Xl' X
2
' ... , XII es linealmente depen-
diente o independiente, se le aplica el proceso de ortogonalización de Gram-Schmidt. Supón-
gase que se han obtenido en dicho proceso el' e2,... , e¡, a partir de xi' x2' ... , Xi. Si al querer
obtener e¡+l resulta que Ie¡+l 1= O,o en términos prácticos su cercanía a cero satisface un cri-
terio de ortogonalidad prestablecido I e¡+ll < E, el vector x¡ + 1 es lineal mente dependiente
de los vectores xl' x2' ... , Xi; como consecuencia, el conjunto dado es linealmente dependien-
te. Si, por el contrario, se obtienen el' e
2
, •.. , en tales que Ie
j
I> e para 1 -::;'j -::;,n, el conjunto
en cuestión es linealmente independiente.
Analice si los siguientes vectores son linealmente independientes.
x, = ln x,= ln ~= III
Solución Se aplica el proceso de Gram-Schmidt
=0
lo cual implica que x2
es linealmente dependiente de Xl. El conjunto es linealmente depen-
diente. Sin embargo, el proceso de ortogonalización puede continuar para ver si x3 es li-
nealmente dependiente de xl
160 Métodos numéricos a plicados a la ingeniería
e . e
pero _ 1 _ 1 =1, por tanto, e2 =O Y I e2 I=O.
el' el
Generalmente, para determinar si un conjunto dado XI' X2' . . . , x" es linealmente depen-
diente o independiente, se le aplica el proceso de ortogonalización de Gram-Schmidt. Supón-
gase que se han obtenido en dicho proceso el' e2, ... , ei, a partir de xl' x 2' . .. , Xi' Si al querer
obtener ei+1 resulta que Iei+1 1= O, o en términos prácticos su cercanía a cero satisface un cri-
terio de ortogonalidad prestablecido Iei+l l < €, el vector Xi + I es linealmente dependiente
de los vectores xl' x 2' . . . , Xi; como consecuencia, el conjunto dado es linealmente dependien-
te. Si, por el contrario, se obtienen el' e2, •.. , en tales que Iej 1> € para 1 -::;'j -::;, n, el conjunto
en cuestión es linealmente independiente.
Analice si los siguientes vectores son linealmente independientes.
x, = ln x, = ln ~=III
Solución Se aplica el proceso de Gram-Schmidt
lo cual implica que x2 es linealmente dependiente de Xl' El conjunto es linealmente depen-
diente. Sin embargo, el proceso de ortogonalización puede continuar para ver si x3 es li-
nealmente dependiente de X I
Matrices y sistemas d e ecuaciones lineales 161
Obsérvese que en el cálculo de e3 se ignora a e2. Como e3 ::F- 0, xI y x3 son lineal mente in-
dependientes.
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
x1=[0; 5; 5; O};
x2= [ O; 1; 1; O]
x3=[1; 1; 1; 1]
e1=x1
a1fa12= (el '*x2) / (el '*e1)
e2=x2-a1fa12*e1
aifa13=(el'*x3)/(e1'*e1)
if norm (e2) >= 1e-5
aifa23=(e2'*x3)/(e2'*e2)
e3=x3-aifal3*e1-aifa23*e2
eise
. e3=x3-aifal3*e1
end
RANGO
e3_25 ()
Progm
[0;5;5;0]->xl : [0;1;1;0]->x2
[1;1;1;1]->x3 : CirIO
xlr+e I : Disp el : Pause
dotP(e1,x2)/(dotP(e1,el)->a12
x2-a12*e1->e2 : Disp e2 : Pause
dotP (el ,x3) / (dotP (el ,el) ->a13
If norm(e2) >= lE-5 Then
dotP(e2,x3)/(dotP(e2,e2)->a23
x3-a13*e1-a23'"e2->e3
Eise
x3-al3*el->e3
EndIf
Disp e3
EndPrgm
El número de vectores linealmente independientes de un conjunto dado recibe el nombre de
rango o característica del conjunto. Así, el conjunto del ejemplo 3.25 tiene un rango de 2.
Para un conjunto de m vectores, cada uno de n componentes, el rango puede ser co-
mo máximo igual al menor de m o n.
RANGO DE UNA MATRIZ
Una matriz puede verse como un conjunto de vectores; más claramente, la matriz.
anz,n
al,l al,2
a2,1 a2,2
A=
am•l a",.2
r"
162 Métodos numéri cos aplicados a la ingeniería
se puede tratar como un conjunto de n vectores columna de m componentes cada uno (o
bien m vectores fila de n componentes cada uno); es decir, como A = [x¡ X2 ... Xn l
donde
al•l al,2 al,n
a2,1 a2,2 a2,n
xl= x2 = X =11
am,l am,2 <:
o como:
Yl
Y2
A=
YII/
donde
Y¡ = [al,l al,2'" al,fl l, Y2 = [a2,1 a2,2'" a2,,, l ,...,YI1l = [am,l am,2'" am,1l l
En estas condiciones puede hablarse del rango de una matriz, en donde el rango de
una matriz A está dado por el numero máximo de vectores columna o vectores fila, lineal-
mente independientes:
Así la matriz
A = ~~ I IIcuyas columnas son los elementos del conjunto dado en el ejemplo 3.25, tiene rango 2.
Cuando el rango de una matriz cuadrada de orden n es menor que n, se dice que la ma-
triz es singular. Lo cual significa también que su determinante es cero (véase Probo 3.18).
Si las columnas de la matriz son "casi" linealmente dependientes, recibe el nombre de casi
singular o mal condicionada (véase sistemas de ecuaciones mal condicionadas, Seco 3.4).
En esta sección se ha considerado una serie de conceptos teóricos que, además de su
interés por sí mismos, forman un marco que permitirá explicar de manera lógica ciertos al-
goritmos importantes de las matemáticas y también conceptos de existencia y unicidad de
las soluciones de los problemas que resuelven dichos algoritmos.
3.4 Solución de sistemas de ecuaciones lineales
Gran número de problemas prácticos de ingeniería se reduce al problema de resolver un
sistema de ecuaciones lineales. Por ejemplo, pueden citarse la solución de sistemas de
ecuaciones no lineales, la aproximación polinomial, la solución de ecuaciones diferencia-
les parciales, entre otros .
• Puede demostrarse que el número máximo de vectores columna lineal mente independientes de una matriz A,
es igual al número máximo de vectores fila linealmente independientes.
-- - ·---------------------------------~~=~="Rlliilii
Matrices y sistemas de ecuaciones lineales 163
Un sistema de m ecuaciones lineales en n incógnitas tiene la forma generalo (o
1
al,lxI + al,2x2 + + al,n
x
" b¡
a2,IxI + a2,2x2 + + a2,I1
xn b2
(3.39)
am,)x¡ + am,2x2 + ... + «;», bm
Con la notación matricial de puede escribir la ecuación anterior como:
a¡,¡ a¡,2
a2,) a2,2
... a¡,1l
... a2,II
bm... am.1l
y concretamente como A x = b.
Donde A es la matriz coeficiente del sistema, x el vector incógnita y b el vector de
términos independientes.
Dados A y b, se entiende por resolver el sistema (Ec. 3.39) encontrar los vectores x
que lo satisfagan. Antes de estudiar las técnicas que permiten encontrar x se expondrán al-
gunas consideraciones teóricas.
EXISTENCIA y UNICIDAD DE SOLUCIONES
Si b es el vector cero, la ecuación 3.39 es un sistema homogéneo. Si por el contrario, b "#
O,el sistema es no homogéneo. A continuación se define la matriz aumentada B, forma-
da con los elementos de la matriz coeficiente A y los del vector b de la siguiente manera:
al,) a¡,2 al,/Z b¡
a2,) a2,2 a2,/I
b2
B= =[Alb]
am,l am,2 <: bm
Si el rango de la matriz coeficiente A y de la matriz aumentada B son iguales, se dice que
el sistema (Ec. 3.39) es consistente. Si no ocurre esto, el sistema es inconsistente (por tan-
to, un sistema homogéneo siempre es consistente). Un sistema inconsistente no tiene solu-
ción, mientras que uno consistente tiene una solución única o un número infinito de
soluciones, según como sea el rango de A en comparación con el número de incógnitas n.
Si el rango de A es igual al número de incógnitas, la solución es única; si el rango de A es
menor que dicho número, hay un número infinito de soluciones (véase Fig. 3.9).
Figura 3.9
Solución
de sistemas de
ecuaciones
lineales.
Sistemas de ecuaciones lineales
A x = b
Rango A * rango B RangoA = rango B
I I
I Inconsistente
~ I Consistente
~
I
I
Sin solución
11
Rango A = n Rango A < n
I I
Número infinito
Solución única de soluciones
Ejer
164 Métodos numéricos aplicados a la ingeniería
Ejemplo 3.26 Sea el sistema
2x,+4x2=6
3 x, + 6 x2 = 5
La matriz aumentada es:
4
6 I ~J
Puede verse fácilmente que: rango de A = 1, rango de B = 2; como rango A :#= rango B, el
sistema no tiene solución.
Si el sistema es homogéneo
2x, + 4 x2 O
3 xl + 6 x2 O,
la matriz aumentada es:
D
4
I ~J6
y rango A = 1, rango B = 1, rango A < 2 = n; en este caso existe un número infinito de so-
luciones.
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
~
A=[2 4; 3 6]
rangoA=rank(A)
B=[2 4 6; 3 6 5]
rangoB=rank (B)
,el
Matrices y sistemas de ecuaciones lineales 165
Ejemplo 3.27 Sea el sistema
2 xI + 3 L x2
+ X3 O
O xI + 2 x2 + x3 1
xI + O x2 + x3 O,
donde la matriz aumentada es:
[~
1
1
1
3
2
O
Obsérvese que la matriz coeficiente son los vectores del ejemplo 3.24, que son linealmen-
te independientes y, por tanto, rango A = 3.
Al aplicar el método de Gram-Schmidt para ortogonalizar el vector de términos inde-
pendientes se observa que es linealmente dependiente y, por tanto, rango B = 3. El siste-
ma es consistente y como rango A = número de incógnitas = 3, puede esperarse solución
única del sistema.
Esta comprobación se deja como ejercicio para el lector.
MÉTODOS DIRECTOS DE SOLUCiÓN
El prototipo de todos estos métodos se conoce como la eliminación de Gauss y se presen-
ta a continuación.
ELIMINACiÓN DE. GAUSS
Considérese un sistema general de tres ecuaciones lineales con tres incógnitas.
al,lx¡ + aJ•2xZ + a1,3x3 b¡
a2,¡x¡ + a2,2xZ + aZ,3x3 bz (3.40)
a3,¡x¡ + a3,Zx2 + a3,3x3 b3
Como primer paso, se reemplaza la segunda ecuación con lo que resulte de sumarle la pri-
mera ecuación multiplicada por (-az/a¡). De manera similar se sustituye la tercera ecua-
ción con el resultado de sumarle la primera ecuación multiplicada por (-a3
'/aJ
,J)'
Esto da lugar al nuevo sistema
b¡
b' 2
b' 3
a¡,¡x¡ + aJ,zxz + a1,3x3
a' z,zXz + a'2,3x3
a' 3,ZX2 + a' 3,3X3
(3.41)
en donde las a' y las b' son los nuevos elementos que se obtienen de las operaciones ya
mencionadas, y en donde x¡ se ha eliminado en la segunda y tercera ecuaciones. Ahora,
multiplicando la segunda ecuación de 3.41 por (-a'3,z1a'Z,Z) y sumando el resultado a la
tercera ecuación de 3.41, se obtiene el sistema triangular
b¡
b' z
b" 3
(3.42)
166 Métodos numéricos aplicados a la ingeniería
donde a"33 y b"3' resultaron de las operaciones realizadas y x2 se ha eliminado de la ter-
:, 
cera ecuacion.
El proceso de llevar el sistema de ecuaciones 3.40 a la forma de la ecuación 3.42 se
conoce como triangularización.
El sistema en la forma de la ecuación 3.42 se resuelve despejando de su última ecua-
ción x3' sustituyendo x3 en la segunda ecuación y despejando x2 de ella. Por último, con x3
y x2 sustituidas en la primera ecuación de 3.42 se obtiene xI. Esta parte del proceso se lla-
ma sustitución regresiva.
Antes de ilustrar la eliminación de Gauss con un ejemplo particular, nótese que no es
necesario conservar xl' x2 y x3 en la triangularización y que ésta puede llevarse a cabo
usando solamente la matriz coeficiente A y el vector b. Para mayor simplicidad se emplea-
rá la matriz aumentada B.
= [A lb]
Con esto se incorpora la notación matricial y todas sus ventajas a la solución de sis-
temas de ecuaciones lineales.
Ejemplo 3.28 Resuelva por eliminación de Gauss el sistema
4xI 9x2 + 2x3 5
2x1 4x2 + 6x3 3
XI x2 + 3x3 4
Solución La matriz aumentada del sistema es:
[~
-9 2
n--4 6
-1 3
(3.43)
(3.44)
Triangularización
Al sumar la primera ecuación multiplicada por (-2/4) a la segunda, y la primera ecuación
multiplicada por (-1/4) a la tercera, resulta
[~
-9
0.5
1.25
2
5
2.5
5]0.5
2.75
(3.45)
Obsérvese que en este paso la primera fila se conserva sin cambio.
Sumando la segunda fila multiplicada por (-1.25/0.5) a la tercera se obtiene la matriz'
[~
-9
0.5
O
2
5
-10
o.~l1.5
(3.46)
que en términos de sistemas de ecuaciones quedaría como
* Nótese que los vectores columna de A se han ortogonalizado en la triangularización.
r-
5
0.5
1.5
(3.47)
Matrices y sistemas de ecuaciones lineales 167
se
ua-
x3
lIa-
Un proceso de sustitución regresiva produce el resultado buscado. La tercera ecuación de
3.47 da el valor de x3
= -0.15; de la segunda ecuación se obtiene entonces:
0.5 x2
= 0.5 - 5x3
= 1.25
es
bo
ea-
y por tanto x2 = 2.5
finalmente al sustituir x2 y x3 en la primera ecuación de la forma 3.47 resulta
4xI = 5 + 9 x2 -2x3
= 27.8,
de modo que XI = 6.95
Con la sustitución de estos valores en el sistema original se verifica la exactitud de los
resultados:
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
sis-
43)
A=[4 -9 2 5; 2 -4 6 3; 1-1 3 4]
A(2, :)=A(2,:) - A(l, :)*A(2,1)IA(1,1);
A(3, :)=A(3,:) - A(1, :)*A(3,1)IA(1,1);
A
A(3,:)=A(3,:) - A(2,:)*A(3,2)IA(2,2);
x (3) =A(3, 4) lA (3,3) ;
x (2)= (A(2, 4) -A(2,3) *x (3)) lA (2,2) ;
x (1) =(A(1, 4) -A (1,2: 3) *x (2: 3)) lA (1,1)
También puede-ebtenerse la solución directamente con las instrucciones siguientes:
44)
ión
A= [4 -9 2; 2 -4 6; 1 -1 3]
b=[5; 3; 4]
x=Ab
simu1t([4,-9,2;2,-4,6;1,-1,3], [5; 3; 4])
. *z
Como producto secundario de este trabajo, se puede calcular fácilmente el determinante
de la matriz A del sistema original. La matriz coeficiente A pasa de la forma original a la
matriz triangular superior:
.45)
[~ (3.48)
46) mediante operaciones que, de acuerdo con las reglas de los determinantes, no alteran el va-
lor de lA 1.El determinante de la ecuación 3.48 es sólo el producto de los elementos de la
diagonal principal, de modo que el resultado es
lA I = 4(0.5)(-10) = -20
* Véase matrices mal condicionadas (Sec. 3.4.).
Matrices y sistemas de ecuaciones lineales 167
5
0.5
1.5
(3.47)
Un proceso de sustitución regresiva produce el resultado buscado. La tercera ecuación de
3.47 da el valor de x3 = -0.15; de la segunda ecuación se obtiene entonces:
0.5 x2 = 0.5 - 5x3 = 1.25
y por tanto x2 =2.5
finalmente al sustituir x2 y x3 en la primera ecuación de la forma 3.47 resulta
4xI = 5 + 9 x2 -2x3 = 27.8,
de modo que XI = 6.95
Con la sustitución de estos valores en el sistema original se verifica la exactitud de los
resultados:
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
A=[4 -9 2 5; 2 -4 6 3; 1 -1 3 4]
A(2,:)=A(2,:) - A(1,:)*A(2,1)IA(1,1);
A(3, :)=A(3,:) - A(1, :)*A(3,1)IA(1,1);
A
A(3, :)=A(3,:) - A(2, :)*A(3,2) lA (2,2) ;
x (3) =A(3, 4) lA (3,3) ;
x (2) = (A (2, 4) -A (2,3)*x (3)) lA (2,2) ;
x (1) = (A (1, 4) -A (1,2: 3) *x (2: 3)) lA (1,1)
También p~~,de'obtenerse la solución directamente con las instrucciones siguientes:
A= [4 -9 2; 2 -4 6; 1 -1 3]
b=[5; 3; 4]
simu1t([4,-9,2;2,-4,6;1,-1,3], [5; 3; 4])
x=Ab
Como producto secundario de este trabajo, se puede calcular fácilmente el determinante
de la matriz A del sistema original. La matriz coeficiente A pasa de la forma original a la
matriz triangular superior:
[~
-9
0.5
O -J] (3.48)
mediante operaciones que, de acuerdo con las reglas de los determinantes, no alteran el va-
lor de lA 1. El determinante de la ecuación 3.48 es sólo el producto de los elementos de la
diagonal principal, de modo que el resultado es
lA I= 4(0.5)(-10) =-20
* Véase matrices mal condicionadas (Sec. 3.4.).
168 Métodos numéri cos aplicados a la ingeniería
Las ecuaciones para la triangularización, sustitución regresiva y cálculo del determi-
nante de un sistema de n ecuaciones en n incógnitas A x = b por el método de eliminación
de Gauss son:
TRIANGULARIZACIÓN
Para 1 ~ i ~ n-1
Para i +1 ~ k ~ n
bk = bk - (ak,Jai,i )b¡
Para i +1 ~ j ~ n
(3.49)
SUSTITUCiÓN REGRESIVA
x" = b/an,n
Para i = n-1, n-2,... , 1
1
a··1,1
n
[b. - L a x.]
1 j=i+l l,) }
(3.50)
CÁLCULO DEL DETERMINANTE
n
det A = I1 ai,i = al,l a 2,2 ... an,n
i=l
(3.51)
El algoritmo para resolver Ax = b por eliminación de Gauss queda entonces
Para obtener la solución de un sistema de ecuaciones lineales A x = b Yel determinante de A, proporcionar los
DATOS: N número de ecuaciones, A matriz coeficiente y b vector de términos independientes.
RESULTADOS: El vector solución x y el determinante de A o mensaje de falla "HAY UN CERO EN LA DIAGO-
NAL PRINCIPAL".
PASO 1.
PASO 2.
PASO 3.
Hacer DET = 1.
Hacer I = 1.
Mientras 1 ::;N-1, repetir los pasos 4 a 14.
PASO 4. Hacer DET = DET * A (I, 1).
PASO 5. Si DET = O IMPRIMIR mensaje "HAY UN CERO EN LA DIAGONAL PRINCIPAL" YTERMI-
NAR. De otro modo continuar.
PASO 6. Hacer K = 1 + 1.
PASO 7. Mientras K::; N, repetir los pasos 8 a 13.
PASO 8. Hacer J = I + I.
PASO 9. Mientras J::; N, repetir los pasos 10 y 11.
PASO 10. Hacer A (K, J) =A (K, J) -A (K, 1)* A (1, J) / A (1, 1).
PASO 11. Hacer J = J + 1.
PASO 12. Hacer b ( K ) = b (K) -A (K, 1) * b ( I ) / A ( 1, I ).
168 Métodos numéricos aplicados a la ingeniería
Las ecuaciones para la triangularización, sustitución regresiva y cálculo del determi-
nante de un sistema de n ecuaciones en n incógnitas A x =b por el método de eliminación
de Gauss son: 
T RIANGULARIZACIÓN
Para 1 :s; i:S; n- 1
Para i +1 :s; k :s; n
bk = bk - (ak,; la;,i )b¡
Para i +1 :s; j :s; n
SUSTITUCiÓN REGRESIVA
x" = b/an,n
Para i =n-1, n-2,... , 1
1
a ··1, 1
CÁLCULO DEL DETERMINANTE
n
n
[b. - La. x.]
1 j=i+l I,j j
det A = n ai,i = al,l a 2,2 ... an,n
i=l
El algoritmo para resolver Ax =b por eliminación de Gauss queda entonces
(3.49)
(3.50)
(3.51)
Para obtener la solución de un sistema de ecuaciones lineales A x =b Yel determinante de A, proporcionar los
DATOS: N número de ecuaciones, A matriz coeficiente y b vector de términos independientes.
RESULTADOS: El vector solución x y el determinante de A o mensaje de falla "HAY UN CERO EN LA DIAGO-
NAL PRINCIPAL".
PASO 1.
PASO 2.
PASO 3.
Hacer DET = 1.
Hacer 1 = 1.
Mientras 1 ::; N-1, repetir los pasos 4 a 14.
PASO 4. Hacer DET = DET * A (1, 1).
PASO 5. Si DET = O IMPRIMIR mensaje "HAY UN CERO EN LA DIAGONAL PRINCIPAL" YTERMI-
NAR. De otro modo continuar.
PASO 6. Hacer K = 1+ 1.
PASO 7. Mientras K::; N, repetir los pasos 8 a 13.
PASO 8. Hacer J = 1+ I.
PASO 9. Mientras J::; N, repetir los pasos 10 y 11.
PASO 10. Hacer A (K, J) =A (K, J) -A (K, 1)* A (1, J) / A (1, 1) .
PASO 11. Hacer J = J + 1.
PASO 12. Hacer b ( K ) = b (K) - A (K, 1) * b (1 ) / A (1, 1 ).
Matrices y sistemas de ecuaCiO¡-leS lineales 169
PASO 13. Hacer K = K + l.
PASO 14. Hacer 1 = 1 + 1.
PASO 15. Hacer DET = DET * A (N":'N).
PASO 16. Si DET = O IMPRIMIR mensaje "HAY UN CERO EN LA DIAGONAL PRINCIPAL" Y TERMINAR.
De otro modo continuar.
PASO 17. Hacer x (N) = b (N) I A (N, N).
PASO 18. Hacer 1 = N -1.
PASO 19. Mientras 1 ~ 1, repetir los pasos 20 a 26.
PASO 20. Hacer x ( 1) = b ( 1 ).
PASO 21. Hacer J = 1 + 1.
PASO 22. Mientras J ::;N, repetir los pasos 23 y 24.
PASO 23. Hacerx ( 1 ) = x (I ) - A (1, J ) * x ( J ).
PASO 24. Hacer J = J + l.
PASO 25. Hacer x ( 1 ) = x ( 1) I A (1 , 1 ) .
PASO 26. Hacer 1 = 1 - l.
PASO 27. IMPRIMIR x y DET Y TERMINAR.
ELIMINACiÓN DE GAUSS CON PIVOTEO
En la eliminación de xl de la segunda y tercera ecuaciones de la forma 3.40 se tomó como
base la primera, por lo cual se denomina ecuación pivote o, en términos de la notación ma-
tricial, fila pivote. Para eliminar x2
de la tercera ecuación de la forma 3.41, la fila pivote
utilizada fue la segunda. El coeficiente de la incógnita que se va a eliminar en la fila pivo-
te se llama pivote. En la eliminación que dio como resultado el sistema de ecuaciones
3.42, los pivotes fueron al,l Y a'2,2' Esta elección natural de los pivotes al,,, a' 2,2' d'3,3>
etc., es muy conveniente tanto para trabajar con una calculadora como con una computa-
dora; desafortunadamente falla cuando alguno de esos elementos es cero, puesto que los
multiplicadores quedarían indeterminados [por ejemplo si al,l fuera cero, el multiplicador
( -a2,1 / al,l) no está definido]. Una manera de evitar esta posibilidad es seleccionar como
pivote el coeficiente de máximo valor absoluto en la columna relevante de la matriz redu-
cida. Como antes, se tomarán las columnas en orden natural de modo que se vayan elimi-
nando las incógnitas también en orden natural x" x2' x3, etc. Esta técnica, llamada pivoteo
parcial, se ilustra con la solución del siguiente sistema.
Ejemplo 3.29 Resuelva el sistema
10 Xl + x2 - 5x3 1
-20 Xl + 3X2 + 20x3 2
5 Xl + 3x2 + 5x3 6.
Solución La matriz aumentada es:
[ 10
1 -5
~]-2~ 3 20
3 5
(3.52)
(3.53)
El primer pivote debe ser (-20), ya que es el elemento de máximo valor absoluto en la pri-
mera columna. Se elimina entonces Xl de la primera y tercera filas de la ecuación 3.52. Pa-
ra ello, se suma a la primera fila la segunda multiplicada por (-10 / (-20)), Y a la tercera
fila la segunda multiplicada por (-5 / (-20)). Con esto se obtiene la matriz reducida:
170
, ,
Métodos numéricos aplicados a la ingeniería
H 6~]
5
20
10
2.5
3
3.75
(3.54)
El siguiente pivote debe seleccionarse entre la primera y tercera filas (segunda columna)
y en este caso es (3.75). Sumando a la primera fila la tercera multiplicada por (-2.5 / 3.75),
resulta
-2.33;]
6.5
o
3
3.75
-l.666
20
10
(3.55)
que puesta en forma de sistema de ecuaciones queda:
- l.666x3
-20x¡ + 3x2 + 20x3
3.75x2 + lOx3
-2.333
2
6.5
(3.56)
De la primera ecuación de 3.56
-2.333
x3
= --- = 1.4 ,
-l.666
de la tercera ecuación
6.5 - 1O(l.4)
x2 = 3.75 = -2,
y finalmente de la segunda ecuación
2 - 3(-2) - 20(1.4) = 1 .
x¡=
-20
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
A=[10 1 -5 1; -20 3 20 2; 5 3 5 6J
copia=A (2,:); A (2, :)=A(1,:); A (1,:) =copia;
A (2, :) =A(2, :) - A(l,: )*A (2,1) lA (1,1) ;
A (3, :)=A(3,:) - A(l, :)*A(3,l)IA(l,l);
A
A(3, :)=A(3,:) - A(2, :)*A (3,2) lA (2,2) ;
A
x (3) =A(3,4) lA (3,3) ;
x (2) = (A(2,4) -A(2,3) *x (3)) IA(2,2) ;
x (1) =(A (1,4) -A (1,2: 3) *x (2: 3)) lA (1,1)
x
Otra alternativa para solucionar el sistema de ecuaciones 3.52 es utilizar el mismo crite-
rio de selección de los pivotes, pero llevando las filas pivote a las posiciones de modo que
se obtenga la forma triangular en la eliminación. Para esto es necesario, por ejemplo, en la
170 Métodos numéricos aplicado s a la ingeniería
H
2.5
3
3.75
5
20
10 6~] (3.54)
El siguiente pivote debe seleccionarse entre la primera y tercera filas (segunda columna)
yen este caso es (3.75). Sumando a la primera fila la tercera multiplicada por (-2.5 / 3.75),
resulta
o -l.666
3 20
3.75 10
-2.33~]
6.5
que puesta en forma de sistema de ecuaciones queda:
- l.666x3
-20xl + 3x2 + 20x3
3.75x2 + lOx3
De la primera ecuación de 3.56
-2.333
-2.333
2
6.5
x3 =--- = 1.4 ,
-l.666
de la tercera ecuación
6.5 - 1O(l.4)
x2 = 3.75 = -2 ,
y finalmente de la segunda ecuación
2 - 3(-2) - 20(1.4)
XI = =1.
-20
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
A=[10 1 -5 1; - 20 3 20 2; 5 3 5 6J
copia=A (2, :); A (2, : ) =A (1, :); A (1, :) =copia;
A (2, : )=A (2,:) - A(l,: )*A(2, 1) lA (1,1) ;
A(3, :)=A(3,:) - A(1, :)*A(3,1)IA(1,1);
A
A(3, :)=A(3,:) - A(2, :)*A (3,2) lA (2,2) ;
A
x (3) =A (3, 4) lA (3,3) ;
x (2) = (A (2, 4) - A(2, 3) *x (3)) lA (2,2) ;
x (1) =(A (1,4) -A (1 , 2: 3)*x(2: 3)) lA (1,1)
x
(3.55)
(3.56)
Otra alternativa para solucionar el sistema de ecuaciones 3.52 es utilizar el mismo crite-
rio de selección de los pivotes, pero llevando las filas pivote a las posiciones de modo que
se obtenga la forma triangular en la eliminación. Para esto es necesario, por ejemplo, en la
Matrices y sistemas de ecuaciones lineales 171
ecuación 3.52, intercambiar la segunda fila (donde se encuentra el elemento de máximo va-
lor absoluto) con la primera, con lo que se obtiene:
[
-20
10
5
3 20
1 -5
3 5
(3.53')
que se reduce en la primera eliminación a
3 20
2.5 5
3.75 10
(3.54')
Como el siguiente pivote es (3.75), se intercambian la segunda y la tercera filas de la ecua-
ción 3.54', para obtener:
3 20
3.75 10
2.5 5
(3.54")
la cual se reduce al eliminar x2
a
2 J6.5
-2.333
3
3.75
O
20
10
-1.666
(3.55')
que tiene ya la forma triangular y está lista para la sustitución regresiva. En adelante,
cualquier referencia a la eliminación con pivoteo que se haga, entraña la segunda al-
ternativa.
La sustitución regresiva proporciona los siguientes valores
x3 = 1.4, x2 = -2, XI = 1
El determinante de A se calcula de nuevo, multiplicando entre sí los elementos de la dia-
gonal principal de la matriz triangularizada (Ec. 3.55'), pero dicho producto es afectado
por un cambio de signo por cada intercambio de filas que se verifique en la triangulariza-
ción. En el caso en estudio
det A = (-1)2 (-20) (3.75) (-1.666) = 125
ya que hubo dos intercambios de fila para llegar a la ecuación 3.55'.
A fin de elaborar el algoritmo de este método, se utilizarán las ecuaciones 3.49 para
la triangularización después de cada búsqueda del elemento de máximo valor absoluto y
del intercambio de filas correspondiente. Una vez realizada la triangularización, se hará la
sustitución regresiva con las ecuaciones 3.50 y el cálculo del determinante de la siguiente
forma
"detA = (-1)' Il a
i==l l,l
(3.57)
donde r es el número de intercambios de filas que hubo en el proceso de triangularización.
Matrices y s istemas de ecuaciones lineale s 171
ecuación 3.52, intercambiar la segunda fila (donde se encuentra el elemento de máximo va-
lor absoluto) con la primera, con lo que se obtiene:
[
- 20
10
5
3 20
1 -5
3 5
que se reduce en la primera eliminación a
3 20
2.5 5
3.75 10
(3.53')
(3.54')
Como el siguiente pivote es (3.75), se intercambian la segunda y la tercera filas de la ecua-
ción 3.54', para obtener:
[-2~
3 20
H3.75 10 (3.54")
2.5 5
la cual se reduce al eliminar x2 a
[-2~
3 20
2 ]3.75 10 6.5 (3.55')
O - 1.666 -2.333
que tiene ya la forma triangular y está lista para la sustitución regresiva. En adelante,
cualquier referencia a la eliminación con pivoteo que se haga, entraña la segunda al-
ternativa.
La sustitución regresiva proporciona los siguientes valores
x 3 = 1.4, x 2 = - 2, xI = 1
El determinante de A se calcula de nuevo, multiplicando entre sí los elementos de la dia-
gonal principal de la matriz triangularizada (Ec. 3.55'), pero dicho producto es afectado
por un cambio de signo por cada intercambio de filas que se verifique en la triangulariza-
ción. En el caso en estudio
det A = (-1)2 (- 20) (3.75) (- 1.666) = 125
ya que hubo dos intercambios de fila para llegar a la ecuación 3.55'.
A fin de elaborar el algoritmo de este método, se utilizarán las ecuaciones 3.49 para
la triangularización después de cada búsqueda del elemento de máximo valor absoluto y
del intercambio de filas correspondiente. Una vez realizada la triangularización, se hará la
sustitución regresiva con las ecuaciones 3.50 y el cálculo del determinante de la siguiente
forma
"detA =(- 1)' rr a
i=l l,t
(3.57)
donde r es el número de intercambios de filas que hubo en el proceso de triangularización.
172 Métodos numéricos aplicados a la ingeniería
ALGORITMO 3.4 Eliminacion de Gauss con pivoteo
Para obtener la solución de un sistema de ecuaciones lineales A x = b Y el determinante de A, proporcionar los
DATOS: N número de ecuaciones, A matriz coeficiente y b vector de términos independientes.
RESULTADOS: El vector ~Qlución x Y el determinante de A o mensaje "MATRIZ SINGULAR, SISTEMA SIN SO-
LUCION".
PASO l.
PASO 2.
PASO 3.
PASO 4.
PASO 13.
PASO 14.
PASO 15.
Hacer DET = l.
Hacer R = O.
Hacer I = l.
Mientras I S;N - 1 repetir los pasos 5 a 12.
PASO 5. Encontrar PIVOTE (elemento de mayor valor absoluto en la parte relevante de la columna 1 de A)
y P la fila donde se encuentra PIVOTE.
PASO 6. Si PIVOTE = O IMPRIMIR "MATRIZ SINGULAR SISTEMA SIN SOLUCION" y TERMINAR. En
caso contrario continuar.
PASO 7. Si P = I ir al paso 10. De otro modo realizar los pasos 8 y 9.
PASO 8. Intercambiar la fila I con la fila P.
PASO 9. Hacer R = R + l.
PASO 10. Hacer DET = DET * A ( I, I ).
PASO 11. Realizar los pasos 6 a 13 del algoritmo 3.3.
PASO 12. Hacer! = 1 + l.
Hacer DET = DET * A (N, N) * (-1 )**r
Realizar los pasos 17 a 26 del algoritmo 3.3
IMPRIMTR x y DET YTERMINAR.
Para terminar el tema, se compararán las técnicas de eliminación de Gauss con pivoteo y
sin éste. Por brevedad, la primera se denominará GP y la' segunda G.
1. La búsqueda del coeficiente de mayor valor absoluto que se usará como pivote y
el intercambio de filas significa mayor programación en GP.
2. Los factores (ak,¡ / a¡) de las ecuaciones 3.49 siempre serán menores que la unidad
en valor absoluto en GP, con esto los elementos de A I b se conservan dentro de
cierto intervalo, circunstancia valiosa en los cálculos computacionales.
3. Encontrar en GP un pivote igual a cero singnificaría que se trata de una matriz coe-
ficiente A singular (det A = O) y que el sistema A x = b no tiene solución única.
Encontrar en G un pivote igual a cero, no proporciona información alguna acerca
del determinante de A y si detendría el proceso de triangularización.
A pesar de la programación adicional y el mayor tiempo de máquina que se emplea en el
método de Gauss con pivoteo, sus otras ventajas borran totalmente estas desventajas en la
práctica; por tanto, el pivoteo natural se emplea sólo en circunstancias especiales, por
ejemplo cuando se sabe por adelantado que no hay pivotes más grandes que los que van
resultando en la diagonal principal.
ELIMINACIÓN DE JORDAN
Es posible extender los métodos vistos de modo que las ecuaciones se reduzcan a una for-
ma en que la matriz coeficiente del sistema sea diagonal y ya no se requiera la sustitución
regresiva. Los pivotes se eligen como en el método de Gauss con pivoteo, y una vez inter-
cambiadas las filas se eliminan los elementos arriba y debajo del pivote. El sistema del
ejemplo 3.28 ilustra este método.
172 Métodos numéricos aplicados a la ingeniería
ALGORITMO 3.4 EliminaciÓn de Gauss con pivoteo
Para obtener la solución de un sistema de ecuaciones lineales A x =b Yel determinante de A, proporcionar los
DATOS: N númew de ecuaciones, A matriz coeficiente y b vector de términos independientes.
RESULTADOS: El vector ilillución x y el determinante de A o mensaje "MATRIZ SINGULAR, SISTEMA SIN SO-
LUCION".
PASO 1. Hacer DET = 1.
PASO 2. Hacer R = O.
PASO 3. Hacer 1 = 1.
PASO 4. Mientras I S; N - 1 repetir los pasos 5 a 12.
PASO 5. Encontrar PIVOTE (elemento de mayor valor absoluto en la parte relevante de la columna I de A)
y P la fila donde se encuentra PIVOTE.
PASO 6. Si PIVOTE = OIMPRIMIR "MATRIZ SINGULAR SISTEMA SIN SOLUCION" y TERMINAR. En
caso contrario continuar.
PASO 7. Si P = I ir al paso 10. De otro modo realizar los pasos 8 y 9.
PASO 8. Intercambiar la fila I con la fila P.
PASO 9. Hacer R = R + 1.
PASO 10. Hacer DET = DET *A ( 1, I ).
PASO 11. Realizar los pasos 6 a 13 del algoritmo 3.3.
PASO 12. Hacer! = I + 1.
PASO 13. Hacer DET = DET * A (N, N) * (-1 )**r
PASO 14. Realizar los pasos 17 a 26 del algoritmo 3.3
PASO 15. IMPRIMTR x y DET YTERMINAR.
Para terminar el tema, se compararán las técnicas de eliminación de Gauss con pivoteo y
sin éste. Por brevedad, la primera se denominará GP y la'segunda G.
1. La búsqueda del coeficiente de mayor valor absoluto que se usará como pivote y
el intercambio de filas significa mayor programación en GP.
2. Los factores (ak,¡ / a¡) de las ecuaciones 3.49 siempre serán menores que la unidad
en valor absoluto en GP, con esto los elementos de A Ib se conservan dentro de
cierto intervalo, circunstancia valiosa en los cálculos computacionales.
3. Encontrar en GP un pivote igual a cero singnificaría que se trata de una matriz coe-
ficiente A singular (det A =O) y que el sistema A x =b no tiene solución única.
Encontrar en G un pivote igual a cero, no proporciona información alguna acerca
del determinante de A y si detendría el proceso de triangularización.
A pesar de la programación adicional y el mayor tiempo de máquina que se emplea en el
método de Gauss con pivoteo, sus otras ventajas borran totalmente estas desventajas en la
práctica; por tanto, el pivoteo natural se emplea sólo en circunstancias especiales, por
ejemplo cuando se sabe por adelantado que no hay pivotes más grandes que los que van
resultando en la diagonal principal.
ELIMINACIÓN DE JORDAN
Es posible extender los métodos vistos de modo que las ecuaciones se reduzcan a una for-
ma en que la matriz coeficiente del sistema sea diagonal y ya no se requiera la sustitución
regresiva. Los pivotes se eligen como en el método de Gauss con pivoteo, y una vez inter-
cambiadas las filas se eliminan los elementos arriba y debajo del pivote. El sistema del
ejemplo 3.28 ilustra este método.
Solución
Matrices y sistemas de ecuaciones lineales 173
Ejemplo 3.30 Por eliminación de Jordan, resuelva el sistema
4x¡ - 9x2 + 2x3
5
2x[ - 4x2 + 6x3
3
XI - x2 + 3x3
4
La matriz aumentada del sistema es
[~
-9 2
n-4 6
-1 3
so-
deA)
Como en la primera columna el elemento de máximo valor absoluto se encuentra en la pri-
mera fila, ningún intercambio es necesario y el primer paso de eliminación produce
.En
[~
2
5
2_5
5 ]0_5
2.75
-9
0.5
l.25
El elemento de máximo valor absoluto en la parte relevante de la segunda columna (filas
2 y 3) es l.25; por tanto, la fila 3 debe intercambiarse con la 2.
Sumando la segunda fila multiplicada por (-(-9) / l.25), a la primera fila y la segunda mul-
tiplicada por ( -0.5 / 1.25) a la tercera se obtiene el nuevo arreglo
[~ ;.75l
0.5 'j
-9
l.25
0.5
2
2.5
5
[~
o 20
l.25 2.5
O 4
24.8 J2.75
-0.6
donde se han eliminado los elementos de arriba y abajo del pivote (nótese que en este pa-
so el primer pivote no se modifica porque sólo hay ceros debajo de él).
Por último, sumando la tercera multiplicada por (-20/4) a la primera fila ya la terce-
ra multiplicada por (-2.5/4) a la segunda
[~ 27.8 ]
3.125
-0.6
O
l.25
O
O
O
4
que escrita de nuevo como sistema de ecuaciones da
4xI = 27.8
l.25 x2
= 3.125
4 x3 = -0.6
de donde el resultado final se obtiene fácilmente
27.8
x¡ = -- = 6.95 ,
4
3.125
x2=--=2.5,
1.25
-0.6
x3 = -- =-0.15
4
-~----------------------_._----~----
174 Métodos numéricos aplicados a la ingeniería
El determinante también puede calcularse
lA I = (-1)¡ (4) (1.25) (4) = -20,
donde la potencia 1 indica que sólo hubo un intercambio de filas.
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
A=[4 -9 2 5; 2 -4 6 3; 1 -1 3 4]
% No es necesario intercambiar filas
for i=2:3
A(i, :)=A(i,:) - A(l, :)*A(i,l)/A(1,l);
end
A
% Se intercambia la fila 2 con la fila 3
copia=A(3,:) ;A(3, :)=A(2,:) ;A(2, :)=copia;
for i=1:3
if i -=2
A(i, :)=A(i,:) - A(2, :)*A(i,2)/A(2,2);
end
end
A
for i=1:2
A(i, :)=A(i, :)-A(3, :)*A(i,3)/A(3,3);
end
A
for i=1:3
x(i)=A(i,4)/A(i,i) ;
end
x
También puede obtenerse el determinante directamente con las instrucciones siguientes:
A=[4 -9 2; 2 -4 6; 1 -1 3]
det (A)
I det([4,-9,2;2,-4,6;1,-1,3])
Si sólo se requiere calcular lA IYno la solución del sistema, el método de Jordan requie-
re mayor trabajo que el método de eliminación de Gauss con pivoteo.
CÁLCULO DE INVERSAS
Si se tienen varios sistemas por resolver que comparten la misma matriz coeficiente; es decir,
A x¡ = b¡, A x2 = b2, etc.
pueden resolverse todos a un tiempo si se aplica al arreglo
[ A I b¡ I b2 ... ]
el proceso de eliminación, como antes y después, se realiza una sustitución regresiva par-
ticular para cada columna del lado derecho de A. Como caso particular es factible encon-
174 Métodos numéricos aplicados a la ingeniería
El determinante también puede calcularse
l A I = (-1)¡ (4) (1.25) (4) = -20,
donde la potencia 1 indica que sólo hubo un intercambio de filas.
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
A=[4 -9 2 5; 2 -4 6 3; 1 -1 3 4]
% No es necesario intercambiar filas
for i=2:3
A(i, :)=A(i,:) - A(l, :)*A(i,1)/A(1,1);
end
A
% Se intercambia la fila 2 con la fila 3
copia=A(3,:) ;A(3, :)=A(2,:) ;A(2, :)=copia;
for i=l:3
if i -=2
A(i, :)=A(i,:) - A(2, :)*A(i,2)/A(2,2);
end
end
A
for i=1:2
A(i, :)=A(i, :)-A(3, :)*A(i,3)/A(3,3);
end
A
for i=1:3
x (i)=A(i,4)/A(i,i) ;
end
x
También puede obtenerse el determinante directamente con las instrucciones siguientes:
A=[4 - 9 2; 2 - 4 6; 1 -1 3]
det (A)
I det([4,-9,2;2,-4,6;l, -1, 3])
Si sólo se requiere calcular lA IYno la solución del sistema, el método de Jordan requie-
re mayor trabajo que el método de eliminación de Gauss con pivoteo.
CÁLCULO DE INVERSAS
Si se tienen varios sistemas por resolver que comparten la misma matriz coeficiente; es decir,
A x¡ = b¡, A x2 = b2, etc.
pueden resolverse todos a un tiempo si se aplica al arreglo
[ A I b¡ I b2 . .. ]
el proceso de eliminación, como antes y después, se realiza una sustitución regresiva par-
ticular para cada columna del lado derecho de A. Como caso particular es factible encon-
Matrices y sistemas de ecuaciones lineales 175
trar A-l si b¡ = el' b2 = e2,... , bn = e,/ Las n soluciones obtenidas forman las n columnas
de la matriz inversa A-l.
CÁLCULO DE LA INVERSA CON EL MÉTODO DE GAUSS CON PIVOTEO
Como ejemplo se usará la matriz coeficiente del sistema (3.44) para obtener su inversa.
Primero se forma el arreglo
[~
-9
-4
-1
2
6
3
o
1
O
1
O
O
(3.58)
nótese que a la derecha de A se tiene la matriz identidad correspondiente. Eliminando los
elementos debajo del primer pivote (4), se llega al sistema
[~
-9 2 1 O
~l0.5 5 -0.5 1 (3.59)
1.25 2.5 -0.25 O
Se intercambian la segunda y tercera filas.
[4 -92 1 O
!]O 1.25 2.5 -0.25 O (3.60)
O 0.5 5 -0.5 1
Ahora se elimina el segundo elemento de la tercera fila y el arreglo cambia a
Con la sustitución regresiva para el primer vector al lado derecho de la matriz triangular
resulta:
4x3 = - 0.4, de donde x3 = - 0.1;
al sustituir x3 en la fila 2 se tiene
uie-
1.25x2
= -0.25 - 2.5 (-0.1) Y x2
= O;
Y reemplazando x3
y x2
en la fila 1, se obtiene
4xl
= 1 + 9(0) - 2(-0.1) = 1.2 Y Xl = 0.3
Este primer vector solución representa la primera columna de A-[. Del mismo modo se cal-
culan la segunda y la tercera columnas de A-[ con el segundo y tercer vectores del lado de-
recho de la matriz triangular
ir,
[
0.3
kl= O
-0.1
-1.25
-0.5
0.25
2.3]1.0
-0.1
* En este caso el> ez, etc., son vectores de n elementos cuyo único elemento distinto de cero es el de la fila 1, 2,
etc., y su valor es 1.
176 Métodos numéricos aplicados a la ingeniería
CÁLCULO DE LA INVERSA CON EL MÉTODO DE JORDAN
Se parte del mismo arreglo (Ec. 3.58) y también se eliminan los elementos debajo del pri-
mer pivote para llegar a la ecuación 3.59. Se intercambian la segunda y tercera filas y se
llega al sistema de ecuaciones 3.60. En este último arreglo se eliminan los elementos arri-
ba y debajo del pivote (1.25) para llegar a:
u O 20 -0.8 O
;2]1.25 2.5 -0.25 O
O 4 -0.4 1 -0.4
arreglo que todavía se reduce a:
U
O O 1.2
-5 92]1.25 O O -0.625 1.25 ,
O 4 -0.4 1 -0.4
Y que con la primera columna a la derecha de la matriz diagonal produce
1.2
XI =-=0.3,
4
O
x2=--=0,
1.25
-0.4
x3
= -- =-0.1,
4
con la segunda columna
-5
XI = - = -1.25,
4
-0.625
x2 = --- = -0.5 ,
1.25
X3 = 0.25
De igual manera con la tercera columna para llegar a
[
0.3
A-l= O
-0.1
-1.25
-0.5
0.25
2.3]1.0
-0.1
Los métodos de eliminación vistos proporcionan la solución del sistema A x = b, el
det A yA -1, siempre que A sea no singular.
Obsérvese por otro lado que si se tiene un conjunto de vectores xi' x2, ... , xn de n com-
ponentes cada uno y se quieren ortogonalizar, se aplica alguna de las eliminaciones vistas
al conjunto dado tomado como una matriz. La técnica de Gauss con pivoteo también pue-
de aplicarse -por ejemplo- para determinar si dicho conjunto es linealmente indepen-
diente o no (cuando un elemento pivote ai,i es igual a cero, la fila correspondiente es
linealmente dependiente de las filas anteriores).
La sección que sigue puede omitirse sin pérdida de continuidad en los siguientes temas.
CUENTA DE OPERACIONES
Para establecer la velocidad de cálculo y el "trabajo computacional", se requiere conocer
cuántos cálculos de los diferentes tipos se realizan. Considérese para ello la reducción del
sistema general
al,lxl + al,2x2 + + al,nxn bl
a2,lx) + a2,2x2 + + a2,ll
xll
b2
(3.61)
an,¡x¡ + an,2x2 + ... + an,nxn b"
••• zm"s=Cz'=;-
Matrices y sistemas de ecuaciones lineales 177
a la forma triangular
t¡,¡X¡ + t¡,zX2 +
t2,zX2 +
+ t¡,,,xll = c¡
+ t2,1(X" = c2
(3.62)
o en notación matricial más compacta de [A lb] a [ TI e] , matrices ambas de n X (n +
1). Sea
M,; = número de multiplicaciones o divisiones
Sil = número de sumas y restas
necesarias para ir del sistema 3.61 al 3.62.
Evidentemente M¡ = O Y S¡ = O, ya que cualquier matriz A de 1 X 1 es triangular, Si
n > 1, se considera la eliminación en la primera columna. Si la primera columna de A es
distinta del vector cero, generalmente se intercambian filas a fm de llevar el elemento de
máximo valor absoluto de la primera columna a la posición (1, 1). Denomínese de nuevo
[A lb] el sistema resultante de este intercambio. Ahora debe restarse un múltiplo de la
nueva primera fila:
de cada fila:
2 -::;i -::;n (3.63)
para producir filas de la forma:
(3.64)
Explícitamente, si ri = ai,¡ / al,!'
al i,j = ai,j - r¡ a¡J
b'¡ = b¡ - r,»,
(3.65)
Se efectúa una división para producir r¡. La fórmula 3.65 requiere n multiplicaciones y un
número igual de restas. Como se forman (n-1) filas, la eliminación en la primera colum-
na se logra con:
(n + 1) (n - 1) divisiones o multiplicaciones y
n (n - 1) restas.
La primera columna ya tiene ceros debajo de la posición (1, 1). Queda por reducir la ma-
triz de (n -1) X n, matriz debajo de la primera fila ya la derecha de la primera columna.
De la fórmula 3.66, se obtienen las fórmulas
(3.66)
Mil = (n + 1) (n -1) + MII
_
I
Sn = n (n -1) + Sn_1
Como MI = SI = D, se tiene para n ~ 2
Mil = (2 + 1) 1 + (3 + 1) 2 + ... + (n + 1) (n -1)
Sil = 2(1) + 3(2) + ... + n (n -1) .
(3.67)
(3.68)
Matrices y sistemas de ecuaciones lineales 177
a la forma triangular
t¡,¡XI + t¡,:02 +
t2,:02 +
+ tl,,(tn = CI
+ t2,1.x" = C2
(3.62)
o en notación matricial más compacta de [A l b] a [ TI e] , matrices ambas de n X (n +
1). Sea
M,; = número de multiplicaciones o divisiones
Sn = número de sumas y restas
necesarias para ir del sistema 3.61 al 3.62.
Evidentemente MI = OYS¡ = O, ya que cualquier matriz A de 1 X 1 es triangular. Si
n > 1, se considera la eliminación en la primera columna. Si la primera columna de A es
distinta del vector cero, generalmente se intercambian filas a fm de llevar el elemento de
máximo valor absoluto de la primera columna a la posición (1 , 1). Denomínese de nuevo
[A lb] el sistema resultante de este intercambio. Ahora debe restarse un múltiplo de la
nueva primera fila:
de cada fila:
para producir filas de la forma:
Explícitamente, si ri = ai,¡ / al,!'
al i,j = ai,j - r¡ a¡J
b
l
¡ = b¡ - r¡b¡
2 -::; i -::; n (3.63)
(3.64)
(3.65)
Se efectúa una división para producir r¡. La fórmula 3.65 requiere n multiplicaciones y un
número igual de restas. Como se forman (n- l) filas, la eliminación en la primera colum-
na se logra con:
(n + 1) (n - 1) divisiones o multiplicaciones y
n (n - 1) restas.
(3.66)
La primera columna ya tiene ceros debajo de la posición (1, 1). Queda por reducir la ma-
triz de (n -1) X n, matriz debajo de la primera fila ya la derecha de la primera columna.
De la fórmula 3.66, se obtienen las fórmulas
M" = (n + 1) (n - 1) + Mn_¡
Sn = n (n - 1) + Sn_1
Como MI =SI =D, se tiene para n ~ 2
M n = (2 + 1) 1 + (3 + 1) 2 + ... + (n + 1) (n - 1)
Sil = 2(1) + 3(2) + ... + n (n -1)
(3.67)
(3.68)
>'
178 Métodos n uméricos aplicados a la ingeniería
Fácilmente se verifica por inducción que:
n-I 1
L t=-(n-1)n;
1=1 2
n 1
L t2
= -6 (n -1) n (2n -1) ;
1=1
Por tanto, como
n-I
M" = L (t + 1+ 1)t
1=1
y
n-I
Sil = L (t + 1) t
1=1
Entonces:
Mn = ~ (n - 1)n (2n - 1) + (n - l)n
1 1
Sn = () (n - l)n (2n - 1) + 2(n-l)n
(3.69)
Se determinará el número mn de multiplicaciones o divisiones y el número sn de sumas o
restas requeridas para resolver el sistema triangular [T Ix] = c. Sean n ~ 2 Y todas las ti,i
"* O. Supóngase que se han calculado xI!' x,,_p"" x2; llámense mn_1 y S,,_Ilas operaciones
realizadas para ello.
Sea ahora
. cl-tI2x2- ... -tln~n
XI =' , (3.70)
t1,1
El cálculo de xI requiere (n-l) multiplicaciones, una división y (n-l) restas. Entonces, pa-
ra n ~ 2
Como mI
m" = (n - 1 + 1) + m,,_1
s" = (n - 1) + S,,_I
1 y SI = O, se tiene
(3.71)
sn = 1 + 2 + 3 + ...
+ n = ~ n (n + 1)
1
+ (n - 1) = 2 (n - 1) n
(3.72)
mn=I+2+3+ ...
El resultado final se resume a continuación.
El sistema 3.61 con matriz coeficiente A y determinante distinto de cero, puede resol-
verse por el método de eliminación con pivoteo con
un= M"+m,, =~ (n-l)n(2n-1) + (n-1)n + ~n (n+l)
tn3
+ n2
- ~ n multiplicaciones o divisiones y
1 1 1
Sil + Sil =()(n-l)n(2n-l) + 2(n-l) n +2(n-l)n
(3.73)
v =
"
tn3
+ ~ n2
- ~ n sumas o restas.
Obviamente, el "trabajo computacional" para resolver la ecuación 3.61 es función del nú-
mero de operaciones necesarias (Ec. 3.73); por tanto, puede decirse que es proporcional a
n3
. Por otro lado, las necesidades de memoria de máquina serán proporcionales a n2.
178 Métodos numéricos aplicados a la ingeniería
Fácilmente se verifica por inducción que:
,,-1 1
I. t = -en - 1) n;
t=1 2
" 1t~1 t2
= 7) (n -1) n (2n - 1) ;
Por tanto, como
,,- 1
M = I. (t + 1 + l )t
" t= 1
y
,,- 1
S = I. (t + 1) t
" t= 1
Entonces:
Mil = ~ (n - l)n (2n - 1) + (n - l)n
(3.69)
1 1Sn = 7) (n - l)n (2n - 1) + 2 (n-l)n
Se determinará el número mn de multiplicaciones o divisiones y el número sn de sumas o
restas requeridas para resolver el sistema triangular [T I x ] =c. Sean n ;:: 2 Y todas las tu
1= O. Supóngase que se han calculado x"' X,,_l" ' " x2; llámense mn_l Y S,,_l las operaciones
realizadas para ello.
Sea ahora
. c l -tI2 x2 - ... -tI";;:,,
XI = ' ,
tl ,l
(3.70)
El cálculo de Xl requiere (n-l) multiplicaciones, una divisió!l y (n-l) restas. Entonces, pa-
ra n;:: 2
Como mi
m" = (n - 1 + 1) + m,,_1
s" = (n - 1) + S,,_I
1 y SI = O, se tiene
mn = 1 + 2 + 3 + ...
Sil = 1 + 2 + 3 + ...
+ n = ~ n (n + 1)
1
+ (n - 1) = 2 (n - 1) n
El resultado final se resume a continuación.
(3.71)
(3.72)
El sistema 3.61 con matriz coeficiente A y determinante distinto de cero, puede resol-
verse por el método de eliminación con pivoteo con
u,, = M"+m,, =~ (n -l )n(2n -l ) + (n-l)n + ~n (n +l )
~ n3 + n2 - ~ n multiplicaciones o divisiones y
v =
"
1 1 1
S" + s" =7) (n-l)n(2n-l) + 2 (n-l) n + 2 (n- l) n
t n3
+ ~ n2
- ~ n sumas o restas.
(3.73)
Obviamente, el "trabajo computacional" para resolver la ecuación 3.61 es función del nú-
mero de operaciones necesarias (Ec. 3.73); por tanto, puede decirse que es proporcional a
n3 . Por otro lado, las necesidades de memoria de máquina serán proporcionales a n2.
.69)
o
t·1.1
nes
.70)
pa-
.71)
.72)
sol- .
.73)
nú-
ala
Matrices y sistemas de ecuaciones lineales 179
SISTEMAS ESPECIALES
Con frecuencia, la matriz coeficiente del sistema A x = b por resolver es simétrica, o bien
gran número de sus componentes son cero (matrices dispersas). En estos casos algunos de
los métodos conocidos pueden adaptarse, con lo cual se reduce el trabajo computacional y
la memoria de máquina. Primero se tratará el caso de las matrices bandeadas (matrices dis-
persas particulares); las matrices simétricas serán abordadas como un caso particular de los
métodos L-U.
Primero se darán algunos ejemplos particulares de matrices bandeadas
2 O O O O 4 O O O O 8 7 6 O O
O 1 O O O 7 8 1 O O 9 3 O -2 O
O O 5 O O O O 5 2 O 3 -1 8 9 10
O O O 7 O O O 1 3 5 O O 3 5 8
O O O O 6 O O O 3 4 O O 7 4 O
Diagonal Tridiagonal Pentadiagonal
Generalizando: Una matriz A de n X n es tridiagonal si
a¡,j = O siempre que I i - j I > 1 ,
pentadiagonal si
a., = O siempre que I i - j I > 2 , etcétera.I,}
El ancho de banda es 1, 3, 5, etc., en las matrices diagonales, tridiagonales, pentadiago-
nales, etc., respectivamente.
Enseguida se adapta la eliminación de Gauss para la solución del sistema tridiago-
nal A x = b; es decir, A es tridiagonal.
MÉTODO DE THOMAS
Sea el sistema tridiagonal de tres ecuaciones en tres incógnitas
», Xl + Cl X2
a2 Xl + b2 X2 + C2 X3
a3 X2 + b3 X3
TRIANGULARIZACIÓN
Si b¡ :t= O, se elimina xI sólo en la segunda ecuación, con lo que se obtiene como nueva se-
gunda ecuación:
b'2X2 + c'2x3 = d'2
con
Si b' 2 :t= O,X
2
se elimina sólo en la tercera ecuación, y así se obtiene como nueva tercera
ecuación
con
b'3=b3-a3 c'2/b'2; d'3=d3 -a3d'2/b'2
Generalizando: para un sistema tridiagonal de n ecuaciones en n incógnitas.
- .
180 Métodos numéricos a plicados a la ingeniería
TRIANGULARIZACIÓN
Para i = 1,2, ... , n-1
si b' ¡-:1- O se elimina Xi sólo en la (i + l j-ésima ecuación, con lo que se obtiene como nue-
va (i + l)-ésima ecuación
con
SUSTITUCiÓN REGRESIVA
XIl
= d'nlb'n
y para i = n-1, n-2, ... , 1
Estas simplificación del algoritmo de Gauss, válida para sistemas tridiagonales se conoce
como método de Thomas. Con su aplicación se consiguen las siguientes ventajas:
• La memoria de máquina se reduce al no tener que almacenar los elementos de A que
son cero. Obsérvese que en lugar de almacenar la matriz A, se guardan sólo los vec-
tores a = [al' a2,··· , an], b = [bl' b2,··· ,bn] yc = [el' e2,··· , en] con a¡ = en = O, em-
pleando 3n localidades en lugar de n X n localidades, ventaja muy importante
cuando n es grande (n :2: 50).
• No se requiere pivotear.
• Sólo se elimina durante el r-ésimo paso de la triangularización la variable Xi en la
ecuación i + 1, con lo que se reduce el número de operaciones.
• Por último, en la sustitución regresiva debe reemplazarse sólo xi
+¡ en la i-ésima
ecuación para obtener Xi.
Resuelva el sistema tridiagonal
3 x¡ 2x2
x¡ + 5x2 -
4x2 +
= l.0
0.2x3
= 5.8
7x3 = 11.0,
por el método de Thomas.
Solución En este sistema
[
l.0]d = 5.8
11.0
Pa
Como b, -:1- O se calculan las componentes de la nueva segunda fila
b'2 = b2 - a2 c¡ 1b¡ = 5 - 1 (-2) 1 3 = 5.6666 PA
PAy
e' 2 = e2
= -0.2

d'2 = d2 - a2 di lb ; = 5.8 - 1(1/3) = 5.4666
180 Métodos numéricos aplicados a la ingeniería
TRIANGULARIZACIÓN
Para i = 1,2,.. . , n- 1
si b'¡ ::F Ose elimina Xi sólo en la (i + l)-ésima ecuación, con lo que se obtiene como nue-
va (i + l)-ésima ecuación
con
SUSTITUCiÓN REGRESIVA
X n = d'nlb'n
y para i =n- 1, n- 2, ... , 1
Estas simplificación del algoritmo de Gauss, válida para sistemas tridiagonales se conoce
como método de Thomas. Con su aplicación se consiguen las siguientes ventajas:
• La memoria de máquina se reduce al no tener que almacenar los elementos de A que
son cero. Obsérvese que en lugar de almacenar la matriz A, se guardan sólo los vec-
tores a = [al' a2,··· , an], b = [bl' b2, ··· ,bn] yc = [el' e2,··· , en] con a¡ = en = O, em-
pleando 3n localidades en lugar de n X n localidades, ventaja muy importante
cuando n es grande (n :2: 50).
• No se requiere pivotear.
• Sólo se elimina durante el i-ésimo paso de la triangularización la variable Xi en la
ecuación i + 1, con lo que se reduce el número de operaciones.
• Por último, en la sustitución regresiva debe reemplazarse sólo Xi+l en la i-ésima
ecuación para obtener Xi.
Resuelva el sistema tridiagonal
por el método de Thomas.
Solución En este sistema
3 Xl 2X2
Xl + 5x2 -
4x2 +
= 1.0
0.2x3 = 5.8
7x3 = 11.0,
d = 5.8
[
1.0]
Como bl ::F Ose calculan las componentes de la nueva segunda fila
b'2= b2- a2 cl 1bl = 5 - 1 (- 2) 13 = 5.6666
y

e'2 = e2 = -0.2

d'2 = d 2 - a2 di Ibl = 5.8 - 1(1/3) = 5.4666
11.0
te
la
Matrices y sistemas de ecuacion es lineales 181
Como b'2
*- O, se forma la nueva tercera fila
b'3
= b3
- a3
C
/
2
Ib'2
= 7 - 4 (-0.2) 15.666 = 7.141176
d'3
= d3
- a3
d' 2 Ib'2
= 11.0- 4(5.4666) I 5.6666 = 7.1411760
El sistema equivalente resultante es:
0.2x3
7.141176 x3
1.0
5.4666
7.141176
y por sustitución regresiva se llega a:
x3
=dI
3
Ib'3
=7.141176/7.141176= 1
x2 = ( d' 2 - c2 x3
) / b' 2 = (5.4666 - 0.2 (1)) I 5.6666 = 1
x¡ = (d'¡ - e¡ x
2
) / b¡ = (1.0 - (-2) (1) I 3 = 1
Nótese que d' ¡ = d¡ Y b/
1 = b,
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
b=[3 5 7]
a=[O 1 4]
c=[ -2 -0.2 O ]
d=[1 5.8 11J
for i=2:3
b (i) =b(i) -a (i)*c (i -1) lb (i -1) ;
d(i)=d(i) -a (i)*d(i-1) lb (i-1) ;
end
x (3) =d(3) lb (3) ;
for i=2:-1:1
x(i)= (d(i) -e (i)*x (i+1)) lb (i);
end
x
A continuación se da el algoritmo de Thomas.
ALGORITMO 3.5 Método de Thomas
Para obtener la solución x del sistema triadiagonal A x = b proporcionar los
DATOS: El número de ecuaciones N, los vectores a, b, e, y el vector de términos independientes d.
RESULTADOS: El vector solución x o mensaje de falla "EL SISTEMA NO TIENE SOLUCIÓN".
PASO l.
PASO 2.
Hacer 1 =1.
Mientras 1 ~ N-I, repetir los pasos 3 a 6.
PASO 3. Si b(l) *- O continuar. De otro modo IMPRIMIR el mensaje "EL SISTEMA NO TIENE SOLUCIÓN"
y TERMINAR.
PASO 4. Hacer b(l+l) = b(l+l) - a (1+1) *c ( 1 )/b ( 1 ).
Matrices y sistemas de ecuaciones lineales 181
Como b'2 ::j:. O, se forma la nueva tercera fila
b'3 = b3 - a3 e'2 Ib'2 = 7 - 4 (-0.2) I 5.666 = 7.141176
d' 3 = d3 - a3 d' 2 Ib'2 = 11.0 - 4(5.4666) I 5.6666 = 7.1411760
El sistema equivalente resultante es:
y por sustitución regresiva se llega a:
0.2x3
7.141176 x3
x3 = d I
3 I b'3 =7.141176/7.141176 = 1
1.0
5.4666
7.141176
x2 = ( d'2 - e2 x3) / b' 2 = (5.4666 - 0.2 (1)) I 5.6666 = 1
x¡ = (d' ¡ - e¡ x 2) / b't = (1.0 - (- 2) (1)) I 3 = 1
Nótese que d' ¡ = d¡ Yb/
1 = b¡
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
b=[3 5 7]
a=[O 1 4]
c=[ -2 -0.2 O ]
d=[l 5.8 11J
for i=2:3
b (i) =b (i) - a (i)*c (i - 1) /b (i-1) ;
d(i)=d(i) -a (i)*d(i - 1)/b(i- 1);
end
x (3) =d(3)/b(3) ;
for i=2:-1 : 1
x(i)=(d (i) - e (i)*x (i+1)) /b (i);
end
x
A continuación se da el algoritmo de Thomas.
ALGORITMO 3.5 Método de Thomas
Para obtener la solución x del sistema triadiagonal A x = b proporcionar los
DATOS: El número de ecuaciones N, los vectores a, b, e, y el vector de términos independientes d.
RESULTADOS: El vector solución x o mensaje de falla "EL SISTEMA NO TIENE SOLUCIÓN".
PASO 1. Hacer 1 =1.
PASO 2. Mientras 1 ~ N-l, repetir los pasos 3 a 6.
PASO 3. Si b(!) *- Ocontinuar. De otro modo IMPRIMIR el mensaje "EL SISTEMA NO TIENE SOLUCIÓN"
Y TERMINAR.
PASO 4. Hacer b(l+l) = b(I+1) - a (1+1) *c ( 1 )/b ( 1 ).
182 Métodos numéricos aplicados a la ingeniería
PASO 5. Hacer d(l+ 1) = d(I+I) - a (1+1) *d ( I )/b ( I )
PASO 6. Hacer I = I + 1
PASO 7. Si b(N) 7c. O continuar. De otro modo IMPRIMIR mensaje "EL SISTEMA NO TIENE SOLUCIÓN" YTERMI-
NAR.
Hacer x (N) = d (N) / b(N)
Hacer 1= N-I
Mientras 1 ~ 1, repetir los pasos 11 y 12.
PASO 11. Hacer x(l) = (d(l) - c(l) * x(I+I)/b(l) x(l+ l)/b(l)
PASO 12. Hacer I = I -1
PASO 13. IMPRIMIR el vector solución x y TERMINAR.
PASO 8.
PASO 9.
PASO la.
MÉTODOS DE FACTORIZACIÓN
Factorización de matrices en matrices triangulares
La eliminación de Gauss aplicada al sistema (véase ejemplo 3.28)
9 x2 + 2 x3
4x2 + 6x3
x2 + 3x3
5
3
4
condujo en su fase de triangularización al sistema equivalente
[~
-9 2
0.5 5
O -10
~.5]1.5
donde se aprecia una matriz triangular superior de orden 3 que se denotará como U
-9 2]0.5 5
O -10
Ahora se define una matriz triangular inferior L de orden 3, con números 1 a lo largo de la
diagonal principal y con I¡.). igual al factor que permitió eliminar el elemento a· . del siste-, 0
ma 3.43 (por ejemplo, a fin de eliminar a2
,1 = 2 se utilizó el factor 12,1 = 2/4; para eliminar
a3 1 = 1, el factor 13 1 = 1/4, Y para hacer cero a a3 2 = -1 se empleó 132 = 1.25/0.5). Así,
la 'matriz L queda ' "
O
1
1.25/0.5
cuyo producto con U resulta en
O
1
1.25/0.5
L
la matriz coeficiente del sistema original.
-9
0.5
O
~] =A,
-10
U
182
PASO 7.
PASO 8.
PASO 9.
Métodos numéricos aplicados a la ingeniería
PASO 5. Hacer d(l+1) = d(I+1) - a (1+1) *d ( I )/b ( I )
PASO 6. Hacer I = I + 1
Si b(N) ~ Ocontinuar. De otro modo IMPRIMIR mensaje "EL SISTEMA NO TIENE SOLUCIÓN" YTERMI-
NAR.
Hacer x (N) = d (N) / b(N)
Hacer I = N-I
PASO 10. Mientras l 2: 1, repetir los pasos 11 y 12.
PASO 11. Hacer x(I) = (d(I) - c(I) *x(I+I)/b(l) x(l+ l»/b(I)
PASO 12. Hacer I = I -1
PASO 13. IMPRIMIR el vector solución x y TERMINAR.
MÉTODOS DE FACTORIZACIÓN
Factorización de matrices en matrices triangulares
La eliminación de Gauss aplicada al sistema (véase ejemplo 3.28)
4 xI 9 x 2 + 2 x 3 5
2 xI - 4 x 2 + 6 x 3 = 3
XI - x2 + 3 x3 = 4
condujo en su fase de triangularización al sistema equivalente
[~
- 9 2
0.5 5
O - 10
~.5]1.5
donde se aprecia una matriz triangular superior de orden 3 que se denotará como U
-9 2]0.5 5
O -10
Ahora se define una matriz triangular inferior L de orden 3, con números 1 a lo largo de la
diagonal principal y con li,j igual al factor que permitió eliminar el elemento ai,j del siste-
ma 3.43 (por ejemplo, a fin de eliminar a2 l = 2 se utilizó el factor 121 = 2/4; para eliminar
a3 l = 1, el factor 13 l = 1/4, Ypara hacer ~ero a a3 2 =-1 se empleÓ 132 = 1.25/0.5). Así,
la 'matriz L queda ' "
cuyo producto con U resulta en
O
1
1.25/0.5
L
O
1
1.25/0.5
~] [~
la matriz coeficiente del sistema original.
-9
0.5
O
U
~] =A,
-10
Ux=e
Matrices y sistemas de ecuaciones lineales 183
Esta descomposición de A en los factores L y U es cierta en general cuando la elimi-
nación de Gauss puede aplicarse al sistema A x = b sin intercambio de filas, o equivalen-
temente si y sólo si los determinantes de las submatrices de A son todos distintos de cero
al,1 al,,,
al,1 al,2
I al,1 I ::f:.O, ::f:.0, ... , ::f:.0
a2,1 a2,2
a",1 «:
El resultado anterior permite revolver el sistema A x = b, ya que sustituyendo A por L U
se tiene
L U x e b
Solución Se hace U x = e, donde e es un vector desconocido [ e I c2 c3
... c"F, que se puede obte-
ner fácilmente resolviendo el sistema
Le = b,
con sustitución progresiva o hacia adelante, ya que L es triangular inferior (en el sistema
del Ejemplo 3.28, e resulta [5 0.5 1.5]T).
Una vez calculado e, se resuelve
con sustitución regresiva, ya que U es triangular superior y de esa manera se obtiene el
vector solución x (el sistema particular que se ha trabajado da x = [6.95 2.5 -0.15]T).
MÉTODOS DE DOOLlTLE y CROUT
Aun cuando las matrices L y U pueden obtenerse en la triagularización de la matriz au-
mentada [A lb], es deseable encontrar un método más directo para su determinación. Es-
to es factible analizando la factorización de A en las matrices generales de orden tres L y
U, dadas a continuación.
["
O
L] [~"
ul,2
U''] [a", al,2
a",]12,1 12,2 U2,2 U2,3 a2,1 a2,2 a2,3
13,1 13,2 O U3,3 a3,1 a3,2 a3,3
Análisis:
Se multiplican
a) Primera fila de L pcr las tres columnas de U
II,IUI,I al,1
[l,IuI,2 al,2
11,luI,3 al,3·
b) Segunda fila de L por las tres columnas de U
[2,1 UI,I a2,1
[2,1 UI,2 + [2,2 U2,2 a2,2
[2,1 UI,3 + [2,2 U2,3 a2,3 .<
.l
1 •
184 Métodos numéricos aplicados a la ingeniería
e) Tercera fila de L por las tres columnas de U
13,1 UI,I a3,l
13,1 UI,2 + 13,2 U2,2 a3,2
13,1 UI,3 + 13,2 U2,3 + 13,3 U3,3 a3.3'
se llega a un sistema de nueve ecuaciones en 12 incógnitas [1,1' 12,1' [2,2' [3,1' [3,2' [3.3' U1,I'
U1,2' U1,3' U2,2' U2.3' U3,3' por lo que será necesario establecer tres condiciones arbitrarias so-
bre las incógnitas para resolver dicho sistema. La forma de seleccionar las condiciones ha
dado lugar a diferentes métodos; por ejemplo, si se toman de modo que [1,1 = 12,2 = 13,3 = 1,
se obtiene el método de Doolitle; si en cambio se selecciona uI 1 = u22 = u33 = 1, el al-
goritmo resultante es llamado método de Crout. ",
Se continuará el desarrollo de la factorización. Tómese
[1,1 == 12,2 = 13,3 = 1
Con estos valores se resuelven las ecuaciones directamente en el orden en que están dadas
De (a) u1,I = al,l ' uI,2 = al,2' U 1,3= al,3 '
De (b) y sustituyendo los resultados (Ec. 3.74)
(3.74)
12,1= a2,I / u1,1 = a2,1/ al,l '
1 a2,I
u2,2 = a2,2 - 2,1 UI,2 = a2,2 - al,2
al,l
(3.75)
a2,I
U2,3 = a2,3 - 12,1 UI,3 = a2,3 - al,3
al,l
De (e) y sustituyendo los resultados de las ecuaciones 3.74 y 3,75
[3,1 = a3,I / uI,1 = a3,l / al,l
(3.76)
a2,I
a2,2 - al,2
al,l
u3,3 = a3,3 - 13,1 U1,3 - 13,2 U2,3 =
a3,2 -
a3,I
al,2
a3,1 al,l
[a2,3 -
a2,1
a 1,3]a3,3 -
al,1
al,3-
a2,1 al,1
a2,2 - al,2
al,l
Las ecuaciones 3.74,3.75 Y 3.76, convenientemente generalizadas constituyen un método
directo para la obtención de L y U, con la ventaja sobre la triangularización de que no se
tiene que escribir repetidamente las ecuaciones o arreglos modificados de A x = b. A con-
tinuación se resuelve un ejemplo.
Matrices y sistemas de ecuaciones lineales 185
Ejemplo 3.32 Resuelva por el método de Doolitle el sistema
4xI
- 9x2 + 2x3 5
2x1
- 4x2
+ 6x3
3
xI - x2 + 3x3 = 4
Solución Con 11,1 = 12,2 = 13,3 = 1, se procede al
cálculo de la primera fila de U
U¡,I = 4; uI,2 = -9; u1,3 = 2,
cálculo de la primera columna de L
11,1 = 1 (dato); 12,1 = 2/4 = 0.5; 13,1 = 1/4 = 0.25
cálculo de la segunda fila de U
u2
,1 = O (recuérdese que U es triangular superior)
u2,2 = -4 - (2/4) (-9) = 0.5; u2,3 = 6 - (2/4) (2) = 5
cálculo de la segunda columna de L
11
,2 = O (ya que L es triangular inferior)
12,2 = 1 (dato), [3,2 = (-1-(1/4) (-9» / (-4-(2/4) (-9» = 2.5
cálculo de la tercera fila de U, o más bien sus elementos faltantes, ya que por ser triangu-
lar superior
U3,1 = u3,2 = O
u3
,3 = 3 - (1/4) (2) - [(-1-(1/4)(-9»)/(-4-(2/4)(-9»)](6-(2/4)(2») =-10
Con esto se finaliza la factorización".
Las matrices L y U quedan como sigue
[1 O
n [~
-9
-I~]L= 0.5 1 U= 0.5
(3.76)
0.25 2.5 O
cuyo producto, como ya se comprobó, da A.'
Se resuelve el sistema L e = b, donde b es el vector de términos independientes del
sistema original
el =5; e2 = 3 -0.5 (5) = 0.5
e3 =4 -0.25 (5) - 2.5(0.5)= 1.5,'todo
no se
A con- y, finalmente, al resolver el sistema U x = e se tiene la solución del sistema original:
• Los cálculos se han llevado en el orden fila-columna, fila-columna, etc., por convenir a la elaboración de los
algoritmos correspondientes.
186 Métodos numéricos apl icados a la ingeniería
[~ -9 2][X¡~ [5 ~0.5 5 x2 0.5
O -10 x3
1.5
X3 = -0.15
x2
= (0.5 - 5 (-0.15» /0.5 = 2.5
x¡ = (5 + 9(2.5) - 2(--0.15»/4 = 6.95
[
6.95]
X = 2.5
--0.15
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
) '1
clear
fonnat short
A=[4 -9 2 ; 2 -4 6 ; 1 -1 3 J
b=[5 3 4J
[L, U,PJ=lu (A);
L
U
% Se multiplica b por P para que refleje los
% intercambios hechos en A para llegar a L y U
b=lYP
c(l)=b(1) ;
c (2) =b (2) -L (2, l)*c (1) ;
c (3) =b (3) -L (3, l)*c (1) -L (3,2)*c (2) ;
c
x (3)=c(3)/U(3,3) ;
x (2) =(c (2) -U(2,3) *x (3)) /U(2,2) ;
x (1) = (c (1) -U(1 ,2) *x (2) -U(l ,3)*x (3)) /U(1,l) ;
x
Al(
Para f
mente,
DA
RE
PASO
PASO
PASO
e3_32 ()
Prgm
[4,-9,2;2, -4,6;1, -1,3J ....•a: [5,3, 4J....•b:ClrIO
LU a,L,u,p:Disp L:Pause:Disp u:Pause
lYp-+b:b[l, 1J....•c[lJ :b[1,2J -L[2, 1J*c [l} ....•c[2Jt
b[1,3J -L[3,1J*c[lJ- L[3,2J*c[2J ....•c[3J
Disp c:Pause
D->x[l] :D->x[2J: c[3J1u[3,3J ....•x[3J
(c[2J -u [2,3J*x[3J) /u [2,2J ....•x[2J
(c[lJ -u [1,2J*x[2] -u [1 ,3J*x [3J) /u [1, 1J....•x [L]
Disp x
Los resultados intermedios difieren de los anotados anteriormente, debido a que Matlab
realiza intercambios de fila para llegar a las matrices L y U. Sin embargo, los resultados
finales son los mismos.
186 Métodos numéricos aplicados a la ingeniería
[~ -9 2] [X¡~ [5 ~0.5 5 x2 0.5
O - 10 x3 1.5
X3 = -0.15
x2 = (0.5 - 5 (-0.15)) /0.5 = 2.5
x¡ = (5 + 9(2.5) - 2(-0.15))/4 = 6.95
X = 2.5
[
6.95]
-0.15
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
elear
fonnat short
A=[4 - 9 2 ; 2 - 4 6 ; 1 - 1 3 J
b=[5 3 4J
[L, U,PJ=lu (A);
L
U
% Se multiplica b por P para que refleje los
% intercambios hechos en A para llegar a L y U
b=1YP
e(l)=b(1) ;
e (2) =b (2) -L (2, l)*e (1) ;
e (3) =b (3) - L (3, l)*e (1) - L (3,2)*e (2) ;
e
x (3) =e (3)IU(3,3) ;
x (2) = (e (2) - U(2,3) *x (3)) IU(2,2) ;
x (1) = (e (1) -U(1 ,2) *x (2) -U(l ,3)*x (3)) IU(1,l) ;
x
e3_32 ()
Prgm
[4, -9,2;2, -4,6;1, -1,3j....a: [5,3, 4j....b:ClrIO
LU a,L, u,p :Disp L:Pause:Disp u:Pause
1Yp->b:b[l, 1J....e[lj :b[1,2j - L[2, 1J*e[1 j ....e [2j.
b[1,3] - L[3,1j*e[lJ - L[3,2]*e[2]....e[3]
Disp c:Pause
()-->x[1] : ()-->x[2j : e[3J1u[3,3]....x[3]
(e[2] - u [2,3]*x[3j) lu [2,2j ....x [2]
(e [1] -u [1,2]*x[2] - u [1 , 3]*x [3] ) lu [1, l] ....x [1]
Disp x
Los resultados intermedios difieren de los anotados anteriormente, debido a que Matlab
realiza intercambios de fila para llegar a las matrices L y U. Sin embargo, los resultados
finales son los mismos.
(3.77)
Matrices y sistemas de ecuaciones lineales 187
Las ecuaciones 3.74, 3.75 Y 3.76 se generalizan para factorizar la matriz coeficiente
del sistema A x = b, que puede resolverse por eliminación de Gauss sin intercambio de fi-
las; se tiene entonces
1 j-l
l.=- (a¡j- L ukjlik); i=i+ 1,... , n
I,} Uj,j , k=1 ' ,
lu = 1; i = 1,2, ... , n
o
con la convención en las sumatorias que L = O.
k=l
Puede observarse al seguir las ecuaciones 3.74, 3.75 Y3.76 o bien las ecuaciones 3.77, que
una vez empleada ai,j en el cálculo de u¡,j o l¡,j según sea el caso, esta componente de A no
vuelve a emplearse como tal, por lo que las componentes de L y U generadas pueden guar-
darse en A y ahorrar memoria de esa manera. El siguiente algoritmo de factorización de A
ilustra esto.
PASO 1.
PASO 2.
PASO 3.
SiA(1,l) = O IMPRIMIR "LA FACTORIZACIÓN NO ES POSIBLE" YTERMINAR. De otro modo continuar.
Hacer J = 1.
Mientras J ~ N, repetir los pasos 4 a 25.
ALGORITMO 3.6 Factorización directa
Para factorizar una matriz A de orden N en el producto de las matrices L yU triangulares inferior y superior, respectiva-
mente, con l¡,j = 1; i = 1, 2, ... , N, proporcionar los
DATOS: El orden N y las componentes de la matriz A.
RESULTADOS: Las matrices L y U en A o mensaje de falla "LA FACTORIZACIÓN NO ES POSIBLE".
PASO 14.
PASO 15.
PASO 16.
Hacer 1 = J.
Mientras 1 ~ N, repetir los pasos 6 a 13.
PASO 6. Hacer SUMAT = O.
PASO 7. Si J = 1 ir al paso 12. De otro modo continuar.
PASO 8. Hacer K = 1.
PASO 9. Mientras K ~ J - 1, repetir los pasos 10 y 11.
PASO 10. Hacer SUMAT = SUMAT+A(J,K)*A(K,I).
PASO 11. Hacer K = K + 1.
PASO 12. Hacer A(J,I) = A(J,I) - SUMAT.
PASO 13. Hacer 1 = 1 + 1.
Si J = N ir al paso 25. De otro modo continuar.
Hacer 1 = J + 1.
Mientras 1 ~ N, repetir los pasos 17 a 24.
PASO 17. Hacer SUMAT = O.
PASO 18. Si J = 1 ir al paso 23. De otro modo continuar.
PASO 19. Hacer K = 1.
PASO 20. Mientras K ~ J-1, repetir los pasos 21 y 22.
PASO 21. Hacer SUMAT=SUMAT+A(K,J)*A(I,K).
PASO 22. Hacer K = K + 1.
PASO 23. Hacer A(I,J)=(A(I,J)-SUMAT)iA(J,J).
PASO 24. Hacer 1 = 1 +1.
PASO 4.
PASO 5.
Matrices y sistemas de ecuaciones lineales 187
Las ecuaciones 3.74, 3.75 Y 3.76 se generalizan para factorizar la matriz coeficiente
del sistema A x =b, que puede resolverse por eliminación de Gauss sin intercambio de fi-
las; se tiene entonces
1 j-l
l . = - (a¡,j' - L uk,j·l¡,k); i = j + 1,... , n
l,} Uj,j k=1
lu = 1; i = 1,2,... , n
o
con la convención en las sumatorias que L = O.
k=l
(3.77)
Puede observarse al seguir las ecuaciones 3.74, 3.75 Y3.76 o bien las ecuaciones 3.77, que
una vez empleada a· . en el cálculo de u· . o l . . según sea el caso, esta componente de A noIJ l,} l,}
vuelve a emplearse como tal, por lo que las componentes de L y U generadas pueden guar-
darse en A y ahorrar memoria de esa manera. El siguiente algoritmo de factorización de A
ilustra esto.
ALGORITMO 3.6 Factorización directa
Para factorizar una matriz A de orden N en el producto de las matrices L yU triangulares inferior y superior, respectiva-
mente, con l¡,j = 1; i = 1, 2,... , N, proporcionar los
DATOS: El orden N y las componentes de la matriz A.
RESULTADOS: Las matrices L y U en A o mensaje de falla "LA FACTORIZACIÓN NO ES POSIBLE".
PASO l. Si A(l,1) = OIMPRIMIR "LA FACTORIZACJÓN NO ES POSIBLE" YTERMINAR. De otro modo continuar.
PASO 2. Hacer J = l.
PASO 3. Mientras J ~ N, repetir los pasos 4 a 25.
PASO 4. Hacer 1 = J.
PASO 5. Mientras 1 ~ N, repetir los pasos 6 a 13.
PASO 6. Hacer SUMAT = O.
PASO 7.
PASO 8.
PASO 9.
PASO 12.
PASO 13.
Si J = 1 ir al paso 12. De otro modo continuar.
Hacer K = 1.
Mientras K ~ J - 1, repetir los pasos 10 y 11.
PASO 10. Hacer SUMAT = SUMAT+A(J,K)*A(K,I).
PASO 11. Hacer K = K + 1.
Hacer A(J,I) = A(J,I) - SUMAT.
Hacer 1 = 1 +1.
PASO 14. Si J = N ir al paso 25. De otro modo continuar.
PASO 15. Hacer 1 = J + 1.
PASO 16. Mientras 1 ~ N, repetir los pasos 17 a 24.
PASO 17. Hacer SUMAT = O.
PASO 18. Si J = 1 ir al paso 23. De otro modo continuar.
PASO 19. Hacer K = 1.
PASO 20. Mientras K ~ J- 1, repetir los pasos 21 y 22.
PASO 21. Hacer SUMAT=SUMAT+A(K,J)*A(I,K).
PASO 22. Hacer K = K + l.
PASO 23. Hacer A(I,J)=(A(I,J)-SUMAT}/A(J,J).
PASO 24. Hacer 1 = 1 +1.
188 Métodos numérico s aplicados a la ingeniería
PASO 25. Hacer J = J +1
PASO 26. Si A(N,N) = O IMPRIMIR "LA FACTORIZACIÓN NO ES POSIDLE" y TERMINAR. De otro modo conti-
nuar.
PASO 27. IMPRIMIR A YTERMINAR.
Obsérvese que cualquier elemento a¡,i = O, impediría emplear este algoritmo; por otro la-
do, al no pivotear no se reducen en lo posible los errores de redondeo. Para hacer eficien-
te este algoritmo, debe incluirse un intercambio de filas como en la eliminación de Gauss
con pivoteo. A continuación se presenta el algoritmo anterior, pero ahora con estas modi-
ficaciones.
ALGORITMO 3.7 Factorlzación con pivoteo
Para factorizar una matriz A de orden N en el producto de las matrices L y U triangulares inferior y superior respectiva-
mente, con l¡,¡ = 1; i = 1,2, ... , N, con pivoteo parcial, proporcionar los
DATOS: El orden N y las componentes de la matriz A.
RESULTADOS: Las matrices L y U en A o mensaje de falla "LA FACTORIZACIÓN NO ES POSIBLE".
PASO 1.
PASO 2.
PASO 3.
PASO 12.
PASO 13.
Hacer R = O (R registra el número de intercambios de fila que se llevan a cabo).
Hacer J = 1.
Mientras J::; N, repetir los pasos 4 a ll.
PASO 4. Si J = N ir al paso 10.
PASO 5. Encontrar PIVOTE y P (ver paso 5 de algoritmo 3.4).
PASO 6. Si PIVOTE = O IMPRIMIR "LA FACTORIZACIÓN NO ES POSIBLE" Y TERMINAR. De otro
modo continuar.
PASO 7. Si P = J ir al paso 10. De otro modo continuar.
PASO 8. Intercambiar la fila J con la fila P de A.
PASO 9. Hacer R = R + 1.
PASO 10. Realizar los pasos 4 a 24 de algoritmo 3.6.
PASO 11. Hacer J = J +1.
Si A(N,N) = O IMPRIMIR "LA FACTORIZACIÓN NO ES POSIBLE" YTERMINAR. De otro modo continuar.
IMPRIMIR A YTERMINAR. I
A continuación Se resuelve un sistema por el método de Doolitle usando la factorización
con pivoteo.
Ejemplo 3.33 Resuelva el sistema del ejemplo 3.29
l Ox, +
-20x¡ +
5x¡ +
1
2
6
por el método de Doolitle, con pivoteo parcial
Solución Al intercambiar la primera y segunda filas resulta la matriz aumentada siguiente:
[
-20
A = 1~
3
1
3
20
-5
5
188 Métodos numéricos aplicados a la ingeniería
PASO 25. Hacer J = J +1
PASO 26. Si A(N,N) = OIMPRIMIR "LA FACTORIZACIÓN NO ES POSIDLE" y TERMINAR. De otro modo conti-
nuar.
PASO 27. IMPRIMIR A YTERMINAR.
Obsérvese que cualquier elemento a¡ i = O, impediría emplear este algoritmo; por otro la-
do, al no pivotear no se reducen en l¿ posible los errores de redondeo. Para hacer eficien-
te este algoritmo, debe incluirse un intercambio de filas como en la eliminación de Gauss
con pivoteo. A continuación se presenta el algoritmo anterior, pero ahora con estas modi-
ficaciones.
Al.GORITMO 3.7 Factorización con pivoteo
Para factorizar una matriz A de orden N en el producto de las matrices L y U triangulares inferior y superior respectiva-
mente, con lj.j =1; i =1,2,... , N, con pivoteo parcial, proporcionar los
DATOS: El orden N y las componentes de la matriz A.
RESULTADOS: Las matrices L y U en A o mensaje de falla "LA FACTORIZACIÓN NO ES POSIBLE".
PASO 1.
PASO 2.
PASO 3.
PASO 12.
PASO 13.
Hacer R = O(R registra el número de intercambios de fila que se llevan a cabo).
Hacer J = 1.
Mientras J :o; N, repetir los pasos 4 a ll.
PASO 4. Si J = N ir al paso 10.
PASO 5. Encontrar PIVOTE y P (ver paso 5 de algoritmo 3.4).
PASO 6. Si PIVOTE = OIMPRIMIR "LA FACTORIZACIÓN NO ES POSIBLE" YTERMINAR. De otro
modo continuar.
PASO 7. Si P = J ir al paso 10. De otro modo continuar.
PASO 8. Intercambiar la fila J con la fila P de A.
PASO 9. Hacer R = R + 1.
PASO 10. Realizar los pasos 4 a 24 de algoritmo 3.6.
PASO 11. Hacer J = J +1.
Si A(N,N) = OIMPRIMIR "LA FACTORIZACIÓN NO ES POSIBLE" YTERMINAR. De otro modo continuar.
IMPRIMIR A y TERMINAR. I
A continuación se resuelve un sistema por el método de Doolitle usando la factorización
con pivoteo.
Ejemplo 3.33 Resuelva el sistema del ejemplo 3.29
Solución
lOx¡ +
-20x¡ +
5x¡ +
por el método de Doolitle, con pivoteo parcial
1
2
6
Al intercambiar la primera y segunda filas resulta la matriz aumentada siguiente:
[
-20
A = 1~
3
1
3
20
!]-5
5
nti-
la-
ien-
auss
cdi-
tiva-
otro
Matrices y sistemas de ecuaciones lineales 189
20
-5
5
Como la nueva a¡,¡ F O, se forma la primera fila de U y se guarda como primera fila
deA.
al,! = u¡,¡ = -20, a¡,2 = u¡,2 = 3, al,3 = u¡,3 = 20
Cálculo de .la primera columna de L y su registro, excepto 11,1' como primera columna
deA
a2,1 = 12,1
a3,¡ = 13,1
La matriz A resultante entonces es:
A = [=~~5-0.25
11,1 = 1 (dato),
10/(-20) = - 0.5
5/(-20) = - 0.25
3
1
3
Se busca el nuevo pivote en la parte relevante de la segunda columna (segunda y tercera
filas) y resulta ser el elemento a32
.
Se intercambia la segunda fiÍa con la tercera y entonces queda:
A=
[
-20
-0.25
-0.5
3
3
1
20
5
-5 ~]Cálculo de la segunda fila de U (mejor dicho de los elementos distintos de cero de dicha
fila y almacenamiento de éstos en las posiciones correspondientes de A):
a2,2 = u2,2 = 3 (- 0.25)(3) = 3.75
a2,3 = u2,3 = 5 - (- 0.25)(20) = 10.0
Cálculo de la segunda columna de L; es decir, de los elementos debajo de 12,2 y almacena-
miento de éstos en las posiciones correspondientes de A.
1 - (- 0.5)(3)
a32 = 132= = 0.666666
" 3.75
Con estos valores la matriz A resultante es
A = [=~~25
-0.5
3
3.75
0.6666
20
10
-5 ~]Como a
3
,3 F O, se calcula u
3
,3' que constituye la parte relevante de la tercera fila de U, y se
almacena en a3,3'
a
3
3 = U
33
= -5 - (- 0.5) (20) - (0.66666) (LO) = -1.6666
con lo cual la matriz aumentada queda como sigue:
A = [=~~25
- 0.5
3
3.75
0.6666
20
10
- 1.6666 ~]
Matrices y sistemas de ecuaciones lineales 189
Como la nueva al ,¡ F O, se forma la primera fila de U y se guarda como primera fila
deA.
al ,] = U¡ ,¡ = -20, a¡ ,2 = u¡,2 = 3, a¡,3 = u¡ ,3 = 20
Cálculo de .la primera columna de L y su registro, excepto l¡ ,1' como primera columna
deA
ll,l = 1 (dato),
a 2,! = l2,¡
a 3,1 = l3,1
La matriz A resultante entonces es:
A = [=~~5- 0.25
3
1
3
10/(-20) = - 0.5
5/(-20) = - 0.25
20
-5
5
Se busca el nuevo pivote en la parte relevante de la segunda columna (segunda y tercera
filas) y resulta ser el elemento a32.
Se intercambia la segunda fiÍa con la tercera y entonces queda:
A =
[
- 20
-0.25
-0.5
3
3
1
20
5
- 5 ~]
Cálculo de la segunda fila de U (mejor dicho de los elementos distintos de cero de dicha
fila y almacenamiento de éstos en las posiciones correspondientes de A):
a2,2 =u2,2 =3 (- 0.25)(3) =3.75
a2,3 =u2,3 =5 - (- 0.25)(20) = 10.0
Cálculo de la segunda columna de L;es decir, de los elementos debajo de l2,2 y almacena-
miento de éstos en las posiciones correspondientes de A.
1 - (- 0.5)(3)
a 32 =l32 = =0.666666
" 3.75
Con estos valores la matriz A resultante es
A = [=~~25-0.5
3
3.75
0.6666
20
10
-5 ~]
Como a 3,3 F O, se calcula u 3,3' que constituye la parte relevante de la tercera fila de U, y se
almacena en a3,3'
a 3 3 = U33 = -5 - (- 0.5) (20) - (0.66666) (lO) = - 1.6666
con lo cual la matriz aumentada queda como sigue:
A = [=~~25- 0.5
3
3.75
0.6666
20
10
- 1.6666 ~]
190 Métodos numé ricos aplicados a la ingeniería
Al resolver los sistemas
Le = b' conL= [ ~~;5 !6666 ~] y b' = m
se tiene:
2
6 + 0.25(2) = 6.5
1 + 0.5(2) - 0.6666(6.5) = -2.33329
y
Pl
PP
PP
PP
PP
Ux=c
[
-20
con U = ~
3
3.75
O
20 ]
10 Y e como arriba.
-1.6666
se tiene
Xl=
-2.33329
x3 = = 1.3999796
-1.66666
x
2
= 6.5 - 10(1.3999796) = -1.9999456
3.75
2 - 3(-1.9999456) - 20(1.3999796) = 0.99999
-20
PA
PA
PA
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
elear
A=[10 1 -5 ; -20 3 20 ; 5 3 5]
b=[1 2 6]
[L, U,P]=lu (A);
L
U
%Semultiplica P por b transpuesto para
%reflejar los intercambios hechos en A
b=P'b'
e(l)=b(1) ;
e (2) =b (2) -L (2, l)*e (1);
e (3) =b (3) -L (3, l)*e (1) -L (3,2) *e (2) ;
e
x (3) =e (3) fU(3,3);
x (2) = (e (2) -U(2,3)*x (3)) fU(2,2) ;
x (1)= (e (1) -U(l ,2)*x (2) -U(1, 3)*x (3)) fU(l,l) ;
x
PA
PA
190 Métodos n umé ricos aplicados a la ingeniería
Al resolver los sistemas
Le = b' con L=
[~0.25
-0.5
o
1
0.6666
~] y b'~ m
se tiene:
y
e l = 2
e2 = 6 + 0.25(2) = 6.5
e3 = 1 + 0.5(2) - 0.6666(6.5) =- 2.33329
Ux =c
[
-20
con U = ~
3
3.75
O
20 ]
10 Ye como arriba.
- 1.6666
se tiene
- 2.33329
x3 = = 1.3999796
-1.66666
x
2
= 6.5 - 10(1.3999796) =- 1.9999456
3.75
2 - 3(-1.9999456) - 20(1.3999796) O
X l = - - - - -- - - - - -- - = .99999
-20
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
clear
A=[10 1 -5 ; - 20 3 20 ; 5 3 5]
b=[1 2 6]
[L, U, P]=lu (A) ;
L
U .
%Se multiplica P por b transpuesto para
%reflejar los intercambios hechos en A
b=P"b'
e(l)=b(l) ;
e (2) =b (2) - L (2 , l )*c(l );
e (3) =b (3) -L (3, l)*c (1) -L (3, 2) *c (2) ;
e
x (3) =c (3)IU(3 , 3) ;
x (2) = (e (2) - U(2, 3) *x (3)) IU(2, 2) ;
x (1) = (e (1) - U(l ,2)*x (2) - U(1 , 3) *x (3)) IU(1 , l) ;
x
Matrices y sistemas de ec uaciones lineales 191
A continuación se da el algoritmo de Doolitle
ALGORITMO 3.8 Método de Doolitle
Para obtener la solución del sistema A x = b Yel determinante de A, proporcionar los
DATOS: N el número de ecuaciones, A la matriz aumentada del sistema.
RESULTADOS: El vector solución x y el determinante de A o mensaje "LA FACTORIZACIÓN NO ES POSIBLE".
PASO 1.
PASO 2.
PASO 3.
PASO 4.
PASO 5.
PASO 13.
PASO 14.
PASO 15.
PASO 23.
PASO 24.
Realizar los pasos 1 al 12 del algoritmo 3.7.
Hacer c(l) = A(l,N+ 1).
Hacer DET = A(l,l).
Hacer I = 2.
Mientras I ~ N, repetir los pasos 6 a 12.
PASO 6. Hacer DET = DET *A(I,I).
PASO 7. Hacer c(l) = A(I,N+1).
PASO 8. Hacer J = 1.
PASO 9. Mientras J ;::::1-1, repetir los pasos 10 y 11.
PASO 10. Hacer c(l) = c(l) -A(I,J)* c(J) .
PASO 11. Hacer J = J + 1.
PASO 12. Hacer I = I +1.
Hacer x(N) = c(N)/A(N,N).
Hacer I = N -1.
Mientras 1;::::1, repetir los pasos 16 a 22.
PASO 16. Hacer xCI) = c(I).
PASO 17. Hacer J = I +1.
PASO 18. Mientras J ~ N, repetir los pasos 19 y 20.
PASO 19. Hacer x(l) = x(l) - A(I,J) * x(J).
PASO 20. Hacer J = J + 1.
PASO 21. Hacer x(l) = x(I)/A(I,I).
PASO 22. Hacer 1= 1-1.
Hacer DET = DET *(-1) ** R.
IMPRIMIR x y DET YTERMINAR.
SISTEMAS SIMÉTRICOS
En el caso de que la matriz coeficiente del sistema A x = b sea simétrica, los cálculos de
la factorización (si es posible) se simplifican, ya que la segunda de las ecuaciones 3.77 se
reduce a:
a.,
1 J,l.. 1 .Ó: 1 2 1ij=- l=J+ ,... ,n,J=, , ... ,n-
, a··
JJ
(3.78)
Esto disminuye considerablemente el trabajo, en particular cuando n es grande.
Ejemplo 3.34 Resuelva el sistema simétrico siguiente
[!
1
O
4
Solución Cálculo de la primera fila de U y su registro en A.
Mat rices y s is temas de ecuaciones lineales 191
A continuación se da el algoritmo de Doolitle
ALGORITMO 3.8 Método de Doolitle
Para obtener la solución del sistema A x =b Yel determinante de A, proporcionar los
DATOS: N el número de ecuaciones, A la matriz aumentada del sistema.
RESULTADOS: El vector solución x y el determinante de A o mensaje "LA FACTORIZACIÓN NO ES POSIBLE".
PASO l.
PASO 2.
PASO 3.
PASO 4.
PASO 5.
Realizar los pasos 1 al 12 del algoritmo 3.7.
Hacer c(l) = A(I,N+1).
Hacer DET = A(l,l).
Hacer I = 2.
Mientras 1 ~ N, repetir los pasos 6 a 12.
PASO 6. Hacer DET = DET *A(I,I).
PASO 7. Hacer c(I) = A(I,N+l).
PASO 8.
PASO 9.
Hacer J = 1.
Mientras J 2: 1-1, repetir los pasos 10 y 1l.
PASO 10. Hacer c(l) = c(l) -A(I,J)* c(J) .
PASO 11. Hacer J = J + 1.
PASO 12. Hacer 1= I +1.
PASO 13. Hacer x(N) = c(N)/A(N,N).
PASO 14. Hacer 1= N -1.
PASO 15. Mientras 12: 1, repetir los pasos 16 a 22.
PASO 16. Hacer xCI) = c(I).
PASO 17. Hacer J = 1 +1.
PASO 18. Mientras J ~ N, repetir los pasos 19 y 20.
PASO 19. Hacer x(l) = x(l) - A(I,J) * x(J).
PASO 20. Hacer J = J + 1.
PASO 21. Hacer xCI) = x(I)/A(I,I).
PASO 22. Hacer 1 = 1- 1.
PASO 23. Hacer DET = DET *(-1) ** R.
PASO 24. IMPRIMIR x y DET YTERMINAR.
SISTEMAS SIMÉTRICOS
En el caso de que la matriz coeficiente del sistema A x =b sea simétrica, los cálculos de
la factorización (si es posible) se simplifican, ya que la segunda de las ecuaciones 3.77 se
reduce a:
a··
1 J,l . . 1 .' 1 2 1ij = - 1 = ] + ,... , n,] = , ,.", n-
, a· ·
JJ
(3.78)
Esto disminuye considerablemente el trabajo, en particular cuando n es grande.
Ejemplo 3.34 Resuelva el sistema simétrico siguiente
[l
1
O
4
Solución Cálculo de la primera fila de U y su registro en A.
192 Métodos numéricos aplicados a la ingeniería
a¡,¡ = U¡,¡ = 2,
a¡,2 = u¡,2 = 1,
a¡,3 = u¡,3 = 3.
Cálculo de los elementos relevantes de la primera columna de L, usando la ecuación
3.78 y su registro en A.
a¡3
a31
=13
¡=-' =1.5
, , a
i.i
Cálculo de los elementos relevantes de la segunda fila de U y su registro en las posiciones
correspondientes de A
a2,2 = U2,2 = a2,2 -12,¡ u¡,2 = 0-0.5 (1) = -0.5
a2,3 = u2,3 = a2,3 - 12,1U¡,3 = 4 - 0.5 (3) = 2.5
Cálculo de los elementos relevantes de la segunda columna de L mediante la ecuación 3.78
y su registro en las posiciones correspondientes de A.
a23
a3 2 = 132 = -'- = - 5, , a
2,2
Finalmente se calcula la componente U
3
,3 (único elemento relevante de la tercera fila de U)
y se verifica su registro en a3,3'
a3,3 = U3,3 = a3,3 - 13,¡ U¡,3 - 13,2 U2,3
= 3 - 1.5(3) - (-5)(2.5) = 11
La factorización da como resultado
[
~.5
1.5
1
-0.5
-5
Con la resolución del sistema L e = b Para f
mente
[
~.5
1.5
O
1
-5
Di
RE
se obtiene: e = [O 1 8F
Y al resolver el sistema U x = e
PASO
PASO
[~
1
-0.5
O
3l2.5
J
"11
se obtiene:
[
-1.9091J
x = 1.6364
0.7273
192 Métodos numéricos aplicados a la ingeniería
a l ,1 =UI,I =2,
a l ,2 = u I ,2 = 1,
al ,3 =uI ,3 =3.
Cálculo de los elementos relevantes de la primera columna de L, usando la ecuación
3.78 y su registro en A.
al3
a3 1 = l3 1 = - ' = l.5, , a
1,1
Cálculo de los elementos relevantes de la segunda fila de U y su registro en las posiciones
correspondientes de A
a2,2 = u2,2 = a2,2 -l2,1 uI,2 = 0 - 0.5 (1) = - 0.5
a2,3 = u2,3 = a2,3 - l2,1 uI ,3 = 4 - 0.5 (3) = 2.5
Cálculo de los elementos relevantes de la segunda columna de L mediante la ecuación 3.78
y su registro en las posiciones correspondientes de A.
a23
a3 2 = l3 2 = - '- = - 5, , a
2,2
Finalmente se calcula la componente U3,3 (único elemento relevante de la tercera fila de U)
y se verifica su registro en a3,3'
a3,3 = U3,3 = a3,3 - l3,1 U¡ ,3 - l3,2 U2,3
La factorización da como resultado
[~.5
1.5
=3 - l.5(3) - (-5)(2.5) =11
1
- 0.5
- 5
Con la resolución del sistema L e =b
[~.5
l.5
se obtiene: e = [O 1 8F
Yal resolver el sistema U x =e
[~
se obtiene:
O
1
-5
1
-0.5
O
3l2.5
J
"11
[
-l.9091J
x = 1.6364
0.7273
'n
c1ear
A=[2 1 3; 1 O 4; 3 4 3}
b=[O 1 3}
A (2,1) =A (1,2) lA (1,1) ;
A(3,1)=A(1,3)IA(1,1) ;
A (2,2: 3) =A (2,2: 3) -A (2,1) *A (1,2: 3) ;
A(3,2)=A(2,3)IA(2,2);
A(3,3)=A(3,3)-A(3,1:2)*A(1:2,3) ;
A
c(l)=b(l);
e (2) =b (2) -A (2, 1) *c (1);
e (3) =b (3) -A ( 3, 1 : 2) *e (1 : 2) , ;
e
x=[O O O};
x(3)=c(~)IA(3,3);
x (2) = (e (2) -A (2,3) *x (3) ) lA (2,2) ;
x (1) = (e (1) -A (1,2: 3) *x (2: 3) , ) lA (1,1) ;
x
Matrices y sistemas de ecuaciones lineales 193
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
78
U)
Es importante observar que no se emplea pivoteo parcial y que si alguno de los elementos
ui,i resulta ser cero, este método no es aplicable; como consecuencia, habrá que recurrir al
método de Doolitle con pivoteo, por ejemplo, con lo cual se pierde la ventaja de que A es
simétrica.
A continuación se da el algoritmo correspondiente.
ALGORITMO 3.9 Factorización de matrices simétricas
Para factorizar una matriz A de orden n en el producto de las matrices L y U triangulares inferior y superior, respectiva-
mente, con tu = 1; i = 1,2, ... , n, proporcionar los
DATOS: El orden N y las componentes de la matriz simétrica A.
RESULTADOS: Las matrices L y U en A o mensaje de falla "LA FACTORIZACIÓN NO ES POSIBLE".
PASO 1.
PASO 2.
Hacer J = l.
Mientras J :s; N, repetir los pasos 3 al 15.
PASO 3. Hacer 1 = J.
PASO 4. Mientras I:s; N, repetir los pasos 5 a 13.
PASO 5. Hacer SUMAT = O.
PASO 6. Si J = 1 ir al paso 11. De otro modo continuar.
PASO 7. Hacer K = l.
PASO 8. Mientras K:S; J - 1, repetir los pasos 9 y 10.
PASO 9. Hacer SUMAT=SUMAT+A(J,K)*A(K,I).
PASO 10. Hacer K = K + l.
PASO 11. Hacer A(J,I) = A(J,I) - SUMAT.
PASO 12. Si 1 > J Hacer A (I,J) = A (J,I)/A(J,J). De otro modo continuar.
PASO 13. Hacer 1 = 1 + 1.
Matrices y sistemas de ecuaciones lineales 193
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
c1ear
A=[2 1 3 ; 1 O 4 ; 3 4 3]
b=[O 1 3]
A(2 , l)=A(1 , 2)IA(1 , l) ;
A(3 , l )=A(1,3) IA(1 , l ) ;
A(2,2:3)=A(2,2:3) -A(2 , l )*A(l ,2:3);
A(3 , 2 )=A(2, 3 ) IA(2 , 2 );
A (3,3) =A (3,3) -A (3,1: 2 ) *A (1: 2,3) ;
A
e (1) =b (1) ;
e (2) =b (2) - A (2, 1) *e (1) ;
c(3)=b (3)-A(3, l : 2)*c(1:2) ' ;
e
x=[O O O];
x(3)=c(~)IA(3,3);
x (2) = (e (2) -A (2, 3J*x (3 ) ) lA (2,2) ;
x (1) = (e (1) -A (1,2: 3 ) *x (2: 3) , ) l A (1,1) ;
x
Es importante observar que no se emplea pivoteo parcial y que si alguno de los elementos
ui,i resulta ser cero, este método no es aplicable; como consecuencia, habrá que recurrir al
método de Doolitle con pivoteo, por ejemplo, con lo cual se pierde la ventaja de que A es
simétrica.
A continuación se da el algoritmo correspondiente.
AlGORITMO 3.9 Factorización de matrices simétricas
Para factorizar una matriz A de orden 17 en el producto de las matrices L y U triangulares inferior y superior, respectiva-
mente, con tu =1; i =1,2, ... ,17, proporcionar los
DATOS: El orden N y las componentes de la matriz simétrica A.
RESULTADOS: Las matrices L y U en A o mensaje de falla "LA FACTOR1ZACIÓN NO ES POSIBLE".
PASO 1. Hacer J = l.
PASO 2. Mientras J ~ N, repetir los pasos 3 al 15.
PASO 3. Hacer 1 = J.
PASO 4. Mientras 1 ~ N, repetir los pasos 5 a 13.
PASO 5. Hacer SUMAT = O.
PASO 6. Si J = 1 ir al paso 11. De otro modo continuar.
PASO 7. Hacer K = 1.
PASO 8. Mientras K ~ J - 1, repetir los pasos 9 y LO.
PASO 9. Hacer SUMAT=SUMAT+A(J,K)*A(K,I).
PASO 10. Hacer K = K + 1.
PASO 11. Hacer A(J,I) = A(J,I) - SUMAT.
PASO 12. Si 1 > J Hacer A (I,J) = A (J,I)/A(J,J). De otro modo continuar.
PASO 13. Hacer 1 = 1 + 1.
194 Métodos numéricos apl icados a la ingeniería
PASO 14. Si A(J,J) = OIMPRIMIR "LA FACTORIZACIÓN NO ES POSIBLE" YTERMINAR. De otro mo-
do continuar.
PASO 15. Hacer J = J + 1.
PASO 16. IMPRIMIR A YTERMINAR.
MÉTODO DE CHOLESKY
Una matriz simétrica A cuyas componentes son números reales, es positiva definida si y
sólo si los determinantes de las sub matrices de A son positivos.
al,1 al,2 al,,,
al.1 al,2
a2,1 a2,2 a2,,,
I al,1 I > O, > O,... , >0
a2,1 a2,2
a",1 a",2 <,
En el caso de tener un sistema A x = b, con A positiva definida, la factorización de A en
la forma L U es posible y muy sencilla ya que toma la forma L U, donde L es triangular
inferior:
11,1 O
12, I 12,2
L=
1",1 1",2
O
O
i:
Los cálculos se reducen, ya que ahora basta estimar n(n+ 1)/2 elementos (los I¡,j -:f. O), en lu-
gar de los n2 elementos de una factorización nominal (los I¡,j tales que i <j Y los u¡,j tales
que i ?:.j). El número de cálculos es prácticamente la mitad.
Ejemplo 3.35 Resuelva el sistema de ecuaciones lineales
1
2
O
cuya matriz coeficiente es simétrica y positivamente definida.
Solución
Factorización de A
13,1]13,2
13,3
en
lar
Matrices y sistemas de ecuacione s lineales 195
De la multiplicación de matrices se tiene
IT,I = al,l; 11,1 = ± ~l = ± 2 se toma el valor positivo de todas las raíces
11,1 12,1 = al,2;
11,1 13,1 = a1,3;
11,1 = 2
12,1 = ali 11,1 =112 = 0.5
13,1= ali 11,1 =2/2 = 1
12,2 = J a2,2 - IL12 + 12 - a .2,1 2,2 - 2,2 '
12,2 = J 2 - 0.52
= 1.32287
-12 1 13 1 + a2 3
I - " ,
3,2 - I
2,2
13
,2 = _ 0.5 (1) = -0.37796
1.32287
13,1 + 1~,2 + 13,3 = a3,3 ; 13,3 = J a3,3 - 13,1 - 13,2
[3,3 = J 5 - 1 - 0.14286 = 1.96396
Al resolver el sistema:
Lc=b
[~5 o O J1.32287 O
-0.37796 1.96396
CI = 0.5
c2 = (2 - 0.5(0.5»/1.32287 = 1.32287
c3 = (4 - 0.5 + 0.37796(1.32287»/1.96396 = 2.0367
Al resolver el sistema:
Lrx=c
[~ - 0.3~796] [~~] =
1.96396 x3
[
0.5 ]
1.32287
2.0367
0.5
1.32287
O
X
3
= 2.0367/1.96396 = 1.037
x2
= (1.32287 + 0.37796(1.037»/1.32287 = 1.29629
Xl = (0.5 - 0.5 (1.29629) - 1.037)/2 = -0.59259
El vector solución es:
[
-0.59259]
x = 1.29629
1.037
Matrices y sistemas de ecuaciones lineales 195
De la multiplicación de matrices se tiene
IL = al ,l; 11,1 = ± A l = ± 2 se toma el valor positivo de todas las raÍCes
11,1 12,1 = a l ,2;
11,1 13,1 = al ,3 ;
11,1 = 2
12,1 = a l ,/ 11,1 =112 = 0.5
13,1 = al'/ 11,1 =2/2 = 1
12,2 = Ja2,2 -/L
12,2 = J2 - 0.52
= 1.32287
1 _ - 12,1 13,1 + a2,3
3,2 - 1
2,2
1
3
,2 = _ 0.5 (1) = -0.37796
l.32287
~ 1 + ~ 2 + I~ 3 =a3 3 ;. , , , 13,3 = Ja3,3 - I~,1 - l~,2
133 =J5 - 1 - 0.14286 = 1.96396
Al resolver el sistema:
Lc = b
[ ~5
o
1.32287
-0.37796
el = 0.5
e2 = (2 - 0.5(0.5))/l.32287 = l.32287
e3 = (4 - 0.5 + 0.37796(l.32287))/1.96396 =2.0367
Al resolver el sistema:
V'x=c
[~
0.5
l.32287
O
-0.3~79J [~~] =
1.96396 J x3
X3 = 2.0367/1.96396 = l.037
[
0.5 ]
l.32287
2.0367
x2 = (l.32287 + 0.37796(1.037))/1.32287 = l.29629
xI = (0.5 - 0.5 (l.29629) - l.037)/2 = -0.59259
El vector solución es:
[
-0.59259]
x = 1.29629
1.037
196 Métodos numéricos aplicados a la ingeniería
Para realizar los cálculos puede usarse el siguiente guión de Matlab que utiliza la fun-
ción chol (A), que devuelve la matriz triangular superior U de A, la cual deberá ser simé-
trica y positiva definida:
A= [4 1 2
U=chol (A)
L=U'
b=[l 2 4J
c=inv(L)*b'
x=inv (L' ) *c
1 2 O; 2 O 5J
PAse
Las fórmulas de este algoritmo para un sistema de n ecuaciones son
ll,l -r-;
t., = al/l¡,1
(
i-I )112
l=a-L[2k
1,1 1,1 k=1 1,.
i=2,3",.,n
i = 2,3'00' ,n
i-I
l = ~ (a - L l k 1k)
),1 1. 1,) k= l 1, t.
1,1
i = 2, 3'00' ,n
j = i + 1, i + 2,... , n -}
1.= O1,)
i < j

A continuación se da el algoritmo para este método.
Para factorizar una matriz positiva definida en la forma L U, proporcionar los
DATOS: N, el orden de la matriz y sus elementos.
RESULTADOS: La matriz L.
PASO 1.
PASO 2.
PASO 3.
Hacer L(l,l) =A (1,1) ** 0.5.
Hacer 1 = 2.
Mientras 1 ::;N, repetir los pasos 4 y 5.
PASO 4. Hacer L(1,l) = A(l,I)/L(1,l) YL(I,I) = O.
PASO 5. Hacer 1 = 1 + 1.
Hacer 1 = 2.
Mientras 1 ::;N, repetir los pasos 8 a 24.
PASO 8. Hacer S = O.
PASO 9. Hacer K = 1.
PASO 10. Mientras K::; 1-1, repetir los pasos 11 y 12.
PASO 11. Hacer S = S + L(1,K) **2.
PASO 6.
PASO 7.
196 Métodos numéricos aplicados a la ingeniería
Para realizar los cálculos puede usarse el siguiente guión de Matlab que utiliza la fun-
ción chol (A), que devuelve la matriz triangular superior U de A, la cual deberá ser simé-
trica y positiva definida:
rIl
,,-IIJt..
A= [4 1 2 1 2 O; 2 O 5]
U=chol (A)
L=U'
b=[l 2 4]
c=inv(L)*b'
x=inv(L' )*c
Las fórmulas de este algoritmo para un sistema de n ecuaciones son
11,1=~
li,1= al/ll,l
(
i- I )l/2l=a-L[2k1,1 1,1 k= 1 1, '
i- I
1 = ~ Ca - L 1 k 1 k)
J,l l.. I,J k=1 1, J,
1,1
1.= OI,J
i = 2, 3,... , n
i =2,3'00 ' , n
i = 2, 3'00' ,n
j =i + 1, i + 2,... , n -}
i < j
A continuación se da el algoritmo para este método.
f' '; " , .' . i . " •., - ,
ALGORITMO 3.10 Método de Cholesky .
Para factorizar una matriz positiva definida en la forma L U, proporcionar los
DATOS: N, el orden de la matriz y sus elementos.
RESULTADOS: La matriz L.
PASO 1. Hacer L(l,l) =A (1,1) ** 0.5.
PASO 2. Hacer 1 = 2.
PASO 3. Mientras 1 ::; N, repetir los pasos 4 y 5.
PASO 4. Hacer L(l,l) = A(l,I)/L(1,l) YL(I,I) = O.
PASO 5. Hacer l = l + 1.
PASO 6. Hacer 1 = 2.
PASO 7. Mientras 1::; N, repetir los pasos 8 a 24.
PASO 8. Hacer S = O.
PASO 9. Hacer K = 1.
PASO 10. Mientras K::; 1- 1, repetir los pasos 11 y 12.
PASO 11. Hacer S = S + L(1,K) **2.
Matrices y sistemas de ecuaciones lineales 197
PASO 12. Hacer K = K +l.
PASO 13. Hacer L(I,!) = (A(I,I) - S) ** 0.5.
PASO 14. Si 1 = N ir al paso 25.
PASO 15. Hacer J = I + l.
PASO 16. Mientras J :::;N, repetir los pasos 17 a 23.
PASO 17. Hacer S = o.
PASO 18. Hacer K = l.
PASO 19. Mientras K:::; 1-1, repetir los pasos 20 y 2l.
PASO 20. Hacer S = S + L(I,K)*L(J,K).
PASO 21. Hacer K = K + l.
PASO 22. Hacer L(J,I)=(A(I,J)-S)/L(I,I) y L(I,J) = O.
PASO 23. Hacer J = J + l.
PASO 24. Hacer I = 1 +1.
PASO 25. IMPRIMIR L YTERMINAR.
SISTEMAS DE ECUACIONES MAL CONDICIONADOS
Algunos autores caracterizan los métodos de solución directos como aquellos con los que
se obtiene la solución exacta x del sistema A x = b mediante un número finito de opera-
ciones, siempre y cuando no existan errores de redondeo. Como estos errores son prácti-
camente inevitables, se obtendrán en general soluciones aproximadas y, cuya sustitución
en el sistema producirá una aproximación del vector b: b'
Ay = b' ""b
En general, pequeños errores de redondeo producen sólo pequeños cambios en el vector
solución; en estos casos se dice que el sistema está bien condicionado. Sin embargo, en
algunos otros los errores de redondeo de los primeros pasos causan errores más adelante
(se propagan), de modo que la solución obtenida y resulta ser un vector distinto del vector
solución; peor aún, en estos sistemas la sustitución de y satisface prácticamente dicho sis-
tema. Este tipo de sistemas se conocen como mal condicionados. A continuación se pre-
sentan dos ejemplos
Sea el sistema mal condicionado"
[
1.99J
1.97
(3.79)
cuya solución es XI = x2
= 1.00, y sea la matriz aumentada siguiente
[
l.00
0.00
0.9900
0.0001
l.9900J
0.0001 '
el resultado de la triangularización. Si se redondea o corta a tres dígitos la última fila, que-
daría como fila de ceros y el sistema original como un sistema sin solución única.
Si, por otro lado, por un pequeño error en los cálculos se obtiene como solución de la
ecuación 3.79
YI= O, Y2 = 2,
* Forsythe, G.E. y Moler, C.B. Computer Solution of Linear Algebraic Systems. Englewood Cliffs, NJ. Prentice
Hall (1967).
Matrices y sistemas de ecuaciones lineales 197
PASO 12. Hacer K = K +1.
PASO 13. Hacer L(I,!) = (A(r,!) - S) ** 0.5.
PASO 14. Si 1 = N ir al paso 25.
PASO 15. Hacer J = 1 + l.
PASO 16. Mientras J :::; N, repetir los pasos 17 a 23.
PASO 17. Hacer S = O.
PASO 18. Hacer K = 1.
PASO 19. Mientras K :::; 1-1, repetir los pasos 20 y 2l.
PASO 20. Hacer S = S + L(l,K)*L(J,K).
PASO 21. Hacer K = K + 1.
PASO 22. Hacer L(J,I)=(A(I,J)-S)/L(l,l) y L(I,J) = O.
PASO 23. Hacer J = J + 1.
PASO 24. Hacer 1 = 1 +1 .
PASO 25. IMPRIMIR L YTERMINAR.
SISTEMAS DE ECUACIONES MAL CONDICIONADOS
Algunos autores caracterizan los métodos de solución directos como aquellos con los que
se obtiene la solución exacta x del sistema A x =b mediante un número finito de opera-
ciones, siempre y cuando no existan errores de redondeo. Como estos errores son prácti-
camente inevitables, se obtendrán en general soluciones aproximadas y, cuya sustitución
en el sistema producirá una aproximación del vector b: b'
Ay =b' "" b
En general, pequeños errores de redondeo producen sólo pequeños cambios en el vector
solución; en estos casos se dice que el sistema está bien condicionado. Sin embargo, en
algunos otros los errores de redondeo de los primeros pasos causan errores más adelante
(se propagan), de modo que la solución obtenida y resulta ser un vector distinto del vector
solución; peor aún, en estos sistemas la sustitución de y satisface prácticamente dicho sis-
tema. Este tipo de sistemas se conocen como mal condicionados. A continuación se pre-
sentan dos ejemplos
Sea el sistema mal condicionado"
[
1.99J
1.97
cuya solución es X I =x2 = 1.00, y sea la matriz aumentada siguiente
[
1.00
0.00
0.9900
0.0001
1.9900J
0.0001 '
(3.79)
el resultado de la triangularización. Si se redondea o corta a tres dígitos la última fila, que-
daría como fila de ceros y el sistema original como un sistema sin solución única.
Si, por otro lado, por un pequeño error en los cálculos se obtiene como solución de la
ecuación 3.79
* Forsythe, G.E. y Moler, C.B. Computer So/ution ol Linear Algebraic Systems. Englewood Cliffs, NJ. Prentice
Hall (1967).
198 Métodos numéricos aplicados a la ingeniería
que aunque distinta del vector solución da en la situación
[~:~~ ~:~~J [~J = D:~~J
prácticamente el vector b.
Aun una solución tan absurda como
Y,= 100, Y2 = -99,
da resultados sorprendentemente cercanos a b
[
1.00
0.99
0.99J
0.98 [
100J
-99
= [1.99J
1.98
Algunas veces los elementos de A y b son generados por cálculos (véase algoritmo s 5.1 y
5.5) Y los valores resultantes de ambos son ligeramente erróneos.
Sea el sistema mal condicionado
1.001 xI - x2
= 1
xI - x2 = O
que se desea resolver, pero por errores de redondeo o de otro tipo, se obtiene en su lugar
(3.80)
Y, - 0.9999 Y2 = 1.001
Y, - 1.0001 Y2 = O,
que difiere sólo "ligeramente" del sistema 3.80
Las soluciones exactas son, respectivamente,
(3.80')
[
1000J
x = 1000;
= [5005.5005J
y 5005.0000
cuya diferencia es notable a pesar de que los sistemas son casi idénticos. Para entender es-
to se da a continuación una interpretación geométrica de los sistemas mal condicionados.
INTERPRETACIÓN GEOMÉTR'CA DE UN SISTEMA MAL
CONDICIONADO DE ORDEN 2
La solución de un sistema de dos ecuaciones en dos incógnitas
a,., x, + al,2 x2 bl
a2,' x, + a2,2 x2 = b2
es el punto de intersección de las rectas
(~1)
b, a',2
x,=
a", al,'
x2
b2 a2,2
x,=
a2,' a2,1
x2
(3.82)
(3.83)
en el plano x2
- XI' Si el sistema 3.81 es mal condicionado, las rectas 3.82 y 3.83 son ca-
si paralelas, pero resulta difícil decir dónde se cortan exactamente" (véase Fig. 3.10).
* Nótese que hay una solución única, pero resulta difícil decir dónde está.
.!D/)
res-
dos.
3.81)
(3.82)
(3.83)
n ea-
3.10).
----------------------~----------~~~ .....=.".-
Matrices y sistemas de ecuaciones lineales 199
Ecuación (3.82)
Ecuación (3.83)
Figura 3.10
Interpretación
geométrica de
un sistema mal
condicionado
de orden 2.
Cualquier pequeño error de redondeo o de otro tipo puede alejar del vector solución, con lo
que se produce una solución errónea y. No obstante esto, si y está en la región de cruce,
el sistema 3.81 se satisface prácticamente con y. Hay que observar que la región de cruce es
muy amplia y que algunos de sus puntos pueden estar muy alejados del vector solución .
Una vez que se ha visto el comportamiento de los sistemas mal condicionados, resul-
ta de interés determinar si un sistema dado está mal condicionado y qué hacer en tales casos
para resolverlo. Hay varias formas de detectar si un sistema está malo bien condicionado; pe-
ro quizá la más simple de ellas es la del determinante normalizado que se describe a conti-
nuación.
MEDIDA DE CONDICIONAMIENTO USANDO EL DETERMINANTE NORMALIZADO
En el sistema 3.81 el determinante de la matriz coeficiente
puede interpretarse en valor absoluto como el área del paralelo gramo cuyos lados son los
vectores fila' [al.] al.2] Y [a2,] a2,2] (véase Fig. 3.11).
Figura 3.11
Interpretación
geométrica del
determinante.
Puede decirse lo mismo para los vectores columna.
Figura 3.10
Interpretación
geométrica de
un sistema mal
condicionado
de orden 2.
Figura 3.11
Interpretación
geométrica del
determinante.
Matrices y sistemas de ecuaciones lineales 199
Ecuación (3.83)
Ecuación (3.82)
Cualquier pequeño error de redondeo o de otro tipo puede alejar del vector solución, con lo
que se produce una solución errónea y. No obstante esto, si y está en la región de cruce,
el sistema 3.81 se satisface prácticamente con y. Hay que observar que la región de cruce es
muy amplia y que algunos de sus puntos pueden estar muy alejados del vector solución.
Una vez que se ha visto el comportamiento de los sistemas mal condicionados, resul-
ta de interés determinar si un sistema dado está mal condicionado y qué hacer en tales casos
para resolverlo. Hay varias formas de detectar si un sistema está malo bien condicionado; pe-
ro quizá la más simple de ellas es la del determinante normalizado que se describe a conti-
nuación.
M E DIDA DE CONDICIONAMIENTO USANDO EL DETERMINANTE NORMALIZADO
En el sistema 3.81 el determinante de la matriz coeficiente
puede interpretarse en valor absoluto como el área del paralelogramo cuyos lados son los
vectores fila' [a l •1 a l ,2] Y [a2,1a2,2 ] (véase Fig. 3.11).
Puede decirse lo mismo para los vectores columna.
200 Métodos numéricos apli cados a la ingeniería
Figura 3.12
Interpretación
geométrica del
determinante.
En el caso de un sistema general de orden 3, el determinante de la matriz coeficiente de
dicho sistema es, en valor absoluto, el volumen del paralelepípedo cuyos lados son los vec-
tores [al I al 2 al 3] , [a2 1 a22 a2 3] Y [a3 I a32 a3 3] (véase Fig. 3.12).
Al ~uldpli¿ar cada'una' de Ías filas del ~iste'ma 3.81 por un factor, el sistema resultan-
te es equivalente, pero la matriz coeficiente se ha modificado y, por ende, su determinante.
Si, por ejemplo, se divide la primera y segunda ecuaciones de 3.81, respectivamente, entre:
se obtiene como nueva matriz coeficiente
cuyo determinante en valor absoluto es menor o igual a la unidad, ya que ahora Ia I= 1 Y
I b I = 1 (véase Fig. 3.11). El determinante así obtenido se conoce como determinante
normalizado y, en general, para sistemas de orden n la matriz coeficiente resultante de di-
vidir la i-ésima fila por los factores"
k = J a
2
1 + a
2
2 + ... + a2,."1 l, r, i = 1,2, ... , n
tiene un determinante, en valor absoluto, menor o igual que la unidad. <:
Si el sistema 3.81 está mal condicionado, los vectores fila [al,1 al,2] Y [a2,l a2,2] son
casi paralelos y el determinante normalizado estará muy cercano a cero (muy pequeño).
Si, por otro lado, los vectores fila son casi ortogonales (perpendiculares), el determinante
estará muy cercano a la unidad, en valor absoluto.
Resumiendo y precisando: para medir el condicionamiento de un sistema de orden n, se
debe obtener el determinante normalizado de la matriz coeficiente de dicho sistema; y si su
valor absoluto es "prominentemente menor" que 1, el sistema está mal condicionado en ca-
so de tener un valor absoluto prominentemente cercano a 1, el sistema está bien condiciona-
do. Esta lejanía o cercanía de 1 queda determinada por la precisión empleada. **
Ejemr::
s
• Llamados factores de escalamiento .
•• Young, D. M. Y Gregory, R. T. A Survey Of Numerical Mathematics, Vol. II Addison-Wesley (1973), pp. 812-820.
200
Figura 3.12
Interpretación
geométrica del
determinante.
Métodos n uméricos aplicados a la ingeniería
En el caso de un sistema general de orden 3, el determinante de la matriz coeficiente de
dicho sistema es, en valor absoluto, el volumen del paralelepípedo cuyos lados son los vec-
tores [al ,1a l ,2 a l ,3 ] , [a2,1a 2,2 a 2,3 ] y [a3,1a 3,2 a 3,3 ] (véase Fig. 3.12).
Al multiplicar cada una de las filas del sistema 3.81 por un factor, el sistema resultan-
te es equivalente, pero la matriz coeficiente se ha modificado y, por ende, su determinante.
Si, por ejemplo, se divide la primera y segunda ecuaciones de 3.81, respectivamente, entre:
se obtiene como nueva matriz coeficiente
cuyo determinante en valor absoluto es menor o igual a la unidad, ya que ahora Ia I= 1 y
I b I = 1 (véase Fig. 3.11). El determinante así obtenido se conoce como determinante
normalizado y, en general, para sistemas de orden n la matriz coeficiente resultante de di-
vidir la i-ésima fila por los factores*
k¡ =J a~,1 + a~,2 + ... + a~,1I i = 1,2,... , n
tiene un determinante, en valor absoluto, menor o igual que la unidad. "'-......!
Si el sistema 3.81 está mal condicionado, los vectores fila [al ,1a l ,2 ] Y [a2,1a 2,2] son
casi paralelos y el determinante normalizado estará muy cercano a cero (muy pequeño).
Si, por otro lado, los vectores fila son casi oltogonales (perpendiculares), el determinante
estará muy cercano a la unidad, en valor absoluto.
Resumiendo y precisando: para medir el condicionamiento de un sistema de orden n, se
debe obtener el determinante normalizado de la matriz coeficiente de dicho sistema; y si su
valor absoluto es "prominentemente menor" que 1, el sistema está mal condicionado en ca-
so de tener un valor absoluto prominentemente cercano al , el sistema está bien condiciona-
do. Esta lejanía o cercanía de 1 queda determinada por la precisión empleada.**
• Llamados factores de escalamiento.
*. Young, D. M. YGregory, R. T. A SlIrvey 01Numerical Marhematics, Vol. II Addison- Wesley ( 1973), pp. 812-820.
Matrices y sistemas de e cuaciones lineales 201
Si bien la técnica es útil, no resulta práctica en sistemas grandes, ya que el cálculo del
determinante toma tiempo y es casi equivalente a resolver dichos sistemas. Entonces, si se
sospecha que un sistema está mal condicionado, se analiza de la manera siguiente:
a) Se resuelve el sistema original A x = b.
b) Se modifican los componentes de A ligeramente y se resuelve el sistema resul-
tante A' x = b.
e) Si las dos soluciones son sustancialmente diferentes (estas diferencias se comparan
con los cambios hechos en a¡), el sistema está mal condicionado.
Una vez corroborado que un sistema grande está mal condicionado, deberán emplearse los
métodos de solución vistos con ciertas recomendaciones.
a) Aprovechar las características de la matriz coeficiente (matrices bandeadas, simé-
tricas, diagonal dominantes, positivas definidas, etc.), para que el método seleccio-
nado sea el más adecuado y se realicen, por ejemplo, menos cálculos.
b) Emplear pivoteo parcial o total (véase Ejer. 3.9).
e) Emplear doble precisión en los cálculos.
Si aún después de seguir estas sugerencias persisten las dificultades, puede recurrirse a los
métodos iterativos que se estudian más adelante y que son, en general, otra alternativa de
solución de sistemas lineales mal y bien condicionados, con la ventaja de no ser tan sen-
sibles a los errores de redondeo.
MATRICES ELEMENTALES Y LOS MÉTODOS DE ELIMINACiÓN
Nótese que cualquiera de los métodos de eliminación vistos para resolver el sistema A x = b
involucra las siguientes operaciones sobre una matriz:':'
a) Intercambio de filas.
b) Multiplicación de la fila por un escalar, y
e) Sustitución de una fila por la suma de ésta y alguna otra fila de la matriz.
Estas operaciones pueden llevarse a cabo, mediante multiplicaciones de la matriz en cues-
tión, por ciertas matrices especiales; por ejemplo, la matriz permutadora permite intercam-
biar filas. Multiplicando en cambio por la izquierda una matriz B cualquiera por la matriz
identidad correspondiente 1, pero sustituido uno de sus elementos unitarios por m (la posi-
ción (i,i), por ejemplo), se multiplica la i-ésima fila de B por m.
Ejemplo 3.36 Multiplique la matriz general B de 3 X 4 por la matriz identidad correspondien~ don-
de se ha reemplazado el 1 de la posición (2, 2) con m.
Solución
[~
O
~][b"
b1,2 bl,3
b",] [b"
b1,2 b1,3
b" ]m b2,1 b2,2 b2.3 b2,4 = mb2.1 mb2,2 mb2,3 mb2,4
O b3,1 b3,2 b3,3 b3,4 b3,1 b3,2 b3,3 b3,4
Los resultados hablan por sí solos.
Finalmente, cuando se multiplica por la izquierda una matriz general B por la matriz
identidad correspondiente 1, en la que se ha sustituido uno de los ceros con m (el cero de
• Generalmente se trata de la matriz aumentada [A lb].
202 Métodos numéricos aplicados a la ingeniería
la posición (i,j), por ejemplo), se tiene el efecto de sustituir la fila i-ésima de B por la fila
resultante de sumar ésta y la filaj-ésima de B multiplicada por m.
Ejemplo 3.37 Sustituya la segunda fila de la matriz general B de 3 X 3 por el resultado de sumar di-
cha segunda fila con la primera fila de B multiplicada por m.
Solución Se sustituye el cero de la posición (2, 1) de la matriz 1 de 3 X 3 con m y se multiplica por
la izquierda por B; es decir:
[~
o
1
O
b,,2
mb,,2 + b2,2
b3,2
Si se desea intercambiar columnas, multiplicarlas por un escalar o sustituir una columna
por la suma de ésta y alguna otra, se procede siguiendo las mismas ideas, pero con las mul-
tiplicaciones por la derecha sobre la matriz en cuestión.
Estas matrices se conocen como elementales y se denotan como:
Permutación: P
Multiplicación por un escalar: M
Sustitución: S
Para aclarar la relación que existe entre estas matrices y los métodos de eliminación, se re-
suelve nuevamente el ejemplo 3.30, pero ahora con matrices elementales.
Ejemplo 3.38 Resuelva por eliminación de Jordan el sistema
4x, - 9x2 + 2x3 5
2x, - 4x2 + 6x3 3
x, - x2 + 3x3 4
con matrices P, M Y S.
Solución La matriz aumentada es
[~
-9
--4
-1
2
6
3
No se intercambian filas, ya que el elemento de máximo valor absoluto se encuentra en la
primera. Para hacer cero el elemento (2, 1), se suma la primera fila multiplicada por -1/2
a la segunda; la siguiente matriz cumple con ese fin.
O
1
O
Para hacer cero el elemento (3,1) se suma la primera multiplicada por -114 a la tercera fi-
la; esto es,
202 Métodos numéricos aplicados a la ingeniería
la posición (i,j), por ejemplo), se tiene el efecto de sustituir la fila i-ésima de B por la fila
resultante de sumar ésta y la filaj-ésima de B multiplicada por m.
Ejemplo 3.37 Sustituya la segunda fila de la matriz general B de 3 X 3 por el resultado de sumar di-
cha segunda fila con la primera fila de B multiplicada por m.
Solución Se sustituye el cero de la posición (2, 1) de la matriz 1 de 3 X 3 con m y se multiplica por
la izquierda por B ; es decir:
Ejemplo 3.38
Solución
[~
o
1
O
b, ,2
mb, ,2 + b2,2
b3,2
Si se desea intercambiar columnas, multiplicarlas por un escalar o sustituir una columna
por la suma de ésta y alguna otra, se procede siguiendo las mismas ideas, pero con las mul-
tiplicaciones por la derecha sobre la matriz en cuestión.
Estas matrices se conocen como elementales y se denotan como:
Permutación: P
Multiplicación por un escalar: M
Sustitución: S
Para aclarar la relación que existe entre estas matrices y los métodos de eliminación, se re-
suelve nuevamente el ejemplo 3.30, pero ahora con matrices elementales.
Resuelva por eliminación de Jordan el sistema
4x, - 9x2 + 2x3 5
2x, - 4x2 + 6x3 3
x , - x2 + 3x3 4
con matrices P, M YS.
La matriz aumentada es
[~
-9 2
n-4 6 = B
-1 3 "'-v
No se intercambian filas, ya que el elemento de máximo valor absoluto se encuentra en la
primera. Para hacer cero el elemento (2, 1), se suma la primera fila multiplicada por -1/2
a la segunda; la siguiente matriz cumple con ese fin.
O
1
O
~] =S,
1
Para hacer cero el elemento (3,1) se suma la primera multiplicada por -114 a la tercera fi-
la; esto es,
Matrices y sistemas de ecuaciones lineales 203
[-,~
O
~]1 = S2
O
El efecto de SI Y S2 sobre B resulta en:
[~
-9 2
~5 ] ~ S,S, B0.5 5
1.25 2.5 2.75
Como el elemento de máximo valor absoluto es 1.25, se intercambia la segunda y tercera
filas, para lo cual se emplea la matriz
[~
O
!~O =p¡
1
l·
Yqueda:
[~
-9 2
~75]1.25 2.5 P¡S2 SI B
0.5 5 0.5
re-
la
1/2
fi-
Para hacer cero los elementos (l ,2) Y (3 ,2) se suma la segunda multiplicada por
(-(-9)/1.25) a la primera fila, y la segunda multiplicada por (-0.5/1.25) a la tercera, pro-
ceso que se lleva a cabo con las matrices.
Para eliminar los elementos (1, 3) Y (2, 3), se suma la tercera multiplicada por (-2014) a la
primera fila y la tercera multiplicada por (-2.5/4) a la segunda, lo cual se logra con Ss y S6'
respectivamente. (Se deja al lector determinar la forma que tienen Ss y S6.) El resultado es:
27.8 ]
3.125
-0.6
[~
-(-9)/1.25
~]1 = S3
O
y queda como resultado:
U
O 20
1.25 2.5
O 4
[~
O
1.25
O
24.8 ]
2.75
-0.6
O
O
4
Todavía se puede multiplicar la primera fila por m¡ = 1/4, la segunda por m2 = 1/1.25 Yla
tercera por m3 = 1/4, lo cual se consigue con
O
1
O
O~] = M" etcétera
204 Métodos num éricos aplicados a la ingeniería
finalmente queda:
[~
o
1
O
O
O
1
6.95]2.5
-0.15
que puesta nuevamente como un sistema de ecuaciones da:
XI 6.95
x2
2.5
x3
-0.15,
directamente la solución del sistema original A x = b.
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
~
B=[4 -9 2 5; 2 -4 6 3; 1 -1 3 4]
51=[1 O O; -0.5 1 O; O O 1]
52=[1 O O; O 1 O; -0.25 O 1]
B=52¡'51*B
Pl= [1 O O; O O 1; O 1 O]
B=Pl*B
53=[1 9/1.25 O; O 1 O; O O 1]
54=[1 O O; O 1 O; O -0.5/1.25 1]
B=54*s.TB
55=[1 O -5; O 1 O; O O 1]
56=[1 O O; O 1 -2.5/4; O O 1]
B=56*55"B
Ma=[1/4 O O; O 1 O; O O 1]
M2=[1O O; O 1/1.25 O; O O 1]
M3=[1O O; O 1 O; O O 1/4]
B---M3*M2*Ma':'B
e3_38 ()
Prgm
[4,-9,2,5;2, -4, 6,3;1,-1,3, 4]-4b
[1, 0,0;-0.5,1,0;0, O.ii-»i
[1, 0,0;0,1,0;-0.25, O, l]-4s2
s21
'sl*b-4b : Disp b : Pause
[1, 0,0;0, 0,1;0,1, O]"-"'p1
p1*b-4b : Disp b : Pause
[1,9/1.25,0;0,1,0;0, O,l]-4s3
[1, 0,0;0,1,0;0, -O. 5/1. 25,1]-4s4
s4*s3:'b-4b : Disp b : Pause
[1,0,-5;0,1,0;0,0,lJ-4s5
[1, O, 0;0,1,-2.5/4;0, O,lJ-4s6
s6's5*b-4b : Disp b : Pause
[1/4, 0,0;0,1,0;0, O.Lt+uú
[1, 0,0;0,1/1.25,0;0, O,lJ-4m2
[1, 0,0;0,1,0;0, O,1/4J-4m3
m3"m2'ml*b-4b : Disp b
EndPrgm
204 Métodos numéricos aplicados a la ingeniería
finalmente queda:
[~
o
1
O
O
O
1
6.95]2.5
-0.15
que puesta nuevamente como un sistema de ecuaciones da:
XI 6.95
x2 2.5
x3 -0.15,
directamente la solución del sistema original A x =b.
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
B=[4 - 9 2 5; 2 -4 6 3; 1 -1 3 4]
51=[1 O O; -0.5 1 O; O O 1]
52=[1 O O; O 1 O; - 0.25 O 1]
B=5Z¡'51*B
Pl= [1 O O; O O 1; O 1 O]
B=PYB
53=[1 9/1 . 25 O; O 1 O; O O 1]
54=[1 O O; O 1 O; O - 0. 5/1 . 25 1]
B=54*53"B
55=[1 O -5; O 1 O; O O 1]
56=[1 O O; O 1 - 2.5/4; O O 1]
B=56*5S'B
Ma=[1/4 O O; O 1 O; O O 1]
M2=[1 O O; O 1/1 .25 O; O O 1]
M3=[1 O O; O 1 O; O O 1/4]
J3=M3l'M2*Ma':'B
e3_38 ()
Prgm
[4,-9, 2 ,5;2, -4, 6,3;1, -1 ,3, 4]-4b
[1, 0,0;-0.5,1,0;0, 0,1]-4sl
[1, 0,0;0,1,0;-0.25, O, 1]-4s2
sZI'sl':'b-4b : Disp b : Pause
[1, O, O; O, 0,1 ; O,1, O] -4p1
p1*b-4b : Disp b : Pause
[1 , 9/1 .25, 0; 0, 1 ,0;0, O, l]-4s3
[1 , 0, 0; 0, 1, 0; 0,-0 .5/1 . 25, 1]-4s4
s4':'s3¡'b-4b : Disp b : Pause
[l , O, - 5;O, l , 0; O, O,l]-4s5
[1 , O, 0;0,1 ,-2.5/4; 0, O, lJ-4s6
s6"sS:'b-4b : Disp b : Pause
[1/4, 0, 0 ; 0, 1, 0; 0, O, l]-4m1
[1 , 0, 0; 0, 1/1 .25, 0; 0, O,l]-4m2
[1 , 0, 0;0, 1 , 0;0, O, 1/4]-4m3
mYm2'ml*b-4b : Disp b
EndPrgm
Matrices y sistemas de ecuaciones lineales 205
Si el producto de las matrices elementales se denota por E
E = M3 M2 MI S6 s. S4 S3 PI S2 S¡ ,
se tiene:
E B = E [A I b 1 = [ 1 I x ] ,
de donde:
EA =1 y EB=x
resulta que E es la inversa de A
E = A-I
Por otro lado, se sabe que el determinante del producto de dos o más matrices es igual
al producto de los determinantes de cada una de las matrices.
detA B... = detA det B...
de donde:
det E A = det 1
o bien:
det E det A = 1
y
1
--=detA
det E
de modo que el determinante de A está dado como la inversa del determinante de E y só-
lo queda obtener det E. Esto parece complicado a simple vista; sin embargo, observando
que en general (véase Probo 3.52)
det P = -1, el determinante de una matriz permutadora es -1.
det M = m, el determinante de una matriz multiplicadora es el factor m, que deberá ser dis-
tinto de cero.
det S = 1, el determinante de una matriz del tipo S es 1.
Se tiene:
det E = det M3 det M2 det MI det S6 det Ss det S4 det S3 det P, det S2 det SI
sustituyendo
y
1
detA = -- =-20
-0.05
Finalmente, para obtener E y por tanto A-I
se toma SI como matriz pivote y sobre ella se
efectúan las operaciones de intercambio de filas, multiplicación por un escalar, etc., que
vayan indicando las matrices a su izquierda. Así:
Matrices y sistemas de ecuaciones lineales 205
Si el producto de las matrices elementales se denota por E
se tiene:
E B =E [A I b 1= [11 xl ,
de donde:
EA = 1 y EB=x
resulta que E es la inversa de A
E = A- I
Por otro lado, se sabe que el determinante del producto de dos o más matrices es igual
al producto de los determinantes de cada una de las matrices.
de donde:
o bien:
y
detA B... = detA det B...
det E A = det 1
det E det A = 1
1
- - = detA
det E
de modo que el determinante de A está dado como la inversa del determinante de E y só-
lo queda obtener det E. Esto parece complicado a simple vista; sin embargo, observando
que en general (véase Probo 3.52)
det P = -1, el determinante de una matriz permutadora es-l.
det M = m, el determinante de una matriz multiplicadora es el factor m, que deberá ser dis-
tinto de cero.
det S = 1, el determinante de una matriz del tipo S es l.
Se tiene:
det E = det M3 det M2 det M I det S6 det Ss det S4 det S3 det PI det S2 det SI
sustituyendo
y
1 1 1
det E = m3 m2 mi (-1) = -"4 (1.25 ) "4 = -D.05
1
detA = - - = -20
-0.05
Finalmente, para obtener E y por tanto A- I
se toma SI como matriz pivote y sobre ella se
efectúan las operaciones de intercambio de filas, multiplicación por un escalar, etc., que
vayan indicando las matrices a su izquierda. Así:
206 Métodos numéricos aplicados a la ingeniería
ya que según se dijo, S2 tiene como efecto multiplicar la primera fila de SI por -1/4 y su-
marla a la tercera fila de Si-
Con P I en cambio se tiene:
ya que PI
intercambia las filas segunda y tercera de (S2 SI)'
Continuando este proceso se llega a:
[
~.3
-0.1
-1.25
-0.5
0.25
2.3~
1.0 = E =
-0.1
3.5 Métodos iterativos
Al resolver un sistema de ecuaciones lineales por eliminación, la memoria de máquina re-
querida es proporcional al cuadrado del orden de A, y el trabajo computacional es proporcio-
nal al cubo del orden de la matriz coeficiente A (véase Secc. 3.4). Debido a esto, la solución
de sistemas lineales grandes (n ;:::50), con matrices coeficiente densas: se vuelve costoso y
difícil en una computadora con los métodos de eliminación, ya que se requiere amplia me-
moria; además, como el número de operaciones que se debe ejecutar es muy grande, se pue-
den producir errores de redondeo también muy grandes. Sin embargo, se han resuelto
sistemas de orden 1000, y aun mayor, con los métodos que se estudiarán en esta sección.
Estos sistemas de un número muy grande de ecuaciones se presentan en la solución
numérica de ecuaciones diferenciales parciales, en la solución de los modelos resultantes
en la simulación de columnas de destilación, etc. En favor de estos sistemas, puede decir-
se que tienen matrices con pocos elementos distintos de cero y que éstas poseen ciertas
propiedades (simétricas, bandeadas, diagonal dominantes, entre otras), que permiten ga-
rantizar el éxito en la aplicación de los métodos de esta sección.
MÉTODOS DE JACOBI y GAUSS-SEIDEL
Los métodos iterativos más sencillos y conocidos son una generalización del método de
punto fijo, estudiado en el capítulo 2. Se puede aplicar la misma técnica a fin de elaborar
métodos para la solución de A x = b, de la siguiente manera.
Se parte de A x = b para obtener la ecuación
Ax-b=O, (3.84)
ecuación vectorial correspondiente af(x) = O. Se busca ahora una matriz B y un vector e,
de manera que la ecuación vectorial
x e B.x. +c, (3.85)
sea sólo un arreglo de la ecuación 3.84; es decir, de manera que la solución de una sea tam-
bién la solución de la otra. La ecuación 3.85 correspondería a x = g (x). A continuación se
• Una matriz densa tiene pocos ceros como elementos.
206 Métodos numéricos aplicados a la ingeniería
ya que según se dijo, S2 tiene como efecto multiplicar la primera fila de SI por -1/4 y su-
marla a la tercera fila de Sl'
Con PI en cambio se tiene:
ya que PI intercambia las filas segunda y tercera de (S2 SI)'
Continuando este proceso se llega a:
[
~.3
-0.1
-1.25
- 0.5
0.25
2.3¡1.0 = E =
-0.1
3.5 Métodos iterativos
Al resolver un sistema de ecuaciones lineales por eliminación, la memoria de máquina re-
querida es proporcional al cuadrado del orden de A, y el trabajo computacional es proporcio-
nal al cubo del orden de la matriz coeficiente A (véase Secc. 3.4). Debido a esto, la solución
de sistemas lineales grandes (n ;::: 50), con matrices coeficiente densas,*se vuelve costoso y
difícil en una computadora con los métodos de eliminación, ya que se requiere amplia me-
moria; además, como el número de operaciones que se debe ejecutar es muy grande, se pue-
den producir errores de redondeo también muy grandes. Sin embargo, se han resuelto
sistemas de orden 1000, y aun mayor, con los métodos que se estudiarán en esta sección.
Estos sistemas de un número muy grande de ecuaciones se presentan en la solución
numérica de ecuaciones diferenciales parciales, en la solución de los modelos resultantes
en la simulación de columnas de destilación, etc. En favor de estos sistemas, puede decir-
se que tienen matrices con pocos elementos distintos de cero y que éstas poseen ciertas
propiedades (simétricas, bandeadas, diagonal dominantes, entre otras), que permiten ga-
rantizar el éxito en la aplicación de los métodos de esta sección.
MÉTODOS DE JACOBI y GAUSS-SE IDEL
Los métodos iterativos más sencillos y conocidos son una generalización del método de
punto fijo, estudiado en el capítulo 2. Se puede aplicar la misma técnica a fin de elaborar
métodos para la solución de A x =b, de la siguiente manera.
Se parte de A x =b para obtener la ecuación
Ax-b = O, (3.84)
ecuación vectorial correspondiente af(x) = O. Se busca ahora una matriz B y un vector e,
de manera que la ecuación vectorial
x =Bx + c , (3.85)
sea sólo un arreglo de la ecuación 3.84; es decir, de manera que la solución de una sea tam-
bién la solución de la otra. La ecuación 3.85 correspondería a x =g (x). A continuación se
• Una matriz densa tiene pocos ceros como elementos.
y su-
a re-
rcio-
ción
oso y
me-
pue-
uelto
'no
ción
antes
ecir-
iertas
n ga-
o de
borar
3.84)
tor e,
3.85)
tam-
ión se
-------~------------..."..------------~~--~~""I'!1Ii
Matrices y sistemas de ecuaciones lineales 207
propone un vector inicial x (O) como primera aproximación al vector solución X. Luego, se
calcula con la ecuación 3.85 la sucesión vectorial x (1) x (2), , de la siguiente manera
x(k+l) = B x(k) + e, k = O, 1,2, .
donde:
(3.86)
Para que la sucesión x(OJ, x(l), ••• , x(n), ••• , converja al vector solución x es necesario
que eventualmente xt, 1 ~ j ~ n (los componentes del vector x(m)), se aproximen tanto a
x
j
' 1 ~ j ~ n (los componentes correspondientes a x), que todas las diferencias I xt - x
j
I ,
1 ~j ~ n sean menores que un valor pequeño previamente fijado, y que se conserven me-
nores para todos los vectores siguientes de la iteración; es decir,
lím (3.87)
La forma como se llega a la ecuación 3.85 define el algoritmo y su convergencia. Dado el
sistema A x = b, la manera más sencilla es despejar xl de la primera ecuación, x2 de la se-
gunda, etc. Para ello, es necesario que todos los elementos de la diagonal principal de A,
por razones obvias, sean distintos de cero. Para ver esto en detalle considérese el sistema
general de tres ecuaciones (naturalmente puede extenderse a cualquier número de ecua-
ciones).
Sea entonces:
al,l Xl + al,2 X2 + al,3 X3 bj
a2,1 Xl + a2,2 X2 + a2,3 X3 b2
a3,1 Xl + a3,2 X2 + a3,3 X3 b3
con all' a22 y a33 distintos de cero.
Se despeja xl de la primera ecuación, x2 de la segunda, y x
3
de la tercera, con lo que
se obtiene:
al,2 al,3 bl
xl= x
2
- x3 +--
al,l al,l al,l
a2,1 a2,3 b2
(3.88)x2 = - xl X
3 +--
a2,2 a2,2 a2,2
a3,1 a3,2 b3
X3 = - X¡ - X2 +--
a3,3 a3,3 a3,3
que en notación matricial queda:
O
al,2 al,3 b¡
xl a¡,¡ al,l Xl al,l
a2,1
O
a2,3 b2
(3.89)x
2
x2 +
a2,2 a2,2 a2,2
x3 a3,1 a3,2
O
x
3
b3
a3,3 a3,3 a3,3
208 Métodos numér icos aplicados a la ingeniería
y ésta es la ecuación 3.86 desarrollada, con
o aJ,2 al,3 bJ
aJ,1 al,l al,l
B
a2,1
O
a2,3 b2
yC=
a2,2 a2,2 a2,2
a3,J a3,2
O
b3
a3,3 a3,3 a3,3
Una vez que se tiene la forma 3.89, se propone un vector inicial x(O) que puede ser x(O)
= 0, o algún otro que sea aproximado al vector solución x.
Para iterar existen dos variantes
1. Iteración de Jacobí (método de desplazamientos simultáneos)
Si
Ej
(3.90)
es el vector aproximación a la solución x después de k iteraciones, entonces se tiene para
la siguiente aproximación
Xk+l
al,l
(bl - al,2 x~ - al,3x~)
1
1
X(k+l) xk+J
(b k k) (3.91)2 2 - a2,1 Xl - a2,3x3
a2,2
k+l
x3
(b3 - a3,1 x1 - a3,2X~)
a3,3
o bien, para un sistema de n ecuaciones con n incógnitas y usando notación más compac-
ta y de mayor utilidad en programación, se tiene:
11
x/+
l
= - [-b + L a· . xk ], para 1 ::;i::; n
ai,i 1 }=l i.) }
Ni
(3.92)
2. Iteración de Gauss-Seidel (método de desplazamientos sucesivos)
En este método los valores que se van calculando en la (k+ l)-ésima iteración se emplean
para calcular los valores faltantes de esa misma iteración; es decir, con X(k) se calcula X(k+l)
de acuerdo con:
1
(bl - al,2 x{ - a 1,3 x~)k+l
aJ,JxJ
X(k+I) k+J (b k+l k) (3.93)x2
a2,2
2 - a2,J Xl - a2,3 X3
xk+J 1
(b3
- a
3
1 X1k+J - a
3
2 X{+I)
3
a3,3 ' ,
er x(O)
(3.90)
para
3.91)
pac-
lean
X(k+I)
.93)
Matrices y sistemas de ecuaciones lineales 209
o bien, para un sistema de n ecuaciones
i-l 11
x/+I=- [-b+ L a .. xk+l+ L a .. xk],paralS:¡S:n
ai,i I l= I 1, } } i=i+ I 1, } }
(3.94)
SUGERENCIA: El empleo de un pizarrón electrónico para los siguientes ejemplos o el de una
calculadora programable, atenuaría considerablemente el trabajo de los cálculos.
Ejemplo 3.39 Resuelva el siguiente sistema por los métodos de Jacobi y Gauss-Seidel
4xI x2 1
-XI + 4x2
x3
1
(3.95)
x2 + 4x3 x4 1
x3 + 4x4 1
Solución Despejando xI de la primera ecuación, x
2
de la segunda, etc., se obtiene
XI xzl4 + 1/4
x2
= x¡f4 + x/4 + 1/4
(3.96)
x3 xzl4 + x/4 + 1/4
x4 + x3/4 + 1/4
Vector inicial
Cuando no se tiene una aproximación al vector solución, se emplea generalmente como
vector inicial el vector cero, esto es:
x(O) = [O O O O]T
a) Método de Jacobi
El cálculo de x(l) en el método de Jacobi se obtiene reemplazando x(O) en cada una de las
ecuaciones de 3.96
0/4 + 1/4
0/4 + 0/4 + 1/4
0/4 + 0/4 + 1/4
0/4 + 1/4
1/4
1/4
1/4
1/4
y entonces X(I) = [1/4 1/4 1/4 1/4]T
Para calcular X(2) se sustituye X(I) en cada una de las ecuaciones de 3.96. Para simpli-
ficar la notación se han omitido los superíndices.
1/16 + 114
1/16 + 1/16 + 1/4
1/16 + 1/16 + 1/4
1/16 + 1/4
0.3125
0.3750
0.3750
0.3125
210 Métodos numéricos aplicados a la ingeniería
A continuación se presentan los resultados de subsecuentes iteraciones, en forma tabular
Tabla 3.1 Solución del sistema 3.95 por el método de Jacobi.
k Xk xk Xk xk
1 2 3 4
O 0.0000 0.0000 0.0000 0.0000
0.2500 0.2500 0.2500 0.2500
2 0.3125 0.3750 0.3750 0.3125
3 0.3438 0.4219 0.4219 0.3438
4 0.3555 0.4414 0.4414 0.3555
5 0.3604 0.4492 0.4492 0.3604
6 0.3623 0.4524 0.4524 0.3623
... 7 0.3631 0.4537 0.4537 0.3631
11
8 0.3634 0.4542 0.4542 0.3634
9 0.3635 0.4544 0.4544 0.3635
10 0.3636 0.4545 0.4545 0.3636
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
% Método de Jacobi
clear
A=[4 -1 O O; -1 4 -1 O; O -1 4 -1; O O -1 4J
b=[1 1 1 1J
XO=zeros(1,4);
K=O; Norma=1;
fprintf('K X(l) X (2) X (3) X(4) Norman')
while Norma> 0.0001
K=K+1;
fprintf( '%2d' ,K)
for i=1:4
suma=O;
for j=1:4
if i -= j
suma=suma+A(i,j)*XO (j);
end
end
X (i) = (b (i) -suma) lA (i,i) ;
fprintf( '%10.4f' ,X(i))
end
Norma=norm (XO-X) ;
fprintf( '%10. 4fn' ,Norma)
XO=X;
if K > 25
disp ('No se alcanzó la convergencia')
break
end
end
Matrices y sistemas de ecuaciones lineales 211
·1
e3_39a ()
Prgm
ClrIO : [4,-1, 0,0;-1,4, -1,0;0, -1,4, -1;0, O,-1, 4]-+a
[l,l,l,l}-+b : [O,O,O,O]-+xO : xü+xl. : O+): : l-+norma
Disp"k x(1) x(2) x(3) x(4) norma"
While norma>1.s-4
k+Ir+k: : string(k)&""->d
For i,1,4
0-+suma
For j,1,4
If i-tj
suma+ati, j ]*xO [1,j ]-+suma
EndFor
(b[l,i] -suma) la [i,i]-+xl [l,i] :d&format (xl [l,i] , "f4") &''''-+d
EndFor
norm(xl-xO)-+norma : d&format(norma,"f5")-+d : Disp d : xl-+xO
If k>25 Then
Disp "No se alcanzó la convergencia"
Exit
EndIf
EndWhile
EndPrgm
b) Método de Gauss-Siedel
Para el cálculo del primer elemento del vector x(l) , se sustituye x(O)en la primera ecuación
de 3.96, para simplificar la notación se han omitido los superíndices.
Xl = 0/4 + 1/4 = 1/4
Para el cálculo de x
2
de x(l), se emplea el valor de xl ya obtenido (1/4) y los valores x
2
' x
3
y x4
de x(O). Así,
1
x2 = 4(4) + 0/4 + 1/4 = 0.3125
Con los valores de xl y x
2
ya obtenidos, y con x
3
y x
4
de x(O) se evalúa x
3
de x(l).
X
3
= 0.3125/4 + 0/4 + 1/4 = 0.3281
Finalmente, con los valores de Xl X
2
y x3
calculados previamente, y con x4
de x(°l, se obtie-
ne la última componente de x(l)
X4 = 0.3281/4 + 1/4 = 0.3320
Entonces x(l) = [0.25 0.3125 0.3281 0.3320F
Para la segunda iteración (cálculo de x(2») se procede de igual manera.
Xl = 0.3125/4 + 1/4 = 0.3281
x2
= 0.3281/4 + 0.3281/4 + 1/4 = 0.4141
x3
= 0.4141/4 + 0.3320/4 + 1/4 = 0.4365
x4
= 0.4365/4 + 1/4 = 0.3591
e3_39a ()
Prgm
Matrices y sistemas de ecuaciones lineales 211
ClrIO : [4, - 1, O, O; - 1 , 4, - 1, O; O, -1,4, -1;O, O, -1,4]-+a
[l,l , l , l]-+b : [O, O, O, O]-+xO : xO-+xl : O-+k : l-+nonna
Disp"k x(l) x(2) x(3) x(4) nonna"
While nonna>1. E- 4
k+l-+k : string(k)&""-+d
For i,1,4
0-+suma
For j , 1, 4
If # j
swna+a [i , j ]*xO [1, j ]-+swna
EndFor
(b[l ,i] - suma) la [i ,i]-+xl [l,i] : d&fonnat (xl [l , i] , " f4 ") &''''-+d
EndFor
nonn(xl- xO)-+nonna : d&fonnat(nonna,"f5")-+d : Disp d : xl-+xO
If k>25 Then
Disp "No se alcanzó la convergencia"
Exit
EndIf
EndWhile
EndPrgm
b) Método de Gauss-Siedel
Para el cálculo del primer elemento del vector x O) , se sustituye x(Ü) en la primera ecuación
de 3.96, para simplificar la notación se han omitido los superíndices.
X l = 0/4 + 1/4 = 1/4
Para el cálculo de x 2 de xO), se emplea el valor de xl ya obtenido (1/4) y los valores x
2
, x
3
y x4
de x(Ü). Así,
1
x2 =4(4) + 0/4 + 1/4 =0.3125
Con los valores de x l Yx 2 ya obtenidos, y con x 3 y x 4 de x(Ü) se evalúa x
3
de x(l).
X3 = 0.3125/4 + 0/4 + 1/4 = 0.3281
Finalmente, con los valores de X l X
2
y x3
calculados previamente, y con x4
de x(Ü), se obtie-
ne la última componente de x(l)
X4 = 0.3281/4 + 1/4 = 0.3320
Entonces x(l) = [0.25 0.3125 0.3281 0.3320F
Para la segunda iteración (cálculo de x(2» se procede de igual manera.
Xl =0.3125/4 + 1/4 =0.3281
x2 = 0.3281/4 + 0.3281/4 + 1/4 =0.4141
x3 = 0.4141/4 + 0.3320/4 + 1/4 = 0.4365
x4 =0.4365/4 + 1/4 =0.3591
212 Métodos numéricos aplicados a la ingeniería
Con lo que x(2) = [0.3281 0.4141 0.4365 0.359 n'.
En la tabla 3.2 se presentan los resultados de las iteraciones subsecuentes.
Tabla 3.2 Solución del sistema 3.95 por el método
de Gauss-Seidel.
k xk xk xk xk
1 2 3 4
O 0.0000 0.0000 0.0000 0.0000
0.2500 0.3125 0.3281 0.3320
2 0.3281 0.4141 0.4365 0.3591
3 0.3535 0.4475 0.4517 0.3629
4 0.3619 0.4534 0.4541 0.3635
¡"1 5 0.3633 0.4544 0.4545 0.3636
11'
6 0.3636 0.4545 0.4545 0.3636
Para realizar los cálculos puede usarse Matlab o la TI-92 Plus:
% Metodo de Gauss-Seidel
clear;A=[4 -1 O O; -1 4 -1 O; O -1 4 -1; O O -1 4];b=[1 1 1 1]
XO=zeros(1,4);X=XO;K=0;Norma=1;
fprintf(' K X(1) X (2) X(3) X(4) Norman')
while Norma> 0.0001
K=K+1; fprintf(' %2d ',K)
for i=1:4
suma=O;
for j=1:4
if i ~= j
suma=suma+A(i,j)*X(j) ;
end
end
X(i)=(b(i) -suma)/A(i,i); fprintf( '%10.4f' ,X(i))
end
Norma=norm(XO-X) ; fprintf ( '%10. 4fn' ,Norma)
XO=X;
if K > 17
disp ('No se alcanzó la convergencia')
break
end
end
Matrices y sistemas de ecuaci ones lineales 213
e3_39b()
Prgm
C1r10 : [4, -1, O,O;-1,4, -1, O;O,-1,4, -1; O,O, -1,4] -> a
[1,1,1,1]->b : [O,O,O,O]->xO : xtr+x.: : O+k: : l=+norme
Disp "k x(l) x (2) x(3) x(4) nonna"
Whi1e nonna>1.E-4
k+Ir+k: : string(k) &" "->d
For i,1,4
O->swna
For j,1,4
If #j
swna+a[i, j }*x1 [1,j J->swna
EndFor
(b[l,iJ-swna) /a [i,i]->x1 [l,i] :d&fonnat (xl [l,iJ , "f4") &" "->d
EndFor
nonn(x1-xO)->nonna : d&fonnat(nonna,"f5")->d : Disp d : xl+xt)
If k>25 Then
Disp "No se alcanzó la convergencia"
Exit
Endlf
EndWhile
End.Prgm
En la aplicación de estas dos variantes son válidas las preguntas siguientes:
1. ¿La sucesión de vectores xCI), X(2), x(3), ... , converge o se aleja del vector solución
x = [x¡ X2 ••• xnll'?
2. ¿Cuándo detener el proceso iterativo?
Las respuestas correspondientes, conocidas como criterio de convergencia, se dan a con-
tinuación
1. Si la sucesión converge a x, cabe esperar que los elementos de x(k) se vayan acer-
cando a los elementos correspondientes de X; es decir, rol a x¡; xk
2 a x2' etc., o que
se alejen en caso contrario.
2. Cuando
a) Los valores absolutos 1xt+ 11 - xt 1,1xf+ 1 - x{ 1,etc., sean todos menores de un
número pequeño E en cuyo valor será dado por el programador.
a bien
b) Si el número de iteraciones ha excedido un máximo predeterminado MAXIT.
Por otro lado, es natural pensar que si la sucesión xCO), x(ll, ... , converge a x, la distancia
(véase Seco 3.2) de xCO) a x, de XCI) a x, etc., se va reduciendo; también es cierto que la dis-
tancia entre cada dos vectores consecutivos xCO)y XCI), x(l) Y x(2), etc., se decrementa con-
forme el proceso iterativo avanza; esto es, la sucesión de números reales
1 X(I)_XCO) 1
1 x(2) - x(l) 1
convergirá a cero.
(3.97)
Matrices y sistemas de ecuaciones lineales 213
e3_39b ()
Prgm
C1rIO : [4, -1, O, 0;-1, 4, -1,0;0, -1, 4, -1;0, O, -1, 4]->a
[ l , l , l ,l] ->b : [O, O, O, O]->xO : x O->x1 : O->k : l ->nonna
Di sp "k x(l) x (2 ) x (3) x(4) nonna"
Whi1e nonna>1. E- 4
k+1->k : s t ring (k ) &" ''->d
For i, 1 , 4
O->swna
For j , 1 , 4
If # j
s wna+a [i , j }*x1 [1, j] ->swna
EndFor
(b[l,i]-swna) l a [i,i]->xl [ l,i] :d&fonnat (xl [l,i] , " f4 ") &" "->d
EndFor
nonn(xl-xO)->nonna : d&fonnat(nonna,"f5")->d : Disp d : xl->xO
If k>25 Then
Disp "No se alcanzó la convergencia"
Exit
Endlf
EndWhile
EndPr gm
En la aplicación de estas dos variantes son válidas las preguntas siguientes:
1. ¿La sucesión de vectores xCI), X(2), x(3), ... , converge o se aleja del vector solución
x = [Xl X2 ••• xnll'?
2. ¿Cuándo detener el proceso iterativo?
Las respuestas correspondientes, conocidas como criterio de convergencia, se dan a con-
tinuación
1. Si la sucesión converge a x , cabe esperar que los elementos de x (k) se vayan acer-
cando a los elementos correspondientes de X; es decir, rol a x I; xk2 a x2' etc., o que
se alejen en caso contrario.
2. Cuando
a) Los valores absolutos Ixt+ 11- xt 1, Ixi+
'
- xi 1, etc., sean todos menores de un
número pequeño E en cuyo valor será dado por el programador.
O bien
b) Si el número de iteraciones ha excedido un máximo predeterminado MAXIT.
Por otro lado, es natural pensar que si la sucesión x (O), x (l), .. . , converge a x , la distancia
(véase Seco 3.2) de x (O) a x , de X CI ) a x , etc., se va reduciendo; también es cierto que la dis-
tancia entre cada dos vectores consecutivos x (O) y x(l ), x(l ) y x (21, etc., se decrementa con-
forme el proceso iterativo avanza; esto es, la sucesión de números reales
convergirá a cero.
I X( I)-X(O) I
I X(2) - x(!) I
I X(k+I ) - x Ck) I
(3.97)
214 Métodos numé ricos aplicados a la ingeniería
't '1
Si, por el contrario, esta sucesión de números diverge, entonces puede pensarse que el
proceso diverge. Con esto, un criterio más es
e) Detener el proceso una vez que I x(k+I) - x(k) I < e
Al elaborar un programa de cómputo para resolver sistemas de ecuaciones lineales, gene-
ralmente se utilizan los criterios a), b) y e) o la combinación de a) y b), o la de b) y e).
Si se observan las columnas de las tablas 3.1 y 3.2, se advertirá que todas son suce-
siones de números convergentes, por lo que ambos métodos convergen a un vector, presu-
miblemente la solución del sistema 3.95.
Si se tomara el criterio (a) con e = 10-2
Yel método de Jacobi, e se satisface en la sex-
ta iteración de la tabla 3.1; en cambio si e = 10-3, se necesitan 10 iteraciones.
Si se toma E = 10-3, el método de Gauss-Seidel y el criterio (a), se requerirían sólo seis
iteraciones, como puede verse en la tabla 3.2.
Aunque hay ejemplos en los que Jacobi converge y Gauss-Seidel diverge, y vicever-
sa, en general puede esperarse convergencia más rápida por Gauss-Seidel, o una manifes-
tación más rápida de divergencia. Esto se debe al hecho de ir usando los valores más
recientes de X(k+I) que permitirán acercarse o alejarse más rápidamente de la solución.
REARREGLO DE ECUACIONES
Para motivar el rearreglo de ecuaciones, se propone resolver el siguiente sistema con el
método de Gauss Seidel y con e = 10-2 aplicado a Ix(k+ 1)- X(k) l.
-XI + 3x2 + 5x3 + 2x4 10
XI + 9x2 + 8x3 + 4x4 15
(3.98)
x2 + x4 2
2xI + x2 + x3 x4 -3
Al resolver para XI de la primera ecuación, para x2 de la segunda, x3 de la cuarta, y x4 de
la tercera se obtiene:
XI 3x2 + 5x3 + 2x4 - 10
x2 -x/9 (8/9) x3
(4/9) x4 + 15/9
x3
- 2xI x2 + x4 - 3
x4 x2 + 2
Con el vector cero como vector inicial, se tiene la siguiente sucesión de vectores.
Nótese que el proceso diverge.
Tabla 3.3 Aplicación del método de Gauss-Seidel al sistema 3.98.
k xk xk xk xk I X(k+l) - X(k) I
1 2 3 4
O 0.000 0.000 0.000 0.000
-10.000 2.7778 14.222 -0.7778 17.62
2 67.8889 -18.172 -12l.2 20.17 159.0
3 -631.1 170.7 1108.0 -168.71 1439.05
el
e-
e-
u-
x-
eis
er-
es-
ás
el
8)
de
Matrices y sistemas de ecuaciones lineales 215
Si el proceso iterativo diverge, como es el caso, un rearreglo de las ecuaciones puede
originar convergencia; por ejemplo, en lugar de despejar XI de la primera ecuación, x2
de
la segunda, etc., cabe despejar las diferentes Xi de diferentes ecuaciones, teniendo cuidado
de que los coeficientes de las Xi despejadas sean distintos de cero.
Esta sugerencia presenta, para un sistema de n ecuaciones, n! distintas formas de
rearreglar dicho sistema. A fin de simplificar este procedimiento, se utilizará el siguien-
te teorema.
TEOREMA 3.2 Los procesos de Jacobi y Gauss-Seidel convergirán si en la matriz
coeficiente cada elemento de la diagonal principal es mayor (en valor
absoluto) que la suma de los valores absolutos de todos los demás elementos
de la misma fila o columna (matriz diagonal dominante). Es decir, se asegura
la convergencia si:
11
I a.1 > L I a.1
1,1 i=I l.)
j*i
y (3.99)
11
l zr.l > L I aJ
.,; I
/,1 i=)
j:J!i
Este teorema no será de mucha utilidad si se toma al pie de la letra, ya que contados sis-
temas de ecuaciones lineales poseen matrices coeficiente diagonalmente dominantes; sin
embargo, si se arreglan las ecuaciones para tener el sistema lo más cercano posible a las
condiciones del teorema, algún beneficio se puede obtener. Ésta es la pauta para reordenar
las ecuaciones y obtener o mejorar la convergencia, en el mejor de los casos. A continua-
ción se ilustra esto, rearreglando el sistema 3.98, despejando XI de la ecuación 4, x2
de la
ecuación 2, x3
de la ecuación 1, y x4
de la ecuación 3, para llegar a:
XI = -xzl2 - x/2 + xi2 - 3/2
x2 = -x/9 - 8x/9 - 4xi9 + ]5/9
x3 x/5 3xzl5 2xi5 + 10/5
x4 -x2 + 2
Los resultados para las primeras 18 iteraciones con el vector cero como vector inicial se
muestran en la tabla 3.4.
Antes de continuar las iteraciones, puede observarse en la tabla 3.4 que los valores de
x(l8) parecen converger al vector
x = [-10 12]T
Con la sustitución de estos valores en el sistema 3.98, se comprueba que XI = 1, x2
= 0.0,
x3
= 1 Yx4 = 2 es el vector solución, y por razones obvias se detiene el proceso.
Finalmente, las ecuaciones 3.99 son equivalentes (en sistemas de ecuaciones) a la ex-
presión 2.10 del capítulo 2 que establece el criterio de convergencia del método iterativo
para resolver f (x) = O.
216 Métodos numéricos apli cados a la ingeniería
Tabla 3.4 Aplicación del método de Gauss-Seidel al sistema 3.98,
rearreglando las ecuaciones para obtener una aproximación
a un sistema diagonal dominante.
k Xk x
k xk xk I x(k+l) - X(k) I
1 2 3 4
O 0.0000 0.0000 0.0000 0.0000
1 -1.5000 1.8333 0.6000 0.1667 2.44
2 -2.6333 1.3519 0.5956 0.6481 1.32
3 -2.1496 1.0881 0.6580 0.9119 0.6140
4 -1.9171 0.8895 0.7181 1.1105 0.3695
5 -1.7486 0.7291 0.7686 1.2704 0.2867
6 -1.6134 0.5978 0.8102 1.4022 0.2337
PASO 1
7 -1.5030 0.4903 0.8444 1.5097 0.1907
8 -1.4125 0.4020 0.8724 1.5980 0.1567 PASO I
9 -1.3382 0.3297 0.8953 1.6703 0.1285 * Operacic
10 -1.2774 0.2704 0.9142 1.7296 0.10529
11 -1.2275 0.2217 0.9296 1.7783 0.08643
12 -1.1865 0.1818 0.9423 1.8182 0.07089
13 -1.1530 0.1491 0.9527 1.8509 0.06162
14 -1.1254 0.1223 0.9612 1.8777 0.04764
15 -1.1029 0.1003 0.9682 1.8997 0.03903
16 -1.0844 0.0822 0.9739 1.9178 0.03209
17 -1.0692 0.0674 0.9786 1.9326 0.02629
18 -1.0567 0.0553 0.9824 1.9447 0.02152
Se presenta a continuación un algoritmo para resolver sistemas de ecuaciones lineales con
el método iterativo, en sus dos versiones: desplazamientos simultáneos y desplazamientos
sucesivos.
ALGORITMO 3.11 Métodos de Jacobi y Gauss-Seidel
Para encontrar la solución aproximada del sistema de ecuaciones A x = b proporcionar los
DATOS: El número de ecuaciones N, la matriz coeficiente A, el vector de términos independientes b, el vec-
tor inicial xO, el número máximo de iteraciones MAXIT, el valor de EPS y M = O para usar JACO-
Bl o M "* O para usar GAUSS-SEIDEL.
RESULTADOS: La solución aproximada x y el número de iteraciones K en que se alcanzó la convergencia o mensa-
je "NO SE ALCANZÓ LA CONVERGENCIA", la última aproximación a x y MAXIT.
PASO l.
PASO 2.
PASO 3.
Arreglar la matriz aumentada de modo que la matriz coeficiente quede lo más cercana posible a la diagonal
dominante (véase Probo 3.55).
Hacer K = 1
Mientras K ~ MAXIT, repetir los pasos 4 a 18.
Matrices y sistemas de ecuacio nes lineales 217
PASO 4. Si M = O ir al paso 5. De otro modo Hacer ? x = xO.·
PASO 5. Hacer 1 = l.
PASO 6. Mientras 1 ~ N, repetir los pasos 7 a 14.
PASO 7. Hacer SUMA = O.
PASO 8. Hacer J = l.
PASO 9. Mientras J ~ N, repetir los pasos 10 a 12.
PASO 10. Si J = 1 ir al paso 12.
PASO 11. Hacer SUMA = SUMA+A(I,J)*xO(J)
PASO 12. Hacer J = J +l.
PASO 13. Si M = O, hacer xCI) = (b(I)-SUMA)/A(I,l).
De otro modo hacer xO(I)= (b(I)-SUMA)/(A(I,l).
PASO 14. Hacer! = 1 + l.
PASO 15. Si Ix - xOI ~ EPS ir al paso 19. De otro modo continuar.
PASO 16. Si M = O, hacer xO = x.
PASO 17. Hacer K = K + l.
PASO 18. IMPRIMIR mensaje "NO SE ALCANZÓ LA CONVERGENCIA", el vector x, MAXIT y el mensaje "ITE-
RACIONES" YTERMINAR.
PASO 19. IMPRIMIR el mensaje "VECTOR SOLUCIÓN", x, K y el mensaje "ITERACIONES" y TERMINAR.
*" Operaciones vectoriales.
SUGERENCIA: Una vez más se recomienda programar el algoritmo 3.11 en un lenguaje de alto nivel
(véase PROGRAMA 3.3 del CD), o bien en una calculadora o en un pizarrón
electrónico o en Matlab, donde las operaciones vectoriales se ejecutan con sólo
indicarlas.
ACELERACIÓN DE CONVERGENCIA
Si aún después de arreglado el sistema por resolver A x = b, conforme la pauta del teore-
ma 3.2, no se obtiene convergencia por los métodos de Jacobi y Gauss-Seidel o es muy
lenta (como sucedió con el sistema 3.98 de la sección anterior), puede recurrirse a los mé-
todos de relajación que, como se hará notar posteriormente, son lo métodos de Jacobi y
Gauss-Seidel afectados por un factor de peso w que, elegido adecuadamente, puede pro-
ducir convergencia o acelerada si ya existe. Se describen a continuación estos métodos pa-
ra un sistema de n ecuaciones en n incógnitas.
Llámese N la matriz coeficiente del sistema por resolver, una vez que haya sido lleva-
da a la forma más cercana posible a diagonal dominante, y después de dividir la primera
fila entre al," la segunda entre a2,2"" , y la n-ésima entre all
,lI' N es una matriz con unos
en la diagonal principal. A continuación descompóngase N en la siguiente forma:
N=L+ 1+ U,
donde L es una matriz cuyos elementos por debajo de su diagonal principal son idénticos
a los correspondientes de N y ceros en cualquier otro sitio, 1es la matriz identidad y U una
matriz cuyos elementos arriba de la diagonal principal son idénticos a los correspondien-
tes de N y cero en cualquier otro sitio. Sustituyendo esta descomposición de N, el sistema
que se quiere resolver quedaría:
(L + 1 + U) x = b (3.100)
Si ahora se suma x a cada miembro de la ecuación 3.100 se obtiene
(L + 1 + U) x + x = b + x
PASO 4.
PASO 5.
PASO 6.
Matrices y sistemas de ecuaciones lineales 217
Si M = Oir al paso 5. De otro modo Hacer ':' x = xO. ·
Hacer 1 = 1.
Mientras 1 <S; N, repetir los pasos 7 a 14.
PASO 7. Hacer SUMA = O.
PASO 8. Hacer J = 1.
PASO 9. Mientras J <S; N, repetir los pasos 10 a 12.
PASO 10. Si J = 1 ir al paso 12.
PASO 11. Hacer SUMA = SUMA+A(I,J)*xO(J)
PASO 12. Hacer J = J +l.
PASO 13. Si M = O, hacer xCI) = (b(I)-SUMA)/A(I,I).
De otro modo hacer xO(I)= (b(I)-SUMA)/(A(I,I).
PASO 14. Hacer 1 = 1 + 1.
PASO 15. Si Ix - xOI <S; EPS ir al paso 19. De otro modo continuar.
PASO 16. Si M = O, hacer xO = x.
PASO 17. Hacer K = K + 1.
PASO 18. IMPRIMIR mensaje "NO SE ALCANZÓ LA CONVERGENCIA", el vector x, MAXIT y el mensaje "ITE-
RACIONES" YTERMINAR.
PASO 19. IMPRIMIR el mensaje "VECTOR SOLUCIÓN", x, K y el mensaje "ITERACIONES" y TERMINAR.
*" Oper:lciones vectoriales.
SUGERENCIA: Una vez más se recomienda programar el algoritmo 3.11 en un lenguaje de alto nivel
(véase PROGRAMA 3.3 del CD), o bien en una calculadora o en un pizarrón
electrónico o en Matlab, donde las operaciones vectoriales se ejecutan con sólo
indicarlas.
ACELERACIÓN DE CONVERGENCIA
Si aún después de atTeglado el sistema por resolver A x =b, conforme la pauta del teore-
ma 3.2, no se obtiene convergencia por los métodos de Jacobi y Gauss-Seidel o es muy
lenta (como sucedió con el sistema 3.98 de la sección anterior), puede recurrirse a los mé-
todos de relajación que, como se hará notar posteriormente, son lo métodos de Jacobi y
Gauss-Seidel afectados por un factor de peso w que, elegido adecuadamente, puede pro-
ducir convergencia o acelerarla si ya existe. Se describen a continuación estos métodos pa-
ra un sistema de n ecuaciones en n incógnitas.
Llámese N la matriz coeficiente del sistema por resolver, una vez que haya sido lleva-
da a la forma más cercana posible a diagonal dominante, y después de dividir la primera
fila entre al ,!' la segunda entre a 2,2'''' , y la n-ésima entre a ll
, lI' N es una matriz con unos
en la diagonal principal. A continuación descompóngase N en la siguiente forma:
N= L+ 1 + U,
donde L es una matriz cuyos elementos por debajo de su diagonal principal son idénticos
a los correspondientes de N y ceros en cualquier otro sitio, 1 es la matriz identidad y U una
matriz cuyos elementos arriba de la diagonal principal son idénticos a los cotTespondien-
tes de N y cero en cualquier otro sitio. Sustituyendo esta descomposición de N, el sistema
que se quiere resolver quedaría:
(L + 1 + U) x = b (3.100)
Si ahora se suma x a cada miembro de la ecuación 3.100 se obtiene
(L + 1 + U) x + x =b + x
218 Métodos numéricos aplicados a la ingeniería
"Despejando" x del lado izquierdo, se llega al esquema siguiente
x = x + [b - L x - x - U x], (3.101)
que puede utilizarse para iterar a partir de un vector inicial x(O). Nótese que la ecuación
3.101, puede reducirse a la ecuación 3,89, ya que sólo es un rearreglo de ésta.
Al aplicar la ecuación 3.10 1, pueden presentarse de nuevo las dos variantes que die-
ron lugar a los métodos de Jacobi y Gauss-Seidel, con lo que el esquema de desplazamien-
tos simultáneos quedaría:
Ej
X(k+l) = X(k) + [b - L X(k) - X(k) - U X(k)] (3.102)
y el de desplazamientos sucesivos así:
X(k+l) = X(k) + [b - L X(k+l) - X(k) - U X(k)] (3.103)
Llegar al esquema 3.102 y 3.103 no es simplemente para tener una versión distinta de las
ecuaciones 3.89, sino para someterlo a un análisis que permita proponer "nuevos métodos"
o mejoras en los que ya se tienen. Por ejemplo, factorizando x(k) dentro del paréntesis rec-
tangular de la ecuación 3.102, se tiene:
b - ( L + 1+ U) X(k) = b - N x(k) = r(k) (3.104)
vector que se denota como r(k) y se llama vector residuo de la k-ésima iteración y puede
tomarse como una medida de la cercanía de x(k) al vector solución x; si las componentes
de r(k) o Ir(k) Ison pequeñas, X(k) suele ser una buena aproximación a x; pero si los elemen-
tos de r(k) o Ir(k) I son grandes, puede pensarse que X(k) no es muy cercana a x. Aunque hay
circunstancias donde esto no se cumple, por ejemplo, cuando el sistema por resolver está
mal condicionado (véase Seco 3.4), es práctico tomar estos criterios como válidos.
Al sustituir la ecuación 3.104, en la 3.102 queda
X(k+l) = X(k) + r(k) (3.105)
que puede verse como un esquema iterativo donde el vector de la (k+l)-ésima iteración se
obtiene a partir del vector de la k-ésima iteración y el residuo correspondiente.
Si la aplicación de la ecuación 3.105 a un sistema particular da convergencia lenta,
entonces x(k+l) y X(k) están muy cercanas entre sí, y para que la convergencia se acelere
puede intentarse afectar r(k) con un peso w > 1 (sobrerrelajar el proceso); si, en cambio,
el proceso diverge Ir(k) Ies grande y convendría afectar r(k) con un factor w < 1 (subrela-
jar el proceso), para provocar la convergencia. El esquema 3.105 quedaría en general así:
X(k+l) = x(k) + w r(k) (3.106)
o
n
xk+l = xCk)+ w [b - L a .. x k ]
1 l 1 j=l t.j )
j",¡
1 -:;,i -:;,n , (3.107)
para desplazamientos simultáneos.
Para desplazamientos sucesivos, en cambio, quedaría
X(k+l) = x(k) + w [b - L x(k+l) - x(k) - U X(k)] (3.108)
o
(3.109)
218 Métodos numéricos aplicados a la ingeniería
"Despejando" x del lado izquierdo, se llega al esquema siguiente
x =x + [b - L x - x - U x], (3.101)
que puede utilizarse para iterar a partir de un vector inicial x(O). Nótese que la ecuación
3.101, puede reducirse a la ecuación 3,89, ya que sólo es un rearreglo de ésta.
Al aplicar la ecuación 3.101, pueden presentarse de nuevo las dos variantes que die-
ron lugar a los métodos de Jacobi y Gauss-Seide1, con lo que el esquema de desplazamien-
tos simultáneos quedaría:
X(k+ l) =X (k) + [b - L X(k) - X (k) - U X(k)] (3.102)
y el de desplazamientos sucesivos así:
X(k+ l) = X(k) + [b - L X(k+l) - X(k) - U X(k)] (3.103)
Llegar al esquema 3.102 y 3.103 no es simplemente para tener una versión distinta de las
ecuaciones 3.89, sino para someterlo a un análisis que permita proponer "nuevos métodos"
o mejoras en los que ya se tienen. Por ejemplo, factorizando x(k) dentro del paréntesis rec-
tangular de la ecuación 3.102, se tiene:
b - ( L + 1 + U) X(k) = b - N x(k) = r(k) (3.104)
vector que se denota como r(k) y se llama vector residuo de la k-ésima iteración y puede
tomarse como una medida de la cercanía de x(k) al vector solución x; si las componentes
de r(k) o Ir(k) Ison pequeñas, X(k) suele ser una buena aproximación a x; pero si los elemen-
tos de r(k) o Ir(k) Ison grandes, puede pensarse que X (k) no es muy cercana a x. Aunque hay
circunstancias donde esto no se cumple, por ejemplo, cuando el sistema por resolver está
mal condicionado (véase Seco 3.4), es práctico tomar estos criterios como válidos.
Al sustituir la ecuación 3.104, en la 3.102 queda
X(k+l) =X(k) + r(k) (3.105)
que puede verse como un esquema iterativo donde el vector de la (h l)-ésima iteración se
obtiene a partir del vector de la k-ésima iteración y el residuo correspondiente.
Si la aplicación de la ecuación 3.105 a un sistema particular da convergencia lenta,
entonces x(k+l) y X(k) están muy cercanas entre sí, y para que la convergencia se acelere
puede intentarse afectar r(k) con un peso w > 1 (sobrerrelajar el proceso); si, en cambio,
el proceso diverge Ir(k) Ies grande y convendría afectar r(k) con un factor w < 1 (subrela-
jar el proceso), para provocar la convergencia. El esquema 3.105 quedaría en general así:
X(k+l) = x(k) + w r(k) (3.106)
o
n
xk+l = x(k) + w [b - L a . . x k ]
1 1 I j= l l .} }
1 -:;, i -:;, n , (3.107)
j", ¡
para desplazamientos simultáneos.
Para desplazamientos sucesivos, en cambio, quedaría
X(k+l) =x(k) + w [b - L x(k+l) - x(k) - U X (k) ] (3.108)
o
(3.109)
1)
ón
'e-
n-
2)
3)
las
s"
c-
ay
stá
S)
se
la,
ere
io,
la-
sí:
06)
07)
08)
09)
Matrices y sistemas de ecuaciones lineales 219
Estos métodos se abrevian frecuentemente como SOR (del inglés Succesive Over-Re-
laxation).
En general, el cálculo de w es complicado y sólo para sistemas especiales (matriz coe-
ficiente positivamente definida y tridiagonal) se tiene una fórmula:
Ejemplo 3.40 Resuelva el sistema 3.98
-XI + 3x2 + 5x3
XI + 9x2 + 8x3
x2
2xI + x2 + x3
10
15
2
-3
con desplazamientos sucesivos, w = 1.3 Y con E = 10-2 aplicado a I X(k+l) - x(k) 1.(Puede
seguir los cálculos con un pizarrón electrónico o con Matlab.)
Solución La matriz N y el vector de términos independientes correspondiente son
-
1I2
l4/9
2/5 '
1
112
1
3/5
1
112
8/9
1
O
b = [-3/2 15/9 10/5 2]T
Descomposición de N
L = [ 1~9
-115
O
1/2
8/9
O
O
-
1I2
l4/9
2/5
O
O
O
3/5
1
O
O
O
O
112
O
O
O
Primera iteración
Obtención de x(1) a partir del vector inicial x (O) = [O O O OF y empleando la ecuación 3.108.
Cálculo de x], esto es, i = 1 Yk + 1 = 1
o 4
xl = xp + 1.3[ b, - j:¡ IIJ xl - x? - j:2 U1J x/]
Obsérvese que en la primera sumatoria el valor inicial (j=I) es mayor que el valor final
(O); la convención en estos casos es que tal sumatoria no se realiza. Por tanto,
Xl = O + 1.3[-3/2 - O - 112(0) -1/2(0) + 112(0)] = - 1.95
Cálculo de xi, esto es, i = 2 Yk+ 1 = 1
I
x2
1 = x2
0 + 1.3 [ b2
-L
J~I
= O+ 1.3 [15/9 - 119(-1.95) - O- 8/9(0) - 4/9(0)] = 2.4483
Cálculo de xj, esto es, i = 3 Yk+l = 1
= O + 1.3 [10/5 - (-115)(-1.95) - (3/5) (2.4483) - O- 2/5(0)] = 0.1833
• Burden, R.L. y Faires, J'D. Análisis numérico. Grupo Editorial Iberoamérica (1985), pp. 475.
# -
Matrices y sistemas de ecuaciones lineales 219
Estos métodos se abrevian frecuentemente como SOR (del inglés Succesive Over-Re-
laxatian).
En general, el cálculo de w es complicado y sólo para sistemas especiales (matriz coe-
ficiente positivamente definida y tridiagonal) se tiene una fórmula:
Ejemplo 3.40 Resuelva el sistema 3.98
- XI + 3x2
X I + 9x2
x2
2xI + x2
+ 5x3
+ 8x3
+ x3
+ 2x4
+ 4x4
+ x4
x4
10
15
2
-3
con desplazamientos sucesivos, w = 1.3 Ycon E = 10-2 aplicado a I XCk+ I) - xCk) 1. (Puede
seguir los cálculos con un pizarrón electrónico o con Matlab.)
Solución La matriz N y el vector de términos independientes correspondiente son
112 112
N= l':9 -tal8/9 4/9
-115 3/5 1 2/5 '
b = [-3/2 15/9 10/5 2]T
O 1
Descomposición de N
L = l'~9
O
O
-1/5 3/5
O 1
Primera iteración
O
O
O
O
O
1
n
1/2
O
O
O
1/2
8/9
O
O
-
1I2
l4/9
2/5
O
Obtención de x(l) a partir del vector inicial x (O) = [O OOOF y empleando la ecuación 3.108.
Cálculo de xl, esto es, i = 1 Yk + 1 = 1
o 4
xl = xp + 1.3[ bl -L II J' xl - x O
- L U¡J' xJO ]
pi J I j=2
Obsérvese que en la primera sumatoria el valorinicial (j=1) es mayor que el valor final
(O); la convención en estos casos es que tal sumatoria no se realiza. Por tanto,
Xl = O+ l.3[-3/2 - O- 1/2(0) - 112(0) + 1/2(0)] = - 1.95
Cálculo de xi, esto es, i = 2 Yk+1 = 1
1 4
X2
1 = x2
0 + 1.3 [ b2 -L 12J' xl - X 0_ L U
2J
' x/ ]
pi J 2 j=3
= O+ l.3 [15/9 - 1/9(-1.95) - O- 8/9(0) - 4/9(0)] =2.4483
Cálculo de xj, esto es, i = 3 Yk+1 = 1
= O+ l.3 [10/5 - (-115)(-1.95) - (3/5) (2.4483) - O- 2/5(0)] =0.1833
• Burden, R.L. y Faires, J.D, Análisis numérico, Grupo Editorial Iberoamérica (1985), pp. 475,
220 Métodos numéricos aplicados a la ingeniería
Cálculo de xJ, esto es, i = 4 Yk+1 = 1
3
xJ = x2 + 1.3 [ b4 -L
J=I
= O + 1.3 [2 - 0(-1.95) - 1(2.4483) - 0(0.1833) - O] = - 0.5828
Cálculo de Ix(l) - x(O) I = di
d - )(xl- xO)2+(XI- xO)2+(XI- xO)2+(XI_ xO)2
1- 1 I 2 2 3 3 4 4
= )(-1.95)2 + (2.4483)2 + (0.1833)2 + (-0.5828)2 = 3.1891
Los valores mostrados en la tabla 3.5 se encuentran continuando las iteraciones.
Tabla 3.5 Resultados obtenidos con w = 1.3.
k Xk x k Xk xk I x(k+l) _ x(k) I
1 2 3 4
O 0.0000 0.0000 0.0000 0.0000
1 -1.9500 2.4483 0.1833 -0.5828 3.1891
2 -3.4544 2.0561 0.3462 0.1020 1.7066
3 -2.4089 1.4388 0.6945 0.6989 1.3971
4 -2.1597 0.8406 0.8110 1.2976 0.8898
5 -1.5322 0.4489 0.9334 1.6271 0.8190
6 -1.3312 0.2055 0.9674 1.8447 0.3848
7 -1.1140 0.0822 0.9968 1.9397 0.2689
8 -1.0563 0.0220 1.0005 1.9895 0.0972
9 -1.0046 -0.0004 1.0045 2.0037 0.0583
10 -0.9988 -0.0074 1.0028 2.0084 0.0103
11 -0.9919 -0.0070 1.0024 2.0066 0.0072
Para realizar los cálculos puede usarse el siguiente guión de Matlab:
Ta
%Método SOR
clear
A=[2 1 1 -1; 1 9 8 4; -1 3 5 2; O 1 O 1J
b=[-3 15 10 2J
for i=1:4
N(i, :)=A(i, :)/A(i,i);
b(i)=b(i) /A(i,i);
end
N
U=triu (N)
L=tril (N)
XO=zeros (1,4) ;
X=XO; w=1.3;
K=O;Norma=l;
fprintf(' K X(1) X(2) X(3) X(4) Norman')
whi1e Norma>O.Ol
2
3
4
5
6
Matrices y sistemas de ecuaciones lin eales 221
k=k+1;
fprintf( '%2s' ,k)
for i=1:4
sumaL=O; sumaU=O;
for j=1:4
if i-=j
sumaL=sumaL+L (i, j) *X (j) ;
sumaU=sumaU+U(i,j)':'XO (j);
end
end
X (i) =X (i) +w* (b (i) -sumaL-X (i) -sumaU) ;
fprintf( '%10. 4f' ,X(i))
end
Norma=norm(XO-X);
fprintf ( '%10. 4fn' ,Norma)
XO=X;
if K > 17
disp ('No se alcanzó la convergencia')
break
end
end
Al comparar estos resultados con los obtenidos en la tabla 3.4 (método de Gauss-Seidel
aplicado al sistema que aquí se resuelve), se observa que la convergencia es acelerada y
los cálculos se reducen a la mitad.
COMPARACiÓN DE LOS MÉTODOS DIRECTOS E ITERATIVOS
Una parte importante el análisis numérico es conocer las características (ventajas y des-
ventajas) de los métodos numéricos básicos que resuelven una familia de problemas (en
este caso A x = b), para así elegir el algoritmo más adecuado para cada problema.
A continuación se presentan las circunstancias donde pudiera verse como ventajosa la
elección de un método iterativo y también a qué se renuncia co.n esta decisión.
Ventajas
Tabla 3.6 Ventajas y desventajas de los métodos iterativos comparados con los métodos directos.
Desventajas
l. Probablemente más eficientes que los directos para
sistemas de orden muy alto.
2. Más simples de programar.
3. Puede aprovecharse una aproximación a la solución,
si tal aproximación existe.
4. Se obtienen fácilmente aproximaciones burdas de la
solución.
5. Son menos sensibles a los errores de redondeo (valio-
so en sistemas mal condicionados).
6. Se requiere menos memoria de máquina. Generalmen-
te las necesidades de memoria son proporcionales al
orden de la matriz.
1. Si se tienen varios sistemas que comparten la matriz
coeficiente, esto no representará ahorro de cálculos ni
tiempo de máquina, ya que por cada vector a la dere-
cha de A tendrá que aplicarse el método seleccionado.
2. Aun cuando la convergencia esté asegurada, puede
ser lenta y, por tanto, los cálculos requeridos para ob-
tener una solución particular no son predecibles.
3. El tiempo de máquina y la exactitud del resultado de-
penden del criterio de convergencia.
4. Si la convergencia es lenta, los resultados deben in-
terpretarse con cautela.
5. No se tiene ventaja particular alguna (tiempo de má-
quina por iteración) si la matriz coeficiente es simé-
trica.
6. No se obtiene A-I ni det A .
•
Matrices y sistemas de ecuaciones lineales 221
k=k+1 ;
fprin tf( ' %2s ' , k)
f or i=1 : 4
sumaL=O ; suma U=O ;
for j =1 : 4
if i-=j
sumaL=sumaL+L (i, j ) *X (j ) ;
sumaU=sumaU+U(i , j )*XO (j );
end
end
X (i ) =X (i ) +W-' (b (i ) -sumaL- X (i ) - sumaU) ;
f printf( ' %10. 4f ' ,X(i))
end
Norma=norm (XO-X);
f printf( ' %10 . 4fn ' , Norma )
XO=X;
if K > 17
di sp ('No se alcanzó la convergencia')
b reak
end
end
Al comparar estos resultados con los obtenidos en la tabla 3.4 (método de Gauss-Seidel
aplicado al sistema que aquÍ se resuelve), se observa que la convergencia es acelerada y
los cálculos se reducen a la mitad.
COMPARACiÓN DE LOS MÉTODOS DIRECTOS E ITERATIVOS
Una parte importante el análisis numérico es conocer las características (ventajas y des-
ventajas) de los métodos numéricos básicos que resuelven una familia de problemas (en
este caso A x =b), para así elegir el algoritmo más adecuado para cada problema.
A continuación se presentan las circunstancias donde pudiera verse como ventajosa la
elección de un método iterativo y también a qué se renuncia co.n esta decisión.
Tabla 3.6 Ventajas y desventajas de los métodos iterativos comparados con los métodos directos.
Ventajas
l. Probablemente más eficientes que los directos para
sistemas de orden muy alto.
2. Más simples de programar.
3. Puede aprovecharse una aproximación a la solución,
si tal aproximación existe.
4. Se obtienen fácilmente aproximaciones burdas de la
solución.
5. Son menos sensibles a los eITores de redondeo (valio-
so en sistemas mal condicionados).
6. Se requiere menos memoria de máquina. Generalmen-
te las necesidades de memoria son proporcionales al
orden de la matriz.
Desventajas
1. Si se tienen varios sistemas que comparten la matriz
coeficiente, esto no representará ahorro de cálculos ni
tiempo de máquina, ya que por cada vector a la dere-
cha de A tendrá que aplicarse el método seleccionado.
2. Aun cuando la convergencia esté asegurada, puede
ser lenta y, por tanto, los cálculos requeridos para ob-
tener una solución particular no son predecibles.
3. El tiempo de máquina y la exactitud del resultado de-
penden del criterio de convergencia.
4. Si la convergencia es lenta, los resultados debei] in-
terpretarse con cautela.
5. No se tiene ventaja particular alguna (tiempo de má-
quina por iteración) si la matriz coeficiente es simé-
trica.
6. No se obtiene A- I ni det A.
222 Métodos numéricos aplicados a la ingeniería
3.6 Valores y vectores propios
Si A es una matriz de números reales de orden n e 1 la matriz identidad de orden n, el po-
linomio definido por
peA) = det(A - Al) (3.110)
i
.1
se llama el polinomio característico de A.
Es fácil ver que p es un polinomio de n-ésimo grado en A con coeficientes reales," y
que, por tanto, la ecuación
peA) = O (3.111)
tiene n raíces, de las cuales algunas suelen ser complejas. Los ceros de esta ecuación, co-
nocidos como valores característicos o propios de A, están ligados con la solución del
sistema A x = b. Por ejemplo, el método de Gauss-Seidel, independientemente del vector
inicial que se emplee, converge a la solución de A x = b si y sólo si los valores propios de
B son todos menores de uno en valor absoluto."
f' " ,; ""1
'Ejemplo 3.41 Dada la siguiente matriz, encuentre sus valores propios Ejen
[~
-9
nA= -4
-1
Solución Se forma A - Al
A-Al= [~
-9
~l [~
O
~][T
-9
3~A]-4 -A 1 -4-A
-1 O -1
Se obtiene el determinante de este último arreglo
det (A - Al) = (4 - A)(-4 - A)(3 - A) -4 - 54 -
(2)(-4 - A)(l) - (-9)(2)(3 - A) - (6)(-1) (4 - A)
Al desarrollar e igualar con cero se obtiene
-A3 +3A2 -6A - 20 = O,
el polinomio característico de A, cuyos ceros Al' ~, A3 son los valores buscados.
El hecho de ser un polinomio cúbico con coeficientes reales garantiza una raíz real por
lo menos. Con el método de Newton-Raphson y un valor inicial de -2 se llega a
Al = -1.53968
El polinomio se degrada por división sintética
I
-1
-1.53968 .
3
1.53968
-6
-6.98965
-20
20
-1 4.53968 -12.98965 O
'Véase problema 3.59.
** J. N. Franklin, Matrix Theory. Prentice Hall, 1968.
po-
10)
,'y
11)
co-
del
tor
s de
por
Matrices y sistemas de ecuaciones lineales 223
El polinomio degradado es:
- A} + 4.53968A - 12.98965 = O,
de donde, por aplicación de la fórmula cuadrática se tiene
~ = 2.26984 + 2.799553 i
 = 2.26984 - 2.799553 i
Una vez obtenidos los valores propios de una matriz A de orden n, los vectores x "# O
que resuelven el sistema
A x = A¡ x, i = 1,2, ... , n
(3.112)
(A - Al) x = O
se denominan vectores propios de A correspondientes a A¡. Como det(A - A¡l) = OYel sis-
tema es homogéneo, se tiene un número infinito de soluciones para cada A¡.
Ejemplo 3.42 Encuentre los vectores propios de la matriz del ejemplo 3.41, correspondientes al valor
propio A¡ = -1.53968.
Al resolver el sistema por alguno de los métodos de eliminaciónSolución
[
4 - (-1.53968) - 9 2]
(A-A¡I)x= 2 -4-(-1.53968) 6
1 -1 3-(-1.53968)
resulta una matriz triangular superior, por lo menos con una fila de ceros.* Para asegurar
que esa(s) fila(s) de ceros sea(n) la(s) última(s) y que la sub matriz no singular resultante
esté lo mejor condicionada posible, se usa pivoteo total (intercambio de filas y columnas)
y escalamiento.
Sea entonces la matriz por triangularizar
=B
-9
- 2.46032
-1
Nótese que el vector de términos independientes no se emplea porque todos sus componen-
tes son cero.
En lugar de emplear la norma enclideana para el escalamiento, se usará ahora la si-
guiente norma, definida para un vector cualquiera y = [y¡, Y2"" Yn F, como
y = I Y I I + I Y2 I + .,. + I Y" I
ya que es más sencilla de calcular que la eucJideana y que para la primera, segunda y ter-
cera filas de A es, respectivamente,
[
16.53968]
10.46032
6.53968
• Pizar, M. S. Numerical Computing and Mathematical Analysis. S.R.A. (1975)
Matrices y sistemas de ecuaciones lineales 223
El polinomio degradado es:
- A} + 4.53968A - 12.98965 = O,
de donde, por aplicación de la fórmula cuadrática se tiene
~ = 2.26984 + 2.799553 i
A3 = 2.26984 - 2.799553 i
Una vez obtenidos los valores propios de una matriz A de orden n, los vectores x -:;:. O
que resuelven el sistema
A x = A¡ x, i = 1,2,.. . , n
(A - A 1) x = O
(3.112)
se denominan vectores propios de A correspondientes a A¡. Como det(A - A¡I) =OYel sis-
tema es homogéneo, se tiene un número infinito de soluciones para cada A¡.
Ejemplo 3.42 Encuentre los vectores propios de la matriz del ejemplo 3.41, correspondientes al valor
propio Al =-1.53968.
Solución Al resolver el sistema por alguno de los métodos de eliminación
[
4 - (- 1.53968) - 9
(A - Al!) x = 2 - 4 - (- 1.53968)
1 -1 3-C-1.t968l]
resulta una matriz triangular superior, por lo menos con una fila de ceros.* Para asegurar
que esa(s) fila(s) de ceros sea(n) la(s) última(s) y que la submatriz no singular resultante
esté lo mejor condicionada posible, se usa pivoteo total (intercambio de filas y columnas)
y escalamiento.
Sea entonces la matriz por triangularizar
-9
- 2.46032 = B
- 1
Nótese que el vector de términos independientes no se emplea porque todos sus componen-
tes son cero.
En lugar de emplear la norma enclideana para el escalamiento, se usará ahora la si-
guiente norma, definida para un vector cualquiera y = [yl' Y2" " Y" ]T, como
y = I YI I + IY2 I + .,. + I YI! I
ya que es más sencilla de calcular que la eucIideana y que para la primera, segunda y ter-
cera filas de A es, respectivamente,
[
16.53968]
10.46032
6.53968
• Pizar, M. S. Numerical Computing and Mathematical Analysis. S.R.A. (1975)
224 Métodos numéricos aplicados a la ingeniería
Cada fila de la matriz B se divide entre su factor de escalamiento y se obtiene:
[
0.33493
B' = 0.19120
0.15291
-0.54415
-0.23520
-0.15291
0.12092]
0.57360
0.69417
En el pivoteo total es necesario registrar los cambios de columnas que se verifican, ya que
éstos afectan el orden de las incógnitas. Para ello se utilizará un vector q, en donde apare-
cen como elementos las columnas. Al principlo están en orden natural y se tiene:
Se busca el elemento de máximo valor absoluto de B'. En este caso es b' 33 = 0.69417. Se
intercambian las filas 1 y 3, Y las columnas 1 y 3 para llevar este elemento a la posición
pivote (1, 1), teniendo cuidado de registrar los intercambios de columnas en q. Los resul-
tados son:
[
0.69417 -0.15291
B" = 0.57360 -0.23520
0.12092 -0.54415
0.15291]
0.19120 ,
0.33493
Se eliminan los elementos de la primera columna que están debajo del elemento pivote,
con lo cual se produce:
[
0.69417
B'" = 0.0
0.0 ~
-0.15291
-0.10885
-0.51751
0.15291
J
0.06485
0.30830
Se busca el elemento de máximo valor absoluto en las dos últimas filas; resulta ser b'" 3 2 =
-0.51751. Se intercambian las filas 2 y 3, y con esto se lleva a este elemento a la posición
pivote (2, 2). Los resultados son:
[
0.69417
B/v = 0.0
0.0
-0.15291
-0.51751
-0.10885
y q = [ ~] , y, que no hubo intercambio de columnas
0.15291]
0.30830
0.06485
Se eliminan los elementos de la segunda columna que están debajo del elemento pivote y
se produce
[
0.69417
BV = 0.00000
0.00000
-0.15291
-0.51751
0.00000
0.15291]
0.30830
-0.00000
una matriz triangularizada con una fila de ceros, la última como se planeó. La submatriz no
singular de la que se habló al principio está formada por los elementos (1, 1), (1, 2), (2, 1) Y
224 Métodos numéricos aplicados a la ingeniería
Cada fila de la matriz B se divide entre su factor de escalamiento y se obtiene:
[
0.33493
B' = 0.19120
0.15291
-0.54415
-0.23520
-0.15291
0.12092]
0.57360
0.69417
En el pivoteo total es necesario registrar los cambios de columnas que se verifican, ya que
éstos afectan el orden de las incógnitas. Para ello se utilizará un vector q, en donde apare-
cen como elementos las columnas. Al principIo están en orden natural y se tiene:
q=U]
Se busca el elemento de máximo valor absoluto de B' . En este caso es b'3,3 =0.69417. Se
intercambian las filas 1 y 3, Ylas columnas 1 y 3 para llevar este elemento a la posición
pivote (1, 1), teniendo cuidado de registrar los intercambios de columnas en q. Los resul-
tados son:
[
0.69417 -0.15291
B" = 0.57360 -0.23520
0.12092 -0.54415
0.15291~
0.19120 ,
0.33493
Se eliminan los elementos de la primera columna que están debajo del elemento pivote,
con lo cual se produce:
[
0.69417
B"' = 0.0
0.0 ~
-0.15291
-0.10885
-0.51751
0.15291
J
0.06485
0.30830
Se busca el elemento de máximo valor absoluto en las dos últimas filas; resulta ser b'" 3,2 =
- 0.51751. Se intercambian las filas 2 y 3, Ycon esto se lleva a este elemento a la posición
pivote (2, 2). Los resultados son:
[
0.69417
B/v = 0.0
0.0
-0.15291
-0.51751
-0.10885
y q = [ ~],ya qne no hnbo mtecc,,",bio de column"'.
0.15291]
0.30830
0.06485
Se eliminan los elementos de la segunda columna que están debajo del elemento pivote y
se produce
[
0.69417
BV = 0.00000
0.00000
-0.15291
-0.51751
0.00000
0.15291]
0.30830
-0.00000
una matriz triangulruizada con una fila de ceros, la última como se planeó. La submatriz no
singular de la que se habló al principio está formada por los elementos (1, 1), (l, 2), (2, 1) Y
ue
e-
Se
ión
ul-
te,
ey
no
) y
Matrices y sistemas de ecuaciones lineales 225
(2,2). Al escribir el sistema en términos de XI' x2 y x3
' y considerar los cambios de colum-
nas que hubo, se tiene
0.69417 x3 - 0.15291 x2 + 0.15291 xI = O
0.00000 x3 - 0.51751 x2 + 0.30830 Xl = O
Un sistema homogéneo de dos ecuaciones en tres incógnitas, cuyas infinitas soluciones
pueden obtenerse en términos de alguna de las incógnitas. El sistema se resuelve en térmi-
nos de XI
0.69417x3 - 0.15291 x2 = -0.15291 XI
0.00000 x3 - 0.51751 x2 = -0.30830 XI
de donde
X2 = 0.59573 XI
x3 = -0.08905 XI
Se da un valor particular a xl' por ejemplo XI = 1,y resulta
= [ ~.59753]
-0.08905
uno de los infinitos vectores propios de A correspondientes a Al'
Comprobación
Ya que por definición A x = Al X
[~ ~][
~.59573]
- 0.08905
= -1.53968 [, ~.59573]
-0.08905
-9
-4
-1
MÉTODO DE LAS POTENCIAS
El método de las potencias permite calcular el valor y el vector característicos dominantes
de una matriz A de orden n, cuando dicha matriz tiene n vectores característicos linealmen-
te independientes: vI' v2' ... VII Y un valor característico A¡ estrictamente dominante en
magnitud
I Al I > I Az I ~ I ~ I ~ ... ~ I AIl I
Se muestra a continuación dicho método.
Dada la independencia lineal de los vectores característicos, cualquier vector V de n
componentes puede expresarse como una combinación lineal de ellos:
Multiplicando la ecuación anterior por la izquierda por A se tiene:
Av = alAv¡ + a2Av2 + ... + a,,Avn
= al AIVJ + a2A2v2 + ... + anAnVn
Matrices y sistemas de ecuaciones lineales 225
(2,2). Al escribir el sistema en términos de xI' x2 y x3' y considerar los cambios de colum-
nas que hubo, se tiene
0.69417 x3 - 0.15291 x2 + 0.15291 xl = O
0.00000 x3 - 0.51751 x2 + 0.30830 Xl =O
Un sistema homogéneo de dos ecuaciones en tres incógnitas, cuyas infinitas soluciones
pueden obtenerse en términos de alguna de las incógnitas. El sistema se resuelve en térmi-
nos de Xl
de donde
0.69417x3 - 0.15291 x2 =-0.15291 Xl
0.00000 x3 - 0.51751 x2 = -0.30830 XI
X2 = 0.59573 Xl
X3= -0.08905 XI
Se da un valor particular a xl' por ejemplo XI =1, y resulta
= [~.59753]-0.08905
uno de los infinitos vectores propios de A correspondientes a Al '
Comprobación
Ya que por definición A x = Al X
[~
-9
-4
-1 [
~.59573]- 0.08905
=-1.53968 [ , ~.59573]- 0.08905
MÉTODO DE LAS POTENCIAS
El método de las potencias permite calcular el valor y el vector característicos dominantes
de una matriz A de orden n, cuando dicha matriz tiene n vectores característicos linealmen-
te independientes: vI' v2' .. . VII Y un valor característico Al estrictamente dominante en
magnitud
I A.I I > I íLz I ~ I ~ I ~ ... ~ I An I
Se muestra a continuación dicho método.
Dada la independencia lineal de los vectores característicos, cualquier vector V de n
componentes puede expresarse como una combinación lineal de ellos:
Multiplicando la ecuación anterior por la izquierda por A se tiene:
Av = alAvl + a2Av2 + ... + a,,Avn
= al A.IVI + a2A2V 2 + ... + anAnVn
226 Métodos numéricos aplicados a la ingeniería
Multiplicando repetidamente por A se llega a
Akv = alA/vI + a2Alv2 + ... + anA/Vn
y factorizando
Akv = Alk [ alvl + a2 ( ~ )2 + ... + «.(~~)n1
y como Al es el mayor, todos los términos dentro del paréntesis rectangular tienden a ce-
ro cuando k tiende a 00, excepto el primer término (si al *- O). Para k grande Akv "" A/al
VI'
Al tomar la relación de cualesquiera componentes correspondientes a Akv y Ak+IV, se
obtiene una sucesión de valores convergentes a Al' ya que
A/+lalvl
.
---",-,j ""A¡ (3.113)
A}a¡v¡,j
Además, la sucesión AI-kA kV convergirá al vector característico V I multiplicado por a t
Ejemplo 3.43 Encuentre el valor característico y el vector característico dominantes de la matriz coe-
ficiente del siguiente sistema, usando el método de las potencias
Solución Como generalmente no se conocen los vectores característicos, sino que ése es el propósi-
to, se empieza a iterar con v = el = [1 O O]T.
Primera iteración
Primero se calcula el producto A v
Ahora se calcula el producto A2 V
Se calcula el primero de los valores de la ecuación 3.113, utilizando el primer componen-
te de ambos productos
Al,l "" 5/1 = 5
Segunda iteración
Se calcula el producto A3 V
226 Métodos numéricos aplicados a la ingeniería
Multiplicando repetidamente por A se llega a
Akv = alA/vI + a2Alv2 + ... + anA/Vn
y factorizando
Akv = A¡k [ alv¡ + a2 ( ~ )2+ ... + an (~~ )n1
y como Al es el mayor, todos los términos dentro del paréntesis rectangular tienden a ce-
ro cuando k tiende a 00, excepto el primer término (si a¡ *- O). Para k grande Akv "" A/al VI'
Al tomar la relación de cualesquiera componentes correspondientes a Akv y Ak+IV, se
obtiene una sucesión de valores convergentes a Al' ya que
1 k+1 V
/,¡ al ¡,j
----,--------"'--""A¡
A}a¡v¡,j
(3.113)
Además, la sucesión Al-kAkV convergirá al vector característico V ¡ multiplicado por al'
IEjemplo 3.4~ Encuentre el valor característico y el vector característico dominantes de la matriz coe-
ficiente del siguiente sistema, usando el método de las potencias
Solución Como generalmente no se conocen los vectores característicos, sino que ése es el propósi-
to, se empieza a iterar con V =el =[1 OO]T.
Primera iteración
Primero se calcula el producto A v
Ahora se calcula el producto A2 V
Se calcula el primero de los valores de la ecuación 3.113, utilizando el primer componen-
te de ambos productos
Segunda iteración
Se calcula el producto A3 V
e-
VI'
se
3)
si-
en-
Matrices y sistemas de ecuaciones lineales 227
El nuevo valor de la ecuación 3.113 es:
AI,2 "" 13/5 = 2.6
Al continuar las iteraciones se obtiene:
k
1
2
3
4
5
6
7
8
9
10
5.00000
2.60000
3.15385
2.95122
3.01653
2.99452
3.00183
2.99939
3.00020
2.99993
El proceso converge al valor propio dominante A1
= 3. El lector puede repetir el proceso,
usando la segunda componente de cada producto Ak v.
Para encontrar uno de los vectores propios correspondientes a Al = 3, se usa la fórmu-
la A¡k Akv, resultando
VI = [9841.7 9841.3 O]T, que normalizado da VI = [1 1 O]T.
Debido a que Ak produce, por lo general, valores muy grandes o muy pequeños, conviene
normalizar los productos Ak ven cada iteración, dividiendo cada elemento del vector en-
tre el elemento de máximo valor absoluto de dicho vector.
Los cálculos pueden realizarse con el siguiente guión de Matlab, en el que se obtiene
la ecuación 3.113 con el elemento de máximo valor del segundo producto Ak v obtenido
en cada iteración.
A=[l 2 0;2 1 0;0 O -1};
v= [1; O; O};
Dist=l;R=O
Eps=le-5;K=0;
while Dist>Eps
K=K+1;
X=A-N'v;
Y=A- (K+1)*v;
[Z,I}=max(Y) ;
Rl=Y(I)/X(I) ;
fprintf(' %2d %10_5fn' ,K,R)
Dist=abs (Rl-R) ;
R=Rl;
end
v1=A-¡0'v/R
Matrices y sistemas de ecuaciones lineales 227
El nuevo valor de la ecuación 3.113 es:
AI.2 "'" 13/5 = 2.6
Al continuar las iteraciones se obtiene:
k A.t,k
1 5.00000
2 2.60000
3 3.15385
4 2.95122
5 3.01653
6 2.99452
7 3.00183
8 2.99939
9 3.00020
10 2.99993
El proceso converge al valor propio dominante AJ = 3. El lector puede repetir el proceso,
usando la segunda componente de cada producto Ak v.
Para encontrar uno de los vectores propios correspondientes a Al =3, se usa la fórmu-
la A¡kAkv, resultando
V I =[9841.7 9841.3 O]T, que normalizado da v I =[1 1 O]T.
Debido a que Ak produce, por lo general, valores muy grandes o muy pequeños, conviene
normalizar los productos Ak v en cada iteración, dividiendo cada elemento del vector en-
tre el elemento de máximo valor absoluto de dicho vector.
Los cálculos pueden realizarse con el siguiente guión de Matlab, en el que se obtiene
la ecuación 3.113 con el elemento de máximo valor del segundo producto Ak v obtenido
en cada iteración.
A= [l 2 0; 2 1 0; 0 O -1} ;
v= [1 ; O; O} ;
Dis t=l ; R=O
Eps=le-5; K=0;
while Dist>Eps
K=K+1 ;
X=A-K'v;
Y=A - (K+1)*v ;
[Z , I}=max(Y) ;
Rl=Y (I ) / X(I) ;
fprintf (' %2d %10. 5fn ' , K, R)
Dist=abs (Rl - R) ;
R=Rl ;
end
v1=A -i0'v/R
228 Métodos numéri cos aplicados a la ingeniería
Ejercicios
~ 3.1 En una columna de cinco platos, se requiere absorber benceno contenido en una corriente de
gas V, con un aceite L que circula a contracorriente del gas. Considérese que el benceno trans-
ferido no altera sustancialmente el número de moles de V y L fluyendo a contracorriente, que
la relación de equilibrio está dada por la ley de Henry (y = mx) y que la columna opera a ré-
gimen permanente. Calcule la composición del benceno en cada plato.
Datos: V = 100 moles/min; L = 500 moles/mino
Yo = 0.09 fracción molar de benceno en V.
X
o = 0.0 fracción molar de benceno en L (el aceite entra por el domo sin ben-
ceno).
m = 0.12
Solución Los balances de materia para el benceno en cada plato son (véase Fig. 3.13).
V
•..
Ys
L---
l
X
o ,
Fig. 3.13
Columna de
absorción de
cinco platos. Yo
228
Ejercicios
~ 3.1
Métodos numéricos aplicados a la ingeniería
En una columna de cinco platos, se requiere absorber benceno contenido en una cOlTÍente de
gas V, con un aceite L que circula a contracorriente del gas. Considérese que el benceno trans-
ferido no altera sustancialmente el número de moles de V y L fluyendo a contracorriente, que
la relación de equilibrio está dada por la ley de Henry (y =mx) y que la columna opera a ré-
gimen permanente. Calcule la composición del benceno en cada plato.
Datos: V = 100 moles/min; L = 500 moles/mino
Yo = 0.09 fracción molar de benceno en V.
X
o= 0.0 fracción molar de benceno en L (el aceite entra por el domo sin ben-
ceno).
m = 0.12
Solución Los balances de materia para el benceno en cada plato son (véase Fig. 3.13).
Fig. 3.13
Columna de
absorción de
cinco platos.
L- ------,¡
X
o ,
~Yo
V
...
Ys
I
~X I
Matrices y sistemas de ecuaciones lineales 229
Plato Balance de benceno
ede
5 L (xo - xs) + V (Y4 - Ys) = O
s- 4 L (xs - x4) + V (Y3 - Y4) = O
que
3 L (x4 - x3) + V (Y2 - Y3) = Oaré-
2 L (x3 - x2) + V (YI - Y2) = O
L (x2 - Xl) + V (yo - Y¡) = O
ben-
Al sustituir la información que se tiene, las consideraciones hechas y rearreglando las
ecuaciones, se llega a:
512 X
s +
500 X
s
+ 12 XI
+ 512 XI
O
O
O
O
9
12 x3
512 x3 +
500 x3
12 x2
512 x2
500 x2
Con el PROGRAMA 3.2 del CD, se obtienen los siguientes resultados
X
2
= 4.32 X 10--4,
X
s = 5.8286 X 10-9,
Xl = 0.018,
x4
= 2.4869 X 10-7,
~~ 3.2
También pueden usarse las instrucciones en Matlab dadas en el ejemplo 3.28, con los cam-
bios apropiados en los datos.
Supóngase que se tiene una estructura cuadrada. A fin de analizarla se forma una malla
imaginaria sobre dicha estructura, como se muestra en la figura siguiente.
o o )
o o )
Figura 3.14
Estructura
cuadrada.
y se numeran los nodos, por ejemplo, como se muestra a continuación.
4 8 12 16
3 7 11 15
2 6 10 14
1 5 9 13
Cada nodo se identifica con a; por ejemplo, el 4 con al ' el 6 con a32, etc., y así quedat.] "
formada una matriz A representativa de la estructura.
230 Métodos numéricos aplicados a la ingeniería
Ciertas consideraciones de ingeniería determinan que ai,j *- O siempre que los nadas i
y j sean vecinos o adyacentes." Para aclararlo, hay que observar que al nodo 5 le corres-
ponde a4,2' Ycomo los nadas 4 y 2 no son vecinos a4,2 = O; al 11 en cambio le correspon-
de a23 y como 2 y 3 son vecinos, a23 *- O. Por último a33
*- O, ya que el nodo 3 puede
considerarse vecino consigo mismo. ' ,
Estas consideraciones generan matrices o sistemas dispersos o frecuentemente ban-
deados. Estos sistemas suelen ser muy grandes, ya que las mallas se construyen con un
gran número de nadas.
En la aplicación del método de las rigideces," para calcular los desplazamientos en
los nadas de una estructurada dada al aplicarse una carga en uno de los nadas, se obtiene
el siguiente sistema de ecuaciones:
3.01687 0.00000 3.3750 -3.0000 0.00000 0.0000 dxB 1600
0.00000 3.01687 3.3750 0.0000 -0.01687 3.3750 dyB 0.00
105
3.37500 3.37500 900.00 0.0000 -3.37500 450.00 eB 0.00
¡p""
-3.00000 0.00000 0.0000 3.0400 0.00000 6.0000 dxe 0.00
II 0.00000 -0.01687 -3.3750 0.0000 4.01687 -3.3750 dye 0.00
0.00000 3.37500 450.00 6.0000 -3.37500 2100.0 ee 0.00
donde la matriz coeficiente es conocida como la matriz de nadas, dB = [dxB dyb eB]T y de =
[dxe dye edT
son los vectores de desplazamiento de los nadas By C, respectivamente. Re-
suelva dicho sistema.
Solución La solución obtenida con el PROGRAMA 3.2 del CD o con Matlab, se da a continuación
dxB = 0.47185;
dxc = 0.46776;
dyB = 0.00259;
dyC
= -0.00194;
eB = -0.00125
ec = -0.00108
~ 3.3 Determine las concentraciones molares de una mezcla de cinco componentes en solución
a partir de los siguientes datos espectrofotométricos.
Longitud Absorbancia molar del componente Absorbancia
de onda j total
1 2 3 4 5 observada
1 98 9 2 1 0.5 0.1100
2 11 118 9 4 0.88 0.2235
3 27 27 85 8 2 0.2800
4 1 3 17 142 25 0.3000
5 2 4 7 17 118 0.1400
Asúmase que la longitud de la trayectoria óptica es unitaria y que el solvente no absorbe
a estas longitudes de onda.
Solución Si se considera que se cumple la ley de Beer, entonces a una longitud de onda dada, i
, El nodo 7, por ejemplo, tiene como vecinos a los nadas 3, 6, 8 Y 11.
" Carlos Magdalena. Análisis matricial de estructuras reticulares. Edición mimeográfica. ES lA, lPN.
Matrices y sistemas de ecuaciones lineales 231
donde:
ATOTi
es la absorbancia total observada a la longitud de onda i.
c¡.j es la absorbancia molar del componente j a la longitud de onda i.
ej
es la concentración molar del componente j en la mezcla.
Al sustituir los valores de la tabla se obtiene
98 el + 9 e, + 2 e3 + c4 + 0.5 es 0.1100
n
11 el + 118 e2 + 9 e3 + 4 e, + 0.88 es 0.2235
e 27 el + 27 e2 + 85 e, + 8 e, + 2 es 0.2800
el + 3 e2 + 17 e3 + 142 C, + 25 es 0.3000
z c, + 4 e2 + 7 e3 + 17 e, + 118 es 0.1400
Un sistema de ecuaciones lineales con matriz coeficiente dominante. Esto sugiere resolver
el sistema con el método de Gauss-Seidel.
El PROGRAMA 3.3 del Cl) utiliza el método de Gauss-Seidel para resolver un sistema
de ecuaciones lineales. Este programa se utilizó con el vector cero como vector inicial, por
la relativa cercanía de cero con cada uno de los valores del lado derecho del sistema. Los
resultados obtenidos son
e- el = 0.000910
C, = 0.001664
e2
= 0.001569
es= 0.000740
W1~ 3.4 Determine la intensidad de corriente en cada rama del circuito que se muestra en la figu-
ra 3.15.
in
Solución Se asigna un sentido y una letra a cada magnitud desconocida; los sentidos supuestos son
enteramente arbitrarios. Hay que observar que la intensidad de corriente en R3, RI YEl es
la misma y, por consiguiente, sólo se requiere una letra. Lo mismo ocurre para la intensi-
dad de corriente en R2
, E2
Y R6. Los nodo s (puntos de la red en los cuales se unen tres o
más conductores) se designan con las letras a, b, e, d.
e,», E2
,r2
R¡ a R2
i¡ ___
i3
---
i,l-- Es,rs
R3 b R4 Rs d R6
~i¡
i4---
e
•• is --- i3
Figura 3.15
Circuito
eléctrico con
resistencias y
fuentes de
poder.
i6 ---
232 Métodos numé ricos aplicados a la ingeniería
Aplicación de la regla de los nodos de Kirchhoff a tres nadas cualesquiera
Nodo L i =0
a il + i2 - i3 =0
b - il - i4 - i6 =0
C i4 + is - i2 =0
Si bien es cierto que hay un nodo más, el d, la aplicación de la regla daría una ecuación li-
nealmente dependiente de las otras tres, esto es:
Nodo d
ecuación que se obtiene sumando las tres primeras; por ello resulta redundante y en gene-
ral se aplica dicha regla a n-l nadas solamente.
En la figura 3.16 se representa el circuito cortado en mallas. Considérese en cada ma-
lla como positivo el sentido de las agujas del reloj. La regla de las mallas de Kirchhoff (L
E, = L ik
R, ) proporciona las siguientes ecuaciones:
Malla
1
11
III
L Ek = L ik Rk
-E¡ - Es = ilRI + i¡ r¡ - i2 rs - i4 R4 + il R3
E2 + Es = i3r2 + i3 R2 + i3 R6 + is R, + i2 rs
E4 = i4R4 - is Rs - i6 r4 - i6 R7
~
---R, El'r, E2,r2 R2
i,
---
,:IE,>', ar:i
i3
---
• •R3 R4 Rs R6
e e
~ i, b i4
--- ~ is d ~ i3
R4 e Rs d
b i4 ___
~ is
Figura 3.16
Circuito de la
figura 3.15
cortado en
mallas.
Se tienen ecuaciones independientes, donde conocidas las Rk' las Ek y las rk' se pueden
calcular las seis intensidades de corriente resolviendo el sistema. Para los siguientes da-
tos, calcule las intensidades de corriente.
Matrices y sistemas de ecuaciones lineales 233
k Ek (volts) r, (Q) Rk(Q)
1 12 0.1 25
2 10 0.5 40
3 16
n li- 4 12 0.5 20
5 24 0.2 9
6 4
7 20
Con el PROGRAMA 3.2 del CD se obtienen los siguientes valores para las intensidades de
corriente
k 1 2 3 4 5 6
-0.53811 0.65531.1934 0.68226 0.51115 -0.14415
3.5 Con los datos del diagrama siguiente (donde los porcentajes están dados en peso), encuen-
tre posibles valores de las corrientes M" M2, M3 YM4.
M {83% etanol
, 17% agua
Tanque de
mezclado {
58% etanol
1----· M4 21 % metanol
21% agua
M {61% metanol
2 39% agua
{
24% metanol
M3 55% etanol
21% agua
Solución Mediante balances de materia por componente y global, se tiene
Componente Balance de materia
Etanol 0.83 M, + + 0.55 M3 0.58 M4 O
Metanol 0.61 M2 + 0.24 M3 0.21 M4 O
Agua 0.17 M, + 0.39 M2 + 0.21 M3 0.21 M4 O
Global M·
+ M2 + M3 M4 O,
l. Hay que observar que sólo se tienen tres ecuaciones linealmente independientes, pues la
ecuación del balance global de materia es la suma de las otras tres. Por ser el sistema ho-
mogéneo es consistente, y como el rango de la matriz coeficiente es menor que el número
de incógnitas, el sistema tiene un número infinito de soluciones. Fijando una base de cálcu-
lo, por ejemplo M4 = 100Kg, se obtiene el sistema:
234 Métodos numéricos aplicados a la ingeniería
0.83 M¡
O.17M¡
0.61 M2
+ 0.39 M2
+ 0.55 M3
+ 0.24 M3
+ 0.21 M3
58
21
21
cuya solución se deja al lector, utilizando alguno de los programas vistos.
Un granjero desea preparar una fórmula alimenticia para engordar ganado. Dispone de
maíz, desperdicios, alfalfa y cebada, cada uno con ciertas unidades de ingredientes nutri-
tivos, de acuerdo con la tabla siguiente
UNIDADESDEINGREDIENTESNUTRITIVOSPORkg DECADAALIMENTODISPONIBLE
ALIMENTO
Ingrediente Requerimiento diario
nutritivo Maíz Desperdicio Alfalfa Cebada Unidades / kg
Carbohidrato 80 15 35 60 230
Proteína 28 72 57 25 180
Vitaminas 20 20 12 20 80
Celulosa 50 10 20 60 160
Costo $ 18 5 7 20
a) Determine los kilogramos necesarios de cada material para satisfacer el requeri-
miento diario (presentado en la última columna).
b) Determine el costo de la mezcla
NOTA:La fórmula alimenticia debe contener los cuatro alimentos.
Solución Si se llama Xl a los kg de maíz necesarios, x210s de desperdicio, ... , se tiene
80x¡
28 Xl
20xI
50xI
+ 15 x2 + 35 x3
+ 60 x4
+ 72 x2 + 57 x3
+ 25 x4
+ 20x2 + 12x3 + 20x4
+ 10 x2 + 20 x3 + 60 x4
230
180
80
160
Con el PROGRAMA3.2 del CD o con Matlab se obtiene:
Xl = 1.8524, x2
= 1.0318, x3
= 0.6178, x4
= 0.745
De donde el costo de la mezcla es:
Costo = 18*1.8524 + 5*1.03 + 7*0.61 + 20*0.745 = $ 57.66
3.7 En un sistema monofásico en equilibrio químico existen los siguientes compuestos: CO,
H2' CH30H, H20 Y C2H6
· Calcule el número de reacciones químicas independientes.
Se establece la matriz atómica listando los compuestos como cabezas de columna y los
átomos como inicio de filas, de tal modo que la intersección muestre el número de átomos
del compuesto correspondiente.
Solución
o
Matrices y sistemas de ecuaciones lineales 235
Compuesto
Átomo CO H2 CH30H HzÜ C2H6
C 1 O 1 O 2
H O 2 4 2 6
e a 1 O 1 1 O
Si N es el número de compuestos en equilibrio químico, R el número de reacciones inde-
pendientes, se tiene la siguiente relación discutida por Jouguet, Brinkey y otros"
R=N-C
donde C es el rango de la matriz atómica.
Para encontrar el rango se utilizará el método de ortogonalización de Gram-Schmidt,
aplicado a las columnas de la matriz atómica. Para esto, llámense xl' x2' ... Xs las colum-
nas ca, H2,··· , C2H6.
Por tanto:
Nótese que como x2 es ortogonal a xl' el proceso da e2 = Xz.
y
o,
los
os .,
* Jouguet, J. Ec. Polyt. París, 2, 62 (1921); Prigogine and Defay. J. Chem. Phys 15,614 (1947).
I ,~,,¡~------------------------------------------------------------------------------------------------~ ..
236 Métodos numéricos aplicados a la ingeniería
Por tanto
e,~ m -(1) m -(2) m-m
Esto indica que x3 es linealmente dependiente de x¡ y x2. Continuando el proceso de orto-
gonalización, pero sin tomar en cuenta a e3
, se tiene:
Fi~
Siste
1
2
Por tanto
e,~ m ~ m -(1) m [~~1
Como el número de filas de la matriz atómica es 3, el máximo número de vectores lineal-
mente independientes es 3 y como ya se ha encontrado que x ¡, x2
Y x4
son linealmente in-
dependientes, X
s es necesariamente dependiente de x ¡, x2 Y x4 Y es debe ser el vector cero
(demostración que se deja al lector como ejercicio); entonces, el rango de la matriz atómi-
ca es 3.
Al aplicar la fórmula
se tiene que el número de reacciones independientes para llegar al sistema en equilibrio
químico mencionado es 2.
Los cálculos pueden hacerse con Matlab usando el guión del ejemplo 3.23.
3.8 Analicemos las características de la vibración libre no amortiguada del sistema de tres
grados de libertad mostrado en la figura 3.17. El sistema consta de tres masas mI' m2 y
m3
, conectadas mediante los tres resortes mostrados, siendo sus constantes elásticas k.. k2
y k3' Los desplazamientos de las masas se definen mediante las coordenadas generaliza-
das xl' x2 y x3' respectivamente, estando medido cada desplazamiento a partir de la posi-
ción de equilibrio estático de la masa respectiva.
Utilizando ya sea las ecuaciones de Lagrange o bien la segunda ley de Newton, se en-
cuentra que las ecuaciones diferenciales de movimiento del sistema son:
m¡x;' + (k¡ + k2)x¡ - kr2 = O
m2x{ - kr¡ +(k2 + k3)x2 - k3x3 = O
m3x; - k3x2 + k3x3 = O
(1)
236 Métodos numéricos aplicados a la ingeniería
Por tanto
e3~ m- (1) m-(2) mm
Esto indica que x3 es linealmente dependiente de x¡ y x2. Continuando el proceso de orto-
gonalización, pero sin tomar en cuenta a e3, se tiene:
Por tanto
1
2
Como el número de filas de la matriz atómica es 3, el máximo número de vectores lineal-
mente independientes es 3 y como ya se ha encontrado que x¡, x2 y x4 son linealmente in-
dependientes, Xs es necesariamente dependiente de x¡, x2 Y x4 Yes debe ser el vector cero
(demostración que se deja al lector como ejercicio); entonces, el rango de la matriz atómi-
ca es 3.
Al aplicar la fórmula R = N - C = 5-3 = 2
se tiene que el número de reacciones independientes para llegar al sistema en equilibrio
químico mencionado es 2.
Los cálculos pueden hacerse con Matlab usando el guión del ejemplo 3.23.
3.8 Analicemos las características de la vibración libre no amortiguada del sistema de tres
grados de libertad mostrado en la figura 3.17. El sistema consta de tres masas m!, m2 y
m3, conectadas mediante los tres resortes mostrados, siendo sus constantes elásticas kl' k2
y k3. Los desplazamientos de las masas se defmen mediante las coordenadas generaliza-
das xl' x2 y x3, respectivamente, estando medido cada desplazamiento a partir de la posi-
ción de equilibrio estático de la masa respectiva.
Utilizando ya sea las ecuaciones de Lagrange o bien la segunda ley de Newton, se en-
cuentra que las ecuaciones diferenciales de movimiento del sistema son:
m¡x;' + (k¡ + k2)x¡ - kzX2 = O
m2x{ - kzXl +(k2 + k3)x2 - k3x3 = O
m3x~ - k3x2 + k3x3 = O
(1)
orto-
neal-
te in-
cero
tórni-
ibrio
posi-
een-
(1)
Matrices y sistemas de ecuaciones lineales 237
mi =m2=m3= 1.0 Kg s-/m
kl = k2 = k3 = 10 Kg/m
Figura 3.17
Sistema de tres
grados de
libertad. X3
Sabemos, de la teoría de las vibraciones, que la solución del sistema de ecuaciones (1) se
puede escribir en la forma:
XI =XI senpt
x2 = X2 sen pt (2)
x3
= X3 senpt
En donde Xi' X2 y X3
son las amplitudes del movimiento de las masas respectivas, y p de-
nota las frecuencias circulares naturales que corresponden a los modos principales de vi-
bración del sistema.
Sustituyendo la ecuación 2 y las derivadas correspondientes a esas expresiones en la
ecuación 1, Y utilizando los valores de masas y de constantes elásticas mostrados en la fi-
gura 3.17, obtenemos el siguiente conjunto de ecuaciones algebraicas homogéneas:
lOX2
+ (20 - p2)X2
-lOX2
o
O
O
(3)
Para obtener una solución distinta de la trivial de la ecuación 3, el determinante de la
matriz coeficiente del sistema, debe ser igual a cero, de manera que
-lO
(20 _ p2)
-10
(4)
El desarrollo de este determinante resulta en el polinomio característico
p6 _ 50p4 + 600 p2 - 1000 = O (5)
que se puede escribir como ecuación cúbica en p2, de la forma
(P2)3 _ 50(P2)2 + 600 p2 - 1000 = O (6)
Se encuentra que las raíces de la ecuación 6 son:
p? = 1.98 seg?
pf = 1.98 seg-I
pl = 32.5 seg?
Estos valores característicos son los cuadrados de las frecuencias circulares del primero,
segundo y tercer modos de vibración del sistema, respectivamente.
Como la ecuación 3 constituye un conjunto homogéneo de ecuaciones simultáneas, no
se puede obtener un conjunto único de valores para Xi' X2 y Xy Sin embargo, se pueden
Figura 3.17
Sistema de tres
grados de
Matrices y sistemas de ecuaciones lineales 237
m) =m2 =m3 = I.OKgs2/m
k) =k2 =k3 =10 Kg/m
libertad. X3
Sabemos, de la teoría de las vibraciones, que la solución del sistema de ecuaciones (1) se
puede escribir en la forma:
x ) = X ) senpt
x2 =X2 senpt
x3 =X3 senpt
(2)
En donde X) ' X2 y X3 son las amplitudes del movimiento de las masas respectivas, y p de-
nota las frecuencias circulares naturales que corresponden a los modos principales de vi-
bración del sistema.
Sustituyendo la ecuación 2 y las derivadas correspondientes a esas expresiones en la
ecuación 1, Y utilizando los valores de masas y de constantes elásticas mostrados en la fi-
gura 3.17, obtenemos el siguiente conjunto de ecuaciones algebraicas homogéneas:
lOX2
+ (20 - p2)X2
-lOX2
o
O
O
(3)
Para obtener una solución distinta de la trivial de la ecuación 3, el determinante de la
matriz coeficiente del sistema, debe ser igual a cero, de manera que
O-10
(20 _ p2) - 10 =0
-10 (lO - p2)
El desarrollo de este determinante resulta en el polinomio característico
p6 _ 50p4 + 600 p2- 1000 = O
q.le se puede escribir como ecuación cúbica en p2, de la forma
(p2)3 _ 50(p2)2 + 600 p2 - 1000 = O
Se encuentra que las raíces de la ecuación 6 son:
p)2 = 1.98 seg-2
pi = 1.98 seg-I
pI =32.5 seg-2
(4)
(5)
(6)
Estos valores característicos son los cuadrados de las frecuencias circulares del primero,
segundo y tercer modos de vibración del sistema, respectivamente.
Como la ecuación 3 constituye un conjunto homogéneo de ecuaciones simultáneas, no
se puede obtener un conjunto único de valores para Xi' X2 y X3. Sin embargo, se pueden
,4
238 Métodos numéricos aplicados a la ingeniería
determinar varias relaciones para las amplitudes, que proporcionarán la configuración del
sistema para los diferentes modos de vibración cuando se define una amplitud unitaria pa-
ra cualquiera de las masas. Por ejemplo, sustituyendo pf = 1.98 en la ecuación 3 se obtie-
ne la siguiente configuración para el primer modo
X2
= 1.80 XI
X3 = 2.25 XI
primer modo (7)
En forma similar, las configuraciones del segundo y tercer modos, utilizando p:f = 15.5 y
Pf = 32.5, respectivamente, son
X2
= 0.45 XI
} segundo modo (8)
X3 =-0.80 XI
X2
=-1.25 XI
} tercer modo (9)
X3 =0.555 XI
Se puede ver en las tres últimas ecuaciones que si la amplitud de cualquiera de las masas
se conoce o se supone para un modo particular de vibración, se puede determinar la con-
figuración del sistema para ese modo. Como las ecuaciones 7 a 9 consisten en relaciones
de amplitudes Xi' la substitución de la ecuación 2 en estas ecuaciones indica que las rela-
ciones mostradas son también las relaciones de los desplazamientos. Por ejemplo, cuando
mI tiene un desplazamiento de 1 cm y el sistema está vibrando en el segundo modo, los
desplazamientos correspondientes de m2
y m3
serán 0.45 cm y 0.80 cm, respectivamente,
y el movimiento de 1n3 estará 180 o fuera de fase con el de mI. Se puede agregar aquí que
la configuración de un sistema, dada por las relaciones mostradas arriba, define también
los desplazamientos iniciales que se tendrían que dar a las masas para que el sistema vi-
brara en el modo asociado con esa configuración, sin que estuvieran presentes otros armó-
nicos como cuando el sistema se suelta a partir del reposo.
Problemas
3.1 Elabore un algoritmo general para sumar y restar matrices.
3.2 Con el algoritmo del problema anterior, elabore uno de propósito general para sumar y res-
tar matrices.
3.3 Demuestre, partiendo de la definición del producto de una matriz por un escalar, las ecua-
ciones 3.7, 3.8 y 3.10.
3.4 Demuestre la ecuación 3.12, utilizando la definición de multiplicación de matrices.
3.5 Con el programa 3.1 del disco multiplique las siguientes matrices
l~
O O
~lll~4
Iq1 O 8
O 1 12
O O 15 16 17
l~
3 4
;] U
3 O
~l6 7 0.2 -1
O 5 4 5
O O 9 3 -2
Matrices y sistemas de ecuaciones lineales 239
n del
l~
O O
~J U
2 3
¡~lapa- O 1 6 7
btie- 1 O 10 11
O O 14 15 16
(7)
[-~l m5.5 y
[01234] [3 8 -2 5 1]
(8)
l¡; 4
¡~J l~
O O
~J
8 1 O
12 O 1
(9) 15 16 17 O O
3.6 La siguiente tabla representa las existencias en bodega de una agencia de refacciones pa-
asas ra automóviles.
con-
MARCA
Refacción M1 M2 M3 M4 MS M6
Rl 5 13 23 8 15 98
R2 16 45 11 54 10 86
R3 34 22 77 21 65 2
ó- R4 21 19 83 2 16 37
R5 8 97 69 27 14 3
En la siguiente tabla se dan los precios unitarios correspondientes a las refacciones de arriba.
MARCA
Yres- Refacción M1 M2 M3 M4 MS M6
ecua- R1 65000 73450 82500 71245 62350 76450
R2 3400 3560 2560 5790 4700 5000
R3 12500 13450 16400 15600 11650 9500
R4 895 940 780 950 645 1000
R5 5350 7620 6700 3250 5890 7000
Determine la inversión en bodega de la agencia.
3.7 Responda las siguientes preguntas.
a) ¿Una matriz no cuadrada puede ser simétrica?
b) ¿Una matriz diagonal es triangular superior, triangular inferior o ambas?
e) ¿Una matriz diagonal tiene inversa con uno de sus elementos de la diagonal princi-
pal igual a cero?
240 Métodos numéricos aplicados a la ingeniería
3.8 Multiplique una matriz permutadora (seleccione una cualquiera) por sí misma y observe el
resultado. Generalice dicho resultado.
Demuestre las ecuaciones 3.15, 3.16 Y3.17.
Obtenga la ecuación 3.21 a partir de la ley de los cosenos.
Elabore un algoritmo tal que, dados dos vectores de igual número de componentes, se de-
termine e imprima la norma euclideana de estos vectores, su producto punto, el ángulo que
guardan entre ellos y la distancia que hay entre ambos.
Codifique el algoritmo del problema 3.11 y verifique este programa con las siguientes pa-
rejas de vectores
3.9
3.10
3.11
3.12
a)
m·m b) l~lUl e) ltJ liU0
3.13 El teorema 3.1 puede y debe emplearse también para ortogonalizar un conjunto de m vec-
tores linealmente independientes de n componentes cada uno, con m < n. Por otro lado, de-
muestre con el teorema mencionado, que cualquier conjunto de n vectores linealmente
independientes con n componentes cada uno da como resultado un conjunto linealmente de-
pendiente al adicionársele un vector xn+ I de n componentes.
NOTA: Use como motivación algunos casos particulares sencillos: por ejemplo, a un conjunto
particular de dos vectores lineal mente independientes con dos componentes cada uno,
añada un tercer vector y aplique la ortogonalización al conjunto resultante.
3.14 Elabore una subrutina de propósito general para ortogonalizar un conjunto de m vectores
linealmente independientes de n componentes cada uno (m < n) con el método de Gram-
Schmidt.
NOTA: Puede usar el algoritmo 3.2 como base.
3.15 Con la subrutina del problema 3.14 ortogonalice los siguientes conjuntos de vectores.
a)
1 -2 3 7 5
-2 1 0.8 -3 4
5 7 4 5 3
XI =
7 ' x2 =
3
x3 =
15
x4 =
3.2
Xs =
1
8 12 3 9 7
0.3 O 2 40 8
b)
m [~l mXI= , x2 = x3 =
e)
x,= HJ .x,=
D]x3 =
[;~J
eel
de-
que
pa-
Matrices y sistemas de ecuaciones lineales 241
3.16 Modifique el programa del problema 3.14 de modo que:
a) Dado un conjunto cualquiera de m vectores de n componentes cada uno tm-cn), se
vayan ortogonalizando los linealmente independientes y se descarte los que resulten
lineal mente dependientes.
b) Imprima el número de vectores linealmente independientes del conjunto denotando
este número como rango del conjunto.
Corra el programa para determinar el rango de las siguientes matrices o conjuntos de vec-
tores columna
-~J
vec-
, de-
ente
e de-
3.17
3.18
lores
ram-
1 -5
3 20
3 5
1-5] [103 20 , -20
355
Calcule el número de reacciones independientes en una reacción de pirólisis, en la cual se
encuentran en equilibrio los siguientes compuestos 02' H2, CO, CO2' H2C03, CH30H,
C2HsOH, (CH3)2 CO, CH4, CH3
CHO Y H20.
Dada una matriz A de orden n, los términos
a) Matriz singular (det A =0)
b) Rango A < n
e) Los vectores columna o fila de A son lineal mente dependientes
están estrechamente relacionados.
Demuestre que a) implica tanto b) como e).
3.19 ¿La coincidencia del número de incógnitas con el número de ecuaciones en un sistema de
ecuaciones lineales implica que éste tiene solución única? Justifique su respuesta.
3.20 Dado el siguiente sistema de ecuaciones, encuentre dos valores de w que permitan tener
solución única y diga qué valores de w permiten un número infinito de soluciones.
3.21 Si la matriz coeficiente del sistema A x = O es tal que det A = O; ¿dicho sistema tiene por
ese hecho un número infinito de soluciones?
3.22 El método de eliminación de Gauss usualmente hace la transformación conocida como
triangularización.
[f' a>,4Ja 24, .
a 3,4
a'¡ 2
, ,
a 2,2
O
a'¡ 3
, ,
a? 3
,-'
a 3,3
En estas condiciones, una sustitución hacia atrás permite obtener la solución. Las ecuacio-
nes 3.49 y 3.50 constituyen el algoritmo para el caso general.
242 Métodos numéricos aplicados a la ingeniería
-
Encuentre las ecuaciones correspondientes para resolver el sistema A x= b, pero ahora lle-
vando a cabo la transformación.
[
a:¡,¡
a 21
l'
a 3,¡
o O
a' 22 O
l'
a 3,2 a3,3
a:¡,4]
a 24
l'
a 3,4
y posteriormente una sustitución hacia delante.
3.23 Modifique el algoritmo 3.4, de modo que una vez encontrado el elemento pivote e inter-
cambiadas las filas (si procede), se divida la fila pivote entre el elemento pivote. En el ca-
so de un sistema de orden 3, el resultado en la triagularización sería
y, por tanto, en la sustitución regresiva no se tendría que dividir entre los coeficientes de
las incógnitas.
Por otro lado, para el cálculo del determinante deben guardarse los pivotes para su empleo
en la expresión
Elabore un algoritmo para resolver un sistema de ecuaciones A x = b usando la elimina-
ción de Jordan.
Calcule el número de multiplicaciones, divisiones o ambas y la cantidad de sumas, restas
o ambas que se requieren para resolver un sistema tridiagonal por el método de Thomas.
Determine también las necesidades de memoria para este algoritmo.
Utilice el subprograma que se da en el ejercicio 8.2 del capítulo 8 para resolver los siguien-
tes sistemas
[~
1'11
11
11
detA = (-1)" Il a
i=l 1,1
SUGERENCIA: Vea el PROGRAMA 3.1 del CD.
3.24
3.25
lIi!JI 3.26
a) 0.5 XI + 0.25 x2
0.3 x¡ + 0.8 x2 + 0.4 x3
0.2 x2 + x3 + 0.6x4
x3 3 x4
b) XI x2
1
2xI x2 + 3 x3 8
x2 + x3 4
e) 4x¡ + x2
-8 x¡ x2 + x3
3 x2 2x3 + 4x4
x3 x4 + Xs
2x4 + 6 Xs
0.32
0.77
-0.6
-2
-1
13
-3
2.1
3.4
3.27 Una matriz tridiagonal por bloques (o partida) es una matriz de la forma
Matrices y sistemas de ecuaciones lineales 243
ra lle-
BI el o o
A2 B2 e2 o
A=
o A3 B3 e3 o
o o o
o ell
_
1
o o A" Bn
inter- donde BI' B2,··· ,Bn son matrices de orden nl' n2,··· nn: respectivamente. A2, A3' ... , An son
el ea- matrices de orden (n2 X ni)' (n3 X n2), ... , (n" X nll
_
I), respectivamente, y e" e2,· .. en_1
son matrices de orden (nI X n2), (n2 X n3), ... , (nll
_
1 X nn)' respectivamente.
Por ejemplo, las matrices
a)
donde B,= [ -! -n[B, el g,] -1
A= A2 B2 6 i = 1,2,3
o A3 B3 -1
tes de
[-~O
J]pleo
y Ai+1 = e¡= -2 i = 1,2
O
b)
1 5 3 5 8 9 -2 O O O O O
2 -1 O 1 4 O 7 O O O O O
4 3 6 7 3 2 3 O O O O O
na-
7 3 6 4 5 8 9 4 5 5 4 3
restas 2 2 5 7 6 3 2 2 7 8 9 1
amas. 3 7 3 4 1 O 1 O -3 5 7 2
1 1 2 4 3 2 5 4 5 7 9 5
guien-
O O O 5 7 9 5 O 5 7 4 2
O O O 4 8 2 2 -1 7 9 7 8
O O O 3 2 1 1 4 8 4 3 2
O O O 5 1 5 4 2 7 4 5 -1
O O O 2 9 7 3 3 2 7 2 2
son tridiagonales por bloques.
Hay que observar que una matriz tridigonal por bloques no es tridiagonal en el sentido de
la definición original.
Elabore un algoritmo similar al algoritmo 3.5 para resolver sistemas tridiagonales por
bloques A x = b.
SUGERENCIA: Para el sistema
donde se ha segmentado a x y b de modo tal que
244 Métodos numéricos aplicados a la ingeniería
Xl Y b, son vectores de nI componentes (el orden de Bl),
x2
y b2
son vectores de n2
componentes (el orden de B2),
x3
y b3
son vectores de n3
componentes (el orden de B3),
forme la matriz aumentada
y elimine la matriz A2
por medio de los elementos de la diagonal principal de B 1; poste-
riormente elimine la matriz A3 con los elementos diagonales de B2. Para iniciar la sustitu-
ción regresiva, resuelva el sistema
B3 x3 = b3 '
con el resultado resuelva el sistema
B2 x2 = b2 - e, x3
Finalmente, sustituyendo x2' resuelva
s, Xl = b, - el x2
Los sistemas pueden resolverse con alguno de los métodos vistos.
3.28 Resuelva el sistema tridiagonal por bloques
6 -1 O -2 O O O O O xl 3
-1 6 -1 O -2 O O O O x2 2
O 1 6 O O -2 O O O x3 3
-2 O O 6 -1 O -2 O O x4 1
O -2 O -1 6 -1 O -2 O Xs O
O O -2 O -1 6 O O -2 x6 1
O O O -2 O O 6 -1 O x7 3
O O O O -2 O 1 6 -1 xg 2
O O O O O -2 O -1 6 x9 3
Utilice la sugerencia del problema 3.27, el algoritmo de ese ejercicio o ambos.
3.29 En la simulación de una columna de destilación de NP platos que separa una mezcla de
NC componentes, el balance de materia por componente en cada plato, el balance de en-
talpía en cada plato y la relación de equilibrio líquido-vapor de cada componente en cada
plato, resultan en un sistema de NP(2NC+ 1) (dos veces el número de componentes más
uno multiplicado por el número de platos) ecuaciones algebraicas no lineales. En la apli-
cación del método de Newton-Raphson para un sistema no lineal es necesario resolver un
sistema tridiagonal por bloques de orden NP(2NC+ 1) en cada iteración. Para una colum-
na de cinco platos y tres componentes, el sistema tridiagonal por bloques por resolver en
cada iteración es:
Bl el Xl bl
A2 B2 e2 X2 b2
A3 B3 e3 X3 b3
A4 B4 e4 X4 b4
As Bs Xs bs
Matrices y sistemas de ecuaciones lineales 245
donde
O O O 12204.1 9216.1 1262.6 1768.8
O O O O -1 O O
O O O O O -1 O
A2 = O O O O O O -1
O O O O O O O
O O O O O O O
O O O O O O O
O O O 10550.0 1187.3 1636.7 2291.6
te- O O O O -1 O O
'tu- O O O O O -1 O
A3= O O O O O O -1
O O O O O O O
O O O O O O O
O O O O O O O
O O O 9863.2 1529.5 2109.1 2951.1
O O O O -1 O O
O O O O O -1 O
A4= O O O O O O -1
O O O O O O O
O O O O O O O
O O O O O O O
O O O 8341.5 2227.6 3073.1 4294.5
O O O O -1 O O
O O O O O -1 O
A5 = O O O O O O -1
O O O O O O O
O O O O O O O
O O O O O O O
5522.3 6518.9 7105.4 18015.3 916.1 1262.6 1768.8
1 O O O 1 O 1
de O 1 O O O 1 O
en- B,= O O 1 O O O 1
ada -0.065 0.9346 0.9346 2.93858 0.119 -0.4894 -0.4894
ás 0.0643 -0.9357 0.0643 0.30762 -0.033 0.1481 -0.0337
pli- 0.0011 0.0011 -0.9989 0.00643 -0.006 -0.0006 0.0524
un
ffi-
5777.5 6941.9 7659.2 28231.1 1187.3 1636.7 2291.6
en 1 O O O 1 O 1
O 1 O O O 1 O
B2 = O O 1 O O O 1
-0.l37 0.8625 0.8625 7.2004 0.8898 -1.6296 -1.6296
0.l314 -0.8686 0.l314 1.6619 0.5605 0.5605 -0.2482
0.0061 0.0061 -0.9989 0.0979 -0.0115 -0.0115 02374
246 Métodos nu méricos aplicados a la ingeniería
6099.7 7471.9 8357.4 27837.5 1529.5 2109.1 2951.1
1 O O O 1 O 1
O 1 O O O 1 O
B3 = O O 1 O O O 1
-0.2217 0.7783 0.7783 5.6209 1.6619 -1.6521 -1.6296
0.1917 -0.8029 0.1971 2.1270 -0.4184 0.7336 -0.2482
0.0246 0.0246 -0.9754 0.3359 -0.0522 -0.0522 03355
6557.3 8540.2 9778.8 18947.5 2227.6 3073.1 4294.5
1 O O O 1 O 1
O 1 O O O 1 O
B4 = O O 1 O O O 1
-0.4351 0.5649 0.5649 1.7373 2.2062 -0.8346 -0.8346 b
0.3456 -0.6544 0.3456 1.5331 -0.5106 0.6927 -0.5106
0.8923 0.8923 -0.9108 0.5003 -0.1322 -0.1322 0.3058
7547.5 9801.1 11480.6 12961.3 3065.4 4231.4 5904.4
1 O O O 1 O 1
O 1 O O O 1 O
Bs = O O 1 O O O 1
-0.6827 0.3173 0.3173 0.7585 29.335 -3.9259 -3.9059
0.4311 -0.5689 0.4311 1.4233 -5.3074 9.3998 -5.3074
0.2516 0.2516 -0.7484 1.0573 -3.0980 -3.0980 2.8411
-5777.5 -6941.9 -7659.2 -17681.1 O O O
O -1 O O O O O
O O -1 O O O O
el= O O O -1 O O O
O O O O O O O
O O O O O O O
O O O O O O O
-6099.6 -7471.9 -8357.4 -17974.2 O O O
O -1 O O O O O
F
O O -1 O O O O
e2 = O O O -1 O O O
O O O O O O O
O O O O O O O
O O O O O O O
-6757.4 -8540.2 -9778.7 -10606.0 O O O
O -1 O O O O O
O O -1 O O O O
e3 = O O O -1 O O O
O O O O O O O
O O O O O O O
O O O O O O O
Matrices y sistemas de ecuaciones lineales 247
-7547.5 -9801.1 -11480.6 -11886.0 O O O
O -1 O O O O O
O O -1 O O O O
C4= O O O -1 O O O
O O O O O O O
O O O O O O O
O O O O O O O
-3390307.1 -117198.1 -117288.9 --421289.9 348305.0
-6.7419 -70.6904 -16.5304 -3.9928 59.4815
13.4936 -16.8926 -18.9351 -52.9235 35.448
b,= 1.2278 , b2= 0.1614 , b3
= -2.1684 , b4= 2.2335 , bs= 3.1614
-0.009835 0.0142 0.02723 -0.0021 -0.01917
0.000629 0.00463 0.00536 -0.00192 -0.01459
0.000566 -0.00256 -0.0020 0.12736 -0.00998
3.30 Adapte la eliminación de Gauss a la solución del sistema pentadiagonal A x = b (A es una
matriz pentadiagonal) y obtenga las ecuaciones correspondientes a esta adaptación.
Figura 3.18 a) b)
3.31 Demuestre que la numeración de los nodos de la figura 3.14 con las consideraciones de
que a¡,j i= O siempre que los nodos sean vecinos, genera una matriz tridiagonal.
3.32 Considere la estructura hexagonal de la figura 3.18a (véase Ej. 3.2.). Numere los nodos en
la forma mostrada en la figura 3.18b, por ejemplo, y con consideraciones físicas que de-
terminan que a¡,j i= O,cuando i y j son nodos vecinos, determine la matriz A representativa
de dicha estructura.
3.33 Se tiene un sistema de tres rectores continuos tipo tanque perfectamente agitado trabajan-
do en serie, en donde se lleva a cabo la reacción A --> Productos y se opera isotérmicamen-
te (véase Fig. 3.19). Los volúmenes se mantienen constantes y son de 100,50 Y 50, litros
respecti vamente.
Un balance de materia en cada reactor, de acuerdo con la ecuación de continuidad, condu-
ce al siguiente sistema de ecuaciones:
248 Métodos numéricos aplicados a la ingeniería
Entrada - Salida -lo que = Acumulación
reacciona
FCAO+ FR CA3 - (F+FR)CA, -k, V, C~,
dCA,
dt
(F+FR)CA1 - (F+FR)CA2 -k, V2C~2
dCA2
dt
(F+FR)CA2 - (F+FR)CA3 -k, V3 C~3
dCA3
dt
Calcule la concentración de A a régimen permanente en cada reactor si la reacción es de
primer orden con respecto a A y la constante de velocidad de reacción k, es O.lmin-'. Las
composiciones están dadas en mol/L.
Figura 3.19
Sistema de tres
reactores
continuos tipo
tanque agitado
en donde se
lleva
a cabo la
reacción A -->
Productos.
F = 10L/min
CA
=l.0 •
o
s = 10 L/min
FR = 5 L/min
C~
3.34 Repita el problema 3.33, considerando que el reflujo es como se muestra en la figura 3.20
F = lOL/min
Figura 3.20
Sistema de tres CA
=1.0
•
1 L/min 2 L/min 2 L/min
o
reactores
continuos tipo CA CA CA FR = 5 L/mintanque agitado, 1 2 3
en donde se VI = 100L V2 = 50 L V3 = 50 L
lleva
a cabo la
reacción A --> CA CA CA S = 10 L/minI 2 3
Productos.
3.35 Calcule la composición del benceno en cada plato de la columna de absorción del ejerci-
cio 3.1, si se modifica Yo a 0.2 de fracción molar. Use las consideraciones del mismo ejer-
cicio.
3.36 Las reacciones químicas pueden escribirse como:
11
L xc, = O
;=1 1 1
donde: Xi es el coeficiente estequimétrico del compuesto i y c¡ el compuesto i.
Por ejemplo, CH4
+ 2 02 ---> CO2 + 2 H20
Matrices y sistemas de ecuaciones lineales 249
puede escribirse como:
Dado que los átomos se conservan en una reacción química, la ecuación de conservación
del elemento k es:
n
L x-m'k = O;i=l 1 1,'
k = 1,2, ... , m
de
as
donde m¡,k es el número de átomos del elemento k en el compuesto i.
Esta última expresión representa un conjunto de ecuaciones lineales, donde x¡ son las in-
cógnitas. Lo anterior se conoce como el método algebraico de balanceo de ecuaciones
químicas.
Utilice este método para balancear la ecuación química
3.37
Fe(Cr02)2 + 02 + Na2C03 -t Fe2
03 + Na, Cr04
+ CO2
Factorice las siguientes en la forma L U, con el algoritmo 3.6
a)
[~
1
-~] b)
[34M 16100
-91]5 1.9999 17.01 9.6
8 1.6 5.2 1.7
e)
[58 3.2 1125] á)
l~OO2
4 X 10-4 5 X 10-4
8X I~J4.3 3.4 9.625 2.3 3 X 10-3 4 X 10-5
2.5 5.2 9.625 O 5 0.01
O O 2 -
e) [~
O O
~J
1)
l~
6 1
I~J10 O 5 -2
9 5 5 7
10 3 3 9 12 24
.20
3.38 Factorice las matrices del problema 3.37, con el algoritmo 3.7.
3.39 Resuelva los siguientes sistemas de ecuaciones con el algoritmo 3.8
a) 4x¡ + x2 - x3 = 8
2x¡ + 5x2 5
3x¡ + 8x2 + 9x3 = O
b) 3.444x¡ + 16100x2
- 9.1x3 = O
1.9999x¡ + 17.01x2 + 9.6x3 = 1
1.6x¡ + 5.2x2 + 1.7x3
= O
e) 5.8x¡ + 3·2x2 + 11.24x3 20.24
4.3x¡ + 3.4x2 + 9.625x3 = 17.325
2.5x¡ + 5·2x2 + 9.625x3 = 17.325
l-
er- el) 4x¡ + 5x2 + 2x3 x4 3
5x¡ + 8x2 + 7x3 + 6x4 2
3x¡ + 7x2 4x3 2x4 O
-xI + 6x2 2x3 + 5x4 1
e) 2.156x¡ + 4.102x2 2.3217x3 + 6x4
18
-4.102x¡ + 6x2 + + 1.2x4 6.5931
-XI 5.7012x2 + 1.2222x3 3.4
6.532x¡ + 7x2 4x4 O
250 Métodos numéricos ap licados a la ingeniería
3.40 Factorice las matrices simétricas siguientes, mediante el algoritmo 3.9.
a)
[-¡ 5
n
b)
[ 333
4.81
-222J6 4.81 10.0 7.45
1 -2.22 7.45 15.0
72.0 0.00 0.00 9.00 0.00 0.00
0.00 2.88 0.00 0.00 0.00 -4.50
e) 0.00 0.00 18.00 9.00 0.00 0.00
9.00 0.00 9.00 12.00 0.00 0.00
0.00 0.00 0.00 0.00 33.00 0.00
0.00 -4.50 0.00 0.00 0.00 33.00
3.41· Con el algoritmo 3.9, elabore un algoritmo para resolver sistemas lineales simétricos y re-
suelva con él los siguientes sistemas.
a) -5x¡ + 5x2 + 3x3
1
5x¡ + 6x2 + x3
2
3x¡ + x2 + 7x3 3
b) 3.33x¡ + 4.81x2
- 2.22x3 5
4.81x¡ + 10.00x2 + 745x3 O
-2.22x¡ + 7.45x2 + 15.00x3
2
e) 72x¡ + 9x4 2
2.88x2
-4.5x6 0.5
18x3 + 9x4 1
9x3 + 12x4 O
33xs 1.2
- 4.5x2 + 33x6 5
3.42 Use el algoritmo 3.10 para factorizar en la forma L U las siguientes matrices positivas de-
finitivas.
a) [4 -2
-!] b) U 1 2
-!J
e) 10 O O -1 O
-2 4 7 O O 5 O O 2
O -1 O 5 O O 2 O O
3 1 -1 O O 8 3
O 2 O 3 5
3.43 Mediante el algoritmo 3.10 elabore un algoritmo para resolver sistemas lineales con ma-
triz coeficiente positiva definida y resuelva con él los siguientes sistemas.
a) 4x¡ 2x2 O
-2x¡ + 4x2 x3
0.5
x2 + 4x3 1
b) 5x¡ + x2 + 2x3 x4 1
x¡ + 7x2 + 3x4 2
2x¡ 5x3 + x4 3
-xI + 3x2 + x3 + 8x4 4
e) l Ox, x4 0.2
5x2 + 2x4 0.4
2x3
1.0
-xI + 8x4 + 3xs 0.6
2x2 + 3x4 + 5xs 0.8
Matrices y sistemas de ecuaciones lineales 251
3.44 Si la factorización de A en las matrices L y U es posible, puede imponerse que ui,i = 1 con
i = 1, 2, ... , n. Con estas condiciones obtenga las ecuaciones correspondientes a las ecuacio-
nes 3.74, 3.75 Y 3.76, para el caso del orden de A igual a 3. También obtenga las ecuaciones
correspondientes a la ecuación 3.77 para el caso general, orden de A igual a n. Este méto-
do, como se recordará, es conocido como algoritmo de Crout.
3.45 Elabore un algoritmo para resolver un sistema de ecuaciones lineales con el método de
Crout (véase algoritmo 3.8); resuelva los sistemas del problema 3.43 con el algoritmo en-
contrado.
3.46 Demuestre que en la solución del sistema lineal A x = b, donde A es positiva definida, con
el método de Cholesky se requiere efectuar:
n raíces cuadradas
re-
n
3
+ 9 n
2
+ 2n lti licaci di ..------ mu tip icaciones o ivrsíones
6
n3 + 6 n2
-7n
------ sumas o restasy
6
cuando el orden de A es n.
3.47 Demuestre que si una matriz A es positiva definida, entonces au > Opara i =1,2, ... , n.
3.48 Los algoritmos de factorización, cuando son aplicables, se pueden simplificar considera-
blemente en el caso de matrices bandeadas, debido al gran número de ceros que aparecen
en estas matrices. Adapte el método de Doolitle o el de Crout para sistemas tridiagonales
y una vez obtenidas las ecuaciones correspondientes, elabore un algoritmo eficiente.
3.49 En la solución de una estructura doblemente empotrada se obtuvo el siguiente sistema:
de-
1 1
- c+- Ap=O
El El
donde El es el módulo de elasticidad del elemento,
-1.80 p¡
22.50 P2
c= -67.50 p= P3
0.00 P4
165.00 Ps
0.00 P6
72.00 0.00 0.00 9.00 0.00 0.00
0.00 2.88 0.00 0.00 0.00 -4.50
Y A= 0.00 0.00 18.00 9.00 0.00 0.00
9.00 0.00 9.00 12.00 0.00 0.00
0.00 0.00 0.00 0.00 33.00 0.00
0.00 -4.50 0.00 0.00 0.00 33.00
Encuentre p.
ma-
3.50 Determine si el sistema que sigue está mal condicionado.
[
~:~~~~ 671.~~ -~:~l[~~l= [160~~:~~j
1.6000 5.20 1.7 x3
8.42
Resuélvalo usando la eliminación de Gauss y aritmética de cinco dígitos.
252 Métodos numé ricos aplicados a la ingeniería
3.51 La matriz H(IZ) de orden n o matriz de Hilbert, definida por
1
h .. = --- ; 1 ::;i ::; n; 1 ::;j ::;n,
I,} i + j-1
es una matriz mal condicionada que surge, por ejemplo, al resolver las ecuaciones norma-
les del método de aproximación por mínimos cuadrados (véase capítulo 5). Encuentre H(4l,
H(S) y sus inversas por alguno de los métodos vistos; además, resuelva el sistema.
H(4) X = [ 1 O 1 OF
3.52 Demuestre que:
det P = -1, el determinante de una matriz permutadora es-l.
det M = In, el determinante de una matriz multiplicadora es el factor In (m '* O).
det S = 1, el determinante de una matriz del tipo S es 1.
Sugerencia: Utilice la función determinante de una matriz de orden n.
3.53 Dados los siguientes sistemas de ecuaciones lineales:
calcule las inversas, determinantes y soluciones correspondientes, usando matrices ele-
mentales.
3.54 Resuelva los siguientes sistemas de ecuaciones lineales mediante los métodos de Gauss-
Seidel y de Jacobi.
a)
[!
-1
-~][;j= D]
b)
D
1
i][;j= [:]
-1 2
-1 1
e) inciso c) del problema 3.41.
d) 1 2 22 23 24
XI
13.4
1 6 62 63 64 x2
30.4
1 10 102 103 104 x3
41.8
1 20 202 203 204 x4 57.9
1 30 302 303 304 X
s 66.5
d) 8 O 6 1 O O O O OO O XI 1
O 9 O O O O5 O 2 1 O x2 5
O 1 7 O O 1 2 O O 1 O x3 8
O 1 O 6 O O 1 O O O 1 x4 O
O O O O9 O O O 1 1 1 Xs 8
O 1 O 2 O 10 1 O 3 O O x6
1
O O 5 O 2 2 10 O O O O x7 O
O O O 6 1 O O 15 O 2 O x8 3 Fig
TrE
O 2 O O 4 O 1 1 20 1 O x9 O
intercc
O O O O O3 O 6 5 25 1 xIO 1
1 O 3 1 5 O 7 O O 1 12 XII 2
Matrices y sistemas de ecuaciones lineales 253
3.55 Elabore un algoritmo para arreglar la matriz aumentada de un sistema, de modo que la ma-
triz coeficiente quede lo más cercana posible a diagonal dominante.
3.56 Elabore un algoritmo para resolver un sistema de ecuaciones linales, usando los métodos
SOR con w > 1 Y con w < 1.
SUGERENCIA: Puede obtenerlo fácilmente modificando el algoritmo 3.11.rma-
¡fA),
3.57 Aplique la segunda ley de Kirchhoff a la malla formada por el contorno del circuito de la
figura 3.15; es decir, no considere Es, R4 YRs- Demuestre que la ecuación resultante es li-
nealmente dependiente de las tres obtenidas al seccionar en mallas dicho circuito.
3.58 Resuelva los sistemas de ecuaciones lineales del problema 3.54 con el algoritmo elabora-
do en el problema 3.56.
3.59 Demuestre que la ecuación 3.11 O es un polinomio de grado n si A es una matriz de orden
n e 1 es la matriz identidad correspondiente.
3.60 Encuentre los valores característicos (eigenvalores) de la matriz coeficiente del siguiente
sistema.
O).
1 0.3
7 2
2 5
O -2
1_0
:
l-1[!]
s ele-
3.61 Encuentre los vectores característicos (eigenvectores) correspondientes al valor caracterís-
tico dominante (el de máximo valor absoluto) del ejemplo anterior.
3.62 Encuentre el valor característico dominante y los vectores característicos correspondientes
del sistema de ecuaciones del problema 3.60.
3.63 Se tienen tres tanques cilíndricos iguales de 6 pies de diámetro, comunicados entre sí por
medio de tubos de 4 pulgadas de diámetro y 2 pies de largo, como se muestra en la figura
3.21. El tercer tanque tiene una salida a través de un tubo de 4 pulgadas de diámetro y 8
pies de largo. Al primer tanque llega un fluido a razón de 0.1 pies cúbicos por minuto e
inicialmente su nivel tiene una altura de 20 pies, mientas que el segundo y tercer tanques
están vacíos. El fluido es un aceite viscoso cuya densidad es de 51.45 lbm
/pie3, Y viscosi-
dad es 100 centipoises. Calcule la altura del fluido en cada tanque cuando se alcance el ré-
gimen permanente.
auss-
SUGERENCIA: Use la ecuación de Poiselle para el cálculo de la velocidad media del fluido a través
de los tubos.
F = 0.1 pie3/min
,
h,1
CD
h,1
G)
G)
•
5
8
O
8
1
O
3
O
1
2
Figura 3.21
Tres tanques
interconectados.
L = 2'
D = 2"
L = 2' L = 8'
D=4" D = 4"
CAPÍTULO 4
SISTEMAS DE ECUACIONES
NO LINEALES
A dónde nos dirigimos
En este capítulo estudiaremos las técnicas que nos permitirán resolver sistemas de
ecuaciones no lineales,j (x) = O,vistas como la situación más general de los casos que
analizamos en los capítulos 2 y 3. Para esto, utilizaremos sistemas de dos ecuaciones
no lineales en dos incógnitas, lo cual no implica pérdida de generalidad y a cambio nos
permitirá realizar los cálculos de manera más ágil y, sobre todo, presentar una interpre-
tación geométrica del método. De esta manera, el lector tendrá frente a sí un reto de vi-
sualización y entenderá por qué estos métodos requieren de numerosos cálculos.
Además de las extensiones que se hacen del método de punto fijo, de Newton-
Raphson y de bisección a sistemas no lineales, estudiaremos una fórmula que, median-
te un planteamiento generalizado, nos permite proponer y explorar técnicas diferentes
a las vistas anteriormente, como la del descenso de máxima pendiente y variantes a las
ya conocidas como la de Newton-Raphson con optimización del tamaño de paso.
Con este capítulo terminamos la parte algebraica del libro en la que se basarán los
siguientes capítulos correspondientes a la parte de análisis y dinámica, ya que muchos
de los problemas que veremos más adelante se reducen a resolver problemas de tipo al-
gebraico; por ejemplo: cuando se resuelve una ecuación diferencial parcial donde se
termina resolviendo un sistema lineal o no lineal de ecuaciones, o en el caso en que es
necesario resolver problemas de absorción, destilación, diseño de reactores, diseño de
vigas u otros de gran interés para el ingeniero.
Introducción
En el capítulo 2 se vio cómo encontrar las raíces de una ecuación de la forma:
1(X) =0.
Por otro lado, en el capítulo 3 se estudiaron las técnicas iterativas de solución de un siste-
ma de ecuaciones lineales A x = b.
Estos dos son casos particulares de la situación más general, donde se tiene un siste-
ma de varias ecuaciones con varias incógnitas, cuya representación es:
11(xl' x2' x3'··· , xl1) = O
12(x., x2' x3'··· , x) = O
(4.1)
donde f (xl' x2' x3, ... , x,) para 1 ~ i ~ n es una función (lineal o no) de las variables inde-
pendientes Xl' X2' X3,··· , X,I"
CAPÍTULO 4
SISTEMAS DE ECUACIONES
NO LINEALES
A dónde nos dirigimos
En este capítulo estudiaremos las técnicas que nos permitirán resolver sistemas de
ecuaciones no lineales,!(x) =O, vistas como la situación más general de los casos que
analizamos en los capítulos 2 y 3. Para esto, utilizaremos sistemas de dos ecuaciones
no lineales en dos incógnitas, lo cual no implica pérdida de generalidad y a cambio nos
permitirá realizar los cálculos de manera más ágil y, sobre todo, presentar una interpre-
tación geométrica del método. De esta manera, el lector tendrá frente a sí un reto de vi-
sualización y entenderá por qué estos métodos requieren de numerosos cálculos.
Además de las extensiones que se hacen del método de punto fijo, de Newton-
Raphson y de bisección a sistemas no lineales, estudiaremos una fórmula que, median-
te un planteamiento generalizado, nos permite proponer y explorar técnicas diferentes
a las vistas anteriormente, como la del descenso de máxima pendiente y variantes a las
ya conocidas como la de Newton-Raphson con optimización del tamaño de paso.
Con este capltulo terminamos la parte algebraica del libro en la que se basarán los
siguientes capítulos correspondientes a la parte de análisis y dinámica, ya que muchos
de los problemas que veremos más adelante se reducen a resolver problemas de tipo al-
gebraico; por ejemplo: cuando se resuelve una ecuación diferencial parcial donde se
termina resolviendo un sistema lineal o no lineal de ecuaciones, o en el caso en que es
necesario resolver problemas de absorción, destilación, diseño de reactores, diseño de
vigas u otros de gran interés para el ingeniero.
Introducción
En el capítulo 2 se vio cómo encontrar las raíces de una ecuación de la forma:
J(X) = 0.
Por otro lado, en el capítulo 3 se estudiaron las técnicas iterativas de solución de un siste-
ma de ecuaciones lineales A x = b.
Estos dos son casos particulares de la situación más general, donde se tiene un siste-
ma de varias ecuaciones con varias incógnitas, cuya representación es:
J, (xi' x2' x3' ··· , x,,) =O
J2 (Xl' X 2' X 3'··· , X,,) = O
(4.1)
donde.!; (x" X 2' X 3, ... , X II ) para 1 ~ i ~ n es una función (lineal o no) de las variables inde-
pendientes x" x2' x3, ... , xl/.
256 Métodos numéricos aplicados a la ingeniería
Si por ejemplo la ecuación 4.1 consiste sólo en una ecuación de una incógnita (n = 1),
se tiene la ecuación 2.1. En cambio la ecuación 4.1 se reducirá al caso (3.39) si n > 1 Yfp
f2,· .. 1" son todas funciones lineales de x" x2' x3, ... , x".
Por todo esto, es fácil entender que los métodos iterativos de solución de la ecuación 4.1
son extensiones de los métodos para ecuaciones no lineales con una incógnita y emplean las
ideas que se aplicaron al desarrollar los algoritmos iterativos para resolver A x = b.
A continuación se dan algunos ejemplos.
a) I, (x¡, x2
) = X,2 + xl- 4 = O
f2 (xl' x2) = x2 - x,2 = O
b) t,(xl' x2) = 10 (x2 - x?) = O
f2 (x., x2) = 1 - x, = O
e) t.(xl' x2, x;) = x,x2x3 - lOx,3 + x2 = O
f2 (xl' x2' x3) = XI + 2X2X3 + senx2 - 15 = O
f3 (xl' x2' x3) = x2
2 - 5x,x3 - 3x3
3 + 3 = O
4.1 Dificultades en la solución de sistemas de
ecuaciones no lineales
Antes de desarrollar los métodos iterativos para resolver sistemas de ecuaciones no linea-
les con varias incógnitas, se destacarán algunas de las dificultades que se presentan al apli-
car estos métodos.
• Es imposible graficar las superficies multidimensionales definidas por las ecuacio-
nes de los sistemas para n > 2.
• No es fácil encontrar "buenos" valores iniciales.
Para atenuar estas dificultades proporcionamos algunas sugerencias antes de analizar un
intento formal de solución de la ecuación 4.1.
REDUCCiÓN DE ECUACIONES
Resulta muy útil tratar de reducir analíticamente el número de ecuaciones y de incógnitas
antes de intentar una solución numérica. En particular, hay que intentar resolver alguna de
las ecuaciones para alguna de las incógnitas. Después, sustitúyase la ecuación resultante
para esa incógnita en todas las demás ecuaciones; con esto el sistema se reduce en una
ecuación y una incógnita. Continúe de esta manera hasta donde sea posible.
Por ejemplo, en el sistema
f,(xi' x2) = 10 (x2 - x,2) = O
f2(xp x2) = l-x, = O
se despeja x, en la segunda ecuación
x, = 1
y se sustituye en la primera
cuya solución, x2
= 1, conjuntamente con x, = 1 proporciona una solución del sistema da-
do, sin necesidad de resolver dos ecuaciones con dos incógnitas.
256 Métodos numéricos aplicados a la ingeniería
Si por ejemplo la ecuación 4.1 consiste sólo en una ecuación de una incógnita (n = 1),
se tiene la ecuación 2.1. En cambio la ecuación 4.1 se reducirá al caso (3.39) si n > 1 YJI'
J2,· .. 1" son todas funciones lineales de xi' x2, x3'··· , xl1
'
Por todo esto, es fácil entender que los métodos iterativos de solución de la ecuación 4.1
son extensiones de los métodos para ecuaciones no lineales con una incógnita y emplean las
ideas que se aplicaron al desarrollar los algoritmos iterativos para resolver A x =b.
A continuación se dan algunos ejemplos.
a) JI (xi' x2) = X l
2
+ xl - 4 = O
J2(xi' x2) =x2 - x l
2 =O
b) f., (xl' x2) = 10 (x2 - x?) = O
J2 (xi' x2) = 1 - xI = O
c) JI (xi' x2, x3) = x lx2x3 - lOxl
3+ x2 =O
J2 (xi' x2, x3) =xI + 2x2x3 + senx2 - 15 =O
J3 (xi' x2' x3) =x2
2 - 5xlx3 - 3x3
3
+ 3 =O
4.1 Dificultades en la solución de sistemas de
ecuaciones no lineales
Antes de desarrollar los métodos iterativos para resolver sistemas de ecuaciones no linea-
les con varias incógnitas, se destacarán algunas de las dificultades que se presentan al apli-
car estos métodos.
• Es imposible graficar las superficies multidimensionales definidas por las ecuacio-
nes de los sistemas para n > 2.
• No es fácil encontrar "buenos" valores iniciales.
Para atenuar estas dificultades proporcionamos algunas sugerencias antes de analizar un
intento formal de solución de la ecuación 4.1.
REDUCCiÓN DE ECUACIONES
Resulta muy útil tratar de reducir analíticamente el número de ecuaciones y de incógnitas
antes de intentar una solución numérica. En particular, hay que intentar resolver alguna de
las ecuaciones para alguna de las incógnitas. Después, sustitúyase la ecuación resultante
para esa incógnita en todas las demás ecuaciones; con esto el sistema se reduce en una
ecuación y una incógnita. Continúe de esta manera hasta donde sea posible.
Por ejemplo, en el sistema
JI(xl' x2) = 10 (x2- x12) =O
Jlxl' x2) = 1 - XI = O
se despeja XI en la segunda ecuación
XI = 1
y se sustituye en la primera
cuya solución, x2 =1, conjuntamente con XI = 1 proporciona una solución del sistema da-
do, sin necesidad de resolver dos ecuaciones con dos incógnitas.
4.1
las
ea-
li-
io-
un
itas
de
le
una
da-
1
I
Sistema de ecuaciones no lineales 257
PARTICiÓN DE ECUACIONES
A veces resulta más sencillo dividir las ecuaciones en subsistemas menores y resolverlos
por separado. Considérese por ejemplo el siguiente sistema de cinco ecuaciones con cin-
co incógnitas.
I,(x" x2' x3, x4, xs) O
fixl' x2' x4) O
f3(x" x3, x4, xs) O
f4(x2, x4) O
fs(xl' x4) O
En vez de atacar las cinco ecuaciones al mismo tiempo, se resuelve el subsistema forma-
do porf2,f4 yfs- Las soluciones de este subsistema se utilizan después para resolver el sub-
sistema compuesto por las ecuaciones f y f3'
En general, una partición de ecuaciones es la división de un sistema de ecuaciones en
subsistemas llamados bloques. Cada bloque de la partición es el sistema de ecuaciones
más pequeño que incluye todas las variables que es preciso resolver.
TANTEO DE ECUACIONES
Supóngase que se quiere resolver el siguiente sistema de cuatro ecuaciones con cuatro in-
cógnitas.
f,(x2, x3)
f2(x2, x3, x4)
fixl' x2' x3' x4)
fixl' x2, x3)
O
O
O
O
No se pueden dividir en subsistemas, sino que es preciso resolverlas simultáneamente; sin
embargo, es posible abordar el problema por otro camino. Supóngase que se estima un va-
lor de x3. Se podría obtener así x2 a partir de fl' x4 de f2 y x, de f3' Finalmente, se compro-
baría cou f¿ la estimación hecha de x3
. Sif4 fuese cero o menor en magnitud que un valor
predeterminado o criterio de exactitud E, la estimación x3 y los valores de x2' x4 y x, obte-
nidos con ella, serían una aproximación a la solución del sistema dado. En caso contrario,
habría que proponer un nuevo valor de x3
y repetir el proceso.
Nótese la íntima relación que guarda este método con el de punto fijo (Cap. 2), ya que
un problema multidimensional se reduce a uno unidimensional en x3
VALORES INICIALES
a) De consideraciones físicas
Si el sistema de ecuaciones 4.1 tiene un significado físico, con frecuencia es posible aco-
tar los valores de las incógnitas a partir de consideraciones físicas. Por ejemplo, si alguna
de las variables Xi representa la velocidad de flujo de un fluido, ésta no podrá ser negati-
va. Por tanto, Xi ¿ O. En el caso de que Xi represente una concentración expresada como
fracción peso o fracción molar de una corriente de alimentación, se tiene que O ::::;Xi ::::; 1.
(Para mayores detalles ver los ejercicios resueltos al final del capítulo).
Sistema de ecuaciones no lineales 257
PARTIC iÓN DE ECUACIONES
A veces resulta más sencillo dividir las ecuaciones en subsistemas menores y resolverlos
por separado. Considérese por ejemplo el siguiente sistema de cinco ecuaciones con cin-
co incógnitas.
f, (xI' X2' X3' X4' X5) O
fix i' X2' X4) O
fix " X3' X4' X5) O
f4(x2, X4) O
f 5(xl' X4) O
En vez de atacar las cinco ecuaciones al mismo tiempo, se resuelve el subsistema forma-
do porf2,f4 y f5' Las soluciones de este subsistema se utilizan después para resolver el sub-
sistema compuesto por las ecuaciones f l y f3'
En general, una partición de ecuaciones es la división de un sistema de ecuaciones en
subsistemas llamados bloques. Cada bloque de la partición es el sistema de ecuaciones
más pequeño que incluye todas las variables que es preciso resolver.
TANTEO DE ECUACIONES
Supóngase que se quiere resolver el siguiente sistema de cuatro ecuaciones con cuatro in-
cógnitas.
f l(X2, x3) O
f 2(x2, x3' x4) O
fixl' x2' x3' x4) O
fixi' x2' x3) O
No se pueden dividir en subsistemas, sino que es preciso resolverlas simultáneamente; sin
embargo, es posible abordar el problema por otro camino. Supóngase que se estima un va-
lor de x3. Se podría obtener así x2 a partir de fi' x4 de f 2 y XI de f3' Finalmente, se compro-
baría conf4la estimación hecha de x3. Sif4 fuese cero o menor en magnitud que un valor
predeterminado o criterio de exactitud E, la estimación x3 y los valores de x2' x4 y XI obte-
nidos con ella, serían una aproximación a la solución del sistema dado. En caso contrario,
habría que proponer un nuevo valor de x3 y repetir el proceso.
Nótese la íntima relación que guarda este método con el de punto fijo (Cap. 2), ya que
un problema multidimensional se reduce a uno unidimensional en x3
VALORES INICIALES
a) De consideraciones físicas
Si el sistema de ecuaciones 4.1 tiene un significado físico, con frecuencia es posible aco-
tar los valores de las incógnitas a partir de consideraciones físicas. Por ejemplo, si alguna
de las variables X i representa la velocidad de flujo de un fluido, ésta no podrá ser negati-
va. Por tanto, Xi 2: O. En el caso de que Xi represente una concentración expresada como
fracción peso o fracción molar de una corriente de alimentación, se tiene que O::::; Xi ::::; 1.
(Para mayores detalles ver los ejercicios resueltos al final del capítulo).
258 Métodos numéricos apl icados a la' ingeniería
b) Visualización de raíces en sistemas de dos ecuaciones no lineales con dos incógnitas.
Sea el sistema
I, (x, y) = x2 - lOx + y2 + 8 = °
!2 (x, y) = xy2 + X - lOy + 8 = ° (4.2)
Algebraicamente una solución o raíz del sistema 4.2 es una pareja X, y, tal que satisface ca-
da una de las ecuaciones de dicho sistema. Nos permitiremos hacer la interpretación o vi-
sualización de una raíz a través de varias etapas:
Al graficar la función j. (x, y), se obtiene una superficie en el espacio, como se ve en
la figura 4.1.
Para apreciar mejor ésta y otras gráficas, se ha incluido una inserción a color (con las
Fig. 4.1 a la Fig. 4.8) en páginas más adelante.
Ir
10
1.5
30
20
z O
-10
Figura 4.1
Intersección de
la superficie
fl (x, y) con el
plano xy.
-20
Ir
La intersección, si hay, de la superficie r¡ (x, y) con el plano x - y puede resultar en una
curva el' como se muestra en la figura 4.1. A lo largo de esta curva se da el hecho de que
I, (x, y) = 0, dicho de otra manera, que los puntos de esta curva son la solución de la ecua-
ción j, (x, y) = O, no del sistema 4.2.
Repitiendo el mismo procedimiento con la superficie de la función j', (x, y), se obtie-
ne otra curva e2
en el plano x - y, que ahora resulta ser la solución de la ecuación j, (x, y)
= 0, ver figura 4.2.
Finalmente, las intersecciones de las curvas e, y e2 del plano x - y, resultan ser pun-
tos comunes a las tres superficies.j', (x, y)'!2 (x, y) y el plano x - y; dichos puntos satis-
facen ambas ecuaciones del sistema 4.2 y son precisamente las raíces X, y que buscamos,
ver figura 4.3. Partiendo de la raíz mostrada en la gráfica 4.3 se pueden proponer valores
iniciales.
Por último, resulta muy conveniente conocer bien las características de cada método
de solución del sistema 4.1 para efectuar la elección más adecuada para el mismo.
Se iniciará el estudio de dichos métodos con la extensión del método de punto fijo a
sistemas de ecuaciones no lineales.
4,
258
Figura 4.1
Intersección de
la superficie
f1
(x, y) con el
plano x-y.
Métodos numéricos aplicados a la· ingeniería
b) Visualización de raíces en sistemas de dos ecuaciones no lineales con dos incógnitas.
Sea el sistema
!, (x, y) =x2 - lOx + y2 + 8 =°
!2 (x, y) =xy2 + X - lOy + 8 =° (4.2)
Algebraicamente una solución o raíz del sistema 4.2 es una pareja X, ji, tal que satisface ca-
da una de las ecuaciones de dicho sistema. Nos permitiremos hacer la interpretación o vi-
sualización de una raíz a través de varias etapas:
Al graficar la función!¡ (x, y), se obtiene una superficie en el espacio, como se ve en
la figura 4.1.
Para apreciar mejor ésta y otras gráficas, se ha incluido una inserción a color (con las
Fig. 4.1 a la Fig. 4.8) en páginas más adelante.
30
20
10
z O
-10
-20
.5
La intersección, si hay, de la superficie!, (x, y) con el plano x - y puede resultar en una
curva e" como se muestra en la figura 4.1. A lo largo de esta curva se da el hecho de que
!, (x, y) = 0, dicho de otra manera, que los puntos de esta curva son la solución de la ecua-
ción!, (x, y) =O, no del sistema 4.2.
Repitiendo el mismo procedimiento con la superficie de la función!2 (x, y), se obtie-
ne otra curva e2en el plano x - y, que ahora resulta ser la solución de la ecuación!2 (x, y)
= 0, ver figura 4.2.
Finalmente, las intersecciones de las curvas e¡ y e2 del plano x - y, resultan ser pun-
tos comunes a las tres superficies:!, (x, y)'!2 (x, y) y el plano x - y; dichos puntos satis-
facen ambas ecuaciones del sistema 4.2 y son precisamente las raíces X, ji que buscamos,
ver figura 4.3. Partiendo de la raíz mostrada en la gráfica 4.3 se pueden proponer valores
iniciales.
Por último, resulta muy conveniente conocer bien las características de cada método
de solución del sistema 4.1 para efectuar la elección más adecuada para el mismo.
Se iniciará el estudio de dichos métodos con la extensión del método de punto fijo a
sistemas de ecuaciones no lineales.
las.
(4.2)
e ca-
o vi-
e en
pun-
satis-
fijo a
Sistema de ecuaciones no lineales 259
Figura 4.2
Intersección de
la superficie
f2(x, y) con el
plano x-y.
1.5
0.5o
y
o-0.5 x-1 -1.5 -1
30
20
10
-10
Figura 4.3
Intersección d~'
las superficies -20
f; (x, y) y f2(x, y)
con el plano
xy.
1.5
Método de punto fijo multivariable
------
4.2
Los algoritmo s estudiados en este capítulo son, en principio, aplicables a sistemas de cual-
quier número de ecuaciones; sin embargo, para ser más concisos y evitar notación compli-
cada, se considerará sólo el caso de dos ecuaciones con dos incógnitas. Éstas generalmente
se escribirán como:
f¡(x, y) = O
f2(x, y) = O
(4.3)
y se tratará de encontrar pares de valores (x, y) que satisfagan ambas ecuaciones.
Figura 4.2
Intersección de
la superficie
f2 (x, y) con el
plano x-y.
Figura 4 .3
Intersección d:.'
las superficies
f; (x, y ) y f2 (x, y)
con el plano
x-y.
-,-,..'
S istema de ecuacione s no lineales 259
1.5
.-.-~ --.
1.5
4.2 Método de punto fijo multivariable
Los algoritmos estudiados en este capítulo son, en principio, aplicables a sistemas de cual-
quier número de ecuaciones; sin embargo, para ser más concisos y evitar notación compli-
cada, se considerará sólo el caso de dos ecuaciones con dos incógnitas. Éstas generalmente
se escribirán como:
f ¡(x, y) = O
fix, y) = O
y se tratará de encontrar pares de valores (x, y ) que satisfagan ambas ecuaciones.
(4.3)
260 Métodos numéricos ap licados a la ingeniería
Como en el método de punto fijo (Sec. 2.1), y en los métodos de Jacobi y Gauss-Sei-
del (Sec. 3.5), se resolverá la primera ecuación para alguna de las variables, x por ejem-
plo, y la segunda para y.
x = gl(x, y)
y = gzCx, y)
(4.4)
Al igual que en los métodos mencionados, se tratará de obtener la estimación (k + l j-ési-
ma a partir de la estimación k-ésima con la expresión
xk+1 = g l(x'<, yk)
yk+1 = gzCxk, yk)
(4.5)
Se comienza con valores iniciales xO, ya, se calculan nuevos valores x', yl, Y se repite el
proceso, esperando que después de cada iteración los valores de xk, yk se aproximen a la
raíz buscada x,)I, la cual cumple con:
x = gl(X,)I)
)1 = gzC X,)I)
Por analogía con los casos analizados, puede predecirse el comportamiento y las caracte-
rísticas de este método de punto fijo multivariable.
Como se sabe, en el caso de una variable la manera particular de pasar de f (x) = O a
x = g(x), afecta la convergencia del proceso iterativo. Entonces debe esperarse que la for-
ma en que se resuelve para x = gl(x, y) y y = gzCx, y) afecta la convergencia de las itera-
ciones (4.5).
Por otro lado, se sabe que el reordenarniento de las ecuaciones en el caso lineal afec-
ta la convergencia, por lo que puede esperarse que la convergencia del método en estudio
dependa de si se despeja x de f2 o de fl•
Finalmente, como en el método iterativo univariable y en el de Jacobi y de Gauss-Sei-
del, la convergencia --en caso de existir- es de primer orden, cabe esperar que el méto-
do iterativo multivariable tenga esta propiedad.
Ejemplo 4.1 Encuentre una solución del sistema de ecuaciones no lineales
I,(x, y) = x2 - lOx + y2 + 8 = O
f2(x, y) = xy2 + X - lOy + 8 = o.
Solución Con el despeje de x del término (-lOx) en la primera ecuación, y de y del término (-lOy)
en la segunda ecuación, resulta:
X2+y2+8
x=
10
xy2+x+8
y=
10
o con la notación de la ecuación 4.5
(x'<)2 + (yk)2 + 8
xk+1 = _
10
x'< (yk)2 + x'< + 8
yk+1 = 10
Con los valores iniciales xO = O,ya = O, se inicia el proceso iterativo.
a
r-
a-
Sistema de ecuacio nes no lineales 261
1- Primera iteración
Xl = 0
2
+ 0
2
+ 8 = 0.8
10
yl = 0(0)2 + O + 8 = 0.8
10
1-
Segunda iteración
el
la
2 (0.8)2 + (0.8)2 + 8
x = = 0.928
10
2 0.8(0.8)2 + 0.8 + 8 O 9
Y = = . 312
10
5)
Al continuar el proceso iterativo, se encuentra la siguiente sucesión de vectores:
k xk yk
O 0.00000 0.00000
1 0.80000 0.80000
2 0.92800 0.93120
3 0.97283 0.97327
4 0.98937 0.98944
5 0.99578 0.99579
6 0.99832 0.99832
7 0.99933 0.99933
8 0.99973 0.99973
9 0.99989 0.99989
10 0.99996 0.99996
11 0.99998 0.99998
12 0.99999 0.99999
13 1.00000 1.00000
e-
c-
io
l-
o-
y)
Los cálculos pueden hacerse con Matlab o con la TI-92 Plus
,
XO=O; yO=O;
fprintf (' k x (k) y (k) n')
fprintf(' %2d %10.5f %10.5fn', O, xO, yO)
for k=l: 13
x1=(xOA2+yOA2+8) /10;
y1= (xO*yW2+xO+8) 110;
fprintf(' %2d %10.5f %10.5fn' ,k,x1,y1)
xO=x1; yO=y1;
end
262 Métodos numéricos aplicados a la ingeniería
Plus e4_1 ( )
Prgm
Define g1(x, y) = (xA2+yA2+8)/10
Define g2(x, y) = (x~yA2+x+8)/10
O~xO : ~yO : ~k : ClrIO
Disp "k x (k) y (k) rr
string (k) S." "&format (xO, "f5") ~d
ds " "&format (yO, "f5") r+d : Disp d
For k, 1, 13
g1(xO, yO)-+x: g2(xO, yO)-+y
string (k) &" "&format (x , "f5")-+d
ds " "&format (y, "f5")->d : Disp d
x-+ xO : y-+ yO
EndFor
EndPrgm
Para observar la convergencia del proceso iterativo, se pudieron usar los criterios del capítu-
lo anterior, como distancia entre dos vectores consecutivos, o bien las distancias componen-
te a componente de dos vectores consecutivos. También existe un criterio de convergencia
equivalente al de las ecuaciones 2.10 y 3.99 que puede aplicarse antes de iniciar el proceso
iterativo mencionado, y que dice:
I~!ll +1~!21~M<l; 1~~11+1~~21~M<l
para todos los puntos (x, y) de la región del plano que contiene todos los valores (xk,
yk) y la raíz buscada (x, .9).
(4.6)
Una condición suficiente aunque no necesaria, para asegurar la convergencia es que
Por otro lado, si M es muy pequeña en una región de interés, la iteración converge rápidamen-
te; si M es cercana a 1 en magnitud, entonces la iteración puede converger lentamente. Este
comportamiento es similar al del caso de una función univariable discutido en el capítulo 2.
Por lo general es muy difícil encontrar el sistema 4.4 a partir de la ecuación 4.3, de
modo que satisfaga la condición 4.5.
De todas maneras, cualquiera que sea el sistema (4.4) a que se haya llegado y que se
vaya a resolver con este método, puede aumentarse la velocidad de convergencia usando
desplazamientos sucesivos en lugar de los desplazamientos simultáneos del esquema 4.5.
Es decir, se iteraría mediante
xk + 1 = gl(Xk, yk)
r:1 = g2(xk+ 1 , yk)
(4.7)
Como en el caso lineal (Jacobi y Gauss-Seidel), si la iteración por desplazamientos simul-
táneos diverge, generalmente el método por desplazamientos sucesivos divergería más rá-
pido; es decir, se detecta más rápido la divergencia, por lo que se recomienda en general
el uso de desplazamientos sucesivos en lugar de desplazamientos simultáneos.
262 Métodos numéricos aplicados a la ingeniería
Plus e4_1( )
Prgm
Define g1(x, y) = (x A2+yA2+8)/10
Define g2(x, y) = (x~yA2+x+8)/10
O->xO : O->yO : O->k : ClrIO
Disp "k x (k) y (k) "
string (k) &" "& format (xO, "f5")->d
d& " " &fonnat (yO, "f5") ->d : Disp d
For k, 1 , 13
g1 (xO , yO)->x : g2 (xO, yO)->y
string (k) &" "&forma t (x, "f5")->d
d&" " &fonnat (y, "f5")->d : Disp d
x-+xO : y->yO
EndFor
EndPrgm
Para observar la convergencia del proceso iterativo, se pudieron usar los criterios del capítu-
lo anterior, como distancia entre dos vectores consecutivos, o bien las distancias componen-
te a componente de dos vectores consecutivos. También existe un criterio de convergencia
equivalente al de las ecuaciones 2.10 y 3.99 que puede aplicarse antes de iniciar el proceso
iterativo mencionado, y que dice:
Una condición suficiente aunque no necesaria, para asegurar la convergencia es que
I~!ll +1~!21 ~M<l; 1~~1 1 + 1~~21 ~M<l (4.6)
para todos los puntos (x, y) de la región del plano que contiene todos los valores (xk,
yk) y la raíz buscada (i, .H
Por otro lado, si M es muy pequeña en una región de interés, la iteración converge rápidamen-
te; si M es cercana a 1 en magnitud, entonces la iteración puede converger lentamente. Este
comportamiento es similar al del caso de una función univariable discutido en el capítulo 2.
Por lo general es muy difícil encontrar el sistema 4.4 a partir de la ecuación 4.3, de
modo que satisfaga la condición 4.5.
De todas maneras, cualquiera que sea el sistema (4.4) a que se haya llegado y que se
vaya a resolver con este método, puede aumentarse la velocidad de convergencia usando
desplazamientos sucesivos en lugar de los desplazamientos simultáneos del esquema 4.5.
Es decir, se iteraría mediante
Xk+ 1 = gl(xk, yk)
yk+1 = g2(xk+1, l)
(4.7)
Como en el caso lineal (Jacobi y Gauss-Sei~el), si la iteración por desplazamientos simul-
táneos diverge, generalmente el método por desplazamientos sucesivos divergería más rá-
pido; es decir, se detecta más rápido la divergencia, por lo que se recomienda en general
el uso de desplazamientos sucesivos en lugar de desplazamientos simultáneos.
Sistema de ecuaciones no lineales 263
LEjemPIO 4.2' Resuelva el sistema del ejemplo 4.1 utilizando el método de punto fijo multivariable con
desplazamientos sucesivos
fl(x, y) = x2 - 10x + y2 + 8 = O
tix, y) = xy2 + X - 10y + 8 = O
SUGERENCIA: Se pueden seguir los cálculos con un pizarrón electrónico o se programa una
calculadora.
Solución Al despejar x del término (-lOx) y y del término (-lOy) de la primera y segunda ecuacio-
nes, respectivamente, resulta
pítu-
nen-
ncia
eso
Al derivar parcialmente, se obtiene
dgl 2xk dgJ
2yk
--
dX 10 dy 10
dg2 (/)2 + 1 dg2
2xk+1 l
dX 10 dy 10
Y evaluadas en xO = OY en yO = O
dgJ
=0
dgl
=0
dX xO dy xO
yO yO
dg2
=1110
dg2
=0
dX Xl dy Xl
yO yO
e
con lo que se puede aplicar la condición 4.6
dgl + dg2 = O + 1/10 = 1/10 < 1
dX dX
~ + dg2 = O + O = O < 1
dY dy
la cual se satisface; si los valores sucesivos de la iteración: xl, y'; x2, y2; x3, y3;... la satis-
facen también, se llega entonces a X, y.
(4.7) Primera iteración
ul-
rá-
eral
Xl = 0
2
+ 0
2
+ 8 = 0.8
10
0.8(0)2 + 0.8 + 8
yl = = 0.88
10
264 Métodos numéricos aplicados a la ingeniería
Cálculo de la distancia entre el vector inicial y el vector [Xl, i]T
I x(l) - x(O)I = )(0.8 - 0.0)2 +(0.88 - 0.00)2 = 1.18929
Segunda iteración
x2 = (0.8)2 + (0.88)2 + 8 = 0.94144
10
y2 = 0.94144(0.88)2 + 0.94144 + 8 = 0.96704
10
Cálculo de la distancia entre [x2, y2F y [xl, yl F:
Ix(2)- X(I) I = )(0.94144 - 0.8)2 + (0.96704 - 0.88)2 = 0.16608
A continuación se muestran los resultados de las iteraciones.
k xk yk Ix(k+l) - x(k) I
O 0.00000 0.00000
1 0.80000 0.88000 1.18929
2 0.94144 0.96705 0.16608
3 0.98215 0.99006 0.04677
4 0.99448 0.99693 0.01411 ALI
5 0.99829 0.99905 0.00436
6 0.99947 0.99970 0.00135 Para e
7 0.99983 0.99991 0.00042
G(I, x
8 0.99995 0.99997 0.00013 DA
9 0.99998 0.99999 0.00004
10 0.99999 1.00000 0.00001 RE
11 1.00000 1.00000 0.00001
PASO
PASO
Hay que observar que se requirieron once iteraciones para llegar al vector solución (1,1)
contra 13 del ejemplo 4.1, donde se usaron desplazamientos simultáneos.
Los cálculos pueden hacerse con Matlab o con la TI-92 Plus.
xO=O; yO=O;
fprintf (' k x (k) y (k) Dist n')
fprintf(' %2d %10.5f %10.5fn', O, xO, yO)
for k=l:11
X1= (xOA2+yOA2+8) /10;
Y1= (x1*yOA2+xl+8) 110;
Dist= ( (x1-xO) A2+ (y1-yO) A2) AO.5;
Fprintf( '%2d %10.5f %10.5f %10.5fn', k, x I , yl , Dist)
XO=x1; yO=y1;
End
PASO
Sistema de ecuaciones no lineales 265
E4_2 ( )
Prgm
Define gl(x,y) = (xA2+yA2+8)/10
Define g2 (x,y) = (x*yA2+x+8) /10
O--+xO : O--+yO : (r+): : CirIO
Disp "k x (k) y (k) "
string(k) &" "&format (xO, "f5")--+d
d&" "&format(yO, "f5")--+d : Disp d
for k, 1, 11
gl (xO,yO)--+x " g2(x,yO)--+y
string (k) &" "format (x, "f5")--+d
d&" "format (y, "f5")--+d: Disp d
x+xt) : y--+yO
EndFor
EndPrgm
A continuación se presenta un algoritmo para el método de punto fijo multivariable en sus
versiones de desplazamientos simultáneos y desplazamientos sucesivos.
ALGORITMO 4.1 Método de punto fUo multivariable
Para encontrar una solución aproximada de un sistema de ecuaciones no lineales g (x) = x, proporcionar las funciones
G(I, x), 1=1, 2, ... , N Y los
DATOS: El número de ecuaciones N, el vector de valores iniciales x, el criterio de convergencia EPS, el nú-
mero máximo de iteraciones MAXIT y M = O para desplazamientos sucesivos o M = 1 para despla-
zamientos simultáneos.
RESULTADOS: Una solución aproximada x o mensaje "NO HUBO CONVERGENCIA".
,1)
PASO l. Hacer K = l.
PASO 2. Mientras K ~ MAXIT, repetir los pasos 3 a 14.
PASO 3. Si M = O, hacer xaux = x. De otro modo continuar.
PASO 4. Hacer 1 = 1.
PASO 5. Mientras I ~ N, repetir los pasos 6 y 7.
PASO 6. Si M = O, hacer X(I) = G(I, x). De otro modo hacer XAUX(I) = G(I, x).
PASO 7. Hacer I = I + 1.
PASO 8. Hacer I = 1.
PASO 9. Mientras I ~ N, repetir los pasos 10 y 11.
PASO 10. Si ABS (XAUX(I) - X(I) > EPS ir al paso 13. De otro modo continuar.
PASO 11. Hacer I = I + 1.
PASO 12. IMPRIMIR x Y TERMINAR.
PASO 13. Si M = 1 hacer x = xaux. De otro modo continuar.
PASO 14. Hacer K = K + 1.
PASO 15. IMPRIMIR mensaje "NO HUBO CONVERGENCIA" YTERMINAR.
SUGERENCIA: Desarrolle este algoritmo con Mathcad o un software equivalente.
E4_2 ( )
Prgm
Sistema de ecuacion es no lineales 265
Define gl(x, y) = (xA
2+yA
2+8) /10
Define g2 (x,y) = (x*yA
2+x+8) /10
O--+xO : O--+yO : O--+k : CirIO
Disp "k x (k) y (k) "
string (k) &" "&format (xO, " f5")--+d
d&" " &format (yO, "f5") --+d : Disp d
for k, 1 , 11
gl (xO,yO)--+x " g2 (x,yO)--+y
string (k) &" "format (x, " f5")--+d
d&" "format (y, "f5")--+ d : Disp d
x--+xO : y--+yO
EndFor
EndPrgm
A continuación se presenta un algoritmo para el método de punto fijo multivariable en sus
versiones de desplazamientos simultáneos y desplazamientos sucesivos.
ALGORITMO 4.1 Método de punto fUo multivariable
Para encontrar una solución aproximada de un sistema de ecuaciones no lineales g (x) = x, proporcionar las funciones
G(l, x), 1=1, 2, ... , N Ylos
DATOS: El número de ecuaciones N, el vector de valores iniciales x, el criterio de convergencia EPS, el nú-
mero máximo de iteraciones MAXIT y M = Opara desplazamientos sucesivos o M = 1 para despla-
zamientos simultáneos.
RESULTADOS: Una solución aproximada x o mensaje "NO HUBO CONVERGENCIA".
PASO l . Hacer K = 1.
PASO 2. Mientras K ::; MAXIT, repetir los pasos 3 a 14.
PASO 3. Si M = O, hacer xaux = x. De otro modo continuar.
PASO 4. Hacer 1= 1.
PASO 5. Mientras 1::; N, repetir los pasos 6 y 7.
PASO 6. Si M =O, hacer XCI) = G(I, x). De otro modo hacer XAUX(I) =G(I, x).
PASO 7. Hacer! = 1+ 1.
PASO 8. Hacer 1= 1.
PASO 9. Mientras 1::; N, repetir los pasos 10 y 11.
PASO 10. Si ABS (XAUX(I) - XCI) > EPS ir al paso 13. De otro modo continuar.
PASO 11. Hacer! = 1+ 1.
PASO 12. IMPRIMIR x Y TERMINAR.
PASO 13. Si M = 1 hacer x = xaux. De otro modo continuar.
PASO 14. Hacer K = K + 1.
PASO 15. IMPRIMIR mensaje "NO HUBO CONVERGENCIA" YTERMINAR.
SUGERENCIA: Desarrolle este algoritmo con Mathcad o un software equivalente.
266 Métodos nu méricos aplicados a la ingeniería
4.3 Método de Newton-Raphson
El método iterativo para sistemas de ecuaciones converge linealmente. Como en el méto-
do de una incógnita, puede crearse un método de convergencia cuadrática, es decir, el mé-
todo de Newton-Raphson multivariabe, a continuación se obtendrá este procedimiento para
dos variables; la extensión a tres o más variables es viable generalizando los resultados.
Supóngase que se está resolviendo el sistema.
Nx, y) O
f2(x, y) O,
Donde ambas funciones son continuas y diferenciables, de modo que puedan expandirse
en serie de Taylor. Esto es:
df df 1 [ d
2
f 2
f(x,y)=f(a,b)+-(x-a)+-(y-b)+- --(x-a) +
dX dX 2! dXdX
d
2
f d2f]2 -- (x - a) (y - b) + -- (y - b)2 + ...
dXdY dXdY
dondef(x, y) se ha expandido alrededor del punto (a, b) y todas las derivadas parciales es-
tán evaluadas en (a, b).
Expandiendo I, alrededor de (xk, yk)
1 [ d2
,!, d2
,!(xk+! - xk)2 + 2 --'- (xk+! - xk)(yk+' -yk) +
2! dXdX dXdy
(4.8)
donde todas las derivadas parciales están evaluadas en (xk
, yk). De la misma forma puede
expandirse f2 como sigue:
(4.9)
De igual manera que en la ecuación 4.8, todas las derivadas parciales de 4.9 están evalua-
das en (xk, yk).
Ahora supóngase que xk+1 y yk+' están cerca de la raíz buscada (x, y) que los lados iz-
quierdos de las dos últimas ecuaciones son casi cero; además, asúmase que xk .y yk están
266 Métodos numéricos aplicados a la in geniería
4.3 Método de Newton-Raphson
El método iterativo para sistemas de ecuaciones converge linealmente. Como en el méto-
do de una incógnita, puede crearse un método de convergencia cuadrática, es decir, el mé-
todo de Newton-Raphson multivariabe, a continuación se obtendrá este procedimiento para
dos variables; la extensión a tres o más variables es viable generalizando los resultados.
Supóngase que se está resolviendo el sistema.
Nx, y) O
fzCx, y) O,
Donde ambas funciones son continuas y diferenciables, de modo que puedan expandirse
en serie de Taylor. Esto es:
f(x, y) = f(a, b) + -(x - a) + -(y - b) + - - - (x - a)2 +
df df 1 [ d2
f
dx dx 2! dxdx
2 - - (x - a)(y-b)+-- (y-b)2 + ...dy d
2
f 1
dxdy dxdy
dondef(x, y) se ha expandido alrededor del punto (a, b) y todas las derivadas parciales es-
tán evaluadas en (a, b).
Expandiendof l alrededor de (xk, yk)
_ _ _J 1_ (xk+ 1 _ xk)2 + 2 __J 1_ (xk+ 1 _ xk)(yk+ 1 _ yk) +1 [ d
U
d
U
2! dxdx dxdy
(4.8)
donde todas las derivadas parciales están evaluadas en (xk, yk). De la misma forma puede
expandirsef2 como sigue:
(4.9)
De igual manera que en la ecuación 4.8, todas las derivadas parciales de 4.9 están evalua-
das en (xk, yk).
Ahora supóngase que xk+ 1 y yk+1 están cerca de la raíz buscada (x, y) que los lados iz-
quierdos de las dos últimas ecuaciones son casi cero; además, asúmase que xk -y yk están
a
e
s-
.8)
e
.9)
a-
IZ-
Sistema de ecuaciones no lineales 267
tan próximos de y:k+ 1 que pueden omitirse los términos a partir de los que se encuentran
agrupados en paréntesis rectangulares. Con esto las ecuaciones 4.8 y 4.9 se simplifican a
(4.10)
Para simplificar aún más, se cambia la notación con
(4.11 )
y así queda la (k + l)-ésima iteración en términos de la k-ésima, como se ve a continuación
(4.12)
La sustitución de la ecuación 4.11 en la 4.10 y el rearreglo dan como resultado:
(4.13)
el cual es un sistema de ecuaciones lineales en las incógnitas h y j (recuérdese que las de-
rivadas parciales de la ecuación 4.13, así como 11y12
están evaluadas en (xk, yk) y, por tan-
to, son números reales).
Este sistema de ecuaciones lineales resultante tiene solución única, siempre que el de-
terminante de la matriz de coeficientes o matriz jacobiana J no sea cero; es decir, si
Precisando: el método de Newton-Raphson consiste fundamentalmente en formar y resol-
ver el sistema 4.13, esto último por alguno de los métodos vistos en el capítulo 3. Con la
solución y la ecuación 4.12 se obtiene la siguiente aproximación .
Este procedimiento se repite hasta satisfacer algún criterio de convergencia estableci-
do. Cuando converge este método, lo hace con orden 2, y requiere que el vector (xo' Yo) es-
té muy cerca de la raíz buscada (x, )1).
Sistema de ecuaciones no lineales 267
tan próximos de Y!+ 1 que pueden omitirse los términos a partir de los que se encuentran
agrupados en paréntesis rectangulares. Con esto las ecuaciones 4.8 y 4.9 se simplifican a
(4.10)
Para simplificar aún más, se cambia la notación con
(4.11)
y así queda la (k + l)-ésima iteración en términos de la k-ésima, como se ve a continuación
(4.12)
La sustitución de la ecuación 4.11 en la 4.10 y el rearreglo dan como resultado:
(4.13)
el cual es un sistema de ecuaciones lineales en las incógnitas h y j (recuérdese que las de-
rivadas parciales de la ecuación 4.13, así comoJI yJ2están evaluadas en (Y!, yk) y, por tan-
to, son números reales).
Este sistema de ecuaciones lineales resultante tiene solución única, siempre que el de-
terminante de la matriz de coeficientes o matriz jacobiana J no sea cero; es decir, si
Precisando: el método de Newton-Raphson consiste fundamentalmente en formar y resol-
ver el sistema 4.13, esto último por alguno de los métodos vistos en el capítulo 3. Con la
solución y la ecuación 4.12 se obtiene la siguiente aproximación.
Este procedimiento se repite hasta satisfacer algún criterio de convergencia estableci-
do. Cuando converge este método, lo hace con orden 2, y requiere que el vector (xo' Yo) es-
té muy cerca de la raíz buscada (x, ji).
268 Métodos numéricos aplicados a la ingeniería
INTERPRETACiÓN GEOMÉTRICA DEL MÉTODO DE NEWTON-RAPHSON
Desarrollemos en etapas esta interpretación para un sistema de dos ecuaciones. Sea el
sistema
f¡(x, y) = x2 + y2 - 1
Nx, y) = x2 - y2 - 1
La gráfica def¡(x, y) se muestra en la figura 4.4 .
10
2
»-> :
...·t··
.s->: , •••••••••••••••• : j¡(x,y).
......... ····1···
.'-' -~.... '
1" .
......! .
8
6
4
.... :
2
o ...¡.....
-2
2 ..... :
..:....•.::
Figura 4.4
Gráfica de la
superficie
fdx, y).
o
-1
-2 -2
Si el punto de inicio es (Xo' Yo) = (1, 1), el plano tangente a la superficie j.tx, y) en el pun-
to (1, 1,f(1, 1)) se muestra en la figura 4.5.
10
5
o
-5
Figura 4.5
Plano tangente -10
a la superficie 2
f1 (x, y) en el
punto (1,1,1).
268
Figura 4.4
Gráfica de la
superficie
f¡(x, y).
Figura 4.5
Métodos numéricos aplic a dos a la ingeniería
INTERPRETACiÓN GEOMÉTRICA DEL MÉTODO DE NEWTON-RAPHSON
Desarrollemos en etapas esta interpretación para un sistema de dos ecuaciones. Sea el
sistema
f¡(x, y) =X2 + y2 - 1
Nx, y) =x2 - y2 - 1
La gráfica def¡(x, y) se muestra en la figura 4.4.
10
8
6
4
2
o
- 2
2
.·······f······
o
.'··r·········.:····J·~I(X,y) !....
_---r" : ······L. .¡.....
.. " ~ .. ...."
......j
............::
-1
-1
o
-2 -2
.....:
2
Si el punto de inicio es (xo' Yo) = (1, 1), el plano tangente a la superficief¡(x, y) en el pun-
to (1 , 1,ft1 , 1)) se muestra en la figura 4.5.
10
5
o
- 5
Plano tangente - 10 2
a la superficie 2
fl (x, y) en el
punto (1,1,1).
Sistema de e cuaciones no lineales 269
La intersección del plano tangente con el plano x - y, en caso de existir, es una línea
recta r" como puede apreciarse en la figura 4.6.
ea el
..- ..-- .----_.- '-"
- -- _. - - -_. - -- ~- - --- -- - - -- -- _. ~- ---
- -" _.' - ~_.. .-- - --
lO
8
6
4
2
O
-2
-4
-6
-8
plano tangente j
af(x,y) i
". --~
Figura 4.6
Intersección del
plano tangente
y el plano x-y.
-LO
2
-2 -1-2
Si repetimos el procedimiento con la superficie fix, y), obtenemos la recta r2, como pue-
de apreciarse en la figura 4.7.
lpun-
.-----:--
lO
-- -'-- -~
: recta /'2
_.,- ~--'
:"'-.
5
plano x-y T···<, '.,
O
-5
-lO
2
_.- :~-:':-'
Figura 4.7
Intersección del
plano tangente
y el plano x-y
para la función
f2
(x, yj.
..:. '. "plano tangente, ... ::....
.- <, --..,.". a ¡.,ex,y) _.- -
•• -.-.---_.- ••• _---- __ o _', - _'"
2
".:
-1
O
-2 -2
Figura 4.6
Intersección del
plano tangente
y el plano x-y.
Figura 4.7
Intersección del
plano tangente
y el plano x-y
para la función
f2 (x, y).
S istema de ecuaciones no lineales 269
La intersección del plano tangente con el plano x - y, en caso de existir, es una línea
recta r" como puede apreciarse en la figura 4.6.
10
8
6
4
2
O
-2
-4
-6
-8
-10
2
-----------':-------------------:----
.-" ----~ - - -- - --.- - . - - ~- _.- .-_.--
____ __ f __ ------
-2 -2
..- ..-- .----_.-. ".
- 1
"T------
-- ---~---
-.-.~
'. plano'tangente j
af(x,y) i
". --~
Si repetimos el procedimiento con la superficief2(x, y), obtenemos la recta r2, como pue-
de apreciarse en la figura 4.7.
10
5
O
-5
-10
2 ..::.=
O
-1
-2
.-----"!
recta /'2
--.".-
- 2
:---.
ro.
--~--.--
Pla~ox->··"""-..j
..::.,... plano tangente ....
......:::::~.:....<.... a Nx,y) ::::... ".:
2
270 Métodos numéricos aplica dos a la ingeniería
Finalmente, la intersección de los dos planos tangentes con el plano x-y, en caso de
existir, es la intersección de la recta r, con la recta r2
, punto (x" y,), como puede verse en
la figura 4.8, donde se han omitido las superficies j.tx, y) y lix,y) a fin de mostrar más
claramente a (x" y,). Obsérvese que la intersección de las rectas r, y r2
corresponde a la
siguiente aproximación de una solución del sistema de ecuaciones no lineales .
.... 1'..
.... ;
...................¡ plano tangente
10 ..······pianotangente ¡ a/¡{x,y!.. /"',.r~""-
a Nx,y) .i->" j '" ."',,,"'/ <, /',/',..-,
f-'-'-
-v-, -;--v-.
5
o~_5i~-10
-15
2 2Figura 4.8
Intersección de
los planos
tangentes y el
plano xy.
x
-2 -2
Podemos apreciar que este punto tiene aproximadamente las coordenadas (x., y,) = (1, 0.5)
Y servirán como punto de partida para la siguiente iteración. El lector encontrará a conti-
nuación un inserto a color donde podrá observar mejor las intersecciones de las superfi-
cies y la raíz.
Un ejercicio interesante para el lector consistiría en identificar los pasos correspon-
dientes entre la interpretación gráfica dada y la del método de Newton-Raphson univariable;
por ejemplo, la recta tangente a la gráfica de ftx) en (xo, ftxo)) corresponde a la superficie
tangente a una de las gráficas del sistema en (xo, Yo,f(xo, Yo)), etcétera.
Use el método de Newton-Raphson para encontrar una solución aproximada del sistema.
Ejemplo ~] 1, (x, y) = x2-lOx + y2+ 8 = O I
12(x, y) = xy2 + X - lOy + 8 = O
con el vector inicial: [xc, yO]T = [O, O]T.
Solución Primero se forma la matriz coeficiente del sistema 4.13, también conocida como matriz de
derivadas parciales
di, =2x-1O
dx
dl_, _ = 2y
dy
dl'L- = 2xy 10
dy
270
Figura 4.8
Intersección de
los planos
tangentes y el
plano xy.
~-::1
Ejemplo 4.3
Métodos numéricos a plicados a la ingeniería
10
5
-5
- 10
-15
2
Finalmente, la intersección de los dos planos tangentes con el plano x-y, en caso de
existir, es la intersección de la recta r, con la recta r2, punto (x" y ,), como puede verse en
la figura 4.8, donde se han omitido las superficiesJ¡(x, y) yJix, y) a fin de mostrar más
claramente a (xi' y ¡). Obsérvese que la intersección de las rectas r¡ y r2 corresponde a la
siguiente aproximación de una solución del sistema de ecuaciones no lineales.
...................! plano tangente
....··piano tangente ¡ a!¡(x,y!..
a Nx,y) ....j.... ..'
ox
····r··
- 2 -2
f····
2
Podemos apreciar que este punto tiene aproximadamente las coordenadas (xl' y¡) = (1, 0.5)
Yservirán como punto de partida para la siguiente iteración. El lector encontrará a conti-
nuación un inserto a color donde podrá observar mejor las intersecciones de las superfi-
cies y la raíz.
Un ejercicio interesante para el lector consistiría en identificar los pasos correspon-
dientes entre la interpretación gráfica dada y la del método de Newton-Raphson univariable;
por ejemplo, la recta tangente a la gráfica de fix) en (xo, fixo)) corresponde a la superficie
tangente a una de las gráficas del sistema en (xo, yo,f(xo, Yo))' etcétera.
Use el método de Newton-Raphson para encontrar una solución aproximada del sistema.
J, (x, y) =X2 - lOx + y2 + 8 =O I
J2 (x, y) =xy2 + X - lOy + 8 =O
con el vector inicial: [xo, yO]T =[O, O]T.
Solución Primero se forma la matriz coeficiente del sistema 4.13, también conocida como matriz de
derivadas parciales
dJ¡ = 2x - 1O
dx
dJ_,_ = 2y
dy
dJ~ = 2xy 10
dy
atrizde
k Xk yk I xk+l - xk I
O 0.00000 0.00000
1 0.80000 0.88000 1.18929
2 0.99179 0.99171 0.22195
3 0.99998 0.99997 0.01163
4 1.00000 1.00000 0.00004
* Nótese que I x(l) - ¡¡ID) ! = Jh2 + j2
so de
r más
ea la
1,0.5)
conti-
uperfi-
espon-
iable;
erficie
ma.
Sistema de ecuaciones no lineales 271
que aumentada en el vector de funciones resulta en:
2y
2xy -10
Primera iteración
Al evaluar la matriz en [xo, yO]T se obtiene:
o
-10
que al resolverse por eliminación de Gauss da
h = 0.8, j = 0.88
al sustituir en la ecuación 4.12 se obtiene:
Xl = xO + h = O + 0.8 = 0.8
yl = yO + j = O + 0.88 = 0.88
Cálculo de la distancia entre x(O)y X(I)
I x(l) - x(O)I = )(0.8 - 0)2 + (0.88 - 0)2 = 1.18929
Segunda iteración
Al evaluar la matriz en [.xl; yl]T resulta
[
-8.4
1.7744
-1.41440J
-0.61952
1.76
-8.592
que por eliminación gaussiana da como nuevos resultados de h y j
h = 0.19179,j = 0.11171
de donde:
x2 = Xl + h = 0.8 + 0.19179 = 0.99179
y2 = yl + j = 0.88 + 0.11171 = 0.99171
Cálculo" de la distancia entre x(l) y x(2):
I x(2)- x(l) I = ) (0.99179 - 0.8)2 + (0.99171 - 0.88)2 = 0.22190
Con la continuación de este proceso iterativo se obtienen los resultados siguientes:
272 Métodos numéricos apli cados a la ingeniería
Hay que observar que se requirieron cuatro iteraciones para llegar al vector solución
(1,1) contra once del ejemplo 4.2, donde se usó el método de punto fijo con desplazamien-
tos sucesivos. Sin embargo, esta convergencia cuadrática implica mayor número de cálcu-
los, ya que, como se puede observar, en cada iteración se requiere:
a) La evaluación de 2 X 2 derivadas parciales.
b) La evaluación de 2 funciones.
e) La solución de un sistema de ecuaciones lineales de orden 2.
Estos cálculos pueden realizarse con Matlab o con la TI-92 Plus.
xO=O; yO=O;
fprintf(' k
fprintf(' %2d
for k=l : 4
df1x=2*xO-1 O; df1y=2*yO;
df2x=yOA2+1; df2y=2*xO*yO-10;
f1=xOA2-10*xO+yOA2+8;
f2=xO*yOA2+xO-10*yO+8 ;
A=[df1x df1y; df2x df2y];
b=[-f1; -f2];
trj=inv tAr=b,
x1=xO+hj (1); y1=yO+hj (2);
Dist= ( (x1-xO) A2+(y1-yO) A2) AO.5;
fprint(' %2d %10.5f %10.5f
xO=x1; yO=y1;
end
x (k)
%10.5f
Y (k) Ix(k+1) -x (k) 1 n')
%10.5fn' l O, xO, yO)
%10.5fn', k, xl, y1, Dist)
e4_3 (
Prgm
Define f1 (x, y) = xA2-10':'x+yA2+8
Define f2 (x, y) =x*yA
2+x-lCI'y+8
Define df1x(x, y) =2*x-10
Define df1y(x, y) =2*y
Define df2x(x, y) =yA
2+1
Define df2y(x, y) =2*x*y-10;
O->xO O->yO 0-> k CirIO
Disp"k x (k) y(k) Ix(k+1) -x(k)l"
string(k) &" "&format (xO, "f5")->d
d&" "%format (yO, "f5")--+d : Disp d
For k, 1, 4
[df1x(xO,yO) ,df1y(xO,yO); df2x(xO,yO) ,df2y(xO,yO) ]--+a
[-f1(xO, yO); -f2(xO,yO)]--+b
simuit(a,b)--+dx : xO+dx[l]--+x : yO+dx[2]--+y
norm (dx) +ai st: : norm (x) --+ x : norm (y)--+y
string(k) '&" "&format (x, "f5")-td
as" "&format (y1, "f5") +d : Disp d
x+xt) : y->yO
EndFor
EndPrgm
272 Métodos numéricos aplicados a la ingeniería
Ha~ que observar que se requirieron cuatro iteraciones para llegar al vector solución
(1, 1) contra once del ejemplo 4.2, donde se usó el método de punto fijo con desplazamien-
tos sucesivos. Sin embargo, esta convergencia cuadrática implica mayor número de cálcu-
los, ya que, como se puede observar, en cada iteración se requiere:
a) La evaluación de 2 X 2 derivadas parciales.
b) La evaluación de 2 funciones.
e) La solución de un sistema de ecuaciones lineales de orden 2.
Estos cá1cuios pueden realizarse con Matlab o con la TI-92 Plus.
xO=O ; yO=O ;
fprintf( ' k x (k) Y (k) Ix(k+1) -x (k) I n')
fprintf (' %2d %1 0.5f %10 . 5fn ', · O, xO , yO)
for k=l : 4
dflx=2*xO- 1O; dfly=2*yO ;
df2x=yO A 2+1; df2y=2*xO*yO-1 O;
f1=xO A2-10*xO+yOA2+8;
f2=xO*yOA2+xO-10*yO+8 ;
A=[df1x df1y; df2x df2y] ;
b=[-fl; -f2];
hj=inv (A) ':'b;
x1=xO+hj (1) ; y1=yO+hj (2);
Dist= ((x1-xO) A2+ (y1-yO) A2) AO. 5;
fprint ( , %2d
xO=x1 ; y O=y1 ;
end
Prgm
%10 . 5f %1 0.5f %10.5fn' , k, xl , y1 , Dist )
Define fl (x, y) = x A2-10':'x+yA2+8
Define f2 (x, y) =x*yA2+x-1(J''''y+8
Define dflx(x, y) =2*x-10
Define dfly (x , y ) =2*y
Define df2x (x, y ) =yA2+1
Define df2y(x , y) =2*x*y-10 ;
O->xO O->yO 0->k C1rIO
Disp "k x (k) y(k) Ix(k+1) -x (k)1 "
string(k) &" " &format (xO, " f5")->d
d&" " %format (yO , " f5") --+d : Disp d
For k, 1 , 4
[dflx(xO , yO) ,dfly(xO, yO); df2x(xO,yO) ,df2y(xO,yO) ]->a
[-fl (xO , yO) ; -f2 (xO ,yO) ] --+b
simu1t(a , b ) ->dx : xO+dx[l]->x : yO+dx[2]--+y
norm (dx) ->dist : norm (x) --+x : norm (y ) --+y
string (k ) '&" " &format (x, " f5 ") --+d
d& " " &format (y1, " f5 ") ->d : Disp d
x--+xO : y--+yO
EndFor
EndPrgm
ción
ien-
álcu-
1.5
,1
Con el fin de ayudar al lector a visualizar la idea de raíz y el método de Newton-Raph-
son, se presentan a continuación las gráficas de las Fig. 4.1 a la Fig. 4.8 a color.
10
..............
r········
" ..-.; .
-; ..... ---
-----f--- -o,
30
20
--'~' .,"
. ~ ---
r..···--······
:..
..........
z O
-10
-20
y -1 -1.5 -1
Figura 4.1 Intersección de la superficie fl (x, y) con el plano x-y.
30
20
10
....-.~-_.... __ .....
--' ~" -
-10
-20
1
1.5
0.5
Figura 4.2 Intersección de la superficie f2(x, y) con el plano x-y.
Con el fin de ayudar al lector a visualizar la idea de raíz y el método de Newton-Raph-
son, se presentan a continuación las gráficas de las Fig. 4.1 a la Fig. 4.8 a color.
.--'- ;-"
-;-_...--- ... .....:-._-
30
20
10
z O
-10
-20
.5
Figura 4.1 Intersección de la superficie fl (x, y) con el plano xy.
30
20
10
z O
-10
-20
1.5
x
Figura 4.2 Intersección de la superficie f2 (x, y) con el plano xy.
·'!!I
-----T---------
30
10
1-------------
.¡------ ---¡- ----~-
-----------------
20 -- ----~
- -_o~ _
.....
z O
-10
-20
Raíz
1.5
O 0.5
Y -1 -1.5 -1
Figura 4.3 Intersección de las superficies fl [x, yj y f2(x, yj con el plano x-y.
1
.............. :..•:::..,....
>::--
2
- _.' - ~-o_
8
.-' ~-
10 L
.-:-.-'
¡---.
o, "o. ~-o._
6
4
--0-00:
2
--o.;
O
-2
2
O
-1
-2 -2
Figura 4.4 Gráfica de la superficie fdx, yj.
10
t,(X:y)················· ~ , .
5
o
-5
2-10
2 1
-2 -2
Figura 4.5 Plano tangente a la superficie ~ (x, yj en el punto (1, 1. 1J.
10
8
6
·····-------:-----------------------l-------
1,···
4
2
O
-2
-4
-6 ----1
plano tangentej
af(x,y) .. ¡
...:::::,;... . :-8
-10
2
-2 -2 -1
Figura 4.6 Intersección del plano tangente y el plano xy.
10
5
o
-5
-10
2
punto de
-2
Figura 4. S Plano tangente a la superficie r,Ix. YI en el punto 11 , 1, I}.
10 .................!...................._._"["---.._......···-.·.-.·.-.--.1._....
......._---------_ ...!.-----------: :
¡ !
-----t------------- -
8
6
4
2
- 2
-6
-8
- 10
2
Figura 4.6 Intersección del plano tangente y el plano x:y.
.. plano tangente.!
.. af(x,y) .. i
.... i ......-...!
._------!
2
==
5
··----1
I recta r2
.-- - --'"'~- --r' '-nr.---.-_
-------;--.
r
r <. ¡:.----- -;
¡.___ r-----
p,~L~-yJ
10
o
-5
-10
2 --_::-'~~:---
...:::,,:.... plano tange~~~....:::>.....
.:::-::< a Nx,y) .'.::. .1
O 2
-1
-2 -2
Figura 4.7 Intersección del plano tangente y el plano x-y para la función f2
(x, y).
---r--
----1
......................¡ plano tangente
10 ..········píá"nütangente i af¡(x,y!...
aNx,y) ... .: ..'
5
Pa
.•..... ":
..;Piá,;;
O
z
-5
-10
-15
2 2
O
na
x
-2 -2
Figura ~.8 Intersección de los planos tangentes y el plano x-y.
-5
-10
2
O
10
5
1
O
- 1
- ---_:-:.~.-.-:--
----;-.,
-----r
r--
t
plano tangente____
-------- a .f;;(x,y) __-_-------
F¡9~ra4.
7
Inte"eCC/ón del plano tongente y el plano x,y Para la función "'x.J1.-2 -2 - 1
O
1
____o_oro
10 -------:-----------------T plano t~gente
----------plano tangente! af¡(x,y) _
a.f;;(x,y) ---1---- ______
5
O
z
-5
-10
-15
2
O
x
,
.-- :
-1
F¡9~r. ~.8Inte"eCC/ón de lo, Plano, tangente, y el plano x,y
-2 -2
-1
ro-o.
':----...
-'f-··.
r~ct~-;;---'7
'--'""-----...
1
2
2
Sistema de ecuaciones no l ineales 273
GENERALIZACiÓN
Para un sistema de n ecuaciones no lineales con n incógnitas (véase Ec. 4.1) y retornando
la notación vectorial y matricial, las ecuaciones 4.13 quedan:
di]
h] +
di]
h2 + +
di] h
=-/]
dx¡ dX2
dX
II
11
dl2
h] +
dl2
h2 + +
dl2
hll
=':"/2-
dx] dX2 dXn
(4.14)
dJ"
h] +
dJ"
h2 + +
dJ"
hl1 = -:J"
dx¡ dX2 dXn
o
lh =-f
donde las funciones f y las derivadas parciales d/¡I dxj
, i = 1,2, ... , n;j = 1,2, ... , n están
evaluadas en el vector x(k) y .
h. = x.k+] ~ xk
" , 1 :s; i:S; n (4.15)
De donde:
xk+] =xk+h.
, "
1:s; t-: n (4.16)
o
x(k+]) = x(k) + h(k)
y la matriz de derivadas parciales (matriz jacobiana), ampliada en el vector de funciones
queda:
di] dl¡ di]
-/]
dx] dX2 dXII
d/2 d/2 d/2
-/2
dx] dX2 dx"
dJ" dJ" ~f"
-J"
dx] dX2 dXn
(4.17)
o bien:
[ll-f]
Se presenta a continuación un algoritmo para este método.
ALGOR¡TMO 4.2 Método de Newton-Raphson multivariable
Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar la matriz jacobia-
na ampliada con el vector de funciones (véase Ec. 4.17) y los
DATOS: El número de ecuaciones N, el vector de valores iniciales x, el número máximo de iteraciones MA-
XIT y el criterio de convergencia EPS .
H
274 Métodos numéricos apli cados a la ingeniería
RESULTADOS: El vector solución xn o mensaje "NO CONVERGE".
PASO 1. Hacer K = 1.
PASO 2. Mientras K::; MAXIT, repetir los pasos 3 a 9.
PASO 3. Evaluar la matriz jacobiana aumentada (4.17).
PASO 4. Resolver el sistema lineal (4.14).
PASO S. Hacer" xn = x + h.
PASO 6. Si 1 xn - x l » EPS ir al paso 8 . De otro modo continuar.
PASO 7. IMPRIMIR xn y TERMINAR.
PASO 8. Hacer x = xn.
PASO 9. Hacer K = K + 1.
PASO 10. IMPRIMIR "NO CONVERGE" Y TERMINAR.
Ejemplo 4.4 Con algoritmo 4.2, elabore un programa de propósito general para resolver sistemas de
ecuaciones no lineales. Luego úselo para resolver el sistema.
J¡
1¡ (xi' x2' x3) = 3xI - cOS(x2x3) - 0.5 = O
11(XI' xl' X3) = x¡l - 625xl = O
f ( ) -xx 20 (1On:-3) O
3 Xi' x2, x3 = e '2 + X3 + 3 =
~
~
En el disco se presenta el programa 4.1, que consta de los subprogramas GAUSSJORDAN
y PIVOTEO, de propósito general; es decir, no dependen del sistema de ecuaciones para
resolver.
El usuario deberá escribir el programa principal que llama al subprograma FUNCIO-
NES, donde proporcionará la matriz jacobiana ampliada (Ec. 4.17).
La matriz jacobiana ampliada para el sistema es:
4.4Solución
o
-3xI + cOS(xlx3) + 0.5 ]
-x21 + 625x
-x < 20 10 rt - 3. -e '"2_ X3 ----
3
x3 sen (xzX3)
-1250xl
20
El programa queda finalmente como se muestra en el disco (programa 4.1). Su ejecución
con el vector inicial [1 1 I]T produce los siguientes resultados.
k Xl Xz x3
Distancia
O 1.00000 1.00000 1.00000
1 0.90837 0.50065 -0.50286 1.5863
2 0.49927 0.25046 -0.51904 0.47982
3 0.49996 0.12603 -0.52045 0.12444
4 0.49998 0.06460 -0.52199 0.61446E-Ol
5 0.49998 0.03540 -0.52272 0.29214E-Ol
6 0.49998 0.02335 -0.52302 0.12052E-Ol
7 0.49998 0.02024 -0.52309 0.31095E-02
8 0.49998 0.02000 -0.52310 0.23879E-03·
9 0.49998 0.02000 -0.52310 0.14280E-05
• Operaciones vectoriales.
a
0-
ión
Sistema de ecuaciones no lineales 275
La solución del sistema es:
XI 0.49998176
x2
0.19999269E-Ol
x3
-0.52310085
Los cálculos también pueden realizarse usando el guión de Matlab dado en el ejemplo
4.3, con los cambios correspondientes.
Nótese que en cada iteración se requiere:
a) La evaluación de n2 derivadas parciales,
b) La evaluación de n funciones,
e) La solución de un sistema de ecuaciones lineales de orden n,
lo que representa una inmensa cantidad de cálculos. Debido a esto, se han elaborado mé-
todos donde los cálculos no son tan numerosos y cuya convergencia es, en general, supe-
rior a la del método de punto fijo (superlineal). A continuación se presentan dos de estos
métodos, el de Newton-Raphson modificado y el método de Broyden, siendo este último
también una modificación del método de Newton-Raphson.
4.4 Método de Newton-Raphson modificado
El método de Newton Raphson modificado que se describe a continuación consiste en
aplicar el método de Newton-Raphson univariable dos veces (para el caso de un sistema
de n ecuaciones no lineales con n incógnitas, se aplicará n veces), una para cada variable.
Cada vez que se hace esto, se consideran las otras variables fijas.
Considérese de nuevo el sistema
11(X, y) = O
12(x, y) = O
Tomando los valores iniciales xO, yO, se calcula a partir del método de Newton-Raphson
univariable un nuevo valor xl así:
fJ1/ox evaluada en xD, yO.
Hay que observar que se ha obtenido xl a partir de 11
y los valores más recientes de x
y y: xO, yO.
Ahora emplearemos 12
y los valores más recientes de x y y: x', yO para calcular y1
l _ ° 12(Xl, yO)
Y -y - fJNfJy ,
donde fJ1ifJy se evalúa en xl, yO. Se tiene ahora xl y yl. Con estos valores se calcula X2, des-
pués y2, y así sucesivamente.
Este método converge a menudo si xD, yO está muy cerca de x, y, y requiere la evaluación
de sólo 2n funciones por paso (cuatro para el caso de dos ecuaciones que se está manejando).
Hay que observar que se han empleado desplazamientos sucesivos, pero los desplaza-
mientos simultáneos también son aplicables.
Sistema de ecuaciones no lineales 275
La solución del sistema es:
XI 0.49998176
x2 0.19999269E-01
x3 -0.52310085
Los cálculos también pueden realizarse usando el guión de Matlab dado en el ejemplo
4.3, con los cambios correspondientes.
Nótese que en cada iteración se requiere:
a) La evaluación de n2 derivadas parciales,
b) La evaluación de n funciones,
e) La solución de un sistema de ecuaciones lineales de orden n,
10 que representa una inmensa cantidad de cálculos. Debido a esto, se han elaborado mé-
todos donde los cálculos no son tan numerosos y cuya convergencia es, en general, supe-
rior a la del método de punto fijo (superlineal). A continuación se presentan dos de estos
métodos, el de Newton-Raphson modificado y el método de Broyden, siendo este último
también una modificación del método de Newton-Raphson.
4.4 Método de Newton-Raphson modificado
El método de Newton Raphson modificado que se describe a continuación consiste en
aplicar el método de Newton-Raphson univariable dos veces (para el caso de un sistema
de n ecuaciones no lineales con n incógnitas, se aplicará n veces), una para cada variable.
Cada vez que se hace esto, se consideran las otras variables fijas.
Considérese de nuevo el sistema
JI (x, y) = O
J2 (x, y) = O
Tomando los valores iniciales xO, yO, se calcula a partir del método de Newton-Raphson
univariable un nuevo valor xl así:
fJJ/fJx evaluada en xO, yO.
Hay que observar que se ha obtenido Xl a partir deJI y los valores más recientes de x
y y: xO, yO.
Ahora emplearemos J2 y los valores más recientes de x y y: x l, yO para calcular yl
I _ ° J2(Xl, yO)
Y - y - fJNfJy ,
donde fJJifJy se evalúa en xl, yO. Se tiene ahora Xl y yl. Con estos valores se calcula X2, des-
pués y2, y así sucesivamente.
Este método converge a menudo si xO, yO está muy cerca de x,y, y requiere la evaluación
de sólo 2n funciones por paso (cuatro para el caso de dos ecuaciones que se está manejando).
Hay que observar que se han empleado desplazamientos sucesivos, pero los desplaza-
mientos simultáneos también son aplicables.
d
276 Métodos numéricos aplicados a la ingeniería
Ejemplo 4.5 Resuelva el sistema
i, (x, y) = X2 - lOx + y2 + 8 = O
f2 (x, y) = xy2 + X - lOy + 8 = O
Con el método de Newton-Raphson modificado, usando los valores iniciales .xO = O,yO = O.
Puede seguir los cálculos con un pizarrón electrónico.
Solución Primero se obtiene:
d!, = 2.x_ 10
dX
y
d!2
-=2xy-1O
dy
Primera iteración
Se evalúan j'¡ y dj/dX en [O,O]T:
t.(O, O) = 8
y
se sustituye
8
xl =0---=0.8
-10
Para el cálculo de y' se necesita evaluar f2
y d!idy en x', yO
!2(0.8,0) = 0.8(0) + 0.8 - 10(0) + 8 = 8.8
df2
= 2(0.8)(0) - 10 =-10
dX xl
yO
se sustituye:
8.8
yl = O- -- = 0.88
-10
Segunda iteración
NO.8, 0.88) = 1.4144 = -8.4
x'
y'
y
x2 = 0.8 _ 1.4144 = 0.96838
-8.4
Ahora se evalüan z, y d!idY en (x2, y'):
!2(0.96838,0.88) = 0.91830 = -8.29565
x2
yl
y
276 Métodos numéricos aplicados a la ingeniería
Ejemplo 4.5 Resuelva el sistema
JI (x, y) =X2 - lOx + y2 + 8 =O
J2 (x, y) =xy2 + x - lOy + 8 =O
Con el método de Newton-Raphson modificado, usando los valores iniciales xfJ =O, yO =O.
Puede seguir los cálculos con un pizarrón electrónico.
Solución Primero se obtiene:
d!1 = 2x - 10
dx
y
d!2-= 2xy -1O
dy
Primera iteración
Se evalúan!1 y d/¡ldx en [O, O]T:
y
xfJ
=-10
yO
se sustituye
8
xl = O- - - = 0.8
-10
Para el cálculo de yI se necesita evaluar!2 y dJ/dy en Xl, yO
!2 (0.8,0) = 0.8(0) + 0.8 - 10(0) + 8 = 8.8
X l
= 2(0.8)(0) - 10 = -10
se sustituye:
Segunda iteración
yO
I
8.8
y =0--=0.88
- 10
/¡(0.8, 0.88) = 1.4144 y
Xl
yI
1.4144
x2 =0.8 - =0.96838
-8.4
Ahora se eva1úan!2 y d!2/dyen (x2, yl):
J2 (0.96838,0.88) = 0.91830 y
x2
yI
= -8.4
=-8.29565
Sistema de ecuaciones no lineales 277
de donde:
0.91830
y2 = 0.88 - = 0.99070
-8.59565
= O.
Los cálculos pueden continuarse y observarse con Matlab o con la TI-92 Plus
xO=O; yO=O;
fprintf(' k
fprintf ( , %2d
for k=l : 10
f1=xOA2-1U~xO+yOA2+8;
dflx=2*xO-1 O;
x1=xO-fl/dflx;
f2=x1*yOA2+x1-10*yO+8;
df2y=2* xl *yO-1 O;
y1=yO-f2/df2y;
fprintf(' %2d%10.5f%10.5f%10.5fn',
Dist= ( (x1-xO) A2+ (y1-yO) A2) AO. 5;
If Dist < Eps
Break
end
xO=x1; yO=y1;
end
k, xl, y1, Dist)
Eps=le-5;
x (k) Y (k) Distn')
%10.5f %1O.5fn', O, xO, yO)
e4_5 (
Prgm
Define f1(x,y) = xA2-10*x+yA2+8
Define f2 (x,y) =x*yA2+x-1U~y+8
Define df1x(x,y) =2*x-10
Define df2y(x,y) =2*x*y-10
O-+xO : O-+yO : O+k. : 1E-5->eps : CirIO
Disp "k x (k) y(k) Ix(k+1) -x (k) I "
string(k) &" "&format (xO, "f5")->d
d&" "&format (yO, "f5") +a : Disp d
for k, 1, 6
xO-fl (xO,yO) /dflx (xO,yO)-+x
yO-f2 (xO,yO) /df2y (xO,yO)->y
-Y ((x-xO) A2+ (y-yO) A2) =di st:
string (k) &" "&format (x, "f5")-+d
d&" "&format (y, "f5")-+d
d&" "&format (dist, "f5")->d: Disp d
x-+ xO : y-+ yO
EndFor
EndPrgm
l·
Se sugiere al lector continuar las iteraciones y calcular las distancias entre cada dos vec-
tores consecutivos. Continúe hasta que xk
"" 1 Y yk "" l. Compare además la velocidad de
convergencia de este método con la velocidad de convergencia del método de Newton-
Raphson y el de punto fijo para este sistema particular.
Sistema de ecuaciones no lineales 277
de donde:
0.91830
y2=0.88 - =0.99070
-8.59565
Los cálculos pueden continuarse y observarse con Matlab o con la TI-92 Plus
xO=O; yO=O ; Eps=le-5 ;
fprintf( ' k x(k) Y (k) Distn ')
fprintf (' %2d %10 . 5f %10 . 5fn ', O, xO , yO)
for k =l : 10
f1=xO A2-10'xO+yOA2+8;
dflx=2':'xO-1 O;
x1=xO-fl/dflx;
f2=x1*yOA2+x1-10*yO+8 ;
df2y=2*x1*yO-1 O;
y1=yO-f2/df2y;
fprintf( ' %2d%10 . 5f%10 . 5f%10 . 5fn', k , xl , y1 , Dist)
Dist= ((x1-xO) A2+ (y1-yO) A2) AO . 5 ;
I f Dist < Eps
Break
end
xO=x1; yO=y1 ;
end
Prgm
Define f1 (x , y) = x A2-10*x+yA2+8
Define f2(x , y) =x*yA2+x-10"y+8
Define dflx(x, y) =2*x-10
Define df2y(x , y) =2"x*y-10
O->xO : O->yO : O->k : 1E-5->eps : ClrIO
Disp "k x (k) Y (k) Ix(k+1) -x (k ) I "
string(k) &" "&format (xO, " f5")->d
d&" " &format (yO, "f5")->d : Disp d
for k, 1, 6
xO-fl (xO , yO)/dflx(xO ,yO) ->x
yO-f2 (xO,yO) /df2y (xO,yO)->y
,¡ ((x-xO) A2+ (y-yO) A2) ->dist
string (k) &" " &format (x, "f5") -> d
d&" " &format (y, " f5")->d
d&" " &format (di st , "f5") ->d : Disp d
x->xO : y->yO
EndFor
EndPrgm
Se sugiere al lector continuar las iteraciones y calcular las distancias entre cada dos vec-
tores consecutivos. Continúe hasta que xk "" 1 Yyk "" 1. Compare además la velocidad de
convergencia de este método con la velocidad de convergencia del método de Newton-
Raphson y el de punto fijo para este sistema particular.
278 Métodos numéricos apli cados a la ingeniería
En la aplicación de este método se pudo tomar f2 para evaluar xl y fl' a fin de evaluar
y1, así:
4
Xl = xO _ f2 (x
o
, ya)
af¡ax '
I, (x', ya)
yl = ya _ -----''-- __
af/oy ,
Esto puede producir convergencia en alguno de los arreglos y divergencia en el otro. Es po-
sible saber de antemano si la primera o la segunda forma convergirán" para el caso de siste-
mas de dos ecuaciones, pero cuando 3 ~ n las posibilidades son varias (n!) y es imposible
conocer cuál de estos arreglos tiene viabilidad de convergencia, por lo cual la elección se con-
vierte en un proceso aleatorio. Esta aleatoriedad es la mayor desventaja de este método.
En general, para un sistema de n ecuaciones con n incógnitas: x" x2' ... , XII' el algorit-
mo toma la forma:
1 ~ i ~ n (4.18)
al; I
-.. (k+ I k+ I k+ I k k)
OX¡ Xl ' X2 , ... Xi_1 ' Xi , ... 'Xn.
ALGORITMO 4.3 Método de Newton-Raphson modificado
Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar las funciones F (1,
x) y las derivadas parciales D (1, x) y los
DATOS: El número de ecuaciones N, el vector de valores iniciales x, el número máximo de iteraciones MA-
xrr, el criterio de convergencia EPS y M=O para desplazamientos sucesivos o Mel para desplaza-
mientos simultáneos.
RESULTADOS: El vector solución xn o mensaje "NO CONVERGE".
PASO l. Hacer K =1.
PASO 2. Mientras K:S; MAXIT, repetir los pasos 3 a 11.
PASO 3. Si M = O hacer* xaux = x.
PASO 4. Hacer 1 = 1.
PASO 5. Mientras 1 :s;N, repetir los pasos 6 y 7.
PASO 6. Si M = O hacer.
XCI) = X(I)-F(I,x)/D(I,x).
De otro modo hacer:
XAUX(I) = XCI) - F(I,x)ID(I,x).
PASO 7. Hacer 1 = 1 + 1.
PASO 8. Si I xaux -x I >EPS ir al paso LO.
De otro modo continuar.
PASO 9. IMPRIMIR x y TERMINAR.
PASO lO. Si M = l hacer x = xaux.
PASO ll. Hacer K = K + 1.
PASO 12. IMPRIMIR "NO CONVERGE" Y TERMINAR.
*' Operaciones vectoriales.
El método siguiente puede saltarse sin pérdida de continuidad .
• Peter A. Stark. lntroduction lo Numeral Methods. Ed. McMillan.
278 Métodos numéricos aplicados a la ingeniería
En la aplicación de este método se pudo tomarJ2 para evaluar x l yJI' a fin de evaluar
y1, así:
Xl = xO_ J2(xO, yO)
dJldX '
JI (Xl, yO)
y l= yO _ _ '-----__
dJ/ay ,
Esto puede producir convergencia en alguno de los arreglos y divergencia en el otro. Es po-
sible saber de antemano si la primera o la segunda forma convergirán*para el caso de siste-
mas de dos ecuaciones, pero cuando 3 ~ n las posibilidades son varias (n!) y es imposible
conocer cuál de estos arreglos tiene viabilidad de convergencia, por lo cual la elección se con-
vierte en un proceso aleatorio. Esta aleatoriedad es la mayor desventaja de este método.
En general, para un sistema de n ecuaciones con n incógnitas: x I' x2' . .. , XII' el algorit-
mo toma la forma:
1 ~ i ~ n (4.18)
dh I:'1 (k+ I k+ I k+ I k k)
ax¡ XI ' X2 , ... Xi_1 ' Xi , ... 'XH
ALGORITMO 4.3 Método de Newton-Raphson modificado
Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar las funciones F (1,
x) y las derivadas parciales D (1, x) y los
DATOS: El número de ecuaciones N, el vector de valores iniciales x, el número máximo de iteraciones MA-
x¡!r, el criterio de convergencia EPS y M=Opara desplazamientos sucesivos o M=l para desplaza-
mientos simultáneos.
RESULTADOS: El vector solución xn o mensaje "NO CONVERGE".
PASO l. Hacer K =1.
PASO 2. Mientras K :o; MAXIT, repetir los pasos 3 a 11.
PASO 3. Si M = Ohacer* xaux = x.
PASO 4. Hacer I = 1.
PASO 5. Mientras I :o; N, repetir los pasos 6 y 7.
PASO 6. Si M = Ohacer.
X(I) = X(I)-F(I,x)/D(I,x).
De otro modo hacer:
XAUX(I) = X(I) - F(I,x)ID(I,x).
PASO 7. Hacer 1= I + 1.
PASO 8. Si 1 xaux -x 1 >EPS ir al paso LO.
De otro modo continuar.
PASO 9. IMPRIMIR x y TERMINAR.
PASO lO. Si M =1 hacer x = xaux.
PASO l l. Hacer K = K + 1.
PASO 12. IMPRIMIR "NO CONVERGE" Y TERMINAR.
*' Operaciones vectoriales.
El método siguiente puede saltarse sin pérdida de continuidad.
* Peter A. Stark. lnlroduction lo Numeral Methods. Ed. McMillan.
Sistema de ecuaciones no lineales 279
4.5 Método de Broyden
Considérese ahora la generalización del método de la secante a sistemas multivariables,
conocido como el método de Broyden. Según se vio en el capítulo 2, el método de la se-
cante consiste en remplazar f I (xk
) del método de Newton-Raphson
(4.19)
por el cociente:
e-
le
n-
f(Xk) - f(xk_l) ""l' (x
k
),
xk
-xk
_
1
obtenido con los resultados de dos iteraciones previas: xk y xk+1.
Para ver la modificación o aproximación correspondiente del método de Newton-
Raphson multivariable, conviene expresarlo primero en forma congruente con la ecuación
4.19, lo que se logra sustituyendo en la ecuación vectorial (véase Ec. 4.16)
X(k+l) = x(k) + h(k) (4.20)
el vector h(k) que, como se sabe, es la solución del sistema
]<k) h(k) = _f{k)
Al multiplicar esta última ecuación por (J(k))-I se obtiene:
h(k) = _(]<k))-I f{k)
Y al remplazar la ecuación 4.21 en la 4.20 se llega a:
x(k+I) = xCk)_(J(k)tl f{k)
(4.21)
(4.22)
la ecuación correspondiente a la 4.14 para n > l.
El método de la secante para sistemas de ecuaciones no lineales consiste en sustituir
](k) en la ecuación 4.22 con una matriz A(k) , cuyos componentes se obtienen con los resul-
tados de dos iteraciones previas x(k) y x(k-I), de la siguiente manera":
[f(X(k)) - f(X(k-I)) _A(k-I) (x(k) _ x(k-l))] (X(k) _ xCk-I))T
A(k) = A(k-I) + _
l X(k) - x(k-I)J2
(4.23)
o bien:
(4.24)
con la notación
L'lf{k) = fX(k) - f(x(k-I))
L'lX(k) = x(k) - X(k-I)
Para la primera aplicación de la ecuación 4.24 se requieren dos vectores iniciales: x(O) y
x(l). Este último puede obtenerse de una aplicación del método de Newton-Raphson mul-
tivariable
* Dermis, J.E. Jr. y J.J. More (1977), "Quasi-Newton Methods, Motivation and Theory". SIAM Review, 19, No. 1
(46-89).
Sistema de ecuaciones no lineales 279
4.5 Método de Broyden
Considérese ahora la generalización del método de la secante a sistemas multivariables,
conocido como el método de Broyden. Según se vio en el capítulo 2, el método de la se-
cante consiste en remplazar! ' (xk) del método de Newton-Raphson
por el cociente:
! (Xk) - ! (xk_ l ) "" l' (x
k
),
xk
- xk
_
1
obtenido con los resultados de dos iteraciones previas: x k y x k+ 1.
(4.19)
Para ver la modif:.cación o aproximación correspondiente del método de Newton-
Raphson multivariable, conviene expresarlo primero en forma congruente con la ecuación
4.19, lo que se logra sustituyendo en la ecuación vectorial (véase Ec. 4.16)
X(k+l ) = X(k) + h (k)
el vector h (k) que, como se sabe, es la solución del sistema
J (k) h (k) =_ f{k)
Al multiplicar esta última ecuación por (J(k»)-I se obtiene:
h (k) = _(J(k»)- I f{k)
y al remplazar la ecuación 4.21 en la 4.20 se llega a:
X(k+ I) =x (k) _(¡(k»)- I f{k)
la ecuación correspondiente a la 4.14 para n > l.
(4.20)
(4.21)
(4.22)
El método de la secante para sistemas de ecuaciones no lineales consiste en sustituir
¡(k) en la ecuación 4.22 con una matriz A(k) , cuyos componentes se obtienen con los resul-
tados de dos iteraciones previas x (k) y x (k-Il, de la siguiente manera*:
[f(X(k») - f(X(k- I») _A(k- I) (X(k) _ x (k- l »)] (X(k) _ x (k-I»)T
A (k) =A (k- I ) + _ _ ___ _ __...,..,..,-_--,:-...,..,.-:,--_ _ _ ___
1X(k) _ x(k- I)12
o bien:
con la notación
[óf{k) - A (k- I) ÓX(k)] (óx(k»)T
A (k) = A (k- I) + __________ _
1 Ó x(k) 12
óf{k) = fX(k) - f(x(k-I»)
óx(k) = x (k) - X(k-I)
(4.23)
(4.24)
Para la primera aplicación de la ecuación 4.24 se requieren dos vectores iniciales: x (O) y
X( I). Este último puede obtenerse de una aplicación del método de Newton-Raphson mul-
tivariable
* Dennis, J.E. Jr. y J.J. More (1977), "Quasi-Newton Methods, Motivation and Theory". SIAM Review, 19, No.
(46-89).
Ir
em=
280 Métodos numéricos aplicados a la ingeniería
cuya J(O)a su vez puede emplearse en 4.24, con lo cual ésta queda:
(M(I) - J(O)~(l)) (L'lx(l))T
A(l)= J(O)+----------
1 L'lx(l) 12
(4.25)
La inversión de A (k) en cada iteración significa un esfuerzo computacional grande (del or-
den de n3) que, sin embargo, puede reducirse empleando una fórmula de inversión matri-
cial de Sherman y Morrison. * Esta fórmula establece que si A es una matriz no singular y
x y y son vectores, entonces A + xyT es no singular, siempre que yT A-I x =F l. Además,
en este caso,
A-I xyT A-I
(A+ xyT)-1 = kl - -----
1 + yT A-Ix
Esta fórmula permite calcular (A (k))-I a partir de (A (k-I))-I, eliminando la necesidad in-
vertir una matriz en cada iteración. Para esto, primero se obtiene la inversa de la ecua-
ción 4.24.
(4.26)
Después se hace:
A = A(k-I)
(M(k) _ A(k-I) ~(k))
x=-------
1 L'lx(k) 12
y
con lo que la última ecuación queda:
y sustituyendo la ecuación 4.26
_ A(k-I) -1 [(A(k-I))-I M(k) - ~(k)] (L'lX(k))T (A(k-I))-I
- ( ) - 1 ~(k) 12 + (~(k))T (A(k-I))-I L'lf'(k) _ 1 L'lx(k) 12
(4.27)
Esta fórmula permite calcular la inversa de una matriz con sumas y multiplicaciones de
matrices solamente, con lo que se reduce el esfuerzo computacional al orden n2 .
• ibid.
280 Métodos numéricos aplicados a la ingeniería
cuya JCO) a su vez puede emplearse en 4.24, con lo cual ésta queda:
(M(I) - JCO) ~(I)) (~x(l))T
A(J) = ](0) + ____----,-"..---::____
1 ~x(J) 12
(4.25)
La inversión de A(k) en cada iteración significa un esfuerzo computacional grande (del or-
den de n3) que, sin embargo, puede reducirse empleando una fórmula de inversión matri-
cial de Sherman y Morrison.* Esta fórmula establece que si A es una matriz no singular y
x y y son vectores, entonces A + xyT es no singular, siempre que yT A - I x 7: 1. Además,
en este caso,
A-I xyT A-I
(A + xyT)-1 = k l - - - - - -
1 + yT A-IX
(4.26)
Esta fórmula permite calcular (ACk))-I a partir de (ACk-I))-I, eliminando la necesidad in-
vertir una matriz en cada iteración. Para esto, primero se obtiene la inversa de la ecua-
ción 4.24.
Después se hace:
x=
y
con lo que la última ecuación queda:
y sustituyendo la ecuación 4.26
A = ACk- l)
(M(k) _ ACk- l) ~Ck))
1 ~XCk) 12
_ ACk-l) -1 _ [(ACk-I))-1 M(k) - ~Ck)] (~XCk))T (ACk-I))-1
- ( ) 1 ~Ck) 12 + (~Ck))T (ACk-I))-1~fCk) - 1 ~xCk) ¡z
(4.27)
Esta fórmula permite calcular la inversa de una matriz con sumas y multiplicaciones de
matrices solamente, con lo que se reduce el esfuerzo computacional al orden n2.
• ibid.
Sistema de e cuaciones no lineales 281
Ejemplo 4.6 Use el método de Broyden para encontrar una solución aproximada del sistema
¡I(x, y) = x2 - lOx + y2 + 8 = O
Nx, y) = xy2 + X - lOy + 8 = O,
tome como vector inicial: [xO, y0]T = [O,O]T.Se recomienda especialmente emplear un pi-
zarrón electrónico para llevar los cálculos, y así poner la atención en el algoritmo y en el
análisis de los resultados.
5)
oro
íri-
Y
Solución En el ejemplo 4.3 se encontró una solución aproximada de este sistema, empleando el mé-
todo de Newton-Raphson y el vector cero como vector inicial.
Con los resultados de la primera iteración del ejemplo 4.3
]<0) = [-10 0J
1 -10 '
(]<O))-I = [-0.1
-0.01
0J (1) = [0.8 J
-0.1 ' x 0.88a-
se calcula (A(1))-1 con la ecuación 4.23
(Llx(l) - (1(0))-1 M(I)) (Llx(l))T (J(O))-1
(A(1))-1 - (]<O))-I + -'---'--:,:-:-:::--::-,--,:-....,.c,......-:-'--
(Llx(l))T (J(O))-1 Llf'CI)
(A(I))-I = [-0.1
-0.01
0J + [~8] -[=~,
-0.1 [.8 JT
.88
-.~J [=~:~~~~8J[:~sJT [=:~1 -.~J
[ =:~l -.~J [=~:~~~~8J
=[-0.11015
-0.01546
-0.010079J
-0.105404
Se calcula ahora x(2) empleando la ecuación:
X(2) = x(l) - (A(l))-I f(l)
[
.8 J [-0.11015 -0.010079J 1l.4144 J
.88 - -0.01546 -0.105404 LO.61952
[
0.96208J
0.96720
7)
Para la segunda iteración se utilizarán las ecuaciones:
[Llx(2) - (A(l))-I M(2)] (Llx(2)? (A(l))-I
(A(2))-1 = (A(l))-I + _
(Llx(2)? (A(I))-I M(2)
y
de
Al sustituir valores se obtiene:
(3) = [0.997433J
x 0.996786
Sistema de ecuacion e s no lineales 281
Ejemplo 4.6 Use el método de Broyden para encontrar una solución aproximada del sistema
¡I(x, y) = x2 - lOx + y2 + 8 = O
Nx, y) =xy2 + X - lOy + 8 =O,
tome como vector inicial: [xO, yO]T = [O, OF. Se recomienda especialmente emplear un pi-
zarrón electrónico para llevar los cálculos, y así poner la atención en el algoritmo y en el
análisis de los resultados.
Solución En el ejemplo 4.3 se encontró una solución aproximada de este sistema, empleando el mé-
todo de Newton-Raphson y el vector cero como vector inicial.
Con los resultados de la primera iteración del ejemplo 4.3
](0) = [ -10 0J
1 -10 '
(1(0»)-1 = [ -0.1
-0.01
0J (1) = [ 0.8 J-0.1 ' x 0.88
se calcula (A(1»)-1 con la ecuación 4.23
(Llx(1) - (1(0»)-1 M(I») (Llx(l)? (1(0»)-1
(A(I»)-I - (1(0»)-1+ -'-___-'--_---'--'--_--'.....-__
(~(l»)T (1(0»)-1 M'(I)
(A(I»)-I = [-0.1
-0.01
0J + [~8]-[=~l
-0.1 [.8 ] T
.88
-.~J [=~:;~~~8J [:~8J T [=:~1 -.~J
[ =.~1 -.~J [=~:;~~~8J
=[-0.11015
-0.01546
-0.010079J
-0.105404
Se calcula ahora x(2) empleando la ecuación:
X(2) = x(l) - (A(l»)-l r ( l)
[
.8 J [ -0.11015 -0.010079J 1l.4144 J
.88 -0.01546 -0.105404 LO.61952
[
0.96208J
0.96720
Para la segunda iteración se utilizarán las ecuaciones:
[~(2) _ (A(l»)-I M(2)] (~(2)? (A(l»)-I
(A(2»)-1 = (A(l»)-I + _____________
(~(2)? (A(l»)-I M(2)
y
Al sustituir valores se obtiene:
(3) = [0.997433J
x 0.996786
282 Métodos numéricos aplicados a la ingeniería
La continuación de las iteraciones da
X(4) =
[
0.9999037J
0.9998448 '
[
0.9999999849J
0.9999999722 '
X(5) = [0.999998157J
0.999996667
x(7) = [~JX(6) =
que es la solución del sistema, tal como se obtuvo en los ejemplos 4.2 y 4.3.
Los cálculos pueden realizarse con Matlab o con la TI-92 Plus.
~
x=[O O]; Eps=le-8;
fprintf(' k x(k) y(k)n')
fprintf(' %2d %10.6f %10.6fn',0,x(l),x(2))
fl=x(l)A2-10*x(l)+x(2)A2+8;
f2=x (1) *x (2) A2+x (1) -10*x (2) +8;
dflx=2*x(l)-10; dfly=2*x(2);
df2x=x (2) A2+1; df2y=2*x (1) *x (2) -10;
J=[dflx dfly; df2x df2y];
FO=[fl; f2]; Jl=inv(J); dx=-Jl*fO; xl=x+dx';
for k=1:25
f1=xl (1) A2-10*xl (1) +xl (2) A2+8;
f2=xl (1) *xl (2) A2+xl (1) -10*xl (2) +8;
f=[fl; f2]; df=f-fO¡
Al=Jl+ (dx-Jl*df) *dx'*Jl/ (dx'*Jl*df);
dx=-Al*f; x2=xl+dx'; Dist=norm(x2-xl);
fprintf(' %2d %10.6f %10.6f %10.5en', ...
k,xl (1) ,xl (2) ,Dist)
xl=x2; Jl=Al; fO=f;
if Dist < Eps; break; end
end
F
F
F
p
e4 6 (
Prgm
Define fl(x)=x[1,1]A2-10*x[1,1]+x[1,2]A2+8
Define f2 (x) =x[1,1]*x[1,2] A2+x[1,l}-lO*x[1,2]+B
Define dflx(x)=2*x[1,1]-lO : Define dfly(x)=2*x[1,2]
Define df2x(x)=x[1,2]A2+1
Define df2y (x) =2*x [1, l]*x [1,2] -10
[O,O]--->x : lE-5--->eps : Or+k: : ClrIO
Disp "k x (k) y (k) l x (k+l) -x (k) I
string (k) &format (x [1,1] , "f7")--->d
ds " "&format(x[1,2],"f7")--->d : Disp d
[dflx(x),dfly(x);df2x(x),df2y(x)]--->j
[fl(x);f2(x)]--->fO: jA-l--->jl : -jl*fO--->dx: x+dxt=+x L
For k,1,25
[fl(x1);f2(x1)]--->f: f-fO--->dff
j 1+ (dx-j l*dff) *dxT* j l/norm (dxT*j l*dff) --->al
-al*f--->dx : xl+dxT--->x2 : norm (x2-xl) +ai s t:
string (k) &format (x2 [1,1], "f7")--->d
as : "&format(x2[1,2],"f7")--->d
ds " "&format (dist, "f5")--->d : Disp d
x 2---> xl al--->jl: f--->fO
if dist < Eps
exit
EndFor
EndPrgm
282 Métodos numéricos aplicados a la ingeniería
La continuación de las iteraciones da
X(4) = [0.9999037J
0.9998448 '
X (6) = [0.9999999849J
0.9999999722 '
X(5) = [0.999998157J
0.999996667
x(7) = [~J
que es la solución del sistema, tal como se obtuvo en los ejemplos 4.2 y 4.3.
Los cálculos pueden realizarse con Matlab o con la TI-92 Plus.
x=[O O]; Eps=le-8;
fprintf(' k x(k) y(k)n')
fprintf (' %2d %10.6f %1 0.6fn',0,x(l),x(2))
fl=x (l) A2-10*x(l)+x(2 ) A2+8;
f2=x (1) *x (2) A2+x (1) -lO*x (2) +8;
df1x=2*x (l)-10; df1y=2*x(2);
df2x=x (2) A2+1; df2y=2*x (1) *x (2) -10;
J=[df1x df1y; df2x df2y];
FO=[f1; f2]; J1=inv(J); dx=- J1*fO ; x1=x+dx';
for k=1:25
f1=xl (1) A2- 10*xl (1) +xl (2) A2+8;
f2=xl (1) *xl (2) A2+xl (1) -lO*xl (2) +8;
f=[fl; f2]; df=f- fO;
A1=J1+ (dx-J1*df) *dx'*J1/ (dx'*J1*df);
dx=- A1*f; x2=x1+dx'; Dist=norm(x2 - x1);
fprintf(' %2d %10 .6f %10 .6f %10 .5en', ...
k,x1 (1) ,xl (2) ,Dist)
x1=x2; J1=A1; fO=f;
if Dist < Eps; break; end
end
e4 6 ( )
Prgm
Define f1(x)=x[1,1]A2-10*x[1,1]+x[1 ,2]A2+8
Define f2 (x) =x[1,1 ]*x[1,2] A2+x[1,1] -lO*x[1,2]+8
Define dflx(x)=2*x[1 , 1]-lO : Define dfly(x)=2*x[1,2]
Define df2x(x)=x[1,2]A2+1
Define df2y (x) =2*x [1, l]*x [1,2] -10
[O,O]--->x : 1E-5--->eps : O--->k : C1rIO
Disp "k x (k) y (k) Ix (k+1) -x (k) I
string(k) &format (x[l,l], "f7")--->d
d&" " &format (x [1,2], "f7") ---> d : Disp d
[df1x(x) ,df1y(x) ; df2x(x),df2y(x)]--->j
[fl(x);f2(x)]--->fO: jA-l--->jl: -j1*fO--->dx: x+dxT--->x1
For k , 1,25
[fl(xl);f2(xl)]--->f: f - fO--->dff
j 1 + (dx-j l*dff) *dxT* j l/norm (dxT* j l*dff) --->al
-a1*f--->dx : x1+dxT--->x2 : norm (x2 - x1) --->dist
string (k) &format (x2 [1 ,1] , "f 7")--->d
d&" "&format(x2[1,2],"f7")--->d
d&" " &format(dist,"f5")--->d : Disp d
x 2--->xl a1--->jl: f ---> fO
if dist < Eps
exit
EndFor
EndPrgm
Sistema de ecuaci ones no lineales 283
A continuación se presenta el algoritmo para este método.
ALGORITMO 4.4 Método de Broyden
Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar la matriz jacobia-
na ampliada con el vector de funciones (véase Ec. 4.17) y los
DATOS: Número de ecuaciones N, dos vectores de valores iniciales: xO y xl, el número máximo de iteracio-
nes MAXIT y el criterio de convergencia EPS.
RESULTADOS: Una aproximación a una solución: xn o el mensaje "NO CONVERGE"
PASO 1. Calcular AK, la matriz inversa de la matriz jacobiana evaluada en xO.
PASO 2. Hacer K = l.
PASO 3. Mientras K::::;MAXIT, repetir los pasos 4 a 10.
PASO 4. Calcular fO y f'l , el vector de funciones evaluado en xO y xl, respectivamente.
PASO 5. Calcular (*)dx = xl - xO; df = fI - fo.
PASO 6. Calcular AK1, la matriz que aproxima a la inversa de la matriz jacobiana (4.22), con la ecuación
(4.27), usando como (A(k-1lt1 aAK.
PASO 7. Calcular (*) xn = xl -AKl * n.
PASO 8. (*) Si I xn - xl I ::::;EPS ir al paso 11. De otro modo continuar.
PASO 9. Hacer (*) xO = xl; xl = xn; AK =AKl (actualización de xO, xl y AK).
PASO 10. Hacer K = K + 1
PASO 11. Si K::::;MAXIT, IMPRIMIR el vector xn y TERMINAR.
De otro modo IMPRIMIR "NO CONVERGE" YTERMINAR.
* Operaciones matriciales.
4.6 Aceleración de convergencia
Al igual que en los capítulos anteriores, una vez que se tienen métodos de solución funcio-
nales, se mejorarán o crearán nuevos algoritmo s usando dicho conocimiento. También, co-
mo ya se ha visto, esto se logra con un proceso de generalización y abstracción. Se
procederá en esa dirección enseguida.
En cada iteración de los algoritmos vistos se parte de un vector X(k que ahora se lla-
mará punto base; desde ese punto se camina en una dirección, dada por un vector, que se
denominará dirección de exploración. Considérese la figura 4.9 y el punto base (.xO, yO)"' =
(2, 2). Si desde el punto base se camina en la dirección del vector d(O) = [4, l ]", se ter-
minará pasando por el punto P (6, 3).
Ry
Punto base
(.xD,yO) = (2,2)
Figura 4.9
Punto base y
vector de
exploración.
~=-_________________________________________ x
Dirección de
exploración
* De aquí en adelante se usará indistintamente n-adas ordenadas (xi' x2, ... , x,,) para representar un vector de n
elementos y un punto en el espacio n-dimensional.
Sistema de ecuaciones no lineales 283
A continuación se presenta el algoritmo para este método.
ALGORITMO 4.4 Método de Broyden
Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar la matriz jacobia-
na ampliada con el vector de funciones (véase Ec. 4.l7) y los
DATOS: Número de ecuaciones N, dos vectores de valores iniciales: xO y xl, el número máximo de iteracio-
nes MAXIT y el criterio de convergencia EPS.
RESULTADOS: Una aproximación a una solución: xn o el mensaje "NO CONVERGE"
PASO 1. Calcular AK, la matriz inversa de la matriz jacobiana evaluada en xO.
PASO 2. Hacer K = l.
PASO 3. Mientras K:::; MAXIT, repetir los pasos 4 a 10.
PASO 4. Calcular ro y fl, el vector de funciones evaluado en xO y xl, respectivamente.
PASO 5. Calcular (*)dx = xl - xO; df = fl - ro.
PASO 6. Calcular AKJ, la matriz que aproxima a la inversa de la matriz jacobiana (4.22), con la ecuación
(4.27), usando como (A(k-l)-I a AK.
PASO 7. Calcular (*) xn = xl - AKl *n .
PASO 8. (*) Si I xn - xl I :::; EPS ir al paso 11. De otro modo continuar.
PASO 9. Hacer (*) xO = xl; xl =xn; AK =AKl (actualización de xO, xl yAK).
PASO 10. Hacer K = K + 1
PASO 11. Si K:::; MAXIT, IMPRIMIR el vector xn y TERMINAR.
De otro modo IMPRIMIR "NO CONVERGE" YTERMINAR.
* Operaciones matriciales.
4.6 Aceleración de convergencia
Al igual que en los capítulos anteriores, una vez que se tienen métodos de solución funcio-
nales, se mejorarán o crearán nuevos algoritmos usando dicho conocimiento. También, co-
mo ya se ha visto, esto se logra con un proceso de generalización y abstracción. Se
procederá en esa dirección enseguida.
En cada iteración de los algoritmos vistos se parte de un vector x(k que ahora se lla-
mará punto base; desde ese punto se camina en una dirección, dada por un vector, que se
denominará dirección de exploración. Considérese la figura 4.9 y el punto base (xO,yO)"' =
(2, 2). Si desde el punto base se camina en la dirección del vector deO) = [4, Ir, se ter-
minará pasando por el punto P (6, 3).
y R
Figura 4.9
Punto base y
vector de
exploración.
Punto base
(.fl,yO) = (2,2)
Dirección de
exploración
~~_________________________________________ x
* De aquí en adelante se usará indistintamente n-adas ordenadas (xi' x2, ... , x,,) para representar un vector de n
elementos y un punto en el espacio n-dimensional.
284 Métodos numéricos aplicados a la ingeniería
Al avanzar en cierta dirección de exploración a partir de un punto base, se llega a un
nuevo punto que va a ser base para la siguiente iteración, pudiera ser el punto P (6, 3) o
cualquier otro punto de R que dará la ecuación vectorial.
x(1) = x(O) + t d (O)
o en forma más general
I x(k+l) = X(k) + t d (k) I (4.28)
donde t es el factor de tamaño de la etapa y determina la distancia del desplazamiento en la
dirección especificada. Esta ecuación se obtiene fácilmente por la suma de vectores en el pla-
no, como se muestra en la figura 4.10.
Para aclarar esta generalización, se identifica el algoritmo de Newton-Rapshon para
sistemas de dos ecuaciones no lineales con la ecuación 4.28.
Primero se reescribe la ecuación 4.13.
di1 (k+' k) di1 (yk+l k) - f (-_1- k)
Tx x - x + ay -y - - 1 X', Y
para pasarla a notación matricial como sigue:
y
R
Figura 4.10
Suma de
vectores en el
plano.
x(l) = x(O) + t d(O)
x
que ahora, multiplicada por la inversa de la matriz jacobiana, llega a la forma
di, di1
-1
dX dY " [f,(",,,~]["" "] Fi!j
Inf/L
di2 di2 Nxk,yk ) k+l kY -y e
dX dy
a un
3) o
.28)
en la
pla-
para
1
Sistema de ecuaciones no lineales 285
o también:
[
X
k
+
l
] [Xk]
yk+1 yk
(4.29)
-1
y en esa última forma, ya como ecuación vectorial, se tiene la identificación total con la
ecuación 4.28, con:
-1
Hay que observar que en el método de Newton-Rapshon, el factor de tamaño de la etapa
es constante en todos los pasos iterativos del proceso y que d(k) el vector de exploración, es
el resultado de multiplicar la inversa de la matriz jacobiana por el vector de funciones.
MÉTODO DE NEWTON RAPHSON CON OPTIMIZACIÓN DE t
Con la ecuación 4.28 puede estudiarse cómo mejorar los métodos disponibles; por ejem-
plo, se puede ver que en el algoritmo de Newton-Raphson tomar distintos valores de t lle-
varía a distintos vectores x(k+l}, alguno más cercano a la raíz x que los demás (véase Fig.
4.11). La mejora es optirnizar el valor de t en el método de Newton-Rapshon.
Para ejemplificar, tómense los valores de la primera iteración del ejemplo 4.3:
k = O; X
k
= O; h = 0.8 j = 0.88yk = O;
de aquí d(k) = [-0.8 - 0.88]T
y la ecuación 4.29 queda:
X(k+I) = xk + t df
y(k+I) = yk + t d§
(x', yI)
5
t(x', yI)
4
t
•
(xo, yO)
(x', yl)
t3
t t •
t
con t = 2
•2
• tcon t = .5
con t = 1
• xFigura 4.11
Influencia de t
en el vector
xlk+l1. O 2 3 4 5 6 7 8 9 10
286 Métodos numéricos aplicados a la ingeniería
Se lista ahora una serie de valores de t y los correspondientes valores de x(k+I):
t X(k+l) yCk+l)
-0.50 0.4 0.44
-.075 0.6 0.66
-1.00 0.8 0.88
-1.25 1.0 1.10
-1.50 1.2 1.32
Para determinar cuál de las x(k+1) está más cerca de la raíz x, se desarrolla un nuevo crite-
rio de convergencia o avance sustentado en la definición de residuo de una funciónf(x, y),
dada esta última así:
El residuo de una funciónf (x, y) en un punto (xk, yk) es el valor de f en (xk, yk).
ASÍ, en el sistema
fl (x, y) = x2 + y2 - 4 = O
f2 (x, y) = y - x2
= O
en el punto (1, 1) los residuos son:
I, (1,1) = 12 + 12 - 4 =-2
y
En general, el valor de la función suma de residuos al cuadrado
(4.30)
será indicativa de la cercanía de x(k) con la raíz x.
Con la aplicación de este concepto a los distintos vectores X(k+I) obtenidos arriba, se tiene
Para t = -0.5
Zk+1 = [0.42 - 10(0.4) + 0.442 + 8]2 + [0.4(44)2 + 0.4 - 10(0.44) + 8]2 = 35.57
Para t = -0.75 : Zk+1 = 12.93
Para t = -1.0: Zk+1 = 2.38
Para t = -1.25 : Zk+1 = 0.67
Para t = -1.5 : Zk+1 = 4.31
De donde x(k+I) correspondiente a t = -1.25 resulta ser el más cercano a la raíz x = [1, l]T.
Los valores propuestos de t anteriormente, se eligieron de manera arbitraria alrededor
de -1 y aunque el valor de -1.25 es el mejor de ellos, no es el óptimo de todos los valores
posibles para la primera iteración.
A continuación se da una forma de seleccionar los valores de t.
Se selecciona un intervalo de búsqueda [a, b], dentro de ese intervalo se calculan va-
lores de t de la siguiente manera:
b-a
t=a+--
F
y
b-a
t=b---
F
te-
.j),
.30)
erre
or
res
va-
Sistema de ecuaciones no lineales 287
donde F son los términos de la serie de Fibonacci.
F = 1, 1, 2, 3, 5, 8, 13,21, 34, 55, ...
Para cada valor de t se calcula su correspondiente Zk+l' y el valor mínimo Zk+l proporcio-
nará el valor óptimo de t.
Así, seleccionando el intervalo [-l.2, -1], el valor mínimo de Zk+l (= 0.4578) corres-
ponde al valor óptimo de t (= -l.184) en la primera iteración de la solución del ejemplo 4.3
Una vez encontrado el valor óptimo de t se toma el vector xCI) correspondiente y se calcula
d(l) para proceder a optimizar el valor de t en la segunda iteración:
x(2) = x(l) + t d(l)
Ejemplo 4.7 Modifique el programa del ejemplo 4.4 para incluir la optimización de t.
Utilizando el programa resultante, resuelva el sistema del ejemplo 4.4.
Solución Las modificaciones consisten en:
- Elaborar un subprograma para encontrar el valor de t que minimice la función Zk'
utilizando la búsqueda de Fibonacci.
- Modificar el subprograma NEWTON del ejemplo 4.4 para utilizar ahora como cri-
terio de convergencia o avance la función de Zk y la llamada al subprograma de bús-
queda de Fibonacci.
En el CD (PROGRAMA 4.2) se muestran los subprogramas NEWOPT y BUSCA resultantes.
El programa principal y los subprogramas SIMULT y PIVOTEO no sufren cambio alguno.
Con el programa resultate y con los valores iniciales
xCO) = [1 1 I]T
se obtienen los siguientes resultados:
VARI 1 1.00000 l.00000 l.00000
FUNC 1 1.95970 -624.00000 29.83985
SUMA .39027E+06 TOPT= l.833
VARI 2 .83201 .08453 -1.75525
FUNC 2 1.00701 -3.77371 -24.70092
SUMA .62539E+03 TOPT= .9000
VARI 3 .53770 .04775 -.64629
FUNC 3 .11359 -1.13613 -2.47923
SUMA .74503E+Ol TOPT= .9000
VARI 4 .50380 .03001 -.53527
FUNC 4 .01153 -.30917 -.24846
SUMA .15745E+00 TOPT= 1.167
VARI 5 .49935 .02028 -.52103
FUNC 5 -.00190 -.00767 .04138
SUMA .17748E-02 TOPT= .9000
VARI 6 .49992 .02003 -.52289
FUNC 6 -.00019 -.00081 .00414
SUMA .17817E-04 TOPT= .9000
VARI 7 .49998 .02000 -.52308
FUNC 7 -.00002 :-.00008 .00041
SUMA .17825E-06 TOPT= .9000
ti
288 Métodos numéricos apli cados a la ingeniería
La solución del sistema es:
X(l) = .49998116
X(2) = .19999571E-Ol
X(3) = -.52309883
Obsérvense los valores de TOPT en las diferentes iteraciones.
Los cálculos pueden realizarse con el siguiente guión de Matlab que usa la función
min4_7 que hace la búsqueda de Fibonacci descrita anteriormente. Las instrucciones que
conforman la función deben guardarse en un archivo separado con el nombre min4_7.m y
posteriormente escribir el guión que la llama, grabarlo y ejecutarlo.
function f=min4_ 7 (X,Dx)
A = 0.5; B = 2.5; NP O; NU = 1; Menor = 1000000000; Top 1;
for i = 1:20
NF = NU + NP; T = A + (B - A) /NF; XX=X+'1*Dx';
Suma=(-3*XX(1) +cos (XX(2)*XX (3) ) +0.5) "'2+...
(-XX (1) "'2+ 625*XX (2) "'2) "'2+...
(-exp (-XX (1) *XX(2) ) -20*XX (3) - (10*pi -3) /3) "'2;
if Suma < Menor
Menor = Suma;
Topt = T;
end
T = B - (B - A) /NF; XX=X+1*Dx';
Suma=(-3*xx (1) +cos (XX(2) *XX (3)) +0.5) A2+...
(-XX (1) "'2+ 625*XX (2) A2) A2+...
(-exp (-XX (1)*XX (2)) -20*XX(3) - (UJ'pi-3) /3) A2;
if Suma < Menor
Menor = Suma;
Topt = T;
end
NP = NU; NU = NF;
end
f=Topt;
n=3; x=[l 1 1J; Maxit=25; Eps=le-5;
Dist=l;
Fprintf (' k xl x2 x3')
fprintf(' Dist Toptn')
fprintf(' %2d %10.5f %10.5f %10.5fn',0,x(1),x(2),x(3))
for k=l:Maxit
J=[3 x(3)*sin(x(2)*x(3)) x(2)*sin(x(2)*x(3)); ...
2*x(1) -1250*x(2) O;
-x(2)*exp(-x(1)*x(2)) -x (l)*exp (-x (l)*x (2)) 20];
b= [-3'x (1) +cos (x (2) *x (3)) +0. 5; ...
-x (1) "'2+625*x (2) A2; ...
-exp (-x (1) *x (2)) -20*x (3) - (10*pi -3) /3] ;
dx=i.nv t-Ji=b t t=l : t=min4_7(x,dx); xl=x+t*dx';
Dist=norm(xl-x);
fprintf(' %2d %10.5f %10.5f %10.5f %10.5e %6.3fn', ...
k,xl (1) ,xl (2) ,xl (3) ,Dist, t)
if Dist < Eps
break
end
x=xl;
end
288 Métodos numéricos aplicados a la ingeniería
La solución del sistema es:
XCI) = .49998116
X(2) =.19999571E-Ol
X(3) =-.52309883
Obsérvense los valores de TOPT en las diferentes iteraciones.
Los cálculos pueden realizarse con el siguiente guión de Matlab que usa la función
min4_7 que hace la búsqueda de FilJonacci descrita anteriormente. Las instrucciones que
conforman la función deben guardarse en un archivo separado con el nombre min4_7.m y
posteriormente escribir el guión que la llama, grabarlo y ejecutarlo.
function f=min4_7 (X,Dx)
A = 0.5; E = 2.5; NP o; NU = 1; Menor = 1000000000; Top
for i = 1:20
NF = NU + NP; T = A + (E - A) /NF; XX=X+'1*Dx';
Suma= (-3*XX (1) +cos (XX (2)*XX (3) ) +0 .5) "'2+...
(-XX (1) "'2+625*XX (2) "'2) "'2+...
(-exp (-XX (1) *xx (2)) -20*XX (3) - (10*pi - 3) /3) "'2;
if Suma < Menor
Menor = Suma ;
Topt = T;
end
T = E - (E - A) / NF; XX=X+1*Dx';
Suma= (-3*xx (1) +cos (XX (2) *XX (3)) +0.5) A2+...
(-XX (1) "'2+625*XX (2) A2) A2+...
(-exp (- XX (1)*XX (2)) -20*XX (3) - (10*pi-3) / 3) A2;
if Suma < Menor
Menor = Suma;
Topt = T;
end
NP = NU; NU = NF;
end
f=Topt ;
n=3; x=[l 1 11; Maxit=25; Eps=le-5;
Dist=l ;
F'printf (' k xl x2 x3')
fprintf(' Dist Toptn')
fprintf(' %2d %10.5f %10 .5f %10.5fn',0,x(l),x(2 ), x (3))
for k=l:Maxit
J=[3 x (3)*sin (x(2)*x(3)) x(2)*sin(x(2) *x(3));...
2*x(l) -1250*x(2) O;
-x(2)*exp(- x(l)*x(2)) -x (1)*exp (-x (l)*x (2)) 201 ;
b=[-3'x (1) +cos (x (2) *x (3)) +0. 5 ; ...
-x (1) "'2+625*x (2) A2; ...
-exp (-x (1) *x (2)) -20*x (3) - (10*pi - 3) /3] ;
dx=inv(J)*b ; t=l; t=min4_7 (x,dx); xl=x+t*dx';
Dist=norm(xl-x);
fprintf( ' %2d %10 . 5f %10 . 5f %10 . 5f %10.5e %6.3fn', ...
k,xl (1) ,xl (2) ,xl (3) , Dist, t)
if Dist < Eps
end
x=xl;
end
break
1;
ción
que
7.my
1;
SistelT1ade ecuaciones no lineales 289
e4_7 ( )
Prgm
@ Inicia el subprograma para búsqueda de Fibonacci
local min4 7
Define min4_7(x,dx)=Prgm
.5-+a : 2.5-+b : O+np : l=+riu 1000-+menor l=+t.opt:
For i,1,20
nu+np+ni:
For j,1,2
If j=l Then
a+ (b-a) /nii+t:
E1se
b- (b-a) /nf-+ t
EndIf
x+t*dxT-+ xx
fl (xx) A2+f2(xx) A2+f3(xx) A2-+suma
If suma<menor Then
suma-+menor
tr+t.opt:
EndIf
EndFor
riu+np nf-+nu
EndFor
topti+t:
EndPrgm
@ Inicia Newton-Raphson con optimización de t
Define fl (x) =3*x[1, l]-cos (x[1,2]*x[1,3]) -.5
Define f2 (x) =x[1,1] A2-62j*x[1, 2J A2
Define f3 (x) =e " (-x [1, 1J*x [1,2J) +20*x [1,3] + (1O*II-3) /3
Define dfl2 (x) =x[1, 3]*sin (x[1,2J*x [1,3])
Define dfl3 (x) =x[1,2J*sin (x[1, 2]*x [1,3])
Define df21 (x)=2*x[1,1]
Define df22(x)=-1250*x[1,2]
Define df31 (x) =-x [1, 2]*eA(-x [1,l]*x [1,2])
Define df32 (x) =-x[l,l]*eA (-x [l,l]*x [1,2])
[l,l,l]-+x : 3-+n : 1E-5-+eps : C1rIO
Disp "k xl x2 x3 Di.st:"
"O "&format (x [1,1] , "f4") &" "&format (x [1,2J , "f4")-+d
d&" "&format(x[1,3J,"f4")-+d : Disp d
For k,1,25
[3,df12(x),df13(x);df21 (x),df22(x),O;df31 (x),df32(x),2 O]-+j
[-fl (x) ;-f2 (x) ; -f3 (x) [r+b
simu1t(j,b)-+dx : l=+t.opt: min4 7(x,dx)
x+topt*dxT-+ xl norm (xl-x) -+dist
string (k) & ""&format (xl [1,1] , "f5") &''''&format (xl [1,2], "f5")-+d
ds" "&format (xl [1,3J, "f5") s" "&format (dist, "f5")-+d: Disp d
xl=+x
if dist<eps
exit
EndFor
EndPrgm
SistelT1a de ecuaciones no lineales 289
e4_7 ( )
Prgm
@ Inicia el subprograma para búsqueda de Fibonacci
local min4 7
Define min4_7(x,dx)=Prgm
. 5-+a : 2 . 5-+b : O-+np : l-+nu
For i,l ,20
nu+np-+nf
For j , l , 2
If j=l Then
a+ (b-a) /nf-+t
E1se
b - (b-a) /nf-+t
Endlf
x+t*dxT-+xx
1000-+menor
fl (xx) " 2+f2 (xx) "2+f3 (xx ) "2-+suma
If suma <menor Then
suma-+menor
t-+topt
EndIf
EndFor
nu-+np
EndFor
topt-+ t
EndPrgm
nf-+nu
@ Inicia Newton - Raphson con optimización de t
Define fl (x) =3*x[l, l]-cos (x[1,2]*x[l,3]) -.5
Define f2 (x) =x [1,1] "2-62j*x[1,2] "2
l-+topt
Define f3 (x) =e" (-x [l ,l]*x [1,2]) +20*x [1,3] + (1 0*II-3) /3
Define dfl2 (x) =x [1 , 3]*sin (x [1 , 2]*x [1 , 3])
Define dfl3 (x) =x [l , 2}*sin (x [1 , 2}*x [1 , 3])
Define df21 (x)=2*x[1,1]
Define df22(x)=-1250*x[1 , 2]
Define df31 (x)=- x[1 , 2Ye" (- x[1 , 1]*x[1 , 2])
Define df32 (x) =- x [l , lYe" (- x [l , l]*x[l , 2])
[l , l , l] -+x : 3-+n : 1E- 5-+eps : C1rIO
Disp "k xl x2 x3 Dist "
" 0 " &format (x [1,1] , "f4") &" " &format (x [1 , 2] , "f4")-+ d
d&" "&format(x[1,3], "f4")-+ d : Disp d
For k ,1,25
[3 ,df12(x), df13 (x);df21 (x ),df22(x),O;df31 (x),df32 (x ), 2O]-+j
[ - fl (x) ;-f2 (x) ; -f3 (x) ] -+b
simu1t (j , b) -+dx : l-+topt min4_7(x, dx)
x+topt*dxT-+xl norm (xl - x) -+dist
string (k) &""&format (xl [1,1] , "f5") &''''&format (xl [1 , 2] , " f5") -+d
d&" " &format (xl [1,3] , "f5") &" " &format (dist, " f5")-+d : Disp d
x1 -+x
if dist<eps
exit
EndFor
EndPrgm
290 Métodos numéricos aplicados a la ingeniería
MÉTODO DE NEWTON-RAPHSON MODIFICADO CON OPTIMIZACIÓN DE T
(MÉTODO SOR)
En el método de Newton-Raphson modificado, la expresión general 4.18 puede identifi-
carse con la ecuación 4.28 directamente con t = -1
/¡(X/+I,X2
k+I, ... , X¡_Ik+I,x/, ... ,x/)
y dt = 1::; t-: n
él/¡ I
élx¡ (x/+I, x/+I, ... , X¡_/+I, x/, ... , x,,k)
Con la optirnización del valor de t en cada iteración puede acelerarse la convergencia.
El método así obtenido
(4.31)
se conoce como método SOR para sistemas no lineales. A continuación se resuelve un
ejemplo con optimización de t.
Ejemplo 4.8 Resuelva el siguiente sistema de ecuaciones empleando el método SOR para sistemas
no lineales.
!¡(x, y) = x2 - lOx + y2 + 8 = O
fzCx, y) = xy2 + X - lOy + 8 = O
Sean los valores iniciales xD = O Y yO = O
SUGERENCIA: Puede seguir los cálculos usando Mathcad o un pizarrón electrónico disponible.
Solución Primero se obtiene
él!¡ = 2x _ 10
élx
y ».- =2xy-10
ély .
Primera iteración
él!
Se evalúa j', y _1 en [O,O]T
élx
él!¡ I!I (O, O) = 8, --..- _11 0=-10
ox r,y
Se elige el intervalo de búsqueda [-1.5, -0.5] Y t = b - (b - a)/F, y el primer valor a prue-
ba es:
t = -1.5
Xl = xD + t !I (O, O) = O- 1.5 (~ ) = l.2
él!1I -10
élx (O, O)
290
Ejemplo 4.8
M é todos n uméricos a plicados a la ingeniería
MÉTODO DE NEWTON-RAPHSON MODIFICADO CON OPTIMIZACiÓN DE T
(MÉTODO SOR)
En el método de Newton-Raphson modificado, la expresión general 4.18 puede identifi-
carse con la ecuación 4.28 directamente con t =-1
dk
' = /¡(x/+I,x2k+I ,... , X¡_Ik+I,x/, ... ,x,/)
y 1 ::; ¡::; n
1 él/¡ I
élx¡ (xlk+l,xl+ I,... , X¡_Ik+ I,x/,... ,x/)
Con la optimización del valor de t en cada iteración puede acelerarse la convergencia.
El método así obtenido
f (x/+ I, x2k+ I,... , X¡_ Ik+ I , xl,... , x/)
xk+l = xk-t ¡ 1::;¡::;n
1 1 él/¡
':Ix I( k+ 1 k+ 1 k+ I k k)u i X I ' X2 , ... , X 1_ 1 ,Xi , ... , Xn
(4.31)
se conoce como método SOR para sistemas no lineales. A continuación se resuelve un
ejemplo con optimización de t.
Resuelva el siguiente sistema de ecuaciones empleando el método SOR para sistemas
no lineales.
j¡(x, y) =x2 - lOx + y2 + 8 = O
fix, y) =.xy2 + X - lOy + 8 =O
Sean los valores iniciales xO =OYyO =O
SUGERENCIA: Puede seguir los cálculos usando Mathcad o un pizarrón electrónico disponible.
Solución Primero se obtiene
Primera iteración
él!1 = 2x _ 10
élx
y
él!2
- = 2xy-l0
ély .
él!
Se evalúa!1 y _ 1 en [O, O]T
élx
él!1 I! I (O, O) = 8, -':1-.1) 0 = -10
oX x~, y
Se elige el intervalo de búsqueda [- 1.5, - 0.5] Y t = b - (b - a)/F, y el primer valor a prue-
ba es:
t =- 1.5
Xl = xO + t !I (O, O) = O- 1.5 (~ )= 1.2
él!1 I -10
élx (O, O)
1-
ia.
1)
un
e-
Sistema de ecuaciones no lineales 291
d1211zC1.2, O) = 9.2 - =-10
dy x', yO
yl = yO + t fz(1.2, O) = 0- 1.5 (~) = 1.38
d12 I -10
dy (1.2, O)
A partir del criterio de la suma de los residuos elevados al cuadrado, se tiene:
2
1
= 11
2 (1.2, 1.38) + 12
2 (1.2, 1.38)
= [l.22 - 10(1.2) + 1.382 + 8]2 + [l.2(1.38)2 - 1.2 - 10(1.38) + 8]2 = 5.7877
El segundo valor a prueba es t = -1.0, con lo que se obtiene:
Xl = 0.8 yl = 0.88 21 = 2.3843
Al continuar el proceso de búsqueda se tiene:
t xl yl Zl
-1.5000 1.2000 1.3800 5.7877
-1.0000 0.8000 0.8800 2.3843
-0.8333 0.6667 0.7222 8.4991
-0.7000 0.5600 0.5992 17.1088
Ahora se usa t = a + (b - a)/F, y se obtiene:
t xl yl Zl
-0.5000 0.4000 0.4200 37.0420
-1.0000 0.8000 0.8800 2.3843
-1.1667 0.9333 1.0422 0.6151
-1.3000 1.0400 1.1752 1.6312
Por tanto, el valor óptimo de t es -1.1666 y los valores correspondientes de [x', yl] = [0.9333,
1.0422] se toman como resultados finales de la primera iteración.

, I
Segunda iteración
Con el mismo intervalo de búsqueda [-1.5, -0.5] se tiene, con t = b - (b - a)/F
t
-1.5000
-1.0000
-0.8333
-0.7000
1.048416
1.010055
0.997268
0.987039
0.997117 0.166991
1.002319 0.005733
1.006275 0.004285
1.010227 0.027122
292 Métodos numéricos aplicados a la ingeniería
y con t = a + (b - a)/F
( Xl y1 Zl
-0.5000 0.971694 1.017453 0.107664
-1.0000 1.010055 1.002319 0.005733
-1.1667 1.022842 0.999467 0.036085
-1.3000 1.033072 0.997987 0.078302
El valor óptimo de t es -0.8333 y los valores correspondientes de [x2, y2] = [0.997268,
1.006275] se toman como resultados finales de la segunda iteración.
Al continuar el proceso iterativo se obtienen los siguientes valores
k Xk yk Zk (Opf
O 0.000000 0.000000
1 0.933333 1.042222 0.615080 -1.1667
2 0.997268 1.006275 0.004285 -0.8333
3 1.000854 1.001220 0.000084 -0.8333
4 1.000305 1.000076 0.000005 -1.0000
5 1.000019 1.000005 0.000000 -1.0000
Los cálculos pueden realizarse con el siguiente guión de Matlab que usa la función min4_8,
que hace la búsqueda de Fibonacci descrita anteriormente o con la TI92 Plus.
x=[O OJ;
fprintf( •
fprintf( •
fprintf( •
for k=1:10
t=min4_ 8 (x) ; fl=x (1) ~2-10*x (1) +x(2) ~2+8;
dflx=2*x (1) -10; xl (1) =x (1) +t':'fl/dflx;
f2=x1 (1) *x (2) ~2+x1(1) -10*x (2) +8;
df2y=2*x1 (l)*x (2) -10; xl (2)=x (2) +t*f2/df2y;
fl=x1 (1) ~2-10'''x1 (1) +x1 (2) ~2+8;
f2=x1 (1)*x1 (2) ~2+x1(1) -10*x1 (2) +8;
Z=fJA2+fr2;
fprintf( •
fprintf( ,
x=x1;
if Z < Eps; brea k; end
end
Eps=le-6;
k x (k) y (k) ,)
z (k) Toptln')
%2d %13.10f %13.10fln',0,x(1),x(2))
%2d %13.10f %13.10f' ,k,x1 (1) ,xl (2))
%13.10f %8.4fln',Z,t)
Sistema de ecuaciones no lineales 293
function f=min4_ 8 (X)
A = -1.5; B = -0.5; NP = O; NU = 1;
Menor = 1000000000; Topt = 1;
for i = 1:4
for j=1:2
NF = NU + NP;
if j = = 1
T = B-(B - A)/NF;
e1se
T=A+(B-A)/NF;
end
f1=X(1) ~2-1o-"'(.X(l)+X(2) ~2+8; dflx=2*X(1) -10;
XX(1) =X (1) +T"fl/dflx;
f2=XX (1) *X (2) ~2+XX(1) -10*X (2) +8;
df2y=2*XX (1) *X(2) -10; XX(2) =X (2) +T''f2/df2y;
fl=XX(1) ~2-10*XX(1) +XX(2) ~2+8;
f2=XX (1) *XX (2) ~2+XX(1) -10*XX (2) +8;
Suma=fl~2+f2~2
if Suma < Menor
Menor Suma; Topt T;
end
268.
end
NP = NU; NU = NF;
end
f=Topt;
e4_8 ( )
Prgm
@ Inicia subprograma búsqueda de Fibonacci
Local min4 8
Define min4_8(x)=Prgm
-1.5 ...•a : -0.5 ...•b : l ...•topt O+rrp 1...•nu:10000 ...•menor
For i,1,20
nu+np...•nf
For j, 1,2
If j=l Then
a+ (b-a) /nf ...•t
E1se
b- (b-a) /nf ...•t
EndIf
x+xx : x[1,l]+t*f1 (x)/df1x(x) ...•xx[1,l]
x [1,2] +t* f2 (xx) /df2y (xx) ...•xx [1,2]
fl (xx) ~2+f2(xx) ~2""suma
If suma<menor Then
suma...•menor : t ...•topt
EndIf
EndFor
nu...•np : nf ...•nu
EndFor
topt ...•t
EndPrgm
@ Inicia Newton Raphson modificado
Define f1 (x)=x[l,lr2-10*x[l,1]+x[1,2] ~2+8
Define f2 (x) =x [1, l]*x [1, 2] ~2+x[1,1] -10*x [1,2] +8
Define df1x(x)=2*x[l,1]-10
Define df2y (x) =2*x [1,l]*x[l ,2] -10
u.
Sistema de ecuaciones no lineales 293
function f=min4_ 8 (X)
A = - 1 . 5 ; B = - 0 . 5 ; NP = O; NU = 1 ;
Menor = 1000000000; Topt = 1 ;
for i = 1 : 4
for j=1 : 2
NF = NU + NP;
if j = = 1
T = B-(B - A)/NF;
e1se
T=A+(B- A)/NF;
end
f1 =X(l) "2-10*X (l) +X(2) "2+8; df1x=2*X(l) - 10;
XX (1) =X (1) +1*f1/df1x;
f2=XX(l)*X(2) "2+XX (l) - 10*X(2) +8;
df2y=2*XX (l)*X (2) - 10; XX (2) =X (2) +T:'f2/df2y;
f1=XX(1) "2- 1 O*XX (1) +XX(2) "2+8 ;
f2=XX (l)*XX (2) "2+XX (1) -10*XX (2) +8;
Suma=f1 "2+f2"2
if Suma < Menor
end
Menor
end
NP = NU; NU = NF;
end
f=Topt ;
e4_8 ( )
Prgm
Suma ; Topt
@ Inicia subprograma búsqueda de Fibonacci
Local min4 8
Define min4_8(x)=Prgm
T;
- 1 . 5-+a : - 0 . 5-+b : l -+ topt O-+np 1--+nu : 10000-+menor
For i , 1 , 20
nu+np-+nf
For j , 1 , 2
If j=l Then
a+ (b-a) /nf--+ t
E1se
b- (b-a ) /nf-+ t
EndIf
x-+xx : x[l,l]+t*f1 (x)/df1x(x) --+xx[l,l]
x [1 , 2] +t*f2 (xx) /df2y (xx) --+xx [1 , 2]
f1 (xx) "2+f2 (xx) "2-+suma
If suma<menor Then
suma-+menor : t -+ topt
EndIf
EndFor
nu-+np : nf-+nu
EndFor
topt-+ t
EndPrgm
@ Inicia Newton Raphson modificado
Define f1 (x ) =x[1 , 1]"2- l0* x[1 , 1] +x[1 , 2]"2+8
Define f2 (x) =x [1 , l]*x [1 , 2] "2+x [1 , 1] - lO*x [1 , 2] +8
Define df1x (x) =2*x[1 , 1] - 10
Define df2y (x) =2*x[1 , l]*x [1 , 2] -10
294 Métodos numér icos aplicados a la ingeniería
[O,OJ ->X : 1.E-6->eps : ClrIO
Disp "k xl x2 z topt"
"O "&format (x[l,lJ, "f4")->d
d&" "&format(x[1,2J,"f4")->d Disp d
For k,1,10
min4 8 (x)
x->xl x[l,lJ+topt*fl (x)/dflx(x) ->xl[l,lJ
x [1,2J+topt* f2 (xl) /df2y (xl) r+x L[1,2J
fl (xl) A2+f2 (xl) A2->zeta
string (k) s: "&format (xl [1, L] , "f5")->d
d&" "&format (xl [1,2J , "f5") s" "&format (zeta, "f5")->d
d&" "&format (topt, "f5") ->d: Disp d
xi+x
If zeta <eps
Exit
EndFor
EndPrgm
MÉTODO DEL DESCENSO DE MÁXIMA PENDIENTE
Fi~
GI
super
y dilSe ha visto cómo seguir un camino que permita ir disminuyendo z al optimizar el tamaño
del paso t de un método conocido. Sin embargo, puede elaborarse un método de solución
de (4.1), construyendo primero una dirección de exploración d que permita disminuir el
valor de z en una cantidad localmente máxima y, una vez encontrada, buscar la t óptima
en esa dirección. Para el desarrollo de este algoritmo son necesarias las siguientes consi-
deraciones.
La figura 4.12 representa la gráfica de la función z(x, y) = x2 + y2, Y sus curvas de ni-
vel. Si, por ejemplo, se "está" en el punto (x, y, z) = (-1, -1, 2) de la superficie (ver Fig.
4.13), el gradiente de la función z(x, y),
-------------
===----8
= ===--------
6
4
2
O
2
2
Y
O
Figura 4.12
O
Gráfica de la -1 x
función z(x. yj =
x2 + y. -2
Figura 4.13
Gráfica de la
superficie z(x, y)
y dirección del
vector
gradiente.
ma
nsi-
lli-
ig.
Sistema de ecuaciones no lineales 295
__ - r
8
6
4
z ,
2
-:
O
:
"
2 ,
y O 2
-2
dirección del gradiente
V'z(x, y) = [~~; 1 = [ ~; 1 evaluado en (x, y) = (-1, -1) es el vector [=~1 en el plano
x - y cuya dirección nos indica hacia dónde avanzar en el mismo plano x - y, a fm de "as-
cender" en la superficie (a partir de (-1, -1, 2)) lo más rápidamente posible". Como nues-
tro interés es descender lo más bruscamente posible, se toma la dirección contraria del
gradiente o, matemáticamente, se va en la dirección de - V'z(x, y) = [ ~l.Nótese que, si-
guiendo la dirección opuesta del vector gradiente en la figura 4.13, se avanza hacia el pun-
to (O, O) del plano x - y, que es donde la función z(x, y) tiene su mínimo.
Otra propiedad del gradiente que puede ser útil para visualizar cómo encontrar un má-
ximo o un mínimo es que es perpendicular a las curvas de nivel de la superficie. Las cur-
vas de nivel de una superficie z(x, y) son el conjunto de puntos que satisfacen la ecuación
z(x, y) = e, donde e es una constante. Así, para la superficie z(x, y) = x2 + y2, las curvas de
nivel son la familia x2 + y2 = e, es decir, las circunferencias con centro en el eje z paralelas
al plano x - y y a una altura e de éste, y de radiwc (ver Fig. 4.12). Si tomamos nueva-
mente el punto (-1, -1, 2), la circunferencia x2 + y2 = 2 con centro en (O, O, 2) es la curva
de nivel que lo contiene. Si tomamos el vector gradiente [ =~1 y lo llevamos paralelo al
plano x - y al punto (-1, -1,2) encontramos que es perpendicular a la curva de nivel en
ese punto (ver Fig. 4.14). Aun más, al avanzar desde ese punto en la dirección que señala
el gradiente, se avanza sobre la superficie hacia curvas de nivel de mayor radio por el ca-
mino más corto posible, ya que cualquier otra dirección que se tomara a partir de (-1, -1,
2) nos llevaría a otra curva de nivel; por ejemplo, x2 + y2 = 3 por un camino más largo (ver
Fig.4.14) .
• Cabe señalar que esto sólo es cierto para un entorno del punto (-1, -1) del plano x-y.
296
&
Métodos numéri cos aplicados a la ingeniería
Direcciones
-0.8 alternativas
al gradiente
-0.2
-0.4
-0.6
-1.2
-1.4
-1.6
Figura 4.14
Perpendicu-
laridad del
vector gradiente
a una curva
de nivel.
-1.8
o
-1
Gradiente en (-1, -1, 2)
Curva de nivel
X2+y2=3
-2~----------~----------~----------~----------~
-2 -1.5 -1 -0.5 o
Con esta definición de gradiente y sus propiedades, se retorna el asunto del cálculo de la
dirección que asegura la disminución de z = I/(x) + 122(X) (función escalar de x y y), en
una cantidad localmente máxima en un punto. Se determina el vector gradiente de z con
signo negativo en dicho punto (el signo negativo se debe a que se quiere que z disminu-
ya.). El vector gradiente de z se representa por Vz. Por tanto, la dirección de descenso más
brusco es:
con cada uno de los componentes de d calculados como:
d=-(V'z)
d -~
,- dx '
d -~2-
dy
Ejemplo 4.9 Obtenga la dirección del descenso de máxima pendiente del sistema
1, (xl' x2, x3)
12(xl' x2, x3)
13 (x,, x2, x3)
3x, - costx, x3
) - 0.5 = O
x? - 625x} = O
e-x,x2 + 20x3
+ (IOn - 3)/3 = O
use como vector inicial a
Pa
y
296
Figura 4.14
Perpendicu-
laridad del
vector gradiente
a una curva
de nivel.
Métodos numéricos aplicados a la ingeniería
o
-0.2
-0.4
-0.6
-0.8
-1
-1.2
- 1.4
-1.6
-1.8
al gradiente
Gradiente en (-1, -1, 2)
Curva de nivel
X2 +y2=3
-2~----------~----------~----------~----------~
-2 -1.5 -1 -0.5 o
Con esta definición de gradiente y sus propiedades, se retoma el asunto del cálculo de la
dirección que asegura la disminución de z =J¡2(X) + J}(x) (función escalar de x y y), en
una cantidad localmente máxima en un punto. Se determina el vector gradiente de z con
signo negativo en dicho punto (el signo negativo se debe a que se quiere que z disminu-
ya.). El vector gradiente de z se representa por V'z. Por tanto, la dirección de descenso más
brusco es:
d=-(V'z)
con cada uno de los componentes de d calculados como:
d -~
1 - dx ' d - ~2 -
dy
Ejemplo 4.9 Obtenga la dirección del descenso de máxima pendiente del sistema
JI (xl' x2, x3)
J2 (xl' x2, x3)
J3 (xl' x2, x3)
use como vector inicial a
3x, - cos(x2 x3) - 0.5 = O
x? - 625xf = O
e-x,x2 + 20x3
+ (IOn: - 3)/3 = O
Sistema de ecuaciones no lineal es 297
Solución
z = [3x¡ - cos (x2
x3) - 0.5]2 + [x¡2 - 625xiJ2 + [e-X,X2 + 20x3 + (IOn: - 3)/3]2
d, = ~ = 6 (3x¡ - cos (XzX3) - 0.5) + 4x¡ (x¡2 - 625xi)
ax¡
-2x2 e-X
'X2 [e-X
,X2 + 20x3 + (IOn: - 3)/3]
azd2 = - = 2x3 sen (x2x3) [3x¡ - COS (x2 x3) - 0.5]
aX2
-2500x2 (x¡2 - 625xi) - 2x1
e-X
'X2 [e-X
,X2 + 20x3 + (10n: - 3)/3]
azd3 = - = 2x2 sen (xzX3) [3x¡ - cos (xzX3) - 0.5] +
aX3
40 [e-X
,X2 + 20x3 + (IOn: - 3)/3]
Al evaluar di' d2
, Y d3
en x(O) se obtiene:
d¡ -9.0
d2 0.0
d3
418.87872
y entonces el vector dirección es:
l -9 Jd = 0.00
418.87872la
en
on
u-
ás
Una vez calculada la dirección, se utiliza una exploración unidimensional para localizar el
mínimo en esta dirección (por ejemplo una búsqueda de Fibonacci). Ya localizado el mí-
nimo, se calcula una nueva dirección de descenso de máxima pendiente y se repite el pro-
cedimiento. Generalmente, el método se caracteriza por cortos movimientos en zig-zag
que convergen muy lentamente a la solución; sin embargo, se utiliza para acercarse a la
solución y después aplicar un método de alto orden de convergencia como el de Newton-
Raphson; es decir, se emplea como un método para conseguir "buenos" valores iniciales.
Este método puede ejemplificarse paso a paso con el Mathcad o un sofware equivalente y
explorar con varios valores de t para encontrar el óptimo; cabe ensayado con diferentes
sistemas e incluso proponer vectores de exploración, en fin, llevar la matemática a nivel
experimental.
ALGORITMO 4.5 Método del descenso de máxima pendiente
Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar las funciones F(I,x)
y las derivadas parciales de la función (ecuación (4.28» D(I,x) y los
DATOS: Número de ecuaciones N, vector de valores iniciales x, número máximo de iteraciones MAXIT, cri-
terio de convergencia EPS, intervalo de búsqueda [A,B] y el número de puntos de [A,B] por ensa-
yarM.
RESULTADOS: El vector solución x o mensaje "NO CONVERGE'.
Solución
Sistema de ecuaciones no lineales 297
z =[3x¡ - cos (X2X3) - 0.5]2 + [X¡2 - 625xi]2 + [C"X2 + 20x3 + (IOn: - 3)/3]2
d ¡ =~ = 6 (3x¡ - cos (X~3) - 0.5) + 4x¡ (x¡ 2- 625x:f)
ax¡
- 2x2 e-X
"'2 [e-X
,X2 + 20x3 + (IOn: - 3)/3]
azd2 =- = 2x3sen (x2x3) [3x¡ - COS (x2x3) - 0.5]
aX2
-2500x2 (x¡2 - 625x:f) - 2x1 e-X
'X2 [e-X
,X2 + 20x3 + (10n: - 3)/3]
azd3=- =2x2sen (x~3) [3x¡ - COS (x~3) - 0.5] +
aX3
40 [e-X
,X2 + 20x3 + (IOn: - 3)/3]
Al evaluar di' d2, Y d3 en x(O) se obtiene:
d¡ -9.0
d2 0.0
d3 418.87872
y entonces el vector dirección es:
l-9 Jd = 0.00
418.87872
Una vez calculada la dirección, se utiliza una exploración unidimensional para localizar el
mínimo en esta dirección (por ejemplo una búsqueda de Fibonacci). Ya localizado el mí-
nimo, se calcula una nueva dirección de descenso de máxima pendiente y se repite el pro-
cedimiento. Generalmente, el método se caracteriza por cortos movimientos en zig-zag
que convergen muy lentamente a la solución; sin embargo, se utiliza para acercarse a la
solución y después aplicar un método de alto orden de convergencia como el de Newton-
Raphson; es decir, se emplea como un método para conseguir "buenos" valores iniciales.
Este método puede ejemplificarse paso a paso con el Mathcad o un sofware equivalente y
explorar con varios valores de t para encontrar el óptimo; cabe ensayarlo con diferentes
sistemas e incluso proponer vectores de exploración, en fin, llevar la matemática a nivel
experimental.
ALGORITMO 4.5 Método del descenso de máxima pendiente
Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar las funciones F(I,x)
y las derivadas parciales de la función (ecuación (4.28» D(I,x) y los
DATOS: Número de ecuaciones N, vector de valores iniciales x, número máximo de iteraciones MAXIT, cri-
terio de convergencia EPS, intervalo de búsqueda [A,B] y el número de puntos de [A,B] por ensa-
yarM.
RESULTADOS: El vector solución x o mensaje "NO CONVERGE'.
298 Métodos numéricos aplicados a la ingeniería
PASO 1. Hacer K = 1.
PASO 2. Mientras K:<:;MXIT, repetir los pasos 3 a 27.
PASO 3. Hacer Z = O.
PASO 4. Hacer I = 1.
PASO 5. Mientras I:<:;N, repetir los pasos 6 y 7.
PASO 6. Hacer Z = Z + F(I, x) A2.
PASO 7. Hacer I = I + 1.
PASO 8. Si Z :<:;EPS ir al paso 29. De otro modo continuar.
PASO 9. Hacer NP = O, NU = 1, MENOR = 1E20.
PASO 10. Hacer J = 1.
PASO 11. Mientras J :<:;M, repetir los pasos 12 a 25.
PASO 12. Hacer S = NU + NP,
T = A + (B-A)/S, L = 1.
PASO 13. Hacer xa = x-T * dz.
PASO 14. Hacer Z = O.
PASO 15. Hacer 1= 1.
PASO 16. Mientras I :<:;M, repetir los pasos 17 y 18.
PASO 17. Hacer Z = Z + F(T, xa) A2.
PASO 18. Hacer 1= I + 1
PASO 19. Si MENOR < Z, ir al paso 21.
De otro modo continuar.
PASO 20. Hacer MENOR = Z, TOPT = T.
PASO 21. Si L = O ir al paso 24. De otro modo continuar.
PASO 22. Hacer T = B-(B-A)/S, L = O.
PASO 23. Ir al paso 13.
PASO 24. Hacer NP = NU, NU = S.
PASO 25. Hacer J = J + 1.
PASO 26. Hacer x = x-TOPT * dz.
PASO 27. Hacer K = K +1.
PASO 28. IMPRIMIR "NO CONVERGE' Y TERMINAR.
PASO 29. IMPRIMIR x y TERMINAR.
4.
Ejemplo 4.10 Con el algoritmo 4.5, elabore un programa para resolver el sistema
11(x» x2' x3)
12(x,, x2' x3)
13 (x]> x2' x3)
3 xI - cos(x2 x3) - 0.5 = O
X¡2 - 625x2
2 = O
e-x,x2+ 20x3 + ( IOn: - 3)/3 = O
use como vector inicial a
Solución En el CD se presenta el PROGRAMA 4.3, basado en el método del descenso de máxima pen-
diente y con búsqueda de Fibonacci.
Para su empleo, el usuario proporcionará el procedimiento GRADTE, donde se forma
la función z por minimizar y el gradiente de esta función Vz. Enseguida se anotan los re-
sultados que se obtienen.
298 Métodos numéricos aplicados a la ingeniería
PASO 1. Hacer K = 1.
PASO 2. Mientras K ~ MXIT, repetir los pasos 3 a 27.
PASO 3. Hacer Z = O.
PASO 4. Hacer 1 = 1.
PASO 5. Mientras 1 ~ N, repetir los pasos 6 y 7.
PASO 6. Hacer Z = Z + F(I, x) A2.
PASO 7. Hacer 1 = I + 1.
PASO 8. Si Z ~ EPS ir al paso 29. De otro modo continuar.
PASO 9. Hacer NP = O, NU = 1, MENOR = IE20.
PASO 10. Hacer J = 1.
PASO 11. Mientras J ~ M, repetir los pasos 12 a 25.
PASO 12. Hacer S = NU + NP,
T = A + (B-A)/S, L = l.
PASO 13. Hacerxa = x-T*dz.
PASO 14. Hacer Z = O.
PASO 15. Hacer 1 = 1.
PASO 16. Mientras 1 ~ M, repetir los pasos 17 y 18.
PASO 17. Hacer Z = Z + F(T, Xa) A2.
PASO 18. Hacer I = 1 + 1
PASO 19. Si MENOR < Z, ir al paso 21.
De otro modo continuar.
PASO 20. Hacer MENOR = Z, TOPT = T.
PASO 21. Si L = Oir al paso 24. De otro modo continuar.
PASO 22. Hacer T = B-(B-A)/S, L = O.
PASO 23. Ir al paso 13.
PASO 24. Hacer NP = NU, NU = S.
PASO 25. Hacer J = J + 1.
PASO 26. Hacer x = x-TOPT * dz.
PASO 27. Hacer K = K +1.
PASO 28. IMPRIMIR "NO CONVERGE' YTERMINAR.
PASO 29. IMPRIMIR x y TERMINAR.
Ejemplo 4.10 Con el algoritmo 4.5, elabore un programa para resolver el sistema
Solución
JI (XI' x2' x3) 3 x ¡ - cos(x2x3) - 0.5 = O
J2 (xi' x2' x3) = x ¡2 - 625x2
2 =O
J3 (xi' x2' x3) e-X
'X2+ 20x3 + ( IOn - 3)/3 =O
use como vector inicial a
En el CD se presenta el PROGRAMA 4.3, basado en el método del descenso de máxima pen-
diente y con búsqueda de Fibonacci.
Para su empleo, el usuario proporcionará el procedimiento GRADTE, donde se forma
la función z por minimizar y el gradiente de esta función Vz. Enseguida se anotan los re-
sultados que se obtienen.
Sistema de ecuaciones no lineales 299
k Xl X2 X
3 Z t
O 0.00000 0.00000 0.00000
1 0.01127 0.00000 -0.52458 1.11912e+002 0.00125
2 0.33117 -0.00002 -0.49597 2. 1500ge+000 0.03636
3 0.33479 0.00044 -0.52365 5.73944e-001 0.00125
4 0.50090 0.00759 -0.52085 2.58186e-001 0.05882
37
38
0.49998
0.49998
0.02000
0.02000
-0.52310
-0.52310
l.73843e-009
4.03291e-01O
0.03636
0.00077
Para finalizar este capítulo estudiaremos una aplicación del método de Newton-Raphson pa-
ra encontrar factores cuadráticos de una ecuación polinornial con el método de Bairstow.
4.7 Método de Bairstow
Este método, al igual que el método de Lin visto en el capítulo 2, permite obtener factores
cuadráticos del polinomio"
p(x) = aoX" + a1x"-1 + a2xll
-
2 + ... + all
, (4.32)
aplicando el método de Newton-Raphson a un sistema relacionado con dicho polinomio.
Más específicamente, la división de p(x) por el polinomio cuadrático x2 - ux - v (factor
buscado) puede expresarse como:
p(x) = (x2 - ux - v)q(x) + r(x) (4.33)
donde q(x) es un polinomio de grado 11 - 2 Yr(x) el residuo lineal, dados respectivamente por
q(x) = boX"-2 + b¡xn-3 + ... + bn_2
r(x) = bll
_
1
(u, v)(x - u) + bn (u, v)
(4.34)
(4.35)
donde la notación bn_l(u, v) y bll
(u, v) se usa para enfatizar que bn_1
y bn
dependen de las
u y v seleccionadas para formar el factor cuadrático.
El factor cuadrático será un factor de p(x) si podemos escoger u y v de modo que
bll(u, v) = O (4.36)
Al desarrollar las operaciones indicadas en el lado derecho de la ecuación (4.33), se ob-
tiene un polinomio cuyos coeficientes quedan expresados en términos de las b' s, u y v. Al
igualar éstos con los coeficientes correspondientes de (4.32), se tiene a las b' s en la si-
guiente forma:
* Nótese que la forma en que se manejan los sub índices de los coeficientes difieren de la forma en que se usa-
ron anteriormente y será exclusiva para esta sección.
300 Métodos n uméricos aplicados a la ingeniería
ba = aa ba = aa
b, - uba = al bl = al + uba
b2
- ub ; - vba = a2 b2 = a2 + ub, + vba
bk
- ubk
_
l - vbk
_
2 = ak bk = ak + ubk_l + vbk_2
b"_l - ubl1_2 - vb"_3 = a,,_l bl1
_
l = a,,_l + ub"_2 + vb"_3
bl1
- ubll
_
l - vbn
_
2 = all
bl1 = a" + ubll
_
l + vbll
_
2
Si se hace artificialmente b, = OYb_2
= O,la expresión para bk
vale para O::; k::; n, de mo-
do que nuestra expresión general quedaría:
O::;k5,n
y en particular:
ba = aa + ub_l + vb_2
b, = al + uba+ vo.,
Es interesante observar el carácter recursivo de las b' s ya que, por ejemplo, bk
está expresa-
da en términos de bk
_
l y bk
_
2, Y ambas a su vez se pueden expresar en b' s cuyos subíndices
son k - 2, k - 3 Y k - 3, k - 4, respectivamente. Continuando de esta manera, bk
queda final-
mente expresada en términos de los coeficientes de (4.32), que son conocidos, y obviamente
de u y v que son propuestos. En adelante, todo se hará en forma recursiva, de modo que cual-
quier cálculo relacionado con el sistema (4.36) quedará sujeto a un proceso de este tipo.
La forma del factor cuadrático x2 - ux - v, tan artificial a primera vista, tiene su razón
en la facilitación del cálculo de p(x) para un argumento complejo x = a + bi. Sean las ak
reales. Haciendo u = 2a y v = -a2 - b2
, tenemos:
x2 - ux - v = (a + bi)2 - 2a(a + bi) - (-a2 - b2)
= a2
+ 2abi - b2 - 2a2 - 2abi + a2 + b2 = O
De esto, por la ecuación (4.32):
p(x) = (x2 - ux - v)q(x) + r(x)
= O + r(x) = bn_l(a + bi - 2a) + b"
= bn_l(-a + bi) + b"
Para obtener bl1
_
l y b" deberán evaluarse primero ba, b., ... , bn_2 y esto puede hacerse por
aritmética real, ya que como vimos antes, se calculan en términos de los coeficientes del
polinomio 4.32, que son reales y de u y v que también son reales, y sólo hasta el cálculo
final se empleará aritmética compleja en la multiplicación de b"_l por (-a + bi). Si se diera
el caso de que b"_l y bn fueran ceros, entonces p(x) = O, y los complejos conjugados a ± bi
serían entonces ceros de p(x).
El método de Bairstow consiste en usar el método de Newton para resolver el siste-
ma (4.36).
Las derivadas parciales de bl1
_
l
y bn con respecto a u y v implican obtener primero las
derivadas parciales de b,,_2' b"_3"" , b, Yba, dada la recursividad de b" y b"_l' Por esto, sea
(4.37)
mo-
.37)
por
del
ulo
era
bi
te-
las
sea
Sistema de ecuaciones no lineales 301
dbl
C
o=--= »¿
du
db2 d(a2 + u(al + ubo) + vbo)
cl = --a;;- = du = al + 'Iub¿ = b, + uCo
C - db" - b °
n-l - du - n-l + UC,,_2 + VC,,_3
De este modo, las ck se calculan a partir de las bk
, del mismo modo que las bk
se obtuvie-
ron a partir de las ako Los dos resultados que necesitamos son:
db,,_1
C ---
n-2 - du '
dbnC =-_.
,,-1 dL!
db
De igual modo, tomando derivadas respecto a v y haciendo dk
= ~, encontramos:
dv
dbod2=--=O
- dv
dbl
dl=--=O
- dv
db2
do=--=bo
dv
db3
d(a3
+ ub.; + vbl) d(a3
+ u(a2
+ ub, + vbo) + vbl
)
di = -- = = --=---=----'-----''----'-
dv dv dv
db
d = --" = b + ud + vd11-2 dv 11-2 ,,-3 11-4
Como las ck
y las dk
satisfacen la misma recurrencia:
<,= d_2 = O
c_l
= d, = O
Co = do= bo
Sistema de ecuaciones no lineales 301
db)
Co= - - = bodu
db2 d(az + u(a ) + ubo) + vbo)
c )=--= =a1 +2ubO =b)+ucO
du du
C - db" - b .
1/-) - du - 11-) + uC,,_z + VC,,_3
De este modo, las ck se calculan a partir de las bk, del mismo modo que las bk se obtuvie-
ron a partir de las ak. Los dos resultados que necesitamos son:
db,,_)
C - --
17-2 - OU '
db"C =--
,,-) du
db
De igual modo, tomando derivadas respecto a v y haciendo dk = ~, encontramos:
dv
dbo
dz=-- =O
- dv
db)
d)=-- =O
- dv
db2
do = - - =bo
dv
db3 d(a3 + ub2 + vb) d(a3 + u(a2 + ub) + vbo) + vb)
d) =-- = =-~-----=---''----''------'-
dv dv dv
Como las ck y las dk satisfacen la misma recurrencia:
c_2 =d_2 =O
c_ ) =d_1 =O
Co=do = bo
[ .
302 Métodos numéricos ap licados a la ingeniería
En particular
dbll_l_ d - C
dV - n-3 - 11-3'
dbll
---d -cdV - n-2 - 11-2
y ahora se tiene todo para aplicar el método de Newton-Raphson. Supóngase que se tienen
raíces aproximadas a ± bi de p(x) = O Ycon esto el factor cuadrático asociado x2
- ux - v,
de p(x). Esto significa que tenemos raíces aproximadas de la ecuación 4.36. Aplicando el
método de Newton-Raphson a (4.36) queda:
cn
_
2h + cn
_
3k = -bn
_¡
cll_¡h + cn_2k = -bll
Dado que se trata de un sistema de dos ecuaciones lineales, se puede programar fácilmen-
te la solución recurriendo a la regla de Cramer.
h = bncn_3 - bll_lcn_2 ,
c2 - C C11-2 11-1 n-3
k = bl1_¡cll_l - bncn_2
c2
- C C11-2 11-1 11-3
Ejemplo 4.11 Encuentre los factores cuadráticos de la ecuación polinornial de cuarto grado
p(x) = .0 - 8x3 + 39x2 - 62x + 50 = O
Utilice como valor inicial x = O+ Oi; esto es, a = O Yb = O
Solución Dado lo complejo del algoritmo, empezaremos identificando los elementos relevantes.
~ Grado del polinornio: n = 4.
Coeficientes del polinornio: ao = 1;al = -8; a2 = 39; a3 = -62; a4 = 50.
Factor cuadrático: U
o = 2a = 2(0) = O; "o = _a2
- b2
= 02
- 02
= O.
Cálculo de los coeficientes b de q(x)
bo = ao = 1
b, = al + uobo = -8 + 0(1) = -8
b2 = a2 + uOb¡ + vobo = 39 + 0(-8) + 0(1) = 39
b3 = a3 + uOb2 + vObl = -62 + 0(39) + 0(-8) = -62
b4 = a4 + uOb3 + vOb2 = 50 + 0(-62) + 0(39) = 50
Recuérdese que b3 y b4 deberán tender a cero, en caso de convergencia.
Cálculo de las derivadas parciales e
Co = bo = 1
c¡ = b, + uoco = -8 + 0(1) =-8
c2 = b2 + uOcl + voco = 39 + 0(-8) + 0(1) = 39
c3 = b3 + uOc2 + vOc¡ = -62 + 0(39) + 0(-8) = -62
302 Métodos numéricos aplicados a la ingeniería
En particular
abll_ l _ d - c
av - n-3 - 11-3'
abll---d - cav - n-2 - 11-2
y ahora se tiene todo para aplicar el método de Newton-Raphson. Supóngase que se tienen
raíces aproximadas a ± bí de p(x) = OYcon esto el factor cuadrático asociado x2 - ux - v,
de p(x). Esto significa que tenemos raíces aproximadas de la ecuación 4.36. Aplicando el
método de Newton-Raphson a (4.36) queda:
cn_2h + cn_3k = -bn_¡
cll_¡h + cn_2k =- bn
Dado que se trata de un sistema de dos ecuaciones lineales, se puede programar fácilmen-
te la solución recurriendo a la regla de Cramer.
Ejemplo 4.11 Encuentre los factores cuadráticos de la ecuación polinomial de cuarto grado
p(x) =.0 - 8x3 + 39x2 - 62x + 50 =O
Utilice como valor inicial x = O+ Oí; esto es, a = OYb = O
Solución Dado lo complejo del algoritmo, empezaremos identificando los elementos relevantes.
I~ I Grado del polinomio: n = 4.
Coeficientes del polinomio: ao = 1; a¡ = -8; a2 = 39; a3 = -62; a4 = 50.
Factor cuadrático: Uo = 2a = 2(0) = O; V
o= _a2 - b2 = 02 - 02 = O.
Cálculo de los coeficientes b de q(x)
bo= ao= 1
b¡ = al + uobo = - 8 + 0(1) = -8
b2 = a2 + uOb¡ + vobo = 39 + 0(- 8) + 0(1) = 39
b3 = a3 + uOb2 + vOb ¡ = -62 + 0(39) + 0(-8) = -62
b4 = a4 + uOb3 + vOb2 = 50 + 0(- 62) + 0(39) = 50
Recuérdese que b3
y b4 deberán tender a cero, en caso de convergencia.
Cálculo de las derivadas parciales c
Co =bo= 1
c¡ = b¡ + uoco = - 8 + 0(1) =-8
c2 = b2 + uOc¡ + voco = 39 + 0(- 8) + 0(1) = 39
c3 = b3 + uOc2 + vOc] = -62 + 0(39) + 0(-8) = -62
en
v,
el
n-
Sistema de ecuaciones no lineales 303
Formando el sistema linearizado se obtiene:
cll
_
2h + cn_3k = - bn_¡ o bien c2h + e.k = - b3
o bien 39h + 8k = -(-62)
cn_¡h + cll
_
2k = - bl1
o bien c3h + c2k = - b4 o bien -62h + 39k = -50
Al resolver este sistema por la regla de Cramer se obtiene:
h = b4c¡ - b3c2
cl- c3c¡
b3
c3
- b4
c2
k= 2 =
C2 - c3c¡
Cálculo del nuevo factor cuadrático
50(-8) - (-62)(39) = 1.96878
392 -(-62)(-8)
-62(-62) - 50(39) = 1.84780
392 -(-62)(-8)
U¡ = ua + h = O + 1.96878 = 1.96878
VI = va + k = O+ 1.84780 = 1.84780
Las nuevas aproximaciones a las raíces son:
x = a + bi; donde
a = u¡l2 = 1.96878/2 = 0.98439
y
b = ± ) - VI - a2 = ± 1.67834i
x = 0.98439 ± 1.67834i.
Para ver si el proceso converge puede evaluarse el polinornio en las diferentes aproxima-
ciones a las raíces y ver si lp(x) 1::::;e, en donde E, en este caso podría tomarse como 10-5.
La ecuación 4.28 queda entonces:
p(x) = x4 - 8x3 + 39x2 - 62x + 50 = -31.6831 ± 11.3870i
1 p(x) 1 = )(-31.6831)2 + (11.3870)2 = 33.6671
Al continuar el proceso iterativo, se obtienen los siguientes resultados:
Segunda Iteración
k O 1 2 3 4
bk 1 -6.03122 28.97366 -16.10175 71.83686
ck 1 -4.06244 22.82341 21.32595
1 p(x) 1 13.4132
Con estos valores x = 1.04666 ± 0.56619i
Tercera Iteración
k O 1 2 3 4
bk 1 -5.90668 25.21935 -0.84351 12.52183
ck 1 -3.81336 15.82070 37.67428
1 p(x) 1 0.170093
Con estos valores x = 1.00299 ± 0.99679i
304 Métodos numér icos aplicados a la ingeniería
Cuarta Iteración
k o 1 2 3 4
1
1
-5.99401 24.97649 0.08813 0.23405
-3.98802 14.97697 38.10619
Ip(x) 13.86 X 10-4
Con estos valores x = 1.00000033 ± 0.9999990063i
Se puede ver que el proceso está convergiendo a las raíces x = 1 ± li. En el disco se
encuentra el programa 4.4 que realiza estos cálculos.
Ejercicios
4.1 Uno de los problemas de ingeniería química que mejor ilustra la reducción de ecuaciones
es el cálculo de la fracción de vapor VIF en una vaporización instantánea (véase ejercicio
2.6), donde se tienen las ecuaciones
i = 1,2, ... , n
(1)
(2)
provenientes del balance de materiales, y las relaciones de equilibrio líquido-vapor
K=~,
x¡
i = 1,2, ... , n (3)
donde:
pO
K.=-'
, P i = 1, 2, ... , n (4)
y
i = 1,2, ... , n (5)
con las constantes A¡, B¡ y C¡ dadas para cada componente i.
Además se tiene:
n
~x
¡=I t
11
~ y= O
¡=I '
(6)
11
~ Z = 1
¡=I t
(7)
Por otro lado, se tiene en estos problemas generalmente especificadas: z¡, i = 1,2, ... , n -
1, P, T Y F.
Para un número de componente n = 9: por ejemplo, se tiene entonces un sistema de
39 ecuaciones en las 39 incógnitas: L, V, x, y¡, K¡, p¡, i = 1,2, ... ,9 YZ9' que puede redu-
cirse, en general, como sigue.
Al combinar las ecuaciones (2) y (3) se eliminan las y¡, y se obtiene:
Z¡ F
x· =---'---
1 (K¡, V + F)
(8)
304 Métodos numéricos aplicados a la ingeniería
Cuarta Iteración
k O 1 2 3 4
bk 1 -5.99401 24.97649 0.08813 0.23405
ck 1 - 3.98802 14.97697 38.10619
Ip(x) 13.86 X 10-4
Con estos valores x = 1.00000033 ± 0.9999990063i
Se puede ver que el proceso está convergiendo a las raÍCes x = 1 ± li. En el disco se
encuentra el programa 4.4 que realiza estos cálculos.
Ejercicios
4.1 Uno de los problemas de ingeniería química que mejor ilustra la reducción de ecuaciones
es el cálculo de la fracción de vapor VIF en una vaporización instantánea (véase ejercicio
2.6), donde se tienen las ecuaciones
i =1,2,... , n
provenientes del balance de materiales, y las relaciones de equilibrio líquido-vapor
donde:
y
K=~,
pO
K.= - '
, P
i =1,2,... , n
i = 1, 2,... , n
i = 1,2,... , n
con las constantes A i, Bi YCi dadas para cada componente i.
Además se tiene:
n n.
~x
i=1 '
~ y=O
i=l '
11
~ Z = 1
i=1 '
(1)
(2)
(3)
(4)
(5)
(6)
(7)
Por otro lado, se tiene en estos problemas generalmente especificadas: z¡, i = 1,2,... , n -
1, P, T Y F.
Para un número de componente n = 9: por ejemplo, se tiene entonces un sistema de
39 ecuaciones en las 39 incógnitas: L, V, Xi' Yi' Ki, Pi' i = 1, 2,... ,9 YZ9' que puede redu-
cirse, en general, como sigue.
Al combinar las ecuaciones (2) y (3) se eliminan las Yi' y se obtiene:
Zi F
x· =----'---
, (K¡, V + F)
(8)
se
es
cio
(1)
(2)
(3)
(4)
(5)
(6)
(7)
de
u-
8)
Sistema de ecuaciones no lineales 305
Al combinar las ecuaciones (6) y (3):
n 11
Lx L K¡x = O
¡=I ' ¡=I'
o bien:
1/
Lx(1-K.)=O
i=l I 1
(9)
con la sustitución de (8) en (9) se tiene:
; z, F(l- K)
z: -'-------'--=0
i=1 K¡ V + L
(10)
Pero de (1) L = F-V, con lo que queda finalmente:
11 z.(l-K.)
L 1 '=0
i= I V (K, - 1) + F
(11)
Hay que observar que si se conocen los valores de z¡, i = 1,2, ... , n - 1 (usando la ecua-
ción (7) se obtiene z.), los valores de A¡, B¡, C¡, i = 1, 2, ... , n y los valores de P y T
(usando (5) y (4) se obtiene K¡, i = 1,2, ... , n) y F, la ecuación (11) es ya sólo función
de V, con lo que se ha reducido el sistema de 39 ecuaciones con 39 incógnitas a una so-
la ecuación con una incógnita (V), cuya solución puede obtenerse con alguno de los mé-
todos del capítulo 2.
4.2 La presión requerida para sumergir un objeto pesado grande en un terreno suave y homo-
géneo, que se encuentra sobre un terreno de base dura, puede predecirse a partir de la pre-
sión requerida para sumergir objetos más pequeños en el mismo suelo. * En particular, la
presión p requerida para sumergir una lámina circular de radio r, a una distancia d en el te-
rreno suave, donde el terreno de base dura se encuentra a una distancia D > d debajo de la
superficie, puede aproximarse mediante una ecuación de la forma:
(1)
donde kl, k2 Yk3 son constantes que, con k2 > O,dependen de d y la consistencia del terre-
no pero no del radio de la lámina.
a) Encuentre los valores de ki' k2 Y k3 si se supone que una lámina de radio de 1 pul-
gada requiere una presión de 10 lb/pulg? para sumergirse 1 pie en el terreno lodoso;
una lámina de radio 2 pulgadas, requiere una presión de 12 lb/pulg? para sumergir-
se 1 pie; y una lámina de radio 3 pulgadas requiere una presión de 15 lb/pulg? (su-
poniendo que el lodo tiene una profundidad mayor que 1 pie).
b) Use los cálculos de a) para predecir cuál es la lámina circular de radio mínimo que
se necesitaría para sostener un peso de 500lb en este terreno, con un hundimiento
de menos de 1 pie.
Solución Inciso a)
Al sustituir los valores de r y p en (1) para los tres casos, se tiene:
10 = kl exp(k2) + k3
12 = k, exp(2k2) + 2k3
15 = k, exp(3k2) + 3k3
* Richard L. Burden y J. Douglas Faires. Análisis numérico. Grupo Editorial Iberoamericana (1985).
Sistema de ecuaciones no lineales 305
Al combinar las ecuaciones (6) y (3):
n 11
Lx L K¡x = O
¡=I I ¡=I I
o bien:
1/
L x (l-K.) = O
i=l 1 1
con la sustitución de (8) en (9) se tiene:
; Z¡ F(l- K)
"-- -'--------'--=0
i=1 K¡ Y + L
Pero de (1) L =F-Y, con lo que queda finalmente:
11 z.(l-K.)
L 1 I =0
¡=I Y (Ki - 1) + F
(9)
(10)
(11)
Hay que observar que si se conocen los valores de z¡, i = 1, 2,... , n - 1 (usando la ecua-
ción (7) se obtiene zl/)' los valores de A¡, B¡, C¡, i = 1, 2, ... , n y los valores de P y T
(usando (5) y (4) se obtiene K¡, i = 1, 2, ... , n) y F, la ecuación (11) es ya sólo función
de Y, con lo que se ha reducido el sistema de 39 ecuaciones con 39 incógnitas a una so-
la ecuación con una incógnita (Y), cuya solución puede obtenerse con alguno de los mé-
todos del capítulo 2.
4.2 La presión requerida para sumergir un objeto pesado grande en un terreno suave y homo-
géneo, que se encuentra sobre un terreno de base dura, puede predecirse a partir de la pre-
sión requerida para sumergir objetos más pequeños en el mismo suelo.* En particular, la
presión p requerida para sumergir una lámina circular de radio r, a una distancia d en el te-
rreno suave, donde el terreno de base dura se encuentra a una distancia D > d debajo de la
superficie, puede aproximarse mediante una ecuación de la forma:
(1)
donde kl , k2 Yk3 son constantes que, con k2 > O, dependen de d y la consistencia del terre-
no pero no del radio de la lámina.
a) Encuentre los valores de ki' k2 Y k3 si se supone que una lámina de radio de 1 pul-
gada requiere una presión de 10 Ib/pulg2 para sumergirse 1 pie en el terreno lodoso;
una lámina de radio 2 pulgadas, requiere una presión de 12 Ib/pulg2 para sumergir-
se 1 pie; y una lámina de radio 3 pulgadas requiere una presión de 15 lb/pulg2 (su-
poniendo que el lodo tiene una profundidad mayor que 1 pie).
b) Use los cálculos de a) para predecir cuál es la lámina circular de radio mínimo que
se necesitaría para sostener un peso de 500 lb en este terreno, con un hundimiento
de menos de 1 pie.
Solución Inciso a)
Al sustituir los valores de r y p en (1) para los tres casos, se tiene:
10 = k¡ exp(k2) + k3
12 = k¡ exp(2k2) + 2k3
15 = kl exp(3k2) + 3k3
* Richard L. Burden y J. Douglas Faires. Análisis numérico. Grupo Editorial Iberoamericana (1985).
..,.
306 Métodos numéricos aplicados a la ingeniería
un sistema de tres ecuaciones no lineales en las incógnitas k" k2 Y k3. Se despeja k3 de la
primera ecuación
Se sustituye k3 en las dos restantes y se tiene:
12 = k¡ exp(2k2) + 2[10 - k¡ exp(k2)]
15 = k¡ exp(3k2) + 3[10 - k¡ exp(k2)]
o bien:
!¡ (k" k2) = k¡ [exp (2k2) - 2exp (k2)] + 8 = O
!2 (k" k2) = k¡[exp (3k2) - 3exp (k2)] + 15 = O
(2)
un sistema de dos ecuaciones no lineales en las incógnitas k¡ y k2.
Al dividir miembro a miembro estas dos ecuaciones
kj [exp (2k2) - 2exp (k2)] -8
k¡ [exp (3k2
) - 3exp (k2
)] -15
se obtiene:
8 6
exp (k2) - - exp (2k2) - - = O
15 15
o bien:
(3)
una ecuación no lineal en la incógnita k2
, cuya solución con el método de Newton-Raps-
han visto en el capítulo 2 es:
k2
= 0.259695;
al sustituir k2 en cualquiera de las ecuaciones (2) y despejar se tiene:
-8
k¡ = = 8.771286,
exp (2k2
) - 2exp (k2
)
por último:
Inciso b)
Un peso de 500 lb sobre un disco de radio r producirá una presión de 500/(n:r2) lb/pulg-.
Entonces:
500
p = -- = k¡ exp (k2 r) + k3 r
n:r2
o bien:
Para obtener el valor mínimo de r, se iguala! I (r) con cero
306 Métodos numéricos aplicados a la ingenie ría
un sistema de tres ecuaciones no lineales en las incógnitas kp k2 Yk3. Se despeja k3 de la
primera ecuación
Se sustituye k3 en las dos restantes y se tiene:
o bien:
12 = k¡ exp(2k2) + 2[10 - k¡ exp(k2)]
15 = k, exp(3k2) + 3[10 - k¡ exp(k2)]
J¡ (kl' k2) = k, [exp (2k2) - 2exp (k2)] + 8 = O
J2 (kl' k2) = k, [exp (3k2) - 3exp (k2)] + 15 =O
un sistema de dos ecuaciones no lineales en las incógnitas k, y k2.
Al dividir miembro a miembro estas dos ecuaciones
k¡ [exp (2k2) - 2exp (k2) ] -8
k,[exp (3k2) - 3exp (k2)] - 15
se obtiene:
8 6
exp (k2 ) - - exp (2k2) - - = O
15 15
o bien:
(2)
(3)
una ecuación no lineal en la incógnita k2, cuya solución con el método de Newton-Raps-
hon visto en el capítulo 2 es:
~ = 0.259695;
al sustituir k2
en cualquiera de las ecuaciones (2) y despejar se tiene:
-8
k, = = 8.771286,
exp (2k2) - 2exp (k2)
por último:
Inciso b)
Un peso de 500 lb sobre un disco de radio r producirá una presión de 500/(n:r2
) Ib/pulg2.
Entonces:
o bien:
500
p =-- =k¡ exp (k2 r) + k3 r
n:r2
Para obtener el valor mínimo de r, se iguala!, (r) con cero
la
Sistema de ecuaciones no lineales 307
lo que origina una ecuación no lineal en la incógnita r, cuya solución por medio de algu-
no de los métodos del capítulo 2 da
r = 3.18516 pulg.
que corresponde a un mínimo de f (r). El lector puede verificar esto usando alguno de los
criterios del cálculo diferencial.
4.3 Resuelva el siguiente sistema verificando primero su partición.
el: XI + x4 -10 = O
e2: xlx4x3 - Xs - 6 = O
2) e
3
: XIX/
7
(X4 - 5) - 8 = O
e
4
: x4 - 3xI + 6 = O
es: xIX3 - Xs + 6 = O
a) Se forma una matriz de incidencia
XI x2 x3
x4
X
s
3)
el 1 1
s- e2 1 1 1 1
e
3
1 1 1
e4 1 1
es 1
Solución Si bien la descomposición de un sistema en subsistemas es conocida como partición, la se-
cuencia para resolver los subsistemas resultantes se denomina orden de precedencia del
sistema. Existen algoritmos para partir un conjunto de ecuaciones y determinar el orden de
precedencia. A continuación se seguirán las ideas de estos algoritmos a fin de partir el sis-
tema dado.
donde cada fila corresponde a una ecuación y cada columna a una variable. Un 1 aparece
en la fila i y la columna}, si la variable xi aparece en la ecuación e¡.
b) Se rearreglan las filas y columnas para apreciar mejor las particiones y el orden de
precedencia. Así después de un rearreglo se llega a

~J
~J1
G
1
1
[~
donde se nota de inmediato que en las ecuaciones eI y e4 aparecen solamente las variables
x¡ y x4
' y constituyen entonces un subsistema que puede resolverse primero
el: xl+x4=10
e4: -3x¡ + x4 = -6
resulta x2 = 4 Yx4 = 6.
308 Métodos numéricos aplicados a la ingeniería
Estos valores se sustituyen en la ecuación e3 y ésta queda en función de x2 solamen-
te; por tanto, como una ecuación en una incógnita
e3
: 4X
2
1.7_8=0
resulta x2 = 1.5034
Finalmente, las ecuaciones e2 y es pueden resolverse para x3 y xs' lo que da
X
3
1.255
X
s 11.0202
4.4 En un reactor se efectúan las siguientes reacciones en fase gaseosa:
A+B •••====~. (1)
2E (2)
A la temperatura de la reacción, las constantes de equilibrio son kp¡=2.6 y kP2 = 3.1 Las
composiciones iniciales son 2 mol/L de A y 1 mol/L de B.
Calcule la composición a la salida del reactor, asumiendo que se alcanza el equilibrio.
Solución Si x¡ representa los moles de A convertidos en la reacción (1), y x2 los moles de A conver-
tidos en la reacción (2), entonces en el equilibrio tenemos:
moles deA
moles de B
moles de C
moles de D
moles de E
moles totales
2 -x¡ -x2
l-x¡
x¡ -x2
x¡
2x2
3
Con la aplicación de la ley de acción de masas se obtiene:
Para la reacción ( 1)
2.6 = (x¡ - x2)(xj)
(2 - x¡ - x2)(l - x¡)
Para la reacción ( 2 )
3.1 = (2x2)2
(2 - x¡ - x2)(x¡ - x2)
que es un sistema de dos ecuaciones no lineales en dos incógnitas, cuya solución por el
método de Newton-Raphson, por ejemplo, exige:
- Un vector inicial cercano a la solución, obtenible a partir de consideraciones físi-
cas del problema.
- La matriz jacobiana, ampliada con el vector de funciones, que es relativamente fá-
cil, puesto que las derivadas parciales son directas.
Vector inicial. En virtud de las funciones y la existencia inicial de 2 moles de A y 1 mol
de B, se propone x¡ = 0.8 Yx2 = 0.4.
Las derivadas parciales para la matriz jacobiana se dan a continuación
308
4.4
Métodos numéricos aplicados a la ingeniería
Estos valores se sustituyen en la ecuación e3 y ésta queda en función de x2 solamen-
te; por tanto, como una ecuación en una incógnita
e3: 4X/7 _8 = 0
resulta x2 = 1.5034
Finalmente, las ecuaciones e2 y es pueden resolverse para x3 y xs' lo que da
x3 1.255
X
s 11.0202
En un reactor se efectúan las siguientes reacciones en fase gaseosa:
(1)
2E (2)
A la temperatura de la reacción, las constantes de equilibrio son kp ¡=2.6 y kP2 =3.1 Las
composiciones iniciales son 2 mol/L de A y 1 mol/L de B.
Calcule la composición a la salida del reactor, asumiendo que se alcanza el equilibrio.
Solución Si x ¡ representa los moles de A convertidos en la reacción (1), y x2 los moles de A conver-
tidos en la reacción (2), entonces en el equilibrio tenemos:
moles deA 2 - Xl -x2
moles de B l-x
l
moles de C Xl - x2
moles de D xl
moles de E 2x2
moles totales 3
Con la aplicación de la ley de acción de masas se obtiene:
Para la reacción ( 1 )
2.6 = (Xl - x2)(xJ)
(2 - Xl - x 2)(l - Xl)
Para la reacción ( 2 )
que es un sistema de dos ecuaciones no lineales en dos incógnitas, cuya solución por el
método de Newton-Raphson, por ejemplo, exige:
- Un vector inicial cercano a la solución, obtenible a partir de consideraciones físi-
cas del problema.
- La matriz jacobiana, ampliada con el vector de funciones, que es relativamente fá-
cil, puesto que las derivadas parciales son directas.
Vector inicial. En virtud de las funciones y la existencia inicial de 2 moles de A y 1 mol
de B, se propone Xl =0.8 Yx2 =OA.
Las derivadas parciales para la matriz jacobiana se dan a continuación
Sistema de ecuaciones no lineales 309
n- (x, - x2) (x,)
i, (x" x2) = (2 _ x, _ x
2
) (1 _ x,) - 2.6 = O
(2x2)2
f2(x"X2)= -3.1=0
(2 - x, - x2) (xI - x2)
(2 - x, - x2)(1 - xl)(2xI - x2) - (XI - x2)(x,)( -3 + 2 xI + x2)
«2 -x, -x2)(1-x,»2
(2 - x, - x2) (1 - x,) (x,) + (xI - x2)(x,) (x, - 1)
«2 - x, - x2) (1 - x,»2
of2 (x" x2) -(2x2) 2 (2 - 2x,)
ox, ( (2 - x, - x2) (x¡ - x2»2
8 (2 -x, -x2) (x, -x2) x2- 8 xl(-l + x2)
( (2 - x, - x2) (x, - X2»2
(1)
(2)
Las
rio. Con el PROGRAMA 4.1 del CD se obtienen los siguientes resultados:
k X(I) X(2) Distancia
O 0.80000 0.40000
0.82175 0.46596 6.94595e-002
2 0.83460 0.45687 1.57387e-002
3 0.83176 0.4557l 3.06403e-003
4 0.83145 0.45566 3.18286e-004
5 0.83144 0.45565 1.21513e-005
6 0.83144 0.45565 4.10222e-007
La solución del sistema es:
X(l) = 0.83144
X(2) = 0.45565
ver-
4.5 El mezclado imperfecto en un reactor continuo de tanque agitado, se puede modelar co-
mo dos o más reactores con recirculación entre ellos, como se muestra en la figura si-
guiente.
físi-
F = 25L/min
F+ FR
CA
F
CA
I 2
. FR. r
te fá-
mol
Figura 4.15
Reactores
químicos con
recirculación.
1'71'"
310 Métodos numéricos aplicados a la ingeniería
En este sistema se lleva a cabo una reacción isotérmica irreversible del tipo A .E:B
de orden 1.8 con respecto al reactante A. Con los datos que se proporcionan abajo, calcu-
le la concentración del reactante A en los reactores 1 y 2 (CAl Y CA2respectivamente), una
vez alcanzado el régimen permanente.
Datos
F = 25 L/min
CAo= 1 mollL
FR = 100 L/min
VI = 80 L
V2 = 20 L
k = 0.2 (L/mol)o.s (min -1)
Solución Con el balance del componente A en cada uno de los reactores se tiene
Entra Sale Reacciona Acumulación
Reactor 1
(1)
Reactor 2
(F+FR)CAI- (FR+F)CA2-V2kcnA2=0
un sistema de dos ecuaciones no lineales en las incógnitas CAl y CA2.
No obstante, se observa que despejando a CA2de la ecuación (1)
(F + FR) CAl + VI k CltAI- F CAOCA2=----~~~~--~--~~--~~
FR
(2)
y sustituyéndola en la ecuación (2)
(F + FR ) CAl + V I k C"Al - FC AO
125 CAl - 125 -----'-'----''-'-'----'------'-'-'------'=-
FR
_iv, [(F + FR) CAl + VI k C"AI - FCAO] 11 = O
- FR
el problema se reduce a una ecuación no lineal en la incógnita CAl' cuya solución se en-
cuentra empleando alguno de los métodos del capítulo 2 y se deja al lector como ejercicio.
CAl = 0.6493
CA2= 0.6352
4.6 En una lámpara de arco: de longitud de arco constante, se observa el voltaje V empleado
por el arco para diversos valores de la corriente 1
Resultados:
1 0.5 1 2 4 8 12
V 160 120 94 75 62 56
Encuentre la ecuación que mejor represente estos valores, empleando el criterio de míni-
mos cuadrados .
• J. Lipka. Computaciones gráficas y mecánicas. Lipka J. CECSA.
310 Métodos numéricos aplicados a la ingeniería
En este sistema se lleva a cabo una reacción isotérmica irreversible del tipo A ~ B
de orden 1.8 con respecto al reactante A. Con los datos que se proporcionan abajo, calcu-
le la concentración del reactante A en los reactores 1 y 2 (CAl YCA2 respectivamente), una
vez alcanzado el régimen permanente.
Datos
VI = 80 L
V2 = 20 L
F = 25 Llmin
CAO = 1 mollL
FR =100 Llmin k = 0.2 (Llmol)o.8 (rnin - 1)
Solución Con el balance del componente A en cada uno de los reactores se tiene
Entra Sale Reacciona
Reactor 1
Reactor 2
(F + FR ) CAl - (FR + F) CA2 - V2k cnA2 = O
un sistema de dos ecuaciones no lineales en las incógnitas CAl y CA2.
No obstante, se observa que despejando a CA2 de la ecuación (1)
(F + FR ) CAl + V I k C/AI - F CAO
CA2 =-----=.-'------'-'.:....---'----'-.:..:'--------'-''''-
FR
y sustituyéndola en la ecuación (2)
(F + FR ) CAl + VI k cnAl - FCAO
125 CAI - 125 ------'-'--'-'-'----'------'-'-'-------'=-
FR
_ kV? [ (F + FR ) CAl + VI k cnAI - FCAO] 11 = O
- FR
Acumulación
(1)
(2)
el problema se reduce a una ecuación no lineal en la incógnita CAl' cuya solución se en-
cuentra empleando alguno de los métodos del capítulo 2 y se deja al lector como ejercicio.
Resultados: CAl = 0.6493
CA2 =0.6352
4.6 En una lámpara de arco,* de longitud de arco constante, se observa el voltaje V empleado
por el arco para diversos valores de la corriente 1
1 0.5 1 2 4 8 12
V 160 120 94 75 62 56
Encuentre la ecuación que mejor represente estos valores, empleando el criterio de míni-
mos cuadrados.
• J. Lipka. Computaciones gráficas y mecánicas. Lipka J. CECSA.
Sistema de ecuaciones no lineales 311
SoluciónB Se traza el diagrama de dispersión
cu-
una v
•150
•
100
•
•
•50 •(1)
2 5 10 1
(2)
y se observe que la curva suave que pasa entre los puntos es hiperbólica y asintótica a al-
guna recta horizontal V = c. Con esto, se supone que los datos pueden quedar relaciona-
dos por la ecuación
donde' b < O.
Los parámetros a, b y e se determinan minimizando la función
6
f( a, b, c) = L (V; - al/ - C)2
;=1
La ecuación (2) se deriva parcialmente con respecto a a, b y e, y se igualan a cero dichas
derivadas parciales para obtener:
666
L vtr :« L I2b_c L Ib=O11 1 1
;=J ;=1 ;=1
6 6 6
L V J/ lnl, - a L 1;2b lnl¡ - e L Illnl; = O
;=1 ;=J ;=1
6 6 b
L V¡ - a L I¡ - 6 e = O
;=1 ;=J
en-
icio,
93
352
ado un sistema de tres ecuaciones no lineales en las incógnitas a, by c.
Al despejar e de la tercera ecuación:
1 6
c=- L V.
6 ;=1 1
a
6
6
L Il
;=1
'ni-
y sustituir en las dos primeras, se tiene:
6 6 1 6 6 6
I, (a b) = L V lb - a L Ilb - - [ LV] [ L lb] + [ --ª- L lb F= O
, ;=1 1 1 ;=1 1 6 ;=1 1 ;=1 1 6 ;=J 1
• b > O en el caso de una parábola, con ordenada al origen c.
(1)
(2)
(3)
(4)
(5)
pr
312 Métodos n uméricos aplicados a la ingeniería
un sistema de dos ecuaciones no lineales en las incógnitas a y b, cuya solución requiere
valores iniciales.
Para estimar valores iniciales, en la ecuación (1) se sustituyen tres de los puntos dados
160 = a 0.5b
+ e
75 = a 4b
+ e
56 = a l2b
+ e
al despejar e de la tercera y sustituir en las dos primeras se tiene:
160 = a 0.5b + 56 - a 12b
75 = a 4b
+ 56 - a 12b
o bien
a (0.5b - 12b) 104
a(4b-12b) 19
Estas dos últimas ecuaciones se dividen miembro a miembro
,,'
0.5b - 12b 104
4b-12b 19
se rearregla
19 (0.5)b + 85 (12)b -104 (4)b = O
y se resuelve esta ecuación no lineal con alguno de los métodos del capítulo 2 para obtener:
b = -0.51952
de donde:
a = 89.77
El sistema (5) se resuelve utilizando éstos como valores iniciales y el método de Newton-
Raphson multivariable, con lo que resulta
(1)
a 87.78
b -0.532
y al sustituir en (4) se obtiene:
e = 32.86
De tal manera que la ecuación que mejor ajusta los datos queda:
,
v = 87.78 1 -0.532 + 32.86
4.7 Para la obtención de butadieno a partir de etanol en fase vapor, se propone el siguiente me-
canismo de reacción.
CH3-CH2-OH ~('======
/OH
CH2 = C,-----+ CH2 = CH2 .::,======
H
, /011
CH2.:=C", + H2
. H
(2)
(3)
312
4.7
Métodos numéricos aplicados a la ingeniería
un sistema de dos ecuaciones no lineales en las incógnitas a y b, cuya solución requiere
valores iniciales.
Para estimar valores iniciales, en la ecuación (1) se sustituyen tres de los puntos dados
160 = a 0.5b + e
75 = a 4b
+ e
56 = a 12b
+ e
al despejar e de la tercera y sustituir en las dos primeras se tiene:
160 = a 0.5b + 56 - a 12b
75 = a 4b + 56 - a l2b
o bien
a (0.5" - 12b) 104
a (4b -12b) 19
Estas dos últimas ecuaciones se dividen miembro a miembro
0.5b - 12b 104
4b -12b 19
se rearregla
19 (0.5)b + 85 (12)b -104 (4)b = O
y se resuelve esta ecuación no lineal con alguno de los métodos del capítulo 2 para obtener:
b =-0.51952
de donde:
a =89.77
El sistema (5) se resuelve utilizando éstos como valores iniciales y el método de Newton-
Raphson multivariable, con lo que resulta
a 87.78
b -0.532
y al sustituir en (4) se obtiene:
e = 32.86
De tal manera que la ecuación que mejor ajusta los datos queda:,
v=87.78 [ - 0.532 + 32.86
Para la obtención de butadieno a partir de etanol en fase vapor, se propone el siguiente me-
canismo de reacción.
CH3-CH2-OH .::,.======
/ OH
CH2 = C"-... + CH2 = CH2 .::.======
H
. /0H.
CH2.:= C", + H2
H
CH2 = CH-HC = CH2 + H20
(1)
(2)
(3)
Sistema de ecuaciones no lineales 313
uiere Calcule las composiciones en el equilibrio a 400 o C y 1 atm, si las constantes de equi-
librio son 5.97, 0.27 Y 2.8 para las reacciones (1), (2) Y (3), respectivamente.
Solución Base de cálculo: 1 mol de etanol.
Si
dos
XI = moles de etileno producidas en la reacción (1)
x2 = moles de hidrógeno producidas en la reacción (2)
x3 = moles de agua producidas en la reacción (3)
entonces en el equilibrio se tendrá:
moles de etanol
moles de etileno
moles de agua
moles de hidrógeno
moles de acetaldehído
moles de butadieno
moles totales
1 - xI - x2
XI -x3
XI + x3
x2
x2
-x3
x3
1 + xI + x2
De acuerdo con la ley de acción de masas, se tiene:
tener:
(XI + x3) (xI - x3) [ P l,1nl
5.97
(1-xl -x2) 1 +xl
+x2
0.27 = (x2 + x3) x2 [ P 1,1n2
(1-xl -x2) 1 +xl +x2
2.8 = (XI + x3) x3 [ P l,1n3
(XI - x3 )( x2 - x3 ) 1 + XI + x2
donde Sn, = número de moles de los productos-número de moles de los reactantes (en la
reacción i).
Por tanto:
wton-
,1nl
= 2 - 1 = 1
,1n2
=2-1=1
,1n3
=2-2=0
Por otro lado:
P = 1 atm.
Vector inicial. Luego de observar las funciones y el hecho de que la base de cálculo es 1
mol de etanol, se propone
e me-
XI = 0.7, X2 = 0.2,
(1) Si se utilizaran las ecuaciones del sistema tal como están, se tendrían serios problemas, ya
que si xI + x2
= 1, habría división entre cero. Un reacomodo de las ecuaciones permitiría
no sólo evitar la división entre cero, sino obtener una convergencia más rápida. Por ejem-
plo, podría escribirse el sistema así.,
p,1nl (XI + X
3
)(x
l
- x
3
) -5.97(1 - XI - x
2
)(1 + XI + X
2
),1nl = O
p,1n2 (x
2
+ x
3
)x
2
- 0.27(1 + XI + x
2
)(1 + XI + X
2
),1n2 = O
p,1n3 (XI + x
3
)x
3
- 2.8(xl
- x
3
)(x
2
- x
3
)(1 + XI + x
2
),1n3 = O
(2)
(3)
Sistema de ecuaciones no lineales 313
Calcule las composiciones en el equilibrio a 400 o C y 1 atm, si las constantes de equi-
librio son 5.97, 0.27 Y2.8 para las reacciones (1), (2) Y(3), respectivamente.
Solución Base de cálculo: 1 mol de etanol.
Si
X ¡ = moles de etileno producidas en la reacción (1)
x2 = moles de hidrógeno producidas en la reacción (2)
x3 =moles de agua producidas en la reacción (3)
entonces en el equilibrio se tendrá:
moles de etanol
moles de etileno
moles de agua
moles de hidrógeno
moles de acetaldehído
moles de butadieno
moles totales
1 - x¡- x2
x ¡ -x3
x¡ + x3
x2
x2 -x3
x3
1 + xl + x2
De acuerdo con la ley de acción de masas, se tiene:
0.27 = (x2 + x3) x2
(1-x l
-X
2
)
(xI + x3) x3 [ P 1~n32.8 =
(X I - X3 ) (X2 - X3 ) 1 + XI + x2
donde ~ni =número de moles de los productos-número de moles de los reactantes (en la
reacción i).
Por tanto:
Por otro lado:
~n¡ =2 - 1 = 1
~n2 =2 - 1=1
~n3 = 2-2 =0
P = 1 atm.
Vector inicial. Luego de observar las funciones y el hecho de que la base de cálculo es 1
mol de etanol, se propone
XI =0.7, X2 = 0.2,
Si se utilizaran las ecuaciones del sistema tal como están, se tendrían serios problemas, ya
que si X I + x2 = 1, habría división entre cero. Un reacomodo de las ecuaciones permitiría
no sólo evitar la división entre cero, sino obtener una convergencia más rápida. Por ejem-
plo, podría escribirse el sistema a'sí:.
p~n¡ (XI + X3)(xl - x3) -5.97(1 - XI - x2
)(l + X I + X2)~nl = O
p~n2 (x2 + x3)x2 - 0.27(1 + XI + x2)(1 + XI + X2)~n2 = O
p~n3 (XI + x3)x3 - 2.8(xl - x3)(x2 - x3)(1 + XI + X2)~n3 =O
314 Métodos numéricos ap licados a la ingeniería
Luego de sustituir valores y resolver el sistema de ecuaciones no lineales resultante
con el PROGRAMA 4.1 del CD, se llega a los siguientes resultados
X(1) 0.71230
X(2) 0.24645
X(3) 0.15792
4.8 En una columna de cinco platos, se quiere absorber tolueno contenido en una corriente de
gas Vo (moles de gas sin tolueno/min), con un aceite Lo (moles de aceite sin tolueno/min).
Considérese que la relación de equilibrio está dada por la ley de Henry (y = m x), y que la
columna opera a régimen permanente. Calcule la composición de tolueno en cada plato.
Datos: Vo = 39.6 moles/min
Lo = 6.0 moles/min
Las moles de tolueno/min que entran a la columna con el gas y el aceite, son res-
pectivamente:
TVo = 5.4 moles/min
TLo = 0.0 moles/min
m = 0.155
De aquí:
Yo = 5.4 = 0.12
5.4 + 39.6
fracción mol de tolueno en el gas que entra.
Solución Los balances de masa para el tolueno en cada plato son (véase Fig. 4.16).
Plato Balance de tolueno
Ys
-Í
Lo----
Figura 4.16
Columna
de absorción de Vo +
cinco platos.
4
t; = Lo+ TLi
Vi= Vo+ TVi
1::; i s 5
X
1
314 Métodos numéricos aplicados a la ingeniería
Luego de sustituir valores y resolver el sistema de ecuaciones no lineales resultante
con el PROGRAMA 4.1 del CD, se llega a los siguientes resultados
X(l) 0.71230
X(2) 0.24645
X(3) 0.15792
4.8 En una columna de cinco platos, se quiere absorber tolueno contenido en una corriente de
gas Va (moles de gas sin tolueno/min), con un aceite Lo (moles de aceite sin tolueno/min).
Considérese que la relación de equilibrio está dada por la ley de Henry (y = m x), y que la
columna opera a régimen permanente. Calcule la composición de tolueno en cada plato.
Datos: Va = 39.6 moles/min
Lo =6.0 moles/min
Las moles de tolueno/min que entran a la columna con el gas y el aceite, son res-
pectivamente:
TVo= 5.4 moles/min
TLo =0.0 moles/min
m = 0.155
De aquí:
Yo = 5.4 = 0.12
5.4 + 39.6
fracción mol de tolueno en el gas que entra.
Solución Los balances de masa para el tolueno en cada plato son (véase Fig. 4.16).
Plato
Ys
Balance de tolueno
Li = Lo+ TLi
Vi = Vo+ TVi
1 S:¡ S: S
Figura 4.16
Columna
de absorción de Vo+
cinco platos.
e
e
l·
la
Sistema de ecuaciones no lineales 315
2
3
4
5
(Vo + TVo)yo - (Vo + TV¡)y¡ + (Lo + TL2)x2 - (Lo + TL¡)x¡ = O
(Va + TV¡)y¡ - (Vo + TV2)Y2 + (Lo + TL3)x3 - (Lo + TL2)x2 = O
(VO + TV 2)Y2 - (VO + TV 3)Y3 + (Lo + TL4)x4 - (Lo + TL3)x3 = O
(VO + TV 3)Y3 - (VO + TV 4)y 4 + (Lo + TL5)x5 - (Lo + TL4)x4 = O
(VO + TV 4)y 4 - (Vo + TV 5)Y5 + (Lo + TLo)xo - (Lo + TL5)X5 = O
donde TV¡, TL¡, O ::; i::;5, son los moles de tolueno/min que salen del plato i con el gas y
el aceite, respectivamente.
Como
y demás y¡ = ITLX¡,
y¡ = TV¡ + V
o
se obtiene:
VOmx¡
TV ¡= --''----'-
1 - 11'lX¡
Por otro lado:
L~r.
TL=_lr_,
, 1-x¡
para O::; i::; 5
Con la sustitución de y¡, TV¡ y TL¡ en los balances de masa anteriores, resulta el sistema
no lineal siguiente:
V m2
x 2 V m2
x 2 LoX 2 LoX52 __O
V mx + o 4 _ V mx _ o 5 + L~r + __ 0_ - Lr _
o 4 1 o 5 1 Ira 1 o-s 1- 11'lX
4
- mX5
- Xo - x5
donde xi' x2'· .. ,x5 son las incógnitas.
Este sistema se resuelve con el programa 4.2 con los siguientes valores iniciales
x¡ = 0.4, x2
= 0.3, x3
='O.~, x4
= 0.1, x5
= 0.05,
los cuales se obtuvieron usando un perfil lineal de concentraciones a lo largo de la colum-
na. Los resultados obtenidos son:
Sistema de ecuacione s no lineales 315
(Va + TVo)yo - (Va + TV¡)y¡ + (Lo + TL2)x2 - (Lo + TL¡)x¡ = O
2 (Va + TV¡)y¡ - (Va + TV2)Y2 + (Lo + TL3)X3 - (Lo + TL2)x2 = O
3 (Va + TV2)Y2 - (Va + TV3)Y3 + (Lo + TL4)x4 - (Lo + TL3)x3 = O
4 (Va + TV3)Y3 - (Va + TV4)Y4 + (Lo + TL5)x5 - (Lo + TL4)x4 = O
5 (Va + TV4)Y4 - (Va + TV5)Y5 + (Lo + TLo)xo- (Lo + TL5)x5 = O
donde TV¡, TL¡, O::;; i::;; 5, son los moles de tolueno/min que salen del plato i con el gas y
el aceite, respectivamente.
Como
se obtiene:
Por otro lado:
TV¡
y. =----'-----
I TV¡ + Va
y demás y¡ = ¡TtX¡,
VOmx¡
TV¡ =-"--------'-
1 - 11'tX¡
L~x: .
TL=_lr_ ,
I 1-x¡
para O::;; i::;; 5
Con la sustitución de y¡, TV¡ y TL¡ en los balances de masa anteriores, resulta el sistema
no lineal siguiente:
V m2
x 2 V m2
x 2 LoX 2 LoX52 __ OV mx + o 4 _ V mx _ o 5 + L~x: + __0_ - Lx: _
o 4 1 o 5 1 lrO 1 lT-5 1- 11'tX4 - mX
5
- X
o
- x
5
donde xi' x2'· .. , x5 son las incógnitas.
Este sistema se resuelve con el programa 4.2 con los siguientes valores iniciales
x ¡ = 0.4, x2 = 0.3, x3 =·0.2, x4 = 0.1, x5 = 0.05,
los cuales se obtuvieron usando un perfil lineal de concentraciones a lo largo de la colum-
na. Los resultados obtenidos son:
316 Métodos numéricos aplicados a la ingeniería
Distancia
.62 120E-0 1
.85044E-02
.27569E-02
.91471E-03
.30494E-03
.10179E-03
.34040E-04
k X (1) X (2) X (3) X (4) X (5)
O .40000 .30000 .20000 .10000 .05000
1 .45756 .30057 .19940 .12100 .06020
2 .45398 .30115 .20289 .12717 .06318
3 .45432 .30195 .20424 .12919 .06416
4 .45444 .30222 .20468 .12986 .06449
5 .45448 .30231 .20483 .13008 .06460
6 .45450 .30234 .20488 .13016 .06463
7 .45450 .30235 .20489 .13018 .06465
La solución del sistema es:
X (1) .45450091
X (2) .30234605
X (3) .20489225
X (4) .13018015
X (5) .64646289E-Ol
Problemas
4.1 Resuelva el sistema
XIX
2
+X
6
X
4
18
x2+xS+x6 12
XI + In (xi x4) 3
x3
2
+ x3
2
x2 + x4 = 4
x3(x3 + 6) = 7
utilizando las sugerencias dadas al principio de este capítulo (reducción, partición, entre
otros).
4.2 Resuelva el sistema
el: XI x3 -x4 1
e2
: xl x3
2 + X4 17
e3
: XI + x2 6
e4
: In X3 xl + X3 xl 1
mediante tanteo de ecuaciones.
4.3 A partir de consideraciones geométricas demuestre que el sistema no lineal
x2+y2-x=0
x2_y2_y=0
Sistema de ecuaciones no lineales 317
tiene una solución no trivial única. Además, obtenga una estimación inicial Xl, yO Y aproxi-
me dicha solución, empleando el método de punto fijo.
4.4 Dado el sistema de ecuaciones no lineales
x2
+ Y = 37
x-y2=5
determine un arreglo de la forma
g, (x, y) =x
g2 (x, y) = y
y un vector inicial x(O) que prometa convergencia a una solución; es decir, que se satisfa-
ga el sistema de desigualdades (Ec. 4.6).
4.5 Encuentre una solución del sistema de ecuaciones del problema anterior, por medio del
método de Newton-Raphson y tomando como valor inicial
a) (x, y) = (5,0)
b) (x, y) = (5,-1)
¿Qué criterios se pueden aplicar para saber si el proceso converge y, en tal caso, cómo se
puede verificar que efectivamente se trata de una solución?
SUGERENCIA: Emplee el CD del libro.
4.6 Utilice el método de punto fijo multivariable para encontrar una solución de cada uno de
los siguientes sistemas.
a) x,(4 - O.0003x, - 0.0004x2) = O
x2(2 - 0.0002x¡ - 0.000Ix2) = O
b) x,2+2x2
2-x2-2x3 =0
x,2 -8x2
2 + l Ox, = 0.0001
x,2/(7x2 x3
) - 1 = O
c) 2x, + x2 + x3 - 410g(lOx,) = O
x, + 2x2 + x3 - 4 log(lOx2) = O
x, x2 x3
-log (lOx3
) = O
ti) 3x, sen x2 -cos(x2 x3
) sen x2 -serr-' (-0.52356) sen x2 = O
x¡2 - 625xl = O
exp(-x¡ x2) + 20x3
= 9.471975
SUGERENCIA: Utilice el Mathcad o sofware equivalente.
4.7 Elabore un programa para resolver sistemas de ecuaciones no lineales. Utilice para ello el
algoritmo 4.1.
Emplee el programa de problema 4.7 para resolver los sistemas del problema 4.6.
Mediante el PROGRAMA 4.1 del CD (véase ejemplo 4.4), resuelva los siguientes sistemas
de ecuaciones no lineales. .
4.8
4.9
a) (x¡ + cos x¡ x2x3
_1)"2 = O
(l-x¡ )114 + x2 + x3
(0.05x3
- 0.15) = 1
1 + x¡2 + 0.1 xl- 0.01x2 -x3 = O
b) 0.5 sen (x¡ x2) - xi(4n) - 0.5x¡ = O
0.920423 [exp (2x¡) - exp (1)] + 8.65256x2 -2exp(x¡) = O
Emplee EPS = 10-4.
--
Sistema de ecuaciones no lineales 317
tiene una solución no tlivial única. Además, obtenga una estimación inicial :xO, yO Yaproxi-
me dicha solución, empleando el método de punto fijo.
4.4 Dado el sistema de ecuaciones no lineales
determine un arreglo de la forma
g, (x, y) =X
g2 (x, y) = y
y un vector inicial x(O) que prometa convergencia a una solución; es decir, que se satisfa-
ga el sistema de desigualdades (Ec. 4.6).
4.5 Encuentre una solución del sistema de ecuaciones del problema anterior, por medio del
método de Newton-Raphson y tomando como valor inicial
a) (x, y) = (5,0)
b) (x, y) = (5,-1)
¿Qué criterios se pueden aplicar para saber si el proceso converge y, en tal caso, cómo se
puede verificar que efectivamente se trata de una solución?
SUGERENCIA: Emplee el CD del libro.
4.6 Utilice el método de punto fijo multivariable para encontrar una solución de cada uno de
los siguientes sistemas.
4.7
4.8
4.9
a) x,(4 - O.0003x, - 0.0004x2) = O
xi2 - 0.0002x¡ - 0.000Ix2) =O
b) x,2 + 2xl - x2-2x3 = 0
x,2 -8xl + 10x3 = 0.0001
x,2j(7x2x3
) - 1 = O
e) 2x, + x2+ x3 - 4Iog(lOx,) = O
x , + 2x2 + x3 - 4 log(lOx2) = O
x, x2x3 - log (lOx3) =O
á) 3x, sen x2-cos(x2x3) sen x2-sen-' (-0.52356) sen x2= O
x,2 - 625x} =O
exp(-x, x2) + 20x3 = 9.471975
SUGERENCIA: Utilice el Mathcad o sofware equivalente.
Elabore un programa para resolver sistemas de ecuaciones no lineales. Utilice para ello el
algoritmo 4.1.
Emplee el programa de problema 4.7 para resolver los sistemas del problema 4.6.
Mediante el PROGRAMA 4.1 del CD (véase ejemplo 4.4), resuelva Jos siguientes sistemas
de ecuaciones no lineales. .
a) (x, +cosx,x2x3 -1)"2 = 0
(1 - x¡ )'/4 + x2 + x3 (0.05x3 - 0.15) = 1
1 + x? + 0.1 x} - 0.01x2- x3 =O
b) 0.5 sen (x , x2) - xi(4n) - 0.5x, =O
0.920423 [exp (2x,) - exp (1)] + 8.65256x2-2exp(x,) =O
Emplee EPS = 10-4.
318 Métodos numéricos aplicados a la ingen iería
4.10 Si en la aplicación del métodos de Newton-Raphson, en algún punto del proceso iterati-
vo, por ejemplo x(i) , el determinante de la matriz jacobiana evaluado en ese punto es ce-
ro, o muy cercano a cero, dicho proceso no puede continuarse. ¿Qué hacer en tales casos?
(véase Probo 2.10).
4.11 Los métodos estudiados en este capítulo son aplicables también a sistemas de ecuaciones
lineales y a ecuaciones no lineales en una variable, ya que estos dos son sólo casos particu-
lares del caso general de sistemas de ecuaciones no lineales. Por ejemplo, si se aplicara el
método de Newton-Raphson para resolver el sistema lineal
4x, - 9x2 + 2x3 5
2x, - 4x2
+ 6x3
3
x, -x2 + 3x3 4
la matriz de derivadas parciales sería:
-9
-4
-1
4.13
Encuentre la solución utilizando el algoritmo 4.2 con un vector inicial adecuado.
Resuelva el problema 3.33 (considerando ahora que la reacción es de orden 0.5 con res-
pecto a A y la constante de velocidad de reacción k, es 0.05 L-0.5mol°.5 mirr '. Emplee el
programa del problema 4.7, o bien el PROGRAMA 4.1 del CD.
Repita el problema 3.34, considerando que la reacción es de orden 0.5 y que la constante
de velocidad de reacción es 0.05 L-o.s molo.s mirr '. ¿La conversión de A mejora recircu-
lando los tres tanques en lugar de recircular solamente el primero?
Utilice el método iterativo de punto fijo para resolver el sistema de ecuaciones no lineales
del ejemplo 4.4, con el vector inicial
~ 4.12
4.14
a) con desplazamientos sucesivos
b) con desplazamientos simultáneos
Compare la convergencia en los dos casos.
SUGERENCIA: Emplee el Mathcad o un software equivalente.
4.15 Resuelva el ejercicio 4.8, usando TVo = 9.9
4.16 Resuelva los sistemas de los problemas 4.6 y 4.9 por el método de Newton-Raphson mo-
dificado.
4.17 Elabore un programa para resolver sistemas de ecuaciones no lineales por el método de
Newton-Rapshon modificado, utilizando para ello el algoritmo 4.3. Resuelva con dicho
programa el sistema
x2
, +2xl+exp(x, +x2)=6.1718-x,x3
lOx2 = -x2 x3
sen (x, x3) + xl = 1.141-x,
utilizando como vector inicial a x(O) = [l,I,I]T.
318 Métodos numéric o s a p licados a la ingeniería
4.10 Si en la aplicación del métodos de Newton- Raphson, en algún punto del proceso iterati-
vo, por ejemplo x (i) , el determinante de la matriz jacobiana evaluado en ese punto es ce-
ro, o muy cercano a cero, dicho proceso no puede continuarse. ¿Qué hacer en tales casos?
(véase Probo 2.10).
4.11 Los métodos estudiados en este capítulo son aplicables también a sistemas de ecuaciones
lineales y a ecuaciones no lineales en una variable, ya que estos dos son sólo casos particu-
lares del caso general de sistemas de ecuaciones no lineales. Por ejemplo, si se aplicara el
método de Newton-Raphson para resolver el sistema lineal
~ 4.12
4.13
4.14
4xI - 9x2 + 2x3
5
2x1 - 4x2 + 6x3 3
XI - x2 + 3x3 4
la matriz de derivadas parciales sería:
-9
-4
-1
Encuentre la solución utilizando el algoritmo 4.2 con un vector inicial adecuado.
Resuelva el problema 3.33 (considerando ahora que la reacción es de orden 0.5 con res-
pecto a A y la constante de velocidad de reacción kl
es 0.05 L-0.5 mol°.5 min-l . Emplee el
programa del problema 4.7, o bien el PROGRAMA 4.1 del CD.
Repita el problema 3.34, considerando que la reacción es de orden 0.5 y que la constante
de velocidad de reacción es 0.05 L-o.s molo.s min-I . ¿La conversión de A mejora recircu-
lando los tres tanques en lugar de recircular solamente el primero?
Utilice el método iterativo de punto fijo para resolver el sistema de ecuaciones no lineales
del ejemplo 4.4, con el vector inicial
a) con desplazamientos sucesivos
b) con desplazamientos simultáneos
Compare la convergencia en los dos casos.
SUGERENCIA: Emplee el Mathcad o un software equivalente.
4.15 Resuelva el ejercicio 4.8, usando TVo =9.9
4.16 Resuelva los sistemas de los problemas 4.6 y 4.9 por el método de Newton-Raphson mo-
dificado.
4.17 Elabore un programa para resolver sistemas de ecuaciones no lineales por el método de
Newton-Rapshon modificado, utilizando para ello el algoritmo 4.3. Resuelva con dicho
programa el sistema
X21 + 2xl + exp (xl + X2 ) =6.1718 -XI X3
lOx2 =- X2 X3
sen (XI X3) + x2
2
=1.14l-xl
utilizando como vector inicial a x (O) = [l,l,l]T.
rati-
ales
mo-
de
cho
Sistema de ecuaciones no lineales 31 9
4.18 La siguiente tabla representa las temperaturas observadas TrC) a diferentes tiempos t
(min) del agua en un tanque de enfriamiento
o 1 2 3 105 7 15 20
T 92.0 85.3 79.5 74.5 67.0 60.5 53.5 45.0 39.5
Encuentre la ecuación de enfriamiento que mejor represente estos valores, empleando el
criterio de mínimos cuadrados. Véase ejercicio 4.6.
4.19 La relación entre el rendimiento de un cultivo y la cantidad de fertilizante x, aplicado a ese
cultivo, se ha formulado así:
y = a - b d-
donde O < d < 1
Dado los siguientes datos
O 2 3 4x
y 44.4 54.6 63.8 65.7 68.9
obtenga estimaciones de a, by d empleando el método de los mínimos cuadrados. (Véase
ejercicio 4.6).
4.20 Resuelva los sistemas de ecuaciones no lineales del problema 4.9 con el método de Broy-
den. Compare el número de iteraciones requerido con el número requerido en los métodos
de punto fijo y de Newton-Raphson multivariable. Emplee en la comparación EPS = I x(i)
- x(i-l) k 10-4.
4.21 Elabore un programa de cómputo para resolver sistemas de ecuaciones no lineales con el
método de Broyden.
Emplee para ello el algoritmo 4.4. Resuelva con dicho programa el sistema
xl
2
+ 2X2
2
+ exp (xl + X2) = 6.1718 -Xl X3
lOx2
= -X
2
X
3
sen (Xl X3) + xl = 1.14l-xl,
utilizando como vector inicial a x(O) = [l,I,I]T
4.22 El método de Broyden pertenece a una familia conocida como métodos de Cuasi-New-
ton. Otro de los miembros de dicha familia se obtiene al reemplazar a J (k) de la ecuación
4.22 con una matriz A(k) , cuyos componentes son las derivadas parciales numéricas; esto
es, consiste en aproximar las derivadas parciales analíticas de la matriz jacobiana J por sus
correspondientes derivadas parciales numéricas. Por ejemplo, para una función de dos varia-
ble f (x, y) las derivadas parciales numéricas quedan así:
df
dx
f (x + h, Y ) - f ( x, y )
h
y
df f (x, y + h ) - f ( x, y )
dy h
donde h es un valor pequeño.
Sistema de ecuaciones no lineales 31 9
4.18 La siguiente tabla representa las temperaturas observadas TeC) a diferentes tiempos t
(min) del agua en un tanque de enfriamiento
o 1 2 3 5 7 10 15 20
T 92.0 85.3 79.5 74.5 67.0 60.5 53.5 45.0 39.5
Encuentre la ecuación de enfriamiento que mejor represente estos valores, empleando el
criterio de mínimos cuadrados. Véase ejercicio 4.6.
4.19 La relación entre el rendimiento de un cultivo y la cantidad de fertilizante x, aplicado a ese
cultivo, se ha formulado así:
y = a - b dX
donde O< d < 1
Dado los siguientes datos
x O 2 3 4
Y 44.4 54.6 63.8 65.7 68.9
obtenga estimaciones de a, by d empleando el método de los mínimos cuadrados. (Véase
ejercicio 4.6).
4.20 Resuelva los sistemas de ecuaciones no lineales del problema 4.9 con el método de Broy-
den. Compare el número de iteraciones requerido con el número requerido en los métodos
de punto fijo y de Newton-Raphson multivariable. Emplee en la comparación EPS = Ix(i)
- x(i- l) k 10-4.
4.21 Elabore un programa de cómputo para resolver sistemas de ecuaciones no lineales con el
método de Broyden.
Emplee para ello el algoritmo 4.4. Resuelva con dicho programa el sistema
xl
2
+ 2X2
2
+ exp (xl + x2 ) = 6.1718 -Xl X3
lOx2 = - x2 x3
sen(xl x3)+xl = 1.141-xl ,
utilizando como vector inicial a x(O) =[l,I,I]T
4.22 El método de Broyden pertenece a una familia conocida como métodos de Cuasi-New-
ton. Otro de los miembros de dicha familia se obtiene al reemplazar a J (k) de la ecuación
4.22 con una matriz A (k) , cuyos componentes son las derivadas parciales numéricas; esto
es, consiste en aproximar las derivadas parciales analíticas de la matriz jacobiana J por sus
correspondientes derivadas parciales numéricas. Por ejemplo, para una función de dos varia-
blef (x, y) las derivadas parciales numéricas quedan así:
df f (x + h, Y ) - f ( x, y )
dX h
y
df f (x, y + h ) - f ( x, y )
dy h
donde h es un valor pequeño.
320 Métodos numéricos apl icados a la ingeniería
Con las ideas dadas, encuentre una solución aproximada del sistema de ecuaciones no li-
neales siguiente usando como vector inicial [.xO, yO ]T = [O, O] T
II (x, y) = x2 -lOx + y2 + 8 = O
12(x, y) = xy2 + X - lOy + 8 = O
4.23 Resuelva los sistemas de ecuaciones no lineales de los problemas 4.6 y 4.9, mediante el
método de Newton-Raphson con optimización de t.
I~I SUGERENCIA: Emplee el PROGRAMA 4.2 del CD.
4.24 Otra forma de seleccionar los valores del tamaño de la etapa t (véase Seco 4.6), consiste en
dividir el intervalo de búsqueda [a, b] en dos partes iguales sucesivamente. Esto es:
~ 4.25
ti = (a + b)/2,
t2 = (a + tl)/2,
t4 = (t2 + tl)/2,
t3 = (ti + b)/2
ts = (t3 + ti )/2, etcétera
FiglJ
Si:
eva
Gráficamente:
a
t2 ti t3
[----I~--~I __ -LI__ -'1 __ -LI---]
t4 ts b
Para cada valor de t se calcula el correspondiente Zk+i' Y el valor mínimo de Zk+1 propor-
cionará el valor óptimo de t. Encuentre el valor óptimo de t en la primer iteración de la
solución del ejemplo 4.3 usando este método de cálculo de t y el intervalo [-1.2, - 1] .
Modifique el PROGRAMA 4.2 del CD de modo que se empleen los valores de t calculados
en la forma indicada en el problema 4.24.
Resuelva los siguientes sistemas de ecuaciones algebraicas no lineales, proponiendo en ca-
da caso vectores iniciales. Emplee en cada caso los métodos que juzgue más convenientes
y el software de que disponga.
a) y sen x + cos x - z = O
exp(x + y) - x2
cos x -n/l.15 = O
y + 3xz + x3
= O
b) ln(x y) + x2 y2 = 8
sen x + y exp(x) = 2
c) xl
3
+ x2
3
-xl = 129
Xl
2
+ xl- x3
2
= 9.75
Xl + x2
-x3
= 9.49
4.27 Se desea concentrar una solución con una concentración inicial de sólidos de 20% a una
concentración final de 60% en un evaporador de doble efecto. Se dispone de vapor satu-
rado a 0.68 atm (10 psig) y el segundo efecto que opera con una presión de vacío de 0.136
atm (2 psia). (Ver figura 4.17.)
Si la alimentación al sistema, 18,240.6 kg./h, entra al primer efecto a 93.3 °C, determine
el área de los evaporadores, Al y A2
, Yla cantidad de vapor requerido.
4.26
320 Métodos n u méricos aplicados a la ingeniería
Con las ideas dadas, encuentre una solución aproximada del sistema de ecuaciones no li-
neales siguiente usando como vector inicial [ xO, yO F = [O, O] T
J I (x, y) = X2 -lOx + y2 + 8 = O
J2 (x, y) = .xy2 + X - lOy + 8 = O
4.23 Resuelva los sistemas de ecuaciones no lineales de los problemas 4.6 y 4.9, mediante el
método de Newton-Raphson con optimización de t.
I~ I SUGERENCIA: Emplee el PROGRAMA 4.2 del CD.
4.24 Otra forma de seleccionar los valores del tamaño de la etapa t (véase Seco 4.6), consiste en
dividir el intervalo de búsqueda [a, b] en dos partes iguales sucesivamente. Esto es:
~ 4.25
4.26
Gráficamente:
ti = (a + b)/2,
t2 = (a + tl )/2,
t4 =(t2 + tl )/2,
t3 = (ti + b)/2
ts = (t3 + t i)/2, etcétera
t2 t[ t3
[--~I---'I--~I---'I --~I--_]
a t4 t5 b
Para cada valor de t se calcula el correspondiente zk+i' Yel valor mínimo de Zk+ 1 propor-
cionará el valor óptimo de t. Encuentre el valor óptimo de t en la primer iteración de la
solución del ejemplo 4.3 usando este método de cálculo de t y el intervalo [- 1.2, - 1] .
Modifique el PROGRAMA 4.2 del CD de modo que se empleen los valores de t calculados
en la forma indicada en el problema 4.24.
Resuelva los siguientes sistemas de ecuaciones algebraicas no lineales, proponiendo en ca-
da caso vectores iniciales. Emplee en cada caso los métodos que juzgue más convenientes
y el software de que disponga.
a) y sen x + cos x - z = O
exp(x + y) - x2 cos x -n/1.l5 =O
y + 3xz + x3
=O
b) ln(x y) + x2 y2 =8
sen x + y exp(x) = 2
c) x l
3 + x2
3 -xl = 129
x l
2
+ xl - x3
2
= 9.75
XI + x2 - x3 = 9.49
4.27 Se desea concentrar una solución con una concentración inicial de sólidos de 20% a una
concentración final de 60% en un evaporador de doble efecto. Se dispone de vapor satu-
rado a 0.68 atm (10 psig) y el segundo efecto que opera con una presión de vaCÍo de 0.136
atm (2 psia). (Ver figura 4.17.)
Si la alimentación al sistema, 18,240.6 kg./h, entra al primer efecto a 93.3 oC, determine
el área de los evaporadores, A l y A2, Yla cantidad de vapor requerido.
Sistema de ecuaciones no lineales 321
Figura 4.17
Sistema de
evaporación
de doble
efecto.
Otros datos:
Cp
, F = 0.9 kcal/(kg 0c)
Cp, Ll = 0.8 "
Cp,L2 = 0.8
4.28 El método del eigenvalor (valor propio) dominante" para resolver sistemas de ecuaciones
no lineales, consiste en emplear el siguiente algoritmo
1
x(k+2) = X(k) + __ [X(k+l) _ x(k)]
1 - "'-1
donde "'-1 es el eigenvalor dominante de la matriz jacobiana J (véase ecuación 4.17), eva-
luada en x(k+l) y aproximado de la siguiente manera:
I X(k+I) - X(k) I
"'-------1- I X(k) _ x(k+l) I
(f (Xk+l _ xk?)1/2
i::::l I 1
"'-1=-------------
(f (Xk _ Xk-1)2)1/2
i=l 1 1
o bien:
• E. Kehat and M. Shacham. Chemical Processes Simulation Programs-3: Solution of systemas of Non-Linear
Equations. Process Technology lnternational, Vol. 18, pág. 181 (1973).
UI = 3,516.5 kcal/thm")
U2
= 2,440.4 "
Figura 4.17
Sistema de
evaporación
de doble
efecto.
Otros datos:
Sistema de ecuaciones no lineales 321
Cp
, F =0.9 kcal/(kg oC) UI = 3,516.5 kcall(hm2
)
Cp, Ll =0.8 fI U2
= 2,440.4 fI
Cp, L2 = 0.8 fI
4.28 El método del eigenvalor (valor propio) dominante' para resolver sistemas de ecuaciones
no lineales, consiste en emplear el siguiente algoritmo
1x(k+2) =X(k) + __ [ X(k+I) _ x(k)]
1 - "'-¡
donde "'-1es el eigenvalor dominante de la matriz jacobiana J (véase ecuación 4.17), eva-
luada en X(k+ I ) y aproximado de la siguiente manera:
o bien:
I X(k+ I) - X(k) I
"'- - - - - - -
I - I X(k) _ x(k+l) I
(i (Xk+1 _ Xk)2)112
;=1 I 1
"'-1 =-------------
(i (Xk _ XH p)I/2
;=1 1 1
* E. Kehat and M. Shacham. Chemical Processes Simulation Programs-3: Solution of systemas of Non-Linear
Equations. Process Technology Inlernalional, Vol. 18, pág. 181 (1973).
322 Métodos numéricos aplicados a la ingeniería
(
Hay que observar que para la primera aplicación de este algoritmo se requieren tres vec-
tores iniciales x(O) , x(l) y x(2), los cuales pueden obtenerse, por ejemplo, con el método de
punto fijo multivariable.
Mediante este algoritmo resuelva el sistema:
t. (x, y) = x2 -lOx + y2 + 8 = O
f2
(x, y) = xy2 + X - lOy + 8 = O
usando como vector inicial: [xD, yO] = [O,O]T y los resultados de las dos primeras iteracio-
nes del ejemplo 4.1.
4.29 La convergencia del método del eigenvalor dominante (véase Probo 4.28), puede acelerar-
se usando un factor t de la siguiente manera:
X(k + 2) = X(k) + _t_ [x(k + 1) _ X(k) ],
1- Al
y ensayando varios valores de t como se hizo en los métodos de Newton-Raphson con op-
timización de t y del descenso de máxima pendiente. El valor de t puede calcularse tam-
bién en cada iterción con una fórmula dada por Broyden," o sea usa un valor constante.
Obtenga una aproximación a una solución del sistema dado en el problema 4.28 utilizan-
do un valor de t = 0.7
4.30 Resuelva los sistema de ecuaciones no lineales de los problemas 4.6 y 4.9, empleando el
método del descenso de máxima pendiente para obtener los valores iniciales; luego, con
esos valores aplique el método de Newton-Ranphson o el método de Broyden.
4.31 Hay que observar que en el método del descenso de máxima pendiente se encuentra el mí-
nimo local de la función Zk = f¡ 2 + f2
2 + ... + t;2. Este método puede emplearse para apro-
ximar el mínimo local de una función dada analíticamente, tomando dicha función como
z. Modifique el algoritmo 4.5 para aproximar los mínimos de las funciones siguientes,
usando EPS = 10-5.
111
a) z(x, y) = sen (x + y) + sen x - cos y
b) Z(x¡,x2,x3)=X12+xl-3xl
c) z(xp x2, x3) = x/ + 2x2
4+ 3x3
3-1
SUGERENCIA: Grafique la superficie el inciso a) usando el Mathcad o el Graphics Calculus (GC).
4.32 Encuentre todos los factores cuadráticos de las ecuaciones polinominales siguientes:
a) x8 + 13x6 + 35x4 - 13x2 - 36 = O
b) x6 + (n;2 + 5)x4 + (5n;2 + 6)x2 + 6n;2 = O
4.33 ¿Qué pasa cuando se aplica el método de Bairstow a un polinomio que no tiene factores
cuadráticos? Puede usar, por ejemplo, el polinomio
-2.8x5 -1l.352x4 + 86.468x3 + 438.252x2 + 32.418x - 1309.484 .
• c.G. Broyden. A Class of Methods for Solving Nonlinear Simultaneous Equiatiosns. Math Comp. 19 pág. 577
(1965).
322 Métodos numéricos aplicados a la ingeniería
Hay que observar que para la primera aplicación de este algoritmo se requieren tres vec-
tores iniciales x(O) , x(l) y X(2), los cuales pueden obtenerse, por ejemplo, con el método de
punto fijo multivariable.
Mediante este algoritmo resuelva el sistema:
f¡ (x, y) = x2 -lOx + y2 + 8 =O
f2 (x, y) =xy2 + X - lOy + 8 = O
usando como vector inicial: [xD, yO] = [O,O]T y los resultados de las dos primeras iteracio-
nes del ejemplo 4.1.
4.29 La convergencia del método del eigenvalor dominante (véase Probo 4.28), puede acelerar-
se usando un factor t de la siguiente manera:
X (k + 2) =X(k) + _t_ [x(k + 1) _ X(k) ],
1 - "'1
y ensayando varios valores de t como se hizo en los métodos de Newton-Raphson con op-
timización de t y del descenso de máxima pendiente. El valor de t puede calcularse tam-
bién en cada iterción con una fórmula dada por Broyden,* o sea usa un valor constante.
Obtenga una aproximación a una solución del sistema dado en el problema 4.28 utilizan-
do un valor de t =0.7
4.30 Resuelva los sistema de ecuaciones no lineales de los problemas 4.6 y 4.9, empleando el
método del descenso de máxima pendiente para obtener los valores iniciales; luego, con
esos valores aplique el método de Newton-Ranphson o el método de Broyden.
4.31 Hay que observar que en el método del descenso de máxima pendiente se encuentra el mí-
nimo local de la función Zk =f¡2 + f 2
2 + ... + fn2. Este método puede emplearse para apro-
ximar el llÚnimo local de una función dada analíticamente, tomando dicha función como
z. Modifique el algoritmo 4.5 para aproximar los llÚnimos de las funciones siguientes,
usando EPS = 10-5.
a) z(x, y) =sen (x + y) + sen x - cas y
b) z(xl' x2, x3) = x¡2 + xl-3x3
2
c) z(xl' x2, x3) =x¡2 + 2x2
4 + 3xl-l
SUGERENCIA: Grafique la superficie el inciso a) usando el Mathcad o el Graphics Calculus (GC).
4.32 Encuentre todos los factores cuadráticos de las ecuaciones polinominales siguientes:
a) x8 + 13x6 + 350 - 13x2 - 36 =O
b) x6 + (n;2 + 5)0 + (5n;2 + 6)x2 + 6n;2 = O
4.33 ¿Qué pasa cuando se aplica el método de Bairstow a un polinomio que no tiene factores
cuadráticos? Puede usar, por ejemplo, el polinomio
-2.8x5 -11.3520 + 86.468x3 + 438.252x2 + 32.418x - 1309.484.
• C.G. Broyden. A Class ofMethods for Solving Nonlinear Simultaneous Equiatiosns. Math Comp. 19 pág. 577
(1965).
CAPÍTULO 5
APROXIMACIÓN FUNCIONAL E
INTERPOLACIÓN
A dónde nos dirigimos
En este capítulo se estudiará la aproximación de funciones disponibles en forma discre-
ta (puntos tabulados), con funciones analíticas sencillas, o bien de aproximación de fun-
ciones cuya complicada naturaleza exija su reemplazo por funciones más simples. Para
lograr esto partiremos de tablas de valores dados y, utilizando la familia de los polino-
mios, aproximaremos una sección de la tabla por una línea recta, una parábola, etc. La
elección del grado se hará analizando el fenómeno que originó los valores y, el tipo de
aproximación, con base en la exactitud de éstos.
En la parte final del capítulo se estudia la aproximación utilizando el criterio de los
mínimos cuadrados y se incluyen aproximaciones multilineales.
Las ideas y técnicas de interpolación-extrapolación permean el desarrollo de los
métodos de los capítulos siguientes como integración, derivación, solución de ecuacio-
nes diferenciales ordinarias y parciales e incluso se emplearon ya en la obtención de
métodos para resolver ecuaciones no lineales.
Introducción
La enorme ventaja de aproximar información discreta o funciones "complejas", con fun-
ciones analíticas sencillas, radica en su mayor facilidad de evaluación y manipulación, si-
tuación necesaria en el campo de la ingeniería.
Las funciones de aproximación se obtienen por combinaciones lineales de elementos
de familias de funciones denominadas elementales. En general tendrán la forma
a080 (x) + a[g[ (x) + ... + a"g" (x),
donde aj
, O< i < n, son constantes por determinar y g¡(x), O.,:;i":; n funciones de una fami-
lia particular. Los monomios en x (xo, x, x2,... ) constituyen la familia o grupo más emplea-
do; sus combinaciones generan aproximaciones del tipo polimonial
El grupo conocido como funciones de Fourier
1, sen x, cos x, sen 2x, cos 2x, ... ,
al combinarse linealmente, genera aproximaciones del tipo:
Il 11
ao + .L a¡ cos ix + .L bi sen ix
1;[ 1;[
El grupo de las funciones exponenciales
1, e', e2x
, ...
(5.1)
(5.2)
(5.3)
CAPÍTULO 5
APROXIMACIÓN FUNCIONAL E
INTERPOLACIÓN
A dónde nos dirigimos
En este capítulo se estudiará la aproximación de funciones disponibles en forma discre-
ta (puntos tabulados), con funciones analíticas sencillas, o bien de aproximación de flm-
ciones cuya complicada naturaleza exija su reemplazo por funciones más simples. Para
lograr esto partiremos de tablas de valores dados y, utilizando la familia de los polino-
mios, aproximaremos una sección de la tabla por una línea recta, una parábola, etc. La
elección del grado se hará analizando el fenómeno que Oliginó los valores y, el tipo de
aproximación, con base en la exactitud de éstos.
En la parte final del capítulo se estudia la aproximación utilizando el criterio de los
núnimos cuadrados y se incluyen aproximaciones multilineales.
Las ideas y técnicas de interpolación-extrapolación permean el desarrollo de los
métodos de los capítulos siguientes como integración, derivación, solución de ecuacio-
nes diferenciales ordinarias y parciales e incluso se emplearon ya en la obtención de
métodos para resolver ecuaciones no lineales.
Introducción
La enorme ventaja de aproximar información discreta o funciones "complejas", con fun-
ciones analíticas sencillas, radica en su mayor facilidad de evaluación y manipulación, si-
tuación necesaria en el campo de la ingeniería.
Las funciones de aproximación se obtienen por combinaciones lineales de elementos
de familias de funciones denominadas elementales. En general tendrán la forma
(5.1)
donde a¡, O< i < n, son constantes por determinar y g/x), O.,:; i":; n funciones de una fami-
lia particular. Los monomios en x (xo, x, x2, ... ) constituyen la familia o grupo más emplea-
do; sus combinaciones generan aproximaciones del tipo polimonial
(5.2)
El grupo conocido como funciones de Fourier
1, sen x, cos x, sen 2x, cos 2x, ... ,
al combinarse linealmente, genera aproximaciones del tipo:
Il 11
ao + .L a¡ cos ix + .L b¡ sen ix
I;! 1;
(5.3)
El grupo de las funciones exponenciales
1, eX, e2x, . . .
324 Métodos numéricos aplicados a la ingeniería
también puede usarse del modo siguiente
n
L ae"
i=ü
(5.4)
De estos tres tipos de aproximaciones funcionales, las más comunes por su facilidad de
manejo en evaluaciones, integraciones, derivaciones, etc., son las aproximaciones polino-
miales (5.2) y son las que se estudiarán a continuación.
Sea una función f (x) dada en forma tabular
Puntos o 1 2 n 5
x
f (x,,)f(x)
Para aproximar af(x) por medio de un polinomio del tipo 5.2, se aplica alguno de los cri-
terios siguientes: el de ajuste exacto o el de mínimos cuadrados.
La técnica del ajuste exacto consiste en encontrar una función polinomial que pase
por los puntos dados en la tabla (véase Fig. 5.1). El método de mínimos cuadrados con-
siste en hallar un polinomio que pase entre los puntos y que satisfaga la condición de mi-
nimizar la suma de las desviaciones (d) elevadas al cuadrado; es decir, que se cumpla
n
L (d.)2 = mínimo
i=ü 1
Cuando la información tabular de que se dispone es aproximada hasta cierto número de
cifras significativas, por ejemplo la de tablas de logaritmos o de funciones de Bessel, se
recomienda usar ajuste exacto. En cambio, si la información tiene errores considerables,
como en el caso de datos experimentales, no tiene sentido encontrar un polinomio que pa-
se por esos puntos sino más bien que pase entre ellos; entonces, el método de mínimos
cuadrados es aplicable.
y
,
,
,
f(X3)
,
= d3--------------~---
f(X2)
/-d2
----------/? -
I
I
I
Figura 5.1 f(xl) ------ .zz d, I
Aproximación I
polinomial con
r I
,
I,
criterio de
,
Ir
ajuste exacto
,
I
(curva I
discontinua) y "-do
I
f(xo) - -9- I
con mínimos I
cuadrados
I
(curva llena). Xo XI X2 x3 X
Tabla 5.1 Temperatura de ebullición de la acetona a diferentes
presiones.
Puntos O 2 3 4 5 6
T (0C) 56.5 78.6 113.0 144.5 181.0 205.0 214.5
P (atm) 1 2 5 10 20 30 40
e
e
Tabla 5.2 Temperatura de ebullición de la
acetona a diferentes presiones.
Puntos O 2 3
TCC) 56.5 113.0 18l.0 214.5
P (atm) 5 20 40
Aproximación funcional e interpolación 325
Una vez que se obtiene el polinomio de aproximación, éste puede usarse para obtener
puntos adicionales a los existentes en la tabla, mediante su evaluación, lo que se conoce
como interpolación. También puede derivarse o integrase a fin de obtener información adi-
cional de la función tabular.
A continuación se describen distintas formas de aproximar con polinomios obtenidos
por ajuste exacto y su uso en la interpolación. En la sección 5.8 se describe la aproxima-
ción polinomial por mínimos cuadrados, y en el capítulo 6 la derivación y la integración.
5.1 Aproximación polinominal simple e interpolación
La interpolación es de gran importancia en el campo de la ingeniería, ya que al consultar
fuentes de información presentadas en forma tabular, es frecuente no encontrar el valor
buscado como un punto en la tabla. Por ejemplo, las tablas 5.1 y 5.2 presentan la tempe-
ratura de ebullición de la acetona (C3H60) a diferentes presiones.
Supóngase que sólo se dispusiera de la segunda y se desease calcular la temperatura de
ebullición de la acetona a 2 atm de presión.
Una forma muy común de resolver este problema es sustituir los puntos (O) y (1) en
la ecuación de la línea recta: p (x) = ao + a jX, de tal modo que resultan dos ecuaciones con
dos incógnitas que son ao Yaj• Con la solución del sistema se consigue una aproximación
polinominal de primer grado, lo que permite efectuar interpolaciones lineales; es decir, se
sustituye el punto (O) en la ecuación de la línea recta y se obtiene: .
56.5 = ao+ 1 al
y al sustituir el punto (1)
113 = ao + 5 a"
sistema que al resolverse da ao = 42.375 Yal = 14.125
Por tanto, estos valores generan la ecuación:
p (x) = 42.375 + 14.125 x (5.5)
326 Métodos numéricos apli cados a la ingeniería
La ecuación resultante puede emplearse para aproximar la temperatura cuando la pre-
sión es conocida. Al sustituir la presión x = 2 atm se obtiene una temperatura de 70.6 "C.
A este proceso se le conoce como interpolación.
Gráficamente la tabla 5.2 puede verse como una serie de puntos (O), (1), (2) Y (3) en
un plano P vs T (Fig. 5.2), en donde si se unen con una línea los puntos (O) y (1), por bús-
queda gráfica se obtiene T '" 70.6 °C, para P = 2 atm.
En realidad, esta interpolación sólo ha consistido en aproximar una función analítica
desconocida [T =f (P)] dada en forma tabular, por medio de una línea recta que pasa por
los puntos (O) y (1).
Para aproximar el valor de la temperatura correspondiente a P = 2 atm se pudieron tomar
otros dos puntos distintos, por ejemplo (2) y (3), pero es de suponer que el resultado tendría
un margen de error mayor, ya que el valor que se busca está entre los puntos (O)y (1).
Si se quisiera una aproximación mejor al valor "verdadero" de la temperatura busca-
da, podrían unirse más puntos de la tabla con una curva suave (sin picos), por ejemplo tres
(O), (1), (2) (véase Fig. 5.3) y gráficamente obtener T correspondiente a P = 2 atm.
Analíticamente, el problema se resuelve al aproximar la función desconocida [T =
f(P)] con un polinomio que pase por los tres puntos (O), (1) y (2). Este polinomio es una
parábola y tiene la forma general
P2(x) = ao + a¡x + a~2, (5.6)
donde los parámetros ao, a¡ y a2 se determinan sustituyendo cada uno de los tres puntos
conocidos en la ecuación 5.6; es decir:
56.5 =ao + a¡l + a212
113 = ao + a¡5- + a252
181 = ao + a¡20 + a2202
Al resolver el sistema se obtiene:
ao = 39.85, al = 17.15, a2
= -0.50482
100
2
TOC
113 ------------------------------------ p¡
110
90
80
70.6
70 •••
Figura 5.2
Interpolación
gráfica de la 60
temperatura de 56.5
ebullición de la
acetona a 2 50 L- __ ---'- --'- L- __ --'- -'--_-j~
atm. O
I Po
I
2 3 4 5
(5.7)
6
326
Figura 5 .2
Interpolación
gráfica de la
temperatura de
ebullición de la
acetona a 2
atm.
Métodos numéricos aplicados a la ingeniería
La ecuación resultante puede emplearse para aproximar la temperatura cuando la pre-
sión es conocida. Al sustituir la presión x = 2 atm se obtiene una temperatura de 70.6 oC.
A este proceso se le conoce como interpolación.
Gráficamente la tabla 5.2 puede verse como una serie de puntos (O), (1), (2) Y(3) en
un plano P vs T (Fig. 5.2), en donde si se unen con una línea los puntos (O) y (1), por bús-
queda gráfica se obtiene T '" 70.6 oC, para P =2 atm.
En realidad, esta interpolación sólo ha consistido en aproximar una función analítica
desconocida [T = f (P)] dada en forma tabular, por medio de una línea recta que pasa por
los puntos (O) y (1).
Para aproximar el valor de la temperatura cOlTespondiente a P =2 atrn se pudieron tomar
otros dos puntos distintos, por ejemplo (2) y (3), pero es de suponer que el resultado tendría
un margen de eiTor mayor, ya que el valor que se busca está entre los puntos (O) y (1).
Si se quisiera una aproximación mejor al valor "verdadero" de la temperatura busca-
da, podrían unirse más puntos de la tabla con una curva suave (sin picos), por ejemplo tres
(O), (1), (2) (véase Fig. 5.3) y gráficamente obtener T correspondiente a P = 2 atm.
Analíticamente, el problema se resuelve al aproximar la función desconocida [T =
f(P)] con un polinomio que pase por los tres puntos (O), (1) y (2). Este polinomio es una
parábola y tiene la forma general
P2(x) = ao + aJx + a~2, (5.6)
donde los parámetros ao, a J y a2 se determinan sustituyendo cada uno de los tres puntos
conocidos en la ecuación 5.6; es decir:
Al resolver el sistema se obtiene:
ao=39.85,
T oe
56.5 = ao + a J1 + a212
113 = ao + a15-+ a252
181 =ao + a J20 + a2202
al = 17.15, a2 = -0.50482
113 --- - - --- ---------- --- ------- -- - -- -- - PI
110
100
90
80
70.6
70 ...
60
56.5
I Po
2
50
O 2 3 4 5 6
(5.7)
Aproximación funcional e interpolación 327
200
TOC
181
180
160
J40
120
113
100
80
72.1
••
60
56.5
Figura 5.3
Interpolación 40
2
gráfica con tres O O
puntos.
pre-
0c.
3) en
bús-
10 15 20
(5.7) De tal modo que la ecuación polinomial queda:
P2 (x) = 39.85 + 17.15x - 0.50482x2
25
P atm
(5.8)
y puede emplearse para aproximar algún valor de la temperatura correspondiente a un va-
lor de presión. Por ejemplo si x = 2 atm, entonces:
T '" P2 (2) = 39.85 + 17.15 (2) - 0.50482(2)2 '" 72.1 °C
La aproximación a la temperatura "correcta" es obviamente mejor en este caso. Obsérve-
se que ahora se ha aproximado la función desconocida [T =f (P)] con un polinomio de se-
gundo grado (parábola) que pasa por los tres puntos más cercanos al valor buscado. En
general, si se desea aproximar una función con un polinomio de grado n, se necesitan n +
1 puntos, que sustituidos en la ecuación polinomial de grado n:
(5.9)
generan un sistema de n + 1 ecuaciones lineales en las incógnitas ai
, i = O, 1,2 ... , n.
Una vez resuelto el sistema se sustituyen los valores de a¡ en la ecuación (5.9), con lo
cual se obtiene el polinomio de aproximación. A este método se le conoce como aproxi-
mación polinomial simple.
Por otro lado, como se dijo al principio de este capítulo, puede tenerse una función
conocida pero muy complicada, por ejemplo:
f (x) = (2/x) 1/2 sen x
(5.10)
(5.11)
la cual conviene, para propósitos prácticos, aproximar con otra función más sencilla, co-
mo un polinomio. El procedimiento es generar una tabla de valores mediante la función
original y a partir de dicha tabla aplicar el método descrito arriba.
328 Métodos numéricos apl:cados a la ingeniería
ALGORITMO 5.1 Aproximación polinominal simple
Para obtener los (n + 1) coeficientes del polinomio de grado n (n > O) que pasa por (n + 1) puntos, proporcionar los
DATOS: El grado del polinomio N y las N + 1 parejas de valores (X(I), FX (1), 1=0,1, ... , N).
RESULTADOS: Los coeficientes A(O), A(l), ... , A(N) del polinornio de aproximación.
PASO l. Hacer I =O.
PASO 2. Mientras I:S; N, repetir los pasos 3 a 9.
PASO 3. Lacer B(I, O) = l.
PASO 4. Hacer J = l.
PASO 5. Mientras J :s;N, repetir los pasos 6 y 7.
PASO 6. Hacer B(I, J) = B(I,J-l) * X(I).
PASO 7. Hacer J = J+1.
PASO 8. Hacer B(I,N+l) = FX(I).
PASO 9. Hacer I = 1 + 1.
PASO 10. Resolver el sistema de ecuaciones lineales B a = fx de orden N + 1 con alguno de los algoritmo s del capítulo 3.
PASO 11. IMPRIMIR A(O), A(l), ... , A(N) YTERMINAR.
5.2 Polinomios de Lagrange
El método de aproximación polinomial dado en la sección anterior, requiere la solución de
un sistema de ecuaciones algebraicas lineales que, cuando el grado del polinomio es alto,
puede presentar inconvenientes. Existen otros métodos de aproximación polinomial en que
no se requiere resolver un sistema de ecuaciones lineales y los cálculos se realizan direc-
tamente; entre éstos se encuentra el de aproximación polinomial de Lagrange.
Se parte nuevamente de una función desconocidaf(x) dada en forma tabular y se asu-
me que un polinomio de primer grado (ecuación de una línea recta) puede escribirse:
(5.12)
donde xl y Xo son los argumentos de los puntos conocidos [xo,f(xo)]' [XI,f(XI)], y ao y al
son dos coeficientes por determinar. Para encontrar el valor de ao' se hace x = X
o en la
ecuación 5.12, que al despejar da:
p (xo) f(xo)
ao=--=---
Xo -Xl Xo-Xl
(5.13)
y para hallar el valor de al' se sustituye el valor de X con el de xi' con lo que resulta:
P (Xl) f(XI)
al =---=---
Xl-XO Xl-XO
(5.14)
de tal modo que al sustituir las ecuaciones 5.13 Y 5.14 en la 5.12 queda:
(5.15)
o en forma más compacta:
p (x) = Lo (x)f(xo) + L¡ (x)f(xl) (5.16)
328 Métodos numéricos apl:cados a la ingeniería
ALGORITMO 5.1 Aproximación polinominal simple
Para obtener los (n + 1) coeficientes del polinorrtio de grado n (n > O) que pasa por (n + 1) puntos, proporcionar los
DATOS: El grado del polinorrtio N y las N + I parejas de valores (X(I), FX (1), 1=0,1,... , N).
RESULTADOS: Los coeficientes A(O), A(I),... , A(N) del polinorrtio de aproximación.
PASO l. Hacer I = O.
PASO 2. Mientras I:S; N, repetir los pasos 3 a 9.
PASO 3. Lacer B(I, O) = l .
PASO 4. Hacer J = l.
PASO 5. Mientras J :s; N, repetir los pasos 6 y 7.
PASO 6. Hacer B(I, J) = B(I,J-l) * X(I).
PASO 7. Hacer J = J+1.
PASO 8. Hacer B(I,N+l) = FX(I).
PASO 9. Hacer I = 1 + 1.
PASO 10. Resolver el sistema de ecuaciones lineales B a = fx de orden N + 1 con alguno de los algoritmos del capítulo 3.
PASO 11. IMPRIMIR A(O), A(l), ... , A(N) YTERMINAR.
5.2 Polinomios de Lagrange
El método de aproximación polinomial dado en la sección anterior, requiere la solución de
un sistema de ecuaciones algebraicas lineales que, cuando el grado del polinomio es alto,
puede presentar inconvenientes. Existen otros métodos de aproximación polinomial en que
no se requiere resolver un sistema de ecuaciones lineales y los cálculos se realizan direc-
tamente; entre éstos se encuentra el de aproximación polinomial de Lagrange.
Se parte nuevamente de una función desconocidaf(x) dada en forma tabular y se asu-
me que un polinomio de primer grado (ecuación de una línea recta) puede escribirse:
(5.12)
donde x, y Xo son los argumentos de los puntos conocidos [xo,f(xo)]' [XI,f(XI)], y ao y al
son dos coeficientes por determinar. Para encontrar el valor de ao' se hace x = X
o en la
ecuación 5.12, que al despejar da:
p (xo) f(xo)
ao= - - = - - - (5.13)
Xo -Xl Xo -Xl
y para hallar el valor de al' se sustituye el valor de X con el de xi' con lo que resulta:
P (Xl) f(x l)
al = - - - = - - - (5.14)
x ,-xo xl-xO
de tal modo que al sustituir las ecuaciones 5.13 Y5.14 en la 5.12 queda:
(5.15)
o en forma más compacta:
p (x) = Lo (x)f(xo) + L¡ (x)f(xl) (5.16)
3.
de
lto,
que
ec-
asu-
.12)
yal
n la
.13)
.14)
.15)
.16)
Aproximación funcional e interpolación 329
donde:
x-x
Lo (x) = __ 1
xO-x¡
x-x
L¡ (x) = __ o
XI -xO
(5.17)y
De igual manera, un polinomio de segundo grado (ecuación de una parábola) puede escri-
birse:
(5.18)
donde xo' x¡ y x2 son los argumentos correspondientes a los tres puntos conocidos [x(» f
(xo)] , [xl,f(x¡)], [x2,f(x2)]; los valores de ao' al Y a2 se encuentran sustituyendo x = xo'
x = x¡ y x = x2' respectivamente, en la ecuación 5.18 para obtener:
y
(5.19)
cuyo reemplazo en dicha ecuación genera el siguiente polinomio
(5.20)
donde:
Lo (x) = (x - xl) (x - x2) ,
(xo - xl) (xo - x2)
(5.21)
Por inducción el lector puede obtener polinomios de tercer, cuarto o n-ésimo grado; este
último queda como se indica a continuación
donde:
LI (x) = (x - xo) (x - x2) (x - xll)
(XI - xo) (xl - x2) (xI - x,,)
que en forma más compacta y útil para programarse en un lenguaje de computadora que-
daría:
11
PII
(x) = L L¡ (x)f(x)
i=O
(5.22)
Aproximación funcional e interpolación 329
donde:
x-x
Lo (x) = _ _1
Xo-XI
y (5.17)
De igual manera, un polinomio de segundo grado (ecuación de una parábola) puede escri-
birse:
(5.18)
donde xo, XI y x2 son los argumentos correspondientes a los tres puntos conocidos [xO' f
(xo)] , [x¡,f(x ¡)], [x2,f(x2)]; los valores de ao, a¡ y a2 se encuentran sustituyendo X = xo'
x = X I YX = x2' respectivamente, en la ecuación 5.18 para obtener:
y
(5.19)
cuyo reemplazo en dicha ecuación genera el siguiente polinomio
(5.20)
donde:
(5.21)
Por inducción el lector puede obtener polinomios de tercer, cuarto o n-ésimo grado; este
último queda como se indica a continuación
donde:
que en forma más compacta y útil para programarse en un lenguaje de computadora que-
daría:
1/
P" (x) = I, L¡ (x) f (x)
;=0
(5.22)
330 Métodos numéri cos aplicados a la ingeniería
donde':
11 (x - x)
L¡ (x) = Il -------'--
j=ü (x¡ - x)
j#
(5.23)
Al combinarse linealmente con f (x¡), los polinomios L¡ (x), denominados polinomios de
Lagrange, generan la aproximación polinomial de Lagrange a la información dada en for-
ma tabular.
Ejemplo 5.1 Para la tabla que se presenta a continuación
a) Obtenga la aproximación polinomial de Lagrange con todos los puntos
b) Interpole el valor de la funciónf(x) para x = 1.8
/
o 2 3
f(x) -3 o 5 7
o 1 3 6
Solución a) Obsérvese que hay cuatro puntos en la tabla, por lo que el polinomio será de ter-
cer grado. Al sustituir los cuatro puntos en las ecuaciones generales 5.22 y 5.23 se
obtiene:
P (x) - (x - 1) (x - 3) (x _ 6) -3 +
3 - (0-1)(0-3)(0-6)
I O
(X - O) (x - 3) (x - 6) -------
(1 - O)(1 - 3) (1 - 6)
5
+ (x - O) (x - 1) (x - 6) (3 _ O) (3 _ 1) (3 _ 6)
. 7
+ (x - O) (x - 1) (x - 3) (6 _ O) (6 _ 1) (6 _ 3)
al efectuar las operaciones queda:
P3(x) = (x3 - lOx2 + 27x - 18) (l/6) + (x3 -7x2 + 6x) (-5/18) + (x3 - 4x2
+ 3x) (7/90)
y finalmente resulta:
b) El valor de x = 1.8 se sustituye en la aproximación polinomial de Lagrange de ter-
cer grado obtenida arriba y se tienef(1.8) '" 2.
Los cálculos pueden hacerse con Matlab o con la TI-92 Plus 1.
• rr (x - x¡) = (x - xI) (x - xZ) ... (x - XII).
1=1
330 Métodos n u méricos aplicado s a la in gen iería
donde*:
11 (x-x)
L¡ (x) = n --"--
j=ü (x¡ - x)
j#
(5.23)
Al combinarse linealmente con f (x¡), los polinomios L¡ (x), denominados polinomios de
Lagrange, generan la aproximación polinomial de Lagrange a la información dada en for-
ma tabular.
Ejemplo 5.1 Para la tabla que se presenta a continuación
Solución
a) Obtenga la aproximación polinomial de Lagrange con todos los puntos
b) Interpole el valor de la funciónf(x) para x = 1.8
o 2 3
f(x) -3 o 5 7
o 1 3 6
a) Obsérvese que hay cuatro puntos en la tabla, por lo que el polinomio será de ter-
cer grado. Al sustituir los cuatro puntos en las ecuaciones generales 5.22 y 5.23 se
obtiene:
-3
P3 (x) =(x - 1) (x - 3) (x - 6) (O _ 1) (O _ 3) (O _ 6) +
I O
(x - O) (x - 3) (x - 6) (1 _ O) (1 _ 3) (1 _ 6)
5
+ (x - O) (x - 1) (x - 6) (3 _ O) (3 _ 1) (3 _ 6)
. 7
+ (x - O) (x - 1) (x - 3) (6 _ O) (6 _ 1) (6 _ 3)
al efectuar las operaciones queda:
P3(X) = (x3 - lOx2 + 27x - 18) (l/6) + (x3 -7x2 + 6x) (-5/18) + (x3 - 4x2 + 3x) (7/90)
y finalmente resulta:
3 3 3 ? 276
P (x) = - - x - - x- + -- x - 3
3 90 90 90
b) El valor de x = 1.8 se sustituye en la aproximación polinomial de Lagrange de ter-
cer grado obtenida arriba y se tienef(1.8) '" 2.
Los cálculos pueden hacerse con Matlab o con la TI-92 Plus 1.
• tI (x - x¡) = (x - xI) ( x - xz) ... (x - x ).
;=1 "
r-
se
Aproximación funciona l e interpolación 331
~
x= [O 1 3 6] ;
y=[-3 O 5 7] ;
e
xi=1.8;
r- yi=interp1 (x, xi)y,
e5_1 ()
Prgm
C1rIO
{O, 1, 3, 6}-+a : {-3, O, 5, 7}-+y
A+n : O+i: : De1var x
For i, 1, n
y[i]-+p
For i, 1, n
if i=]
p* (x-a [j]) / (a [i] -a [j])-+p
EndFor
r+p+i:
EndFor
Disp "Po1inomio interpo1ante"
Disp expand(r) : Pause
FnOff : a[l]-.l* (a [n]-a[l])-+xmin
a[n]+_l* (a [n]-a[l]-+xmax
min(y)-.l*(max(y)-min(y)) -+ymin
max (y) +.1* (max(y) -min (y)) +ymex
DrawFunc r : NewP10t 1, 1, a, y
FnOn : Pause
setMode ("Sp1it 1 App", "Home")
EndPrgm
Obsérvese que si se remplaza x con cualquiera de los valores dados en la tabla, en la apro-
ximación polinomial, se obtiene el valor de la función dado por la misma tabla.
Encuentre tanto la aproximación polinomial de Lagrange a la tabla 5.2 como el valor de
la temperatura para una presión de 2 atm utilizando esta aproximación.
Solución a) Aproximación polinomial de Lagrange mediante dos puntos (n = 1)
r-
(5.24)
al sustituir los primeros dos puntos de la tabla resulta:
x-5 x-1
P (x) = -- 56.5 + -- 113
1-5 5-1
332 Métodos numéricos aplicados a la ingeniería
Observe que la ecuación 5.24 es equivalente a la 5.5 y, por tanto, al sustituir x = 2 se
obtiene el mismo resultado T ""70.6 °C, como era de esperar.
b) Aproximación polinomial de Lagrange con tres puntos (n = 2)
(X-Xl) (X-X2) (X-Xo) (X-X2)
P2 (X) = f (Xo) + f (x.)
(xo - Xl) (xo - X2) (Xl - Xo) (Xl - X2)
(X-Xo) (X-Xl)
+ f(x2)
(X2 - Xo) (X2 - Xl)
al sustituir los primeros tres puntos de la tabla, se obtiene:
(X) = (x-5) (x-20) 56.5+ (x-1)(x-20) 113+ (x-1)(x-5) 181 (5.25)
P2 (1 - 5) (1 - 20) (5 - 1) (5 - 20) (20 - 1) (20 - 5)
polinomio que puede servir para interpolar la temperatura de ebullición de la acetona a la
presión de 2 atm; así el resultado queda T ""72.1. Observe que la ecuación 5.25 equivale
a la 5.8.
e) La tabla 5.2 contiene cuatro puntos, por lo que la aproximación polinomial de ma-
yor grado posible es 3. Se desarrolla la ecuación 5.22 para n = 3
(5.26)
Al sustituir los puntos de la tabla, se obtiene:
(X - 5) (x - 20) (x - 40) (x - 1) (x - 20) (x - 40) 113 +
P3 (x) = (1 _ 5)(1 _ 20) (1 _ 40) 56.5 + (5 - 1) (5 - 20) (5 - 40)
(X - 1) (x - 5) (x - 40)
(20 - 1) (20 - 5) (20 - 40)
181 +
(X - 1) (x - 5) (x - 20) 214.5
(40 - 1) (40 - 5) (40 - 20)
y al simplificar queda:
P3 (x) = 0.01077 x3 - 0.78323 x2 + 18.4923 X + 38.774
Pa¡
el cual puede empelarse para encontrar el valor de la temperatura correspondiente a la pre-
sión de 2 atm. Con la sustitución de X = 2 Y al evaluar pix) queda:
T =f(2) ""p3(2) = 0.01077(2)3 + 0.78323(2)2 + 18.4923(2) + 38.774 = 72.7
Para realizar los cálculos puede usar Matlab o la TI92-Plus
PA
PA
PA
332 Métodos n umé rico s a p licados a la ingen iería
Observe que la ecuación 5.24 es equivalente a la 5.5 y, por tanto, al sustituir x = 2 se
obtiene el mismo resultado T '" 70.6 oC, como era de esperar.
b) Aproximación polinomial de Lagrange con tres puntos (n =2)
(X-Xl) (X - X2) (X - Xo) (X-X2)
P2 (X) = ! (Xo) + ! (Xl)
(Xo- Xl) (Xo- X2) (Xl - Xo) (Xl - X2)
(X-Xo) (X-XI)
+ !(X2)
(X2 - XO) (X2 - XI)
al sustituir los primeros tres puntos de la tabla, se obtiene:
(X) = (x - 5) (x - 20) 56.5 + (x - 1) (x - 20) 113 + (x - 1) (x - 5) 181 (5.25)
P2 (1 - 5) (1 - 20) (5 - 1) (5 - 20) (20 - 1) (20 - 5)
polinomio que puede servir para interpolar la temperatura de ebullición de la acetona a la
presión de 2 atm; así el resultado queda T '" 72.1. Observe que la ecuación 5.25 equivale
a la 5.8.
e) La tabla 5.2 contiene cuatro puntos, por lo que la aproximación polinomial de ma-
yor grado posible es 3. Se desarrolla la ecuación 5.22 para n = 3
Al sustituir los puntos de la tabla, se obtiene:
(X - 5) (x - 20) (x - 40) (x - 1) (x - 20) (x - 40) 113 +
P3 (x) = (1 _ 5)(1 _ 20) (1 - 40) 56.5 + (5 - 1) (5 - 20) (5 - 40)
(X - 1) (x - 5) (x - 40)
(20 - 1) (20 - 5) (20 - 40)
y al simplificar queda:
181 +
(X - 1) (x - 5) (x - 20) 214.5
(40 - 1) (40 - 5) (40 - 20)
P3 (x) =0.01077 x3 - 0.78323 x2 + 18.4923 x + 38.774
(5.26)
el cual puede empelarse para encontrar el valor de la temperatura correspondiente a la pre-
sión de 2 atm. Con la sustitución de x = 2 Yal evaluar pix) queda:
T = f(2) '" pi2) = 0.01077(2)3 + 0.78323(2)2 + 18.4923(2) + 38.774 = 72.7
Para realizar los cálculos puede usar Matlab o la TI92-Plus
2 se
5.25)
a la
ivale
ma-
5.26)

¡
·1
pre-
Aproximación funcional e interpolación 333
P=[l 5
T=[56.5
xi=2;
yi=interp1 (P, T, xi)
yi=interpl (P, T, xi, 'eubie')
yi=interpl (P, T, xi., 'sp1ine')
20 40];
113 181 214.5];
Sobre 'spline' vea la sección 5.7
e5_2 ()
Prgm
CIrIO
Request "Grado del po1inomio", n
expr(n) +l=+n
For i, 1, n
Request "P("&string (i) &")", e
expr(e)-->x[i]
Request "T("&string (i) &")", e
expr (e) -->y [i]
EndFor
Request "Presion a interpolar", e
expr(e)-->xint: tr+r
For i,l,n
y[i]->p
Forj, 1, n
if ú!j
p* (xint-a [j]) / (a [i] -a tin :»
EndFor
r+p+i:
EndFor
Disp "T("&format (xint, "fl") &")="&format (r, "f4")
EndPrgm
ALGORITMO 5.2 Interpolación con polinomios de Lagrande
Para interpolar con polinomios de Lagrange de grado N, proporcionar los
DATOS: El grado del polinornio N, las N + 1 parejas de valores (X(I), FX(I), 1=0,1, ... , N) Yel valor para el
que se desea la interpolación XINT.
RESULTADOS: La aproximación FXINT, el valor de la función en XINT.
PASO l. Hacer FXINT = O.
PASO 2. Hacer 1 = O.
PASO 3. Mientras 1 ~ N, repetir los pasos 4 a 10.
PASO 4. Hacer L = l.
Aproximación funcional e interpolación 333
P=[l 5 20 40} ;
T=[56. 5 113 181 214 . 5} ;
xi=2;
yi=interp1 (P, T, xi)
yi=interpl (P, T, xi, 'eubie' )
yi=interpl (P, T, xi , ' spline ')
Sobre 'spline' vea la sección 5.7
e5_2 ()
Prgm
ClrIO
Request " Grado del polinomio", n
expr (n) +1--+n
For i , 1 , n
Request " P (" &string (i ) &")", e
expr (e) --+x[i}
Request " T( " &string (i) &")", e
expr (e) --+y [i}
EndFor
Request "Presion a interpolar", e
expr(e)--+xint: O--+r
For i , l , n
y[i} --+p
For j , 1 , n
if ioIj
p* (xint -a [j] ) / (a [i] -a [j] )--+p
EndFor
r+p--+r
EndFor
Disp " T ("&format (xint, "fl") &") ="&format (r, "f4")
EndPrgm
ALGORITMO 5.2 Interpolación con polinomios de Lagrande
Para interpolar con polinomios de Lagrange de grado N, proporcionar los
DATOS: El grado del polinomio N, las N + 1 parejas de valores (X(1), FX(1), 1=0,1,... , N) Yel valor para el
que se desea la interpolación XINT.
RESULTADOS: La aproximación FX1NT, el valor de la función en X1NT.
PASO l. Hacer FXINT = O.
PASO 2. Hacer 1 = O.
PASO 3. Mientras 1:0; N, repetir los pasos 4 a 10.
PASO 4. Hacer L = 1.
334 Métodos numéricos aplicados a la ingeniería
PASO 5. Hacer 1 = O.
PASO 6. Mientras 1:S; N, repetir los pasos 7 y 8.
PASO 7. Si I *JHacer L = L * (XINT-X(J))/(X(I)-X(J)).
PASO 8. Hacer 1=1 + 1.
PASO 9. Hacer FXINT = FXINT + L * (FX (1).
PASO 10. Hacer I = 1 + 1.
PASO 11. IMPRIMIR FXINT Y TERMINAR.
Ejemplo 5.3
Solución
Elabore un programa para aproximar la funciónf(x) = cos x en el intervalo [O, 8n] , con
polinomios de Lagrange de grado 1,2,3, ... ,10. Use los puntos que se requieran, distri-
buidos regularmente en el intervalo.
Determine en forma práctica el error máximo que se comete al aproximar con los po-
linomios de los diferentes grados y compare los resultados.
El programa se encuentra en el CD (PROGRAMA 5.1).' Para calcular el error máximo se di-
vidió el intervalo [ O, 8n] en 20 subintervalos y se calculó el valor con el polinomio inter-
polante y el valor verdadero con la función cos x, determinando el error absoluto. Se
obtuvieron los siguientes resultados.
Grado Error máximo
1
2
3
4
5
6
7
8
9
10
2.23627
2.23622
3.17025
2.23627
4.04277
4.1879
5.68560
33.74134
12.82475
35.95l74
Se observa que al aumentar el grado del polinomio, el error absoluto máximo va aumen-
tando.
Antes de pasar al estudio de otra forma de aproximación polinomial (de Newton), se requie-
re el conocimiento de las diferencias divididas, las cuales se presentan a continuación.
5.3 Diferencias divididas
Por definición de derivada en el punto X
o de una función analíticaj(x) se tiene:
I' (x) = lím
x-+x
o x-xo
334 Métodos numéricos apl icados a la ingeniería
PASO 5. Hacer J = O.
PASO 6. Mientras J:S:; N, repetir los pasos 7 y 8.
PASO 7. Si I *JHacer L = L * (XlNT-X(J))/(X(I)-X(J)).
PASO 8. Hacer J=J + 1.
PASO 9. Hacer FXINT = FXINT + L * (FX (1).
PASO 10. Hacer I = I + 1.
PASO 11. IMPRIMIR FXlNT Y TERMINAR.
Ejemplo 5.3
Solución
Elabore un programa para aproximar la funciónf(x) = cos x en el intervalo [O, 8n] , con
polinomios de Lagrange de grado 1, 2, 3,... ,10. Use los puntos que se requieran, distri-
buidos regularmente en el intervalo.
Determine en forma práctica el error máximo que se comete al aproximar con los po-
linomios de los diferentes grados y compare los resultados.
El programa se encuentra en el CD (PROGRAMA 5.1). Para calcular el error máximo se di-
vidió el intervalo [ O, 8n] en 20 subintervalos y se calculó el valor con el polinomio inter-
polante y el valor verdadero con la función cos x, determinando el error absoluto. Se
obtuvieron los siguientes resultados.
Grado Error máximo
2.23627
2 2.23622
3 3.17025
4 2.23627
5 4.04277
6 4.1879
7 5.68560
8 33.74134
9 12.82475
10 35.95174
Se observa que al aumentar el grado del polinomio, el error absoluto máximo va aumen-
tando.
Antes de pasar al estudio de otra forma de aproximación polinomial (de Newton), se requie-
re el conocimiento de las diferencias divididas, las cuales se presentan a continuación.
5.3 Diferencias divididas
Por definición de derivada en el punto X
ode una función analíticaj(x) se tiene:
f' (x)
po-
di-
ter-
. Se
Aproximación funcional e interpolación 335
Sin embargo, cuando la función está en forma tabular
oPuntos 1 2 n
uie-
x Xn
f(x) f(x,,)
La derivada sólo puede obtenerse aproximadamente; por ejemplo, si se desea la derivada
en el punto x, (xo< x < Xl)' puede estimarse como sigue:
El lado derecho de la expresión anterior se conoce como la primera" diferencia dividida de
f(x) respecto a los argumentos xoY xl' y se denota generalmente comof[xo, Xl] ; así,
La relación entre la primera diferencia dividida y la primera derivada queda establecida
por el teorema del valor medio
siempre y cuando f (x) satisfaga las condiciones de aplicabilidad de dicho teorema. Para
obtener aproximaciones de derivadas de orden más alto, se extiende el concepto de dife-
rencias divididas a órdenes más altos como se ve en la tabla 5.3, en donde para uniformar
la notación se han escrito los valores funcionales en los argumentos Xi' O ~ i ~ n, como
f [Xi] Y se les llama diferencias divididas le orden cero.
Por otro lado, de acuerdo con la tal ra 5.3, la diferencia de orden i es:
En esta expresión pude observarse que:
a) Para formarla se requieren i + 1 puntos y
b) El numerador es la resta de dos diferencias de orden i - 1 Yel denominador la res-
ta de los argumentos no comunes en el numerador .
• Se llama también diferencia dividida de primer orden.
Aproximación funcional e interpolación 335
Sin embargo, cuando la función está en forma tabular
Puntos o 2 n
x xl1
f(x) f(x,)
La derivada sólo puede obtenerse aproximadamente; por ejemplo, si se desea la derivada
en el punto x, (xo< x < xI)' puede estimarse como sigue:
f' (x) '" f(x l) - f(xo) ,
XI-XO
El lado derecho de la expresión anterior se conoce como la primera* diferencia dividida de
f(x) respecto a los argumentos xoy x" y se denota generalmente comof[xo, x¡] ; así,
La relación entre la primera diferencia dividida y la primera derivada queda establecida
por el teorema del valor medio
siempre y cuando f (x) satisfaga las condiciones de aplicabilidad de dicho teorema. Para
obtener aproximaciones de derivadas de orden más alto, se extiende el concepto de dife-
rencias divididas a órdenes más altos como se ve en la tabla 5.3, en donde para uniformar
la notación se han escrito los valores funcionales en los argumentos Xi' O~ i ~ n, como
f [Xi] Yse les llama diferencias divididas le orden cero.
Por otro lado, de acuerdo con la tat fa 5.3, la diferencia de orden i es:
En esta expresión pude observarse que:
a) Para formarla se requieren i + 1 puntos y
b) El numerador es la resta de dos diferencias de orden i - 1 Yel denominador la res-
ta de los argumentos no comunes en el numerador.
• Se llama también diferencia dividida de primer orden.
Información
f(x)
Xof[xo]
x
Xlf[Xl]
Primeras
---
f[xo,X1]=f[Xl]-f[xo]
XI-XO
f[x1,X2]=f[X2]-f[XI]
X2-XI
Diferenciasdivididas
SegundasTerceras
f[x2,X3]=f[X3]-f[X2]
X3f[X3]X3-X2
f[X3,X4]=f[X4]-f[X3]
X4f[X4]X4-X3
f[x4,Xs]=f[xs]-f[X4]
Xsf[xs]XS-X4
Tabla53'.Tabulacióngeneral,de'diferencias'd'',ivididas
~
(D-
Oo,
O
(J)
::J
e
3(D-
-r
o'
o(J)
O!
u
o'
O!o,
o(J)
O!
¡¡¡
S'
eo
(D
::J
iD'
~-
Diferenciasdivididas
;~~__________~s:eg~u:n~d:as~__________-=~~~~~~~::~~~~~~J[xo,x11~J[xll-J[xolTcrce"'"
Xlf[Xl]Xl-XO
Información
Xfex)Primeras
Xof[xo]
f[xI,X2]=f[X2]-f[xI]
X2f[X2]X2-Xl
f[x2,X3]=f[X3]-f[X2]
X3f[X3]X3-X2
f[x3,X4]=f[X4]-f[X3]
X4f[X4]X4-X3
f[x4,Xs]=f[xs]-f[X4]
Xsf[xs]XS-X4
Tabla53•Tabula"clangeneralde'diferencias'd''d'IVIIdas
:5:
(D-
OQ.
O
(JI
::J
e
3(1)-
...,
o'
o
(JI
O!
'Q..
o'
O!
Q.
o(JI
O!
Aproximación funcional e interpolación 337
Ejemplo 5.4 La información de la tabla siguiente se obtuvo del polinomio
Puntos O 1 2 3 4 5
x -2 -1
-5
O
-2
2
-2
3
7
6
142f(x) -18
A partir de ella, elabore una tabla de diferencias divididas.
Solución Las primeras diferencias divididas mediante los puntos (O), (1) Y (1), (2), respectivamen-
te, son:
-5 - (-18)
f [xo' Xl] = = 13;
-1 - (-2)
-2-(-5)
f[xl' x2] = = 3
0-(-1)
La segunda diferencia dividida mediante los puntos (O), (1) Y (2) es:
3 - 13
f [XÜ'xl' x2 ] = = -5
0-(-2)
De igual manera se calculan las demás diferencias divididas, que se resumen en la siguien-
te tabla
Puntos X f(x) ler orden 2do orden 3er orden 40
orden
O -2 -18
13
1 -1 -5 -5
3
2 O -2 -1 O
O 1
3 2 -2 3 O
9
4 3 7 9
45
5 6 142
Debe notarse que todas las diferencias divididas de tercer orden tienen el mismo valor, in-
dependientemente de los argumentos que se usen para su cálculo. Obsérvese también que
las diferencias divididas de cuarto orden son todas cero, lo cual concuerda con que la ter-
cera y cuarta derivada de un polinomio de tercer grado son -respectivamente- una cons-
tante y cero, sea cual sea el valor del argumento x. El razonamiento inverso también es
válido: si al construir una tabla de diferencias divididas en alguna de las columnas el va-
lor es constante (y en la siguiente columna es cero), la información proviene de un poli no-
mio de grado igual al orden de las diferencias que tengan valores constantes.
Para realizar los cálculos puede usar Matlab.
338 Métodos numéricos ap licados a la ingeniería
x= [-2 -1 023 6};
fx= [-18 -5 -2 -2 7142};
M=6;N=M-1;
for i=l: N
T(i,l) = (fx(i+l) -fx(i))/(x(i+l)-x(i));
end
for ]=2 :N
for i=j :N
T (i,j) (T (i,j-1) -T(i-l,j -1)) / (x (i+l) -
x(i-j+1));
end
end
T
ALGORITMO 5.3 Tabla de diferencias divididas
Para obtener la tabla de diferencias divididas de una función dada en forma tabular, proporcionar los
DATOS: El número de parejas M de la función tabular y las parejas de valores (X (I),FX(I), 1= O, 1,2, ... ,
M-l).
RESULTADOS: La tabla de diferencias divididas T.
PASO 1. Hacer N = M-1.
PASO 2. Hacer 1 = O.
PASO 3. Mientras 1::; N-l, repetir los pasos 4 y 5.
PASO 4. Hacer T(I,O) = (FX(I+ l)-FX(I))/(X(I+ l)-X(I)).
PASO 5. Hacer 1 = 1+1.
PASO 6. Hacer J = 1.
PASO 7. Mientras J s N-I, repetir los pasos 8 a 12.
PASO 8. Hacer 1 = J.
PASO 9. Mientras 1::; N-l, repetir los pasos 10 y 11.
PASO 10. Hacer.
T(I,J) = (T(I,J-l) - T(I-l,J-l))/(X(I+l)-X(I-J)).
PASO 11. Hacer! = 1 + 1.
PASO 12. Hacer J = J + 1.
PASO 13. IMPRIMIR T YTERMINAR.
5.4 Aproximación polinominal de Newton
Puntos o 1 2 3 n
Supóngase que se tiene una función dada en forma tabular como se presenta a continuación
x X"
f(x) f[xn
]
338 Métodos numéricos aplicados a la ingeniería
x= [-2 - 1 023 6} ;
fx= [ - 18 - 5 - 2 - 2 7142} ;
M=6; N=M- 1;
for i=l: N
T(i,l) = (fx(i+l) - fx(i))/(x(i+l) - x(i));
end
for ]=2 : N
for i=j : N
T (i,j) (T (i, j - 1) - T(i-l,j - 1)) / (x (i+l ) -
x (i-j+1 ));
end
end
T
ALGORITMO 5.3 Tabla de diferencias divididas
Para obtener la tabla de diferencias divididas de una función dada en forma tabular, proporcionar los
DATOS: El número de parejas M de la función tabular y las parejas de valores (X (I),FX(I), 1= 0, 1,2, ... ,
M-l).
RESULTADOS: La tabla de diferencias divididas T.
PASO l. Hacer N = M-l.
PASO 2. Hacer 1= O.
PASO 3. Mientras 1::; N-l, repetir los pasos 4 y 5.
PASO 4. Hacer T(I,O) = (FX(I+ l)- FX(I»/(X(I+1)-X(I».
PASO 5. Hacer 1= 1+l.
PASO 6. Hacer J = 1.
PASO 7. Mientras J ::; N-l, repetir los pasos 8 a 12.
PASO 8. Hacer 1 = J.
PASO 9. Mientras 1::; N- l , repetir los pasos 10 y ll.
PASO 10. Hacer.
T(I,J) = (T(I,J- l) - T(I-l,J- l»/(X(I+l)- X(I- J».
PASO 11. HacerI = I + l.
PASO 12. Hacer J = J + l.
PASO 13. IMPRIMIR T YTERMINAR.
5.4 Aproximación polinominal de Newton
Supóngase que se tiene una función dada en forma tabular como se presenta a continuación
Puntos o 1 2 3 n
x
f(x)
2,." ,
Aproximación funcional e interpolación 339
y que se desea aproximarla preliminarmente con un polinomio de primer grado que pasa,
por ejemplo, por los punto (O) y (1). Sea además dicho polinomio de la forma:
(5.27)
ión
donde Xo es la abscisadel punto (O) y ao' al son constantes por determinar. Para encontrar
el valor de ao se hace x = xo' de donde ao = p(xo) = f [xo]' y a fin de encontrar el valor de
al se hace x = xl' de donde al = ({[xI] - f[xo]) / (Xl- xo), o sea la primera diferencia di-
vidida j'[x., xo]·
Al sustituir los valores de estas constantes en la ecuación 5.27 ésta queda
o sea un polinomio de primer grado en términos de diferencias divididas.
y si ahora se desea aproximar la función tabular con un polinomio de segundo grado
que pase por los puntos (O), (1) Y (2) Y que tenga la forma:
(5.28)
donde Xo y XI vuelven a ser las abscisas de los puntos (O) y (1) y ao' al y a2 son constantes
por determinar, se procede como en la forma anterior para encontrar estas constantes; o sea,
si X = xo' ao = P2 (xo) = f [xo]
. f[ XI] - f [xo]
SlX = xI' al = =f[xo'x¡]
xl-xO
Al desarrollar algebraicamente el numerador y el denominador de a2
se llega a"
f[x2
] - f[x¡] f[xl
] - f[xo]
X2 -Xl XI -Xoa2
= ---"--'---------'--'-- = f[xo, XI' X2
]
X
2
-X
o
que es la segunda diferencia dividida respecto a X
o' Xl y X2.
Con la sustitución de estos coeficientes en la ecuación 5.28 se obtiene:
P2(X) = f[xo] + (x - xo)f [xo' x¡] + (X-Xo) (x-xI) f[xo' Xl' X2]
que es un polinomio de segundo grado en términos de diferencias divididas.
Por inducción se puede establecer que, en general, para un polinomio de grado n es-
crito en la forma
Pn(X) = ao + al (x-xo) + a2 (x-xo) (X-XI) + ... + an (x-xo) (X-XI) (x-xn_l) (5.29)
y que pasa por los puntos (O), (1), (2), ... , (n); los coeficientes aO' al' , an están dados por
f[xo]
f[xo' XI]
f[xo, xi' x2]
• Véase el problema 5.11.
Aproximación funcional e interpolación 339
y que se desea aproximarla preliminarmente con un polinomio de primer grado que pasa,
por ejemplo, por los punto (O) y (1). Sea además dicho polinomio de la forma:
(5.27)
donde Xoes la abscisa del punto (O) yao> a, son constantes por determinar. Para encontrar
el valor de ao se hace x =xo' de donde ao =p(xo) =f [xo]' y a fin de encontrar el valor de
a, se hace x = xj> de donde al = (f [x, ] - f [xo ]) / (xl - xo)' o sea la primera diferencia di-
vididaf[xl' xo]'
Al sustituir los valores de estas constantes en la ecuación 5.27 ésta queda
o sea un polinomio de primer grado en términos de diferencias divididas.
y si ahora se desea aproximar la función tabular con un polinomio de segundo grado
que pase por los puntos (O), (1) Y (2) Y que tenga la forma:
(5.28)
donde Xoy x, vuelven a ser las abscisas de los puntos (O) y (1) y ao, al y a2 son constantes
por detei-miri.ar, se procede como en la forma anterior para encontrarestas constantes; o sea,
si x =xo> ao =P2 (xo) =f [xo]
. f[ x,] - f[ xo]
SI x =xl' al = =f[xo, XI]
X¡-XO
Al desarrollar algebraicamente el numerador y el denominador de a2 se llega a*
f[x2] - f[x¡] f[x l] - f[xo]
x2-XI x, - xoa2 = - --=--'--------'---"-- = f[xo> xl' x2]
x2 - xo
que es la segunda diferencia dividida respecto a xQ> XI y x2.
Con la sustitución de estos coeficientes en la ecuación 5.28 se obtiene:
P2(X) = f[xo] + (x - xo)f [xo' x¡] + (x-xo) (x-x,) f[xo> xl' x2]
que es un polinomio de segundo grado en términos de diferencias divididas.
Por inducción se puede establecer que, en general, para un polinomio de grado n es-
crito en la forma
(5.29)
y que pasa por los puntos (O), (1), (2),... , (n); los coeficientes aQ> a" ... > an
están dados por
ao f[xo]
a, f[xo, x ,]
a2 f [xo> x" x2]
• Véase el problema 5.11.
.---------~----------------~----------------------------------=T~~~
340 Métodos numéricos aplicados a la ingeniería
Esta aproximación polinomial de Newton, la cual se puede expresar sintéticamente
como:
n k-I
P" (x) = L ak Il (x -x)
k=O i=O
(5.30)
Para realizar los cálculos puede usar Matlab.
I Ejemplo 5.51 Elabore una aproximación polinomial de Newto~ para la información tabular de las pre-
siones de vapor de la acetona (tabla 5.2) e interpole la temperatura para una presión de
2 atm.
Solución Para el cálculo de los coeficientes del polinomio de Newton, se construye la tabla de dife-
rencias divididas.
Diferencias divididas
Puntos P T
Primera Segunda Tercera
O 1 56.5
14.125
5 113 -0.50482
4.533 0.01085
2 20 181 -0.08167
1.675
3 40 214.5
a) Para n = 1
P (x) = ao + al (x-xo) = f[ Xo ] + f[ xo' XI ] (x-xo)
Si x = 2,f(2) ""p(2) = 56.5 + 14.125(2-1) = 70.6 °C
de la tabla se tienef[xo] = 56.5 y f[xO'xl] = 14.125, de donde:
p (x) = 56.5 + 14.125 (x - 1)
ecuación que equivale a las obtenidas anteriormente (5.5 y 5.24).
b) Para n = 2
P2(X) = ao + al (x-xO) + a2(x-xO)(x-xl)
= f[xo] + f[xO'xl] (x-xo) + f[xO'xl'x2] (x-xo) (x-xl)
de la tabla se obtienen ao = f[xo] = 56.5, al =f[xo' x 1] = 14.125, a2 =f[xo' x l' x2] = -0.50482,
que al sustituirse en la ecuación de arriba dan: .
P2 (x) = 56.5 + 14.125 (x -1) - 0.50482(x -1)(x - 5) E
ecuación que equivale a 5.8 y 5.25
Si x = 2,f(2) ""p2(2) = 56.5+14.125(2-1)-0.50482(2-1)(2-5)=72.1 °C
e) Para n = 3
Aproximación funcional e interpolación 341
nte P3 (x) = ao+a) (x-xo) + a2 (x-xo)(x-x)) + aix-xo)(x-x))(x-x2)
= f[xoJ + f[xo,xd (x-xo) + f[xO,x»x2J (x-xo) (x-x))+
f [xQ>x»x2,x3J (x-xo)(x-x ))(x-x2)
de la tabla se obtienen ao = f[xo J = 56.5, al = f[xo'x) J = 14.125,
a2 = f[xO,x»x2J = -0.50842, a3 = f[ xO,xJ>x2,x3J = 0.01085.
.30)
que sustituidas generan el polinomio de aproximación
P3 (x) = 56.5+ 14. 125(x-l)-0.50482(x-1)(x-5)+0.01085(x-l)(x-5)(x-20)
y que es esencialmente el polinomio obtenido con el método de Lagrange (ecuación 5.26).
dife-
Si x = 2,f(2) "" P3 (2) = 56.5+14.125(2-1)-0.50482(2-1)(2-5)+
0.01085(2-1)(2-5)(2-20) = 70.7 °C
Para realizar los cálculos puede usar Matlab.
c1ear
x=[l 5 20 40];
fx=[56.5 113 181 214.5];
M=4;N=M-1;
for i=l : N
T (i,1) = (E: (i +1) -fx (i)) / (x (i +1) -x (i)) ;
end
for j=2:N
for i=j:N
T(i,j)=(T(i,j-1) -T(i-1,j-1)) l...
(x(i+1)-x(i-j+1) );
end
end
T
Xint=2;
fprintf (' N Fxint In')
px1=fx (1) +T (1,1) * (Xint-x (1) ) ;
fprintf(' %d %6.1f In' ,1,px1)
px2=fx (1) +T (1,1) * (Xint-x (1) ) +...
T(2,2) * (Xint-x (1)) * (Xint-x (2)) ;
fprintf(' %d %6.1f In' ,2,px2)
px3=fx (1) +T (1, 1) * (Xint-x (1)) +...
T(2,2) * (Xint-x (1))* (Xint-x (2)) +...
T(3,3) * (Xint-x (1) ) * (Xint-x (2)) * (Xint-x (3)) ;
fprintf(' %d %6.1f In' ,3,px3)
82,
Ejemplo 5.6 Aproxime la temperatura de ebullición de la acetona a una presión de 30 atm usando
aproximación polinomial de Newton de grado dos (véase Ej. 5.5). 1'6'_.5
3
Solución Se hace pasar el polinomio de Newton por los puntos (1), (2) Y (3), con lo que toma la
forma
Aproximación funcional e interpolación 341
P3 (x) = aO+ a l (X-XO) + a2 (X-XO)(X-X I ) + a3(x-xO)(X-XI )(X-X2)
= f[xOJ + f[xo,xd (x-xo) +f[xO,Xp X2J (X-XO) (X-X I )+
f [xo'x pX2,X3J(X-XO)(X-X I)(X-X2)
de la tabla se obtienen ao = f[xoJ=56.5, al = f[xO,x l J= 14.125,
a2 =f [xO,xp x2J =--0.50842, a3 = f [ xO,xl'x2,x3J =0.01085.
que sustituidas generan el polinomio de aproximación
P3 (x) = 56.5+14.125(x-1)-0.50482(x-1)(x-5)+0.01085(x-1)(x-5)(x-20)
y que es esencialmente el polinomio obtenido con el método de Lagrange (ecuación 5.26).
Si x =2,f(2) '" P3 (2) = 56.5+14.125(2-1)-0.50482(2-1)(2-5)+
0.01085(2-1)(2-5)(2-20) = 70.7 oC
Para realizar los cálculos puede usar Matlab.
c1ear
x=[l 5 20 40];
fx=[56.5 113 181 214.5];
M=4;N=M-l;
for i=l : N
T (i,l) = (L~ (i +1) - fx (i)) / (x (i+l) -x (i)) ;
end
for j=2 : N
for i=j : N
T(i , j)=(T(i,j-l) - T(i-1 , j-1) )/..
(x(i+1)-x (i-j+1) );
end
end
T
Xint=2;
fprintf (' N Fxint In')
px1=fx (1) +T (1 , 1) * (Xint - x (1) ) ;
fprintf(' %d %6.1f In' ,1,px1)
px2=fx (1) +T (1,1) *(Xin t-x (1) ) +...
T (2,2) *(Xint-x (1)) *(Xint-x (2 )) ;
fprintf( ' %d %6.1f In' ,2,px2)
px3=fx (1) +T (1,1) *(Xint-x (1) ) +...
T (2,2) *(Xint-x (1))* (Xint - x (2)) +...
T (3,3) *(Xint-x (1) r' (Xint - x (2)) *(Xint-x (3)) ;
fprintf(' %d %6.1f In' ,3,px3)
Ejemplo 5.6 Aproxime la temperatura de ebullición de la acetona a una presión de 30 atm usando
aproximación polinomial de Newton de grado dos (véase Ej. 5.5). 1'6'.S
"3
Solución Se hace pasar el polinomio de Newton por los puntos (1), (2) Y(3), con lo que toma la
forma
~~-~~~------.~.--------------------------------------------------------------------------~--------~-
¡ ~'l
342 Métodos numéricos aplicados a la ingeniería
con los coeficientes dados ahora de la siguiente manera:
ao = f[XI]
al = f[xl' X2]
a2= f[xl'X2'X3]
Al sustituir:
PA
P2 (x) = f[xl] + f[xl' X2] (X~XI) + f[xl' x2, x3] (X-Xl) (X-X2)
= 113 + 4.533(x - xl) - 0.08167(x - xl)(x - x2)
y al evaluar dicho polinomio en X = 30, se obtiene la aproximación buscada 5.
T = pzC30) = 113 + 4.533(30 - 5) - 0.08167(30 - 5)(30 - 20)
= 205.9
El valor reportado en la tabla 5.1 es 205, por lo que la aproximación es buena.
Para realizar los cálculos puede usar Matlab.
c1ear
x= [5 20 40 J;
fx=[113 181 214.5J;
M=3; N=M-1;
for i=l : N
T(i,l) = (fx(i+1) -fx(i))/(x(i+1)-x(i))
end
for j=2:N
for i=j:N
T (i,j) = (T (i ,j-1) -T (i -1,j-1)) / ...
(x(i+l) -x (i-j+l) );
end
end
T
Xint=30;
px2=fx(1) +T(l,l) * (Xint-x(l))+ ...
T(2,2) * (Xint-x(1))*(Xint-x(2));
fprintf ('T (%2d)=%6.1fn' ,Xint, px2)
Para interpolar con polinomios de Newton en diferencias divididas de grado N, proporcionar los
DATOS: El grado del polinomio N, las N+ 1 parejas de valores (X(I), FX(I), 1=0, 1,2, ... , N) Y el valor para
el que se desea interpolar XINT.
RESULTADOS: La aproximación FXINT al valor de la función en XINT.
PASO l. Realizar los pasos 2 a 12 del algoritmo 5.3.
PASO 2. Hacer FXINT = FX(O).
PASO 3. Hacer I = O.
PASO 4. Mientras 1 ::;N~ 1, repetir los pasos 5 a 11.
342 Métodos numéricos aplicados a la ingeniería
con los coeficientes dados ahora de la siguiente manera:
ao= ![Xl]
al = f[xl' X2]
a2 = ! [xl' X 2' X 3]
Al sustituir:
P2 (x) = f[xl ] + f[xl' X2] (X-Xl) + f[xl' X2, X3] (X-Xl) (X-X2)
= 113 + 4.533(x - xl) - 0.08l67(x - XI)(X - X2)
y al evaluar dicho polinomio en X = 30, se obtiene la aproximación buscada
T =pi30) = 113 + 4.533(30 - 5) - 0.08167(30 - 5)(30 - 20)
= 205.9
El valor reportado en la tabla 5.1 es 205, por lo que la aproximación es buena.
Para realizar los cálculos puede usar Matlab.
c1ear
x= [5 20 40 };
fx= [113 181 214.5J;
M=3; N=M-1;
for i =l : N
T(i,l) = (fx(i+1) -fx(i))I(x(i+1 )-x(i))
end
f or j=2 :N
for i =j:N
T (i,j) = (T (i, j-1) -T (i -1,j-1)) loo.
(x(i+l ) -x (i-j +l ) );
end
end
T
Xint=30;
p x 2=fx(1) +T(l,l) * (Xint-x(l))+ oo.
T(2,2) * (Xint-x(1))*(Xint-x(2));
fprintf ('T (%2d) =%6. 1fn' ,Xint, px2)
i ;, &Jl 7F; t , # . * . ~
ALGORITMO 5.4 Interpolación pollnominal de Newton 1
Para interpolar con polinomios de Newton en diferencias divididas de grado N, proporcionar los
DATOS: El grado del polinomio N, las N+1 parejas de valores (X(I), FX(I), 1=0, 1,2,... , N) Yel valor para
el que se desea interpolar XINT.
RESULTADOS: La aproximación FXINT al valor de la función en XINT.
PASO l . Realizar los pasos 2 a 12 del algoritmo 5.3.
PASO 2. Hacer FXINT = FX(O).
PASO 3. Hacer I = O.
PASO 4. Mientras 1 ::; N-l, repetir los pasos 5 a 11.
Aproximación funcional e interpolación 343
PASO 5. Hacer P = 1.
PASO 6. Hacer J = O.
PASO 7. Mientras J ::; I, repetir los pasos 8 y 9.
PASO 8. Hacer P = P * (XINT - X(J».
PASO 9. Hacer J = J + 1.
PASO 10. Hacer FXINT = FXINT + T(I,I)*P.
PASO 11. Hacer I = I + 1.
PASO 12. IMPRIMIR FXINT y TERMINAR.
5.5 Polinomio de Newton en diferencias finitas
Cuando la distancia h entre dos argumentos consecutivos cualesquiera, es la misma a lo
largo de la tabla, el polinomio de Newton en diferencias divididas puede expresarse con
más sencillez. Para este propósito se introduce un nuevo parámetro s, definido en x =
xo+sh, con el cual se expresa el factor productoria
k-I
rr (x - Xi)'
i=O
de la ecuación 5.30 en términos de s y h. Para esto obsérvese que xI - X
o = h, x2
- X
o =
2h, ... , x; - X
o = ih Y que restando x;(O::; i::; n) en ambos miembros de x = X
o + sh, se ob-
tiene:
x - Xi = Xo - Xi + sh = -ih + sh = h(s -i) para (O ::; i ::;n)
Por ejemplo si i = 1,
X-XI = h(s-l)
si i = 2,
X - x2
= h(s - 2)
Al sustituir cada una de las diferencias (x - x¡) con h (s - i), en la ecuación 5.29, se llega a:
P; (x) = Pn (xo + sh) = f[xo] + hsf[xo' XI] + h2
s(s-1)f[xo, xi' x2]
+ h3
s(s-1)(s-2)f[xo' xl' x2' x3] + ...
+ h" s(s-1)(s-2) ... (s-(n-l»f[xo' xp'" xn
]
(5.31)
o en forma compacta
n k-I
P (x) = L a hk rr (s - i)
n k=O k ;=0
(5.32)
Esta última ecuación puede simplificarse aún más si se introduce el operador lineal li,co-
nocido como operador lineal en diferencias hacia delante y definido sobre f (x) como.
lif(x) = f(x + h) - f(x)
La segunda diferencia hacia delante puede obtenerse como sigue:
li (lif(x» = li2 f(x) = li (¡(x + h) -f(x»
= lif(x + h) - lif(x)
=f (x + h + h) - f (x + h) - f (x + h) + f (x)
= f (x + 2h) - 2f (x + h) + f (x)
Aproximación funcional e interpolación 343
PASO 5. Hacer P = 1.
PASO 6. Hacer J = O.
PASO 7. Mientras J ::; 1, repetir los pasos 8 y 9.
PASO 8. Hacer P = P * (XINT - X(J)).
PASO 9. Hacer J = J + 1.
PASO 10. Hacer FXINT = FXINT + T(I,IyP.
PASO 11. Hacer 1 = 1 + 1.
PASO 12. IMPRIMIR FXINT y TERMINAR.
5.5 Polinomio de Newton en diferencias finitas
Cuando la distancia h entre dos argumentos consecutivos cualesquiera, es la misma a lo
largo de la tabla, el polinomio de Newton en diferencias divididas puede expresarse con
más sencillez. Para este propósito se introduce un nuevo parámetro s, definido en x =
xo+sh, con el cual se expresa el factor productoria
k- I
n (x - x¡),
¡=o
de la ecuación 5.30 en términos de s y h. Para esto obsérvese que x I - X
o
= h, x 2 - X
o
=
2h,... , x¡ - Xo = ih Y que restando x¡(O::;; i::;; n) en ambos miembros de x = X
o + sh, se ob-
tiene:
x - x¡ = X
o - x¡ + sh = -ih + sh = hes -i) para (O ::;; i ::;; n)
Por ejemplo si i = 1,
X-X I = h(s-l)
si i = 2,
X - x2
= hes - 2)
Al sustituir cada una de las diferencias (x - x¡) con h (s - i), en la ecuación 5.29, se llega a:
Pn (x) = P" (xo + sh) = f[xo]+ hsf[xo' XI ] + h2
s(s-I)f[xo' xi' x2]
+ h3
s(s-1)(s-2)f[xo' xi' x2' x3] + ...
+ h" s(s-I)(s-2) .. . (s-(n- l)f[xo' x p ' " xll
]
o en forma compacta
11 k-I
P (x) = L a hk I1 (s - i)
11 k=O k i=O
(5.31)
(5.32)
Esta última ecuación puede simplificarse aún más si se introduce el operador lineal bo, co-
nocido como operador lineal en diferencias hacia delante y definido sobref (x) como.
bof(x) =f(x + h) - f(x)
La segunda diferencia hacia delante puede obtenerse como sigue:
bo (bof(x» =bo2 f(x) =bo (¡(x + h) -f(x))
= bof(x + h) - bof(x)
= f (x + h + h) - f (x + h) - f (x + h) + f (x)
=f(x + 2h) - 2f(x + h) + f(x)
344 Métodos numéricos aplicados a la ingeniería
A su vez, las diferencias hacia delante de orden superior se generan como sigue:
/1i f (x) = /1 (/1i-1 f (x))
Estas diferencias se conocen como diferencias finitas hacia delante. Análogamente cabe
definir V como operador lineal de diferencias hacia atrás; así, la primera diferencia ha-
cia atrás se expresa como:
V f(x) = f(x) - f(x - h)
La segunda diferencia hacia atrás queda:
V2 f(x) = V(Vf(x)) = V(j(x) - f(x - h))
V2f(x) = f(x)-f(x-h)-f(x-h) +f(x-2h)
V2f(x) = f(x)-2f(x-h) +f(x-2h)
de tal modo que las diferencias hacia atrás de orden superior se expresan en términos ge-
nerales como:
Vi f(x) = V(Vi-l f (x)).
Estas diferencias se conocen como diferencias finitas hacia atrás.
Al aplicar /1 al primer valor funcional f [xoJ de una tabla se tiene:
N (xo) =f[xlJ - f[xoJ = hf[xo'x¡],
de manera que:
Del mismo modo:
f[x2J -2f[x¡J +f[xoJ
2 h2
por lo que:
En general:
(5.33)
De igual manera, las diferencias divididas en función de las diferencias hacia atrás que-
dan:
(5.34)
Consecuentemente, al sustituir f [xo' xp'" x;J, (O :s; i :s; n) en términos de diferencias fini-
tas, la ecuación 5.31 queda:
s (s-1)
PIl
(x) = PI1
(xo + sh) =f [xoJ + s/1f [xoJ + --- /12
f[xOJ +
2!
344 Métodos numéricos aplicados a la ingeniería
A su vez, las diferencias hacia delante de orden superior se generan como sigue:
f..i f (x) =f.. (I!:!/- ¡f (x»
Estas diferencias se conocen como diferencias finitas hacia delante. Análogamente cabe
definir V como operador lineal de diferencias hacia atrás; así, la primera diferencia ha-
cia atrás se expresa como:
V f(x) = f(x) - f(x - h)
La segunda diferencia hacia atrás queda:
V2 f(x) = V(Vf(x» = v(j(x) - f(x - h»
V2f(x) = f(x)-f(x-h)-f(x-h) +f(x-2h)
V2f(x) = f(x)-2f(x-h) +f(x -2h)
de tal modo que las diferencias hacia atrás de orden superior se expresan en términos ge-
nerales como:
Vi f(x) =V(Vi-l f (x».
Estas diferencias se conocen como diferencias finitas hacia atrás.
Al aplicar f.. al primer valor funcionalf [xo] de una tabla se tiene:
de manera que:
Del mismo modo:
por lo que:
En general:
N (xo) = f[x¡] - f[xo] = hf[xo'x¡],
f [x2] -2f [Xl] + f [xo]
2 h2
(5.33)
De igual manera, las diferencias divididas en función de las diferencias hacia atrás que-
dan:
(5.34)
Consecuentemente, al sustituir f [xo' x p '" x;J, (O :s:; i :s:; n) en términos de diferencias fini-
tas, la ecuación 5.31 queda:
s (s-l)
PIl
(x) =PI1
(xo + sh) =f [xo] + sf..f [xo] + --- f.. 2f[xO] +
2!
Aproximación funcional e interpolación 345
s (s-l) (s-2) A3f[ ]
+ ti X
o + ...
3!
(5.35)
cabe
ia ha-
+ s (s-l) (s-2) ... (s- (n-1) ) él '1[x
o
]
n!
conocido como el polinomio de Newton en diferencias finitas hacia delante.
Existe una expresión equivalente a la 5.35 para diferencias hacia atrás (polinomio de
Newton en diferencias finitas hacia atrás), cuya obtención se motiva al final del ejemplo
siguiente.
La siguiente tabla proporciona las presiones de vapor en lb/plg? a diferentes temperatu-
ras para el 1-3 butadieno
s ge-
Puntos o 1 2 3 4 5
50
24.94
60
30.11
70
36.05
80
42.84
90
50.57
100
59.30
Aproxime la función tabulada por el polinornio de Newton en diferencias hacia delante e
interpole la presión a la temperatura de 64°F.
Solución Primero se construye la tabla de diferencias hacia delante como sigue:
Punto xi f[x¡] élf[x¡] él2f [x¡] él3j[x¡] él4j [Xi]
O 50
24.94 _________
N [x
o
] = 5.17 ______________
1 60 30.11
él2j [x
o
] = 0.77 ______________
élf[x¡] = 5.94 él3f [xoJ = 0.08 __________
2 70 36.05 él2f[x,] = 0.85 él4j [xo] = 0.01
él3f [x¡] = 0.09
él2f[x2
] = 0.94 él4j [x,] = -0.03
él3f [x2] = 0.06
élf[x2
] = 6.79
3 80 42.84
élf[x3] = 7.73
4 90 50.57
élf[x4] = 8.73
5 100 59.30
(5.33)
que-
(5.34)
fini-
Observe que en esta información h= 10, el valor por interpolar es 64 y que el valor de s se
obtiene de la expresión x = X
o + sh; esto es:
s= x - Xo = 64 - 50 = 1.4
h 10
346 Métodos numéricos aplicados a la ingeniería
Si se deseara aproximar con un polinomio de primer grado, se tomarían sólo los dos
primeros términos de la ecuación 5.35; o sea,
p(x) =f[xo] + s L1f[xo] = 24.94 + 1.4(5.17) = 32.18
Hay que observar que realmente se está extrapolando, ya que el valor de x queda fuera del
intervalo de los puntos que se usaron para formar el polinomio de aproximación.
Intuitivamente se piensa que se obtendría una aproximación mejor con los puntos (1)
y (2). Sin embargo, la ecuación 5.35 se desarrolló usando X
o como pivote y para aplicarla
con el punto (1) y (2) debe modificarse a la forma siguiente
s (s - 1)
P« (x) = f[xl + sh] = f[xl] + SL1f[x¡] + L1
2
f[ Xl] + ...
2!
+ s(s-l) ... (s-(n-1)) L1'1[x]
I 1
n.
(5.36)
la cual usa como pivote Xl' Ycuyos primeros dos términos dan la aproximación polinomial
de primer grado:
x-x 64 - 60
p(x) = f [Xl] + sts f [Xl], donde ahora s = __ 1_= =0.4;
h 10
al sustituir valores de la tabla se tiene:
f(64) '" P (64) = 30.11 + 0.4(5.94) = 32.49
En cambio, si se deseara aproximar con un polinomio de segundo grado, se requeri-
rían tres puntos y sería aconsejable tomar (O), (1) y (2) en lugar de (l ), (2) Y (3), ya que el
argumento por interpolar está más al centro de los primeros. Con esta selección y la ecua-
ción 5.35 queda
donde:
S
_ x - X
o _ 64 - 50
- - ---== 1.4;
h 10
este valor se sustituye arriba y queda:
p2(64) = 24.94 + 1.4(5.17) + 1.4 (1.4 - 1) 0.77 = 32.39
2!
Si se quisiera interpolar el valor de la presión a una temperatura de 98°F, tendría que desa-
rrollarse una ecuación de Newton en diferencias hacia delante, usando como pivote el pun-
to (4) para un polinomio de primer grado o el punto (3) para un polinomio de segundo grado,
etc. Sin embargo, esto es factible usando un solo pivote (el punto 5 en este caso), indepen-
dientemente del grado del polinomio por usar, si se emplean diferencias hacia atrás.
Para esto se debe desarrollar una ecuación equivalente a la 5.35, pero en diferencias
hacia atrás; este desarrollo se presenta a continuación en dos pasos -el primero es un re-
sultado necesario.
Primer paso
Obtención del polinomio de Newton en diferencias divididas hacia atrás de grado n apo-
yado en el punto XII.
346 Métodos numéricos aplicados a la ingeniería
Si se deseara aproximar con un polinomio de primer grado, se tomarían sólo los dos
primeros términos de la ecuación 5.35; o sea,
p(x) = f[xo] + s L1f[xo] = 24.94 + 1.4(5.17) = 32.18
Hay que observar que realmente se está extrapolando, ya que el valor de x queda fuera del
intervalo de los puntos que se usaron para formar el polinomio de aproximación.
Intuitivamente se piensa que se obtendría una aproximación mejor con los puntos (1)
y (2). Sin embargo, la ecuación 5.35 se desarrolló usando X
ocomo pivote y para aplicarla
con el punto (1) y (2) debe modificarse a la forma siguiente
s (s - 1)
PI/ (x) =f[x I + sh] =f[x l ] + sL1f[x¡] + L12 f[ XI] + ...
2!
s (s - 1) ... (s- (n - 1)) A 'f [ ]+ ,-,1/ X
I I
n.
(5.36)
la cual usa como pivote XI' Ycuyos primeros dos términos dan la aproximación polinomial
de primer grado:
X-X 64 - 60
p(x) =f[x¡] + SL1f[xl
], donde ahora s =__1_ = =OA;
h 10
al sustituir valores de la tabla se tiene:
f(64) '" p (64) = 30.11 + OA(5.94) = 32A9
En cambio, si se deseara aproximar con un polinomio de segundo grado, se requeri-
rían tres puntos y sería aconsejable tomar (O), (1) Y(2) en lugar de (1), (2) Y(3), ya que el
argumento por interpolar está más al centro de los primeros. Con esta selección y la ecua-
ción 5.35 queda
donde:
S
_ X - X
o _ 64 - 50
- - - - - = 1.4;
h 10
este valor se sustituye arriba y queda:
p2(64) = 24.94 + 1A(5.17) + lA (lA - 1) 0.77 = 32.39
2!
Si se quisiera interpolar el valor de la presión a una temperatura de 98 °F, tendlía que desa-
rrollarse una ecuación de Newton en diferencias hacia delante, usando como pivote el pun-
to (4) para un polinomio de primer grado o el punto (3) para un polinomio de segundo grado,
etc. Sin embargo, esto es factible usando un solo pivote (el punto 5 en este caso), indepen-
dientemente del grado del polinomio por usar, si se emplean diferencias hacia atrás.
Para esto se debe desarrollar una ecuación equivalente a la 5.35, pero en diferencias
hacia atrás; este desarrollo se presenta a continuación en dos pasos -el primero es un re-
sultado necesario.
Primer paso
Obtención del polinomio de Newton en diferencias divididas hacia atrás de grado n apo-
yado en el punto xl/.
Aproximación funcional e interpolación 347
dos Para simplificar se inicia con n = 2 Yse asume que un polinomio de segundo grado en
general tiene la forma:
del
P2(X) = ao + a¡(x - XII) + aix - x,.) (x - xlI_¡)
donde ao' a¡ y a2 son las constantes por determinar y XII Y xlI
_
1 las abscisas de los puntos
(n) y (n-l), respectivamente.
Si X = XII' ao = pixl1) = f [xl1]
Si X = x
l1
_1' a¡ = P2 (xlI_¡) - P? (x,) = f [XII' x
lI
_¡]
xn
_
l
-xn
s (1)
carla
.36)
al desarrollar algebraicamente el numerador y el denominador de a2
se llega a:
mía!
al sustituir estas constantes en el polinomio queda:
P2 (x) = f [xl1] + (x - x,) f [xl1' xlI_¡] + (X-XII) (x-xn_¡) f [x"' xlI_1' xn_2]
De lo anterior se puede inducir que, en general, para un polinomio de grado n escrito
en la forma
PII (x) = ao + a¡ (X-XII) + a2 (x-x,,) (X-XII_¡) + ... + all (x-x,,) (X-XII_¡)'" (x-x¡), (5.37)
los coeficientes ao' al' a2, ... , a"están dados por
ueri-
ue el
cua- ao =f[xn]
al = f [Xn, XIl_1]
Segundo paso
Obtención del polinomio de Newton en diferencias finitas hacia atrás de grado n, apoya-
do en el punto XII'
Las ecuaciones' siguientes se pueden construir introduciendo el parámetro s definido
ahora por la expresión x = xll + sh.
X -xI! = sh
x - xn_1 = xll - xlI_¡ + sh = his+ 1)
x - xll_2
= xll - xll_2
+ sh = h(s+2)
desa-
pun-
do,
x - Xo = xI! - Xo + sh = his+n)
Al sustituir las ecuaciones anteriores y los coeficientes f [xl1] ,f [xI!' xn_¡] , ... ,f [x"' xn_l"" ,
xo] en la ecuación 5.37 en términos de diferencias finitas (Ec. 5.34), finalmente queda
re-
apo-
* Recuérdese que se considera aquí que la diferencia entre dos argumentos consecutivos cualesquiera es h.
Aproximación funcional e interpolación 347
Para simplificar se inicia con n =2 Yse asume que un polinomio de segundo grado en
general tiene la forma:
P2(X) =ao + al(x - x) + a2(x - x,,) (x - xll
_
l )
donde ao' al Ya2 son las constantes por determinar y x" y xn
_ 1 las abscisas de los puntos
(n) y (n-1), respectivamente.
Si x =xn' ao =pix,,) =f [x" ]
Si x =X,,_l' al = P2 (xll
_
l ) - P2 (x,) =f [x"' x
ll
_
l
]
Xn_l -Xn
S
. P2 (xn_ 2) - pzCX,,) - f [ x,!, X,,_¡] (X"_2- x,,)
1 X =Xn_2' a2 =
(XIl
_
2- X,,)(Xn
_
2- xll
_
l
)
al desarrollar algebraicamente el numerador y el denominador de a2 se llega a:
al sustituir estas constantes en el polinomio queda:
P2 (x) =f [XII] + (x - XII) f [xn, xlI
_
l ] + (x-xl!) (x-xn_ l) f [x"' xlI_i' xlI_2]
De lo anterior se puede inducir que, en general, para un polinomio de grado n escrito
en la forma
P" (x) = ao + al (x-x,) + a2 (x-x,,) (x-xn_ l) + ... + all (x-x,,) (X-X,,_l)·.· (X-Xl)' (5.37)
los coeficientes ao' al' a2, .. . , a" están dados por
ao = f[x,,]
al = f [X"' XIl_ 1]
Segundo paso
Obtención del polinomio de Newton en diferencias finitas hacia atrás de grado n, apoya-
do en el punto x".
Las ecuaciones' siguientes se pueden construir introduciendo el parámetro s definido
ahora por la expresión x =x" + sh.
X -xll
= sh
x - xn_ 1 = x" - x,,_l + sh = h(s+ 1)
x - xll
_
2 = xl! - xll
_
2 + sh = h(s+2)
x - X
o = xll
- X
o + sh = h(s+n)
Al sustituir las ecuaciones anteriores y los coeficientes f [xll
] ,f [x"' xn_ l] ,... ,f[x"' x,._l' ... ,
xo] en la ecuación 5.37 en términos de diferencias finitas (Ec. 5.34), finalmente queda
* Recuérdese que se cons¡dera aquí que la diferencia entre dos argumentos consecutivos cualesquiera es h.
H'"
348 Métodos numéricos aplicados a la ingeniería
s (s + 1)
P" (x" + sh) =f[x,J + s V f[x,,] + 2! V 2f[xn] + ...
+ s (s + 1) ... (s + (n - 1)) Vil f[x ]
, "n.
(5.38)
que es la ecuación de Newton en diferencias hacia atrás,
Para realizar los cálculos puede usar Matlab o la TI-92 Plus
x=[50 60 70 80 90 100J;
fx=[24.94 30.11 36.05 42.84 50.57 59.30J;
N=6; h=10; xint=64;
for i=1:N-1
T(i,1)=fx(i+1) -fx(i);
end
for j=2:N-1
for i=j :N-1
T(i,j) =T(i,j-1) -T(i-1,j-1);
end
end
T
s=(xint-x(l))/h;
fxint=fx(l)+s*T(l,l);
fprintf('Grado 1 P(%4.0f)=%6.2fn',xint,fxint)
fxint=fx (1) +s*T(l,l) +5* (s-1)/2*T(2,2);
fprintf( 'Grado 2 P(%4.Of)=%6.2fn' ,xint,fxint)
e5_7 ()
Prgm
{50, 60, 70, 80, 90, 100j-+x : C1rIO
{24.94, 30.11, 36.05, 42.84, 50.57, 59.30j-+y
6-+n : 10-+h : 64-+xint: newMat(n-l,n-l)-+t
For i,1,n-1
y [i +1J-y [iJ-+t [i, 1J
EndFor
for j,2,n-1
for i,j,n-l
t[i,j-1J-t[i-l,j-l]-+ t[i,jJ
EndFor
EndFor
setMode ("Display Digits", "FIX 2")
disp t: Pause
(xint-x [1]) /tr+ s
y[lJ+s*t[l,l] -+fxint
"P("&format (xint, "Eo") &")="-+d
d&format (fxint, "E?"} s" con grado 1"r+d
disp d
y [1] +s*t [1,1] +5* (5-1) /2*t [2,2J-+ fxint
"P("&format (xint, "Eo") s ") ="-+d
d&format (fxint, "tS") s " con grado 2"-+d
disp d
EndPrgm
348 Métodos numéricos aplicados a la ingeniería
s (s + 1)
PII (XII + sh) = f[xlI] + s Vf [xlI] + V 2f [x,J + ...
2!
+ s(s + I) ... (s + (n- l )) V"f[x ]
I 11
n .
que es la ecuación de Newton en diferencias hacia atrás,
Para realizar los cálculos puede usar Matlab o la TI-92 Plus
x = [50 60 70 80 90 100] ;
fx=[24 . 94 30 . 11 36. 05 42 . 84 50 . 57 59 . 30] ;
N=6; h=10; x i nt=64;
for i=1 : N- 1
T (i , 1 ) =f x (i+1 ) - fx (i );
end
f or j=2 : N-1
for i=j :N- 1
T (i, j ) =T (i , j - 1) - T (i-1 , j - 1 ) ;
end
end
T
s=(xint - x (l )) /h ;
f xint=fx (1 ) +s* T (1 , 1) ;
fprintf ( 'Grado 1 P (%4 . Of) =%6. 2fn ' , xin t , fxint )
fxint=fx (1 ) +s*T (1 , 1 ) +s* (s - l ) /Z¡'T (2 , 2) ;
f printf ( 'Grado 2 P (%4 . Of) =%6. 2fn ' , xint ,fxin t)
e5_7 ()
Prgm
(50 , 60 , 70 , 80 , 90, 100} ~x : C1rIO
(24 . 94 , 30 . 11 , 36 . 05 , 42 . 84 , 50 . 57, 59 . 30} ~y
6~n : 10~ h : 64~ xint : newMat (n -1 , n -1 )~ t
For i , 1 , n - 1
y[i+1] - y [i] ~ t [i , l ]
EndFor
f or j , 2 , n-1
for i , j , n-1
t[i , j -1] - t[i -1 , j - 1] ~ t [i , j]
EndFor
EndFor
setMode ( "Display Digi ts " , " FIX 2 ")
disp t : Pause
(xint-x [1]) /h~ s
y[l]+s*t[l , l] ~ fxint
" P( " &format (xint , " fO") &") ="~ d
d&format (fxint , " f3 " ) & " con grado l "~ d
disp d
y[l]+s*t [l , l]+s* (s - l) /2* t [2 , 2] ~ fxint
"P ("&format (xint , " fO") &") ="~ d
d&format (fxint , " f3 " ) & " con grado 2"~ d
disp d
EndPrgm
(5.38)
Aproximación funcional e interpolación 349
Ejemplo 5.8 Interpole el valor de la presión a una temperatura de 98°F, utilizando la tabla de presio-
nes de vapor del ejemplo 5.7 y el polinomio de Newton (5.38).
Solución Primero se construye la tabla de diferencias hacia atrás como sigue:
Punto xi f[xJ Vf[x¡] V2f[xJ V3f[xi] V4j [x¡]
O 50 24.94
Vf[x,] = 5.17
60 30.11 V2j [x2]=0.77
Vf[x2]= 5.94 V3f [x3]=0.08
2 70 36.05 V2f [x3]=0.85 V4j [x4]=0.0 1
Vf[x3]=6.79 V3f [x4
]=0.09
3 80 42.84 V2f [x4]=0.94 V4j [xs]=-O.03
Vf[x4] =7.73 V3f[xs]=0.06~
~
4 90 50.57 V2f[xS
]=1.00----
Vf[xs]=8.73 ~
5 100 59.30~
Si se usa un polinomio de primer grado, se tiene de la ecuación 5.38.
p(98) =f [xs] + s V f [xs]
donde:
x-x" 98 -100
s = --= =-0.2;
h 10
y con la tabla de diferencias finitas hacia atrás
p2(98) = 59.3 - 0.2(8.73) = 57.55
Si en cambio se usa un polinomio de segundo grado, se emplean los tres primeros térmi-
nos de la ecuación 5.38, con lo cual la aproximación queda:
s (s + 1)
P2 (98) =f[xs] + s V f[xs] + V2f[xs]
2!
= 59.3 - 0.2 (8.73) + -0.2 (-0.2 + 1) (1) = 57.67
2!
Para realizar los cálculos puede usar Matlab o la TI-92 Plus.
350 Métodos numéricos aplicados a la ingeniería
~
x= [50 60 70 80 90 100J;
fx=[24.94 30.11 36.05 42.84 50.57 59.30J;
N=6; h=10;
for i=1:N-1
T(i,1)=fx(i+1) -fx(i);
end
for j=2:N-1
for i=j :N-1
T(i,j)=T(i,j-1) -T(i-l,j-1);
end
end
T
Xint=98;
s=(Xint-x(N))/h;
px=fx(6) +s*T(5,1);
fprintf(' T(%6.2f)= %6.2f In',Xint,px)
px=fx (6)+s*T (5,1)+s* (s-l) /2*T (4,2) ;
fprintf(' T(%6.2f)= %6.2f In' ,Xint,px)
e5_8 ()
Prgm
{50, 60, 70, 80, 90, 100}--+x
{24.94, 30.11, 36.05, 42.84, 50.57, 59.30}--+y
6--+n: 10->h: newMat (n-Li ri-Lr+t:
For i,1,n-1
y[i +lJ-y[iJ--+t [i, 1J
EndFor
For j,2,n-1
For i,j,n-1
t [i, j-1J -t [i-1, j-1J--+t [i,j J
EndFor
EndFor
Disp t
98--+xint : (xint-x lnl ) /tr+s
y [nJ +s*t [n-1, l l=y irn:
Disp "y ("&format (xint, "fO") s") ="&format (yint, "f2")
y [nJ +s*t [n-l, 1J +s* (s-l) /2*t [n-1 ,2J--+yint
Disp ''y ("&format (xint, "Et)") s") ="&format (yint, "E?"}
Si se deseara interpolar el valor de la presión a una temperatura de 82°F, tendría que usar-
se la ecuación 5.38 pero apoyada en el punto n-l [punto (4) en este caso] ; esto es,
s (s + 1) ... (s + (n - 1) )
+ Vil f [xll
_
1
]
n!
s (s + 1) 2
P" (XII
_
1 + sh) = f [Xn_1] + sV f [Xn_¡] + 2! V f [Xn_¡] + ...
(5.39)
350 Métodos numéricos aplicados a la ingeniería
x= [50 60 70 80 90 100J;
fx=[24 . 94 30.11 36. 05 42 . 84 50.57 59 . 30J ;
N=6; h=10;
for i=1 : N- 1
T(i , 1)=fx(i+1) - fx(i) ;
end
for j=2:N- 1
for i=j : N- 1
T(i , j)=T(i , j - 1) - T(i - 1 , j-1 );
end
end
T
Xint=98 ;
s= (Xint-x(N))/h;
px=fx(6) +s*T(5 , 1);
fprintf (' T(%6.2f)= %6.2f In' , Xint ,px)
px=fx(6) +s*T(5,1) +s* (s-l) /2*T (4, 2);
fprintf(' T(%6.2f)= %6. 2f In' ,Xint,px)
e5_8 ()
Prgm
{50 , 60 , 70, 80 , 90, 100j--->x
{24.94, 30 . 11 , 36 . 05 , 42 . 84, 50 . 57, 59 . 30j--->y
6--->n : 10--->h : newMat (n - 1 , n - 1) ---> t
For i , 1 , n - 1
y[i +lJ - y[iJ --->t [i , 1J
EndFor
For j , 2 , n-1
For i,j,n-1
t [i , j - 1J - t [i - 1 , j - 1J ---> t [i , j J
EndFor
EndFor
Disp t
98--->xint : (xint-x [nJ) /h--->s
y [nJ +s*t [n-1, lJ--->yin t
Disp "y ("&format (xin t , "fO") &") ="&format (yint, "f2")
y [nJ +s*t [n - l, 1J +s* (s-l) /2*t [n-1 ,2J--->yint
Disp ''y ("&format (xin t , " fO") &") ="&format (yint, "f2")
Si se deseara interpolar el valor de la presión a una temperatura de 82 °F, tendría que usar-
se la ecuación 5.38 pero apoyada en el punto n-l [punto (4) en este caso] ; esto es,
s (s + 1) 2
P" (XII
_
1 + sh) = ![XIl
_,] + sV! [xll
_¡] + 2! V f [XII
_
1] + ...
(5.39)
s (s + 1) ... (s + (n - 1) )
+ V"! [xII
_, ]
n!
.39)
Aproximación funcional e interpolación 351
NOTA: Es importante hacer notar que las tablas de los ejemplos 5.7 (diferencias hacia delante) y 5.8
(diferencias hacia atrás) presentan los mismos valores numéricos aunque los operadores y
subíndices de sus argumentos no sean los mismos. Por lo anterior, el polinomio de Newton
en diferencias hacia delante y su tabla correspondiente pueden usarse a fin de interpolar en
puntos del final de la tabla con sólo invertir la numeración de los puntos en dicha tabla y los
subíndices de los argumentos de cada columna de diferencias finitas (se ilustra enseguida en
el Ejemplo 5.9).
También es útil observar que los valores de la tabla utilizados en las ecuaciones 5.35, 5.36
o alguna modificación de éstas, son los de las diagonales trazadas de arriba hacia abajo (véa-
se la tabla del ejemplo 5.7) y que los valores utilizados en 5.38, 5.39 o alguna modificación de
éstas, son los de las diagonales trazadas de abajo hacia arriba (ver tabla del ejemplo 5.8).
Se resuelve un ejemplo para ilustrar esto.
Ejemplo 5.9 Con la ecuación 5.35 y la tabla de diferencias hacia delante del ejemplo 5.7, interpole la
presión de vapor de 1-3 butadieno a la temperatura de 98°F, mediante un polinomio de
primer y segundo grado.
Solución Invertidos la numeración de los puntos en la tabla mencionada y los subíndices de los ar-
gumentos de cada columna, la tabla toma el aspecto:
Punto Xi f[x¡] Vf[xi] V2f[xi] V3f[Xi] V4j [X)
5 50 24.94
Vf[x4] = 5.17
4 60 30.11 V2f [x3]=0.77
Vf [x3]= 5.94 V3f [x2]=0.08
3 70 36.05 V2f [x2]=0.85 V:¡ [x ¡]=O.O1
Vf [x2]=6.79 V3f[x¡]=0.09
2 80 42.84 V2f [x¡]=0.94 V:¡ [xo]=-0.03
Vf[x¡]=7.73 V3f [xo]=0.06
1 90 50.57 V2f[xO]=1.00
Vf [xo]=8.73
O 100 59.30
Observe que todos los valores numéricos conservan su posición en la tabla.
Se emplea la ecuación 5.35 con x = 98, xo = 100 Y h = 10, de donde:
x-xos = ---
h
98 - 100
= -0.2
10
al emplear un polinomio de primer grado se tiene:
p (98) = 59.30 + (-0.2) (8.73) = 57.55
En cambio, con uno de segundo grado:
(-0.2) (-0.2 + 1)
P2 (98) = 59.30 + (-0.2) (8.73) + 1 = 57.63
2!
Como se puede observar, son los mismos resultados que se obtuvieron en el ejemplo 5.8.
En el CD encontrará el PROGRAMA 5.8 de Interpolación Numérica. Con este programa usted
puede proporcionar la función como una tabla de puntos e interpolar para algún valor desea-
do. Podrá también observar gráficamente los puntos dados, la función interpolante y el valor
a interpolar
352 Métodos numérico s aplicados a la ingeniería
5.6 Estimación de errores en la aproximación
En general, al aproximar una función por un polinomio de grado n, se comete un error; por
ejemplo, cuando se utiliza un polinomio de primer grado, se remplaza la función verdade-
ra en un intervalo con una línea recta (Fig. 5.4). En términos matemáticos, la función se
podría representar exactamente como:
(5.40)
Donde R¡(x) es el error cometido al aproximar linealmente la funciónf(x) y p¡(x) es, por
ejemplo, el polinomio de primer grado en diferencias divididas.
Al despejar R¡(x) de la ecuación 5.40 y tomando como factor común (x - xo) queda:
R¡(x) =f(x) -f[xo] - (x-xo)f[xo'x¡]
(
f[x] - f[xo] )
= (x - xo) - f [ xo,x,]
x-xo
= (x- xo) (j [xo,x] - f [xÜ'x¡D
al multiplicar y dividir por (x-x.) se obtiene:
R,(x) = (x-xo) (x-x¡)f[x, xo' x,]
dondef[x,xo'x,] es la segunda diferencia dividida respecto a los argumentos xo' x, y x. Re-
sulta imposible calcular exactamentef[x, xo' x¡], ya que no se conoce laf(x) necesaria pa-
ra su evaluación. Sin embargo, si se tiene otro valor de f (x), sea f (x2
) (y si la segunda
diferenciaf[x, XÜ' xl] no varía significativamente en el intervalo donde están los puntos xó'
x, y x2
), entonces R¡(x) se aproxima de la siguiente manera:
R, (x) '" (x-xo) (x-x,) f[xo' x" x2]
de tal modo que al sustituirlo en la ecuación original quede:
f(x) ---------
f(xl)
--- -'.
--,
,-,,
: RI(x),, ,
, ,
,
r
r
r ,
'J(x),
, ,,,
" f(xo)
"
", ', ,
,
,
,
I
I
I
I
,
I
,
,
,
Figura 5.4 Xo x XI X
;por
de-
n se
.40)
, por
da:
Re-
apa-
nda
(r)
,,,
Aproximación funcional e interpolación 353
Observe que el lado derecho de esta expresión es el poli nomio de segundo grado en dife-
rencias divididas. Como se había intuido, esto confirma que -en general- se aproxima
mejor la funciónfix) con un polinomio de grado dos que con uno de primer grado.
Por otro lado, si se aproxima a funciónf(x) con un polinomio de segundo grado P2(x),
se espera que el error Rix) sea en general menor. La función expresada en estos términos
queda:
f(x) = pix) + R2(x) =f[xo] + (x-xo)f[xo'x¡] + (x-xo) (x-x¡)f[xo' xl' x2] + R2(x)
de donde Rix) puede despejarse:
Rix) = f (x) - f[ Xo ] - (x - xo)f [xo' x¡] - (x - xo) (x - x¡) f[ XO'xl' x2]
y como en el caso de un polinomio de primer grado, se demuestra * que el término del error
para la aproximación polinomial de segundo grado es:
Rix) = (x-xo) (x-x¡) (x-x2)f[xo' xl' x2]
De igual modo quef[ x, XO'x¡] en el caso linealf[x, xo' x¡, x2] no se puede determinar con
exactitud; sin embargo, si se tiene un punto adicional (x3,f(x3)), cabe aproximarf(x, xo, xl'
x2
] con:
f[x, xo' xl' x2] ""f[xo, xI>x2' x3],
que sustituida proporciona una aproximación a R2(x):
Rix) "" (x-xo) (x-x¡) (x-x2)f[ xo, xI>x2, x3
].
Si se continúa este proceso puede establecerse por inducción que:
f (x) = p,,(x) + RI/(x),
donde Pn (x) es el polinomio de grado n en diferencias divididas que aproxima la función
tabulada, y Rn (x) es el término correspondiente del error. Esto es:
P,,(x) = f [xo] + (x-xo) f [xo' x¡] + ... + (x-xo) (x-x.) ... (x-xl1_¡) f [xo"" , x/.]
y
o
Rn (x) = [fr (x -x) 1 f[x, xo' X¡ ... , Xn]
1=0
(5.41)
en dondef[ x, Xo' Xl"" , x,,] puede aproximarse con un punto adicional (x/1+1'f(x,,+¡)) así:
f[x, xo, xl"'" xn] ""f[xo' xi' x2'···' X/l' xn+¡]
entonces R,,(x) queda como:
Rn (x) "" [;~ (x - x) 1 f [XO'Xl' x2··· , »; xl1+¡]
(5.42)
La ecuación
f(x) = p,,(x) + RI1(x)
es conocida como la fórmula fundamental de Newton en diferencias divididas. Al ana-
lizar el factor productoria (producto acumulado)
n
I1 (x -x)
;=0
'Véaese el problema 5.24.
Aproximación funcional e interpolación 353
Observe que el lado derecho de esta expresión es el polinomio de segundo grado en dife-
rencias divididas. Como se había intuido, esto confirma que -en general- se aproxima
mejor la funciónj(x) con un polinomio de grado dos que con uno de primer grado.
Por otro lado, si se aproxima a funciónf(x) con un polinomio de segundo grado P2(x),
se espera que el error R2(x) sea en general menor. La función expresada en estos términos
queda:
f (x) =pix) + R2(x) =f[xo] + (x-xo)f [xÜ'x l] + (X-Xo) (X-Xl) f[xo' Xi' x2] + R2(x)
de donde Rix) puede despejarse:
Rix) = f (x) - f[ Xo ] - (x - xo)f [xo, Xl] - (X - xo) (X - xl)f [xo' Xi' x2]
y como en el caso de un polinomio de primer grado, se demuestra" que el término del error
para la aproximación polinomial de segundo grado es:
R2(x) = (x-xo) (X-Xl) (x-x2)f[xo' Xi' x2]
De igual modo quef[ x, XÜ' XI] en el caso linealf[x, xo' XI' x2] no se puede determinar con
exactitud; sin embargo, si se tiene un punto adicional (x3' f (x3)), cabe aproximarf [x, xo, xi'
x2
] con:
f[x, xo' xi' x2] "" f[xo, Xl' X2' x3],
que sustituida proporciona una aproximación a R2(x):
Rix) "" (x-xo) (X-XI) (x-x2)./[ xo' xi' x2' x3].
Si se continúa este proceso puede establecerse por inducción que:
f (x) = Pn(x) + Rn(x),
donde Pn (x) es el polinomio de grado n en diferencias divididas que aproxima la función
tabulada, y R" (x) es el término correspondiente del error. Esto es:
PIl(x) = f [xo] + (x- xo) f [xo, xtl + ... + (x-xo) (X-X I) ... (x-xn_ l) f [xo"" , x/J
y
o
RIl (x) =[[1 (x - x) 1f [x, Xo' Xl '" , Xn]
1=0
(5.41)
en dondef[ x, xo' xi"" , xn] puede aproximarse con un punto adicional (x/1+i' f(xn+ l)) así:
f[x, xo' x p "" x,,] ""f[xo' xi' x2,·.. , xn' xn+ l]
entonces Rn(x) queda como:
R" (x) "" [ ;~ (x - x) 1f [xo, XI' x2·.. , XII, xl1 + l ]
La ecuación
f(x) = PII(x) + Rn(x)
(5.42)
es conocida como la fórmula fundamental de Newton en diferencias divididas. Al ana-
lizar el factor productoria (producto acumulado)
"I1 (x -x)
;=0
• Véaese el problema 5.24.
354 Métodos numéricos aplicados a la ingeniería
de Rn(x), se observa que para disminuido (y, por ende, disminuir el error RIl(x) ) deben
usarse argumentos xi lo más cercanos posible al valor por interpolar x (regla que se había
seguido por intuición y que ahora se confirma matemáticamente). También de esta produc-
toria se infiere que en general en una extrapolación (x fuera del intervalo de las Xi usadas)
el error es mayor que en una interpolación. Puede decirse también que si bien se espera
una mejor aproximación al aumentar el grado n del polinomio P; (x), es cierto que el va-
lor del factor productoria aumenta al incrementarse n, por lo que debe existir un grado óp-
timo para el polinomio que se usará en el proceso de interpolación. Por último, en términos
generales es imposible determinar el valor exacto de Rn(x); a lo más que se puede llegar
es determinar el intervalo en que reside el error.
Los ejemplos que se dan a continuación ilustran estos comentarios.
Ejemplo 5.10 Suponga que tiene la tabla siguiente de la función cos x.
Puntos o 1 2 3
x (grados)
f(x) = cos x
o 50 60 90
1.0000 0.6400 0.5000 0.0000
y desea interpolar el valor de la función en x = 10°.
Solución Al interpolar linealmente con los puntos (O) y (1) queda:
P (x) =f[ x¡] + (X-Xl) f[x l'x2]
Al sustituir valores da pelO) = 0.9280.
La interpolación con un polinomio de segundo grado y los puntos (O), (1) y (2) da:
pix) = f[xo] + (x-xo)f [xo'x¡] + (x-xo)(x-x¡) f[x(Y xl' x2]
Al sustituir valores resulta pilO) = 0.9845.
Se interpola con un polinomio de tercer grado (usando los cuatro puntos) y queda
P3(x) = f[xo] + (x-xo)f [xO'xI] + (x-xo)(x-x¡) f[xo' xl' x2]
+ (x-xo) (x-x¡) (x-x2)f [xo' xl' x2' x3]
Al sustituir valores da P3(10) = 0.9764.
El valor correcto de cos 10° hasta la cuarta cifra significativa es 0.9848, así que el error
en por ciento para el primer grado es 5.77, para el segundo 0.03, y para el tercero 0.85
El grado óptimo del polinomio de aproximación para este caso particular es 2 (usan-
do los puntos más cercanos al valor por interpolar: (O) (1) y (2). Si se usaran los puntos
(O), (1) y (3) el error sería 1.80%, como puede verificar el lector.
Ejemplo 5.11 Con la ecuación 5.41 encuentre una cota inferior del error de interpolación Rn(x) para x =
1.5 cuando f (x) = in x, n=3, xo=l, x¡=4/3, x2=5/3 Yx3 = 2.
Solución La ecuación 5.41 con n = 3 queda:
354 Métodos numéricos aplicados a la ingeniería
de Rn(x), se observa que para disminuirlo (y, por ende, disminuir el error R,,(x) ) deben
usarse argumentos xi lo más cercanos posible al valor por interpolar x (regla que se había
seguido por intuición y que ahora se confirma matemáticamente). También de esta produc-
toria se infiere que en general en una extrapolación (x fuera del intervalo de las Xi usadas)
el error es mayor que en una interpolación. Puede decirse también que si bien se espera
una mejor aproximación al aumentar el grado n del polinomio Pn (x), es cierto que el va-
lor del factor productoria aumenta al incrementarse n, por lo que debe existir un grado óp-
timo para el polinomio que se usará en el proceso de interpolación. Por último, en términos
generales es imposible determinar el valor exacto de Rn(x); a lo más que se puede llegar
es determinar el intervalo en que reside el error.
Los ejemplos que se dan a continuación ilustran estos comentarios.
Ejemplo 5.10 Suponga que tiene la tabla siguiente de la función cos x.
Puntos
x (grados)
f(x) =cos x
o 1 2 3
o 50 60 90
1.0000 0.6400 0.5000 0.0000
y desea interpolar el valor de la función en x = 10°.
Solución Al interpolar linealmente con los puntos (O) y (1) queda:
P (x) = f[ x¡] + (X-Xl) f[xl'x21
Al sustituir valores da pelO) =0.9280.
La interpolación con un polinomio de segundo grado y los puntos (O), (1) Y(2) da:
pix) = f[xol + (x-xo)f [xo'x¡] + (x-xO)(x-xI ) f[xo' xI' xJ
Al sustituir valores resulta pilO) = 0.9845.
Se interpola con un polinomio de tercer grado (usando los cuatro puntos) y queda
P3(x) = f[xol + (x-xo)f [xo,x¡l + (x-xo)(x-x¡) f[xo' xI' x21
+ (x-xo) (X-XI) (x-x2)f[xO' xI' x2' x31
Al sustituir valores da pilO) = 0.9764.
El valor correcto de cos 10° hasta la cuarta cifra significativa es 0.9848, así que el error
en por ciento para el primer grado es 5.77, para el segundo 0.03, y para el tercero 0.85
El grado óptimo del polinomio de aproximación para este caso particular es 2 (usan-
do los puntos más cercanos al valor por interpolar: (O) (1) y (2). Si se usaran los puntos
(O), (1) Y(3) el error sería 1.80%, como puede verificar el lector.
Ejemplo 5.11 Con la ecuación 5.41 encuentre una cota inferior del error de interpolación Rn(x) para X =
1.5 cuandof (x) = in x, n=3, xo=l, x ¡=4/3, x2=5/3 Yx3 =2.
Solución La ecuación 5.41 con n =3 queda:
gar
a:
rror
au-
tos
Aproximación funcional e interpolación 355
donde el factor productoria puede evaluarse directamente como sigue
3
TI (x - x) = (1.5-1) (1.5--4/3) (1.5-5/3) (1.5-2) = 0.00694
;=0 I
En cambio, el factor f [x, xo' xi' x2' x3] es -como se ha dicho antes- imposible de deter-
minar, pues no se cuenta con el valor de f (x) (necesario para su evaluación). Sin embar-
go, el valor de f [x, xo' XI' x2' x3] está estrechamente relacionado con la cuarta deri vada de
f (x), como lo expresa el siguiente teorema.
Teorema *
Seaf (x) una función de valor real, definida en [a,b] y k veces diferenciable en (a,b). Si xo'
XI"" ,xkson k+1 puntos distintos en [a,b], entonces existe ~ e (a,b) tal que:
f(k) (O
f[xo' XI"" ,xk] = ---
k!
con ¡; e (min x max x.), O :s; i :s; n~ 1, I
Al utilizar esta información se tiene, en general,
f(II+I)(~) 11
RI1 (x) = TI (x - x¡)
(n + 1)! ;=0
con ~ e (mín Xi, máx x¡), O ~ i ~ n
y para n = 3
Se deriva sucesivamente f (x) cuatro veces y se tiene:
f' (x) = l/x;!" (x) = -l/x2; f /" (x) = 2/x3,- fIV (x) = -6/~
Comoj'I" (x) es creciente en el intervalo de interés (1, 2) (al aumentar x en éste se incremen-
tafIV (x), alcanza su valor mínimo en x = 1 y, por tanto, la cota inferior buscada está da-
da por:
fIV (1) 6
0.00694 -- = 0.00694 -- = -0.00174,
4! (1)44!
es decir:
R3 (1.5) ?: -0.00174
. Este valor indica que el error de interpolación cuando x = 1.5 es mayor o igual que
-0.00174. Sin embargo, para conocer el intervalo donde reside el error, es necesario cono-
cer la cota superior, que se calcula en el ejemplo siguiente.
Ejemplo 5.12 Calcule la cota superior del error R3(x) del ejemplo anterior y confirme que al utilizar
diferencias divididas para interpolar en x = 1.5, el error obtenido está en el intervalo cu-
yos extremos son las cotas obtenidas. Use 0.40547 como valor verdadero en ln 1.5.
Como se vio, la función -6/~ es creciente en (1, 2); por tanto alcanza su valor máximo en
x = 2 Y la cota superior está dada por:
Solución
• Para su demostración véase Conte, S.D. y De Boor C. Análisis numérico. 2a
. Ed., MC Graw-Hill (1967), pp.
226-227.
Aproximación funcional e interpolación 355
donde el factor productoria puede evaluarse directamente como sigue
3
TI (x - x) = (1.5-1) (1.5--4/3) (1.5-5/3) (1.5-2) = 0.00694
;=0 I
En cambio, el factor f [x, xo' xl' x2' x3] es -como se ha dicho antes- imposible de deter-
minar, pues no se cuenta con el valor de f (x) (necesario para su evaluación). Sin embar-
go, el valor def [x, xo' xI' x2' x3] está estrechamente relacionado con la cuarta derivada de
f (x), como lo expresa el siguiente teorema.
Teorema *
Seaf(x) una función de valor real, definida en [a,b] y k veces diferenciable en (a,b). Si xo'
xI"'" xkson k+1 puntos distintos en [a,b] , entonces existe e; 10 (a,b) tal que:
f (k) (e;)
f[xo' xl"" ,xk] =---
k!
con e; 10 (min x max x), O:s; i :s; n1, I
Al utilizar esta información se tiene, en general,
j(II+I)(e;) 11
Rn (x) = TI (x - x¡)
(n + 1)! ;=0
con e; 10 (mÍn x máx x), O~ i ~ n1, I
y para n = 3
Se deriva sucesivamentef (x) cuatro veces y se tiene:
f' (x) = l/x;f" (x) = -l/x2; 1''' (x) = 2/x3;fTV (x) =-6/r
ComofIV (x) es creciente en el intervalo de interés (1, 2) (al aumentar x en éste se incremen-
tafTV (x), alcanza su valor mínimo en x = 1 y, por tanto, la cota inferior buscada está da-
da por:
fIV (1) 6
0.00694 - - = 0.00694 - - = -0.00174,
4! (1)44!
es decir:
R3 (1.5) ?: -0.00174
Este valor indica que el error de interpolación cuando x = 1.5 es mayor o igual que
-0.00174. Sin embargo, para conocer el intervalo donde reside el error, es necesario cono-
cer la cota superior, que se calcula en el ejemplo siguiente.
Ejemplo 5.12 Calcule la cota superior del error R3(x) del ejemplo anterior y confirme que al utilizar
diferencias divididas para interpolar en x = 1.5, el error obtenido está en el intervalo cu-
yos extremos son las cotas obtenidas. Use 0.40547 como valor verdadero en [n 1.5.
Solución Como se vio, la función - 6/r es creciente en (1, 2); por tanto alcanza su valor máximo en
x = 2 Yla cota superior está dada por:
• Para su demostración véase Conte, S.D. y De Boor C. Análisis numérico. 2a
. Ed., MC Graw-Hill (1967), pp.
226-227.
356 Métodos numéricos aplicados a la ingeniería
0.00694
-6
= -0.00011,
24
4!
es decir:
R3 (1.5):S; -0.00011
Por medio de la interpolación con diferencias divididas con un polinomio de tercer grado
se obtiene:
P3 (1.5) = f[xo] + (1.5-xo)f [xo'x¡] + (1.5-xo)(1.5-x¡) f[xO
'x¡,x2
]
+ (1.5-xo) (1.5-x) (1.5-x2
) f[xO
,xl'x2
x3
]
= 0.40583
y el error es In 1.5 - P3 (1.5) = -0.00036 que, efectivamente, está en el intervalo
[-0.00174, -0.00011] .
1", ,.
5.7 Aproximación polinominal segmentaria
En alguno de los casos previos pudo pensarse en aproximar f (x) por medio de un polino-
mio de grado "alto", 10 o 20. Esto pudiera ser por diversas razones: porque se quiere ma-
yor exactitud; por manejar un solo polinomio que sirva para interpolar en cualquier punto
del intervalo [a, b], etcétera.
Sin embargo, hay serias objeciones al empleo de la aproximación de grado "alto"; la
primera es que los cálculos para obtener Pn(x) son mayores, hay que verificar más cálcu-
los para evaluar P; (x) y, lo peor del caso, es que los resultados son poco confiables como
puede verse en el ejemplo 5.10.
Si bien lo anterior es grave, lo es más que el error de interpolación aumenta en lugar
de disminuir (véase Seco 5.6 y ejemplo 5.3). Para abundar un poco más en la discusión de
la sección 5.6, se retornará el factor productoria de la ecuación 5.41.
n
Il (x - x.),
;=0 '
donde, si n es muy grande, los factores (x-x), son numerosos y, si su magnitud es mayor
de 1, evidentemente su influencia será aumentar el error Rn(x).
Para disminuir Rn(x), atendiendo el factor productoria exclusivamente, es menester
que los factores (x-x) sean en su mayoría menores de 1 en magnitud, lo cual puede lograr-
se tomando intervalos pequeños alrededor de X. Como el intervalo sobre el cual se va a
aproximarf(x) generalmente se da de antemano, lo anterior se lograr dividiendo dicho in-
tervalo en subintervalos suficientemente pequeños y aproximar f (x) en cada subintervalo
por medio de un polinomio adecuado; por ejemplo, mediante una línea recta en cada su-
bintervalo (véase Fig. 5.5)
Esto da como aproximación de f (x) una línea quebrada o segmentos de líneas rectas
-que se llamarán g) (x)- cuyos puntos de quiebre son xi' x2
, ... ,xn
_¡. Las funcionesf(x)
y g¡ (x) coinciden en xo' xl' x2, ... , x" Y el error en cualquier punto x de [xo' xll
] queda aco-
tado, de acuerdo con el teorema del ejemplo 5.11 aplicado a cada subintervalo [Xi' xi
+¡] con
i = 0,1,2, ... ,n-l, por -
f"@
R¡ (x) = If(x) -g¡ (x) 1 :s; máx 1--,-1 m~x 1(x - x) (x -xi+) 1a:S; s:S; b 2. 1
(5.43)
de
lín
f
356 Métodos numéricos aplicados a la ingeniería
-6
0.00694 = -0.00011,
24 4!
es decir:
R3 (1.5):S; -0.00011
Por medio de la interpolación con diferencias divididas con un polinomio de tercer grado
se obtiene:
P3 (1.5) = f[xo] + (1.5-xo)f [xo,x¡] + (1.5-xo)(1.5-x¡) f[xO'x¡,x2]
+ (1.5-xo) (1.5-xl) (1.5-x2) f[xO,xl'x2 x3]
= 0.40583
y el error es In 1.5 - P3 (1.5) = -0.00036 que, efectivamente, está en el intervalo
[-0.00174, -0.00011] .
5.7 Aproximación polinominal segmentaria
En alguno de los casos previos pudo pensarse en aproximarf (x) por medio de un polino-
mio de grado "alto", 10 o 20. Esto pudiera ser por diversas razones: porque se quiere ma-
yor exactitud; por manejar un solo polinomio que sirva para interpolar en cualquier punto
del intervalo [a, b], etcétera.
Sin embargo, hay serias objeciones al empleo de la aproximación de grado "alto"; la
primera es que los cálculos para obtener Pn(x) son mayores, hay que verificar más cálcu-
los para evaluar Pn
(x) y, lo peor del caso, es que los resultados son poco confiables como
puede verse en el ejemplo 5.10.
Si bien lo anterior es grave, lo es más que el error de interpolación aumenta en lugar
de disminuir (véase Seco 5.6 y ejemplo 5.3). Para abundar un poco más en la discusión de
la sección 5.6, se retomará el factor productoria de la ecuación 5.41.
n
11 (x - x),
i=O '
donde, si n es muy grande, los factores (x-x), son numerosos y, si su magnitud es mayor
de 1, evidentemente su influencia será aumentar el error Rn(x).
Para disminuir Rn(x), atendiendo el factor productoria exclusivamente, es menester
que los factores (x-x) sean en su mayoría menores de 1 en magnitud, lo cual puede lograr-
se tomando intervalos pequeños alrededor de X. Como el intervalo sobre el cual se va a
aproximarf(x) generalmente se da de antemano, lo anterior se lograr dividiendo dicho in-
tervalo en subintervalos suficientemente pequeños y aproximarf (x) en cada subintervalo
por medio de un polinomio adecuado; por ejemplo, mediante una línea recta en cada su-
bintervalo (véase Fig. 5.5)
Esto da como aproximación de f (x) una línea quebrada o segmentos de líneas rectas
-que se llamarán gl (x)- cuyos puntos de quiebre son xl' x2, ... , xn
_¡. Las funcionesf(x)
y g¡ (x) coinciden en xo' xl' x2, ... , xn
y el error en cualquier punto x de [xo, xn
] queda aco-
tado, de acuerdo con el teorema del ejemplo 5.11 aplicado a cada subintervalo [Xi' xi+¡] con
i=0,1,2, ... ,n-l,por -
f"@
R¡ (x) = If(x) -g¡ (x) 1:s; máx 1--,-1m~x 1(x - x) (x -xi+¡) 1a:S; s:S; b 2. 1
(5.43)
Aproximación funcional e interpolación 357
Sif(x) fuera diferenciable dos veces en [xo' XII]' el valor máximo de I (x-x) (X-X¡+I) I
para x E [Xi' X¡+! ] se dan en x = (x¡+x¡+ 1)/2, el punto medio de [x¡,xi+ 1]; de modo que
máx I (x - x¡) (x - x¡+ 1)
1=
máx
x¡ + x¡+!
- x¡) (
x¡ + x¡+!
-X¡+I)
1i i 2 2
do
máx
1
x¡+! -Xi X¡-X¡+I
1i 2 2
(x¡+! -x;>2 &2
máx = máx 1
1 4 i 4
or
ter
ar-
aa
m-
alo
su-
las
(x)
co-
on
43)
Figura 5.5
Aproximación
de f (x) por una
línea quebrada.
Figura 5.6
Aproximación
de f(x) por
parábolas. XIl
358 Métodos numéricos aplicados a la ingeniería
Al sustituir en la ecuación 5.43
I I I
f" (~)I ,óx2
R, (x) = f(x) -g, (x) < máx máx -,-
a < ~ < b 2! 1 4
(5.44)
Donde se aprecia que el error R,(x) puede reducirse tanto como se quiera, haciendo Az, pe-
queño para toda i; por ejemplo, tomando un número suficientemente grande de subinter-
valos en [a,b ], o bien empleando polinomios de grado dos (véase Fig. 5.6) para cada
subintervalo [Xi' xi+d; de esta última manera se consiguen segmentos polinomiales de gra-
do dos g2(x) cuyo término del error (5.44) correspondiente tendrá,óxp en lugar de ,óx? Es-
to da una disminución del error respecto al empleo de líneas rectas. El empleo de
polinomios de grado 3 en cada subintervalo [Xi' Xi+,] es de las técnicas más difundidas y
se discute en detalle enseguida.
APROXIMACiÓN CÚBICA SEGMENTARIA DE HERMITE
Se parte del hecho que se tiene una funciónf(x) de valor real, dada en forma tabular o ana-
lítica en el inetervalo [a,b] , con
a = Xo < x, < x2 < ... <X" = b (5.45)
Se quiere construir una función gix) con segmentos de polinomios cúbicos' p¡(x) en cada
[xi' x¡+,] con i = 0, 1,2, ... ,n-l, tal que
g3(x¡) =f(x¡) con i = = 0,1,2, ... ,n,
de donde:
p¡(x¡) =f(x¡)yP¡(x¡+,) =f(x¡+I)parai=O, 1,... ,n-l
y esta última implica que:
(5.46)
i = 1,2, ... ,n
de modo que gix) es continua en [a.b] y tiene los puntos interiores xi' x2, ... , x,,_, como
puntos de quiebre o donde g3 (x) no es diferenciable en general.
De acuerdo con el álgebra, se sabe que para que un polinomio cúbico quede determi-
nado en forma única se requieren cuatro puntos. Hasta ahora, cada uno de los segmentos
cúbicos Pi(X) tiene que pasar por (Xi' f (x)) y (xi+l' f(xi+1)), de modo que quedan dos pun-
tos o condiciones que se pueden establecer para definir en forma única p¡(x).
La elección de estas dos condiciones faltantes depende, por ejemplo, de la utilización
que se vaya a dar a g3(x), de f(x) y del contexto donde se trabaje (de la ingeniería o mate-
mático).
Por ejemplo, desde el punto de vista de la ingeniería, sería deseable que g3(x) fuera di-
ferenciable en los puntos interiores: xi' x2, ... , x,,_,; es decir, que g3(x) fuese suave en [a,b],
en lugar de tener picos o puntos de quiebre. Esto se daría con dos condiciones como la
5.46, pero en derivadas; así
i = 0,1, ... , n-l (5.47)
previsto que f' (x) fuese conocida o aproximada en cada uno de los puntos XC' x]> ... ,XII.
Con esto quedan cubiertas las dos condiciones faltantes .
• En lo que sigue de esta sección, el subíndice indica el subintervalo, no el grado del polinomio como en otras
ocasiones.
358 Métodos numéricos aplicados a la ingeniería
Al sustituir en la ecuación 5.43
I I I
f" (~) I Lix2
R, (x) = f(x) -g, (x) < máx m~x _,_
a < ~ < b 2! 1 4
(5.44)
Donde se aprecia que el error R,(x) puede reducirse tanto como se quiera, haciendo Lix¡ pe-
queño para toda i; por ejemplo, tomando un número suficientemente grande de subinter-
valos en [a,b ], o bien empleando polinomios de grado dos (véase Fig. 5.6) para cada
subintervalo [Xi' xi+,]; de esta última manera se consiguen segmentos polinomiales de gra-
do dos g2(x) cuyo término del error (5.44) correspondiente tendrá Lix? en lugar de Lix? Es-
to da una disminución del error respecto al empleo de líneas rectas. El empleo de
polinomios de grado 3 en cada subintervalo [Xi' xi+,] es de las técnicas más difundidas y
se discute en detalle enseguida.
APROXIMACiÓN CÚBICA SEGMENTARlA DE HERMITE
Se parte del hecho que se tiene una funciónf(x) de valor real, dada en forma tabular o ana-
lítica en el inetervalo [a,b] , con
a =Xo< x, < x2 < ... <XII =b (5.45)
Se quiere construir una función g3(x) con segmentos de polinomios cúbicos' p¡(x) en cada
[xi' x¡+ ,] con i = O, 1,2,... , n-l, tal que
g3(x¡) =f(x¡) con i = = 0,1,2,... , n,
de donde:
p;Cx¡) =f (x¡)yP¡(x¡+,) = f(x¡+I)parai=O, 1,... ,n-l
y esta última implica que:
i = 1,2,.. . , n
(5.46)
de modo que gix) es continua en [a.b] y tiene los puntos interiores xi' x2, ... , x,,_, como
puntos de quiebre o donde g3 (x) no es diferenciable en general.
De acuerdo con el álgebra, se sabe que para que un polinomio cúbico quede determi-
nado en forma única se requieren cuatro puntos. Hasta ahora, cada uno de los segmentos
cúbicos p¡(x) tiene que pasar por (x¡, f (x)) y (x¡+l' f(x¡+l))' de modo que quedan dos pun-
tos o condiciones que se pueden establecer para definir en forma única p¡(x).
La elección de estas dos condiciones faltantes depende, por ejemplo, de la utilización
que se vaya a dar a g3(x), def(x) y del contexto donde se trabaje (de la ingeniería o mate-
mático).
Por ejemplo, desde el punto de vista de la ingeniería, sería deseable que g3(x) fuera di-
ferenciable en los puntos interiores: xi' x2,... , xn_ , ; es decir, que gix) fuese suave en [a,b],
en lugar de tener picos o puntos de quiebre. Esto se daría con dos condiciones como la
5.46, pero en derivadas; así
i = 0,1,... , n-l (5.47)
previsto quef' (x) fuese conocida o aproximada en cada uno de los puntos xo' xl' ... , XII.
Con esto quedan cubiertas las dos condiciones faltantes.
• En lo que sigue de esta sección, el subíndice indica el subintervalo, no el grado del polinomio como en otras
ocasiones.
5.44)
gra-
.2 Es-
o de
das y
ana-
5.45)
cada
5.46)
como
ernu-
entos
pun-
ación
mate-
ra di-
[a,b],
mola
Aproximación funcional e interpolación 359
De la ecuación 5.47 se infiere
p' ¡-l (x) = p' ¡(x) i = 1,2, ... , n (5.48)
5.47)
En este punto cabe empezar a hablar del cálculo de los polinomios p;Cx); por tanto, como
paso siguiente se aproxima p¡(x), i= 1, 2, ... , n con diferencias divididas así.
p¡ (x) = f (x) + f [x¡,x¡] (x-x) + f [Xi' Xi' x¡+d (x-x?
(5.49)
como:
y al sustituir (x-x¡+l) con (x-x) + (X¡-x¡+l) y agrupar se tiene
P¡ (x) = f (x) + f' (x)(x-x)
+(f[x¡, Xi' x¡+ll - f[x¡, Xi' X¡+l,x+ll Ll.x) (x-x? + f[x¡, Xi' x¡+I,XI+ll (x-xy
Para facilidad de manejo en su programación, la ecuación 5.50 se escribe:
P·(x) = cl
. + c2
. (x-x.) + c3
.(x-x.? + c4· (x-x.)3l ,1 ,1 l ,1 1 ,1 l
(5.50)
(5.51)
con
C2,i = f' (x),
y
f' (x¡+I)-2f[x¡,X¡+I] + C2,¡
&2
1
f' (X¡+l) - 2f[x¡, x¡+d+ f' (x)
(X¡+l -x?
(5.52)
Ejemplo 5.13 Resuelva el problema del ejemplo 5.3 usando aproximación segmentaria, con polino-
mios de grado 2, 4, 6, ... , 16 Yestime, como antes, el error máximo en forma práctica.
Solución En el CD se encuentra el PROGRAMA 5.2 que realiza los cálculos solicitados
Aproximación fu ncional e interpolación 359
De la ecuación 5.47 se infiere
P'¡-l (x) = p'¡ (x) i = 1,2,... , n (5.48)
En este punto cabe empezar a hablar del cákulo de los polinomios p¡(x); !JOf tanto, como
paso siguiente se aproxima P¡(x), i = 1, 2, ... , n con diferencias divididas así.
p¡ (x) = f(x) + f[ x¡,x¡] (x- x) + f[x¡, Xi' x¡+d (x-x?
como:
f [ ] 1, f (x¡ + tu) - f (x) =f'(x.)
x¡,x¡ = 1m
Ar~O tu '
y al sustituir (x-X¡+l) con (x-x) + (X¡-x¡+l) y agrupar se tiene
Pi (x) = f (x) + f' (x)(x-x)
+(f[x¡, Xi' X¡+l] - f[x¡, Xi' X¡+I .X+ l] tu) (x-x? + f[x¡, Xi' x¡+I.X l + l ] (x-xy
Para facilidad de manejo en su programación, la ecuación 5.50 se escribe:
con
y
P·(x) = e l . + e2 . (x-x.) + e 3 .(x-x? + e4 · (x-x.)31, ,1 , / 1 ,1 l ,l l
f' (x¡+l) - 2f[x¡, x¡+¡] +f' (x)
(X¡+l -x?
e2,; = f' (x),
f' (x¡+l) - 2f [X¡,X¡+I] + e2.¡
tu?
(5.49)
(5.50)
(5.51)
(5.52)
Ejemplo 5.13 Resuelva el problema del ejemplo 5.3 usando aproximación segmentaria, con polino-
mios de grado 2, 4, 6,... , 16 Yestime, como antes, el error máximo en forma práctica.
Solución En el CD se encuentra el PROGRAMA 5.2 que realiza los cálculos solicitados
360 Métodos numéricos aplicados a la ingeniería
Resultados
Número de intervalos Error máximo
2
4
6
8
10
12
14
16
2.23620
2.23622
0.73979
0.04213
0.09341
0.06417
0.03299
0.01279
En contraste con la aproximación polinomial (véase el ejemplo 5.3), el error máximo de-
crece conforme n crece.
APROXIMACiÓN CÚBICA SEGMENTARIA DE BESSEL
La aproximación cúbica de Hermite requiere el conocimiento def' (x), i = O, 1,... , n. Es-
ta información, como se ha visto a lo largo del capítulo, no siempre existe, aún conocien-
do f(x) analíticamente no siempre es fácil obtenerla.
La aproximación cúbica segmentaria de Bessel se distingue por emplear una aproxi-
mación de f' (x) por
f'(x) '" f[xi_l> xi+¡], i = O, 1, ... , n (5.53)
y en todo lo demás se procede tal como en la aproximación de Hermite.
La expresión 5.53 requiere dos puntos adicionales a los que se tienen y son x_I
y xll
+ i-
ya que
(5.54)
llamadas derivadas frontera de g3(x).
Una forma de obtenerlos es una nueva subdivisión de [a, b], como:
podría también usarse
(5.55)
en caso de disponer de ellas y calcular las derivadas restantes de acuerdo con la ecuación
(5.53).
Otra forma sería tomar f' (xo) y f' (x,) de manera que g3(x) satisfaga las condiciones
de extremo libre.
(5.56)
Independientemente de cómo se obtengan los puntos x_1 y xn+i' las funciones g3(x) y f(x)
coinciden en los puntos de quiebre xo' xi' x2' ... , XII. Por esto gix) es continua en [a,b], y
por la ecuación 5.48 también es continuamente diferenciable. Además, es posible, y se
muestra adelante, determinar f ,(xo), ¡(XI)' ... ,¡(XII) de manera que la g3(x) resultante sea
dos veces continuamente diferenciable.
360 Métodos numéricos aplicados a la ingeniería
Resultados
Número de intervalos
2
4
6
8
10
12
14
16
Error máximo
2.23620
2.23622
0.73979
0.04213
0.09341
0.06417
0.03299
0.01279
En contraste con la aproximación polinomial (véase el ejemplo 5.3), el error máximo de-
crece conforme n crece.
APROXIMACiÓN CÚBICA SEGMENTARlA DE BESSEL
La aproximación cúbica de Hermite requiere el conocimiento def' (x), i =O, 1,... ,n. Es-
ta información, como se ha visto a lo largo del capítulo, no siempre existe, aún conocien-
do f(x) analíticamente no siempre es fácil obtenerla.
La aproximación cúbica segmentaria de Bessel se distingue por emplear una aproxi-
mación de f' (x) por
f'(x) '" f[xi_J> xi+¡], i =O, 1,... , n (5.53)
y en todo lo demás se procede tal como en la aproximación de Hermite.
La expresión 5.53 requiere dos puntos adicionales a los que se tienen y son x_1 y xll
+ l'
ya que
llamadas derivadas frontera de g3(x),
Una forma de obtenerlos es una nueva subdivisión de [a, b], como:
(5.54)
podría también usarse
f'(xlI
+ I), (5.55)
en caso de disponer de ellas y calcular las derivadas restantes de acuerdo con la ecuación
(5.53).
Otra forma sería tomar f' (xo) Yf' (x,,) de manera que gix) satisfaga las condiciones
de extremo libre.
(5.56)
Independientemente de cómo se obtengan los puntos x_1 y x"+ l' las funciones g3(x) y f(x)
coinciden en los puntos de quiebre xo' xl' x2,... , XII' Por esto gix) es continua en [a,b], y
por la ecuación 5.48 también es continuamente diferenciable. Además, es posible, y se
muestra adelante, determinar f ,(xo)' ¡(x¡), ... ,¡(x,,) de manera que la g3(x) resultante sea
dos veces continuamente diferenciable.
Aproximación funcional e interpolación 361
El método de determinar gix) con esta característica se conoce como aproximación
cúbica de trazador, ya que la gráfica de g3(x) se aproxima a la forma que tomaría una va-
rilla delgada flexible si se forzara a pasar por cada punto (xo,J(xo»' (x¡,J(x¡», ... , (x",J(x/).
El requisito de que g3(x) sea continuamente diferenciable dos veces pude darse como:
i = 1, 2,... , n-1 (5.57)
o
i = 1,2, ... , n-1,
conforme la ecuación 5.51 (derivándola dos veces).
Al sustituir las expresiones de la ecuación 5.52 en la última ecuación, se tiene:
2 (f [xi_i' x;l- f' (x¡_I» 6 A,"
+ c4· I ll,l. I =
fu: ,/- /-
¡-¡
i = 1, 2,... , n-1
Al continuar la sustitución y simplificar, se tiene:
fu:J' (X¡_I) + 2(fu:¡_1+ fu:)!, (x) + fu:¡_d' (Xi+¡) =
3 (f[x¡_i' xJ Sx¡ + f[xi, X¡+I]fu:¡_I)' i = 1,2,... , n-1
Un sistema de n-1 ecuaciones lineales en las (n+1) incógnitas!, (xo),f' (XI),'" ,!'(xll
).
Al obtenerf ,(xo) y f '(XII) de alguna manera (por ejemplo mediante las ecuaciones 5.53 o
5.55) se resuelve la 5.58 para!'(xl), !'(x2), ... ,!'(xll
_¡) por alguno de los métodos vistos
en el capítulo 3; no obstante, como el sistema 5.58 es tridiagonal, conviene utilizar el al-
goritmo de Thomas.
(5.58)
Ejemplo 5.14 La siguiente tabla muestra las viscosidades del isopentano a 59°P y a diferentes presio-
nes.
Presión (psia) Viscosidad (micropoises)
426.690 2468
483.297 2482
497.805 2483
568.920 2498
995.610 2584
1422.300 2672
2133.450 2811
3555.750 3094
4266.900 3236
7111.500 3807
362 Métodos numéricos aplicados a la ingeniería
Elabore un programa para aproximar el valor de la viscosidad a las presiones de 355.575,
711.150,2844.600,5689.200 Y8533.801 psia, utilizando la aproximación cúbica segmen-
taria de Bessel.
Solución En el CD se encuentra el PROGRAMA 5.3, el cual proporciona los siguientes resultados.
Presión (psia) Viscosidad (micropoises)
~
355.575 2453.56
711.150 2531.32
2844.600 2950.92
5689.200 3520.79
8533.801 4093.21
5.8 Aproximación polinominal con mínimos cuadrados
Hasta ahora el texto se ha enfocado en encontrar un polinomio de aproximación que pase
por los puntos dados en forma tabular. Sin embargo, a veces la información (dada en la
tabla) tiene errores significativos; por ejemplo, cuando proviene de medidas físicas. En es-
tas circunstancias no tiene sentido pasar un polinomio de aproximación por los puntos da-
dos, sino sólo cerca de ellos (véase Fig. 5.7).
No obstante, esto crea un problema, ya que se puede pasar un número infinito de cur-
vas entre los puntos. Para determinar la mejor curva se establece un criterio que la fije y
una metodología que la determine. El criterio más común consiste en pedir que la suma de
las distancias calculadas entre el valor de la función que aproxima p(x) y el valor de la
funciónf(x¡) dada en la tabla, sea mínima (véase Fig. 5.8); es decir, que
mil.L p(x) - f (x)
1=1
111
= L d. = mínimo
;=1 1
y
y = f(x)
La función pasa entre
los puntos
o
O
Figura 5.7
Aproximación
polinomial que
pasa por entre
XI x2 X x4 x5
x6
X
los puntos. 3
Aproximación funcional e interpolación 363
575, y
en-
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ~1I1
f(x,,)
s.
Figura 5.8
Ilustración de
las distancias di
a minimizar.
Para evitar problemas de derivabilidad más adelante, se acostumbra utilizar las distancias
di' elevadas al cuadrado:
m m
2: [p(x)-f(xW= 2: d2
=mínimo
i=1 1 I ¡=I 1pase
n la
es-
da-
En la figura 5.8 se observan los puntos tabulados, la aproximación polinomial p(x) y las
distancias di entre los puntos correspondientes, cuya suma hay que minimizar.
Si se utiliza
(5.59)CUf-
je y
ade
e la
para aproximar la función dada por la tabla, el problema queda como el de minimizar
m
.2: [ao + a¡x¡ - f (x¡)F
1=1
(5.60)
Hay que observar que del número infinito de polinomios que pasan entre los puntos, se se-
lecciona aquél cuyos coeficientes ao Yal minimicen (5.60).
En el cálculo de funciones de una variable, el lector ha aprendido que para encontrar
el mínimo o máximo de una función, se deriva y se iguala con cero esa derivada. Después
se resuelve la ecuación resultante para obtener los valores de la variable que pudieran mi-
nimizar o maximizar la función. En el caso en estudio, donde se tiene una función por mi-
nimizar de dos variables (ao Y al)' el procedimiento es derivar parcialmente con respecto
a cada una de las variables e igualar a cero cada derivada, con lo cual se obtiene un siste-
ma de dos ecuaciones algebraicas en las incógnitas ao Yal; o sea,
o m
- [2: (ao + alx¡ - f(x) )2]
oao 1=1
entre (5.61)
o m 2
- [2: (ao + alx¡ - f (X) ) ]
oal
1=1
Se deriva dentro del signo de sumatoria
x
.'
Figura 5.8
Ilustración de
las distancias di
a minimizar.
Aprox imación funcional e interpolación 363
y
[(x,,,)
__ __ _______ __ __________ ___ __ __ _ ___ _____ __ _____ __ ____ ~I
x
Para evitar problemas de derivabilidad más adelante, se acostumbra utilizar las distancias
di' elevadas al cuadrado:
l1l 111
.2; [p(x) - f (x)]2 =L d)2 = mínimo
1=) 1=1
En la figura 5.8 se observan los puntos tabulados, la aproximación polinomial p(x) y las
distancias di entre los puntos correspondientes, cuya suma hay que minimizar.
Si se utiliza
(5.59)
para aproximar la función dada por la tabla, el problema queda como el de minimizar
ti!
.L [ao+ a¡xi - f(x)]2
I=¡
(5.60)
Hay que observar que del número infinito de polinomios que pasan entre los puntos, se se-
lecciona aquél cuyos coeficientes aoya) minimicen (5.60).
En el cálculo de funciones de una variable, el lector ha aprendido que para encontrar
el mínimo o máximo de una función, se deriva y se iguala con cero esa derivada. Después
se resuelve la ecuación resultante para obtener los valores de la variable que pudieran mi-
nimizar o maximizar la función. En el caso en estudio, donde se tiene una función por mi-
nimizar de dos variables (aoya)), el procedimiento es derivar parcialmente con respecto
a cada una de las variables e igualar a cero cada derivada, con lo cual se obtiene un siste-
ma de dos ecuaciones algebraicas en las incógnitas ao Ya); o sea,
o 111
- [L (ao+ a¡x¡ - f (x) )2]
oao l=¡
o m 2
- [L (ao+ a)x¡ - f(x» ]
oa¡ 1=)
Se deriva dentro del signo de sumatoria
111 a m
.L - [ ao+ a )x¡ - f (x) ]2 = .L 2 [ ao+ a)xi - f (x) ] 1 =O
,~ ) oao 1=)
m O m
L - [ao+ a¡x¡ - f(x)]2 = L 2 [ao+ a¡x¡ - f(x)] x = O
i=loa¡ 1 i= ¡ 1 1
(5.61)
364 Métodos numéricos aplicados a la ingeniería
al desarrollar las sumatorias se tiene:
[ao + a1xI - f(xl)] + [ao + alx2 - f(x2)] + ... + [ao + a1xm - f(x,,)] = O
[aoXl + alx1
2 - f (XI)x1] + [aoX2 + a1xl- f (x2)x2] + ... +
+ [aoX", + a1x,.? - f (x,) XIII] = O
que simplificadas quedan:
m. m
m ao + al .L Xi = .L f (X)
1=1 1=1
In m 111
ao L X + al L x2 = L f(x) X
i=1 1 i=1 1 i=l 1 1
El sistema se resuelve por la regla de Cramer y se tiene
m 111 m 111
[L f (X) ] [L X?] - [L Xi ] [L f (X) Xi]
1=1 1=1 l=1 1=1
aO=------------n-'------m-------------
mLx2-[LX]2
i=l 1 i=1 1
(5.62)
que sustituidos en la ecuación 5.59 dan la aproximación polinomial de primer grado que
mejor ajusta la información tabulada. Este polinomio puede usarse a fin de aproximar va-
lores de la función para argumentos no conocidos en la tabla.
Ejemplo 5.15 En la tabla siguiente se presentan los alargamientos de un resorte correspondientes a
fuerzas de diferente magnitud que lo deforman.
Puntos 2 3 4 5
Fuerza (kgf): X
Longitud del resorte (m): y
6
0.225
7
0.260
o
0.120
2
0.153
3
0.170
Determine por mínimo cuadrados el mejor polinomio de primer grado (recta) que repre-
sente la función dada.
Solución Para facilitar los cálculos y evitar errores en los mismos, primero se construye la siguien-
te tabla.
Puntos Fuerza r, Longitud y, x2
x;y¡1
1 O 0.120 O 0.000
2 2 0.153 4 0.306
3 3 0.170 9 0.510
4 6 0.225 36 1.350
5 7 0.260 49 1.820
LXi = 18 LYi= 0.928 LX?= 98 L xiYi = 3.986
Aproximación funcional e interpolación 365
Los valores de las sumatorias de la última fila se sustituyen en el sistema de ecuaciones
5.62 y se obtiene:
ao = 0.11564 y al = 0.019434, de donde
p (x) = 0.11564 + 0.019434 x.
Los cálculos pueden realizarse con Matlab o con la TI-92 Plus.
format long
x=[O 2 3 6 7};
y=[0.120 0.153 0.170 0.225 0.260};
a=polyfit (x,y,l)
fprint ('aO=%8. 5f a1=%9.6fn' , a (2) ,a (1) )
e5_15 ()
Prgm
{O,2, 3, 6, 7}->1x : 5->n
{.12, .153, .17, .225, .26}-> 1y
LinReg lx, 1Y
ShowStat
lx [1}- .1* (max(lx) -min (lx)) -> xmin
lx [n} +.1* (max(lx) -min (lx) ) -> xmax
min (ly) -.1* (max(ly) -min (ly)) ->ymin
max (ly) +.1* (max(ly) i +yme«
regeq(x)->y1 (x)
NewPlot 1,1,lx,ly
setMode("Split 1 App","Graph")
Pause
setMode ("Split 1 App", "Hotne"
EndPrgm
Este programa genera las dos pantallas siguientes en la TI-92 Plus
~1~IAl2~ ,,~ '"~ ~ r~~ uolSTAT YAAS
y=a . x-b
a =.1119434
b =, 115639
corr =.993737
R2 =,987513
-e5-15( (Entar -OK )
~
eS-ISO
~'1EnWM PiAD AF'pfi¡m: Fune 1l~:(I
o
o
f¡ o f1P f' F;D:~r'1En~ur'1 . ,
El grado del polinornio no tiene relación con el número de puntos usados y debe seleccio-
narse de antemano con base en consideraciones teóricas que apoyan el fenómeno estudia-
do, el diagrama de dispersión (puntos graficados en el plano x-y) o ambos.
El hecho de tener la mejor recta que aproxima la información, no significa que la infor-
mación esté bien aproximada; quizá convenga aproximarla con una parábola o una cúbica.
~.~~~-------------------------~------
366 Métodos numéricos aplicados a la ingeniería
Para encontrar el polinomio de segundo grado P2(x) = ao + alx + a2x2 que mejor apro-
xime la tabla, se minimiza
(5.63)
donde los parámetros ao' al y a2 se obtienen al resolver el sistema de ecuaciones lineales
que resulta de derivar parcialmente e igualar a cero la función por minimizar con respec-
to a cada uno. Dicho sistema queda:
m m m
m ao+ al L x·+ a2 L x2
= L f(x')
i=l 1 i=l 1 i=l I
m m m In
ao L x·+ al L x2
+ al L x3 = L f(x')x.
i=l 1 i=l 1 i=l 1 i=l 1 1
(5.64)
In m m m
aO L x.2+al L x3+a2 L X4 = Lf(x.)x2,
i=l 1 i=1 1 i=l 1 i=l 1 1
Cuya solución puede obtenerse por alguno de los métodos vistos en el capítulo 3.
IEjemplo~~1;J El calor específico Cp (cal/k gmol) del Mn304 varía con la temperatura de acuerdo con
la siguiente tabla.
Punto 1 2 3 4 5 6
T (K) 280
-:
Cp (cal/k gmol) 32.7
650
45.4
1000
52.15
1200
53.7
1500
52.9
1700
50.3
Aproxime esta información con un polinomio por el método de mínimos cuadrados.
Solución El calor específico aumenta con la temperatura hasta el valor tabulado de 1200 K, para dis-
minuir posteriormente en valores más altos de temperatura. Esto sugiere utilizar un poli-
nomio con curvatura en vez de una recta, por ejemplo, uno de segundo grado, que es el
más simple.
Para facilitar el cálculo de los coeficientes del sistema de ecuaciones 5.64, se constru-
ye la siguiente tabla.
Puntos T Cp X.2 x3 X.4
Y~i Y~?l l l
Xi Yi
280 32.7 0.78 x 105 0.022 X 109 0.062 X 1O11 9156 2.56 x 106
2 650 45.4 0.42 x 106 0.275 X 109 1.785 X 1O11 29510 19.18 x 106
3 1000 52.15 1.00 x 106 1.000 X 109 1.000 X 1012 52150 52.15 x 106
4 1200 53.7 1.44 x 106 1.728 X 109 2.074 X 1012 64440 77.33 x 106
5 1500 52.9 2.25 x 106 3.375 X 109 5.063 X 1012 79350 119.03 x 106
6 1700 50.3 2.89 x 106 4.900 X 109 8.350 X 1012 85510 145.37 x 106
¿Totales 6330 287.15 8.08 X 106 11.3 X 109 166.7 X 1O11 320116 415.62 X 106
apro-
(5.63)
neales
espec-
(5.64)
con
6 X 106
8 X 106
5 X 106
3 X 106
3 X 106
7 X 106
2 X 106
Aproximación funcional e interpolación 367
Los coeficientes se sustituyen en el sistema de ecuaciones 5.64 y se obtiene:
6 ao + 6330 a] + 8.08 X 106 a2
= 287.15
6330 ao + 8.08 X 106 a] + 11.30 X 109 a2
= 320116
8.08 X 106 ao+ 11.30 X 109 al + 166.70 X lO]] a2
= 415.62 X 106
cuya solución por el método de eliminación Gaussiana arroja
ao = 19.29544, a] = 0.053728, a2
= -2.08787 X 10-5,
que forma la aproximación polinornial siguiente:
Cp(T) "" P2 (T) = 19.29544 + 0.053728 T - 2.08787 X 10-5 T2
Los valores de las sumas no se escribieron con todas sus cifras significativas, pero el po-
linornio de regresión se calculó usando todas las cifras que conserva la computadora.
Los cálculos pueden realizarse con Matlab o con la TI-92 Plus.
format long
T=[2BO 650 1000 1200 1500 1700J;
cp=[32.7 45.4 52.15 53.7 52.9 50.3J;
a=polyfit(T,Cp,2);
fprintf( 'aO=%B.5f al=%9.6f a2=%9. 6fn',a (3),a (2),a (1))
Tint=BOO;
cpint=e (3) +a (2)*Tint+a (1) *Tint '2;
fprintf (' Cp (%4. Of) =%6. 1fn' , Tint, Cpint)
Otra forma, usando las ecuaciones normales para la regresión:
T=[2BO 650 1000 1200 1500 1700J;
Cp=[32.7 45.4 52.15 53.7 52.9 50.3J;
A=[length(T) sum(T) sum(T.~2); ...
sum(T) sum(T.~2) sum(T.'3); ...
sum(T. ~2)sum(T. ~3)sum(T. ~4)J
b=[sum(CP); sum(CP.*T); sum(Cp.*T.~2)]
a=Ab
for i=l:length(a)
aa (i)=a (length (a) +l-i);
end
polyval (aa,BOO)
Aproximación funcional e interpolación 367
Los coeficientes se sustituyen en el sistema de ecuaciones 5.64 y se obtiene:
6 ao + 6330 al + 8.08 X 106 a2 = 287.15
6330 ao+ 8.08 X 106 a l + 11.30 X 109 a2 = 320116
8.08 X 106 ao+ 11.30 X 109 a l + 166.70 X 1011 a2 =415.62 X 106
cuya solución por el método de eliminación Gaussiana arroja
ao = 19.29544, al =0.053728, a2 =-2.08787 X 10-5 ,
que forma la aproximación polinomial siguiente:
Cp(T) "" P2 (T) = 19.29544 + 0.053728 T - 2.08787 X 10-5 T2
Los valores de las sumas no se escribieron con todas sus cifras significativas, pero el po-
linomio de regresión se calculó usando todas las cifras que conserva la computadora.
Los cálculos pueden realizarse con Matlab o con la TI-92 Plus.
format long
T=[280 650 1000 1200 1500 1700];
cp=[32.7 45.4 52.15 53.7 52.9 50.3];
a=polyfit(T, Cp,2);
fprintf( 'aO=%8.5f al=%9.6f a2=%9. 6fn',a (3),a (2),a (1))
Tint=800 ;
cpint=a (3) +a (2) *Tint+a (1) *Tint '2;
fprintf(' Cp(%4 . 0f)=%6.1fn', Tint ,Cpint)
Otra forma, usando las ecuaciones normales para la regresión:
T=[280 650 1000 1200 1500 1700];
Cp=[32.7 45.4 52.15 53.7 52.9 50.3J;
A=[length(T) sum(T) sum(T.'2);...
sum (T) sum(T. '2) sum(T.'3);...
sum(T. '2) sum(T. -3) sum(T. -4)]
b=[sum(CP); sum(CP.*T); sum(Cp .*T. -2)]
a=Ab
for i=l : length (a)
aa (i) =a (length (a) +l - i) ;
end
polyval (aa,BOO)
368 Métodos numéricos aplicados a la ingeniería
e5_16 ()
Prgm
Define minimos(lx,ly,np,ng)=Prgm
riq+lr+nec t Ztnec=lr+rm : newList (rmr+s t s+es
For i,i,np
Ir+x»:
For j,l,nn
If j~ec
ss [j ]+xxi'iy[i]-+ss [j]
xx"'ix[i]-+xx : s [j J+xx-+s [j]
EndFor
EndFor
newMat (nec,nec) -+a newMat (nee, 1)+b np+e [l,lJ
For i,l,nee
For j,l,nee
If not(i=l and j=l)
s [j-2+iJ-+a [i,j J
Endfor
ss[iJ-+b[i,l]
EndFor
EndPrgm
{280, 650,1000,1200,1500,1700}-+ Lx
(32. 7,45.4,52.15,53. 7,52.9,50.3)-+ly : 6-+np: 2-+ng: CirIO
minimos(lx,iy,np,ng) : simuit(a,b)-+e: O-+p: DeiVarx
For i,1,ng+1
Disp "x ("&string (i) &") ="&format (e [i, 1J , "e6")
p+e [i, 1J*x (i-1)-+p
EndFor
Disp p : Pause : FnOff
ix[lJ-.1* (mex-Lx) -min (Lx) r +xmin
ix[npJ+.1* (max(lx) -rain-Lx) ) -+xmax
min (Ly) -.1* (max (Ly) -min (Ly) ),-+ymin
max (ly) +.1* (max(Ly ) -min (iy)) -+ymax
2-+xres: O-+ysei :NewPiot 1,1, Lx , Ly : DrawFune p: FnOn: Pause
setMode("Spiit 1 App","Home")
EndPrgm
Pal
~~CleanupO
xl1.) =19.29544EO
xI2.) =53.72770E~3
xI3.) =-20.87873E-6
-2.08787346697E-5·x2 + .053727701612·x + 1
PA
PA
Con este programa se otbienen los siguientes resultados:
t'1En~U~'1 FmKO/30 FUtK
PA.
PA:
.. ,
NOTA: Muchas de las calculadoras de mano cuentan con un programa interno para obtener esta
aproximación; por otro lado, puede usarse un pizarrón electrónico para los cálculos
(sumatorias, solución de ecuaciones, etcétera).
PA~
368 Métodos numéricos aplicados a la ingeniería
e5_16()
Prgm
Define minimos (lx,ly,np,ng) =Prgm
ng+1-+nee:2*nee-1-+nn : newList (nn)-+s:s-+ss
For i,l , np
l-+xx
For j , l , nn
If j9Jee
ss [jJ+xxi'ly[iJ -+ss [j J
xx"'lx[iJ -+xx : s[jJ+xx->s[jJ
EndFor
EndFor
newMat (nee, nee)-+a
For i,l,nee
For j,l,nee
If not(i=l and j=l)
s [j - 2+iJ -+a [i , j J
Endfor
ss[iJ-+b[i,lJ
EndFor
EndPrgm
newMa t (nee,l)-+b
{280 , 650 , 1000,1200 , 1500, 1700}-+lx
np-+a [l ,lJ
(32. 7, 45.4 ,52. 15,53. 7, 52.9 , 50.3) -+ly : 6-+np : 2-+ng: ClrIO
minimos(lx, ly,np , ng) : simult(a , b )-+ e : O-+p : DelVar x
For i , 1 ,ng+1
Disp "x ("&string (i) &") ="&format (e [i , 1] , " e6")
p+e [i, l]*x (i-1)-+p
EndFor
Disp p : Pause : FnOff
lx[lJ-.1* (max-lx) - min (lx) )-+xmin
lx[np]+ . l* (max (lx) -min-lx)) -+xmax
min (ly) - .1* (max (ly) -min (ly) ),:-+ymin
max (ly) +.1* (max (ly) - min (ly)) -+ymax
2-+xres: O-+ysel : NewPlot 1 , 1 , lx, 1y: DrawFune p : FnOn : Pause
setMode(" Split 1 App","Home")
EndPrgm
Con este programa se otbienen los siguientes resultados:
~~cleanuPIJ
xl1 . ) =19 .29544EO
xI2 . ) =53 . 72770E ~ 3
xI3 . ) =-20 . 87873E- 6
- 2. 08787346697E- 5·x2 + . 053727701612 ·x + 1
FmK O/30 1if.llfS~ FUtK
NOTA: Muchas de las calculadoras de mano cuentan con un programa interno para obtener esta
aproximación; por otro lado, puede usarse un pizarrón electrónico para los cálculos
(sumatorias, solución de ecuaciones, etcétera).
Aproximación funcional e interpolación 369
I ,
Ejemplo 5.17 .
Solución
Use aproximación polinomial de segundo grado obtenida en el ejemplo anterior para
aproximar el calor específico del Mn304 a una temperatura de 800 K.
Con la sustitución de T = 800 K en el polinomio de aproximación se tiene:
Cp (800) '" P2(800) = 19.29544 + 0.053728(800) - 2.08787 X lO-s (800)2.
= 48.9 cal/K gmol.
En caso de querer aproximar una función dada en forma tabular con un polinomio de gra-
do más alto, n por ejemplo, el procedimiento es el mismo; esto es, minimizar la función
In
i~l [ao + a¡x¡ + a2x? + ... + «»: -f(x)] 2,
lo cual se obtiene derivándola parcialmente con respecto a cada coeficiente aj
, (O < j < n)
e igualando a cero cada una de estas derivadas. Con esto se llega al sistema lineal
mao + a¡ Lx + a2 Lx2 + + «: Lxn = Ly
ao Lx + al Lx2 + a2 Lx3 + + an
L xn+¡ = L xy
ao LX2 + al Lx3 + a2Lr + + an L xn+2 = L x2y
donde se han omitido, los subíndices i, de x y y, así como los límites de las sumatorias que
van de 1 hasta m para simplificar su escritura.
Aproximación con mfnimos cuadrados
Para obtener los N+ 1 coeficientes del polinomio óptimo de grado N que pasa entre M parejas de puntos, proporcionar los
DATOS: El grado del polinornio de aproximación N, el número de parejas de valores (X(I), FX(I), 1 = 1,2, ... ,
M).
RESULTADOS: Los coeficientes A(O), A(l), ... , A(N) del polinomio de aproximación.
PASO l. Hacer J = O.
PASO 2. Mientras J:::; (2*N-1), repetir los pasos 3 aS.
PASO 3. Si J :::;N Hacer SS(J) = O. De otro modo continuar.
PASO 4. Hacer S(J) = O.
PASO 5. Hacer J = J + 1.
PASO 6. Hacer I = 1.
PASO 7. Mientras 1:::;M, repetir los pasos 8 a 15.
PASO 8. Hacer XX = 1.
PASO 9. Hacer J = O.
PASO 10. Mientras J :::;(2*N-1), repetir los pasos 11 a 14.
PASO 11. Si J :::;N hacer SS(J) = SS(J) + XX*FX(I).
De otro modo continuar.
PASO 12. Hacer XX = XX*X(I).
PASO 13. Hacer S(J) = S(J) + XX.
PASO 14. Hacer J = J + 1.
PASO 15. Hacer 1 = 1 +1.
PASO 16. Hacer B (0,0) = M.
370 Métodos numéricos aplicados a la ingeniería
PASO 17. Hacer I = O.
PASO 18. Mientras I:S; N, repetir los pasos 19 a 24.
PASO 19. Hacer J = O.
PASO 20. Mientras J :s;N, repetir los pasos 21 y 22.
PASO 21. Si l,t OYJ ,t O.
Hacer B(I,1) = S(1-1+1).
PASO 22. Hacer J = J + l.
PASO 23. Hacer B(I,N+l) = SS(I).
PASO 24. Hacer 1 = 1 + 1.
PASO 25. Resolver el sistema de ecuaciones lineales B a = ss de orden N+ 1 con alguno de los algoritmos del capítulo 3.
PASO 26. IMPRIMIR A(O), A(1), ... ,A(N) YTERMINAR. I
En el CD encontrará el PROGRAMA 5.9 de Regresión. Con este programa usted puede pro-
porcionar la función como una tabla de puntos, aproximar con el método de mínimos cua-
drados utilizando un polinomio de grado seleccionado. Podrá además observar gráficamente
los puntos dados, el polinomio de ajuste y el valor a interpolar.
5.9 Aproximación multilineal con mínimos cuadrados
Con frecuencia se tienen funciones de más de una variable; esto es, f (u, v,z). Si se sospe-
cha una funcionalidad lineal en las distintas variables; es decir, si se piensa que la función
y = ao + a¡u + a2v + a3z
Puede ajustar los datos de la tabla siguiente:
Puntos u v Z y
1 u¡ v¡ z¡ f(ul' vI' z.)
2 u2 v2 Z2 f (u2' v2' Z2)
3 u3 v3 Z3 f (u3, v3' Z3)
m Vm.
Se puede aplicar el método de los mínimos cuadrados para determinar los coeficientes ao,
al' a2 y a3 que mejor aproximen la función de varias variables tabulada. El procedimien-
to es análogo al descrito anteriormente y consiste en minimizar la función.
In
.L [(ao + a[u¡ + a2v¡ + a3z¡)-y¡]2
<=[
que derivada parcialmente con respecto de cada coeficiente por determinar: ao, al' a2, a3
e igualada a cero cada una, queda
a m m
L [(ao + a,u. + a2v. + a3z.) - y]2 =2 L (ao + a,u. + a2v¡ + a3z· - y.) 1 = O
a a
o
i=1 I 1 , , . 1=1 1 1 1
a m m
L [(ao + a,u. + a2v. + a3z.) - y]2 =2 L (ao + a,u. + a2v. + a3z - y.) u, = Oi=1 /. 1 I I 1=1 1 I 1 1 1
m m
L [(ao + aju. + a2v. + a3z.) - y]2 =2 L (ao + aju. + a2v. + a3z - y.) V = O;=1 I l 1 1 i=1 1 I 1 1 l
E
y = ao + a lu + a2 v
a los datos de dicha tabla.
ospe- Agua ( %) Cal ( % ) Puzol ana ( % )
nción y u v
27.5 2.0 18.0
.
28.0 3.5 16.5
28.8 4.5 10.5
29.1 2.5 2.5
30.0 8.5 9.0
31.0 10.5 4.5
32.0 13.5 1.5
tilo 3.
Aproximación funcional e interpolación 371
ecuaciones que arregladas generan el sistema algebraico lineal siguiente:
m ao + al L u + a2 L v + a3 L z
ao L u + al L u2 + a2 L uv + a3 L u:
ao L v + al L vu + a2 L v2
+ a3 L vz
ao L z + al L zu + a2 L zv + a3 L Z2
= Ly
= Luy
= Lvy
= Lzy
(5.65)
en las incógnitas ao' al' a2 y a3. Para simplificar la escritura se han omitido los índices i,
de u, v, y Z y los límites de las sumatorias, que van de 1 hasta m.
pro-
cua-
ente
Ejemplo 5.18 A partir de un estudio experimental acerca de la estabilización de arcilla muy plástica,
se observó que el contenido de agua para moldeo con densidad óptima dependía lineal-
mente de los porcentajes de cal y puzolana mezclados con la arcilla. Se tuvieron así los
resultados que se dan abajo. Ajuste una ecuación de la forma:
Solución El sistema por resolver es una modificación del sistema de ecuaciones 5.65 para una fun-
ción y de dos variables u y v
les ao' nao + al Lu + a2 Lv = Ly
en- ao L u + al L u2 + a2 L uv = Luy
ao L v + al L vu + a2 L v2
= Lvy
Con el objeto de facilitar el cálculo del sistema anterior se construye la siguiente tabla.
a2, a3 Ui Vi Yi u.2
UiVi v.2
«s. V)iz ,
1 2.0 18.0 27.5 4.00 36.00 324.00 55.00 495.00
O 2 3.5 16.5 28.0 12.25 57.75 272.25 98.00 462.00
3 4.5 10.5 28.8 20.25 47.25 110.25 129.60 302.40
O 4 2.5 2.5 29.1 6.25 6.25 6.25 72.75 72.75
5 8.5 9.0 30.0 72.25 76.50 81.00 255.00 270.00
O 6 10.5 4.5 31.0 110.25 47.25 20.25 325.50 139.50
7 13.5 1.5 32.0 182.25 20.25 2.25 432.00 48.00
O L Totales 45.0 62.5 206.4 407.5 291.25 816.25 1367.85 1789.65
372 Métodos numéricos aplicados a la ingeniería
Los coeficientes se sustituyen en el sistema de ecuaciones y al aplicar alguno de los mé-
todos del capítulo 3, se obtiene:
ao = 28.69, al = 0.2569, a2 = -0.09607
al sustituir estos valores se tiene:
y = 28.69 + 0.2569 u - 0.09607 v
Los cálculos pueden realizarse con Matlab o con la TI-92 Plus
u=[2'; 3.5; 4.5; 2.5; 8.5; 10.5; 13.5];
v=[18; 16.5; 10.5; 2.5; 9; 4.5; 1.5];
y=[27.5; 28; 28.8; 29.1; 30; 31; 32];
A=[size(u,l) sum(u) sum(v) ; ...
sum (u) sum(u. A2) sum(u. *v) ; ...
sum (v) sum(v. *u) sum (v. A2)] ;
b=[sum (y) ;sum (u. *y) ;sum (v. *y)]
a=Ab
pl
Ej
e5_18 ()
Prgm
{2,3. 5, 4.5,2.5,8.5,10.5,13. 5} ....•u
{18,16. 5,10.5,2. 5, 9, 4.5,1. 5} ....•v
(27.5,28,28.8,29.1,30,31,32} ....•y
@Nota: Las siguientes dos líneas son una sola instruccion
[dim(u) ,sum(u) ,sum(v) ;sum(u) ,sum(u. A2) ,sum(u.*v);
sum (v) , sum (v. *u) , sum (v. A2) J ....•a
[sum(y) ;sum(y.*u) ;sum(y.*u) ] ....•b
simult (a,b) ....•c
Disp c
EndPrgm
Al graficar en el espacio la ecuación y = 28.69 + 0.2569 u - 0.09607 v, resulta un plano
que pasa por entre los puntos experimentales, quedando algunos de ellos abajo y otros arri-
ba y los demás en la superficie, pero la suma de los cuadrados de las distancias de estos
puntos a la superficie es mínima, respecto a cualquier otro plano que pase entre dichos
puntos (ver Fig. 5.9).
372 Métodos numéricos aplicados a la ingeniería
Los coeficientes se sustituyen en el sistema de ecuaciones y al aplicar alguno de los mé-
todos del capítulo 3, se obtiene:
ao = 28.69, al = 0.2569, a2 = -0.09607
al sustituir estos valores se tiene:
y = 28.69 + 0.2569 u - 0.09607 v
Los cálculos pueden realizarse con Matlab o con la TI-92 Plus
u=[2"; 3.5; 4.5; 2 . 5; 8. 5; 10.5; 13.5];
v=[18 ; 16.5; 10.5; 2 . 5; 9; 4. 5; 1.5];
y=[27.5; 28; 28 . 8; 29. 1; 30; 31; 32] ;
A=[size(u,l) sum(u) sum (v) ; ...
sum (u) sum (u . A2) s um (u. *v) ; ...
sum (v) sum (v. *u) sum (v. A2)] ;
b=[sum (y) ;sum (u. *y) ; sum (v. *y)]
a=Ab
e5_18 ()
Prgm
{2, 3. 5, 4.5, 2 . 5, 8 . 5, 10 . 5, 13. 5} -> u
{18, 16. 5, 10. 5, 2 . 5, 9, 4. 5, 1 . 5}->v
(27 . 5 , 28 , 28 . 8 , 29 . 1 , 30 , 31 , 32}->y
@Nota : Las siguientes dos líneas son una sola instruccion
[dim(u) , sum(u) , sum(v) ; sum(u) , sum(u . A2) , sum(u .*v);
sum(v) , sum(v.*u) , sum(v. A2) ] ->a
[sum (y) ;sum(y .*u) ; sum(y.*u) ] ->b
simult (a , b )-> c
Disp e
EndPrgm
Al graficar en el espacio la ecuación y = 28.69 + 0.2569 u - 0.09607 v, resulta un plano
que pasa por entre los puntos experimentales, quedando algunos de ellos abajo y otros arri-
ba y los demás en la superficie, pero la suma de los cuadrados de las distancias de estos
puntos a la supetiicie es minima, respecto a cualquier otro plano que pase entre dichos
puntos (ver Fig. 5.9).
los mé-
y 33
(agua %)
32
31
30
29
28
Figura 5.9
Gráfica del
plano y = 28.69
+ 0.2569 u
-0.09607vy
algunos datos
experimentales.
27
20
Ejercicios
Aproximación funcional e interpolación 373
--,1
1
- -t-
I
I ..•. --
_-1
1
1
- -1-
1
1
...,-
- - 1
'"_ ....1'"..... I
I I
1 ' •••
-.......... I ........•......
I •....... I ..... I 1.....
I ~..... .....,..... I
- 1......... I 1..... I
I I I r-, I
I .....1..... 'l..... , •.............I
- -"...!~':":':":'>---~'--7.o-?'~/-=tz: ~
1
'1
1
1
'1
1
1
, J
1
-- ---- ...•.:1
1
, ,1
-~1
1 _-
_ -1-
1
1 _-
_r "
1
I _ - ....
- -t
1
1
.-_ ..•. - - I
~ .L~~L:;"..L/"'7~?"-",
1
',1
.L~~L:"..L77~~-~ 1',
1
',1
~~~~~~~~~~, :t,
1
1
...,-
1
1
15
15
10
5
ti (cal %)
o o
5.1 A continuación se presentan las presiones de vapor del cloruro de magnesia.
Puntos 4 5o 6 72 3
P (mmHg) 10 20 60 100 200 400 76040
TCC) 1142930 1316 1223 1418988 1050 1088
Solución
Calcule la presión de vapor correspondiente a T = 1000 De.
Como la información no está regularmente espaciada en los argumentos (T), pueden usar-
se diferencias divididas o polinornios de Lagrange para la interpolación. (Se sugiere ver
los PROGRAMAS 5.4 y 5.5 del CD).
Con los polinornios de Lagrange de segundo grado se tiene:
()
-f( ) (x-xl)(x-x2) f() (x-xO)(x-x2)
P2 X - Xo + XI
(xo - XI) (xo - x2) (XI - xo) (XI - x2)
+f(x
2
) (x - xo) (x - XI)
(x2 - xo) (x2 - XI)
Al tomar las presiones como valores de la funciónf(x), las temperaturas como los argu-
mentos x, seleccionar los puntos (O), (1) Y (2), Y sustituir los valores, se obtiene:
n plano
os arri-
e estos
dichos
(1000 - 988) (1000 - 1050) (1000 - 930) (1000 - 1050)
P2 (1000) = 10 (930 _ 988) (930 _ 1050) + 20 (988 - 930) (988 - 1050) +
(1000 - 930) (1000 - 988)
+ 40 = 23.12 mmHg '" 23 mmHg
(1050 - 930) (1050 - 988)
Figura 5.9
Gráfica del
plano y =28.69
+ 0.2569 u
-0.09607vy
algunos datos
experimentales.
Ejercicios
y 33
(agua %)
32
31
30
29
28
27
20
.... -,-1
I .... _.-
_1
1
.... -1-
.... -................ I
Aproximación funcional e interpolación 373
'.... _.-
- 1
1
' .... --_ f
1
I .... - ....
-"1
1
.-_ .... "" - I
.~Á4077,":l' ,
1
, ,1
-~ " ,
1
, , ).
,
o O
, 1 '1
~,
, , 1 '1
1
, , 1 ' J
1,
, , 1
, ,1
1
, ,1
15
10
u (cal %)
5.1 A continuación se presentan las presiones de vapor del cloruro de magnesio.
Solución
Puntos o 2 3 4 5 6 7
P (mmHg) 10 20 40 60 100 200 400 760
TCC) 930 988 1050 1088 1142 1316 12231418
Calcule la presión de vapor correspondiente a T = 1000 oc.
Como la información no está regularmente espaciada en los argumentos (T), pueden usar-
se diferencias divididas o polinomios de Lagrange para la interpolación. (Se sugiere ver
los PROGRAMAS 5.4 y 5.5 del CD).
Con los polinomios de Lagrange de segundo grado se tiene:
( )
- f( ) (X-XI) (x-x2) f() (x-xo) (x-x2)
P2 X - Xo + XI
(xo- X I) (xo- x2) (XI - xo) (XI - x2)
+ f(x
2
) (x - xo) (x - X I)
(x2 - xo) (x2 - XI)
Al tomar las presiones como valores de la función f (x), las temperaturas como los argu-
mentos x, seleccionar los puntos (O), (1) Y(2), Ysustituir los valores, se obtiene:
(1000 - 988) (1000 - 1050) (1000 - 930) (1000 - 1050)
P2 (1000) = 10 (930 _ 988) (930 _ 1050) + 20 (988 _ 930) (988 - 1050) +
(1000 - 930) (1000 - 988)
+ 40 = 23.12 mmHg '" 23 mmHg
(lOSO - 930) (lOSO - 988)
<>
374 Métodos numéricos aplicados a la ingeniería
5.2 Dada la tabla
Puntos O 1 2 3 4
s, 1.00 1.35 1.70 1.90 3.00
f(x) 0.00000 0.30010 0.53063 0.64185 1.09861
Construya una tabla de diferencias divididas para aproximar f (x) en x = 1.50; utilice un
polinomio de Newton de segundo grado.
Solución A continuación se da la tabla de diferencias divididas.
Diferencias divididas
Puntos f(x)
Primeras Segundas Terceras Cuartas
o 1.00 0.00000
0.85743
1 1.35 0.3001O~ -0.28396
0.65866~ 0.10832
2 1.70 0.53063 -0.18647~ -0.03049
0.55610 -0.04735
3 1.90 0.64185 -0.10835
0.41524
4 3.00 1.09861
Se pueden seleccionar los puntos (O), (1) Y (2) para el polinornio de interpolación o bien
(1), (2) Y (3). Se escoge el segundo conjunto de puntos, ya que están más cerca de 1.5 que
el primero; sin embargo, al querer emplear la fórmula
P2(X) =f[xo] + (x -xo)f[xo, x¡] + (x -xo) (x -xl)f[xO' xl' x2]
y la tabla construida se deberá tener cuidado, ya que el valor X
o de la fórmula en realidad
corresponderá a XI de la tabla; x I de la fórmula, a x2 de la tabla, etc. Consecuentemente f
[xo], f [xo, xl' x2] de la fórmula corresponderá af [XI]'! [xl' x2] y f [xl' x2' x3] de la tabla
respectivamente (véase la línea diagonal de la tabla).
Con la sustitución de valores queda
p2(1.5) = 0.30010 + (1.5 - 1.35)(0.65866) + (1.5 - 1.35)(1.5 - 1.7)(-0.18647)
= 0.40449
Una solución alterna es construir la tabla de diferencias de modo que quede como pun-
to (O) el más cercano a 1.5 (1.35 en este caso), entre los puntos restantes se elige como
punto (1) el más cercano a 1.5 (1.70 en este caso), etc. Adelante se muestra cómo que-
da esta tabla.
Aproximación funcional e interpolación 375
Diferencias divididas
Puntos Xi ¡(X)
Primeras Segundas Terceras Cuartas
O 1.35 0.30010
0.65866
1 1.70 0.53063 -0.18647
0.55610 0.10846
2 l.90 0.64185 -0.22443 -0.030567
0.71320 0.05802
3 l.00 0.00000 -0.14900
0.54930
4 3.00 l.09861
con lo cual puede usarse el polinomio
9
P2(X) =f[xo] + (x-xo)f[xo'x¡] + (x-xo) (x-x¡)f[xO'x¡ox2]
directamente, ya que ahora los subíndices de los argumentos de la fórmula y de la tabla se
corresponden. Sustituyendo valores se tiene:
p2(l.5) = 0.30010 + (l.5 - 1.35)(0.65866) + (l.5 - l.35)(l.5 - 1.7)(-0.18647)
= 0.40449
Obsérvese que el valor interpolado es el mismo que se tuvo anteriormente.
5.3 Las densidades de las soluciones acuosas del ácido sulfúrico varían con la temperatura y
la concentración de acuerdo con la tabla.
bien
que
idad
nlef
tabla
TCC)
C (%)
10 30 60 100
5 l.0344 l.0281 l.0140 0.9888
20 1.1453 1.1335 1.1153 1.0885
40 1.3103 1.2953 1.2732 l.2446
70 l.6923 l.6014 l.5753 l.5417
pun-
omo
que-
Solución
a) Calcule la densidad a una concentración de 40% y una temperatura de 15°C.
b) Calcule la densidad a 30°C y concentración de 50%.
e) Calcule la densidad a 50°C y 60% de concentración.
d) Calcule la temperatura a la cual una solución al 30% tiene una densidad de l.215.
a) La temperatura se toma como el argumento x y las densidades (a 40%) como el va-
lor de la funciónf(x).
Con una interpolación lineal entre las densidades a 10 °C y 30°C se tiene:
x-x x-x
P (x) = --¡ f(x
o
) + __ o f(x¡)
xO-XI xl -xo
376 Métodos numérico s aplicados a la ingeniería
d (15) "" 15 - 30 1.3103 + 15 - 10 1.2953 = 1.3066
10 - 30 30 - 10
b) Se toman ahora las concentraciones como argumentos x y las densidades (a 30°C)
como los valores funcionales; luego, mediante una interpolación lineal entre las
concentraciones a 40% y 70% queda:
d (50) = 50 - 70 1.2953 + 50 - 40 1.6014 = 1.3973
40 -70 70 - 40
e) La densidad se aproxima a 50°C, utilizando primero la fila de 40% de concentra-
ción y después la fila de 70% de concentración. Con estas densidades obtenidas a
50 °C se aproxima la densidad a 60% de concentración.
Primer paso
Aproximación de la densidad a 40% y 50°C.
d "" 50 - 60 1.2953 + 50 - 30 1.2732 = 1.2806
30 - 60 60 - 30
Segundo paso
Aproximación de la densidad a 70% y 50°C.
d "" 50 - 60 1.6014 + 50 - 30 1.5753 = 1.5840
30 - 60 60 - 30
Tercer paso
Aproximación de la densidad a 60% y 50°C usando los valores obtenidos en los pasos an-
teriores
d "" 60 -70 1.2806 + 60 - 40 1.5840 = 1.4829
40 -70 70 -40
d) En este caso es necesario interpolar los valores de la densidad a 30% de concentra-
ción a diferentes temperaturas, para después interpolar la temperatura que corres-
ponda a una densidad de 1.215.
Primer paso
Aproximación de la densidad a 30% y 10 0C.
d "" 30 - 20 1.1453 + 30 - 40 1.3103 = 1.2278
40 - 20 20 - 40
Aproximación de la densidad a 30% y 30°C.
d "" 30 - 20 1.1335 + 30 - 40 1.2953 = 1.2144
40 - 20 20 -40
Como la densidad dato (1.215) está entre estos dos valores obtenidos, la temperatura esta-
rá también entre 10 °C y 30°C; por lo que interpolando linealmente entre estos dos valo-
res de densidad (que ahora es el argumento x) se tiene:
376 M é todos n u m é ricos aplicados a la in g e niería
15 - 30 15 - 10
d (15) "'" 1.3103 + 1.2953 = 1.3066
10 - 30 30 - 10
b) Se toman ahora las concentraciones como argumentos x y las densidades (a 30 oC)
como los valores funcionales; luego, mediante una interpolación lineal entre las
concentraciones a 40% y 70% queda:
d (50) = 50 - 70 1.2953 + 50 - 40 1.6014 = 1.3973
40 -70 70 - 40
e) La densidad se aproxima a 50 oC, utilizando primero la fila de 40% de concentra-
ción y después la fila de 70% de concentración. Con estas densidades obtenidas a
50 oC se aproxima la densidad a 60% de concentración.
Primer paso
Aproximación de la densidad a 40% y 50 oc.
d "'" 50 - 60 1.2953 + 50 - 30 1.2732 = 1.2806
30 - 60 60 - 30
Segundo paso
Aproximación de la densidad a 70% y 50 oC.
d "'" 50 - 60 1.6014 + 50 - 30 1.5753 = 1.5840
30 - 60 60 - 30
Tercer paso
Aproximación de la densidad a 60% y 50 oC usando los valores obtenidos en los pasos an-
teriores
d "'" 60 - 70 l.2806 + 60 - 40 1.5840 = l.4829
40 -70 70 - 40
d) En este caso es necesario interpolar los valores de la densidad a 30% de concentra-
ción a diferentes temperaturas, para después interpolar la temperatura que corres-
ponda a una densidad de 1.215.
Primer paso
Aproximación de la densidad a 30% y 10 oc.
d "'" 30 - 20 1.1453 + 30 - 40 1.3103 = l.2278
40 - 20 20 -40
Aproximación de la densidad a 30% y 30 oc.
d "'" 30 - 20 1.1335 + 30 - 40 l.2953 = 1.2144
40 - 20 20 - 40
Como la densidad dato (1.215) está entre estos dos valores obtenidos, la temperatura esta-
rá también entre 10 oC y 30 oC; por lo que interpolando linealmente entre estos dos valo-
res de densidad (que ahora es el argumento x) se tiene:
Aproximación funcional e interpolación 377
Segundo paso
Aproximación de la temperatura a la que una solución con 30% de concentración tiene una
densidad de l.21530°C)
trelas
T = l.215 - 1.2144 10 + l.215 - l.2278 30", 29.1 0C
l.2278 - l.2144 l.2144 - 1.2278
5.4 Elabore un programa para leer una tabla de In pares de valores e interpolar o extrapolar,
utilizando el polinomio de Newton de grado n en diferencias divididas. Pruebe este pro-
grama con los datos del ejercicio 5.l.entra-
idas a
Solución En el disco se encuentra el programa 5.3 que lee a) el número de pares de valores (M); b)
el grado del polinomio interpolante (N); e) el argumento que se desea interpolar (XINT), y
á) los pares de valores (X(1), FX(1)), (X(2), FX(2)), ... , (X(M), FX(M)). Con esta informa-
ción primero llama al subprograma TABLA que elabora la tabla de diferencias divididas.
Con los valores resultantes y el argumento donde se quiere aproximar el valor de la función
y el grado del polinornio interpolante, llama al subprograma INTERPOLA que realiza los
cálculos de interpolación.
El resultado es
PARA XINT = 1000.0000 FXINT = 23.1201
5.5 Elabore un programa que lea una tabla de In (seleccionado por el usuario) pares de valo-
res, y qué interpole o extrapole con el polinomio de Lagrange de orden In-l.
os an-
Solución En el disco se encuentra el programa 5.4, donde se leen M pares de valores XCI) y FX(I)
de una tabla y el valor por interplar XINT.
Resultado:
PARA XINT = 1000.0000 FXINT = 23.1201
5.6 Con el programa 5.4 y la tabla de valores del ejercicio 5.1, calcule la presión de vapor del
cloruro de magnesio a las siguientes temperaturas:
a) 800°C (extrapolación)
e) 1098 °C (interpolación)
b) 950°C (interpolación)
á) 1500°C (extrapolación)
entra-
orres-
Solución PARA XINT = 800.0000
PARA XINT = 950.0000
PARA XINT = 1098.0000
PARA XINT = 1500.0000
FXINT = 18.1702 con los puntos (O), (1) Y (2).
FXINT = 12.4972 con los puntos (O), (1) Y (2).
FXINT = 65.5236 con los puntos (2), (3) Y (4).
FXINT = 1156.1016 con los puntos (5), (6) Y (7).
5.7 Con la información del ejercicio 5.2 estime el error cometido R2
(l.5), aproximef(x) en
x = l.5 con un polinornio de tercer grado y estime el error correspondiente R3 (1.5).
Solución El valor obtenido con un polinomio de segundo grado (Ejer. 5.2) es:
esta-
valo-
P2 (1.5) = 0.40449
Al usar la ecuación 5.41 y los valores de la segunda tabla de diferencias divididas (Ejer.
5.2), se tiene:
R2 (x) '" (x- xo)(x-x¡) (x-x2) f[xo, xl' x2' x3]
'" (l.5-1.35)(1.5-l.7)(l.5-1.9)(0.10846) = 0.00130
Aproximación funcional e interpolación 377
Segundo paso
Aproximación de la temperatura a la que una solución con 30% de concentración tiene una
densidad de 1.215
T = l.215 - l.2144 10 + 1.215 - l.2278 30", 29.1 oC
l.2278 - l.2144 l.2144 - l.2278
5.4 Elabore un programa para leer una tabla de In pares de valores e interpolar o extrapolar,
utilizando el polinomio de Newton de grado n en diferencias divididas. Pruebe este pro-
grama con los datos del ejercicio 5.l.
Solución En el disco se encuentra el programa 5.3 que lee a) el número de pares de valores (M); b)
el grado del polinomio interpolante (N); e) el argumento que se desea interpolar (XINT), y
á) los pares de valores (X(1), FX(1)), (X(2), FX(2)),... , (X(M), FX(M)). Con esta informa-
ción primero llama al subprograma TABLA que elabora la tabla de diferencias divididas.
Con los valores resultantes y el argumento donde se quiere aproximar el valor de la función
y el grado del polinomio interpolante, llama al subprograma INTERPOLA que realiza los
cálculos de interpolación.
El resultado es
PARA XINT = 1000.0000 FXINT =23.1201
5.5 Elabore un programa que lea una tabla de In (seleccionado por el usuario) pares de valo-
res, y qué interpole o extrapole con el polinomio de Lagrange de orden 1n-1.
Solución En el disco se encuentra el programa 5.4, donde se leen M pares de valores XCI) y FX(I)
de una tabla y el valor por interplar XINT.
Resultado:
PARA XINT = 1000.0000 FXINT = 23.1201
5.6 Con el programa 5.4 y la tabla de valores del ejercicio 5.1, calcule la presión de vapor del
cloruro de magnesio a las siguientes temperaturas:
a) 800 oC (extrapolación)
e) 1098 OC (interpolación)
Solución PARA XINT = 800.0000
PARA XINT =950.0000
PARA XINT = 1098.0000
PARA XINT = 1500.0000
b) 950 OC (interpolación)
á) 1500 oC (extrapolación)
FXINT = 18.1702 con los puntos (O), (1) Y(2).
FXINT =12.4972 con los puntos (O), (1) Y(2).
FXINT = 65.5236 con los puntos (2), (3) Y(4).
FXINT = 1156.1016 con los puntos (5), (6) Y(7).
5.7 Con la información del ejercicio 5.2 estime el error cometido R2 (1.5), aproximef(x) en
x =1.5 con un polinomio de tercer grado y estime el error correspondiente R3 (1 .5).
Solución El valor obtenido con un polinomio de segundo grado (Ejer. 5.2) es:
P2 (1.5) = 0.40449
Al usar la ecuación 5.41 y los valores de la segunda tabla de diferencias divididas (Ejer.
5.2), se tiene:
R2 (x) '" (x- xo)(x-x¡) (x-x2) f [xo' xi' x2' x3]
'" (l.5-1.35)(l.5-1.7)(1.5-1.9)(0.10846) =0.00130
378 Métodos numér icos aplicados a la ingeniería
Para aproximar f (x) en x = 1.5 con un polinomio de tercer grado se adiciona R2 (l.5) al
valor P2 (l.5), se obtiene:
P3 (l.5) = 0.40449 + 0.00130 = 0.40579
y la estimación del error en esta interpolación es:
R3 (x) = (x-xO)(X-XI) (x-x2) (x-x3) f [xo, xl' x2' x3' x4]
= (1.5-1.35)(1.5-1.7)(1.5-1.9)(1.5-l.0)(-0.030567)
= 0.00018
Hay que observarse que R3 (l.5) es menor que R2(l.5), por lo que el polinomio de tercer
grado da mejor aproximación a esta interpolación que el de segundo grado.
5.8 Para calibrar un medidor de orificio se miden la velocidad v de un fluido, y la caída de pre-
sión ~p. Los datos experimentales se dan a continuación y se buscan los mejores paráme-
tros a y b de la ecuación que represente estos datos:
v = a(M)b (1)
donde: v = velocidad promedio (pies/s)
~P = caída de presión (mm Hg)
2 3 4 5 6 7 8 9 10 11
vi 3.83 4.17 4.97 6.06 6.71 7.17 7.51 7.98 8.67 9.39 9.89
Mi 30.00 35.5 50.5 75.0 92.0 105.0 115.0 130.0 153.5 180.0 199.5
Solución Este problema puede resolverse mediante el método de mínimos cuadrados de la siguien-
te manera:
Se aplican logaritmos a la ecuación 1 y se tiene:
In v = In a + b In (~P) (2)
al definir y = In v; ao = In a; al = b; x = In (~P) y sustituir en la ecuación 2 queda:
(3)
ecuación de una línea recta.
Si se calculan los parámetros ao y al de la recta (Ec.3) con el método de mínimos cua-
drados, se obtienen (indirectamente) los mejores valores a y b que representan los datos
experimentales.
Para calcular ao y al se construye la siguiente tabla para que los cálculos sean más efi-
cientes (puede usarse una hoja de cálculo electrónica o un pizarrón electrónico).
1-
Aproximación funcional e interpolación 379
Puntos Vi Mi Yi xi x.2
s.»,1
In Vi In Mi (In MY In vi In Mi
1 3.83 30.0 1.34286 3.40120 11.56816 4.56734
2 4.17 35.5 1.42792 3.56953 12.74154 5.09700
3 4.97 50.5 l.60342 3.92197 15.38185 6.28857
4 6.06 75.0 l.8017l 4.31749 18.64072 7.77886
5 6.71 92.0 1.90360 4.52179 20.44658 8.60768
6 7.17 105.0 l.96991 4.65396 2l.65934 9.16788
7 7.51 115.0 2.01624 4.74493 22.51436 9.56692
8 7.98 130.0 2.07694 4.86753 23.69285 10.10957
9 8.67 153.5 2.15987 5.03370 25.33814 10.87214
10 9.39 180.0 2.23965 5.19296 26.96683 11.63041
11 9.89 199.5 2.29581 5.29581 28.04560 12.13545
Totales 20.83364 49.52087 226.99598 95.82182
Los valores de las sumatorias se sustituyen en el sistema de ecuaciones 5.62 y se tiene:
49.52087 1
226.99598 = -0.35904
49.52087 1
226.99598
1
11.0 20.83364 1
49.52087 95.82182
al = --------- = 0.50046
I
ll.O 49.52087 1
49.52087 226.99598
1
20.83364
95.82182
1
11.0
49.52087
Ecuación resultante:
y = -0.35904 + 0.50046 x
De donde:
in a = -0.35904
b = 0.50046
y a = 0.69835
Con estos valores, la ecuación que representa los datos experimentales queda:
v = 0.69835 (~p)O.50046
Para este ejercicio recomendamos ver el PROGRAMA 5.6 del CD.
5.9 Al medir la velocidad (con un tubo de Pitot) en una tubería circular de diámetro interior
de 20 cm, se encontró la siguiente información:
v (cm/s) 600 550 450 312 240
o 3 7 8r (cm) 5
donde r es la distancia en cm medida a partir del centro del tubo.
a) Obtenga la curva v =f (r) que aproxima estos datos experimentales.
b) Calcule la velocidad en el punto r = 4 cm.
380 Métodos n uméricos aplicados a la ingeniería
Solución a) Se asume que en la experimentación hay errores, de tal modo que se justifica usar
una aproximación por mínimos cuadrados. Por otro lado se sabe que el perfil de
velocidades en una tubería generalmente es de tipo parabólico, por lo que se ensa-
yará un polinomio de segundo grado
ver) = ao +al r + a2 r2
Al construir la tabla que proporcione los coeficientes del sistema de ecuaciones 5.64 se tiene
Puntos v r r2
r3 r4 vr vr2
1 600 O O O O O O
2 550 3 9 27 81 1650 4950
3 450 5 25 125 625 2250 11250
4 312 7 49 343 2401 2184 15288
5 240 8 64 512 4096 1920 15360
Totales 2152 23 147 1007 7203 8004 46848
Estos valores se sustituyen en el sistema de ecuaciones 5.64 particularizado para un poli-
nomio de segundo grado y se tiene:
+ 147 a2
+ 1007 a2
+ 7203 a2
2152
8004
46848
Al resolver para los parámetros ao' al Y a2 Y sustituidos en el polinomio propuesto queda:
ver) = 601.714 - 3.0667 r - 5.347 r2
b) Con la sustitución r = 4, se obtiene:
v(4) = 503.89 cro/s
Hay que observar que la distribución de velocidades sólo se presenta del centro a la pared
del tubo, ya que es simétrica.
SUGERENCIA: Vea el PROGRAMA 5.7 del CD.
650
v
600
550
500
503.89
450
400
350
300
Distribución de
250
la velocidad del
centro a la
200
pared de tubo. O 2 3 4 5 6 7 8
Aproximación funcional e interpolación 381
5.10 El porcentaje de impurezas que se encuentra, a varias temperaturas y tiempos de esterili-
zación en una reacción asociada con la fabricación de cierta bebida, está representado por
los datos siguientes
Tiempo de Temperatura °C
esterilización (mín) Xl
x2
75 100 125
15 14.05 10.55 7.55
14.93 9.48 6.59
20 16.56 l3.63 9.23
15.87 11.75 8.78
25 22.41 18.55 15.93
2l.66 17.98 16.44
Estime los coeficientes de regresión lineal en el modelo
y = ao + a¡ x¡ + a2 x2 + a3 x¡2 + a4 xl + as XIX2
Solución Si bien el modelo no es lineal, puede transformarse en lineal con los siguientes cambios
de variable.
que sustituidos en el modelo propuesto dan
y = ao + al XI + a2 X2 + a3 X3 + a4 X4 + as Xs
cuyos parámetros, siguiendo el criterio de los mínimos cuadrados, pueden obtenerse a par-
tir del sistema
nao + a¡Lxl + a2Lx2 + a3 LX3 + a4Lx4 + as LXS Ly
aOLx¡ + a¡ Lx21 + a2Lxlx2 + a3Lxlx3 + a4Lx]x4 + as LX]XS = LXIY
aoLx2 + al L X2XI + a2 L x22 + a3 L X2X3 + a4L X2 X4 + as LX2XS = LX2Y
aoL X3 + a¡ L X3X] + a2 L X3X2 + a3 L x23 + a4L X3 X4 + as L X3XS = LX3Y
aoL X4 + a¡ LX4XI + a2 LX4X2 + a3Lx4x3 + a4L x24 + as L X4XS = LX4Y
aoLXs + al LXSX¡ + a2LXsX2 + a3 LXSX3 + a4LXsX4 + as L x2s = LXsY
Ahora, los valores de la tabla que se dan arriba se disponen así
Puntos 1 2 3 4 5 6 7
XI 75 75 75 75 75 75 100
x2 15 15 20 20 25 25 15
Y 14.05 14.93 16.56 15.87 22.41 2l.66 10.55
382 Métodos numéricos aplicados a la ingeniería
Se continúa adicionando las filas necesarias: x3' x4' xs' X¡2, X2
2,xI' x2
, ... y sumando los to-
tales de cada una para conseguir los coeficientes y el vector de términos independientes
del sistema. Dichos cálculos dan como resultado el siguiente sistema de ecuaciones:
18 1800 360 187500 7500 36000 ao 251.94
1800 187500 36000 20250000 750000 3750000 a¡ 24l70.0
360 36000 7500 3750000 162000 750000 a2 5287.9
187500 20250000 3750000 2254687500 78125000 405000000 a3 2420850.5
7500 750000 162000 78125000 3607500 16200000 a4 115143.0
36000 3750000 750000 405000000 16200000 78125000 as 508702.5
cuya solución por medio de alguno de los métodos del capítulo 3 es:
ao = 56.4264,
a3
= 0.00081632,
a¡ = -0.362597,
a4 = 0.0816,
a2
= -2.74767
as = 0.00314
se sustituyen en el modelo y resulta:
y = 56.4264 - 0.362597x¡ - 2.74767x2 + 0.00081632x¡2 + 0.0816xl + 0.00314x¡x2
Una vez obtenidos los coeficientes, puede estimarse el porcentaje de impurezas correspon-
diente a un tiempo de estirilización y una temperatura dados; por ejemplo, a un tiempo de
19 min y una temperatura de 80°C se tiene un porcentaje de impurezas de:
y = 56.4264 - 0.362597 (80) - 2.74767(19) + 0.00081632(80)2 +
0.0816(19)2+ 0.00314(80)(19) = 14.67
Problemas
5.1 La densidad del carbonato neutro de potasio en solución acuosa varía con la temperatura
y la concentración de acuerdo con la tabla siguiente.
TCOC)
e (%)
O 40 80 100
4 1.0381 1.0276 1.0063 0.9931
12 1.1160 1.1013 1.0786 1.0663
20 1.1977 1.1801 1.1570 1.1451
28 1.2846 1.2652 1.2418 1.2301
a) Calcule la densidad a 40°C y 15% de concentración.
b) Calcule la densidad a 50°C y 28% de concentración.
e) Calcule la densidad a 90°C y 25% de concentración.
el) Calcule la concentración que tiene una solución de densidad 1.129 a una temperatura
de 60 -c.
Utilice interpolaciones cuadráticas en todos los incisos.
5.2 Los datos de presión-temperatura-volumen para el etano se muestran en la tabla siguien-
te, donde la temperatura (1) está en °C, la presión (P) en atmósferas y el volumen especí-
fico (1N) en moles/litro.
a
Aproximación funciona l e interpolación 383
p
T
1 2 4 6 8 9 10
25 20.14 32.84
75 24.95 43.80 68.89 85.95 104.38 118.32 139.23
150 31.89 59.31 106.06 151.38 207.66 246.57 298.02
200 36.44 69.38 130.18 194.53 276.76 332.56
250 40.87 79.16 153.59 237.38 345.38
Calcule el volumen específico en moles/litro para una presión de 7 atmósferas y una tem-
peratura de 175°C.
5.3 Dados:
Puntos o 1 2
x
e f(x)
a) Encuentre los coeficientes ao' al' a2
, del polinomo de segundo grado que pasa por es-
tos tres puntos, por el métodos de Lagrange.
b) Realice el mismo proceso que en a) pero ahora empleando el método de aproxima-
ción polinomial simple.
e) Demuestre que los polinomios en los incisos a) y b) son el mismo, pero escrito en di-
ferente forma.
5.4 Dada una función y =f(x) en forma tabular, a menudo se desea encontrar un valor x corres-
pondiente a un valor dado de y; este proceso, llamado interpolación inversa, se lleva a cabo
en la forma ya vista, pero intercambiando los papeles de x y y. Dada la siguiente tabla.
Puntos o 1 2 3 4 5 6
x 0.0 2.5 5.0 7.5 10.0 12.5 15.0
y 10.00 4.97 2.47 1.22 0.61 0.30 0.14
a
donde y es la amplitud de la oscilación de un péndulo largo, en cm y x es el tiempo medi-
do en min desde que empezó la oscilación.
Encuentre el polinomio de aproximación de Lagrange de segundo grado que pasa por los
puntos (1), (2) y (3) y el valor de x correspondiente a y = 2 cm.
5.5 "Sea z(x) = I1 (x - x.). Demuestre que el polinomio 5.22 puede escribirse en la forma
j=O J
n f (x)
Pn (x) = z (x) .L ----'---
l=O (x - x) z' (Xi)
Use las ideas dadas en el problema anterior para demostrar que5.6
Í-
11
L L¡ (x) "" 1 para toda x.
i=O
384 Métodos numéricos aplicados a la ingeniería
SUGERENClA: Considere que la expresión dada corresponde al polinomio de aproxomación por
polinomios de Lagrange de fix) = 1 (un polinomio de grado cero).
5.7 Demuestre que el polinomio de aproximación de Lagrange de primer grado puede escri-
birse en notación de determinantes así
PO,I (x) = _1_ I po(x) (xo - x) I
xl-xO PI(X) (xl-x)
donde Po (x) =f(xo) y PI(x) =f(xI) y los subíndices O y 1 de p(x) se refieren a los puntos
(O) y (1) por donde pasa el polinomio de aproximación.
Demuestre también que para el caso del polinomio de aproximación de Lagrange de
segundo grado que pasa por los puntos (O), (1) Y (2).
1
POl2 (x) =--
" x2 -XI
I PO,I (x)
PO,2 (x)
5.8 Lo demostrado en el problema anterior es válido, en general, para aproximaciones de ter-
cero, cuarto, ... , n grado. Aitken desarrolló un método para interpolar con este tipo de po-
linomios y consiste en construir la tabla siguiente:
Xo Po (xo-x)
Xl PI PO,I (XI-X)
X2 P2 PO,2 PO,I,2 (X2-X)
X3 P3 PO,3 PO,I,3 PO,I,2,3 (XrX)
X4 P4 PO,4 PO,I,4 PO,1,2,4 PO,I,2,3,4, (XCx)
donde P, =f(x¡) y X el valor donde se desea interpolar.
Para el cálculo de
1
PO,¡(x)=--
x¡-xO
donde el denominador resulta ser (Xi -X) - (xo - X).
En cambio para PO,I,i se usa
1
POI¡(X) =--
" X¡-XI
PO,I (Xl - X)
PO,¡ (X¡- X)
cuyo denominador es (x¡-x) - (X
I
- x).
Se aconseja denotar la abscisa más cercana a x como xo' la segunda más próxima a x
como xi' Y así sucesivamente.
Con ese ordenamiento los valores Po l' Po I ?, Po I 23' etc., representan la mejor aproxima-
ción al valor buscado f (x) con polinomios de p~i;';ero, segundo, tercero, ... , n grado.
Con el método descrito, aproxime el valor de la función de Bessel (lo) dada abajo en x = 0.8
Puntos O 1 2 3
X 0.5 l.00.7 0.9
lo (x) 0.93850.8812 0.80750.7652
cri-
tos
de
ter-
po-
ax
a-
0.8
Aproximación funcional e interpolación 385
5.9 En el método de posición falsa (capítulo 2) se realiza una interpolación inversa: dados los
puntos (xl,f (XI» y (xD,f (xD» se encuentra el polinomio p(x) que pasa por esos puntos y
luego el valor de X correspondiente a p(x) = O. Discuta la interpolación inversa para encon-
trar raíces de ecuaciones no lineales empleando tres puntos.
5.10 Demuestre que si la función f (x) dada en furma tabular corresponde a un polinomio de
grado n, entonces el polinomio de aproximación p(x) de grado mayor o igual a n que pa-
sa por los puntos de la tabla es f (x) misma.
SUGERENCIA: Con el polinomio y = 2x + 3 forme un tabla de valores y tomando dos de esos
valores encuentre p(x) y observe que p(x) = y; después tomando 3 valores
cualesquiera observe que el p(x) obtenido es nuevamente y = 2x + 3. Sólo resta
generalizar estos resultados.
5.11 Desarrolle algebraicamente el numerador y el denominador de
para llegar a
5.12 Verifique que para tres puntos distintos cualesquira de abscisas xo' XI y x2 se cumple que
f[xo' xI' x2] =f[x2, xo' XI] =f[xl' x2' xo]
así como con cualquier otra permutación de xI' x2' xo' Esta propiedad de las diferencias de
segundo orden es conocida como simetría respecto a los argumentos y la cumplen tam-
bién las diferencias de primer orden (trivial), las de orden 3, etcétera.
5.13 Elabore un subprograma de propósito general para construir la tabla de diferencias dividi-
das de una función tabulada.
SUGERENCIA: Vea el algoritmo 5.3. Puede usar una hoja de cálculo electrónica.
5.14 Para los valores siguientes
oPuntos 2 3 4 5 6
40 60 80 100 120 140 160e
0.63 1.36 2.18 3.00 3.93 6.22 8.59p
donde e son los volts y p los kilowatts en una curva de pérdida en el núcleo para un mo-
tor eléctrico:
a) Elabore una tabla de diferencias divididas.
b) Con el polinomio de Newton en diferencias divididas de segundo grado, aproxime el
valor de p correspondiente a e = 90 volts.
5.15 En la tabla siguiente:
1 2 3 4
v 120 94 75 62
Aproximación funcional e interpolación 385
5.9 En el método de posición falsa (capítulo 2) se realiza una interpolación inversa: dados los
puntos (x,,f (x,» y (xD,f (XD»se encuentra el polinomio p(x) que pasa por esos puntos y
luego el valor de x correspondiente a p(x) =O. Discuta la interpolación inversa para encon-
trar raíces de ecuaciones no lineales empleando tres puntos.
5.10 Demuestre que si la función f (x) dada en furma tabular corresponde a un polinomio de
grado n, entonces el polinomio de aproximación p(x) de grado mayor o igual a n que pa-
sa por los puntos de la tabla es f (x) misma.
SUGERENCIA: Con el polinomio y = 2x + 3 forme un tabla de valores y tomando dos de esos
valores encuentre p(x) y observe que p(x) = y; después tomando 3 valores
cualesquiera observe que el p(x) obtenido es nuevamente y = 2x + 3. Sólo resta
generalizar estos resultados.
5.11 Desarrolle algebraicamente el numerador y el denominador de
para llegar a
5.12 Verifique que para tres puntos distintos cualesquira de abscisas xo' XI y x2 se cumple que
f[xo' xI' x2] =f[x2, xo' XI] =f[xl' x2' xo]
así como con cualquier otra permutación de xI' x2' xo. Esta propiedad de las diferencias de
segundo orden es conocida como simetría respecto a los argumentos y la cumplen tam-
bién las diferencias de primer orden (trivial), las de orden 3, etcétera.
5.13 Elabore un subprograma de propósito general para construir la tabla de diferencias dividi-
das de una función tabulada.
SUGERENCIA: Vea el algoritmo 5.3. Puede usar una hoja de cálculo electrónica.
5.14 Para los valores siguientes
Puntos o 2 3 4 5 6
e 40 60 80 100 120 140 160
p 0.63 1.36 2.18 3.00 3.93 6.22 8.59
donde e son los volts y p los kilowatts en una curva de pérdida en el núcleo para un mo-
tor eléctrico:
a) Elabore una tabla de diferencias divididas.
b) Con el polinomio de Newton en diferencias divididas de segundo grado, aproxime el
valor de p correspondiente a e = 90 volts.
5.15 En la tabla siguiente:
1 2 3 4
v 120 94 75 62
-----------------~----------------------------"'P""---
386 Métodos numéricos aplicados a la ingeniería
donde i es la corriente y v el voltaje consumido por un arco magnético, aproxime el valor
de v para i = 3.5 por un polinomio de Newton en diferencias dividas y compare con el va-
lor dado por la fórmula empírica.
v = 30.4 + 90.4 ¡-0.507
5.16 Corrobore que el polinomio de Newton en diferencias divididas puede escribirse en térmi-
nos de Il, así:
(1)
NOTA: Considere que ¡.,°j(xo) = f (xo)' Esta notación es generalmente más útil para programar este
algoritmo.
5.17 Con los resultados del problema anterior y con la definición de función biominal siguien-
te, exprese la ecuación (1) en términos de (t).
(O =
1
k-¡ S - i
rr
;=0 i + 1
k=O
k>O
s (s - 1) s - 2) (s - (k - 1))
1 (2) (3) (k)
5.18 Con los siguientes valores.
Puntos o 32
l/r 140 180 220 240
p/a 12,800 7,500 5,000 3,800
donde p/a es la carga en lb/pulg- que causa la ruptura de una columna de hierro dulce con
extremos redondeados y l/r es la razón de la longitud de la columna al mínimo radio de gi-
ro de su sección transversal.
Encuentre el polinomio de tercer grado que pasa por estos puntos en sus distintas formas:
a) P3(x) = ao + a¡x + a~2 + a3x3 (aproximación polinomial simple).
b) Forma de Lagrange.
e) Aproximación de Newton (en diferencias divididas).
d) Aproximación de Newton en diferencias finitas (hacia delante y hacia atrás).
5.19 En una reacción química, la concentración del producto CB
cambia con el tiempo como se
indica en la tabla de abajo. Calcule la concentración CB
cuando t = 0.82, usando un poli-
nomio de Newton en diferencias finitas.
0.00 1.10 1.150.30 0.55 .80
0.00 0.60 1.000.800.10 0.40
5.20 Resuelve el problema 5.13, empleando diferencias finitas; compare los cálculos realizados
y los resultados obrenidos en ambos problemas.
5.21 Elabore un diagrama de flujo y codifíquelo para leer n pares de valores x y f (x), calcular
e imprimir la tabla de diferencias finitas hacia atrás.
386 Métodos numéricos aplicados a la ingeniería
donde ¡ es la corriente y v el voltaje consumido por un arco magnético, aproxime el valor
de v para ¡ = 3.5 por un polinomio de Newton en diferencias dividas y compare con el va-
lor dado por la fórmula empírica.
v = 30.4 + 90.4 ¡-0.507
5.16 Corrobore que el polinomio de Newton en diferencias divididas puede escribirse en térmi-
nos de rr,así:
(1)
NOTA: Considere que /1°j(xo) = f (xo). Esta notación es generalmente más útil para programar este
algoritmo.
5.17 Con los resultados del problema anterior y con la definición de función biominal siguien-
te, exprese la ecuación (1) en términos de (n.
(n =
k-¡ S - i s (s - 1) s - 2) .. .(s - (k - 1))
rr
;=0 ¡ + 1 1 (2) (3) ...(k)
5.18 Con los siguientes valores.
Puntos o 2 3
!Ir 140 180 220 240
p/a 12,800 7,500 5,000 3,800
k=O
k>O
donde p/a es la carga en lb/pulg2 que causa la ruptura de una columna de hierro dulce con
extremos redondeados y !Ir es la razón de la longitud de la columna al mínimo radio de gi-
ro de su sección transversal.
Encuentre el polinomio de tercer grado que pasa por estos puntos en sus distintas formas:
a) P3(x) =ao + a¡x + a~2 + a3x3 (aproximación polinomial simple).
b) Forma de Lagrange.
e) Aproximación de Newton (en diferencias divididas).
d) Aproximación de Newton en diferencias finitas (hacia delante y hacia atrás).
5.19 En una reacción química, la concentración del producto CB cambia con el tiempo como se
indica en la tabla de abajo. Calcule la concentración CB cuando t = 0.82, usando un poli-
nomio de Newton en diferencias finitas.
0.00 0.30 0.55 .80 1.10 1.15
0.00 0.10 0.40 0.60 0.80 1.00
5.20 Resuelve el problema 5.13, empleando diferencias finitas; compare los cálculos realizados
y los resultados obrenidos en ambos problemas.
5.21 Elabore un diagrama de flujo y codifíquelo para leer n pares de valores x y f (x), calcular
e imprimir la tabla de diferencias finitas hacia atrás.
a-
1)
Il-
on
1-
s:
se
li-
os
lar
Aproximación funcional e. interpolación 387
Puntos Xi f[ Xi] V'f[ Xi] V'2f[ Xi] V'3f[ Xi] ... V'1l-2j[Xi]
O Xo f[ Xo]
V'f[ XI ]
1 xI f[ x¡] V'2f[ XI ]
V'f[ X2] V'3f[ XI ]
2 x2 f[ x2] V'2f[ x2
]
V'f[ x3
] V'3f[ x2]
3 x3 f[ x3] V'2j [x3
]
V'"-2j[xl
_¡]
V'2f[xll_l
]

V'2f[xn_l]
V'f[x n-I]
n -1 xll_1 f[x n-I]
IV'f[x] = f[x] - f[x - h]
V''''f[x] = V'm-If[x] - V' m-If[x- h]
5.22 En el caso en que la distancia h entre dos argumentos consecutivos cualesquiera es la mis-
ma a lo largo de la tabla, puede usarse la ecuación 5.35 para interpolar en puntos cercanos
a X
o o bien 5.38 cuando se quiere interpolar en puntos al final de la tabla (véase Seco 5.5).
Si hay que interpolar en puntos centrales de la tabla, resulta conveniente denotar alguno
de dichos puntos centrales como xo' como x" x2' x3
, ... , las abscisas mayores que Xo y
como x_" x_2' x_3
, ... , las abscisas menores que xo. En estas condiciones e introducien-
do el operador lineal 8, conocido como operador en diferencias centrales y definido
sobre f (x) como:
8f(x) =f(x + hl2) - f(x- hl2)
y cuya aplicación sucesiva conduce a:
8 (8f(x)) = 82f(x) =f(x + h) - 2f(x) +f(x- h)
y en general a:
Nótese que 8f (xo) no emplea, en general, los valores de la tabla, la cual constituye una di-
ficultad para su uso. En cambio, la segunda diferencia central
82f(xk
) =f(xk
+ 11) - 2f(xk
) + f(xk
- h)
incluye sólo valores funcionales tabulados; esto es cierto para todas las diferencias centra-
les de orden par. A fin de evitar que se requieran valores funcionales no tabulados en la pri-
mera diferencia central, puede aplicarse 8 a puntos no tabulados; por ejemplo,j (xk
+ hI2) con
la cual queda:
8f (xk + h/2) =t»,+ h) - f (xk) =f(xk +1) - f (xk),
donde ya sólo aparecen valores funcionales de la tabla.
En general 82i+lf(xk + h/2)(orden impar) queda en función de ordenadas presentes en la
tabla.
Con la notación de diferencias divididas se tiene que:
(1)
(2)
388 Métodos numéricos ap licados a la ingeniería
8f(xo + h/2) =f(Xl) - f(xo) = hf[xOxl]
8f(xo - h/2) =f(xo) - f(X_l) = hf[xo, X_l]
82j(Xl) = 8f(x) + h/2) - 8f(xl - h/2) = hf[xl x?] - hf[xo Xl], - ,
= 2! h2f[xo, Xl' X2]
y en genreral:
8 2i+l f (xk -h/2) = h2i+ 1 (2i +1)!f [xk_i_p xk_i'· .. , Xk'· .. , xk+;J
para orden impar y
para orden par.
La tabla de diferencias centrales queda entonces
X_2 f(x_2)
8f (x_2+ h/2)
x_1 f(x_) 82 f(x_l)
8f(x_)+ h/2) 53f(x_) + h/2)
Xo f(xo) 82 f(xo)
8f (xo+ hl2) 53f(xo + h/2)
x) f(xl) 82 f(xl)
8f(x)+ h/2)
x2 f(x2
)
Note que el argumento permanece constante en cualquier línea horizontal de la tabla.
Con esta notación y la aplicación sucesiva de la ecuaciones 3 y 5 con k = O,la 5.29 se trans-
forma en:, "
8f(x +h/2) 82f(xo)
f(x) =f(xo) + (x-xo) O + (X-Xo) (X-Xl) +
l!h 2!h2
83
f(xo + h/2)
(x- xo) (X- Xl) (X- X 1) + ...
- 3!h3
Al emplear el cambio de variable:
X = Xo + sh,
en donde:
X-X
s = __ 0_
h
(3)
(4)
(5)
(6)
(3)
(4)
(S)
5.23
5.24
5.25
a. 5.26
trans-
5.27
(6)
Aproximación funcional e interpolación 389
el polinomio (6) queda
PI1
(xo + sh) = f(xo) + s 8f(xo + h/2) + s (s -1) 82 f(xo) +
2!
S (s2_12) (j3f(xo+h/2)+ s (s2-12)(s-2) 84f(x
o
)+
3! 4!
s (S2 -12) ... (S2 - (i - 1)2) 82if (xo) (s - i)
... + -------------"---
(2i)!
(7)
cuando el grado del polinomio es par; si es impar, el último término de la ecuación 7 que-
da como:
... + S (s2 -1
2
) ... (s2 - i 2) 82; + 1f (xo + h/2)
(2i +1)!
Este polinomio se conoce como la fórmula hacia delante de Gauss.
Con la tabla del ejemplo 5.7 construya una tabla de diferencias centrales y mediante la
ecuación 7 encuentre por interpolación la presión correspondiente a una temperatura de
76°F.
Si aproxima la función dada abajo por un polinomio de segundo grado y con éste interpo-
la en x = 10, estime el error cometido en esta interpolación.
Puntos o 2 3 4 5 6
x o 196 8 11.5 15
f(x) 38000 38500 35500 27500 19000 15700 11000
Demuestre que el término del error para la aproximación polinomial de segundo grado es:
R2 (x) = (x-xo) (X-Xl) (X-X2) f[x, xO,xpx2]
Encuentre una cota inferior y una cota superior del error de interpolación R3(x) en X = 6.3
para la funciónf (x) = et
dada en los puntos Xo= 5, Xl = 6, x2 = 7, x3 = 8 (véase ejemplo 5.11)
Demuestre que la función dada por z(x) = I(x-xo) (x-xl)1 con xo:S; X :s;Xl alcanza su valor
máximo en (xo + xl)/2 y está dado por (Xl - xo)2/4.
Con lo resultados del problema anterior y la fórmula
f(l/+l) (~) 1/
R, (x) = Il (x - x¡),
I (n+ 1)! ;=0
demuestre que el error R¡(x) con Xo :s;X :s;Xl correspondiente a una aproximación lineal de
f (x) usando como argumento Xo y Xl es menor en magnitud (valor absoluto) que
M(xl-x0)2/8, donde M es el valor máximo de If"(x) I en [xo' Xl]'
5.28 Los siguientes valores furon obtenidos de una tabla de distribución biomial.
b p
n X 0.0500 0.1000 0.1500 0.2000 0.2500
3 O 0.8574 0.7290 0.6141 0.5120 0.4219
1 0.1354 0.2430 0.3251 0.3840 0.4219
2 0.0071 0.0270 0.0574 0.0960 0.1406
3 0.0001 0.0010 0.0034 0.0080 0.0156
390 Métodos nurnértcoa aplicados a la ingeniería
Al pie de dicha tabal se lee "la interpolación lineal dará valores exactos de b a lo más en
dos cifras decimales".
Encuentre una aproximación de f (x; n, p) = f (1; 3, 0.13) exacta en tres cifras decimales.
Recuerde que:
b(x; n, p) = (.;') ¡r (l - p)II-X
¿Cree usted que si los valores de la tabla son exactos en las cuatro cifras decimales dadas,
pueda obtenerse exactitud con cuatro cifras decimales aplicando el método de interpola-
ción?
5.29 En la siguiente tabla, r es la resitencia de una bobina en ohms y T la temperatura de la bo-
bina en "C. Por mínimos cuadrados determine el mejor polinomio lineal que representa la
función dada.
r 10.421 10.939 11.321 11.794 12.242 12.668
T 10.50 29.49 42.70 60.01 75.51 91.05
5.30 En la tabla
Puntos O 1 2 3 4 5 6 7 8
v 26.43 22.40 19.08 16.32 14.04 12.12 10.51 9.15 8.00
P 14.70 17.53 20.80 24.54 28.83 33.71 39.25 45.49 52.52
v es el volumen en pie.' de una lb de vapor y P es la presión en psia. Encuentre los pará-
metros a y b de la ecuación
P= a vb
aplicando el método de mínimos cuadrados.
5.31 Se sabe que el número de pulgadas de una estructura recién construida que se hunde en el
suelo está dada por:
y=3-3e-ax
donde x es el número de meses que lleva construida la estructura. Con los valores
x 2 6 12 18 244
y 1.07 2.26 2.992.78 2.971.88
estime a, usando el criterio de los mínimos cuadrados (véase ejercicio 5.8).
5.32 En el estudio de la constante de velocidad k de una reacción química a diferentes tempe-
raturas, se obtuvieron los datos:
T (K) 320 400340 360 380293 300
k 8.53 X lO-s 19.1 X lO-s 1.56 X 10-3 0.01 0.0522 0.2284 0.8631
pará-
en el
mpe-
Aproximación funcional e interpolación 391
Calcule el factor de frecuencia z y la energía de activación E, asumiendo que los datos ex-
perimentales siguen la ley de Arrhenius:
k = z e -El1.98T
Sieder y Tate* encontraron que una ecuación que relaciona la transferencia de calor de lí-
quidos por dentro de tubos en cambiadores de calor, se puede representar con números adi-
mensionales.
ás en
ales.
5.33
adas,
ola-
a bo-
nta la
Nu = a (Re)" (Pr)C (~)d
J-lIV
Donde Nu es el número de Nusselt, Re es el número de Reynolds, Pr el número de Prandtl
y J-l Y J-lw
las viscosidades del líquido a la temperatura promedio de éste y a la temperatura
de la pared del tubo, respectivamente.
Encuentre los valores de a, b, e y d asumiendo que la tabla siguiente representa datos ex-
perimentales para un grupo de hidrocarburos a diferentes condiciones de operación.
Nu 97.45 109.50 129.90 147.76 153.44 168.90 177.65 175.16
Re 10500 12345 15220 18300 21050 25310 28560 31500
Pr 18.2 17.1 16.8 15.3 12.1 10.1 8.7 6.5
J-LlJ-lw
0.85 0.90 0.96 1.05 1.08 1.15 1.18 1.22
5.34 Elabore un programa de propósito general, para aproximar una función dada en forma ta-
bular por un polinomio de grado n usando el método de mínimos cuadrados.
5.35 En una reacción gaseosa de expa
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves
metodos numericos aplicados a la ingenieria   nieves

Más contenido relacionado

PDF
DOCX
Modelos matemáticos
PPTX
Aplicación de las Ecuaciónes Diferenciales Ordinarias aplicadas en el vaciado...
PDF
Ejercicios resueltos- de metodos
PDF
METODOS NUMERICOS para ingenieria -Chapra
PDF
Metodo de diferencias finitas
PDF
RAÍCES DE ECUACIONES NO LINEALES
PPTX
Metodo de la secante
Modelos matemáticos
Aplicación de las Ecuaciónes Diferenciales Ordinarias aplicadas en el vaciado...
Ejercicios resueltos- de metodos
METODOS NUMERICOS para ingenieria -Chapra
Metodo de diferencias finitas
RAÍCES DE ECUACIONES NO LINEALES
Metodo de la secante

La actualidad más candente (20)

ODP
Coeficientes indeterminados
PDF
Problemas sobre vaciado de tanques
PPTX
Diferenciación numérica Metodos Numericos
PDF
Solucionario ecuaciones2
DOCX
Clasificación de las ecuaciones diferenciales
PDF
Ecuaciones diferenciales parciales E.D.P.
PPTX
Conveccion externa forzada
PPT
Ecuacion de bernoulli
PPTX
Sistema críticamente amortiguado
PPSX
Cuadratura de gauss
PDF
Problema 1 de manometría
PDF
Solucionario ecuaciones diferenciales dennis zill[7a edicion]
PPT
Reduccion de orden
PPTX
Método gráfico, Método de bisección y Método de la regla falsa
DOCX
G5 oscilaciones
PPTX
ecuaciones diferenciales de variables separables y ecuaciones diferenciales r...
PDF
Ejercicios resueltos edo homogéneas
PDF
Ajuste de datos e interpolacion
DOCX
Aplicaciones de las ecuaciones diferenciales a problemas vaciado de tanques (...
PDF
Formulario fluidos
Coeficientes indeterminados
Problemas sobre vaciado de tanques
Diferenciación numérica Metodos Numericos
Solucionario ecuaciones2
Clasificación de las ecuaciones diferenciales
Ecuaciones diferenciales parciales E.D.P.
Conveccion externa forzada
Ecuacion de bernoulli
Sistema críticamente amortiguado
Cuadratura de gauss
Problema 1 de manometría
Solucionario ecuaciones diferenciales dennis zill[7a edicion]
Reduccion de orden
Método gráfico, Método de bisección y Método de la regla falsa
G5 oscilaciones
ecuaciones diferenciales de variables separables y ecuaciones diferenciales r...
Ejercicios resueltos edo homogéneas
Ajuste de datos e interpolacion
Aplicaciones de las ecuaciones diferenciales a problemas vaciado de tanques (...
Formulario fluidos
Publicidad

Similar a metodos numericos aplicados a la ingenieria nieves (20)

PDF
Metodos_Numericos_Aplicados_a_la_ingenie (1).pdf
PDF
Calculo numerico
PDF
Metodos numericos con matlab
PDF
Apunte metodosnumericos
PDF
Chapra.pdf
PDF
Chapra(2007)_MetNumParIng.pdf
PDF
CHAPRA Metodos_numericos_para_ingenieros_5e_140.pdf
PDF
Análisis Numérico Benalcazar.pdf
PDF
Metodosnumerics
PDF
Parte1
PDF
ANALISIS NUMERICO_nodrm.pdf
PDF
notas de análisis numerico
PDF
Analisisnumericobasicolibro 130206071310-phpapp01
PDF
Python
PDF
284023562-metodos-numericos-scilab.pdf
PDF
Metodos numericos
PDF
A libro competo metodos numericos para ingenieria
PDF
A libro competo metodos numericos para ingenieria
PDF
A libro competo metodos numericos para ingenieria
PDF
Metodos numéricos ing. seminario vasquez
Metodos_Numericos_Aplicados_a_la_ingenie (1).pdf
Calculo numerico
Metodos numericos con matlab
Apunte metodosnumericos
Chapra.pdf
Chapra(2007)_MetNumParIng.pdf
CHAPRA Metodos_numericos_para_ingenieros_5e_140.pdf
Análisis Numérico Benalcazar.pdf
Metodosnumerics
Parte1
ANALISIS NUMERICO_nodrm.pdf
notas de análisis numerico
Analisisnumericobasicolibro 130206071310-phpapp01
Python
284023562-metodos-numericos-scilab.pdf
Metodos numericos
A libro competo metodos numericos para ingenieria
A libro competo metodos numericos para ingenieria
A libro competo metodos numericos para ingenieria
Metodos numéricos ing. seminario vasquez
Publicidad

Último (20)

PPTX
Presentación - Taller interpretación iso 9001-Solutions consulting learning.pptx
PDF
prg2_t01_p01_Fundamentos POO - parte1.pdf
PDF
Oficio SEC de formulación de cargos por el apagón del 25F en contra del CEN
PDF
TESTAMENTO DE DESCRIPTIVA ..............
PPTX
GEOLOGIA, principios , fundamentos y conceptos
PDF
fulguracion-medicina-legal-418035-downloable-2634665.pdf lesiones por descarg...
DOCX
Cumplimiento normativo y realidad laboral
PPTX
Notificacion e investigación de incidentes y accidentes de trabajo.pptx
PPTX
Seminario de telecomunicaciones para ingeniería
PDF
manual-electricidad-automotriz-sistemas-electricos-bateria-alumbrado-iluminac...
PDF
Oficio SEC 293416 Comision Investigadora
PDF
Sugerencias Didacticas 2023_Diseño de Estructuras Metalicas_digital.pdf
PPTX
NILS actividad 4 PRESENTACION.pptx pppppp
PDF
NORMATIVA Y DESCRIPCION ALCANTARILLADO PLUVIAL.pdf
PDF
5 Presentación de PowerPointGENERACIÓN DESECHOS UIS 18-02-2023 (1).pdf
PPT
Sustancias Peligrosas de empresas para su correcto manejo
PDF
1132-2018 espectrofotometro uv visible.pdf
PPTX
1 CONTAMINACION AMBIENTAL EN EL PLANETA.pptx
PDF
SUBDIVISIÓN URBANA PUEDE ENFRENTAR SERVIDUMBRE DE PASO.pdf
PDF
Perfilaje de Pozos _20250624_222013_0000.pdf
Presentación - Taller interpretación iso 9001-Solutions consulting learning.pptx
prg2_t01_p01_Fundamentos POO - parte1.pdf
Oficio SEC de formulación de cargos por el apagón del 25F en contra del CEN
TESTAMENTO DE DESCRIPTIVA ..............
GEOLOGIA, principios , fundamentos y conceptos
fulguracion-medicina-legal-418035-downloable-2634665.pdf lesiones por descarg...
Cumplimiento normativo y realidad laboral
Notificacion e investigación de incidentes y accidentes de trabajo.pptx
Seminario de telecomunicaciones para ingeniería
manual-electricidad-automotriz-sistemas-electricos-bateria-alumbrado-iluminac...
Oficio SEC 293416 Comision Investigadora
Sugerencias Didacticas 2023_Diseño de Estructuras Metalicas_digital.pdf
NILS actividad 4 PRESENTACION.pptx pppppp
NORMATIVA Y DESCRIPCION ALCANTARILLADO PLUVIAL.pdf
5 Presentación de PowerPointGENERACIÓN DESECHOS UIS 18-02-2023 (1).pdf
Sustancias Peligrosas de empresas para su correcto manejo
1132-2018 espectrofotometro uv visible.pdf
1 CONTAMINACION AMBIENTAL EN EL PLANETA.pptx
SUBDIVISIÓN URBANA PUEDE ENFRENTAR SERVIDUMBRE DE PASO.pdf
Perfilaje de Pozos _20250624_222013_0000.pdf

metodos numericos aplicados a la ingenieria nieves

  • 1. MÉTODOS NUMÉRICOS.... - APLICADOS A LA INGENIERÍA Antonio Nieves Federico C. Domínguez MÉTODOS NUMÉRICOS APLICADOS A LA INGENIERÍA Antonio Nieves Federico C. Domínguez
  • 2. Métodos Numéricos Aplicados a la Ingeniería Antonio Nieves Hurtado Federico C. Domínguez Sánchez Profesores de la Academia de Matemáticas Aplicadas ESIQIE-IPN QUINTA REIMPRESIÓN MÉXICO, 2006 -/ I I COMPAÑÍA EDITORIAL CONTINENTAL Métodos NUDléricos Aplicados a la Ingeniería Antonio Nieves Hurtado Federico C. Domínguez Sánchez Profesores de la Academia de Matemáticas Aplicadas ES/Q/E-/PN QUINTA REIMPRESIÓN MÉXICO,2006 COMPAÑÍA EDITORIAL CONTINENTAL
  • 3. ;:a Para establecer comunicación con nosotros puede hacerlo por: correo: Renacimiento 180, Col. San Juan Tlihuaca, Azcapotzalco, 02400, México, D.F. fax pedidos: (01 55) 5561 4063·5561 5231 e-mail: info@patriacultural.com.mx home page: www.patriacultural.com.mx Dirección editorial: Javier Enrique Callejas Coordinación editorial: Elisa Pecina Rosas Diseño de interiores:Guillermo Rodríguez Luna Diseño de portada: Perla Alejandra López Romo Colaboración especial: DI. Guillermo Marroquín Suárez Profesor de la Academia de Matemáticas Aplicadas ESIQIE - Instituto Politécnico Nacional Revisión técnica: M.C. José Luis Turriza Profesor de Matemáticas ESIME-IPN Métodos Numéricos, aplicados a la ingeniería Derechos reservados respecto a la segunda edición: © 1995, 2002, Antonio Nieves Hurtado / Federico C. Donúnguez Sánchez © 1995, COMPAÑÍA EDITORIAL CONTINENTAL, S.A. DE C.V. © 2002, GRUPO PATRIA CULTURAL, S.A. DE C.V. bajo el sello de Compañía Editorial Continental Renacimiento 180, Colonia San Juan Tlihuaca, Delegación Azcapotzalco, Código Postal 02400, México, D.F. Miembro de la Cámara Nacional de la Industria Editorial Registro núm. 43 ISBN 970-24-0258-1 (segunda edición) (ISBN 968-26-1260-8 primera edición) Queda prohibida la reproducción o transmisión total o parcial del conte- nido de la presente obra en cualesquiera formas, sean electrónicas o mecánicas, sin el consentimiento previo y por escrito del editor. Impreso en México Printed in Mexico Primera edición: 1995 Segunda edición: 2002 Cuarta reimpresión: 2005 Quinta reimpresión: 2006 Para establecer comunicación con nosotros puede hacerlo por: correo: Renacimiento 180, Col. San Juan Tlihuaca, Azcapotzalco, 02400, México, D.F. fax pedidos: (01 55) 5561 4063·5561 5231 e-mail: info@patriacultural.com.mx home page: www.patriacultural.com.mx Dirección editorüü: Javier Enrique Callejas Coordinación editorial: Elisa Pecina Rosas Diseño de interiores:Guillermo Rodríguez Luna Diseño de portada: Perla Alejandra López Romo Colaboración especial: Dr. Guillermo Marroquín Suárez Profesor de la Academia de Matemáticas Aplicadas ESIQIE - Instituto Politécnico Nacional Revisión técnica: M.C. José Luis Turriza Profesor de Matemáticas ESIME-IPN Métodos Numéricos, aplicados a la ingeniería Derechos reservados respecto a la segunda edición: © 1995, 2002, Antonio Nieves Hurtado / Federico C. Dornínguez Sánchez © 1995, COMPAÑÍA EDITORIAL CONTINENTAL, S.A. DE C.V. © 2002, GRUPO PATRIA CULTURAL, S.A. DE C.V. bajo el sello de Compañía Editorial Continental Renacimiento 180, Colonia San Juan Tlihuaca, Delegación Azcapotzalco, Código Postal 02400, México, D.F. Miembro de la Cámara Nacional de la Industria Editorial Registro núm. 43 ISBN 970-24-0258-1 (segunda edición) (ISBN 968-26-1260-8 primera edición) Queda prohibida la reproducción o transmisión total o parcial del conte- nido de la presente obra en cualesquiera formas, sean electrónicas o mecánicas, sin el consentimiento previo y por escrito del editor. Impreso en México Printed in Mexico Primera edición: 1995 Segunda edición: 2002 Cuarta reimpresión: 2005 Quinta reimpresión: 2006
  • 4. ·"F' A los Eggli: Violet (Mom), Fred, Josephine, Richard y David. Gracias Antonio A mis hijos Alura, Alejandra y Federico, a mis hermanos, y a la memoria de mis padres. Federico A los Eggli: Violet (Mom), Fred, Josephine, Richard y David. A mis hijos Alura, Alejandra y Federico, a mis hermanos, y a Gracias Antonio la memoria de mis padres. Federico
  • 5. CONTENIDO PREFACIO xi 1 ERRORES 1 1.1 Sistema numérico 2 1.2 Manejo de números en la computadora 8 1.3 Errores 11 1.4 Algoritmos y estabilidad 19 Ejercicios 20 Problemas 24 2 SOLUCiÓN DE ECUACIONES NO LINEALES 29 2.1 Método de punto fijo 30 ALGORITMO 2. 1 Método de punto fUo 35 2.2 Método de Newton-Raphson 44 ALGORITMO 2.2 Método de Newton-Raphson 47 2.3 Método de la secante 47 ALGORITMO 2.3 Método de la secante 50 2.4 Métod~· de posición falsa 51 ALGORITMO 2.4 Método de posición falsa 54 2.5 Método de la bisecdón 54 2.6 Problemas de los métodos de dos puntos y orden de convergencia 56 2.7 Aceleración de convergencia 59 ALGORITMO 2.5 Método de Steffensen 62 2.8 Búsqueda de valores iniciales 63 2.9 Raíces complejas 69 ALGORITMO 2.6 Método de Mü//er 76 2.10 Polinomios y sus ecuaciones 77 ALGORITMO 2.7 Método de Horner 79 ALGORITMO 2.8 Método de Horner iterado 82 Ejercicios 90 Problemas 117
  • 6. viii Métodos numéricos aplicados a la ingeniería 3 MATRICES y SISTEMAS DE. ECUACIONES LINEALES 129 3.1 Matrices 130 ALGORITMO 3.1 Multiplicación de matrices 136 3.2 Vectores 141 3.3 Independencia y ortogonaUzación de vectores 149 ALGORITMO 3.2 Ortogonalización de Gram Schmidt 159 3.4 Solución de sistemas de ecuaciones lineales 162 ALGORITMO 3.3 Eliminación de Gauss 168 ALGORITMO 3.4 Eliminación de Gauss con pivoteo 172 ALGORITMO 3.5 Método de Thomas 181 ALGORITMO 3.6 Factorización directa 187 ALGORITMO 3.7 Factorización con pivoteo 188 ALGORITMO 3.8 Método de Doolitle 191 .ALGORITMO 3.9 Factorización de matrices simétricas 193 ALGORITMO 3.10 Método de Cholesky 196 3.5 Métodos iterativos 206 ALGORITMO 3.11 Métodos de Jacobi y Gauss-Seidel 216 3.6 Valores y vectores propios 222 Ejercicios 228 Problemas 238 4 SISTEMAS DE ECUACIONES NO L1NE.ALES 255 4 .• Dificultades en la solución de sistemas de ecuaciones no lineales 256 4.2 Método de punto fijo multivariable 259 ALGORITMO 4.1 Método de punto fUo multivariable 265 4.3 Método de Newton-Raphson 266 ALGORITMO 4.2 Método de Newton-Raphson multivariable 273 4.4 Método de Newton-Raphson modificado 275 ALGORITMO 4.3 Método de Newton-Raphson modificado 278 4.5 Método de Broyden 279 ALGORITMO 4.4 Método de Broyden 283 4.6 Aceleración de convergencia 283 ALGORITMO 4.5 Método del descenso de máxima pendiente 297 4.7 Método de Bairstow 299 Ejercicios 304 Problemas 316
  • 7. ----- Contenido ix 5 APROXIMACiÓN FUNCIONAL E INTERPOLACIÓN 332 s.r Aproximación pollnomlal simple e interpolación 325 ALGORITMO 5. 1 Aproximación polinomial simple 328 5.2 Polinomios de Lagrange 328 ALGORITMO 5.2 lnterpotactón de polinomios de Lagrange 333 5.3 Diferencias divididas 334 ALGORITMO 5.3 Tabla de diferencias divididas 338 5.4 Aproximación polinomial de Newton 338 ALGORITMO 5.4 Interpolación polinomial de Newton 342 5.5 Polinomio de Newton en diferencias finitas 343 5.6 Estimación de errores en la aproximación 352 5.7 Aproximación pollnomlal segmentaria 356 5.8 Aproximación (polinomial con mínimos cuadrados 362 ALGORITMO 5.5 Aproximación con mínimos cuadrados 369 5.9 Aproximación~ Jllul!iline~1 con ~ínimos _cuadr~dos 370 Ejercicios 373 Problemas 382 6 INTEGRACiÓN y DIFERENCIACiÓN NUMÉRICA 393 6.t Métodos de Newton Cotes 395 ALGORITMO 6.1 Método trapezoidal compuesto 403 ALGORITMO 6.2 Método de Simpson compuesto 406 6.2 Cuadratura de Gauss 415 ALGORITMO 6.3 Cuadratura de Gauss-Legrange 421 6.3 Integrales múltiples 422 ALGORITMO 6.4 Integración doble por Simpson 1/3 428 6.4 Diferenciación numérica 429 ALGORITMO 6.5 Derivación de polinomios de Lagrange 437 Ejercicios 437 Problemas 448 7 ECUACIONES DlfE.RENCIALES ORDINARIAS 457 7.t Formulación del problema de valor inicial 459 7.2 Método de Euler 460 ALGORITMO 7.1 Método de Euler 463 7.3 Método de Taylor 463
  • 8. X Métodos numéricos aplicados a la ingeniería 7.4 Métodos de Euler modificado 466 ALGORITMO 7.2 Método de Euler modificado 468 7.5 Métodos de Runge-Kutta 469 ALGORITMO 7.3 Método de Runge-Kutta de cuarto orden 473 7.6 Métodos de predicción-corrección 474 ALGORITMO 7.4 Método predictor-corrector 484 7.7 Ecuaclones diferenciales ordinarias de orden superior y sistemas de ecuaciones diferenciales ordinarias 485 ALGORITMO 7.5 Método de Runge-Kutta de cuarto orden para un sistema de dos ecuaciones diferenciales ordinarias 491 01 7.8 formulación del problema de valores en la frontera 492 Ejercicios 496 Problemas 518 8 ECUACIONES DIFERENCIALES PARCIALES 527 8.• Obtención de ecuaclones diferenciales parciales a partir de la modelación de fenómenos físicos (ecuación de calor y ecuación de onda) 528 8.2 Aproximación de derivadas por diferencias finitas 532 8.3 Solución de problemas de calor unldlmenslonal 536 1.11 ALGORITMO 8.1 Método explícito 541 ALGORITMO 8.2 Método implícito 551 8.4 Convergencia (método explícito), estabilidad y consistencia 553 8.5 Método de Crank-Nlcholson 556 ALGORITMO 8.3 Método de Crank-Nicholson 560 8.6 Otros métodos para resolver el problema de conducción de calor en unidimensional 561 8.7 Solución de la ecuación de onda. unidimensional 563 8.8 Tipos de condiciones frontera en procesos físicos y tratamientos de condiciones frontera irregulares 569 Ejercicios 573 Problemas 579 RESPUESTAS A PROBLEMAS SELECCIONADOS 585 ,.# INDICE ANALíTICO 597
  • 9. PREFACIO 66 68 69 73 74 84 85 91 92 96 18 Objetivo del libro 27 El análisis numérico y sus métodos son una dialéctica entre el análisis matemático cualitati- vo y el análisis matemático cuantitativo. El primero nos dice, por ejemplo, que bajo ciertas condiciones algo existe, que es o no único, etcétera, mientras que el segundo complementa al primero, permitiendo calcular aproximadamente el valor de aquello que existe. El análisis numérico es pues: una reflexión sobre los cursos tradicionales de cálculo, álgebra lineal, ecuaciones diferenciales entre otros, concretando en una serie de métodos o algoritmos, cuya característica principal es la posibilidad de obtener resultados numéricos de problemas matemáticos de cualquier tipo a partir de números y un número finito de operaciones aritméticas. La finalidad de este libro es el estudio y uso racional de dichos algoritmo s en diferentes áreas de ingeniería y ciencias.28 32 36 1 1 Enfoque del libro 6 o La noción de algoritmo es un concepto clásico en las matemáticas. Es un concepto muy anterior a la aparición de las computadoras yde las calculadoras. Por ejemplo, en el Papi- ro de Ahmes o de Rhind (de hacia el año 1650 a. C.) se encuentra la técnica de posición falsa aplicada a la solución de ecuaciones lineales y, en el Jiuzhang suanshu (el libro más famoso de la matemática china del año 200 a. C.) se resolvían sistemas de ecuaciones li- neales con el método conocido hoy en día como eliminación de Gauss. En realidad, en la enseñanza básica tradicional todos aprendimos algoritmos como el de la división, la multiplicación y la extracción de raíces cuadradas. Con el transcurso del tiempo, los dos primeros se convierten generalmente en las operaciones más conocidas y practicadas (aunque quizás también, en las más incomprendidas) y, el tercero, en la opera- ción más fácilmente olvidada. A fin de no caer en un curso más de recetas matemáticas desvinculadas y sin sentido, hemos desarrollado el material de este libro en torno a tres ideas fundamentales: el punto fijo, la eliminación de Gauss y la aproximación de funciones. Para instrumentarlas emplea- mos como recursos didácticos, en cada método o situación, diferentes sistemas de repre- sentación: el gráfico, el tabular y el algebraico, y promovemos el paso entre ellos. Con el fin de que el lector vea claramente la relación entre los métodos que estudia en el libro y su aplicación en el contexto real, se resuelven al final de cada capítulo alrededor de diez o más problemas de diferentes áreas de aplicación. De igual manera, hacemos énfasis en el uso de herramientas como la calculadora y la computadora así como la importancia de la visualización en los problemas. Dada la importancia de cada uno de estos aspectos los trataremos con cierto detalle a continuación. 3 9 3 9 5 7 PREFACIO Objetivo del libro El análisis numérico y sus métodos son una dialéctica entre el análisis matemático cualitati- vo y el análisis matemático cuantitativo. El primero nos dice, por ejemplo, que bajo ciertas condiciones algo existe, que es o no único, etcétera, mientras que el segundo complementa al primero, permitiendo calcular aproximadamente el valor de aquello que existe. El análisis numérico es pues: una reflexión sobre los cursos tradicionales de cálculo, álgebra lineal, ecuaciones diferenciales entre otros, concretando en una serie de métodos o algoritmos, cuya característica principal es la posibilidad de obtener resultados numéricos de problemas matemáticos de cualquier tipo a partir de números y un número finito de operaciones aritméticas. La finalidad de este libro es el estudio y uso racional de dichos algoritmos en diferentes áreas de ingeniería y ciencias. Enfoque del libro La noción de algoritmo es un concepto clásico en las matemáticas. Es un concepto muy anterior a la aparición de las computadoras yde las calculadoras. Por ejemplo, en el Papi- ro de Ahmes o de Rhind (de hacia el año 1650 a. C.) se encuentra la técnica de posición falsa aplicada a la solución de ecuaciones lineales y, en el Jiuzhang suanshu (el libro más famoso de la matemática china del año 200 a. C.) se resolvían sistemas de ecuaciones li- neales con el método conocido hoy en día como eliminación de GaU'ss. En realidad, en la enseñanza básica tradicional todos aprendimos algoritmos como el de la división, la multiplicación y la extracción de raíces cuadradas. Con el transcurso del tiempo, los dos primeros se convierten generalmente en las operaciones más conocidas y practicadas (aunque quizás también, en las más incomprendidas) y, el tercero, en la opera- ción más fácilmente olvidada. A fin de no caer en un curso más de recetas matemáticas desvinculadas y sin sentido, hemos desarrollado el material de este libro en tomo a tres ideas fundamentales: el punto fijo, la eliminación de Gauss y la aproximación de funciones. Para instrumentarlas emplea- mos como recursos didácticos, en cada método o situación, diferentes sistemas de repre- sentación: el gráfico, el tabular y el algebraico, y promovemos el paso entre ellos. Con el fin de que el lector vea claramente la relación entre los métodos que estudia en el libro y su aplicación en el contexto real, se resuelven al final de cada capítulo alrededor de diez o más problemas de diferentes áreas de aplicación. De igual manera, hacemos énfasis en el uso de herramientas como la calculadora y la computadora así como la importancia de la visualización en los problemas. Dada la importancia de cada uno de estos aspectos los trataremos con cierto detalle a continuación.
  • 10. p xii Métodos numéricos aplicados a la ingeniería Los métodos numéricos y las herramientas computaclonales COMPUTADORA Dado que cada algoritmo implica numerosas operaciones lógicas, aritméticas y en múlti- ples casos graficaciones, la computadora es fundamental para el estudio de éstos. El bino- mio computadora-lenguaje de alto nivel (Fortran, Basic, C y otros) ha sido utilizado durante muchos años para la enseñanza y el aprendizaje de los métodos numéricos. Y si bien esta fórmula ha sido exitosa y sigue aún vigente, también es cierto que la aparición de paquetes comerciales como Mathcad, Maple, Matlab (por citar algunos de los más co- nocidos) permiten nuevos acercamientos al estudio de los métodos numéricos. Por ejem- plo, han permitido que la programación sea más sencilla y rápida y han facilitado además la construcción directa de gráficas en dos y tres dimensiones, así como la exploración de conjeturas y la solución numérica directa de problemas matemáticos. En respuesta a estas dos vertientes, se acompaña el libro con un CD donde se han mantenido los programas fuente de la primera edición (Fortran, Pascal y C) y se han in- corporado programas en Visual Basic. En numerosos ejemplos, ejercicios y problemas uti- lizamos o sugerimos además el empleo de los paquetes mencionados arriba. Pr4 CALCULADORAS GRAFICADORAS Las calculadoras graficadoras (como la TI-89, TI-92, HP-48 o HP-49) disponen hoy en día de poderosos elementos como: a) Un sistema algebraico computarizado (CAS por sus siglas en inglés) que permite ma- nipulaciones simbólicas y soluciones analíticas de problemas matemáticos. b) La graficación en dos y tres dimensiones con facilidades como el zoom y el trace. c) La posibilidad de resolver numéricamente problemas matemáticos. d) La posibilidad de programar y utilizar a través de dicha programación los recursos mencionados en los incisos anteriores, convirtiéndose así el conjunto lenguaje-recur- sos en una herramienta aún más poderosa que un lenguaje procedural como Basic o C. Finalmente, su bajo costo, portabilidad y posibilidades de comunicación con sitios Web donde es posible actualizar, intercambiar y comprar programas e información, permiten plantear un curso de métodos numéricos sustentado en la calculadora o una combinación de calculadora y computadora. A fin de apoyar esta acción hemos incorporado en muchos de los ejemplos y ejercicios programas en la TI-92. Se Visualización A raíz de las posibilidades gráficas que ofrecen las computadoras y las calculadoras, la vi- sualización ( un recurso natural del ser humano) ha tomado mayor importancia y se ha po- dido utilizar en las matemáticas de diferentes maneras como: en la aprehensión de los conceptos, en la solución de problemas, en la ilustración de los métodos y en general en darle un aspecto dinámico a diversas situaciones físicas. Así, hemos intentado aprovechar cada uno de estos aspectos y aplicarlos a lo largo del libro siempre que fue posible. Por ejemplo, en el capítulo 4, se presentan ilustraciones novedosas de los métodos para resol- ver sistemas de ecuaciones no lineales (inclusive se han puesto en color varias de esas grá- xii Métodos numéricos aplicados a la ingeniería Los métodos numéricos y las herramientas computacionales COMPUTADORA Dado que cada algoritmo implica numerosas operaciones lógicas, aritméticas y en múlti- ples casos graficaciones, la computadora es fundamental para el estudio de éstos. El bino- mio computadora-lenguaje de alto nivel (Fortran, Basic, C y otros) ha sido utilizado durante muchos años para la enseñanza y el aprendizaje de los métodos numéricos. Y si bien esta fórmula ha sido exitosa y sigue aún vigente, también es cierto que la aparición de paquetes comerciales como Mathcad, Maple, Matlab (por citar algunos de los más co- nocidos) permiten nuevos acercamientos al estudio de los métodos numéricos. Por ejem- plo, han permitido que la programación sea más sencilla y rápida y han facilitado además la construcción directa de gráficas en dos y tres dimensiones, así como la exploración de conjeturas y la solución numérica directa de problemas matemáticos. En respuesta a estas dos vertientes, se acompaña el libro con un CD donde se han mantenido los programas fuente de la primera edición (Fortran, Pascal y C) y se han in- corporado programas en Visual Basic. En numerosos ejemplos, ejercicios y problemas uti- lizamos o sugerimos además el empleo de los paquetes mencionados arriba. CALCULADORAS GRAFICADORAS Las calculadoras graficadoras (como la TI-89, TI-92, HP-48 o HP-49) disponen hoy en día de poderosos elementos como: a) Un sistema algebraico computarizado (CAS por sus siglas en inglés) que permite ma- nipulaciones simbólicas y soluciones analíticas de problemas matemáticos. b) La graficación en dos y tres dimensiones con facilidades como el zoom y el trace. c) La posibilidad de resolver numéricamente problemas matemáticos. el) La posibilidad de programar y utilizar a través de dicha programación los recursos mencionados en los incisos anteriores, convirtiéndose así el conjunto lenguaje-recur- sos en una henamienta aún más poderosa que un lenguaje procedural como Basic o C. Finalmente, su bajo costo, portabilidad y posibilidades de comunicación con sitios Web donde es posible actualizar, intercambiar y comprar programas e información, permiten plantear un curso de métodos numéricos sustentado en la calculadora o una combinación de calculadora y computadora. A fin de apoyar esta acción hemos incorporado en muchos de los ejemplos y ejercicios programas en la TI-92. Visualización A raíz de las posibilidades gráficas que ofrecen las computadoras y las calculadoras, la vi- sualización ( un recurso natural del ser humano) ha tomado mayor importancia y se ha po- dido utilizar en las matemáticas de diferentes maneras como: en la aprehensión de los conceptos, en la solución de problemas, en la ilustración de los métodos y en general en darle un aspecto dinámico a diversas situaciones físicas. Así, hemos intentado aprovechar cada uno de estos aspectos y aplicarlos a lo largo del libro siempre que fue posible. Por ejemplo, en el capítulo 4, se presentan ilustraciones novedosas de los métodos para resol- ver sistemas de ecuaciones no lineales (inclusive se han puesto en color varias de esas grá-
  • 11. Prefacio xiii ficas a fin de tener una mejor apreciación de las intersecciones de superficies y de las raí- ces), ilustraciones de conceptos abstractas como el criterio de convergencia del método de punto fijo univariable y la ponderación de pendientes en los métodos de Runge-Kutta. Además se incluyen varios ejercicios en Visual Basic donde se simula algún fenómeno co- mo el de crecimiento de poblaciones (ejercicio 7.13), amortiguación en choques (ejercicio 7.11) y el desplazamiento de una cuerda vibrante (ejemplo 8.5). En estos últimos se pue- den observar los resultados numéricos en tiempo real y la gráfica que van generando e in- cluso modificar los parámetros para hacer exploraciones propias. Todos ellos aparecen en el CD y se identifican con el icono correspondiente. Prerrequlsftos Generalmente los cursos de métodos numéricos siguen a los de cálculo en una variable, el de ecuaciones diferenciales ordinarias y el' de programación. No obstante, consideramos sólo los cursos de cálculo y de programación como prerrequisitos. Los conocimientos de álgebra lineal requeridos así como los elementos básicos para estudiar las técnicas de la ecuaciones diferenciales parciales, se exponen en los capítulos correspondientes. Si bien los conceptos y técnicas analíticas de las ecuaciones diferenciales ordinarias serían bené- ficos y complementarios con los métodos de este curso, no son, sin embargo, material in- dispensable. Secuencias sugeridas Como se dijo antes, el libro se desarrolla alrededor de tres ideas matemáticas fundamen- tales: punto fijo, eliminación de Gauss y aproximación de funciones. Las dos primeras se estudian en los capítulos 2 y 3, respectivamente, y junto con el capítulo 4 constituyen la parte algebraica del libro. Un primer curso (semestral) de métodos numéricos podría orga- nizarse con los primeros cuatro capítulos del libro, seleccionando las secciones que corres- pondan a su programa de estudios o a las necesidades específicas del curso. La tercera idea matemática clave en el libro es la de aproximación de funciones, la cual se presenta en el capítulo 5 y sustenta el material de análisis: integración y deriva- ción numérica (capítulo 6), y más adelante será la base de la parte de dinámica: ecuacio- nes diferenciales ordinarias y parciales (capítulos 7 y 8, respectivamente). De este modo un curso semestral podría configurarse con los capítulos 1,5,6,7 o bien 1,5,6,7 Y 8 (ver red de temas e interrelación). Debido a esto y al hecho de que algunos tecnológicos y universidades sólo tiene un curso de un semestre de métodos numéricos, podría elaborarse éste con una secuencia co- mo capítulos 1,2,3,5 o bien 1,2,5,6, por ejemplo. Finalmente, recomendamos al maestro que cualquiera que sea la secuencia y las sec- ciones elegidas en cada una de ellas, se discuta y trabaje con los ejemplos resueltos de fi- nal de cada capítulo. Prefacio xiii ficas a fin de tener una mejor apreciación de las intersecciones de superficies y de las raí- ces), ilustraciones de conceptos abstractos como el criterio de convergencia del método de punto fijo univariable y la ponderación de pendientes en los métodos de Runge-Kutta. Además se incluyen varios ejercicios en Visual Basic donde se simula algún fenómeno co- mo el de crecimiento de poblaciones (ejercicio 7.13), amortiguación en choques (ejercicio 7.11) y el desplazamiento de una cuerda vibrante (ejemplo 8.5). En estos últimos se pue- den observar los resultados numéricos en tiempo real y la gráfica que van generando e in- cluso modificar los parámetros para hacer exploraciones propias. Todos ellos aparecen en el CD y se identifican con el icono correspondiente. Prerrequisitos Generalmente los cursos de métodos numéricos siguen a los de cálculo en una variable, el de ecuaciones diferenciales ordinarias y el'de programación. No obstante, consideramos sólo los cursos de cálculo y de programación como prerrequisitos. Los conocimientos de álgebra lineal requeridos así como los elementos básicos para estudiar las técnicas de la ecuaciones diferenciales parciales, se exponen en los capítulos correspondientes. Si bien los conceptos y técnicas analíticas de las ecuaciones diferenciales ordinarias serían bené- ficos y complementarios con los métodos de este curso, no son, sin embargo, material in- dispensable. Secuencias sugeridas Como se dijo antes, el libro se desarrolla alrededor de tres ideas matemáticas fundamen- tales: punto fijo, eliminación de Gauss y aproximación de funciones. Las dos primeras se estudian en los capítulos 2 y 3, respectivamente, y junto con el capítulo 4 constituyen la parte algebraica del libro. Un primer curso (semestral) de métodos numéricos podría orga- nizarse con los primeros cuatro capítulos del libro, seleccionando las secciones que corres- pondan a su programa de estudios o a las necesidades específicas del curso. La tercera idea matemática clave en el libro es la de aproximación de funciones, la cual se presenta en el capítulo 5 y sustenta el material de análisis: integración y deriva- ción numérica (capítulo 6), y más adelante será la base de la parte de dinámica: ecuacio- nes diferenciales ordinarias y parciales (capítulos 7 y 8, respectivamente). De este modo un curso semestral podría configurarse con los capítulos 1,5,6,7 o bien 1,5,6,7 Y8 (ver red de temas e interrelación). Debido a esto y al hecho de que algunos tecnológicos y universidades sólo tiene un curso de un semestre de métodos numéricos, podría elaborarse éste con una secuencia co- mo capítulos 1,2,3,5 o bien 1,2,5,6, por ejemplo. Finalmente, recomendamos al maestro que cualquiera que sea la secuencia y las sec- ciones elegidas en cada una de ellas, se discuta y trabaje con los ejemplos resueltos de fi- nal de cada capítulo.
  • 12. -----------------_._--==~-------------------------------~¿..--------~ xiv Métodos numéricos aplicados a la ingeniería Red de temas e interrelación I Capítulo 1 ~Errores ~ Capítulo 2 Capítulo 3 Solución de ecuaciones no lineales Matrices y sistemas de ecuaciones lineales ~ , Capítulo 4 Sistemas de ecuaciones no lineales t Capítulo 5 Capítulo 6 Aproximación funcional e Integración y diferenciación interpolación numérica 1 I 1t Capítulo 8 Capítulo 7 Ecuaciones diferenciales parciales Ecuaciones diferenciales ordinarias M. ___ Dependencia en requisitos básicos y mecánica de cálculo de los algoritmo s .•. Dependencia solamente de la mecánica de cálculo de los algoritmos Cambios esenciales en esta edición La mayoría de estos cambios responden a sugerencias de profesores que imparten méto- dos numéricos en diferentes instituciones del país. • A dónde nos dirigimos. Se inicia cada capítulo con una introducción donde se descri- be brevemente qué estudiaremos, cómo lo vamos a hacer, qué relación guarda el ma- terial con el de los demás capítulos y, algunas veces, el tipo de problemas que pueden resolverse. Guiones de Matlab. Se incluyen en el libro y en la carpeta Software de cada capítulo del CD guiones de Matlab para distintos ejercicios, ejemplos y problemas. • Programas en la TI-92. A lo largo del libro se dan programas para la TI-92. • Programas en Visual Basic. A fin de aprovechar los aspectos visuales de los lengua- jes actuales, en el CD se proporcionan programas en Visual Basic que pueden ser mo- dificados para adaptarlos a otras situaciones. • Nuevos ejemplos, ejercicios y problemas. Se han adicionado ejercicios y problemas de aplicación para darle mayor versatilidad al material. • Soluciones a ejemplos y ejercicios en Matlab, Mathcad y Mathematica en el CD. • Sección de valores y vectores propios. El material de valores y vectores propios que aparecía originalmente disperso se ha organizado como la sección 3.6.
  • 13. Prefacio XV • Sección de problemas de valores a la frontera. Se ha incorporado la sección 7.7 don- de se estudian ecuaciones diferenciales ordinarias con valores a la frontera. • Método de Bairstow. Se ha incorporado el método de Bairstow para encontrar raíces de ecuaciones polinomiales en la sección 4.7 como una aplicación de las técnicas de solución de ecuaciones no lineales. • Ecuación de onda unidimensional. En la nueva sección 8.7 se resuelve la ecuación de onda de modo de trabajar con ecuaciones hiperbólicas y experimentar con el fenóme- no de vibración de una cuerda. • leonas utilizados en la segunda edición. El libro se rediseñó íntegramente para facilitar su lectura. En particular, se incluyeron los iconos que aparecen a continuación para per- mitir al lector identificar con rapidez los nuevos apoyos con los que cuenta el libro. Guiones de Matlab. liiiI ~ Programas para la calculadora TI-92. Indica un programa en Visual Basic que se ha incluido el! el CD y que le ayudan en la solución de ese ejercicio o ejemplo. La solución se incluye en el CD (en Mathcad, Matlab y Mathematica). Materiales adicionales CD diseñado especialmente para la segunda edición con: Programas fuente en Visual Basic y sus respectivos ejecutables que corren en Win- dows 95 o posterior para la solución de ejemplos y ejercicios. • Documentos de Mathcad y guiones de Matlab. Los documentos en Mathcad permiten darle un sentido exploratorio a los métodos numéricos y los guiones segundos acceso a uno de los paquetes más poderosos para resolver problemas matemáticos. • Algoritrnos, descripción de los programas de cómputo y explicaciones detalladas de su uso. • Ligas a sitios donde el lector encontrará tutoriales de Mathcad, Matlab y Mathemati- ea, en los que podrá aprender a usar estos paquetes. • Sugerencias de empleo de software comercial (Mathcad y Matlab, Mathematica) para resolver un gran número de ejemplos y ejercicios. www. Sitio Web con: • Actualizaciones del material del libro (nuevas soluciones, problemas, programas, etcé- tera). • Registro del usuario a fin de recibir las actualizaciones del material del libro y los pro- gramas que se desarrollen más adelante (se están escribiendo los programas en For- tran 90 y en Visual C++), así como poder enviar sus propias sugerencias o establecer comunicación directa con los autores. • Para tener acceso a este material, el lector sólo necesita entrar a la página de Grupo Patria Cultural (http://www.patriacultural.com.mxJnieves/index.html) e ingresar los datos de la obra. Prefacio XV • Sección de problemas de valores a la frontera. Se ha incorporado la sección 7.7 don- de se estudian ecuaciones diferenciales ordinarias con valores a la frontera. • Método de Bairstow. Se ha incorporado el método de Bairstow para encontrar raíces de ecuaciones polinomiales en la sección 4.7 como una aplicación de las técnicas de solución de ecuaciones no lineales. • Ecuación de onda unidimensional. En la nueva sección 8.7 se resuelve la ecuación de onda de modo de trabajar con ecuaciones hiperbólicas y experimentar con el fenóme- no de vibración de una cuerda. • Iconos utilizados en la segunda edición. El libro se rediseñó íntegramente para facilitar su lectura. En patticular, se incluyeron lo~ iconos que aparecen a continuación para per- mitir al lector identificar con rapidez los nuevos apoyos con los que cuenta el libro. liiiI ~ Guiones de Matlab. Programas para la calculadora TI-92. Indica un programa en Visual Basic que se ha incluido en el CD y que le ayudan en la solución de ese ejercicio o ejemplo. La solución se incluye en el CD (en Mathcad, Matlab y Mathematica). Materiales adicionales tJ CD diseñado especialmente para la segunda edición con: • Programas fuente en Visual Basic y sus respectivos ejecutables que corren en Win- dows 95 o posterior para la solución de ejemplos y ejercicios. • Documentos de Mathcad y guiones de Matlab. Los documentos en Mathcad permiten darle un sentido exploratorio a los métodos numéricos y los guiones segundos acceso a uno de los paquetes más poderosos para resolver problemas matemáticos. • Algoritmos, descripción de los programas de cómputo y explicaciones detalladas de su uso. • Ligas a sitios donde el lector encontrará tutoriales de Mathcad, Matlab y Mathemati- ca, en los que podrá aprender a usar estos paquetes. • Sugerencias de empleo de software comercial (Mathcad y Matlab, Mathematica) para resolver un gran número de ejemplos y ejercicios. www. Sitio Web con: • Actualizaciones del material del libro (nuevas soluciones, problemas, programas, ei¡;é- tera). • Registro del usuario a fin de recibir las actualizaciones del material del libro y los pro- gramas que se desarrollen más adelante (se están escribiendo los programas en For- tran 90 y en Visual C++), así como poder enviar sus propias sugerencias o establecer comunicación directa con los autores. • Para tener acceso a este material, el lector sólo necesita entrar a la página de Grupo Patria Cultural (http://www.patriacultural.com.mxJnieves/index.html) e ingresar los datos de la obra. /
  • 14. -------------------------------------------------------------'I!!<;"'I1"""""----- I XVI Métodos numéricos aplicados a la .ingeniería eA Agradecimientos Esta obra tiene su origen en apuntes para los cursos de métodos numéricos en la carrera de Ingeniero Químico Industrial del Instituto Politécnico Nacional, desarrollados durante una estancia de año sabático en el Instituto Tecnológico de Celaya, y posteriormente, a raíz de un certamen organizado por el propio IPN, se convirtieron en una propuesta de libro que ganó el primer lugar en el Primer Certamen Editorial Politécnico en 1984. Desde enton- ces, con actualizaciones continuas, ha sido utilizado como texto para estos cursos en dife- rentes instituciones del país. Los autores agradece~ al Instituto Politécnico Nacional la' facilidad que otorgó para que la Editorial CECSA lo publicara. Agradecemos también a las muchas personas que en distintas formas colaboraron pa- ra la realización de este libro. En, especial al Dr. Guillermo Marroquín Suárez por el ma- terial, ideas y colaboración intensa que durante un año aportó a la elaboración de los capítulos 5 a 8; su valiosa ayuda permitió darle un enfoque interesante de aplicación al material matemático; sus observaciones a las soluciones enriquecieron el análisis de los ejercicios. Al Ing. Arturo Javier López García por el programa del método de Müller y al M. en C. Ramón Duarte Ramos por su asesoría en los problemas de vigas y columnas. Nuestro agradecimiento especial al personal de la Editorial CECSA, y en particular a Elisa Pecina Rosas, nuestra editora, por su interés constante en lograr una óptima presen- tación técnica, de estilo y de diseño gráfico en el libro. Intr F usa XVI Métodos numéricos aplicados a la .ingeniería Agradecimientos Esta obra tiene su origen en apuntes para los cursos de métodos numéricos en la carrera de Ingeniero Químico Industrial del Instituto Politécnico Nacional, desarrollados dumnte una estancia de año sabático en el Instituto Tecnológico de Celaya, y posteriormente, a raíz de un certamen organizado por el propio IPN, se convirtieron en una propuesta de libro que ganó el primer lugar en el Primer Certamen Editorial Politécnico en 1984. Desde enton- ces, con actualizaciones continuas, ha sido utilizado como texto para estos cursos en dife- rentes instituciones del país. Los autores agradece~ al Instituto Politécnico Nacional la' facilidad que otorgó para que la Editorial CECSA lo publicara. Agradecemos también a las muchas personas que en distintas formas colaboraron pa- ra la realización de este libro. En.especial al Dr. Guillermo Marroquín Suárez por el ma- terial, ideas y colaboración intensa que durante un año aportó a la elaboración de los capítulos 5 a 8; su valiosa ayuda permitió darle un enfoque interesante de aplicación al material matemático; sus observaciones a las soluciones enriquecieron el análisis de los ejercicios. Al Ing. Arturo Javier López García por el programa del método de Müller y al M. en C. Ramón Duarte Ramos por su asesoría en los problemas de vigas y columnas. Nuestro agradecimiento especial al personal de la Editorial CECSA, y en particular a Elisa Pecina Rosas, nuestra editora, por su interés constante en lograr una óptima presen- tación técnica, de estilo y de diseño gráfico en el libro.
  • 15. rade e una íz de que nton- dife- al la n pa- ma- e los ón al e los yal as. lara sen- CP'PÍTULO t ERRORES A dónde nos dirigimos "' En este capítulo revisaremos tres de los sistemas numéricos posicionales másrelevan- tes en el estudio de los métodos numéricos: binario, octal y decimal. Para esto analiza- remos las conversiones entre ellos, la representación y manejo del sistema binario en la computadora, así como los diversos errores que ello puede ocasionar y algunas formas de evitados. Dada la naturaleza electrónica de las calculadoras y computadoras, los sis- temas binario y octal resultan los más indicados a usarse en estos dispositivos; por lo que, a fin de tener una idea de·los procesos numéricos internos en ellas, conviene hacer un estudio de tales sistemas y su conversión al decimal, ya que éste es finalmente nues- tro medio de enlace con las máquinas. Por mi lado, dada la finititud de la palabra de memoria de las máquinas, es imfo- sible representar a todos los números reales en ella. Así, números como Te, [2, :3 = 0.333 ..., números muy pequeños" (o muy grandes) se manejan usando números que son aproximaciones de ellos o simplemente no se manejan. Por otro lado, una de las carac- terísticas más sobresalientes de los métodos numéricos es el uso de los números reales en cálculos extensos. Cabe entonces preguntarse qué efecto tienen tales aproximacio- nes en los cálculos que hacemos con dichos números, en los resultados que obtenemos e incluso qué números reales pueden representarse exactamente en la computadora. El conocimiento de todo esto nos ayudará a evitar cierto tipo de errores, analizar su propagación e incluso interpretar mejor los resultados dados por una máquina. Introducción En la antigüedad, los números naturales se representaban con distintos tipos de símbolos o numerales. A continuación se presentan algunas muestras de numerales primitivos. (Fig. 1.1 Y 1.2). ~ • 11 • 3: • m6 -• - 11 - 16 -1 - -• • ~ • • I • • ~ 7 - - 17 -2 •• ~ 12 -- -.. ~ ••• ~ ••• E ••• ~ 8 -3 ••• - 13 - 18 -- - a 9 •••• ~ •••• ~ •••• ~ 4 •••• - 14 - 19 -- --~ 10 -11 mCERO ~~ 5 -- - 15 -- Figura 1.1 Numerales usados por los mayas. • En estos casos la computadora envía un mensaje indicando que el número es muy pequeño (underf/ow) o muy grande ioverflow¡ para su capacidad.
  • 16. 2 Métodos numéricos aplicados a la ingeniería UNO DOS TRES CUATRO 1 1 111 1111 • • • ••• • • • •Figura 1.2 ~ ~ ~ ~Numerales - primitivos. En la figura 1.2 se puede observar que cada numeral es un conjunto de marcas sencillas e iguales. ¡Imagínese si así se escribiera el número de páginas del directorio telefónico de la Ciudad de México! No sería práctico por la enorme cantidad de tiempo y de espacio que requeriría tal sucesión de marcas iguales. Más aún, nadie podría reconocer, a primera vis- ta, el número representado. Por ejemplo, ¿podría identificar rápidamente el siguiente nu- meral? = ? Los antiguos egipcios evitaron algunos de los inconvenientes de los numerales represen- tados por medio de marcas iguales, usando un solo jeroglífico o figura. Por ejemplo, en lu- gar de 1 1 1 1 1 1 11 ! 1, usaron el símbolo 11. Este jeroglífico representaba el hueso del talón. En la Fig. 1.3 se muestran otros numerales egipcios básicos relacionados con los del sistema decimal que les corresponden. 10 100 1,000 10,000 100,000 1'000,000 ~ n © 1. r( P<CY ;y Figura 1.3 Raya Hueso del Cuerda Flor de Dedo Pez Hombre Números egipcios talón enrollada loto señalado sorprendido antiguos. 1.1 Sistemas numéricos NUMERACiÓN CON BASE DOS (SISTEMA BINARIO) Dado el siguiente conjunto de marcas simples e iguales 1, si se encierran en óvalos por parejas, a partir de la izquierda, se tiene.
  • 17. se de ue ¡s- u- en- lu- eso on Errores 3 A continuación, también empezando por la izquierda, se encierra cada par de óvalos en otro mayor. ~_I @)@_'_9 Finalmente, se encierra cada par de óvalos en uno mayor todavía, comenzando también por la izquierda. Nótese que el número de marcas dentro de cualquier óvalo es una potencia de 2. El número representado por el numeral I I se obtiene así o también Hay que observar que en esta suma no aparece 22. Como O X 22 = O,entonces la suma pue- de escribirse así Ahora puede formarse un nuevo símbolo para representar esta suma omitiendo los parén- tesis, los signos de operación + y X, Y las potencias de 2, de la siguiente manera: ( 1 X 23 ) 1 1 + (O X 22 ) 1 O + ( 1 X 21) + ( 1 X 2° ) 1 1 Nuevo símbolo: 1 1 Ahora bien, ¿cómo interpretaremos este nuevo símbolo? El significado de los números 1 en este nuevo símbolo depende del lugar que ocupan en el numeral. Así pues, el primero de derecha a izquierda representa una unidad; el segun- do, un grupo de dos (o bien 2'), el cuarto cuatro grupos de dos (8, o bien 23). El cero es el medio de asignarle a cada "1" su posición correcta. A los números o potencias de 2 que re- presentan el "1" según su posición en el numeral, se les llama valores de posición; se dice que un sistema de numeración que emplea valores de posición es un sistema posicional. El sistema de este ejemplo es un sistema de base dos, o sistema binario, porque em- plea un grupo básico de dos símbolos: Oy 1. Los símbolos "1" y "O" utilizados para escri- bir los numerales se denominan dígitos binarios o bits. ¿Qué número representa el numerallOlOlOdos? (Se lee: "uno, cero, uno, cero, uno, cero, base dos"). Escríbanse los valores de posición debajo de los dígitos: Dígitos binarios 1 Valores de posición 1 OO Multiplicando los valores de posición por los dígitos binarios correspondientes y sumán- dolos todos, se obtiene el equivalente en decimal. Errores 3 A continuación, también empezando por la izquierda, se encierra cada par de óvalos en otro mayor. ~_I _@>@_'_9 Finalmente, se encierra cada par de óvalos en uno mayor todavía, comenzando también por la izquierda. Nótese que el número de marcas dentro de cualquier óvalo es una potencia de 2. El número representado por el numeral I I se obtiene así o también Hay que observar que en esta suma no aparece 22. Como O X 22 =O, entonces la suma pue- de escribirse así Ahora puede formarse un nuevo símbolo para representar esta suma omitiendo los parén- tesis, los signos de operación + y x, Ylas potencias de 2, de la siguiente manera: ( 1 X 23 ) + (O X 22 ) + (1 X 21 ) + ( 1 X 2° ) 1 1 1 1 Nuevo símbolo: O 1 1 Ahora bien, ¿cómo interpretaremos este nuevo símbolo? El significado de los números 1 en este nuevo símbolo depende del lugar que ocupan en el numeral. Así pues, el primero de derecha a izquierda representa una unidad; el segun- do, un grupo de dos (o bien 21), el cuarto cuatro grupos de dos (8, o bien 23). El cero es el medio de asignarle a cada "1" su posición correcta. A los números o potencias de 2 que re- presentan el "1" según su posición en el numeral, se les llama valores de posición; se dice que un sistema de numeración que emplea valores de posición es un sistema posicional. El sistema de este ejemplo es un sistema de base dos, o sistema binario, porque em- plea un grupo básico de dos símbolos: Oy 1. Los símbolos "1" y "O" utilizados para escri- bir los numerales se denominan dígitos binarios o bits. ¿Qué número representa el numerallOlOlOdos? (Se lee: "uno, cero, uno, cero, uno, cero, base dos"). Escríbanse los valores de posición debajo de los dígitos: Dígitos binarios 1 Valores de posición O 1 Multiplicando los valores de posición por los dígitos binarios correspondientes y sumán- dolos todos, se obtiene el equivalente en decimal.
  • 18. 4 Métodos numéricos aplicados a la ingeniería 10101Odos== (1 X 25) + (O X 24) + (1 X 23) + (O X 22) + (1 X 2') + (O X 2°) 42diez (se lee: "cuatro, dos, base diez"). El sistema de numeración más difundido en la actualidad es el sistema decimal. Es un sis- tema posicional que usa un grupo básico de diez (base diez). Considérese por ejemplo el numeral 582diez EjE Dígitos decimales Valores de posición Forma desarrollada 8 lO' (8 X 10') + Al escribir números decimales se omite la palabra "diez" y se establece la convención de que un numeral con valor de posición, es un número decimal, sin necesidad de indicar la base. De ahí que siempre se anote 582 en lugar, de 582diez ' El desarrollo y arraigo del sistema decimal, quizá se deba al hecho de tener siempre a la vista, los diez dedos de las manos. El sistema binario se emplea en las computadoras di- gitales, debido a que los alambres que forman los circuitos electrónicos presentan sólo dos estados: magnetizados o no magnetizados, ya sea que pase o no corriente por ellos. CONVERSiÓN DE NÚMEROS ENTEROS DEL SISTEMA DECIMAL A UN SISTEMA DE BASE b y VICEVERSA Para convertir un número n del sistema decimal a un sistema con base b, se divide el nú- mero n entre la base b y se registra el cociente e, y el residuo rI resultantes; se divide e, entre la base b, y se anotan el nuevo cociente e2 y el nuevo residuo r2 . Este procedimien- to se repite hasta oblener un cociente e¡ igual a cero con residuo ri • El número equivalen- te a n en el sistema con base b queda formado así: ri ri_' ri_2 ... r,. Convierta 35810 al sistema octa!. Solución La base del sistema octal" es 8, por tanto ~ 358 == 8 X 44 + 632 e, r, 44 8 X 5 + 4 e2 r2 5 8 X O + 5 Así que el número equivalente en octal es 546 • El sistema octal usa un grupo básico de ocho símbolos: 0, 1,2,3,4,5,6,7.
  • 19. sis- de la ea di- dos Errores 5 Convierta 35810 a binario (base 2). Solución 358 2 x 179 + O ~ 179 2 x 89 + 1 89 2 x 44 + 1 44 2 x 22 + O 22 2 x 11 + O 11 2 x 5 + 1 5 2 x 2 + 1 2 2 x 1 + O 1 2 x O + 1 Por tanto 3580 = 1011001102 Para convertir un entero m de un sistema con base b al sistema decimal, se multiplica ca- da dígito de m por la base b elevada a una potencia igual a la posición del dígito, tomando como posición cero la del dígito situado más a la derecha. De la suma resulta el equiva- lente decimal. Así 2768 = 2 X 82 + 7 X 81 + 6 X 8° = 19010 10100012 = 1 X 26 + O X 25 + 1 X 24 + O X 23 + O X 22 + O X 21 + 1 X 2° = 8110 CONVERSiÓN DE NÚMEROS ENTEROS DEL SISTEMA OCTAL AL BINARIO y VICEVERSA Dado un número del sistema octal, su equivalente en binario se obtiene sustituyendo ca- da dígito del número octal con los tres dígitos equivalentes del sistema binario. Base octal Equivalente binario en tres dígitos O 000 1 001 2 010 3 011 4 100 5 101 6 110 7 111
  • 20. 6 Métodos numéricos aplicados a la ingeniería Ejemplo 1.3 Convierta 5468 a binario. EjelT Solución 5 101 4 100 6 110 Así que 5468 = 1011001102 Dado un número en binario, su equivalente en octal se obtiene formando temas de dígitos, contando de derecha a izquierda y sustituyendo cada terna por su equivalente en octal. Así Convertir 100110012 a octal 010 011 0012 Por tanto 100110012 = 2318 2 3 1 Dado que la conversión de octal a binario es simple y la de decimal a binario resulta muy tediosa, se recomienda usar la conversión a octal como paso intermedio al convertir un nú- mero decimal a binario. I DECIMAL l+-o ----+0 I OCTAL l+-o ----+0 I BINARlO J Las flechas tienen dos sentidos porque es válido en ambas direcciones lo dicho. Ejemplo 1.4 Convierta 1011001102 a decimal. Solución a) Conversión directa 1011001102 = 1 X 28 + O X 27 + 1 X 26 + 1 X 25 + O X 24 + O X 23 + 1 X 22 + 1 X 2¡ + O X 20 = 35810 b) Usando la conversión a octal como paso intermedio: 1) Conversión a' octal 101 5 100 4 110 6 Por tanto 1011001102 = 5468 2) Cónversión de octal a decimal 5468 = 5 X 82 + 4 X 81 + 6 X 80 = 35810 CONVERSIÓN DE NÚMEROS FRACCIONARIOS DEL SISTEMA DECIMAL A UN SISTEMA CON BASE b Ej Para convertir un número x¡o fraccionario a un número con base b, se multiplica dicho nú- mero por la base b; el resultado tiene una parte entera el Yuna parte fraccionariaj.. Se mul- tiplica ahora f por b y se obtiene un nuevo producto con parte entera e2 y fraccionaria j.. Este procedimiento se repite un número suficiente de veces o hasta que se presenta.t¡ = O.El equivalente de xlO con base b queda así O. e¡ e2 e3 e4 .•• 6 Métodos numéricos aplicados a la ingeniería Ejemplo 1.3 Convierta 5468 a binario. Solución 5 101 Así que 5468 = 1011001102 4 100 6 110 Dado un número en binario, su equivalente en octal se obtiene formando ternas de dígitos, contando de derecha a izquierda y sustituyendo cada terna por su equivalente en octal. Así Convertir 100110012 a octal 010 Oll 0012 Por tanto 100110012 = 231 8 2 3 1 Dado que la conversión de octal a binario es simple y la de decimal a binario resulta muy tediosa, se recomienda usar la conversión a octal como paso intermedio al convertir un nú- mero decimal a binario. I DECIMAL I~----+'I OCTAL I~'---,I BINARIO J Las flechas tienen dos sentidos porque es válido en ambas direcciones lo dicho. Ejemplo 1.4 Convierta 1011001102 a decimal. Solución a) Conversión directa 1011001102 = 1 X 28 + O X 27 + 1 X 26 + 1 X 25 + O X 24 + O X 23 + 1 X 22 + 1 X 2] + O X 20 =358'0 b) Usando la conversión a octal como paso intermedio: 1) Conversión a' octal 101 5 100 4 Por tanto 1011001102 = 5468 2) Cónversión de octal a decimal 110 6 5468 = 5 X 82 + 4 X 8] + 6 X 80 = 35810 CONVERSIÓN DE NÚMEROS FRACCIONARIOS DEL SISTEMA DECIMAL A UN SISTEMA CON BASE b Para convertir un número x]O fraccionario a un número con base b, se multiplica dicho nú- mero por la base b; el resultado tiene una parte entera e] y una parte fraccionaria!]. Se mul- tiplica ahora!] por b y se obtiene un nuevo producto con parte entera e2 y fraccionaria!2' Este procedimiento se repite un número suficiente de veces o hasta que se presentaj¡ = O. El equivalente de xlO con base b queda así O. e] e2 e3 e4 ...
  • 21. Errores 7 Ejemplo 1.5! Convierta 0.210 a octal y binario. Solución a) Conversión a octal tos, Así 0.2 X 8 1.6 e.f, 0.8 X8 6.4 eJ3 0.2 X 8 1.6 esfs Después de e4 se van a repetir el el e2 e3 e4 indefinidamente, por lo que 0.210 = 0.14631463"'8 b) Conversión a binario uy ú- 0.2 0.4 0.8 0.6 0.2 X2 X2 X2 X2 X2 - -- -- -- 0.4 0.8 1.6 1.2 0.4 elJ; e2f2 e3f3 e4f4 esfs Igual que en el inciso a), después de e4 se repite el e2 e3 e4 indefinidamente, por 10 que 0.210 = 0.001100110guatda.com/cmx.p011...2 I Obsérvese que 0.210 pudo convertirse en binario simplemente tomando su equivalente en octal, y sustituyendo cada número por su tema equivalente en binario. Así 0.210 = 0.1 0.001 463 1 100 110 011 001 463 100 110 011 y 0.210 = 0.0011001100110011001100110011"'2 De lo anterior se puede observar que 358.210 = 101100110.001100110011001100110011"'2 y cualquier número con parte entera y fraccionaria puede pasarse a otro sistema, cambian- do su parte entera y fraccionaria de manera independiente, y al final integrándolos. Para convertir números decimales enteros y fraccionario s a base 2,3, ... ,9 puede usar el P~OGRAMA 1.1 del CD. 6 32 CONVERSiÓN DE UN NÚMERO FRACCIONARIO EN SISTEMA BINARIO A SISTEMA DECIMAL El procedimiento es similar al caso de números enteros, sólo hay que tomar en cuenta que la posición inicia con -1, a partir del punto. Convierta 0.0101011102 a decimal Solución 0.010101110 = O X 2-1 + 1 X 2-2 + O X 2-3 + 1 X 2-4 + O X 2-s + 1 X 2-6 + 1 X 2-7 + 1 X 2-8 +0 X 2-9 = 0.3398437510
  • 22. 8 Métodos numéri cos aplicados a la ingeniería Convierta 0.0101011102 a decimal. Solución a) Conversión a octal 0.010 2 110 6 101 5 y 0.0101011102 = 0.2568 b) Conversión a decimal 0.2568 = 2 X 8-1 + 5 X 8-2 + 6 X 8-3 = 0.33984375'0 1.2 Manejo de números en la computadora Por razones prácticas, sólo puede manejarse una cantidad finita de bits para cada número en una computadora, y esta cantidad o longitud varía de una máquina a otra. Por ejemplo, cuando se realizan cálculos de ingeniería y ciencias, es mejor trabajar con una longitud grande; por otro lado, una longitud pequeña es más económica y útil para cálculos y pro- cesamientos administrativos. Para una computadora dada, el número de bits generalmente se llama palabra. Las pa- labras van desde ocho bits hasta 64 bits. Para facilitar su manejo, la palabra se divide en partes más cortas denominadas bytes; por ejemplo, una palabra de 32 bits puede dividirse en cuatro bytes (ocho bits cada uno). d NÚMEROS ENTEROS Cada palabra, cualquiera que sea su longitud, almacena un número, aunque en ciertas cir- cunstancias se usan varias palabras para contener un número. Por ejemplo, considérese una palabra de 16 bits para almacenar números enteros. De los 16 bits, el primero repre- senta el signo del número; un cero es un signo más y un uno un signo menos. Los 15 bits restantes pueden usarse para guardar números binarios desde 000000000000000 hasta 111111111111111 (véase figura 1.1). Al convertir este número en decimal se obtiene (l X 214) + (l X 213) + (1 X 212) + ... + (1 X 21) + (l X 2°) que es igual a 32767 (215 -1). Por tanto, cada palabra de 16 bits puede contener un nú- mero cualquiera del intervalo -32768 a + 32767 (véase Probo 1.10). Figura 1.4 Esquema de una palabra de 16 bits para un número entero. 16 bits :Iibit O bit 15 8 Métodos numéricos aplicados a la ingeniería Convierta 0.0101011102 a decimal. Solución a) Conversión a octal y 0.010 2 101 5 110 6 0.0101011102 =0.2568 b) Conversión a decimal 0.2568 = 2 X 8-1 + 5 X 8-2 + 6 X 8-3 = 0.33984375 10 1.2 Manejo de números en la computadora Figura 1.4 Esquema de una palabra de 16 bits para un número entero. Por razones prácticas, sólo puede manejarse una cantidad finita de bits para cada número en una computadora, y esta cantidad o longitud varía de una máquina a otra. Por ejemplo, cuando se realizan cálculos de ingeniería y ciencias, es mejor trabajar con una longitud grande; por otro lado, una longitud pequeña es más económica y útil para cálculos y pro- cesamientos administrativos. Para una computadora dada, el número de bits generalmente se llama palabra. Las pa- labras van desde ocho bits hasta 64 bits. Para facilitar su manejo, la palabra se divide en partes más cortas denominadas bytes; por ejemplo, una palabra de 32 bits puede dividirse en cuatro bytes (ocho bits cada uno). NÚMEROS ENTEROS Cada palabra, cualquiera que sea su longitud, almacena un número, aunque en ciertas cir- cunstancias se usan varias palabras para contener un número. Por ejemplo, considérese una palabra de 16 bits para almacenar números enteros. De los 16 bits, el primero repre- senta el signo del número; un cero es un signo más y un uno un signo menos. Los 15 bits restantes pueden usarse para guardar números binarios desde 000000000000000 hasta 111111111111111 (véase figura 1.1). Al convertir este número en decimal se obtiene (l X 214 ) + (1 X 213 ) + (1 X 212 ) + ... + (l X 21) + (l X 2°) que es igual a 32767 (215 -1). Por tanto, cada palabra de 16 bits puede contener un nú- mero cualquiera del intervalo -32768 a + 32767 (véase Probo 1.10). 16 bits i bit O bit 15
  • 23. era plo, itud pro- pa- e en irse cir- ese re- bits sta nú- Errores 9 Ejemplo 1.8 Represente el número -26 en una palabra de 16 bits. Solución -2610 = - 110102 , Y su almacenamiento en una palabra de 16 bits quedaria así Represente el número 525¡0' en una palabra de 16 bits. Solución 52510 = 10158 = 10000011012, Y su almacenamiento quedaria así NÚMEROS REALES (PUNTO FLOTANTE) Cuando se desea almacenar un número real, se emplea en su representación binaria, lla- mada de punto flotante, la notación 0.d¡d2d3d4dsd6d7d8 X l',d'2 d '3 d '"d',d'6 d '7 donde d¡ = 1 Y di Y d'j con i = 2, Oo., 8 Yj = 1,2, ... ,7 pueden ser ceros 0 unos, y se guar- da en una palabra como se muestra en la figura 1.2 Figura 1.5 Esquema de una palabra de 16 bits para un número de punto flotante. Bit 15 Característica Mantisa I-------=-- iBit O Igual que antes, el bit cero se usa para guardar el signo del número. En los bits del uno al siete se almacena el exponente de la base 2 y en los ocho bits restantes la fracción." Según el lenguaje de los logaritmos, la fracción es llamada mantisa y el exponente ca- racterística. El número mayor que puede guardarse en una palabra de 16 bits usando la notación de punto flotante es O 1 Exponente positivo 1 0111111 11111111 1 más Equivalente a 0.99 en decimal • El exponente es un número binario de seis dígitos, ya que el bit uno se emplea para su signo. En algunas cornpu- tadoras el exponente se almacena en base ocho (octal) o base 16 (hexadecimal) en lugar de base 2. Errores 9 Represente el número -26 en una palabra de 16 bits. Solución -2610 =- 110102, Ysu almacenamiento en una palabra de 16 bits quedaria así Represente el número 52510, en una palabra de 16 bits. Solución 525 10 = 10158= 10000011012, Ysu almacenamiento quedaria así Figura 1.5 Esquema de una palabra de 16 bits para un número de punto flotante. 1010 ° ° ° ° ° ° ° ° ° NÚMEROS REALES (PUNTO FLOTANTE) C:uando se desea almacenar un número real, se emplea en su representación binaria, lla- mada de punto flotante, la notación O.d1d2d3d4dsd6d7d8 X 2d ' Id' 2 d' 3 d'" d' 5 d'6 d'7 donde dI = 1 Ydi Yd ' j con i = 2, ..., 8 Yj = 1,2,... ,7 pueden ser ceros 0 unos, y se guar- da en una palabra como se muestra en la figura 1.2 Característica Mantisa ¡Bit ° Bit 15 Igual que antes, el bit cero se usa para guardar el signo del número. En los bits del uno al siete se almacena el exponente de la base 2 y en los ocho bits restantes la fracción.'" Según el lenguaje de los logaritmos, la fracción es llamada mantisa y el exponente ca- racterística. El número mayor que puede guardarse en una palabra de 16 bits usando la notación de punto flotante es °1 más Exponente positivo 1 0111111 11111111 1 Equivalente a 0.99 en decimal • El exponente es un número binario de seis dígitos, ya que el bit uno se emplea para su signo. En algunas compu- tadoras el exponente se almacena en base ocho (octal) o base 16 (hexadecimal) en lugar de base 2.
  • 24. 10 Métodos numéricos aplicados a la ingeniería y los números que se pueden guardar en punto flotante binario van de alrededor de 2-64 (si la característica es negativa) a cerca de 263; en decimal, de 10-19 a cerca de 1018 en mag- nitud (incluyendo números positivos, negativos y cero). Ejemplo 1.10 El número decimal-125.32 que en binario es -1111101.010100011110101, normalizado queda así -.1111101010100011110101 X 2+111 I I I bits truncados en el almacenamiento y la palabra de memoria de 16 bits donde se almacena este valor quedaría como signo mantisa característica positiva I 1 1 t. característica mantisa Nótese que primero se normaliza el número, después se almacenan los primeros ocho bits y se truncan los restantes. El número decimal + 0.2, que en binario es 0.0011001100110011 ... y que normalizado queda .1100110011001100 ... X 2-10 I I I bits truncados se almacena así DOBLE PRECISiÓN La doble precisión es un esfuerzo para aumentar la exactitud de los cálculos adicionando más bits a la mantisa. Esto se hace al utilizar dos palabras, la primera en la forma expues- ta anteriormente, y los bits de la segunda para aumentar la mantisa de la primera. Enton- ces, con una palabra de 16 bits puede usarse en doble precisión una mantisa de 8 + 16 = 24 bits. Los 24 bits de la mantisa permiten expresar alrededor de 7 dígitos de exactitud en un número decimal, en lugar de 3 de la precisión sencilla. La desventaja del uso de la doble precisión es que se emplean más palabras, con lo cual se acrecenta el uso de memoria por un programa. 10 Métodos numéricos aplicados a la ingeniería y los números que se pueden guardar en punto flotante binario van de alrededor de 2-64 (si la característica es negativa) a cerca de 263 ; en decimal, de 10-19 a cerca de 1018 en mag- nitud (incluyendo números positivos, negativos y cero). El número decimal-125.32 que en binario es -1111101.010100011110101, normalizado queda así -.1111101010100011110101 X 2+1J1 I I bits truncados en el almacenamiento y la palabra de memoria de 16 bits donde se almacena este valor quedaría como signo mantisa 1 1 característica característica positiva I mantisa Nótese que primero se normaliza el número, después se almacenan los primeros ocho bits y se truncan los restantes. El número decimal + 0.2, que en binario es 0.0011001100110011 ... y que normalizado queda .1100110011001100... X 2-10 I I bits truncados se almacena así DOBLE PRECISiÓN La doble precisión es un esfuerzo para aumentar la exactitud de los cálculos adicionando más bits a la mantisa. Esto se hace al utilizar dos palabras, la primera en la forma expues- ta anteriormente, y los bits de la segunda para aumentar la mantisa de la primera. Enton- ces, con una palabra de 16 bits puede usarse en doble precisión una mantisa de 8 + 16 = 24 bits. Los 24 bits de la mantisa permiten expresar alrededor de 7 dígitos de exactitud en un número decimal, en lugar de 3 de la precisión sencilla. La desventaja del uso de la doble precisión es que se emplean más palabras, con lo cual se acrecenta el uso de memoria por un programa.
  • 25. Errores 11 si ERROR DE REDONDEO o., b Para finalizar esta sección, se analizarán brevemente algunas consecuencias de utilizar el sistema binario y una longitud de palabra finita. Como no es posible guardar un número binario de longitud infinita o un número de más dígitos de los que posee la mantisa de la computadora que se está empleando, se al- macena sólo un número finito de estos dígitos; como consecuencia, se comete automática- mente un pequeño error, conocido como error de redondeo, que al repetirse muchas veces puede llegar a ser considerable. Por ejemplo, si se desea guardar la fracción decimal 0.0001 que en binario es la fracción infinita 0.000000000000011010001101101110001011101011000 ... quedaría, después de normalizarse, almacenado en una palabra de 16 bits como .11010001 X 2-1101 Si se desea sumar el número 0.0001 con él mismo diez mil veces, usando una computado- ra, naturalmente que no se esperará obtener 1 como resultado, ya que los números que se adicionen no serían realmente 0.0001 sino valores aproximados a él (véase Probo 1.16). t.3 Errores ERROR ABSOLUTO, ERROR RELATIVO Y ERROR EN POR CIENTO Si p* es una aproximación a p, el error se define como o Sin embargo, para facilitar el manejo y el análisis se emplea el error absoluto defini- do como EA = IP* -p I y el error relativo como Ip* -p I ER = ,sip =1= O p y como por ciento de error a ERP = ER X 100 En otros libros las definiciones pueden ser diferentes; por ejemplo, algunos autores definen el error E como p - p*; por tanto, sugerimos que al consultar las distintas biblio- grafías se busquen las definiciones de error dadas. Suponga que el valor para un cálculo debería ser p = 0.10 X 102 pero se obtuvo el resultado p* = 0.08 X 102 , entonces Errores 11 ERROR DE REDONDEO Para finalizar esta sección, se analizarán brevemente algunas consecuencias de utilizar el sistema binario y una longitud de palabra finita. Como no es posible guardar un número binario de longitud infinita o un número de más dígitos de los que posee la mantisa de la computadora que se está empleando, se al- macena sólo un número finito de estos dígitos; como consecuencia, se comete automática- mente un pequeño error, conocido como error de redondeo, que al repetirse muchas veces puede llegar a ser considerable. Por ejemplo, si se desea guardar la fracción decimal 0.0001 que en binario es la fracción infinita 0.000000000000011010001101101110001011101011000.. . quedaría, después de normalizarse, almacenado en una palabra de 16 bits como .11010001 X 2-1101 Si se desea sumar el número 0.0001 con él mismo diez mil veces, usando una computado- ra, naturalmente que no se esperará obtener 1 como resultado, ya que los números que se adicionen no serían realmente 0.0001 sino valores aproximados a él (véase Probo 1.16). t.3 Errores ERROR ABSOLUTO, ERROR RELATIVO Y ERROR EN POR CIENTO Si p* es una aproximación a p, el error se define como IbE = p* - p ] Sin embargo, para facilitar el manejo y el análisis se emplea el error absoluto defini- do como 1,EA = I p* - P I ~ y el error relativo como I p* -p I ER = , sip::j:. O P y como por ciento de error a IEERP = ERX 100 ~ En otros libros las definiciones pueden ser diferentes; por ejemplo, algunos autores definen el error E como p - p*; por tanto, sugerimos que al consultar las distintas biblio- grafías se busquen las definiciones de error dadas. Suponga que el valor para un cálculo debería ser p = 0.10 X 102 pero se obtuvo el resultado p* = 0.08 X 102, entonces
  • 26. 12 Métodos numéric os aplicados a la ingeniería EA = 10.08 X 102 - 0.10 X 102 1= 0.2 X 101 10.08 X 102 - 0.10 X 1021 ER = ------=--::---,--:c;;------ 0.10 X 102 ERP = ER X 100 = 20% = 0.2 X 10° Por lo general, interesa el error absoluto y no el error relativo; pero cuando el valor exacto de una cantidad es "muy pequeño" o "muy grande", los errores relativos son más significativos. Por ejemplo si p = 0.24 X 10-4 Y p* = 0.12 X 10-4, entonces: EA = 10.12 X 10-4 - 0.24 X 10-41 = 0.12 X 10-4 Sin reparar en las cantidades que se comparan, puede pensarse que el error absoluto es muy pequeño y, lo más grave, aceptar p* como una buena aproximación a p. Si, por otro lado, se calcula el error relativo 10.12 X 10-4 - 0.24 X 10-41 °ER = = 0.5 X 10 0.24 X 10-4 se observa que la "aproximación" es tan sólo la mitad del valor verdadero y, por tanto, es- tá muy lejos de ser aceptable como aproximación a p. Finalmente ERP= 50% De igual manera puede observarse que si p = 0.46826564 X 106 y p* = 0.46830000 X 106, entonces: EA = 0.3436 X 102 , y si de nueva cuenta no se toman en consideración las cantidades en cuestión, puede creerse que el EA es muy grande y que se tiene una mala aproximación a p. Sin embar- go, al calcular el error relativo ER = 0.7337715404 X 10-4, se advierte que el error es muy pequeño, como en realidad ocurre. ADVERTENCL4.: Cuando se manejan cantidades "muy grandes" o "muy pequeñas", el error absoluto puede ser engañoso, mientras que el error relativo es más significativo en esos casos. Ip* -p 1 < 5 X 10-1 P DEFINICiÓN Se dice que el número p* aproxima a p con t dígitos significativos si t es el entero más grande no negativo para el cual se cumple 12 Métodos numéricos aplicados a la ing eniería EA =10.08 X 102 - 0.10 X 102 1=0.2 X 101 10.08 X 102 - 0.10 X 102 1 ER =- - --- -..,-,....,,-----::-;:------ 0.10 X 102 ERP = ER X 100 = 20% =0.2 X 10° Por lo general, interesa el error absoluto y no el error relativo; pero cuando el valor exacto de una cantidad es "muy pequeño" o "muy grande", los errores relativos son más significativos. Por ejemplo si p =0.24 X 10-4 Y p* =0.12 X 10-4, entonces: EA = 10.12 X 10-4 - 0.24 X 10-41 =0.12 X 10-4 Sin reparar en las cantidades que se comparan, puede pensarse que el error absoluto es muy pequeño y, lo más grave, aceptar p* como una buena aproximación a p. Si, por otro lado, se calcula el error relativo 10.12 X 10-4 - 0.24 X 10-4 1 °ER = = 0.5 X 10 0.24 X 10-4 se observa que la "aproximación" es tan sólo la mitad del valor verdadero y, por tanto, es- tá muy lejos de ser aceptable como aproximación a p. Finalmente ERP= 50% De igual manera puede observarse que si p = 0.46826564 X 106 y p* =0.46830000 X 106, entonces: EA = 0.3436 X 102, y si de nueva cuenta no se toman en consideración las cantidades en cuestión, puede creerse que el EA es muy grande y que se tiene una mala aproximación a p. Sin embar- go, al calcular el error relativo ER = 0.7337715404 X 10-4, se advierte que el error es muy pequeño, como en realidad ocurre. ADVERTENCL<.: Cuando se manejan cantidades "muy grandes" o "muy pequeñas", el error absoluto puede ser engañoso, mientras que el error relativo es más significativo en esos casos. DEFINICiÓN Se dice que el número p* aproxima a p con t dígitos significativos si t es el entero más grande no negativo para el cual se cumple Ip* -p 1 < 5 X 10-1 P
  • 27. or ás to e Errores 13 Supóngase, por ejemplo, el número 10. Para que p* aproxime a 10 con dos cifras sig- nificativas, usando la definición, p* debe cumplir con Ip* - 10 I < 5 X 10-2 10 p* -10 -5 X 10-2 < < 5 X 10-2 10 10 - 5 X 10-1 < p* < 5 X 10-1 + 10 9.5 < p* < 10.5 esto es, cualquier valor de p* en el intervalo (9.5, 10.5) cumple la condición. En general para t dígitos significativos IP* -p I p <5XlO-1 sip > O Ip* - p I < 5 p X 10-1 P - 5 p X 10-1 < p* < p + 5 p X 10-1 Si, por ejemplo, p = 1000 Y t = 4 1000 - 5 X 1000 X 10-4 < p* < 1000 + 5 X 1000 X 10-4 999.5 < p* < 1000.5 CAUSAS DE ERRORES GRAVES EN COMPUTACiÓN Existen muchas causas de errores en la ejecución de un programa de cómputo, de las cua- les se discutirán ahora algunas de las más serias. Para esto, vamos a pensar en una compu- tadora imaginaria que. trabaja con números en el sistema decimal, en forma tal que tiene una mantisa de cuatro dígitos decimales, y una característica de dos dígitos decimales, el prime- ro de los cuales es usado para el signo. Sumados estos seis al bit empleado para el signo del número, se tendrá una palabra de siete bits. Los números que se van a guardar deben nor- malizarse primero en la siguiente forma 3.0 = .3000 X 101 7956000 = .7956 X 107 -0.0000025211 = -.2521 X 10-5 Empleando esta computadora imaginaria, podemos estudiar algunos de los errores más serios que se cometen en su empleo. a) Suma de números muy distintos en magnitud -. Vamos a suponer que se trata de sumar 0.002 a 600 en la computadora decimal imaginaria. 0.002 = .2000 X 10-2 600 = .6000 X 103 Estos números normalizados no pueden sumarse directamente y, por tanto, la compu- tadora debe desnormalizarlos antes de efectuar la suma. Errores 13 Supóngase, por ejemplo, el número 10. Para que p* aproxime a 10 con dos cifras sig- nificativas, usando la definición, p* deue cumplir con Ip* - 10 I < 5 X 10-2 10 - 5 X 10-2 < p* - 10 < 5 X 10-2 10 10 - 5 X 10-1 < p* < 5 X 10-1 + 10 9.5 < p* < 10.5 esto es, cualquier valor de p* en el intervalo (9.5, 10.5) cumple la condición. En general para t dígitos significativos IP* -p I p <5 X lO-1 sip > O I p* - p I < 5 p X 10-1 P - 5 p X 10-1 < p* < p + 5 p X 10-1 Si, por ejemplo, p = 1000 Yt =4 1000 - 5 X 1000 X 10-4 < p* < 1000 + 5 X 1000 X 10-4 999.5 < p* < 1000.5 CAUSAS DE ERRORES GRAVES EN COMPUTACiÓN Existen muchas causas de errores en la ejecución de un programa de cómputo, de las cua- les se discutirán ahora algunas de las más serias. Para esto, vamos a pensar en una compu- tadora imaginaria que.trabaja con números en el sistema decimal, en forma tal que tiene una mantisa de cuatro dígitos decimales, y una característica de dos dígitos decimales, el prime- ro de los cuales es usado para el signo. Sumados estos seis al bit empleado para el signo del número, se tendrá una palabra de siete bits. Los números que se van a guardar deben nor- malizarse primero en la siguiente forma 3.0 = .3000 X 101 7956000 = .7956 X 107 -0.0000025211 = - .2521 X 10-5 Empleando esta computadora imaginaria, podemos estudiar algunos de los errores más serios que se cometen en su empleo. a) Suma de números muy distintos en magnitud Vamos a suponer que se trata de sumar 0.002 a 600 en la computadora decimal imaginaria. 0.002 = .2000 X 10-2 600 =.6000 X 103 Estos números normalizados no pueden sumarse directamente y, por tanto, la compu- tadora debe desnormalizarlos antes de efectuar la suma.
  • 28. 14 Métodos numéricos aplicados a la ingeniería .000002 X 103 + .600000 X 103 .600002 X 103 Como sólo puede manejar cuatro dígitos, los últimos dos son eliminados y la respues- ta es .6000 X 103 o 600. Por el resultado, la suma nunca se realizó. Este tipo de errores, cuyo origen es el redondeo, es muy común y se recomienda, de ser posible, no sumar o restar dos números muy diferentes (véase ejercicio 1.2). b) Resta de números casi iguales Supóngase que la computadora decimal va a restar 0.2144 de 0.2145 . .2145 X 10° - .2144 X 10° .0001 X 10° Como la mantisa de la respuesta está desnormalizada, la computadora automática- mente la normaliza y el resultado se almacena como .1000 X 10-3. Hasta aquí no hay error, pero en la respuesta sólo hay un dígito significativo; por tan- to, se sugiere no confiar en su exactitud, ya que un pequeño error en alguno de los núme- ros originales produciría un error relativo muy grande en la respuesta de un problema que involucrara este error, como se ve a continuación. Supóngase que la siguiente expresión aritmética es parte de un programa x = (A -B) * e Considérese ahora que los valores de A, B Y e son A = 0.2145 X 10°, B = 0.2144 X 10°, e = 0.1000 X 105 Al efectuarse la operación se obtiene el valor de X = 1, que es correcto. Sin embar- go, supóngase que A fue calculada en el programa con un valor de 0.2146 X 10° (error absoluto 0.0001, error relativo 0.00046 y ERP = 0.046%). Usando este valor de A en el cálculo de X, se obtiene como respuesta X = 2. Un error de 0.046% de pronto provoca un error de 100%. Aun más, este error puede pasar desapercibido. e) Overflow y Underflow Con frecuencia una operación aritmética con dos números válidos da como resultado un número tan grande o tan pequeño que la computadora no puede manejarlo; como conse- cuencia se produce un overflow o un underflow, respectivamente. Por ejemplo, al multiplicar 0.5000 X 108 por 0.2000 X 109 se tiene 0.5000 X 108 X 0.2000 X 109 0.1000 X 1017 Cada uno de los números que se multiplican puede guardarse en la palabra de la compu- tadora imaginaria; sin embargo, su producto es muy grande y no puede almacenarse porque la característica requiere tres dígitos. Entonces se dice que ha llevado a cabo un overflow. Otro caso de overflow puede ocurrir en la división; por ejemplo 2000000 0.000005 0.2000 X 10 7 = 0.4000 X 1012 0.5000 X 10-5 14 Métodos numéricos aplicados a la ingeniería .000002 X 103 + .600000 X 103 .600002 X 103 Como sólo puede manejar cuatro dígitos, los últimos dos son eliminados y la respues- ta es .6000 X 103 o 600. Por el resultado, la suma nunca se realizó. Este tipo de errores, cuyo origen es el redondeo, es muy común y se recomienda, de ser posible, no sumar o restar dos números muy diferentes (véase ejercicio 1.2). b) Resta de números casi iguales Supóngase que la computadora decimal va a restar 0.2144 de 0.2145. .2145 X 10° - .2144 X 10° .0001 X 10° Como la mantisa de la respuesta está desnormalizada, la computadora automática- mente la normaliza y el resultado se almacena como .1000 X 10-3. Hasta aquí no hay error, pero en la respuesta sólo hay un dígito significativo; por tan- to, se sugiere no confiar en su exactitud, ya que un pequeño error en alguno de los núme- ros originales produciría un error relativo muy grande en la respuesta de un problema que involucrara este error, como se ve a continuación. Supóngase que la siguiente expresión aritmética es parte de un programa x =(A -B) * e Considérese ahora que los valores de A, B Ye son A = 0.2145 X 10°, B =0.2144 X 10°, e = 0.1000 X 105 Al efectuarse la operación se obtiene el valor de X = 1, que es correcto. Sin embar- go, supóngase que A fue calculada en el programa con un valor de 0.2146 X 10° (error absoluto 0.0001, error relativo 0.00046 y ERP =0.046%). Usando este valor de A en el cálculo de X, se obtiene como respuesta X = 2. Un error de 0.046% de pronto provoca un error de 100%. Aun más, este error puede pasar desapercibido. e) Overflow y Underflow Con frecuencia una operación aritmética con dos números válidos da como resultado un número tan grande o tan pequeño que la computadora no puede manejarlo; como conse- cuencia se produce un overflow o un underflow, respectivamente. Por ejemplo, al multiplicar 0.5000 X 108 por 0.2000 X 109 se tiene 0.5000 X 108 X 0.2000 X 109 0.1000 X 1017 Cada uno de los números que se multiplican puede guardarse en la palabra de la compu- tadora imaginaria; sin embargo, su producto es muy grande y no puede almacenarse porque la característica requiere tres dígitos. Entonces se dice que ha llevado a cabo un overflow. Otro caso de overflow puede ocurrir en la división; por ejemplo 2000000 0.000005 0.2000 X 10 7 =0.4000 X 1012 0.5000 X 10-5
  • 29. s- e Errores 15 Las computadoras por lo general reportan esta circunstancia con un mensaje que va- ría dependiendo de cada máquina. El underflow puede aparecer en la multiplicación o división, y por lo general no es tan serio como el overflow; las computadoras casi nunca envían mensaje de underflow. Por ejemplo: ( 0.3000 X 10-5 ) X ( 0.02000 X 10-3) = 0.006 X 10-8 = 0.6000 X 10-10 Como el exponente -10 está excedido en un dígito, no puede guardarse en la compu- tadora y este resultado se expresa como valor cero. Este error expresado como error rela- tivo es muy pequeño y a menudo no es serio. No obstante, puede ocurrir, por ejemplo: A = 0.3000 X 10-5, B = 0.0200 X 10-3, C = 0.4000 X 107, y que se desee en algún punto del programa calcular el producto de A, B Y C X=A*B*C Se multiplican primero A y B. El resultado parcial es cero. La multiplicación de este resultado por C da también cero. Si, en cambio, se arregla la expresión como X=A* C*B se multiplica A por C y se obtiene 0.1200 X 102. La multiplicación siguiente da la respues- ta correcta: 0.2400 X 10-3. De igual manera, un arreglo en una divisón puede evitar un- derflow. d) División entre un número muy pequeño Como se dijo, la división entre un número muy pequeño puede causar overflow. Supóngase que se realiza en la computadora una división válida y que no se comete error alguno en la operación; pero considérese que ocurrió un pequeño error de redondeo previamente en el programa, cuando se calculó el denominador. Si el numerador es grande y el denominador pequeño, puede presentarse un error absoluto considerable en el cocien- te. Si éste se resta después, de otro número del mismo tamaño relativo, puede presentarse un error mayor en la respuesta final. Como ejemplo considérese la siguiente instrucción en un programa X=A -B/C donde: A = 0.1120 X 109 = 112000000 B = 0.1000 X 106 = 100000 C = 0.900 X 10-3 = 0.0009 / I Si el cálculo se realiza en la computadora decimal de cuatro dígitos, el cociente B / C es 0.1111 X 109, Y X es 0.0009 X 109 o, después de ser normalizado, X = 0.9000 X 106. Nótese que sólo hay un dígito significativo. Vamos a imaginar ahora que se cometió un pequeño error de redondeo al calcular C en algún paso previo y resultó un valor C* = 0.9001 X 10-3 (EA = 0.0001 X 10-3; ER = 10-4 YERP = 0.01 %). Si se calcula B / C* se obtiene como cociente 0.111 O X 109 YX* = 0.1000 X 107. El valor correcto de X es 0.9000 X 106. ./ I Errores 15 Las computadoras por lo general reportan esta circunstancia con un mensaje que va- ría dependiendo de cada máquina. El underflow puede aparecer en la multiplicación o división, y por lo general no es tan serio como el overflow; las computadoras casi nunca envían mensaje de underflow. Por ejemplo: ( 0.3000 X 10-5 ) X ( 0.02000 X 10-3 ) =0.006 X 10-8 =0.6000 X 10-10 Como el exponente -10 está excedido en un dígito, no puede guardarse en la compu- tadora y este resultado se expresa como valor cero. Este error expresado como error rela- tivo es muy pequeño y a menudo no es serio. No obstante, puede ocurrir, por ejemplo: A = 0.3000 X 10-5, B =0.0200 X 10-3, C = 0.4000 X 107, y que se desee en algún punto del programa calcular el producto de A, B YC X=A*B*C Se multiplican primero A y B. El resultado parcial es cero. La multiplicación de este resultado por C da también cero. Si, en cambio, se arregla la expresión como X=A * C*B se multiplica A por C y se obtiene 0.1200 X 102. La multiplicación siguiente da la respues- ta correcta: 0.2400 X 10-3. De igual manera, un arreglo en una divisón puede evitar un- derflow. d) División entre un número muy pequeño Como se dijo, la división entre un número muy pequeño puede causar overflow. Supóngase que se realiza en la computadora una división válida y que no se comete error alguno en la operación; pero considérese que ocurrió un pequeño error de redondeo previamente en el programa, cuando se calculó el denominador. Si el numerador es grande y el denominador pequeño, puede presentarse un error absoluto considerable en el cocien- te. Si éste se resta después, de otro número del mismo tamaño relativo, puede presentarse un error mayor en la respuesta final. Como ejemplo considérese la siguiente instrucción en un programa donde: X = A -B/C A =0.1120 X 109 =112000000 B =0.1000 X 106 = 100000 C =0.900 X 10-3 =0.0009 Si el cálculo se realiza en la computadora decimal de cuatro dígitos, el cociente B / C es 0.1111 X 109, YX es 0.0009 X 109 o, después de ser normalizado, X =0.9000 X 106. Nótese que sólo hay un dígito significativo. Vamos a imaginar ahora que se cometió un pequeño error de redondeo al calcular C en algún paso previo y resultó un valor C* = 0.9001 X 10-3 (EA = 0.0001 X 10-3; ER = 10-4 YERP = 0.01 %). Si se calcula B / C* se obtiene como cociente 0.111O X 109 YX* =0.1000 X 107 . El valor correcto de X es 0.9000 X 106.
  • 30. 16 Métodos numéricos aplicados a la ingeniería Entonces: EA = I 1000000 - 900000 I = 100000 ER = 11000000 - 900000 I = 0.11 900000 ERP = 0.11 X 100 = 11% El error relativo se ha multiplicado cerca de 1100 veces. Como ya se dijo, estos cálcu- los pueden conducir a un resultado final carente de significado o sin relación con la res- puesta verdadera. e) Error de discretización Dado que un número específico no se puede almacenar exactamente como número bina- rio de punto flotante, el error generado se conoce como error de discretización (error de cuantificación), ya que los números expresados exactamente por la máquina (números má- quina) no forman un conjunto continuo sino discreto. Ejemplo 1.12 Cuando se suma 10000 veces 0.0001 con él mismo, debe resultar 1; sin embargo, el nú- mero 0.0001 en binario resulta en una sucesión infinita de ceros y unos, que se trunca al ser almacenada en una palabra de memoria, con lo que se perderá información y el re- sultado de la suma ya no será 1. Se obtuvieron los siguientes resultados que corroboran 10 anterior, utilizando una PC, precisión sencilla y Visual Basic. Solución 10000 a) L 0.0001 = 1.000054 i= 1 10000 b) 1 + L 0.0001 = 2.000166 i= 1 10000 e) 1000 + L 0.0001 = 1001.221 i= 1 10000 d) 10000 + L 0.0001 = 10000 i= 1 Nótese que en los tres últimos incisos, además del error de discretización, se generó el error de sumar un número muy grande con un número muy pequeño (véase Probo 1.16 y 1.17). El programa se ejecutó iniciando primero a una variable con el valor entero O, 1, 1000 Y 10000; después se fue acumulando a esa variable 0.0001 diez mil veces. f) Errores de salida Aun cuando no se haya cometido error alguno durante la fase de cálculos de un programa, puede presentarse un error al imprimir resultados. Por ejemplo, supóngase que la respuesta de un cálculo particular es exactamente 0.015625. Cuando este número se imprime con un formato tal como FlO.6 o E14.6 (de FOR- TRAN), se obtiene la respuesta correcta. Si, por el contrario, se decide usar F8.3, se impri- 16 Métodos numéricos aplicados a la ingeniería Entonces: EA = I 1000000 - 900000 I = 100000 ER = I 1000000 - 900000 I = 0.11 900000 ERP =0.11 X 100 = 11% El error relativo se ha multiplicado cerca de 1100 veces. Como ya se dijo, estos cálcu- los pueden conducir a un resultado final carente de significado o sin relación con la res- puesta verdadera. e) Error de discretización Dado que un número específico no se puede almacenar exactamente como número bina- rio de punto flotante, el error generado se conoce como error de discretización (error de cuantificación), ya que los números expresados exactamente por la máquina (números má- quina) no forman un conjunto continuo sino discreto. Ejemplo 1.12 Cuando se suma 10000 veces 0.0001 con él mismo, debe resultar 1; sin embargo, el nú- mero 0.0001 en binario resulta en una sucesión infinita de ceros y unos, que se trunca al ser almacenada en una palabra de memoria, con lo que se perderá información y el re- sultado de la suma ya no será 1. Se obtuvieron los siguientes resultados que COIToboran lo anterior, utilizando una PC, precisión sencilla y Visual Basic. Solución 10000 a) L 0.0001 = 1.000054 i= I 10000 b) 1 + L 0.0001 = 2.000166 i= I 10000 e) 1000 + L 0.0001 = 1001.221 i= I 10000 d) 10000 + L 0.0001 = 10000 i= I Nótese que en los tres últimos incisos, además del error de discretización, se generó el error de sumar un número muy grande con un número muy pequeño (véase Probol.16 y 1.l7). El programa se ejecutó iniciando primero a una variable con el valor entero 0,1, 1000 Y 10000; después se fue acumulando a esa variable 0.0001 diez mil veces. f) Errores de salida Aun cuando no se haya cometido error alguno durante la fase de cálculos de un programa, puede presentarse un error al imprimir resultados. Por ejemplo, supóngase que la respuesta de un cálculo particular es exactamente 0.015625. Cuando este número se imprime con un formato tal como FlO.6 o E14.6 (de FOR- TRAN), se obtiene la respuesta correcta. Si, por el contrario, se decide usar F8.3, se impri-
  • 31. u- s- Error-es 17 mirá el número 0.016 (si la computadora redondea), o bien 0.015 (si la computadora trunca), con lo cual se presenta un elTOr. PROPAGACiÓN DE ERRORES Una vez que se sabe cómo se producen los errores en un programa de cómputo, podría pensarse en tratar de determinar el error cometido en cada paso, y conocer de esa manera el error total en la respuesta final. Sin embargo, esto no es práctico. Resulta más adecua- do analizar las operaciones individuales realizadas por la computadora para ver cómo se propagan los errores de dichas operaciones. a) Suma Se espera que al sumar a y b, se obtenga el valor correcto de e = a + b; no obstante, se tie- ne en general un valor de e incorrecto debido a la longitud finita de palabra que se emplea. Puede considerarse que este error fue causado por una operación incorrecta de la compu- tadora -+- (el punto indica que es suma con error). Entonces el error es: Error = (a -+-b) - (a + b) La magnitud de este error depende de las magnitudes relativas, de los signos de a y b, Y de la forma binaria en que a y b son almacenados en la computadora. Esto último varía dependiendo de la computadora, y por tanto es un error muy difícil de analizar y no lo es- tudiaremos aquí. Si por otro lado a y b de entrada son inexactos, hay un segundo error posible. Por ejemplo, considérese que en lugar del valor verdadero de a, la computadora tiene el valor a", el cual presenta un error Ea a* = a + Ea y de igual forma para b Como consecuencia se tendría, aun si no se cometiera error en la adición, un error en el resultado: Error = (a* + b*) - (a + b) = (a + Ea + b + Eb) - (a + b) = Ea + Eb = Ec o sea c* = e + Ec El error absoluto es: I ( a* + b* ) - ( a + b ) I = I Ea + Eb I ::; I Ea I + I Eb I o bien Se dice que los errores Ea y Eb se han extendido a e, y Ec se conoce como el error de propagación. Dicho error es causado por valores inexactos de los valores iniciales y se propaga en los cómputos siguientes, con lo cual causa un error en el resultado final. Errores 17 mirá el número 0.016 (si la computadora redondea), o bien 0.015 (si la computadora tmnca), con lo cual se presenta un elTOr. PROPAGACiÓN DE ERRORES Una vez que se sabe cómo se producen los errores en un programa de cómputo, podría pensarse en tratar de determinar el error cometido en cada paso, y conocer de esa manera el error total en la respuesta final. Sin embargo, esto no es práctico. Resulta más adecua- do analizar las operaciones individuales realizadas por la computadora para ver cómo se propagan los errores de dichas operaciones. a) Suma Se espera que al sumar a y b, se obtenga el valor correcto de e = a + b; no obstante, se tie- ne en general un valor de e incorrecto debido a la longitud finita de palabra que se emplea. Puede considerarse que este error fue causado por una operación incorrecta de la compu- tadora .¡. (el punto indica que es suma con error). Entonces el error es: Error = Ca .¡. b) - Ca + b) La magnitud de este error depende de las magnitudes relativas, de los signos de a y b, Yde la forma binaria en que a y b son almacenados en la computadora. Esto último varía dependiendo de la computadora, y por tanto es un error muy difícil de analizar y no lo es- tudiaremos aquí. Si por otro lado a y b de entrada son inexactos, hay un segundo error posible. Por ejemplo, considérese que en lugar del valor verdadero de a, la computadora tiene el valor a*, el cual presenta un error E a a* = a + Ea y de igual forma para b Como consecuencia se tendría, aun si no se cometiera error en la adición, un error en el resultado: Error = (a* + b*) - (a + b) = (a + E a + b + E b ) - (a + b) =Ea + Eb =E c o sea c* = e + E c El error absoluto es: I ( a* + b* ) - Ca + b ) I = I E a + Eb I ~ I Ea I + I E bI o bien Se dice que los errores E a y Eb se han extendido a e, y E c se conoce como el error de propagación. Dicho error es causado por valores inexactos de los valores iniciales y se propaga en los cómputos siguientes, con lo cual causa un error en el resultado final.
  • 32. 18 Métodos numéricos aplicados a la ingeniería b) Resta El error de propagación ocasionado por valores inexactos iniciales a* y b", puede darse de manera similar que en la adición, con un simple cambio de signo (véase Probo 1.24). e) Multiplicación Si se multiplican los números a* y b", se obtiene (ignorando el error causado por la ope- ración misma): ( a* X b*) = ( a + Ea) X (b + Eb ) = ( a X b ) + ( a X Eb) + ( b X Ea) + ( Ea X Eb) Si Ea y Eb son suficientemente pequeños, puede considerarse que su producto es muy pequeño en comparación con los otros términos y, por tanto, eliminar el último término. Se obtiene entonces el error del resultado final ( a* X b* ) - ( a X b ) '" ( a X Eb) + ( b X Ea ) Esto hace posible encontrar el valor absoluto del error relativo del resultado dividien- do ambos lados entre a X b. 1_( a_~_'X_b'_i' )_-_(_a_X_b_) 1 '" 1 _Eb + _Ea 1 ~ 1 _E/) 1 + 1 _Ea 1 (aXb) b a b a El error de propagación relativo en valor absoluto en la multiplicación es aproxima- damente igualo menor a la suma de los errores relativos de a y b en valor absoluto. d) División Puede considerarse la división de a* y b* como sigue: a* / b" = ( a + Ea ) / ( b + Eb) 1 = (a + Ea) (b + Eb) Multiplicando numerador y denominador por b - Eb a* / b* = (a + Ea) (b - Eb ) ( b + Eb) (b - Eb ) ab - aE/) + Eab - EaEb b2 - EE Si, como en la multiplicación, se considera el producto Ea Eb muy pequeño y, por las mismas razones, a EE y se desprecian, se tiene. a" / b* '" !!!!.... + Eab _ aEb b2 b2 b2 Fi Gráfi fu deri: b 1.4a "'- + El error es entonces: a E a*lb* __ '" _a _ b b 18 Métodos numéri cos aplicados a la ingeniería b) Resta El error de propagación ocasionado por valores inexactos iniciales a':' y b*, puede darse de manera similar que en la adición, con un simple cambio de signo (véase Probo1.24). c) Multiplicación Si se multiplican los números a* y b':', se obtiene (ignorando el error causado por la ope- ración misma): ( a* X b*) = ( a + Ea) X (b + Eb ) = ( a X b ) + ( a X E b ) + ( b X E a) + ( E a X E b ) Si E ay Eb son suficientemente pequeños, puede considerarse que su producto es muy pequeño en comparación con los otros términos y, por tanto, eliminar el último término. Se obtiene entonces el error del resultado final ea* X b* ) - ( a X b ) '" ( a X E b ) + ( b X Ea ) Esto hace posible encontrar el valor absoluto del error relativo del resultado dividien- do ambos lados entre a X b. 1_(a_*_X_b':_')_-_(_a_X_b_) 1 '" 1 _Eb + _E a 1 ~ 1 _E/) 1 + 1 _Ea 1 (aXb) b a b a El error de propagaciúi1 relativo en valor absoluto en la multiplicación es aproxima- damente igualo menor a la suma de los errores relativos de a y b en valor absoluto. d) División Puede considerarse la división de a* y b* como sigue: a* / b* =(a + E a ) / ( b + E b ) 1 = (a + Ea) (b + E b ) Multiplicando numerador y denominador por b - E b ( a + E ) eb-E ) a* / b* = a b eb + E b ) (b - E /) ) ab - aE/) + Eab - E aEb b2 - EE Si, como en la multiplicación, se considera el producto Ea Eb muy pequeño y, por las mismas razones, a EE y se desprecian, se tiene. El error es entonces: a* / b* '" ~ + E a b _ aE b b2 b2 b2 a "' - + b a Ea*Ib* _ _ ",_a b b
  • 33. e Errores 19 Dividiendo entre aIb se obtiene el error relativo. Al tomar el valor absoluto del error relativo, se tiene Se concluye que el error de propagación relativo del cociente en valor absoluto es apro- ximadamente igualo menor a la suma de los errores relativos en valor absoluto de a y b. e) Evaluación de funciones Por último, se estudiará la propagación del error (asumiendo operaciones básicas +, -, X Y/ ideales o sin errores), cuando se evalúa una función f (x) en un punto x = a. En gene- ral, se dispone de un valor de a aproximado: a*; la intención es determinar el error resul- tante E¡=f(a*)-f(a) La figura 1.3 muestra la gráfica de la funciónf ( x ) en las cercanías de x = a. A con- tinuación se determina la relación entre Ea y E¡- Si Ea es pequeño, puede aproximarse la curvaf( x) por su tangente en un entorno de x = a. Se sabe que la pendiente de esta tangente es f' (a) o aproximadamente E¡ / Ea; esto es: y En valor absoluto I E¡I ""lEal' (a*) 1""lEa I 11' (a*) I El error al evaluar una función en un argumento inexacto es proporcional a la prime- ra derivada de la función en el punto donde se ha evaluado. y f'(a) f(x) f(a*) I---....---------~;;;........------~ f(a) I----'-------~ E = a*-aII Figura 1.6 Gráfica de una función y su primera derivada en a. a a* x t .4 Algoritmos y estabilidad El tema fundamental de este libro es el estudio, selección y aplicación de algoritmos, que se definen como secuencias de operaciones algebraicas y lógicas para obtener la solución de un problema. Por lo general, se dispone de varios algoritmos para resolver un problema par- Figura 1.6 Gráfica de una función y su primera derivada en a. Errores 19 Dividiendo entre aIb se obtiene el error relativo. Al tomar el valor absoluto del error relativo, se tiene Se concluye que el error de propagación relativo del cociente en valor absoluto es apro- ximadamente igualo menor a la suma de los errores relativos en valor absoluto de a y b. e) Evaluación de funciones Por último, se estudiará la propagación del error (asumiendo operaciones básicas +, -, X Y/ ideales o sin errores), cuando se evalúa una función f (x) en un punto x = a. En gene- ral, se dispone de un valor de a aproximado: a*; la intención es determinar el error resul- tante E f = f(a*)-f(a) La figura 1.3 muestra la gráfica de la funciónf ( x ) en las cercanías de x =a. A con- tinuación se determina la relación entre E a y E¡- Si Ea es pequeño, puede aproximarse la curvaf( x) por su tangente en un entorno de x = a. Se sabe que la pendiente de esta tangente es!, (a) o aproximadamente E f / Ea; esto es: y En valor absoluto I Ef l "" l Eal' (a*) 1"" l Ea I 11' (a*) I El error al evaluar una función en un argumento inexacto es proporcional a la prime- ra derivada de la función en el punto donde se ha evaluado. y f'(a) Ef =f(a*) - f(a) f(a*) I----.---------~;;......------- f(a) a a* E = a* -aII f(x) x t.4 Algoritmos y estabilidad El tema fundamental de este libro es el estudio, selección y aplicación de algoritmos, que se definen como secuencias de operaciones algebraicas y lógicas para obtener la solución de un problema. Por lo general, se dispone de varios algoritmos para resolver un problema par-
  • 34. 20 Métodos numéricos aplicados a la ingeniería ticular; uno de los criterios de selección es la estabilidad del algoritmo; esto es, que a peque- ños errores de los valores manejados se obtengan pequeños errores en los resultados finales. Supóngase que un error E se introduce en algún paso en los calculos.y que el error de propagación de n operaciones subsiguientes se denota por EIl' En la práctica, por lo ge- neral se presentan dos casos. a) En I '" n e E, donde e es una constante independiente de 11; se dice entonces que la propagación del error es lineal. b) I EIl I '" k" E, para k » 1; se dice entonces que la propagación del error es ex- ponencial. La propagación lineal de los errores suele ser inevitable; cuando e y E son peque- ños, los resultados finales normalmente son aceptables. Por otro lado, la propagación expo- nencial debe evitarse, ya que el término k" crece con rapidez para valores relativamente pequeños de n. Esto conduce a resultados finales muy poco exactos, sea cual sea el tamaño de E. Como consecuencia, se dice que un algoritmo con crecimiento lineal del error es esta- ble, mientras que un algoritmo con una propagación exponencial es inestable (véase Fig. 1.4). En ( Propagación exponencial En= k'IE 0 Figura 1.7 0 Propagación lineal Propagación 0 E,/= nce [ lineal y G G 0 G G propagación f,'!J [!] [!] G exponencial de E errores. 2 3 4 5 6 7 8 9 10 n Ejercicios 1.1 Error de redondeo al restar dos números casi iguales. Vamos a considerar las ecuaciones 31.69x + 14.31 Y = 45.00 (1) 13.05x + 5.89 Y = 18.53 (2) La única solución de este sistema de ecuaciones es (redondeando a cinco cifras deci- males) x = 1.25055, Y = 0.37527. Un método para resolver este tipo de problemas es mul- tiplicar la ecuación (1) por el coeficiente de x de la ecuación (2), multiplicar la ecuación
  • 35. peque- finales. el error r lo ge- Errores 21 (2) por el coeficiente de x de la ecuación (1) y después restar las ecuaciones resultantes. Para este sistema se obtendría (como los coeficientes tienen dos cifras decimales, todas las operaciones intermedias se efectúan redondeando a dos cifras decimales): ntonces [13.05 (14.31) - 31.69 (5.89)] Y (186.75 - 186.65) Y 0.10 Y 13.05 (45.00) - 31.69 (18.53) 587.25 - 587.22 0.03 res ex- de donde y = 0.3, luego peque- n expo- amente tamaño es esta- ig. 1.4). x = _(_18_.5_3_)_-_5._89--,-(0_.3_)= 18.53 - 1.77 = 16.76 = l.28 13.05 13.05 13.05 Para la variable x EA = 1 1.28 - l.25 l = 0.03; ER = 0.03/.1.25 = 0.024; ERP = 2.4% Para la variable y EA = l 0.3 - 0.38 l = 0.08; ER = 0.08/0.38 = 0.21; ERP = 21% 1.2 Error de redondeo al sumar un número grande y uno pequeño. Considere la sumatoria infinita s=f J..=~+~+~+~+~+ ... +_1_+ ... 11 = 1 n2 1 4 9 16 25 100 resulta (usando precisión sencilla y 5000 como valor final de n) 1.644725 si se suma de iz- quierda a derecha, pero resulta 1.644834 si se suma de derecha a izquierda, a partir de n = 5000. Debe notarse que el resultado de sumar de derecha a izquierda es más exacto, ya que en todos los términos se suman valores de igual magnitud. Por el contrario, al sumar de izquierda a derecha, una vez que se avanza en la suma- toda, se sumarán números cada vez más grandes con números más pequeños. Lo anterior se corrobora si se realiza la suma en ambos sentidos, pero ahora con do- ble precisión. El resultado obtenido es 1.64473408684689 (estos resultados pueden variar de máquina a máquina). 1.3 Reducción de errores. Para resolver la ecuación cuadrática 100 x2 - 10011 x + 10.011 = O, el método común sería usar la fórmula - b ±.) b2 - 4 a e x= , 2a después de dividir la ecuación entre 100. x2 -100.11 x + 0.10011 = O 100.11 ± .)(-100.11)2-4(0.10011) x = -----'-----'-----'------'- 2 Errores 21 (2) por el coeficiente de x de la ecuación (1) y después restar las ecuaciones resultantes. Para este sistema se obtendría (como los coeficientes tienen dos cifras decimales, todas las operaciones intermedias se efectúan redondeando a dos cifras decimales): [13.05 (14.31) - 31.69 (5.89) ] Y (186.75 - 186.65) Y 0.10 Y 13.05 (45.00) - 31.69 (18.53) 587.25 - 587.22 0.03 de donde y = 0.3, luego x = -,(_18_.5_3-,-)-_5._89_(-,--0_.3-,-) = 18.53 - 1.77 = 16.76 = 1.28 13.05 13.05 13.05 Para la variable x EA =I 1.28 - 1.25 I=0.03; ER =0.0311.25 = 0.024; ERP =2.4% Para la variable y EA = I0.3 - 0.38 I=0.08; ER =0.08/0.38 = 0.21; ERP =21% 1.2 Error de redondeo al sumar un número grande y uno pequeño. Considere la sumatoria infinita s = i: ~ = J...+~+~+~+~+ ... +_1_+ ... tl = 1 n2 1 4 9 16 25 100 resulta (usando precisión sencilla y 5000 como valor final de n) 1.644725 si se suma de iz- quierda a derecha, pero resulta 1.644834 si se suma de derecha a izquierda, a partir de n = 5000. Debe notarse que el resultado de sumar de derecha a izquierda es más exacto, ya que en todos los términos se suman valores de igual magnitud. Por el contrario, al sumar de izquierda a derecha, una vez que se avanza en la suma- toria, se sumarán números cada vez más grandes con números más pequeños. Lo anterior se corrobora si se realiza la suma en ambos sentidos, pero ahora con do- ble precisión. El resultado obtenido es 1.64473408684689 (estos resultados pueden variar de máquina a máquina). 1.3 Reducción de errores. Para resolver la ecuación cuadrática 100 X2 - 10011 x + 10.011 =O, el método común sería usar la fórmula - b +.)b2 - 4 a e x = , 2a después de dividir la ecuación entre 100. X2 - 100.11 x + 0.10011 = O 100.11 ± .)(-100.11)2 - 4(0.10011) x = - - -- - - - -- --'-------'- 2
  • 36. ., 22 Métodos numéricos apl icados a la ingeniería Trabajando con aritmética de cinco dígitos 100.11 ± -J 10022 - 0.40044 100.11 ± -J 10022 x= = ------- 2 2 = 100.11 ± 100.11 ={ 200.22 = 100 11 22' O Las soluciones verdaderas, redondeadas a cinco dígitos decimales son 100.11 y 0.00100. El método empleado fue adecuado para la solución mayor, pero no del todo para la solución menor. Si las soluciones fueran divisores de otras expresiones, la solución x = O hubiese causado problemas serios. Se restaron dos números "casi iguales" (números iguales en aritmética de cinco dígi- tos) y sufrieron pérdida de exactitud. ¿Cómo evitar esto? Una forma sería reescribir la expresión para la solución de una ecuación cuadrática a fin de evitar la resta de números "casi iguales". El problema, en este caso, se da en el signo negativo asignado a la raíz cuadrada; esto es -b - -J b2 - 4 a e 2a Multiplicando numerador y denominador por -b + .Jb2 - 4a e, queda (-b - .Jb2 - 4 a e) (-b + .Jb2 - 4 a e) 2a (-b +.J b2 - 4 a e ) (-b)2 - (b2 - 4ae) 2a (-b + .Jb2 - 4 a e ) 4ae 2e Usando esta expresión con a = 1, b = -100.11, y e = 0.10011, se obtiene 2 (0.10011 ) 0.20022 0001 ( .,' d . dí )--- =. en antmenca e CInCO 19ltOS 200.22100.11 + .J10022 que es el valor verdadero, redondeado a cinco dígitos decimales. Esta forma alternativa para calcular una raíz pequeña de una ecuación cuadrática, ca- si siempre produce una respuesta más exacta que la de la fórmula usual (véase Probo 2.31). 1.4 Más sobre reducción de errores. Se desea evaluar la expresión A / ( 1 - sen x ), en x = 89° 41'. En tablas con cinco cifras decimales, sen 89° 41' = 0.99998. Con aritmética de cinco dígitos y redondeando se tiene sen x = 0.99998 y 1 - sen x = 0.00002 El valor de sen x sólo tiene cuatro dígitos exactos (confiables). Por otro lado, el úni- co dígito que no es cero en 1 - sen x se ha calculado con el dígito no confiable de sen x, por lo que se pudo perder la exactitud en la resta. Esta situación de arriba puede mejorarse observando que 1 + sen x 1 - sen2 x 1 + sen x cos2 X 1 + sen x ( 1- sen x ) ( 1 + sen x ) 1 - sen x = ---------- 22 Métodos numéricos aplicados a la in gen iería Trabajando con aritmética de cinco dígitos 100.11 ± -J10022 - 0.40044 x = 2 = 100.11 ± ..J1Oo22 2 = 100.11 ± 100.11 = { 200.22 = 100.11 2 2 O ., Las soluciones verdaderas, redondeadas a cinco dígitos decimales son 100.11 y 0.00100. El método empleado fue adecuado para la solución mayor, pero no del todo para la solución menor. Si las soluciones fueran divisores de otras expresiones, la solución x = O hubiese causado problemas serios. Se restaron dos números "casi iguales" (números iguales en aritmética de cinco dígi- tos) y sufrieron pérdida de exactitud. ¿Cómo evitar esto? Una forma sería reescribir la expresión para la solución de una ecuación cuadrática a fin de evitar la resta de números "casi iguales". El problema, en este caso, se da en el signo negativo asignado a la raíz cuadrada; esto es -b -.Jb2 - 4 a e 2a Multiplicando numerador y denominador por -b + .Jb2 - 4a e, queda (-b - .Jb2 - 4 a e) (-b + .Jb2 - 4 a e) 2a (-b +.Jb2 - 4 a e ) (-b)2 - (b2 - 4 a e ) 2a (-b + .Jb2 - 4 ae ) 4ac 2e Usando esta expresión con a = 1, b =-100.11 , y e =0.10011, se obtiene 2 (0.10011 ) 0.20022 0001 ( . , . d . d'· )- --- = . en antmetlca e Cll1CO 19ltOS 100.11 + .J10022 200.22 que es el valor verdadero, redondeado a cinco dígitos decimales. Esta forma alternativa para calcular una raíz pequeña de una ecuación cuadrática, ca- si siempre produce una respuesta más exacta que la de la fórmula usual (véase Probo 2.31). 1.4 Más sobre reducción de errores. Se desea evaluar la expresión A / ( 1 - sen x ), en x = 89° 41 '. En tablas con cinco cifras decimales, sen 89° 41' = 0.99998. Con aritmética de cinco dígitos y redondeando se tiene sen x =0.99998 y 1 - sen x =0.00002 El valor de sen x sólo tiene cuatro dígitos exactos (confiables). Por otro lado, el úni- co dígito que no es cero en 1 - sen x se ha calculado con el dígito no confiable de sen x, por lo que se pudo perder la exactitud en la resta. Esta situación de arriba puede mejorarse observando que ( 1 - sen x ) ( 1 + sen x ) 1 - sen x = - -- - - - - -- - 1 + sen x 1 - sen2 x 1 + sen x cos2 X 1 + sen x
  • 37. 100. arala x=o dígi- e una to es a, ea- 2.31). cifras tiene lúni- senx, Errores 23 Por esto, es posible escribir 1 - sen x de una forma que no incluye la resta de dos nú- meros casi iguales. 1.5 Comparaciones seguras. En los métodos numéricos, a menudo la comparación de igualdad de dos números en no- tación de punto flotante permitirá terminar la repetición de un conjunto de cálculos (pro- ceso cíclico o iterativo). En vista de los errores observados, es recomendable comparar la diferencia de los dos números en valor absoluto contra una tolerancia E apropiad", usando por ejemplo el operador de relación menor o igual ( ::;). Esto se ilustra enseguida. En lugar de SI X = Y ALTO; En caso contrario REPETIR las instrucciones 5 a 9 Deberá usarse: SI ABS (X - Y)::; E ALTO; en caso contrario REPETIR las instrucciones 5 a 9. En lugar de REPETIR { Pasos de un ciclo } HASTA QUE X = Y Deberá usarse REPETIR { Pasos de un ciclo} HASTA QUE ABS ( X - Y)::; E donde E es un número pequeño (generalmente menor que uno, pero puede ser mayor, de- pendiendo el contexto en que se trabaje) e indicará la cercanía de X con Y que se aceptará como "igualdad" de X y Y. 1.6 Análisis de resultados. Al ejecutar las siguientes instrucciones en Visual Basic con doble precisión y en Matlab, se tiene, respectivamente: Dim Y As Double, A as Double Y=lOOO.2 A=Y-IOOO Print A format long Y=lOOO.2; A=Y-IOOO Se obtiene: 0.200000000000045 Se obtiene: 0.20000000000005 Ejecute las mismas instrucciones pero usando Y = 1000.25. Los resultados ahora son conectas. Explíquelo. .v" Errores 23 Por esto, es posible escribir 1 - sen x de una forma que no incluye la resta de dos nú- meros casi iguales. 1.5 Comparaciones seguras. En los métodos numéricos, a menudo la comparación de igualdad de dos números en no- tación de punto flotante permitirá terminar la repetición de un conjunto de cálculos (pro- ceso cíclico o iterativo). En vista de los errores observados, es recomendable comparar la diferencia de los dos números en valor absoluto contra una tolerancia E apropiad", usando por ejemplo el operador de relación menor o igual ( :s; ). Esto se ilustra enseguida. En lugar de SI X = Y ALTO; En caso contrario REPETIR las instrucciones 5 a 9 Deberá usarse: SI ABS (X - Y):S; E ALTO; en caso contrario REPETIR las instrucciones 5 a 9. En lugar de REPETIR { Pasos de un ciclo } HASTA QUE X = Y Deberá usarse REPETIR { Pasos de un ciclo} HASTA QUE ABS ( X - Y):S; E donde E es un número pequeño (generalmente menor que uno, pero puede ser mayor, de- pendiendo el contexto en que se trabaje) e indicará la cercanía de X con Y que se aceptará como "igualdad" de X y Y. 1.6 Análisis de resultados. Al ejecutar las siguientes instrucciones en Visual Basic con doble precisión y en Matlab, se tiene, respectivamente: Dim Y As Double , A as Double Y=lOOO . 2 A=Y-IOOO Print A Se obtiene: 0.200000000000045 format long Y=lOOO . 2; A=Y- IOOO Se obtiene: 0.20000000000005 Ejecute las mismas instrucciones pero usando Y = 1000.25. Los resultados ahora son correctos. Explíquelo.
  • 38. 24 Métodos numéricos ap licados a la ingeniería En doble precisión pueden manejarse alrededor de quince dígitos decimales de exac- titud, de modo que la resta de arriba se representa 1000.200 - 1000.000 La computadora convierte Y a binario dando un número infinito de ceros y unos, y al- macena un número distinto a 1000.2 (véase Probo 1.6 b), Por otro lado, 1000 sí se puede almacenar o representar exactamente en la compu- tadora en binario en punto flotante (los números con esta característica se llaman números máquina). Al efectuarse la resta se obtiene un número diferente de 0.2. Esto muestra por qué deberá analizarse siempre un resultado de un dispositivo digital antes de aceptarlo. 1.7 Más sobre análisis de resultados. El método de posición falsa (véase sección 2.4) obtiene su algoritmo al encontrar el pun- to de corte de la línea recta que pasa por los puntos ( xo'.Yo ), (xi' Y¡ ) y el eje x. Pueden obtenerse dos expresiones para encontrar el punto de corte xM Si (xo' Yo) ==( 2.13, 4.19 ) Y ( x¡ , Y¡ ) == (1.96, 6.87 ) Y usando aritmética de tres dígi- tos y redondeando, ¿cuál es la mejor expresión y por qué? Solución Sustituyendo en i) y en ii) i) x M ==1.96 (4.19) - 2.13 (6.87) == 2.38 4.19-6.87 x ==2.13- (2.13-1.96)4.19==2.40 M 4.19 - 6.87 ii) Al calcular los errores absoluto y relativo, y .omando como valor verdadero a 2.395783582, el cual se calculó con aritmética de 13 dígitos, se tiene: i) EA ==2.395783582 - 2.38 ==0.015783582 0.015783582 2.395783582 ER 0.006588066 ii) EA ==2.395783582 - 2.40 ==0.004216418 ER == 0.004216418 ==0.001759932 2.395783582 de donde es evidente que la forma ii) es mejor. Se sugiere al lector reflexionar sobre el por qué. Problemas 1.1 Proporcione los símbolos o numerales romanos correspondientes a los siguientes símbo- los arábigos 10, 100, 1000, 10000, 100000, 1000000 24 Métodos numéricos aplicados a la ingeniería En doble precisión pueden manejarse alrededor de quince dígitos decimales de exac- titud, de modo que la resta de arriba se representa 1000.200 - 1000.000 La computadora convierte Y a binario dando un número infinito de ceros y unos, y al- macena un número distinto a 1000.2 (véase Probo 1.6 b). Por otro lado, 1000 sí se puede almacenar o representar exactamente en la compu- tadora en binario en punto flotante (los números con esta característica se llaman númeíOs máquina). Al efectuarse la resta se obtiene un número diferente de 0.2. Esto muestra por qué deberá analizarse siempre un resultado de un dispositivo digital antes de aceptarlo. 1.7 Más sobre análisis de resultados. El método de posición falsa (véase sección 2.4) obtiene su algoritmo al encontrar el pun- to de corte de la línea recta que pasa por los puntos ( xo..)'o ), ( x/' YI) Y el eje X . Pueden obtenerse dos expresiones para encontrar el punto de corte xM .) . XI Yo - Xo YI ..) _ (xo - xI) Yú 1 XM = II XM - XD - -=-----'---''' ~ - ~ ~-~ Si (xD , Yo) = (2.13,4.19) Y ( "'(1' YI) = (1.96, 6.87) Y usando aritmética de tres dígi- tos y redondeando, ¿cuál es la mejor expresión y por qué? Solución Sustituyendo en i) y en ii) i) ii) X M = 1.96 (4.19) - 2.13 (6.87) = 2.38 4.19-6.87 x M =2.13 _ (2.13 - 1.96) 4.19 =2.40 4.19 - 6.87 Al calcular los errores absoluto y relativo, y lomando como valor verdadero a 2.395783582, el cual se calculó con aritmética de 13 dígitos, se tiene: i) EA = 2.395783582 - 2.38 = 0.015783582 ER 0.015783582 0.006588066 2.395783582 ii) EA = 2.395783582 - 2.40 =0.004216418 ER = 0.004216418 = 0.001759932 2.395783582 de donde es evidente que la forma ii) es mejor. Se sugiere a11ector reflexionar sobre el por qué. Problemas 1.1 Proporcione los símbolos o numerales romanos correspondientes a los siguientes símbo- los arábigos 10, 100, 1000, 10000, 100000, 1000000
  • 39. y al- pu- eras por o. Errores 25 1.2 Convierta" los siguientes números decimales a los sistemas con base 2 y base 8, y viceversa. a) 536 b) 923 e) 1536 d) 8 e) 2 f) 10 g) 1.3 Convierta los siguientes números enteros del sistema octal a binario y viceversa. 1.5 un- den 1.6 ígi- 1.7 82, 01" 0- a) 777 b) 573 e) 7 d) 2 e) 10 f) O 1.4 Resuelva las siguientes preguntas. a) ¿El número 101121 pertenece al sistema binario? b) ¿El número 3852 pertenece al sistema octal? Si su respuesta es NO en alguno de los incisos, explique por qué; si es sÍ, conviértalo(s) a decimal. Convierta los siguientes números dados en binario a decimal y viceversa, usando la con- versión a octal como paso intermedio a) 1000 b) 10101 e) 111111 Convierta los siguientes números fraccionarios dados en decimal, a binario y octal a) 0.8 b) 0.2 e) 0.973 d) 0.356 e) 0.713 f) 0.10 Convierta los siguientes números fraccionarios, dados en binario, a decimal a) 0.1 b) 0.010101 e) 0.0001 d) 0.11111 e) 0.00110011 f) 0.0110111 1.8 Repita los incisos a) af) del problema 1.7, pero pasando a octal como paso intermedio. 1.9 Convierta los siguientes números, dados en decimal, a octal y binario. a) 985.34 g) 0.9389 b) 10.1 e) 888.222 d) 3.57 h) -0.9389 e) 977.93 j) 0.357 1.10 En la sección 1.2 se dijo que cada palabra de 16 bits puede contener un número entero cualquiera del intervalo -32768 a +32767. Investigue por qué se incluye al-32768, o bien por qué el intervalo no inicia en -32767. Considere una computadora con una palabra de 8 bits. ¿Qué rango de números enteros puede contener dicha palabra? Represente el número -26 en una palabra de 8 bits. Dados los siguientes números máquina en una palabra de 16 bits 1.11 1.12 1.13 a) b) e) o~ ¿Qué decimales representan? 1.14 Normalice los siguientes números a) 723.5578 e) 0.003485 d) 8 X 103b) -15.324 , Puede usar el Programa 1.1 del disco para comprobar sus resultados. o
  • 40. --------------------------_._--------- 26 Métodos numéricos aplicados a la ingeniería SUGERENCIA: Pasar los números a binario y despúes normalizados. 1.15 Represente en doble precisión el número decimal del ejemplo 1.10 1.16 Elabore un programa para la calculadora o el dispositivo de cálculo con el que se cuente, de modo que el número 0.0001 se sume diez mil veces consigo mismo 0.0001 + 0.0001 + ... + 0.0001 1 2 10000 El resultado deberá imprimirse. Interprete este resultado de acuerdo con los siguientes li- neamientos a) Si es 1, ¿cómo es posible si se sumaron diez mil valores que no son realmente 0.0001 ? b) En caso de obtener 1, explore con el valor 0.00001,0.000001, etc., hasta obtener un resultado diferente de l. e) ¿Es posible obtener un resultado menor de 1? ¿Por qué? 1.17 Con el programa del problema l.16 efectúe los cálculos de los incisos a) a d) del ejemplo l.12 y obtenga los resultados de la siguiente manera a) Inicialice la variable SUMA con O, 1, 1000 Y 10000 en los incisos a), by, e) y d), res- pectivamente, y luego en un ciclo súmese a ese valor diez mil veces el 0.000l. Anote sus resultados. b) Inicialice la variable SUMA con Opara los cuatro incisos y al final del ciclo donde se habrá sumado 0.0001 consigo mismo 10000 veces, sume a ese resultado los nú- meros O, 1, 1000 Y 10000 e imprima los resultados. Interprete las diferencias de los resultados. 1.18 La mayoría de las calculadoras científicas almacenan dos o tres dígitos de seguridad más de los que despliegan. Por ejemplo, una calculadora que despliega ocho dígitos puede almace- nar realmente diez (dos dígitos de seguridad); por tanto, será un dispositivo de diez dígitos. Para encontrar la exactitud real de su calculadora, realice las siguientes operaciones. Divida 10 entre 3, al resultado réstele 3. Divida 100 entre 3, al resultado réstele 33. Divida 1000 entre 3, al resultado réstele 333. Divida 10000 entre 3, al resultado réstele 3333. Notará que la cantidad de los números 3 desplegados se va reduciendo. La cantidad de 3 desplegada en cualquiera de las operaciones anteriores, sumada al núme- ro de ceros utilizados con el 1, indica el número de cifras significativas que maneja su cal- culadora. Por ejemplo, si con la segunda operación despliega 0.3333333 la calculadora maneja nueve cifras significativas de exactitud (7 + 2 ceros que tiene 100). NOTA: Si su calculadora es del tipo intérprete BASIC, no realice las operaciones como 1000/3-333porque obtendrá otros resultados. 1.19 Evalúe la expresión A / ( 1-cos x ), en un valor de x cercano a O°. ¿Cómo podría evitar la resta de dos números casi iguales en el denominador? 1.20 Determine en su calculadora o microcomputadora si muestra un mensaje de overflow o no. 1.21 Deduzca las expresiones para xM dadas en el ejercicio l.7. 1.22 Un número máquina para una calculadora o computadora es un número real que se almace- na exactamente (en forma binaria de punto flotante). El número -125.32 del ejemplo l.1O, 26 Métodos numéricos aplicados a la ingeniería SUGERENCIA: Pasar los números a binario y despúes normalizarlos. 1.15 Represente en doble precisión el número decimal del ejemplo 1.10 1.16 Elabore un programa para la calculadora o el dispositivo de cálculo con el que se cuente, de modo que el número 0.0001 se sume diez mil veces consigo mismo 0.0001 + 0.0001 + ... + 0.0001 1 2 10000 El resultado deberá imprimirse. Interprete este resultado de acuerdo con los siguientes li- neamientos a) Si es 1, ¿cómo es posible si se sumaron diez mil valores que no son realmente 0.0001 ? b) En caso de obtener 1, explore con el valor 0.00001,0.000001, etc., hasta obtener un resultado diferente de l . e) ¿Es posible obtener un resultado menor de 1? ¿Por qué? 1.17 Con el programa del problema l.16 efectúe los cálculos de los incisos a) a d) del ejemplo l.12 y obtenga los resultados de la siguiente manera a) Inicialice la variable SUMA con O, 1, 1000 Y 10000 en los incisos a), by, e) y d), res- pectivamente, y luego en un ciclo súmese a ese valor diez mil veces el 0.0001. Anote sus resultados. b) Inicialice la variable SUMA con Opara los cuatro incisos y al final del ciclo donde se habrá sumado 0.0001 consigo mismo 10000 veces, sume a ese resultado los nú- meros O, 1, 1000 Y 10000 e imprima los resultados. Interprete las diferencias de los resultados. 1.18 La mayoría de las calculadoras científicas almacenan dos o tres dígitos de seguridad más de los que despliegan. Por ejemplo, una calculadora que despliega ocho dígitos puede almace- nar realmente diez (dos dígitos de seguridad); por tanto, será un dispositivo de diez dígitos. Para encontrar la exactitud real de su calculadora, realice las siguientes operaciones. Divida 10 entre 3, al resultado réstele 3. Divida 100 entre 3, al resultado réstele 33. Divida 1000 entre 3, al resultado réstele 333. Divida 10000 entre 3, al resultado réstele 3333. Notará que la cantidad de los números 3 desplegados se va reduciendo. La cantidad de 3 desplegada en cualquiera de las operaciones anteriores, sumada al núme- ro de ceros utilizados con el 1, indica el número de cifras significativas que maneja su cal- culadora. Por ejemplo, si con la segunda operación despliega 0.3333333 la calculadora maneja nueve cifras significativas de exactitud (7 + 2 ceros que tiene 100). NOTA: Si su calculadora es del tipo intérprete BASIC, no realice las operaciones como 1000/3-333 porque obtendrá otros resultados. 1.19 Evalúe la expresión A / ( 1-cos x), en un valor de x cercano a O°. ¿Cómo podría evitar la resta de dos números casi iguales en el denominador? 1.20 Determine en su calculadora o microcomputadora si muestra un mensaje de overflow o no. 1.21 Deduzca las expresiones para xM dadas en el ejercicio 1.7. 1.22 Un número máquina para una calculadora o computadora es un número real que se almace- na exactamente (en forma binaria de punto flotante). El número -125.32 del ejemplo l.1O,
  • 41. Errores 27 ente, evidentemente no es un número de máquina (si el dispositivo de cálculo tiene una palabra de 16 bits). Por otro lado, el número -26 del ejemplo 1.8 sí lo es, empleando una palabra de 16 bits. Determine 10 números de máquina en el intervalo [10-19, 1018] cuando se emplea una palabra de 16 bits. 1.23 Investigue cuántos números máquina positivos es posible representar en una palabra de 16 bits. 1.24 Haga el análisis de la propagación de errores para la resta (véase análisis de la suma, en la sección 1.3). 1.25 Se desea evaluar la función e5x en el punto x = 1.0; sin embargo, si el valor de x se calcu- ló en un paso previo con un pequeño error y se tiene x* = 1.01; determine Ef con las ex- presiones dadas en la evaluación de funciones de la sección 1.3. Luego determine Ef co- mo f (1) - f (l.01) Y compare los resultados. 1.26 Resuelva el siguiente sistema de ecuaciones, usando dos cifras decimales para guardar los resultados intermedios y finales. 21.76x + 24.34y = 1.24 14.16x + 15.84y = 1.15 nde nú- y determine el error cometido. La solución exacta (redondeada a 5 cifras decimales es) x = -347.89167, Y = 311.06667. 1.27 Codifique el siguiente algoritmo en su microcomputadora (use precisión sencilla) PASO l. Leer A. PASO 2. Mientras A>O, repetir los pasos 3 y 4. PASO 3. IMPRIMIR Ln(Exp(A))-A, Exp(Ln(A))-A PASO 4. Leer A. PASO 5. TERMINAR. de ce- itos, Ejecútelo con diferentes valores de A, por ejemplo 0.2, 0.25, 1, l.5, 1.8, 2.5, 3.14159, 0.008205, etc., y observe los resultados. 1.28 Modifique el programa del problema del ejemplo 1.27 usando doble precisión para A y compare los resultados. 1.29 Modifique el paso 3 del programa del problema 1.27 para que quede así IMPRIMIR SQR(A fI 2) - A, SQR(A) fI 2 - A y vuelva a ejecutarlo con los mismos valores. e- al- ora 1.30 Realice la modificación indicada en el problema 1.29 al programa del problema 1.28. Compare los resultados. 1.31 Repita los problemas l.27 a l.30 con lenguaje Pascal (puede usar Delphi, por ejemplo), con lenguaje Visual C++ y compare los resultados con los obtenidos en Basic. la no. ce- lO, Errores 27 evidentemente no es un número de máquina (si el dispositivo de cálculo tiene una palabra de 16 bits). Por otro lado, el número -26 del ejemplo 1.8 sí lo es, empleando una palabra de 16 bits. Determine 10 números de máquina en el intervalo [10-19, 1018 ] cuando se emplea una palabra de 16 bits. 1.23 Investigue cuántos números máquina positivos es posible representar en una palabra de 16 bits. 1.24 Haga el análisis de la propagación de errores para la resta (véase análisis de la suma, en la sección 1.3). 1.25 Se desea evaluar la función e5x en el punto x = 1.0; sin embargo, si el valor de x se calcu- ló en un paso previo con un pequeño error y se tiene x* = 1.01 ; determine E¡ con las ex- presiones dadas en la evaluación de funciones de la sección 1.3. Luego determine E¡ co- mo f (1) - f (1.01) Ycompare los resultados. 1.26 Resuelva el siguiente sistema de ecuaciones, usando dos cifras decimales para guardar los resultados intermedios y finales. 21.76x + 24.34y = 1.24 14.16x + 15.84y = 1.15 y determine el error cometido. La solución exacta (redondeada a 5 cifras decimales es) x = -347.89167, Y =311.06667. 1.27 Codifique el siguiente algoritmo en su microcomputadora (use precisión sencilla) PASO l . Leer A. PASO 2. Mientras A>O, repetir los pasos 3 y 4. PASO 3. IMPRIMIR Ln(Exp(A»-A, Exp(Ln(A»-A PASO 4. Leer A. PASO 5. TERMINAR. Ejecútelo con diferentes valores de A, por ejemplo 0.2, 0.25, 1, 1.5, 1.8, 2.5, 3.14159, 0.008205, etc., y observe los resultados. 1.28 Modifique el programa del problema del ejemplo 1.27 usando doble precisión para A y compare los resultados. 1.29 Modifique el paso 3 del programa del problema 1.27 para que quede así IMPRIMIR SQR(A A 2) - A, SQR(A) A 2 - A y vuelva a ejecutarlo con los mismos valores. 1.30 Realice la modificación indicada en el problema 1.29 al programa del problema 1.28. Compare los resultados. 1.31 Repita los problemas 1.27 a 1.30 con lenguaje Pascal (puede usar Delphi, por ejemplo), con lenguaje Visual C++ y compare los resultados con los obtenidos en Basic.
  • 42. CAPÍTULO 2 SOLUCiÓN DE ECUACIONES NO LINEALES A dónde nos dirigimos En este Y.'lPítuloestudiaremos diversos métodos para resolver ecuaciones no lineales en una incógnita,f(x) = O, aprovechando los conceptos básicos del cálculo y las posibili- dades gráficas y de cómputo de la tecnología modema. A lo largo del texto, recurrire- mos sistemáticamente a la interpretación gráfica de los métodos, a fin de mostrar visualmente su funcionamiento y d~ enriquecer las imágenes asociadas con ellos; de iguai máriera, se generan tablas en la aplicación de cada técnica para analizar el com- portamiento numérico y eventualmente detener el proceso. Se ha organizado el material como métodos de uno y de dos puntos, usando como prototipo de los primeros el de punto fijo, y de los segundos el de posición falsa. Esto, junto con el concepto de orden de convergencia, nos permitirá tener los elementos su- ficientes para seleccionar la técnica más adecuada para una situación dada. Finalizamos el capítulo con las técnicas para resolver ecuaciones polinomiales. Algunas de ellas son adaptaciones de las que estudiamos anteriormente y otras particulares para esta familia;' El propósito de este capítulo es que el lector cuente con los elementos básicos, com- putácionales y de criterio, apropiados para resolver el problema algebraico clásico de en- contra¡' las raíces reales y complejas de la ecuación f (x)=O, en donde las técnicas algebraicas de "despejar" la incógnita no sean aplicables, como es el caso de cos x - 3x = Oo e' - 3x = O, o bien resulten imprácticas. Por último, es importante señalar lo difícil que resulta pensar en un tópico de matemáticas o ingeniería que no involucre ecuaciones de esta naturaleza. Introducción Uno de los problemas más frecuentes en ingeniería es encontrar las raíces de ecuaciones de la formaf(x) = O,dondef(x) es una función real de una variable x, como un polinomio en x f (x) = 4 x5 + X 3 - 8 x + 2 o una función trascendente' f (x) = e' sen x + In 3x + x3 Existen distintos algoritmos para encontrar las raíces o ceros de f (x) = O,pero ningu- no es general. es decir, no hay un algoritmo que funcione con todas las ecuaciones; por ejemplo, se puede pensar en un algoritmo que funcione perfectamente para encontrar las raíces de fl (x) = O,pero al aplicarlo no se pueden encontrar los ceros de una ecuación dis- tinta j, (x) = O. , Las funciones trascendentes contienen términos trigonométricos, exponenciales o logarítmicos de la variable independiente. CAPiTULO 2 SOLUCiÓN DE ECUACIONES NO LINEALES A dónde nos dirigimos En este capítulo estudiaremos diversos métodos para ~esolver ecua<;iones no lineales en una incógnita,f(x) = O, aprovechando los conceptos básicos del cálculo y las posibili- dades gráficas y de cómputo de la técnología modema. A lq largo del texto, recunire- mos sistetnáticámente a la interpretación gráfica de los métodos, a fin de mostrar visualmente su fu,ncionamiento y de enriquecer las imágenes asociadas con ellos;. de igúiti máriera, se generan tablas en la aplicación cte cada técnica para analizar el com- portamiento numérico y eventualmente detener el proceso. Se ha organizado el material como métodos de uno y de dos puntos, usando como prototipo de los primeros el de punto fijo, y de los segundos el de posición falsa. Esto, junto con el concepto de orden de convergencia, nos permitirá tener los elementos su- ficientes para seleccionar la técnica más adecuada para una situación dada. Finalizamos el capítulo con las técnicas para resolver ecuaciones polinomiales. Algunas de ellas son adaptaciones de las que estudiamos anteriormente y otras particulares para esta familia. El propósito de este capítulo es que el lector cuente con los elementos básicos, com- putacionales y de critello, apropiados para resolver el problema algebraico clásico de en- contra¡' las raíces reales y complejas de la ecuación f (x)=O, en donde las técnicas algebraicas de "despejar" la incógnita no sean aplicables, como es el caso de cos x - 3x = Oo eX - 3x = O, o bien resulten imprácticas. Por último, es importante señalar lo difícil que resulta pensar en un tópico de matemáticas o ingeniería que no involucre ecuaciones de esta naturaleza. Introducción Uno de los problemas más frecuentes en ingeniería es encontrar las raíces de ecuaciones de la formaf(x) =O, dondef(x) es una función real de una variable x, como un polinomio en x f(x) = 4 x5 + X 3 - 8 x + 2 o una función trascendente' f (x) = eT sen x + In 3x + x3 Existen distintos algoritmos para encontrar las raíces o ceros def (x) =O, pero ningu- no es general. es decir, no hay un algoritmo que funcione con todas las ecuaciones; por ejemplo, se puede pensar en un algoritmo que funcione perfectamente para encontrar las raíces def l (x) = O, pero al aplicarlo no se pueden encontrar los ceros de una ecuación dis- tintaf2 (x) =O. , Las funciones trascendentes contienen términos trigonométricos, exponenciales o logarítmicos de la variable independiente.
  • 43. 30 Métodos numéricos aplicados a la ingeniería Sólo en muy pocos casos será posible obtener las raíces exactas de f (x) = O, como cuando f (x) es un polinomio factorizable, tal como f(x) = (x-xI) (x-x2) ... (X-XII)' donde Xi' 1 ::::;i ::::;n denota la i-ésima raíz de f (x) = O. Sin embargo, se pueden obtener so- luciones aproximadas al utilizar algunos de los métodos numéricos de este capítulo. Se empezará con el método de punto fijo (también conocido como de aproximaciones suce- sivas, de iteración funcional, etc.), por ser el prototipo de todos ellos. 2.1 Método de punto fijo Sea la ecuación general f(x) =0, (2.1) de la cual se desea encontrar una raíz real" X. El primer paso consiste en transformar algebraicamente la ecuación 2.1 a la forma equivalente X = g (x) (2.2) Por ejemplo para la ecuación f (x) = 2x2 - X - 5 = O (2.3) cuyas raíces son 1.850781059 y -1.350781059, algunas posibilidades de x = g (x) son a) x=2x2-5 "despejando" el segundo término. b) x=JX;5 "Despejando" x del primer término. (2.4) e) 5 Factorizando x y "despejándola".x=-- 2x- 1 el) x=2x2-5 Sumando x a cada lado. e) 2x2-x-5 Véase sección 2.2x=x- 4x- 1 Una vez que se ha determinado una forma equivalente (Ec. 2.2), el siguiente paso es tantear una raíz; esto puede hacerse por observación directa de la ecuación (por ejemplo en la Ec. 2.3 se ve directamente que x = 2 es un valor cercano a una raíz)." Se denota el valor de tanteo o valor de inicio como xo' Otros métodos de tanteo se estudiarán en la sec- ción 2.8. Una vez que se tiene xo, se evalúa g (x) en xo, denotándose el resultado de esta eva- luación como xl; esto es, . g (xo) = XI El valor de xI comparado con X o presenta los dos siguientes casos: * En las secciones 2.9 y 2.10 se analizará el caso de raíces complejas . •• Puede graficar usando un paquete comercial.
  • 44. omo so- . Se uce- 2.1) rma 2.2) 2.3) 2.4) o es plo a el ec- va- Solución de ecuaciones no lineales 31 CASO 1. QUE x, =xO Esto indica que se ha elegido como valor inicial una raíz y el problema queda concluido. Para aclararlo, recuérdese que si x es raíz de la ecuación 2.1, se cumple que f(x) = O, y como la ecuación 2.2 es sólo un rearreglo de la ecuación 2.1, también es cierto que g (x ) = x . Si se hubiese elegido como X o = 1.850781059 para la ecuación 2.3, el lector puede ve- rificar que cualquiera que sea la g (x) seleccionada, g (1.850781059) = 1.850781059; esto se debe a que 1.850781059 es una raíz de la ecuación 2.3. Esta característica de g (x) de fijar su valor en una raíz x ha dado a este método el nombre que lleva. Es el caso más frecuente e indica que x, y X o son distintos de x, Esto es fácil de explicar, ya que si x no es una raíz de 2.1, se tiene que f(x)=FO, y por otro lado, evaluando g (x) en x, se tiene g (x) =Fx . En estas circunstancias se procede a una segunda evaluación de g (x), ahora en x" deno- tándose el resultado como x2 Este proceso se repite y se obtiene el siguiente esquema iterativo Valor inicial: Primera iteración: Segunda iteración: Tercera iteración: f(xo) f(x,) f(x2 ) f(x3 ) (2.5) g (x¡_,) = g (x) i-ésima iteración: i + l-ésima iteración: Aunque hay excepciones, generalmente se encuentra que los valores xo, x" x2 ' ... se van acercando a x de manera que x¡ está más cerca de x que x¡_" o bien se van alejando de x de modo que cualquiera está más lejos que el valor anterior. Si para la ecuación 2.3 se emplea X o = 2.0 como valor inicial y las g (x) de los incisos a) y b) de la ecuación 2.4 se obtiene, respectivamente: Solución de ecuaciones no lineales 31 CASO 1. QUE XI =xo Esto indica que se ha elegido como valor inicial una raíz y el problema queda concluido. Para aclararlo, recuérdese que si x es raíz de la ecuación 2.1 , se cumple que f(x) = O, y como la ecuación 2.2 es sólo un rearreglo de la ecuación 2.1 , también es cierto que g (x)=x . Si se hubiese elegido como X o=1.850781059 para la ecuación 2.3, el lector puede ve- rificar que cualquiera que sea la g (x) seleccionada, g (1 .850781059) = 1.850781059; esto se debe a que 1.850781059 es una raíz de la ecuación 2.3. Esta característica de g (x) de fijar su valor en una raíz x ha dado a este método el nombre que lleva. Es el caso más frecuente e indica que XI y X oson distintos de x. Esto es fácil de explicar, ya que si xno es una raíz de 2.1, se tiene que f(x)*O, y por otro lado, evaluando g (x) en x,se tiene g (x) *x . En estas circunstancias se procede a una segunda evaluación de g (x), ahora en x" deno- tándose el resultado como x2 Este proceso se repite y se obtiene el siguiente esquema iterativo Valor inicial: xo f(xo) Primera iteración: xI g (xo) f(x l) Segunda iteración: x2 g (xI) f(x2) Tercera iteración: x3 g (x2) f(x3) (2.5) i-ésima iteración: Xi g (Xi_l ) f(x) i + l-ésima iteración: xi+ I = g (x) f(xi+ l) Aunque hay excepciones, generalmente se encuentra que los valores xo, x" x2' ... se van acercando a x de manera que Xi está más cerca de x que xi_ " o bien se van alejando de x de modo que cualquiera está más lejos que el valor anterior. Si para la ecuación 2.3 se emplea X o = 2.0 como valor inicial y las g (x) de los incisos a) y b) de la ecuación 2.4 se obtiene, respectivamente:
  • 45. 32 Métodos numéricos aplica dos a la ingeniería xo=2;g(x)=2x2-5 Xo = 2; g (x) = JX;5 Xi g (Xi) Xi g (Xi) O 2 3 O 2.00000 1.87083 3 13 1.87083 1.85349 2 13 333 2 1.85349 1.85115 3 333 221773 3 l.85115 1.85083 Puede apreciarse que la sucesión diverge con la g (x) del inciso a), y converge a la raíz 1.850781059 con la g (x) del inciso b). Finalmente, para determinar si la sucesión xo' x [, x2, ... está convergiendo o divergien- do de una raíz X, cuyo valor se desconoce, puede calcularse en el proceso 2.5 la sucesión f (xo)' f (x 1)' f (x2),· .. Si dicha sucesión tiende a cero, el proceso 2.5 converge a x y dicho proceso se continuará hasta que If (x) I < el' donde e[ es un valor pequeño e indicativo de ' la exactitud o cercanía de Xi con x. Se toma a Xi como la raíz y el problema de encontrar una raíz real queda concluido. Si por el contrario f (xo)'! (XI)'! (x2 ), ... no tiende a cero, la sucesión xo, xl' x2' ... diverge de x, y el proceso deberá detenerse y ensayarse uno nuevo con una g (x) diferente. Fi Gráfic Encuentre una aproximación a una raíz real de la ecuación cos x - 3 x = O Solución Dos posibilidades de g (x) = x son a) x = cos x - 2 x b)x = cos x / 3 Graficando por separado las funciones cos x y 3x, se obtiene la figura 2.1 (Para graficar puede usar: el guión (script) de Matlab, las indicaciones para la TI-92 Plus o algún otro software comercial). ,~J o' .AA x= -4: O. 1 : 4; y=cos (x); z= 3~x; t=zeros (size (x)); plot (x,y) axis([-4 4 -2 2]) hold on plot (x,z) plot (x, t) Invoque el editor Y=+W Escriba en yl = la primera función a graficar: cos (x) Escriba en y2 = la segunda función a grafiear: 3*x Grafique con zoom estándar (F2 6) Lleve el cursar gráfico al punto donde se cruzan las dos funciones. Haga un acercamiento(F2 2)~ Use el trazador (F3) para ubicar la raíz. De donde un valor cercano a x es X o = (n/2) /4*. Iterando se obtiene para la forma del inciso a). • En el caso de funciones trigonométricas x debe estar en radianes.
  • 46. a la raíz ergien- ucesión y dicho ativo de contrar cero, la nuevo a TI-92 a del Solución de ecuaciones no lineales 33 0.5 O -0.5 -1 -1.5 Figura 2.1 Gráfica de cos x -2 y de 3x. -4 -3 -2 ~l O 2 3 4 Xi g (Xi) If(Xi) I O Tr/8 0.13848 0.25422 1 0.13848 0.71346 0.57498 2 0.71346 -0.67083 1.38429 3 -0.67083 2.12496 2.79579 4 2.12496 -4.77616 6.90113 Se detiene el proceso en la cuarta iteración, porque f (xo),f (x I),f (x2 ), ... no tiende a cero. Se emplea el valor absoluto de f (x) para manejar la idea de distancia. Se inicia un nuevo proceso con X o :=: (TrI2)/4 y la forma equivalente del inciso b). Xi g (x;) If(Xi) I O Tr/8 0.30796 0.25422 0.30796 0.31765 0.02907 2 0.31765 0.31666 0.00298 3 0.31666 0.31676 0.00031 4 0.31676 0.31675 0.00003 Yla aproximación de la raíz es: .i ""x4 :=: 0.31675 Para llevar a cabo los cálculos que se muestran en la tabla anterior, puede usar Matlab o la TI-92 Plus:
  • 47. ~7t--------------------------------------------~=======-=------------------------------------------ 34 Métodos numéricos aplicados a la ingeniería E2_1 () Prgm ClrIO : 3.1416/B-+xO For i, 1, 5 eos (xO) /3-+ x abs (eos (xO) -::rxO)-+ f string (xO) s" "&string(x)-+a a&" "string (f) -+ a Disp a: Pause : x+ xO EndFor EndPgrm ALG format long xO=pi / B ; for i = 1 : 5 x=eos (xO) / 3; f=abs (eos (xO) - :Ji'xO); disp ( [xO, x, f] ) xO=x; end Para er Matlab posee una función que resuelve ecuaciones no lineales, suministrando la función y un valor inicial. Para este caso la instrucción quedaría: DA' RE fzero('cos(x) -3*x', pi/8) PASO PASO con lo que se obtiene: ans = 0.3168 y en formato largo (format long) ans = 0.31675082877122 PASO La calculadora TI-92 Plus también tiene una función que resuelve ecuaciones no lineales. La instrucción es: nSolve(cos(x) = 3*x, x) y el resultado es 0.316751 CRITERIO DE CONVERGENCIA Se estudiará un criterio más de convergencia del proceso iterativo 2.5, basado en que g (x) = .e , por lo cual puede suponerse que si la sucesión xo, xl' x2' ... converge a x , los valores con- secutivos xi y X i + 1 irán acercándose entre sí conforme el proceso iterativo avanza, como puede verse enseguida - x -H+---I-1I---Kt1I--------x Un modo práctico de saber si los valores consecutivos se acercan es ir calculando la dis- tancia entre ellos di = I Xi + 1 - Xi I Si la sucesión di' d2 , d3 , ... tiende a cero, puede pensarse que el proceso 2.5 está conver- giendo a una raíz x y debe continuarse hasta que di < E, Ytomar a xi+ 1 como la raíz busca- da. Si di' d2 , d3 , ... no converge para un número "grande" de iteraciones (llámense 34 Métodos numéricos aplicados a la ingeniería format long xO=pi / B ; for i = 1 : 5 x=eos (xO) / 3; E2_1 () Prgm CIrIO : 3 . 1416/B-> xO For i , 1, 5 eos (xO) / 3->x abs (eos (xO) -3~xO) -> ff=abs (eos (xO) - YxO) ; disp ( [xO, x, f] ) xO=x; string (xO) &" " &string(x) -> a a&" "string(f)->a end Disp a: Pause : x-> xO EndFor EndPgrm Matlab posee una función que resuelve ecuaciones no lineales, suministrando la función y un valor inicial. Para este caso la instrucción quedaría: fzero('cos(x) -3*x', pi/8) con lo que se obtiene: ans =0.3168 y en formato largo (format long) ans = 0.31675082877122 La calculadora TI-92 Plus también tiene una función que resuelve ecuaciones no lineales. La instrucción es: nSolve(cos(x) =3*x, x) y el resultado es 0.316751 CRITERIO DE CONVERGENCIA Se estudiará un criterio más de convergencia del proceso iterativo 2.5, basado en que g (x) = x , por lo cual puede suponerse que si la sucesión xo' xI ' x2' . .. converge a x, los valores con- secutivos xi y Xi+1 irán acercándose entre sí conforme el proceso iterativo avanza, como puede verse enseguida - x I I I I I I x Un modo práctico de saber si los valores consecutivos se acercan es ir calculando la dis- tancia entre ellos di =I xi + 1 - xi I Si la sucesión di' d2, d3,... tiende a cero, puede pensarse que el proceso 2.5 está conver- giendo a una raíz x y debe continuarse hasta que di < 8, Ytomar a Xi+1 como la raíz busca- da. Si dI' d2, d3, . .. no converge para un número "grande" de iteraciones (llámense
  • 48. ción y neales.. ue s con- como la dis- Solución de ecuaciones no lineales 35 MAXIT), entonces xo, Xl' x2' ... diverge de x , y se detiene el proceso para iniciar uno nue- vo, modificando la función g (x), el valor inicial o ambos. Este criterio de convergencia se utiliza ampliamente en el análisis numérico y resulta más sencillo de calcular que el que emplea la sucesiónf(xo),f(x1 ),f(x2 ), ... pero también es menos seguro, como se verá más adelante. Para finalizar esta sección se da un algoritmo del método de punto fijo en forma pro- pia para lenguajes de programación. ALGORITMO 2. 1 Método de punto fUo Para encontrar una raíz real de la ecuación g (x) = x proporcionar la función G (X) Ylos DATOS: Valor inicial XO, criterio de convergencia EPS y número máximo de iteraciones MAXIT. RESULTADOS: La raíz aproximada X o un mensaje de falla. PASO l. PASO 2. Hacer I = 1 Mientras I <MAXIT, realizar los pasos 3 a 6. PASO 3. Hacer X = G(XO) (calcular (Xi ». PASO 4. Si ABS (X - XO) ::;EPS entonces IMPRIMIR X Y TERMINAR. De otro modo CONTINUAR. PASO 5. Hacer I = I + 1. PASO 6. Hacer XO = X (actualiza XO). IMPRIMIR mensaje de falla: "EL MÉTODO NO CONVERGE A UNA RAÍZ" Y TERMINAR.PASO 7. EL CRITERIO I g' (x) I < 1 Es importante analizar por qué algunas formas equivalentes x = g (x) de f (x) = O condu- cen a una raíz en el método de punto fijo y otras no, aun empleando el mismo valor inicial en ambos casos. Se inicia el análisis aplicando el teorema del punto medio" a la función g (x) en el in- tervalo comprendido entre x¡_l y Xi' (2.6) donde: Como sustituyendo se obtiene: Xi+1- Xi = g' (~¡) (x¡ - x¡_l) Tomando valor absoluto en ambos miembros 1 x¡+l - x¡ 1 = 1 g' (~¡) 11 x¡ - x¡_l 1 Para i = 1,2,3, ... la ecuación 2.7 queda así: (2.7) * Se supone que g (x) satisface las condiciones de aplicabilidad de este teorema. Solución de ecuaciones no lineales 35 MAXIT), entonces xo' Xl' X2, ... diverge de x, y se detiene el proceso para iniciar uno nue- vo, modificando la función g (x), el valor inicial o ambos. Este criterio de convergencia se utiliza ampliamente en el análisis numérico y resulta más sencillo de calcular que el que emplea la sucesiónj(xo),f(xl),f(x2), ... pero también es menos seguro, como se verá más adelante. Para finalizar esta sección se da un algoritmo del método de punto fijo en forma pro- pia para lenguajes de programación. ALGORITMO 2.1 Método de punto fUo Para encontrar una raíz real de la ecuación g (x) = x proporcionar la función G (X) Ylos DATOS: Valor inicial XO, criterio de convergencia EPS y número máximo de iteraciones MAXIT. RESULTADOS: La raíz aproximada X o un mensaje de falla. PASO 1. PASO 2. PASO 7. Hacer 1 = 1 Mientras 1 <MAXIT, realizar los pasos 3 a 6. PASO 3. Hacer X = G(XO) (calcular (Xi ». PASO 4. Si ABS (X - XO) ::; EPS entonces IMPRIMIR X YTERMINAR. De otro modo CONTINUAR. PASO 5. Hacer 1 = 1 + 1. PASO 6. Hacer XO = X (actualiza XO). IMPRIMIR mensaje de falla: "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR. EL CRITERIO Ig' (x) I< 1 Es importante analizar por qué algunas formas equivalentes x = g (x) dej(x) = Ocondu- cen a una raíz en el método de punto fijo y otras no, aun empleando el mismo valor inicial en ambos casos. Se inicia el análisis aplicando el teorema del punto medio* a la función g (x) en el in- tervalo comprendido entre xi_1 y Xi' donde: Como sustituyendo se obtiene: Xi+ 1 - Xi = g' (~¡) (Xi - xi_1) Tomando valor absoluto en ambos miembros 1xi+1 - Xi 1 =1g' (~¡) 11 Xi - xi_1 1 Para i = 1,2,3,... la ecuación 2.7 queda así: * Se supone que g (x) satisface las condiciones de aplicabilidad de este teorema. (2.6) (2.7)
  • 49. 36 Métodos numéri cos aplicados a la ingeniería 1g' (~2) 1 1X2 - XI 1 = 1g' (~3) 1 1X3 - X2 1 ~2 E (X2, XI) ~3 E (X3, X2) (2.8) Supóngase ahora que en la región que comprende a xo' xI"" y en x misma, la función g' (x) está acotada; esto es 1g' (x) I:S; M, para algún número M. Entonces: 1x2 - XI 1 :s; M 1Xl - Xo 1 1x3 - x2 1 :s; M 1x2 - xII 1x4 - x3 1 :s; M 1x3 - x2 1 (2.9) Si se sustituye la primera desigualdad en la segunda, se tiene 1x3 - x2 1:s; MI x2 - XI 1:s; MM 1XI - Xo 1 o bien 1x3 - x2 1:s; M2 1XI - Xo 1 Si se sustituye este resultado en la tercera desigualdad de la ecuación 2.9 se tiene 1x4 - x3 1:s; M 1x3 - x2 1:s; MM2 1XI - Xo 1 1x4 - x3 1:s; M3 1XI - Xo 1o Procediendo de igual manera se llega a (2.10) El proceso 2.5 puede converger por razones muy diversas, pero es evidente que si M < 1, dicho proceso convergirá, ya que Mi tenderá a cero al tender i a un número grande. En conclusión, el proceso 2.5 puede converger si M es grande y convergirá si M < 1 en un entorno de X que incluya xo, XI' x2 , ... Entonces M < 1 es urja condición suficiente, pero no necesaria para la convergencia. Un método práctico de emplear este resultado es obtener distintas formas X = g (x) def (x) = O,Ycalcular 1g' (x) 1;las que satisfagan el criterio 1g' (xo) 1< 1 prometerán convergencia al aplicar el proceso 2.5. Ejemplo 2.2 Calcule una raíz real de la ecuación" f (x) = x3 + 2x2 + 10x - 20 = O, empleando como valor inicial X o = l. *Resuelta por Leonardo de Pisa en 1225. 36 Métodos numéricos aplicados a la ingeniería 1X3 - X2 1 1g' (~2) 1 1X2 - XI 1 1X4 - X3 1 = 1g' (~3) 1 1X3 - X2 1 ~2 E (X2, X I) ~3 E (X3, X2) (2.8) Supóngase ahora que en la región que comprende a X o' Xi' .. . yen x misma, la función g' (x) está acotada; esto es 1g' (x) 1s M, para algún número M. Entonces: 1x2 - X I 1 s M 1xl - X o1 1x3 - x2 1 s M 1x2 - xII 1x4 - x3 1 s M 1x3 - x2 1 Si se sustituye la primera desigualdad en la segunda, se tiene 1x3 - x2 1s M Ix2 - XI 1s MM 1xI - Xo 1 o bÍen 1x3 - x2 1S M2 1xI - Xo 1 Si se sustituye este resultado en la tercera desigualdad de la ecuación 2.9 se tiene 1x4 - x3 1s M 1x3 - x2 1S MM2 1X I - X o 1 o Procediendo de igual manera se llega a (2.9) (2.10) El proceso 2.5 puede converger por razones muy diversas, pero es evidente que si M < 1, dicho proceso convergirá, ya que Mi tenderá a cero al tender i a un número grande. En conclusión, el proceso 2.5 puede converger si M es grande y convergirá si M < 1 en un entorno de X que incluya xo, X I ' x2, . .. Entonces M < 1 es uria condición suficiente, pero no necesaria para la convergencia. Un método práctico de emplear este resultado es obtener distintas formas X = g (x) def (x) = O, Ycalcular 1g' (x) 1; las que satisfagan el criterio 1g' (xo) 1< 1 prometerán convergencia al aplicar el proceso 2.5. Ejemplo 2.2 Calcule una raíz real de la ecuación* f (x) =x3 + 2x2 + 10x - 20 =O, empleando como valor inicial X o=1. *Resuelta por Leonardo de Pisa en 1225.
  • 50. (2.8) nción g' (2.9) Solución de ecuaciones no lineales 37 Solución Dos formas x = g (x) de esta ecuación son 20 a) x=---- x2 + 2x + 10 de donde , ( ) -20(2x + 2) g x = (x2 + 2x + 10)2 Sustituyendo X o = l. I g' (1) 1=1 -80 1=0.47 169 y b) x = x3 + 2,¿ + llx - 20 y g' (x) = 3x2 + 4x + 11 y I g' (1) I = 8 De donde la forma a) promete convergencia y la forma b) no. Aplicando el proceso 2.5 y el criterio e = 10-3 a I X¡+l - x¡ I en caso de convergencia, se tiene: Xi IXi+1 -Xi I Ig' (X) I O 1.00000 '.. 0.47337 L 1.53846 , 0.53-846 0.42572 2 1.29502 0.24344 0.45100 3 1.40183 0.10681 0.44047 4 1.35421 0.04762 0.44529 5 1.37530 0.02109 0.44317 6 1.36593 0.00937 0.44412 (2.10) 7 1.37009 0.00416 0.44370 8 1.36824 0.00184 0.44389 9 1.36906 0.00082 0.44380 ef(x) = encia al Para llevar a cabo los cálculos que se muestran en la tabla anterior, puede usarse Ma- tlab o la TI-92 Plus. format long xO=l; for i=l : 9 x=20/ (xO~2+2*xO+10); dist=abs (x - xO) ; dg=abs (- 2(J1' (2*x+2) l .. (x"2+2*x + 10) "2) ; disp ([x, dist, dg]) xü-x: end e2_2 ( ) Prgm Define g(x)=20/(x~2+2*x+10) CirIO: 1-t xO For i, 1, 9 g (xO) -t x: abs (x - xO) -t d Disp string (x) &" "&string (d) Pause: x-txO EndFor EndPrgm
  • 51. 38 Métodos numéricos aplicados a la ingeniería Obsérvese que Ig'(x) I se mantiene menor de uno. Una vez que IXi +¡ - xi I < 10-3, se detiene el proceso y se toma como raíz a x9 X"'- 1.36906 Si se hubiese tomado la forma equivalente _x3 - 2x2 + 20 x=----- 10 para la cual, se tiene , () -3x2 - 4x g x =---- 10 y con X o = 1 Ig'(1)1=1- 7 1=0.7, 10 Fi Inte geor 19lo cual indica posibilidad de convergencia, pero al aplicar el proceso 2.5 se tiene Xi IXi+1 -Xi I Ig' (Xi) I O 1.00000 0.70000 1.70000 0.70000 1.54700 2 0.93070 0.76930 0.63214 3 1.74614 0.81544 1.61316 4 0.85780 0.88835 0.56386 5 1.78972 0.93192 1.67682 Una divergencia lenta, ya que I g' (x) I toma valores mayores de 1 en algunos puntos. La condición de que el valor absoluto de g' (x) sea menor que 1en la región que com- prende la raíz buscada x y los valores xi' se interpreta geométricamente a continuación. En caso de contar con software comercial pueden graficarse las funciones g' (x) co- rrespondientes a los incisos a) y b) y la recta y = x, y observar los valores de g' (x) en las Xi del proceso iterativo. INTERPRETACIÓN GEOMÉTRICA DE I g' (X) 1<1 Al graficar los dos miembros de la ecuación 2.2 como las funciones y = x y y = g (x), la raíz buscada x es la abscisa del punto de cruce de dichas funciones (véase Fig. 2.2). El proceso 2.5 queda geométricamente representado en la figura 2.2, la cual muestra un caso de convergencia, ya que I g' (x) I es menor que 1 en xo, xl"" X . Para ver esto se trazan las tangentes a g (x) en (xo, xl)' (xl' x2), ... y se observa que to- das tienen un ángulo de inclinación menor que la función y = x cuya pendiente es 1. Fi eL conv díve, L
  • 52. 10-3, se tos. ue com- ción. x) co- (x) en (x), la ). uestra que ta- l. Figura 2.2 Interpretación geométrica de I g' (x) 1> 1. y Solución de ecuaciones no lineales 39 y y=x y = g(x) y A continuación se presentan geométricamente los casos posibles de convergencia y diver- gencia. y y Figura 2.3 Cuatro casos posibles de convergencia y divergencia en la iteración x= 9 (x). y=X y = g(x) xo x a) Convergencia monotónica y = g(x) y y=x x X o XI x3 X e) Divergencia mono tónica y y=x y = g(x) b) Convergencia oscilatoria x3 xI i X o x2 d) Divergencia oscilatoria X X Figura 2.2 Interpretación geométrica de I g' (x) 1> 1. Figura 2.3 Cuatro casos posibles de convergencia y divergencia en la iteración x= 9 (x) . Solución de ecuaciones no lineales 39 y y = x y =g(x) y r y A continuación se presentan geométricamente los casos posibles de convergencia y diver- gencia. y y y = X y = X y =g(x) " x x a) Convergencia monotónica b) Convergencia oscilatoria y =g(x) y y y=x , , , , , , I I I I , , , , x X o XI x 2 x 3 X x3 X I X Xo x2 X c) Divergencia monotónica d) Divergencia oscilatoria
  • 53. 40 Solución Métodos numéricos aplicados a la ingeniería Caso 1. La figura 2.3a ilustra qué ocurre si g' (x) se encuentra entre Oy l. Incluso si X o esta lejos de la raíz x -que se encuentra en el cruce de las curvas y = x, y = g (x)- los valores sucesivos Xi se acercan a la raíz por un solo lado. Esto se conoce como convergencia monotónica. Caso 2. La figura 2.3b muestra la situación en que g' (x) está entre -1 y O.Aun si X o está alejada de la raíz x ,los valores sucesivos xi se aproximan por el lado derecho e izquierdo de la raíz. Esto se conoce como convergencia oscilatoria. Caso 3. En la figura 2.3c se ve la divergencia cuando s' (x) es mayor que 1. Los valores sucesivos Xi se alejan de la raíz por un solo lado. Esto se conoce como divergencia monotónica. Caso 4. La figura 2.3d presenta la divergencia cuando g' (x) es menor que -1. Los valores sucesivos Xi se alejan de la raíz oscilando alrededor de ella. Esto se conoce como divergencia oscilatoria. Un excelente ejercicio es crear ecuaciones f (x) = O, obtener para cada una de ellas varias alternativas de x = g(x) y graficarlas para obtener el punto de intersección (aproximación de la raíz); obtener las correspondientes g' (x) y graficarlas alrededor del punto de inter- sección. Una vez hecho esto se puede ver si alrededor de la raíz la gráfica de g' (x) queda dentro de la banda y = -1 YY = 1;de ser así, un valor inicial cercano a la raíz prometería convergencia. Si la gráfica de g' (x) queda fuera de la banda y = -1, Y = 1no sería reco- mendable iniciar el proceso iterativo. Utilizando la ecuación del ejemplo 2.2 elabore las gráficas de las g' (x) de los incisos a y b. Agregue a las gráficas la banda constituida por y = -1 YY = 1. 20 a) g (x) = ---- x2 + 2x + 10 g' (x) = -20(2x + 2) (x2 + 2x + 10)2 Las gráficas de y = g (x) y y = x se intersectan alrededor de x = 1. Utilizando Matlab o la TI-92 Plus se obtiene la gráfica de s' (x) y la banda y = -1, Y = 1. x=0 : O . 05 : 2; dg=-2(f~ (zt'x+2).j(x. ~2+Z;'x+10). ~2; y=ones (size (x) ) ; z=-ones (size (x) ) ; ymin=nanmin (dg) ymax=nanmax (dg) Invoque el edi tor Y= • W Escriba en y1= la expresión de g' (x): Y1=-2~ (Z;'x+2)/ (x~2+zt'x+10) ~2 Escriba en y2= la cota inferior: y2=-1 Escriba en y3= la cota inferior: y3= 1 MUestre la gráfica con acercamiento nonnal (F2 6). Haga un acercamiento (F2 2.J)if ymin > -1 40 Solución Métodos numéricos aplicados a la ingeniería Caso 1. La figura 2.3a ilustra qué ocurre si g' (x) se encuentra entre Oy 1. Incluso si X oesta lejos de la raíz x -que se encuentra en el cruce de las curvas y = x, y = g (x)-los valores sucesivos Xi se acercan a la raíz por un solo lado. Esto se conoce como convergencia monotónica. Caso 2. La figura 2.3b muestra la situación en que g' (x) está entre -1 y O. Aun si X o está alejada de la raíz x , los valores sucesivos xi se aproximan por el lado derecho e izquierdo de la raíz. Esto se conoce como convergencia oscilatoria. Caso 3. En la figura 2.3c se ve la divergencia cuando g' (x) es mayor que 1. Los valores sucesivos Xi se alejan de la raíz por un solo lado. Esto se conoce como divergencia monotónica. Caso 4. La figura 2.3d presenta la divergencia cuando g' (x) es menor que -1. Los valores sucesivos X i se alejan de la raíz oscilando alrededor de ella. Esto se conoce como divergencia oscilatoria. Un excelente ejercicio es crear ecuacionesf (x) = O, obtener para cada una de ellas varias alternativas de x = g(x) y graficarlas para obtener el punto de intersección (aproximación de la raíz); obtener las correspondientes g' (x) y graficarlas alrededor del punto de inter- sección. Una vez hecho esto se puede ver si alrededor de la raíz la gráfica de g' (x) queda dentro de la banda y = -1 YY = 1; de ser así, un valor inicial cercano a la raíz prometería convergencia. Si la gráfica de g' (x) queda fuera de la banda y =-1, Y = 1 no sería reco- mendable iniciar el proceso iterativo. Utilizando la ecuación del ejemplo 2.2 elabore las gráficas de las g' (x) de los incisos a y b. Agregue a las gráficas la banda constituida por y = - 1 YY = 1. 20 a) g (x) = - - -- x2 +2x+1O g' (x) = -20(2x + 2) (x2 + 2x + 10)2 Las gráficas de y =g (x) y y =x se intersectan alrededor de x = 1. Utilizando Matlab o la TI-92 Plus se obtiene la gráfica de g' (x) y la banda y =-1, Y =1. x=0 : O . 05 : 2; dg= -2(J~ (zt'x+2). / (x. ~2+Z;'x+10) . ~2; y=ones (size (x) ) ; z~ones (size (x) ) ; ymin=nanmin (dg) ; ymax=nanmax (dg) if ymin > - 1 Invoque el eJi tor Y= • W Escriba en yl= la expresión de g ' (x): Yl=-2~ (zt'x+2) / (x ~2+Z;'x+lO) ~2 Escriba en y2= la cota inferior: y2=-1 Escriba en y3= la cota inferior: y3= 1 MUestre la gráfica con acercamiento normal (F2 6). Haga un acercamiento (F2 2.J )
  • 54. c1uso as y = lado. . Los sto se as varias irnación de inter- x) queda ometería ría reco- isos a I,y = 1. (x) : y2=-1 y3= 1 to Solución de ecuaciones no lineales 41 ymin= -1.1; end if ymax < 1 ymax=1.1 ; end plot (x, dg, 'k') hold on plot (x, y, 'k') plot (x, z, 'k') axis ([O 2 ymin ymax]) 0.8 0.6 004 0.2 O -0.2 ~A~ ----------------¡ -0.6 -0.8 -1L-~ __ ~ __ -L __ -L __ J-__~ __ L-~ __ ~ __ ~ O 0.2 004 0.6 0.8 1.2 lA 1.6 1.8 2 Como puede verse, la gráfica de g' (x) alrededor de Xo = 1 queda dentro de la banda y = 1, Y = -1, por lo que un valor inicial dentro del intervalo (0, 2) prometería convergencia, la cual se daría en caso de que la sucesión XÜ' xi' x2' ... xi"" sea tal que g' (x) se mantenga en dicha banda. b) g (x) = x3 + 2x2 + llx - 20 g' (x) = 3x2 + 4x + 11 Xo = 1 Utilizando el guión de Matlab anterior con el cambio (o el correspondiente para la TI-92 Plus) dg = 3*x. A 2 + 4*x + 11 se obtiene: ymin= - 1 . 1 ; end if ymax < 1 ymax=1 . 1 ; end plot (x, dg, 'k ') hold on plot (x , y , 'k ' ) plot (x, z, 'k ' ) axis ( [O 2 ymin ymax]) 0.8 0.6 0.4 0.2 O - 0.2 Solución de e cuaciones no lineales 41 -O.4 r--_ _ __ _ __ - ------1 - 0.6 -0.8 - 1 O 0.2 0.4 0.6 0.8 1.2 1.4 1.6 1.8 2 Como puede verse, la gráfica de g' (x) alrededor de X o == 1 queda dentro de la banda y == 1, Y == -1, por lo que un valor inicial dentro del intervalo (O, 2) prometería convergencia, la cual se daría en caso de que la sucesión XO' xl' x2' ... Xi''' ' sea tal que g' (x) se mantenga en dicha banda. b) g (x) == x3 + 2x2 + llx - 20 g' (x) == 3x2 + 4x + 11 Xo== 1 Utilizando el guión de Matlab anterior con el cambio (o el cOtTespondiente para la TI-92 Plus) dg == 3*x. A 2 + 4*x + 11 se obtiene:
  • 55. 42 Métodos numéricos aplicados a la ingeniería 30 25 20 15 10 5 O O 0.2 0.4 0.6 0.8 1.2 1.4 1.6 1.8 2 Como se puede observar, la gráfica de g' (x) queda totalmente fuera de la banda y = -1, Y = 1, por lo que no es recomendable utilizar esta g(x). Si por otro lado ensayamos la forma equivalente _x3 - 2x2 + 20 g(x) = con 10 , () -3x2 - 4x g x =---- 10 La gráfica queda ahora: 0.5 O -1 0.2 0.4 0.6 0.8 1.2 1.4 1.6 1.8 2 --0.5 -1.5
  • 56. Solución de ecuaciones no lineales 43 Podría pensarse que al tomar un valor inicial dentro de la banda, por ejemplo X o = 1 tendríamos posibilidades de convergencia. No obstante, en el proceso iterativo (ver ejem- plo 2.2), se observa una divergencia oscilatoria. Explíquela utilizando la segunda tabla del ejemplo 2.2 y la gráfica anterior. I ORDEN DE CONVERGENCIA Ahora se verá que la magnitud de g' (x) no sólo indica si el proceso converge o no, sino que además puede usarse como indicador de cuán rápida es la convergencia. Sea E i el error en la i-ésima iteración; esto es Ei =xi-x Si se conoce el valor de la función g (x) y sus derivadas en X, puede expanderse g (x) al- rededor de x en serie de Taylor y encontrar así el valor de g (x) en Xi ( - )2 (- )3 () () '() ( ) 11 ( ) Xi - X + '" (x-) Xi - X g Xi = g x + g X Xi - X + g x 2! g 31 + oo. o bien , ,, (x¡ - x ? '" _ (x¡ - X )3 g (x) - g (x ) = g (x) (x¡ - x) + g (x ) + g (x ) + ... 2! 3! Como X¡+I = g (x) y x = g (x), también puede escribirse la última ecuación como E2 E3 X. -x=g' (x) E + gil (X)_l_+g"' (X)_l_+ oo. 1+1 , 2! 3! El miembro de la izquierda es el error en la (i + 1) -ésima iteración y, por tanto, se expre- sa como E i+ 1 de modo que E2 E3 E '+1= g' (x) E.+ g" (x) -'-+ gil' (x) -'-+ oo. 1 , 2! 3! (2.11) donde puede observarse que si después de las primeras iteraciones E i tiene un valor pe- queño ( 1 E ¡ 1 < 1), entonces El, 1 E? 1, E ¡4,... serán valores más pequeños que 1 E i 1, de modo que si g' (x) 7:- O, la magnitud del primer término de la ecuación 2.11 generalmente domina las de los demás términos y E i+1 es proporcional a E ¡; en cambio si g' (x) = OYg" (x) 7:- O, la magnitud del segundo término de la ecuación 2.11 predomina sobre la de los términos restantes y Ei+1es proporcional a El. Si g' (x) = gil (x) = OY gil' (x):t;: O, E¡+I es proporcional a E ?, etcétera. Se dice entonces que en caso de convergencia, el proceso 2.5 tiene orden uno si g' (x) 7:- O, orden dos si g' (x) = O Yg" (x) 7:- O, orden tres si g' (x) = g" (x) = O Y g'" (x) 7:- O, etc. Una vez determinado el orden n se tiene que E i+1 oc E t y el error E ¡+Iserá más peque- ño que E ¡entre más grande sea n y la convergencia por tanto más rápida. Soluc ión de ecuaciones no lineale s 43 Podría pensarse que al tomar un valor inicial dentro de la banda, por ejemplo X o= 1 tendríamos posibilidades de convergencia. No obstante, en el proceso iterativo (ver ejem- plo 2.2), se observa una divergencia oscilatoria. Explíquela utilizando la segunda tabla del ejemplo 2.2 y la gráfica anterior. I ORDE N DE CONVE RGENCIA Ahora se verá que la magnitud de g' (x) no sólo indica si el proceso converge o no, sino que además puede usarse como indicador de cuán rápida es la convergencia. Sea E i el error en la i-ésima iteración; esto es E; = xi-x Si se conoce el valor de la función g (x) y sus derivadas en X, puede expanderse g (x) al- rededor de x en serie de Taylor y encontrar así el valor de g (x) en x; ( - )2 ( - )3 g (x) - g ( x- ) + g' (x- ) (x x-) + g" (x- ) Xi - X + g'" (x- ) Xi - X i - i - 2! 31 + ... o bien , ,, (Xi - X )2 '" _ (Xi - X )3 g (x) - g (x ) =g (x) (Xi - x) + g (x) + g (x) + ... 2! 3! Como Xi+1 = g (x) y x =g (x), también puede escribirse la última ecuación como E 2 E 3 x· -x = g' (X)E + g" (x) - '- +g'" (x) - ' -+ ... ,+ 1 , 2! 3! El miembro de la izquierda es el error en la (i + 1) -ésima iteración y, por tanto, se expre- sa como E i+ 1 de modo que E 2 E 3 E .+1 =g' (x ) E . + g" (x ) - ' - + g'" (x) - '- + ... , , 2! 3! (2.11) donde puede observarse que si después de las primeras iteraciones E i tiene un valor pe- queño ( 1 E i 1< 1), entonces El, 1 E? 1, E i4,... serán valores más pequeños que 1 E i 1, de modo que si g' (x) 7:- O, la magnitud del primer término de la ecuación 2.11 generalmente domina las de los demás términos y E i+l es proporcional a E i; en cambio si g' (x) = OYg" (x) 7:- O, la magnitud del segundo término de la ecuación 2.11 predomina sobre la de los términos restantes y E i+l es proporcional a E l. Si g' (x) =g" (x) =OYg'" (x) 7'7 O, E ;+ 1 es proporcional a E ?, etcétera. Se dice entonces que en caso de convergencia, el proceso 2.5 tiene orden uno si g' (x) 7:- O, orden dos si g' (x) = OYg" (x) 7:- O, orden tres si g' (x) = g" (x) = OYg'" (x) 7:- O, etc. Una vez determinado el orden n se tiene que E i+1 oc E t y el error E i+1 será más peque- ño que E i entre más grande sea n y la convergencia por tanto más rápida.
  • 57. 44 Métodos n uméricos aplicados a la ingeniería Obsérvese que en los ejemplos resueltos g' (x) *- O, Y el orden ha sido uno. Como al ini- ciar el proceso sólo se cuenta con X o y algunas formas g (x), puede obtenerse g' (x) para ca- da forma y las que satisfagan la condición I e' (xo) I < 1 prometerán convergencia. Dicha convergencia será más rápida para aquéllas donde I s' (xo) I sea más cercano a cero y más lenta entre más próximo esté dicho valor a 1. Así pues, para la ecuación 2.3, las formas 2.4 y el valor inicial X o = 2 se obtiene, respectivamente: a) g' (x) = 4x b) g'(x)~ 4(0r -10 c) g' (x) = (2x _ 1) 2 d) g' (x) = 4x , x -1 (4x-l)(4x-1)-(2x2-x-S)4 e) g ( ) - - (4x _ 1)2 y I g' (2) 1=8 y I g' (2) 1=0.1336 y I s' (2) I = 1.111 y I g' (2) I = 8 y I g' (2) I =0.08163 Las formas de los incisos b) y e) quedan con posibilidades de convergencia, y la e) como la mejor opción porque su valor está más cercano a cero. Se deja al lector encontrar una raíz real de la ecuación 2.3 con el método de punto fi- jo, con la forma e) y detener la iteración una vez que If(x) I ~ 10-4,en caso de convergen- cia, o desde un principio si observa divergencia en las primeras iteraciones. 2.2 Método de Newton-Raphson Ahora se estudiará un método de segundo orden de convergencia cuando se trata de raíces reales no repetidas. Consiste en un procedimiento que lleva la ecuación f (x) = O a la for- ma x = g (x), de modo que g' (x) = O. Su deducción se presenta enseguida. En la figura 2.4 se tiene la gráfica de f (x) cuyo cruce con el eje x es una raíz real x . y pendiente =f'(xo) r-~~-------------- 11 Figura 2.4 Derivación del método de Newton- Raphson. x X 2 x 44 Métodos numéricos aplicados a la ingeniería Obsérvese que en los ejemplos resueltos g' (x)"* O, Yel orden ha sido uno. Como al ini- ciar el proceso sólo se cuenta con X o y algunas formas g (x), puede obtenerse g' (x) para ca- da forma y las que satisfagan la condición I g' (xo) I < 1 prometerán convergencia. Dicha convergencia será más rápida para aquéllas donde I g' (xo) I sea más cercano a cero y más lenta entre más próximo esté dicho valor a 1. Así pues, para la ecuación 2.3, las formas 2.4 y el valor inicial X o=2 se obtiene, respectivamente: a) g' (x) = 4x b) g' (x) = 4 ( x:5)'" -10 c) g' (x) =(2x-l) 2 d) g' (x) = 4x , x -1 (4x-1)(4x-l)-(2x2 -x -S)4 e) g ( ) - - (4x _ 1)2 y Ig' (2) 1=8 y I g' (2) 1=0.1336 y I g' (2) I = Ull y I g' (2) I =8 y I g' (2) I =0.08163 Las formas de los incisos b) y e) quedan con posibilidades de convergencia, y la e) como la mejor opción porque su valor está más cercano a cero. Se deja al lector encontrar una raíz real de la ecuación 2.3 con el método de punto fi- jo, con la forma e) y detener la iteración una vez que If(x) I ~ 10-4, en caso de convergen- cia, o desde un principio si observa divergencia en las primeras iteraciones. 2.2 Método de Newton-Raphson Figura 2.4 Derivación del método de Newton- Raphson. Ahora se estudiará un método de segundo orden de convergencia cuando se trata de raíces reales no repetidas. Consiste en un procedimiento que lleva la ecuaciónf(x) = Oa la for- ma x =g (x), de modo que g' (x) =O. Su deducción se presenta enseguida. y En la figura 2.4 se tiene la gráfica de f (x) cuyo cruce con el eje x es una raíz real x . pendiente =!'(xo) ~~~-------------- x
  • 58. i. Solución de ecuaciones no lineales 45 Vamos a suponer un valor inicial X o que se sitúa en el eje horizontal. Trácese una tan- gente a la curva en el punto (xo'J (xo») y a partir de ese punto sígase por la tangente hasta su intersección con el eje x; el punto de corte xI es una nueva aproximación a x (hay que observar que se ha reemplazado la curva j'(x) por su tangente en (xo,J(xo))' El proceso se repite comenzando con XI' se obtiene una nueva aproximación x2 y así sucesivamente, has- ta que un valor XI satisfaga If(x) I ::;;El' I X¡+I- X¡ 1< E o ambos. Si lo anterior no se cum- pliera en un máximo de iteraciones (MAXIT), debe reiniciarse con un nuevo valor xo' La ecuación central del algoritmo se obtiene así Xl = X o - L1x La pendiente de la tangente a la curva en el punto (xo,J (xo)) es: así que y sustituyendo en general f(x) x. I =x.---=g (x) 1+ 1 f' (x) 1 (2.12) Este método es de orden 2, porque g' (x) = O Yg" (x) i= O (véase Probo 2.11). Encuentre una raíz real de la ecuación f(x) =x3 + 2x2 + lOx- 20 mediante ~l método de Newton-Raphson, X o = 1, con E = 10-3 aplicado a I x¡+1- Xi I Solución Se sustituyenf(x) yf' (x) en (2.12) 1/ X? + 2 x? + 10 Xi - 20 3x? + 4x¡ + 10 Primera iteración X = 1 _ ( 1 )3 + 2( 1 )2 + 1O( 1 ) - 20 = 1.41176 I 3( 1 )2 + 4( 1 ) + 10 Como XI i= xo' se calcula x2 Segunda iteración X = 1.41176 ~",-(1.41176)3+ 2(1.41176)2 + 10(1.41176) - 20)= 1.36934 2 3 (1.41176)2 + 4(1.41176) + 10 Solución de ecuaciones no lineales 45 Vamos a suponer un valor inicial X oque se sitúa en el eje horizontal. Trácese una tan- gente a la curva en el punto (xo' J (xo») y a partir de ese punto sígase por la tangente hasta su intersección con el eje x; el punto de corte xI es una nueva aproximación a x (hay que observar que se ha reemplazado la curvaf(x) por su tangente en (xo,f(xo))' El proceso se repite comenzando con XI' se obtiene una nueva aproximación x2 y así sucesivamente, has- ta que un valor X I satisfaga If (x) I::;; El ' Ix¡+ I - x¡ I< E o ambos. Si lo anterior no se cum- pliera en un máximo de iteraciones (MAXIT), debe reiniciarse con un nuevo valor xo' La ecuación central del algoritmo se obtiene así XI =Xo- Llx La pendiente de la tangente a la curva en el punto (xo,f (xo)) es: así que y sustituyendo en general (2.12) f(x) x· I = x.---= g (x) 1+ 1 f' (x) 1 Este método es de orden 2, porque g' (x) = Oy gil (x) *' O(véase Probo 2.11). Encuentre una raíz real de la ecuación f (x) = x3 + 2x2 + lOx - 20 mediante ~l método de Newton-Raphson, X o = 1, con E = 10-3 aplicado a Ix¡+1 - Xi I Solución Se sustituyenf (x) yf' (x) en (2.12) Primera iteración x? + 2 xl +10 x¡ - 20 3x? + 4x¡ + 10 x = 1 _ ( 1 )3 + 2( 1 )2 + 1O( 1 ) - 20 = 1.41176 I 3( 1 )2 + 4( 1 ) + 10 Como XI *'xo' se calcula x2 Segunda iteración x = 1.41176 _J1.41176)3+ 2(1.41176)2 + 1O(l.41176) - 20) = l.36934 2 3 (l.41176)2 + 4(1.41176) + 10
  • 59. 46 Métodos numéricos aplicados a la ingeniería Con este proceso se obtiene la tabla 2.1 Tabla 2.1 Resultados del ejemplo 2.3. i Xi IXi+1-xil 1 g' (Xi) 1 O 1.00000 0.24221 1.41176 0.41176 0.02446 2 1~ 0.04243 0.00031 3 l.36881 0.00053 4.6774 X 10-8 4 l.36881 0.00000 9.992 X 10-16 Para llevar a cabo los cálculos que se muestran en la tabla anterior, se puede emplear Matlab o la TI-92 Plus. Fonnat long xO=l ; for I=l : 4 f=xO-3+2i'xO-2+10"xO - 20 ; df=3*xO-2+4*xO+10; x=xO - f/df; dist = abs (x - xO) ; dg=abs (1 - ((3*x-2+4*x+10) -2 - (x-3+2i'x-2+10*x-20) * (6*x+4))/ (3*x-2+4*x+ 10) -2); disp ([x, dist, dg]) xO=x; end e2_4 () Prgm Define f (x)=x-3+Zl'x-2+10*x -20 Define df (x) = 3*x-2+4*x+10 Define dg (x) = 1 - (df(x) -2-f (x) * (6*x+4) ) / df (x)-2 ClrIO: 1.-+xO For i, 1, 4 xO-f (xO) / df (xO)-+x abs (x -xO)-+dist Disp string (x) &" "&string (dist) &" "&string (abs (dg (x))) x-+xO EndFor EndPrgm Se requirieron sólo tres iteraciones para satisfacer el criterio de convergencia; además, se obtuvo una mejor aproximación a x que en el ejemplo 2.2, ya que f (1.36881) se encuen- tra más cercana a cero que f (1.36906), como se ve a continuación f(l.36881) = (l.36881)3 + 2(l.36881)2 + 1O(l.36881)-20 = -0.00004 If(1.36881) 1=0.00004 y If(l.36906) I = 0.00531 Hay que observar que x4 ya no cambia con respecto a x3 en cinco cifras decimales y que g' (x4 ) es prácticamente cero. En el CD encontrará el PROGRAMA 2.7 (Raíces de Ecuaciones), escrito para la versión 6 de Visual Basic. Con este programa se pueden resolver diferentes ecuaciones y obtener una visualización gráfica de los métodos de Newton-Raphson, de Bisección y de Posición Falsa; los últimos dos se verán más adelante. Pan PAS PAS PM 2.
  • 60. lear , se en- ue ión ner ión Solución de ecuaciones no lineales 47 ALGORITMO 2.2 Método de Newton-Raphson Para encontrar una raíz real de la ecuación f (x) = O, proporcionar la función F (X) Y su derivada DF (X) Ylos DATOS: Valor inicial XO, criterio de convergencia EPS, criterio de exactitud EPSl y número máximo de ite- raciones MAXIT. RESULTADOS: La raíz aproximada X o un mensaje de falla. PASO l. Hacer 1= 1 PASO 2. Mientras 1 < MAXIT, repetir los pasos 3 a 7. PASO 3. Hacer X = XO - F(XO) / DF (XO) (calcula x.), PASO 4. Si ABS (X - XO) < EPS, entonces IMPRIMIR X Y TERMINAR. De otro modo CONTINUAR. PASO S. Si ABS (F (X» < EPS1, entonces IMPRIMIR X Y TERMINAR. De otro modo CONTINUAR. PASO 6. Hacer 1= 1+ 1. PASO 7. Hacer XO = X. PASO 8. IMPRIMIR mensaje de falla "EL MÉTODO NO CONVERGE A UNA RAÍZ" Y TERMINAR. FALLAS DEL MÉTODO DE NEWTON-RAPHSON Cuando el método de Newton-Raphson converge se obtienen los resultados en relativa- mente pocas iteraciones, ya que para raíces no repetidas este método converge con orden 2 y el error E ;+1 es proporcional al cuadrado del error anterior' E r Para precisar más, su- póngase que el error en una iteración es l O:" , el error siguiente -que es proporcional al cuadrado del error anterior- es entonces aproximadamente 1O-2n, el que sigue será apro- ximadamente lO-4n, etc. De esto puede afirmarse que cada iteración duplica aproximada- . mente el número de dígitos correctos. Sin embargo, algunas veces el método de Newton-Raphson no converge sino que os- cila. Esto puede ocurrir si no hay raíz real como se ve en la figura 2.Sa; si la raíz es un pun- to de inflexión como en la figura 2.Sb, o si el valor inicial está muy alejado de la raíz buscada y alguna otra parte de la función "atrapa" la iteración, como en la figura 2.Sc. El método de Newton-Raphson requiere la evaluación de la primera derivada de!(x). En la mayoría de los problemas de los textos este requisito es trivial, pero éste no es el ca- so en problemas reales donde, por ejemplo, la función! (x) está dada en forma tabular. Es importante discutir algunos métodos para resolver! (x) = Oque no requieran el cálcu- lo de! I (x), pero que retengan algunas de las propiedades favorables de convergencia del método de Newton-Raphson. A continuación se estudian algunos métodos que tienen es- tas características y que se conocen como métodos de dos puntos. 2.3 Método de la secante El método de la secante consiste en aproximar la derivada! I (x) de la ecuación 2.12 por el cociente" * Véase Probo 2.13. *. Nótese que este cociente es la derivada numérica de f (x). Solución de ecuacion es no lineales 47 ALGORITMO 2.2 Método de Newton-Raphson Para encontrar una raíz real de la ecuación! (x) = O, proporcionar la función F (X) Ysu derivada DF (X) Ylos DATOS: Valor inicial XO, criterio de convergencia EPS, criterio de exactitud EPSl y número máximo de ite- raciones MAXIT. RESULTADOS: La raíz aproximada X o un mensaje de falla. PASO l . Hacer 1 = 1 PASO 2. Mientras 1 < MAXIT, repetir los pasos 3 a 7. PASO 3. Hacer X = XO - F(XO) / DF (XO) (calcula x¡). PASO 4. Si ABS (X - XO) < EPS, entonces IMPRIMIR X YTERMINAR. De otro modo CONTINUAR. PASO s. Si ABS (F (X» < EPS1, entonces IMPRIMIR X YTERMINAR. De otro modo CONTINUAR. PASO 6. Hacer 1= 1 +1. PASO 7. Hacer XO = X. PASO 8. IMPRIMIR mensaje de falla "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR. FALLAS DEL MÉTODO DE NEWTON-RAPHSON Cuando el método de Newton-Raphson converge se obtienen los resultados en relativa- mente pocas iteraciones, ya que para raíces no repetidas este método converge con orden 2 y el error E i+l es proporcional al cuadrado del error anterior' E i. Para precisar más, su- póngase que el error en una iteración es 1O-1l , el error siguiente -que es proporcional al cuadrado del error anterior- es entonces aproximadamente 10-2/1 , el que sigue será apro- ximadamente lO-4n, etc. De esto puede afirmarse que cada iteración duplica aproximada- .. mente el número de dígitos correctos. Sin embargo, algunas veces el método de Newton-Raphson no converge sino que os- cila. Esto puede ocurrir si no hay raíz real como se ve en la figura 2.Sa; si la raíz es un pun- to de inflexión como en la figura 2.Sb, o si el valor inicial está muy alejado de la raíz buscada y alguna otra parte de la función "atrapa" la iteración, como en la figura 2.Sc. El método de Newton-Raphson requiere la evaluación de la primera derivada def(x). En la mayoría de los problemas de los textos este requisito es trivial, pero éste no es el ca- so en problemas reales donde, por ejemplo, la funciónf(x) está dada en forma tabular. Es importante discutir algunos métodos para resolverf(x) =Oque no requieran el cálcu- lo def I (x) , pero que retengan algunas de las propiedades favorables de convergencia del método de Newton-Raphson. A continuación se estudian algunos métodos que tienen es- tas características y que se conocen como métodos de dos puntos. 2.3 Método de la secante El método de la secante consiste en aproximar la derivadaf I (x) de la ecuación 2.12 por el cociente** *VéaseProb.2.13. *. Nótese que este cociente es la derivada numérica de/ex). - - - - - - - - - - - - - - - - - - -
  • 61. 48 Métodos numéric os aplicados a la ingeniería Figura 2.5. Funciones donde puede fallar el método de Newton-Raphson. y f(x) a) Raíces complejas y f(x) »> x b) rcx) = O y f(x) c) Valor inicial muy lejos de la raíz formado con los resultados de las dos iteraciones anteriores x¡_, y xi. De esto resulta la fórmula (x-x,)f(x) 1 1- 1 = g (x) f(x) - f(x¡_l) (2.13) Para la primera aplicación de la ecuación 2.13 e iniciar el proceso iterativo, se requerirán dos valores iniciales: X o y x,: La siguiente aproximación, x2 ' está dada por: • Que pueden obtenerse por el método de punto fijo. 48 Métodos numéricos aplicados a la ingeniería f (x) y y Figura 2.5. Funciones donde puede fallar el método de Newton-Raphson. f(x) ---- x a) Raíces complejas b) rCx) =O f(x ) y c) Valor inicial muy lejos de la raíz formado con los resultados de las dos iteraciones anteriores X¡_ I Yxi. De esto resulta la fórmula (x - X _ I ) f (x) 1 1 1 = g (x) f(x) - f(x¡_,) (2.13) Para la primera aplicación de la ecuación 2.13 e iniciar el proceso iterativo, se requerirán dos valores iniciales: Xoy xI : La siguiente aproximación, x2' está dada por: • Que pueden obtenerse por el método de punto fijo.
  • 62. f(x) esulta la (2.13) querirán Solución de ecuaciones no lineales 49 y así sucesivamente hasta que g (x) "" x¡+1 o una vez que o Use el método de la secante para encontrar una raíz real de la ecuación polinominal .f (x) = x3 + 2x2 + lOx - 20 = O Solución Con la ecuación 2.13 se obtiene X¡+I = Xi - (3 2 2 10 20) (3 2 2 10 20)Xi + Xi + X¡ - - X i-I + X ¡_I + X¡_I- Mediante Xo = OYXI = 1 se calcula x2 x 2 =1- (1-0)(13 +2(1)2+10(1)-20) =1.53846 (13 + 2(1)2 + 10 (1) - 20) - (03 + 2 (0)2 + 10(0) - 20) Los valores de las iteraciones subsecuentes se encuentran en la tabla 2.2. Si bien no se con- vergió a la raíz tan rápido como en el caso del método de Newton-Raphson, la velocidad de convergencia no es tan lenta como en el método de punto fijo (véase ejemplo 2.2); enton- ces se tiene para este ejemplo una velocidad de convergencia intermedia. Tabla 2.2 Resultados del ejemplo 2.4. X¡ IX¡+I -Xi I O 0.00000 1 1.00000 1.00000 2 1.53846 0.53846 3 1.35031 0.18815 4 1.36792 0.01761 5 1.36881 0.00090 IX¡+ 1 - X¡ I ~ E = 10-3 Para llevar a cabo los cálculos que se muestran en la tabla anterior, puede emplearse el si- guiente guión de Matlab.
  • 63. 50 Métodos numéricos aplicados a la ingeniería format long xO=O ; xl=l; for i=l : 4 fO = xO-3+2"xO-2+l(Ji'xO-20; fl = xl-3+2"xl-2+10*xl - 20; x2 = xl - (xl - xO) *fl / (fl - fO) ; dist=abs (x2-xl); disp ([x2, dist)) xO=xl ; xl =x2 ; end In ALGORITMO 2.3 Método de la secante gel rr Para encontrar una raíz real de la ecuaciónf(x) = O, dadaf(x) analíticamente, proporcionar la función F (X) Ylos DATOS: Valores iniciales XO, Xl; criterio de convergencia EPS, criterio de exactitud EPSl y número máxi- mo de iteraciones MAXIT. RESULTADOS: La raíz aproximada X o un mensaje de falla. PASO l. Hacer I = l. PASO 2. Mientras I < MAXIT, repetir los pasos 3 a 8. PASO 3. Hacer X=XO - (Xl-XO)*F(XO)/(F(Xl)-F(XO». PASO 4. Si ABS (X - Xl) < EPS entonces IMPRIMIR X YTERMINAR. PASO 5. Si ABS (F (X» < EPSI entonces IMPRIMIR X YTERMINAR. PASO 6. Hacer XO = Xl. PASO 7. Hacer Xl = X. PASO 8. Hacer I = I + 1. PASO 9. IMPRIMIR mensaje de falla "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR. INTERPRETACiÓN GEOMÉTRICA DEL MÉTODO DE LA SECANTE Los dos miembros de la ecuación x = g (x) se grafican por separado, como se ve en la fi- gura 2.6. Se eligen dos puntos del eje x: X o y XI como primeras aproximaciones a x . Se evalúa g (x) en X o y en XI' Yse obtienen los puntos A y B de coordenadas (xo' g (xo)) y (xl' g (XI))' respectivamente. Los puntos A y B se unen con una línea recta [secante a la curva y = g (x)] y se sigue por la secante hasta su intersección con la recta y = x. La abscisa correspondiente al pun- to de intersección es x2' la nueva aproximación a x . Para obtener x 3 se repite el proceso comenzando con XI y x2 en lugar de Xo y Xl' Este método no garantiza la convergencia a una raíz, lo cual puede lograrse con cier- tas modificaciones que dan lugar a los métodos de posición falsa y de bisección. F I pos 50 iiI Métodos n u méricos aplicados a la ingeniería format long xO=O ; xl=l; for i=l : 4 fO = xO-3+2"xO-2+1CJ!'xO-20; fl = xl-3+2"xl-2+1Gt.xl - 20; x2 = xl - (xl - xO) *fl / (fl - fO) ; dist=abs (x2-xl); disp ([x2, dist)) xO=xl ; xl=x2 ; end ALGORITM O 2.3 Método de la secante Para encontrar una raíz real de la ecuación! (x) = 0, dada! (x) analíticamente, proporcionar la función F (X) Ylos DATOS: Valores iniciales XO, Xl ; criterio de convergencia EPS, criterio de exactitud EPSl y número máxi- mo de iteraciones MAXIT. RESULTADOS: La raíz aproximada X o un mensaje de falla. PASO l. Hacer I = l. PASO 2. Mientras I < MAXIT, repetir los pasos 3 a 8. PASO 3. Hacer X=XO - (Xl-XO)*F(XO)/(F(Xl)-F(XO». PASO 4. Si ABS (X - Xl) < EPS entonces IMPRIMIR X YTERMINAR. PASO 5. Si ABS (F (X» < EPSI entonces IMPRIMIR X YTERMINAR. PASO 6. Hacer XO = Xl. PASO 7. Hacer Xl = X. PASO 8. Hacer I = I + l. PASO 9. IMPRIMIR mensaje de falla "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR. INTERPRETACiÓN GEOMÉTRICA DEL MÉTODO DE LA SECANTE Los dos miembros de la ecuación x =g (x) se grafican por separado, como se ve en la fi- gura 2.6. Se eligen dos puntos del eje x: X oy XI como primeras aproximaciones a x . Se evalúa g (x) en Xoy en XI' Yse obtienen los puntos A y B de coordenadas (xo' g (xo)) y (xl' g (XI))' respectivamente. Los puntos A y B se unen con una línea recta [secante a la curva y = g (x)] y se sigue por la secante hasta su intersección con la recta y = x. La abscisa correspondiente al pun- to de intersección es x2' la nueva aproximación a x . Para obtener x3 se repite el proceso comenzando con XI y x2 en lugar de Xo y XI ' Este método no garantiza la convergencia a una raíz, lo cual puede lograrse con cier- tas modificaciones que dan lugar a los métodos de posición falsa y de bisección.
  • 64. los ero rnáxi- en la fi- se sigue al pun- Xl' on cier- Figura 2.6 Interpretación geométrica del método de la secante. Solución de ecuaciones no lineales 51 y y = g(x) x 2.4 Método de posición falsa y Figura 2.7 Método de posición falsa. A El método de posición falsa, también llamado de Regula-Palsi, al igual que el algoritmo de la secante, aproxima la derivada f' (x) de la ecuación 2.12 por el cociente f (x) - f (x¡_l ) pero en este caso los valores de x¡ y X¡_l se encuentran en lados opuestos de la raíz buscada, de modo tal que sus valores funcionales correspondientes tienen signos opuestos, esto es: Se denotan Xi y x¡+l como xD y xi' respectivamente. Para ilustrar el método se utilizará la figura 2.7 y se partirá del hecho que se tienen dos valores iniciales xD y x] definidos arriba, y de que la función es continua en (x], xD ). y x x Figura 2.6 Interpretación geométrica del método de la secante. y Solución de ecuaciones no lineales 51 y = g(x) x 2.4 Método de posición falsa y Figura 2.7 Método de posición falsa. A El método de posición falsa, también llamado de Regula-Falsi, al igual que el algoritmo de la secante, aproxima la derivada!, (x) de la ecuación 2.12 por el cociente f(x) - f(Xi _ 1) pero en este caso los valores de Xi y X i_ 1 se encuentran en lados opuestos de la raíz buscada, de modo tal que sus valores funcionales correspondientes tienen signos opuestos, esto es: Se denotan Xi y xi+1 como xD y Xl' respectivamente. Para ilustrar el método se utilizará la figura 2.7 y se partirá del hecho que se tienen dos valores iniciales xD y xl definidos arriba, y de que la función es continua en (x/, xD). y x x
  • 65. 52 Métodos numéricos aplicados a la ingeniería Se traza una línea recta que une los puntos A y B de coordenadas (XI,f(XI)) y (xD, f(xD)), respectivamente. Se reemplazaf(x) en el intervalo (Xl' XD) con el segmento de recta AB yel punto de intersección de este segmento con el eje X, X w será la siguiente aproximación a x . Se evalúaf (xM) y se compara su signo con el de f (xD). Si son iguales, se actualiza xD sustituyendo su valor con el de xM ; si los signos son diferentes, se actualiza x, sustituyen- do su valor con el de xM. Nótese que el objetivo es mantener los valores descritos (xD y Xl) cada vez más cercanos entre sí y la raíz entre ellos. Se traza una nueva línea secante entre los puntos actuales A y B, Y se repite el proce- so hasta que se satisfaga el criterio de exactitud If(XM) I < El tomándose como aproxima- ción a X el valor último de xM. Para terminar el proceso también puede usarse el criterio I xD - Xl I < E. En este caso se toma como aproximación a:i la media entre xD y xl" Para calcular el valor de xM se sustituye xD por Xi y Xl por xi _ l en la ecuación 2.13, con lo que se llega a (XD - Xl) f (XD) f (XD) - f (Xl) xrf (xD) - xDf (X,) f (xD) - f (Xl) (2.14) el algoritmo de posición falsa. Ejemplo 2.6 Utilice el método de posición falsa para obtener una raíz real del polinomio f(x) = x3 + 2x2 + lOx - 20 Solución Para obtener x, y xD se puede, por ejemplo, evaluar la función en algunos puntos donde' este cálculo sea fácil o bien se grafica. Así: feO) = -20 f(l) =-7 f(-l) = -29 f(2) = 16 De acuerdo con el teorema de Bolzano hay una raíz real, por lo menos, en el intervalo (1, 2); por tanto, Xl = 1;f(x) =-7 xD = 2 ;f(xD) = 16 Al aplicar la ecuación 2.14 se obtiene xM X M = 2 _ (2 -1) (16) = 1.30435 16 - (-7) y f (xM ) = (1.30435)3 + 2(1.30435)2 + 10(1.30435) - 20 = -1.33476 Como f (xM ) < O(igual signo que f (x), se reemplaza el valor de Xl con el de Xw con lo cual queda el nuevo intervalo como (1.30435, 2). Por tanto: -Xl = 1.30435 ;f(xl) = -1.33476 xD = 2;f(xD ) = 16 52 Métodos n u méricos aplicados a la ingeniería Se traza una línea recta que une los puntosA y B de coordenadas (xl,f(x¡) Y(xD, f(xD», respectivamente. Se reemplazaf(x) en el intervalo (xI' xD) con el segmento de recta AB yel punto de intersección de este segmento con el eje x, xM' será la siguiente aproximación a x . Se evalúaf(xM) y se compara su signo con el def (xD). Si son iguales, se actualiza xD sustituyendo su valor con el de xM ; si los signos son diferentes, se actualiza XI sustituyen- do su valor con el de xM . Nótese que el objetivo es mantener los valores descritos (xD y XI) cada vez más cercanos entre sí y la raíz entre ellos. Se traza una nueva línea secante entre los puntos actuales A y B, Yse repite el proce- so hasta que se satisfaga el criterio de exactitud If(xM) I< cl tomándose como aproxima- ción a X el valor último de xM. Para terminar el proceso también puede usarse el criterio IxD - XI I< c. En este caso se toma como aproximación a x la media entre xD y xI" Para calcular el valor de xM se sustituye xD por Xi y XI por xi_1 en la ecuación 2.13, con lo que se llega a el algoritmo de posición falsa. (XD - XI) f (xD) f(xD) - f(xl) X¡j (xD) - xDf (xI) f (xD ) - f (XI) Ejemplo 2.6 Utilice el método de posición falsa para obtener una raíz real del polinomio f(x) =x3 + 2x2 + lOx - 20 (2.14) Solución Para obtener XI y xD se puede, por ejemplo, evaluar la función en algunos puntos donde ' este cálculo sea fácil o bien se grafica. Así: feO) = - 20 f(l) =-7 f(-l) = - 29 f(2) = 16 De acuerdo con el teorema de Bolzano hay una raíz real, por lo menos, en el intervalo (1, 2); por tanto, XI = 1 ;f(x¡) = -7 xD =2 ;f(xD) =16 Al aplicar la ecuación 2.14 se obtiene xM y X M =2 _ (2 - 1) (16) = 1.30435 16 - (-7) f (xM ) = (1.30435)3 + 2(1.30435)2 + 10(1.30435) - 20 =-1.33476 Comof(xM) < O(igual signo quef(x¡), se reemplaza el valor de XI con el de xM' con lo cual queda el nuevo intervalo como (1.30435, 2). Por tanto: -XI = 1.30435 ;f(xl) =-1.33476 xD =2;f (xD) = 16
  • 66. (X D )), B yel nax. izaxD tuyen- D y XI) proce- xima- riterio 3,con (2.14) nde alo (1, o cual Solución de ecuaciones no lineales 53 Se calcula una nueva xM (2 - 1.30435) 16 xM = 2 = 1.35791 , 16 - (-1.33476) f(xM ) = (1.35791)3 + 2(1.35791)2 + 10(1.35791) - 20 = -0.22914 Como f (xM ) < O, el valor actual de XI se reemplaza con el último valor de xM; así el inter- valo queda reducido a (1.35791, 2). La tabla 2.3 muestra los cálculos llevados a cabo has- ta satisfacer el criterio de exactitud If(XM) I < 10-3 Tabla 2.3 Resultados del ejemplo 2.5. Xl XD XM If(XM} I O 1.00000 2.00000 1 1.00000 2.00000 1.30435 1.33476 2 1.30435 2.00000 1.35791 0.22914 3 1.35791 2.00000 1.36698 0.03859 4 1.36698 2.00000 1.36850 0.00648 5 1.36850 2.00000 1.36876 0.00109 6 1.36876 2.00000 1.36880 0.00018 Para llevar a cabo los cálculos que se muestran en la tabla anterior puede emplearse Ma- tlab o la TI-92 Plus. e2_6 ( ) Prgm Define f (x)= x"3+2*x"2+10*x-20 ClrIO: 1.-+xi: 2.-+xd: O.OOl-+Eps Disp " xi xd xm I f(xm) 1" Loop xd-f (xd) * (xd-xi) / (f (xd) -f (xi))-+ xm format (xi, "f5") &" "&format (xd, "f5")-+a a&" "&forrnat (xm, "f5") &" "-+ a a&format (abs (f (xm), "f6")-+a disp a If abs (f (xm)) < Eps Exit ,.;tf F(xd) *F(xm) > O Then xnr-->xi : El se : xrrr+ xd EndIf EndLoop EndPrgm . format long xi=l; xd= 2; Eps= 0.001 ; fi=xi "3+2*xi "2+10*xi-20; Ed=xd"3+2*xd"2+ 10*xd-20; fm=l; while abs (im) > Eps xm=xd-fd* (xd-xi) / (fd-fi); fm=xm "3+2*xm"2+1 0*xm-20; disp ( [xi, xd, xm, abs (fm) ] ) if fd*fm > O xd=xm; fd=fm; else xi=xm; fi=fm; end
  • 67. 54 Métodos numéricos aplicados~ª la ingeniería NOTA El GC proporciona los métodos de punto fijo, Newton-Raphson, posición falsa y bisección, de modo tal que pueden verse las iteraciones gráfica y numéricamente al resolver una ecuación dada. También hay calculadoras que disponen de algunos de estos métodos con los cuales auxiliarse. ALGORITMO 2.4 Método de posición falsa Para encontrar una raíz real de la ecuaciónf(x) = 0, dadaf(x) analíticamente, proporcionar la función F (X) Ylos DATOS: RESULTADOS: Valores iniciales XI y XD que forman un intervalo, en donde se halla una raíz x (F (XI) * F (XD) < O), criterio de convergencia EPS, criterio de exactitud EPSl y número máximo de ite- raciones MAXIT. La raíz aproximada X o un mensaje de falla. PASO 1. Hacer 1 = 1; FI = F (XI); FD = F (XD). PASO 2. Mientras 1 < MAXIT, repetir los pasos 3 a 8. PASO 3. Hacer XM = (XI*FD - XD*FI) / (FD - FI); FM = F (XM). PASO 4. Si ABS (FM) < EPSl, entonces IMPRIMIR XM y TERMINAR. PASO 5. Si ABS (XD-XI) < EPS, entonces hacer XM = (XD + XI) / 2; IMPRIMIR "LA RAÍZ BUSCADA ES", IMPRIMIR XM y TERMINAR. PASO 6. Si FD * FM > 0, hacer XD = XM (actualiza XD) y FD = FM (actualiza FD). PASO 7. Si FD * FM <0, pacer XI = XM (actualiza XI) y FI = FM (actualiza FI). PASO 8. Hacer 1 = 1 + 1. PASO 9. IMPRIMIR mensaje de falla "EL MÉTODO NO CONVERGE A UNA RAÍz" y TERMINAR. 2.5 Método de la bisección El método de la bisección es muy similar al de posición falsa, aunque algo más simple. Co- mo en el método de posición falsa también se requieren dos valores iniciales para ambos la- dos de la raíz, y que sus valores funcionales correspondientes sean de signos opuestos. En este caso, el valor de xM se obtiene como el punto medio entre XI y xD. xM = (XI + xD) / 2 Dependiendo de la función que se tenga en particular, el método de la bisección puede con- verger ligeramente más rápido o más lentamente que el método de posición falsa. Su gran ventaja sobre el método de posición falsa es que proporciona el tamaño exacto del interva- lo en cada iteración (en ausencia de errores de redondeo). Para aclarar esto, nótese que en este método después de cada iteración el tamaño del intervalo se reduce a la mitad; después de n interaciones, el intervalo original se habrá reducido 2" veces. Por lo anterior, si el in- tervalo original es de tamaño a y el criterio de convergencia aplicado al valor absoluto de la diferencia de dos xM consecutivas es E, entonces se requerirán n iteraciones, donde n se calcula con la igualdad de la expresión a -:s: E, 2/1 54 Métodos numéricos aplicados_ª- la ingeniería NOTA El GC proporciona los métodos de punto fijo, Newton-Raphson, posición falsa y bisección, de modo tal que pueden verse las iteraciones gráfica y numéricamente al resolver una ecuación dada. También hay calculadoras que disponen de algunos de estos métodos con los cuales auxiliarse. ALGORITMO 2.4 Método de posición falsa Para encontrar una raíz real de la ecuación f (x) = 0, dadaf(x) af1alíticamente, proporcionar la función F (X) Ylos DATOS: RESULTADOS: Valores iniciales XI y XD que forman un intervalo, en donde se halla una raíz x (F (XI) * F (XD) < O), criterio de convergencia EPS, criterio de exactitud EPSl y número máximo de ite- raciones MAXIT. La raíz aproximada X o un mensaje de falla. PASO 1. Hacer I =1; PI =F (XI); FD =F (XD). PASO 2. Mientras I < MAXIT, repetir los pasos 3 a 8. PASO 3. Hacer XM = (XI*FD - XD*FI) / (FD - FI); FM = F (XM). PASO 4. Si ABS (FM) < EPSl, entonces IMPRIMIR XM y TERMINAR. PASO 5. Si ABS (XD-XI) < EPS, entonces hacer XM = (XD + XI) / 2; IMPRIMIR "LA RAÍZ BUSCADA ES", IMPRIMIR XM y TERMINAR. PASO 6. Si FD * FM > 0, hacer XD = XM (actualiza XD) y FD = FM (actualiza FD). PASO 7. Si PO * FM <0, pacer XI =XM (actualiza XI) y PI =FM (actualiza FI). PASO 8. Hacer 1 = I + 1. PASO 9. IMPRIMIR mensaje de falla "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR. 2.5 Método de la bisección El método de la bisección es muy similar al de posición falsa, aunque algo más simple. Co- mo en el método de posición falsa también se requieren dos valores iniciales para ambos la- dos de la raíz, y que sus valores funcionales correspondientes sean de signos opuestos. En este caso, el valor de xM se obtiene como el punto medio entre XI y xD. xM = (XI + xD) / 2 Dependiendo de la función que se tenga en particular, el método de la bisección puede con- verger ligeramente más rápido o más lentamente que el método de posición falsa. Su gran ventaja sobre el método de posición falsa es que proporciona el tamaño exacto del interva- lo en cada iteración (en ausencia de errores de redondeo). Para aclarar esto, nótese que en este método después de cada iteración el tamaño del intervalo se reduce a la mitad; después de n interaciones, el intervalo original se habrá reducido 211 veces. Por lo anterior, si el in- tervalo original es de tamaño a y el criterio de convergencia aplicado al valor absoluto de la diferencia de dos xM consecutivas es E, entonces se requerirán n iteraciones, donde n se calcula con la igualdad de la expresión a -:s: E, 2"
  • 68. bisección, una os con los (XI) * F o de ite- SCADA pIe. Co- bas la- stos. ede con- Su gran interva- que en después si el in- oluto de de n se Solución de ecuaciones no lineales 55 de donde: In a -In E n=---- In 2 (2.15) Por esto se dice que se puede saber de antemano cuántas iteraciones se requieren. Ejemplo 2.7 Utilice el método de la bisección para obtener una raíz real del polinomio I(x) = x3 + 2x2 + lOx - 20 Solución Con los valores iniciales obtenidos en el ejemplo 2.6 Xl = 1 ;f(xl) = -7, xD = 2 ;f(x~) = 16, Si E = 10-3, el número de iteraciones n será n= lna-lnE In 2 In (2 - 1) -In 10-3 = 9.96 In 2 . o bien n"" 10 Primera iteración 1+2 xM =--= 1.5 2 f(1.5) = 2.88 Como I(xM) > O (distinto signo de I(Xl»' se remplaza el valor de Xl con el de xM' con lo cual queda un nuevo intervalo (1, 1.5). Entonces: XD = l;l(xD) =-7 xD = l.5 ;f (xD ) = 2.88 Segunda iteración 1 + 1.5 = 1.25 2 y I(xM ) = -2.42 Como ahora I(xM ) < O (igual signo que I(x), se reemplaza el valor de xD con el valor de la nueva xM ; de esta manera queda como intervalo (1.25, 1.5). La tabla 2.4 muestra los cálculos, llevados a cabo trece veces, a fin de hacer ciertas observaciones. El criterio 1xi +! - Xi' 1~ 10-3 se satisface en diez iteraciones. Nótese que si E se hubiese aplicado sobre 1I (xM) 1,se habrían requerido 13 iteracio- nes en lugar de 10. En general, se necesitarán más iteraciones para satisfacer un valor de E sobre 1I(xM) 1que cuando se aplica a 1x¡+1 - x¡ 1. Solución d e ecuaciones no lineales 55 de donde: In a -In E n=---- In 2 Por esto se dice que se puede saber de antemano cuántas iteraciones se requieren. Ejemplo 2.7 Utilice el método de la bisección para obtener una raíz real del polinomio I (x) = x3 + 2x2 + lOx - 20 Solución Con los valores iniciales obtenidos en el ejemplo 2.6 Xl = 1 ;f(xl) =-7, xD = 2 ;f(x~) = 16, Si E = 10-3, el número de iteraciones n será n= o bien Primera iteración lna-lnE In 2 In (2 - 1) -In 10-3 = 9.96 In 2 . n"" 10 1+2 xM =-- = l.5 2 I(1.5) = 2.88 (2.15) Como I (xM ) > O(distinto signo de I (Xl»' se remplaza el valor de Xl con el de xM' con lo cual queda un nuevo intervalo (1, l.5). Entonces: Segunda iteración y XD = l;f(xD) = -7 xD = 1.5 ;1(xD) = 2.88 1 + 1.5 = l.25 2 I (xM) =-2.42 Como ahoraI (xM) < O(igual signo queI (x¡), se reemplaza el valor de xD con el valor de la nueva xM ; de esta manera queda como intervalo (l.25, l.5). La tabla 2.4 muestra los cálculos, llevados a cabo trece veces, a fin de hacer ciertas observaciones. El criterio 1xi+! - Xi' 1~ 10-3 se satisface en diez iteraciones. Nótese que si E se hubiese aplicado sobre 1I (XM) 1, se habrían requerido 13 iteracio- nes en lugar de 10. En general, se necesitarán más iteraciones para satisfacer un valor de E sobre 1I (XM) 1 que cuando se aplica a 1 X¡+ ! - X¡ 1.
  • 69. 56 Métodos numéricos aplicados a la ingeniería Tabla 2.4 Resultados del ejemplo 2.7 i Xl XD XM IXMi -XMi+11 If(XM) I O 1.00000 2.00000 1 1.00000 2.00000 1.50000 v 2.87500 2 1.00000 1.50000 1.25000 0.25000 2.42188 3 1.25000 1.50000 1.37500 0.12500 0.13086 4 1.25000 1.37500 1.31250 0.06250 1.16870 5 1.31250 1.37500 1.34375 0.03125 0.52481 6 1.34375 1.37500 1.35938 0.01563 0.19846 7 1.35938 1.37500 1.36719 0.00781 0.03417 8 1.36719 1.37500 1.37109 0.00391 0.04825 9 1.36719 1.37109 1.36914 0.00195 0.00702 10 1.36719 1.36914 1.36816 0.00098 0.01358 R 11 1.36816 1.36914 1.36865 0.00049 0.00329 12 1.36865 1.36914 1.36890 0.00025 0.00186 13 1.36865 1.36890 1.36877 0.00013 0.00071 Utilizando el guión de Matlab del ejemplo 2.6, con la modificación apropiada, puede ob- tenerse la tabla anterior. 2.6 Problemas de los métodos de dos puntos y orden de convergencia A continuación se mencionan algunos problemas que se presentan en la aplicación de los métodos de dos puntos. 1. El hecho de requerir dos valores iniciales. Esto resulta imposible de satisfacer (en bisección y posición falsa) si se tienen raíces repetidas por parejas (Xl y x2), Q muy difícil si la raíz buscada se encuentra muy cerca de otra (x3 y x4) (véase Fig. 2.8). En el último caso, uno de los valores iniciales debe estar entre las dos raíces o de otra manera no se detectará ninguna de ellas. * 2. Debido a los errores de redondeo f (xM ) se calcula con un ligero error. Esto no es un problema sino hasta que xM está muy cerca de la raíz x, y f (xM ) resulta ser po- sitiva cuando debería ser negativa o viceversa, o bien resulta ser cero. 3. En el método de la secante no hay necesidad- de tener valores iniciales para ambos lados de la raíz que se busca. Esto constituye una ventaja, pero puede ser peligro- so, ya que en la ecuación 2.13 .• Para estos casos un graficador con capacidad de acercamiento (zoom) y rastreo (trace) puede ser de ayuda . . ,
  • 70. edeob- ión de los sfacer(en 2)' o muy Fig.2.8). íces o de a ambos r peligro- Solución de ecuaciones nQ lineales 57 la diferencia y x Figura 2.8 Raíces repetidas por parejas y muy cercanas entre sí. puede causar problemas al evaluar xi_l' pues f (x) y f (Xi_l) no tienen necesariamente sig- nos opuestos y su diferencia al ser muy cercana a cero producir overflow. Por último, de- be decirse que en el método de la secante no hay certeza de convergencia. ORDEN DE CONVERGENCIA Se determinará el orden de convergencia del método de la secante solamente, ya que para los demás métodos de dos puntos vistos, se siguen las mismas ideas. Si, como antes, E i representa el error en la i-ésima iteración E i-I = Xi_1 - X E i = Xi-X Ei+1=Xi+1-X Al sustituir en la ecuación 2.13 xi+l' Xi' xi_1despejadas de las ecuaciones de arriba, se tiene: x + E ¡+1 = X + E i - (x + E i - X - E i-I) f (E i + X ) f(E¡+x)-f(E¡_1 +x) o bien (E¡ - Ei_l)f(E¡ + x) E. 1 = E . - ----=---'--=----'--- ,+ 'f(E¡+x)-f(Ei_l +x) Si se expande en serie de Taylor af (E i + X ) y f (E ¡-l + x) alrededor de x se tiene: E 2 f (E i + X ) =f (x ) + E J' (x ) + -' f" (x ) + ... 2! (2.17) Figura 2.8 Raíces repetidas por parejas y muy cercanas entre sí. Solución de ecuaciones nQ lineales 57 la diferencia y x puede causar problemas al evaluar Xi_' puesf (X) Yf (Xi_1) no tienen necesariamente sig- nos opuestos y su diferencia al ser muy cercana a cero producir overflow. Por último, de- be decirse que en el método de la secante no hay certeza de convergencia. ORDEN DE CONVERGENCIA Se determinará el orden de convergencia del método de la secante solamente, ya que para los demás métodos de dos puntos vistos, se siguen las mismas ideas. Si, como antes, Ei representa el error en la i-ésima iteración E i-l =Xi_1 - X E; =xi-x Ei+1=Xi+1-X Al sustituir en la ecuación 2.13 x¡+, Xi' x¡_l despejadas de las ecuaciones de arriba, se tiene: x + Ei+1= X + Ei - o bien (x + Ei -x - Ei_1)f(E i + X) f(E¡+X)-f(E¡_1+ X) Si se expande en serie de Taylor afeE ¡ + x) Yf(E ;-1 + x ) alrededor de x se tiene: E 2 f (E ¡ + X ) =f (x ) + EJ f (x ) + -'f ff (x ) + ... 2! (2.17)
  • 71. 58 Métodos numéricos aplicado s a la ingeniería E 2 f(E¡_I+x)=f(x)+E¡_¡/'(X)+ 2¡~1 f"(x)+ ... Sustituyendo estas expansiones en la ecuación 2.17 y como f (x) = O, queda: (E¡ - E¡_I) (EJ' (x) + E2J" (x )/2! + ... ) E ;+1 = E ¡- --"'----''--'----'-------'--------- (E¡-Ei_I)f' (x)+ ~! (E2¡-E2¡_I)f" (x)+ ... -.... Factorizando a (E ¡- E ¡_I) en el denominador y cancelándolo con el mismo factor del nu- merador queda: (EJ' (x) + E2J" (x )/2! + ... ) E i+1 = E i - --'-------''--------- f' (x) + ~! (Ei + Ei_l)f" (x) + ... (EJ' (x) + E2J" (x )/2! + ... ) 1 f" (x) =E- (l+-(Eo+Eo1) + .. .tl , f' (x ) 2! ' ¡- f' (x ) 2.] Por el teorema binomial: 1 , _ E2if" _ 1 f" (x) Ei+I=E¡- f'(x-) (EJ (x)+- (x)+ ... )(l--(Ei+E¡) + ... ) 2! 2! - f' (x) 1 1 E o =E¡---(EJ' (X)+-E2J" (x)+ ... --' (E.+E¡ I)f" (x)+ ... ) f' (x) 2! 2! ' - 1 1 = E o- -- (E f' (x) - - E oE o1f" (x) + ... ) , f' (x)' 2!' ,- 1 f" (x) = 2!E ¡ E ¡-I f' (x) + ... o bien: E i E i-i' f" (x) f' (x) 1 E =:- i+1 2! donde se aprecia que el error en la (i + l)-ésima iteración es proporcional al producto de los errores de las dos iteraciones previas. El error en el método de Newton-Raphson está dado así (véase Probo 2.13) f" (x) E ,·+1=: E2 2!f' (x) " donde por comparación puede observarse que el error en el método de la secante es lige- ramente mayor que en el de Newton-Raphson; por tanto, su orden de convergencia será li- geramente menor, pero con la ventaja de que no hay que derivar la funciónf(x). Por otro lado, en los métodos de primer orden el error en la iteración (i + l)-ésima es proporcional al error de la iteración previa solamente, por lo que puede decirse que los mé- todos de dos puntos son superlineales (orden de convergencia mayor de uno pero menor de dos). 58 Métodos numéricos aplicados a la ingeniería E 2 f( E i_I+X) = f(x)+E¡_¡/'(X)+ 2'~1 f"(x)+ ... Sustituyendo estas expansiones en la ecuación 2.17 y comof (x) = 0, queda: (E¡ - E i_ l) (EJ ' (x) + E2J " (x )/2! + ...) E i+1= E ¡ - ---'-----':.....:...--'-----,-------'--------- (E¡-E¡_¡)f' (x)+ ~! (E 2¡-E 2¡_I)f" (x) + ... .... Factorizando a (E ¡ - E ¡_ I) en el denominador y cancelándolo con el mismo factor del nu- merador queda: (EJ' (x) + E2J" (x )/2! + ...) E i+1 = E i - ---'----:----'''------ - - f' (x) + ~! (E i + Ei_l)f" (x) + ... (EJ' (x) + E2J" (x )/2! + ...) 1 f" (x) =E- (1+-(Eo+Eo 1) j "(x-) + .. .tl , f' (x) 2! ' ,- Por el teorema binomial: 1 , _ E 2if" _ 1 f" (x) Ei+I=E¡- f'(x-) (EJ (x) +- (x) + ... )(I--(E i +E ¡ I) + ... ) 2! 2! - f' (x) 1 1 E o =E ¡ ---(EJ ' (X)+-E 2J" (x)+ ... --' (E.+E¡ ,)f" (x) + ... ) f' (x) 2! 2! ' - o bien: 1 1 = E " - - - (E "f' (x) - - E E o1f" (x) + ... ) f' (x) 2! ' ,- 1 E " ' - i+ 1 2! f" (x) f' (x) donde se aprecia que el error en la (i + 1)-ésima iteración es proporcional al producto de los errores de las dos iteraciones previas. El error en el método de Newton-Raphson está dado así (véase Probo 2.13) f" (x) E ,.+ 1 '" -'----- E 2 2!f' (x) " donde por comparación puede observarse que el error en el método de la secante es lige- ramente mayor que en el de Newton-Raphson; por tanto, su orden de convergencia será li- geramente menor, pero con la ventaja de que no hay que derivar la funciónf(x) . Por otro lado, en los métodos de primer orden el error en la iteración (i + 1)-ésima es proporcional al error de la iteración previa solamente, por lo que puede decirse que los mé- todos de dos puntos son superlineales (orden de convergencia mayor de uno pero menor de dos).
  • 72. .o.) de ge- ti- es Solución de ecuaciones no lineales 59 2.7 Aceleración de convergencia Se han visto métodos cuyo orden de convergencia es uno y dos, o bien un valor interme- dio (superlineales). Existen métodos de orden 3 (véase Probo 2.14) y de orden superior; sin embargo, es importante dar otro giro a la búsqueda de raíces reales y averiguar si la con- vergencia de los métodos vistos se puede acelerar. MÉTODOS DE UN PUNTO / Si en alguno de los métodos vistos se tiene que la sucesión xo' x" x2, ... , converge muy len- tamente a la raíz buscada, pueden tomarse, entre otras, las siguientes decisiones: a) Continuar el proceso hasta satisfacer alguno de los criterios de convergencia prestablecidos. b) Ensayar con una g (x) distinta; es decir, buscar una nueva g (x) en punto fijo o cambiar de método. e) Utilizar la sucesión de valores xo, x" x2, ... para generar otra sucesión: xo', XI" ='....que converja más rápidamente a la raíz x que se busca. Los incisos a) y b) son suficientemente claros, mientras que la succesión xo', XI" x2', ... de la parte e) se basa en que en ciertas condiciones de g , (x)," se tiene que E· I lím _1+_ = g , (x ) j-+oo E i (2.18) donde: E ¡= x¡ - x es el error en la i-ésima iteración. Para valores finitos de i, la ecuación 2.18 puede escribirse como: E· I 1+ , (- ) --""g X E¡ o (2.19) o también: Xi+2 - X "" g , (x) (x¡+1 - x) Restando la ecuación 2.19 de la 2.20 se tiene: (2.20) de donde: X¡+2 -x¡+1 x¡+1 =». g' (x) "" (2.21) Despejando x de la ecuación 2.19 1 - g , (x) * Véase Problema 2.22. Solución de ecuaciones no lineales 59 2.7 Aceleración de convergencia Se han visto métodos cuyo orden de convergencia es uno y dos, o bien un valor interme- dio (superlineales). Existen métodos de orden 3 (véase Probo 2.14) y de orden superior; sin embargo, es importante dar otro giro a la búsqueda de raíces reales y averiguar si la con- vergencia de los métodos vistos se puede acelerar. MÉTODOS DE UN PUNTO / Si en alguno de los métodos vistos se tiene que la sucesión xo' xl' x2, ... , converge muy len- tamente a la raíz buscada, pueden tomarse, entre otras, las siguientes decisiones: a) Continuar el proceso hasta satisfacer alguno de los criterios de convergencia prestablecidos. b) Ensayar con una g (x) distinta; es decir, buscar una nueva g (x) en punto fijo o cambiar de método. e) Utilizar la sucesión de valores xo, xl' x2' ... para generar otra sucesión: xo', XI" x2', ... que converja más rápidamente a la raíz x que se busca. Los incisos a) y b) son suficientemente claros, mientras que la succesión xo', XI" x2', ... de la parte e) se basa en que en ciertas condiciones de g , (x),* se tiene que E· I lím _ 1+_ = g , (x ) i-+oo E j donde: E ¡ = X¡ - x es el error en la i-ésima iteración. Para valores finitos de i, la ecuación 2.18 puede escribirse como: E · I 1+ ' ( - ) - - ""g X E¡ o X¡+l - X"" g , (x) (x¡ - x) o también: X i+2 - X"" g , (x) (x¡+1 - x) Restando la ecuación 2.19 de la 2.20 se tiene: de donde: g' (x) "" Despejando x de la ecuación 2.19 * Véase Problema 2.22. X¡+2 - x¡+1 Xi+1 - xi 1 - g , (x) (2.18) (2.19) (2.20) (2.21)
  • 73. 60 Métodos numér icos aplicados a la ingeniería E, sustituyendo la ecuación 2.21 en la última ecuación, se llega a: x"",x.- (x¡+l-xY I X¡+2 - 2xi+1 + xi que da aproximaciones a x a partir de los valores ya obtenidos en alguna sucesión. Lláme- se a esta nueva sucesión x' o' x' i- x' 2' ... i:2: O (2.22) Por ejemplo, x' o requiere de xo' XI' x2, ya que (Xl - xO)2 X' o = X o - ----''-----''-- x2 - 2xl + X o y así sucesivamente. Este proceso conducirá, en la mayoría de los casos, a la solución buscada x más rápi- do que si se siguiera el inciso a); asimismo, evita la búsqueda de una nueva g (x) y el ries- go de no obtener convergencia con esa nueva g (x). A este proceso se le conoce como aceleración de convergencia y se presenta como algoritmo de Aitken. ALGORITMO DE AITKEN Dada una sucesión de número xo, xi' x2' ... a partir de ella se genera una nueva sucesión x' o' x' l' x' 2" .. con la ecuación 2.22. Si se emplea la notación b.x¡ = Xi+l -Xi' i = 0,1,2, ... donde b. es un operador" de diferencias cuyas potencias (o más propiamente su orden) se pueden obtener así o la ecuación 2.22 adquiere la forma simplificada (2.23) • Véase capítulo 5. 60 Métodos numéricos aplicados a la ingeniería sustituyendo la ecuación 2.21 en la última ecuación, se llega a: _ (X¡+I -xix "" x· - ---=--'-'---'-- , X¡+2 - 2x¡+ 1 + X¡ que da aproximaciones a x a partir de los valores ya obtenidos en alguna sucesión. Lláme- se a esta nueva sucesión x' o' x' l' x'2' ... x ' ¡ = X¡ ___(x-"c.:.·+:.-l_-_x-,-¡)_2_ X¡+2 - 2x¡+1 + X¡ i;::: ° (2.22) Por ejemplo, x' orequiere de x o' XI' x 2' ya que (XI - x O)2 x'o=X o- --'----"-- x2 - 2x¡ + Xo y así sucesivamente. Este proceso conducirá, en la mayoría de los casos, a la solución buscada x más rápi- do que si se siguiera el inciso a); asimismo, evita la búsqueda de una nueva g (x) y el ries- go de no obtener convergencia con esa nueva g (x). A este proceso se le conoce como aceleración de convergencia y se presenta como algoritmo de Aitken. ALGORITMO DE AITKEN Dada una sucesión de número X o' x" X 2 , ... a partir de ella se genera una nueva sucesión x' o' x' J' x' 2' .. . con la ecuación 2.22. Si se emplea la notación i =0,1,2,... donde Ll es un operador' de diferencias cuyas potencias (o más propiamente su orden) se pueden obtener así o la ecuación 2.22 adquiere la forma simplificada (2.23) • Véase capítulo 5.
  • 74. Solución de ecuaciones no lineales 61 Ejemplo 2.8 Acelerar la convergencia de !~sucesión del ejemplo 2.2, mediante el algoritmo de Aitken. Solución Con la ecuación 2.22 o 2.23 con X o = 1, XI = 1.53846, x2 = 1.29502 se tiene: x' = 1 _ (1.53846 - 1)2 = 1.37081 o 1.29502 - 2(1.53846) + 1 Ahora, con la ecuación 2.22 y con XI = 1.53846, x2 = 1.29502 Yx3 = 1.40183, resulta: x' = 1.53846 _ (1.29502 -1.53846)2 = 1.36566 I 1.40183 - 2(1.29502) + 1.53846 En una tercera iteración se obtiene: X' 2 = 1.36889 Obsérvese que x' 1 está prácticamente tan cerca de la raíz real de la ecuación como el valor de x6 del ejemplo 2.2, y x' 2 mejora tanto la aproximación que es preciso compa- rar este valor con el de x3 del ejemplo 2.4. La comparación puede establecerse median- te If(x') Iy If(x) 1. Se ha encontrado que el método de Aitken es de segundo orden' y se emplea normal- mente para acelerar la convergencia de cualquier sucesión de valores que converge li- nealmente, cualquiera que sea su origen. La aplicación del método de Aitken a la iteración de punto fijo da el procedimiento conocido como método de Steffensen, que se ilustra a continuación. Encuentre una raíz real de la ecuación f(x)=x3 + 2x2+ 10x-20=0 con el método de Steffensen, usando e = 10-3 aplicado a If (x' i) 1. Solución Se pasa primero la ecuación f (x) = O a la forma g (x) = x. Al igual que en el ejemplo 2.2, se factoriza x en la ecuación y luego se "despeja". 20 x=----- x2+2x+1O Primera iteración Se elige un valor inicial X o = 1 Y se calcula Xl y x2 Xl = 1.53846 x2 = 1.29502 Se aplica ahora la ecuación 2.22 para acelerar la convergencia: x' = 1 _ (1.53846 - 1)2 = 1.37081 o 1.29502 - 2(1.53846) + 1 Como If(x' o) I = (1.37081)3 + 2(1.37081)2 + 10(1.37081) - 20 = 0.04234> 10-3, se pasa a la • Henrici, P., Elements of Numerical Analysis. John Wiley & SOIlS, lnc. (1964). pp. 91-92. Solución de ecuaciones no lineales 61 Ejemplo 2.8 Acelerar la convergencia de !~ :;ucesión del ejemplo 2.2, mediante el algoritmo de Aitken. Solución Con la ecuación 2.22 o 2.23 con Xo=1, xl = 1.53846, x2 = 1.29502 se tiene: x' = 1 _ (1.53846 - 1)2 = 1.37081 o 1.29502 - 2(1.53846) + 1 Ahora, con la ecuación 2.22 y con XI =1.53846, x2 =1.29502 Yx3 = 1.40183, resulta: x' = 1.53846 _ (1.29502 _ i1.53846)2 = 1.36566 I 1.40183 - 2(1.29502) + 1.53846 En una tercera iteración se obtiene: x'2 = 1.36889 Obsérvese que x' I está prácticamente tan cerca de la raíz real de la ecuación como el valor de x6 del ejemplo 2.2, y x'2 mejora tanto la aproximación que es preciso compa- rar este valor con el de x3 del ejemplo 2.4. La comparación puede establecerse median- te If(x') I y If(xi ) 1. Se ha encontrado que el método de Aitken es de segundo orden' y se emplea normal- mente para acelerar la convergencia de cualquier sucesión de valores que converge li- nealmente, cualquiera que sea su origen. La aplicación del método de Aitken a la iteración de punto fijo da el procedimiento conocido como método de Steffensen, que se ilustra a continuación. Encuentre una raíz real de la ecuación f(x) = x3 + 2x2 + 10x-20 = 0 con el método de Steffensen, usando e = 10-3 aplicado a If (x' ¡) 1. Solución Se pasa primero la ecuaciónf (x) = Oa la forma g (x) = x. Al igual que en el ejemplo 2.2, se factoriza x en la ecuación y luego se "despeja". 20 x =-- -- - x2+ 2x + 1O Primera iteración Se elige un valor inicial X o= 1 Yse calcula X l y x2 XI = 1.53846 x2 = 1.29502 Se aplica ahora la ecuación 2.22 para ace-Ierar la convergencia: x' = 1 _ (1.53846 - 1)2 = 1.37081 o 1.29502 - 2(1.53846) + 1 Como If(x' o) I=(1.37081)3 + 2(1.37081)2 + 10(1.37081) - 20 = 0.04234> 10-3, se pasa a la • Henrici, P., Elements ofNumerical Analysis. John Wiley & Sons, lnc. (1964). pp. 91-92.
  • 75. 62 l Métodos numéricos aplicados a la ingeniería Segunda iteración Con el valor de x' o que ahora se denota como x3 y con la g(x) que se tiene, resulta: x4 = 1.36792 X s = 1.36920 PA Aplicando nuevamente la ecuación 2.22 a x3' xt{Y Xs se llega a: (1.36792 - 1.37081)2 x' I = x6 = 1.37081 - ---'-----------'--- 1.36920 - 2(1.36792) + 1.37081 =1.36881 Luego, con el criterio de exactitud se tiene: If (x6 ) I = 0.0000399 < 10-3 y el problema queda resuelto. Para llevar a cabo los cálculos, puede usarse Matlab o la TI-92 Plus, con los siguien- tes programas basados en el algoritmo 2.5 format long xO=l;eps=O.OOl; for i=l:lO xl=20/(xO~2+2*xO+10); x2=20/(xl~2+2*xl+10); x=xO-(xl-xO)~2/(x2-2*xl+xO) ; dist=abs(x-xO) ; disp ( [xl, x2, xl ) if dist < eps breek end xO=x; end e2_9( Prgm Define g(x)=20/(x~2+2*x+10) CirIO: 1.-->xO : li e-Ar+epe Loop g (xO) +xl : g (xl) +x? xO- (xl-xO) ~2/ (x2-2*x1+xO) -->x Disp format (x, "f5") If abs (x-xO)<eps Exit x-->xO EndLoop EndPrgm 2 A continuación se da el algoritmo de Steffensen. ALGORITMO 2.5 Método de Steffensen Para encontrar una raíz real de la ecuación g (x) = x, proporcionar la función G(X) y los DATOS: RESULTADOS: Valor inicial XO, criterio de convergencia EPS y número máximo de iteraciones MAXIT. La raíz aproximada X o un mensaje de falla. PASO l. Hacer 1 = l. PASO 2. Mientras 1 < MAXIT, repetir los pasos 3 a 6. PASO 3. Hacer: Xl = G(XO) 62 Métodos numéricos aplicados a la ingeniería Segunda iteración Con el valor de x'oque ahora se denota como x3 y con la g(x) que se tiene, resulta: x4 = 1.36792 X s = 1.36920 Aplicando nuevamente la ecuación 2.22 a x3' x4'Y Xs se llega a: (1.36792 - 1.37081)2 x' I = x6 = 1.37081 - ---'-------- --'----- 1.36920 - 2(1.36792) + 1.37081 =1.36881 Luego, con el criterio de exactitud se tiene: If (x6 ) I = 0.0000399 < 10-3 y el problema queda resuelto. Para llevar a cabo los cálculos, puede usarse Matlab o la TI-92 Plus, con los siguien- tes programas basados en el algoritmo 2.5 format long xO=l ;eps=O.OOl ; for i=l :lO xl=20/(xO~2+2*xO+10); x2=20/(xl~2+2*xl+10); x=xO- (xl -xO)~2/(x2-2*xl+xO) ; dis t=abs (x-xO) ; disp ( [xl , x2, xl) if dist < eps break end xO=x; end e2_9( Prgm Define g(x)=20/(x~2+2*x+10) CirIO: 1.""'xO : 1.e-4-+eps Loop g(xO) -+xl: g(xl) -+x2 xO- (xl -xO) ~2/ (x2-2*xl+xO) -+x Disp format (x, "f5") If abs (x-xO)<eps Exit x->xO EndLoop EndPrgm A continuación se da el algoritmo de Steffensen. ALGORITMO 2.5 Método de Steffensen Para encontrar una raíz real de la ecuación g (x) = x, proporcionar la función G(X) y los DATOS: RESULTADOS: Valor inicial XO, criterio de convergencia EPS y número máximo de iteraciones MAXIT. La raíz aproximada X o un mensaje de falla. PASO l . Hacer 1 = l. PASO 2. Mientras 1 < MAXIT, repetir los pasos 3 a 6. PASO 3. Hacer: Xl = G(XO)
  • 76. Solución de ecuaciones no lineales 63 X2 = G(Xl). X = XO - (XI-XO) '2/ (X2-2*Xl+XO). PASO 4. SI ABS (X-XO) < EPS, IMPRIMIR X YTERMINAR. De otro modo CONTINUAR. PASO 5. Hacer 1 = 1 + 1 PASO 6. Hacer XO = X (actualiza XO) PASO 7. IMPRIMIR mensaje de falla: "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR. / MÉTODOS DE DOS PUNTOS Los métodos de dos puntos bisección y posición falsa garantizan convergencias, pero ya que puede ser muy lenta en algunos casos, conviene acelerarla. Enseguida se estudia una modificación de posición falsa que cumple con este cometido. MÉTODO ILLlNOIS* Esta técnica difiere del método de posición falsa (véase algoritmo 2.4) en que los valores (X¡, F¡), (XD, FD) de las sucesivas iteraciones se determinan de acuerdo con las siguientes reglas: a) Si FD*FM > O, hacer XD = Xl' FD = F¡ b) Si FD*FM < O,hacer FD = Fd2 Y en ambos casos se sustituye a X¡ con XM y F¡ con FM. El empleo de FD/2 en lugar de FD evita que uno de los extremos X¡ o XD se manten- ga fijo (caso frecuente en posición falsa). Esta modificación acelera considerablemente la convergencia del método. Los valores funcionales Fl' FD empleados conservan sus signos opuestos. El algoritmo correspondiente puede obtenerse sustituyendo los pasos 6 y 7 en el algoritmo 2.4 con los incisos (a) y (b), respectivamente, y además un paso donde se susti- tuye a X¡ con XM y F¡ con FM. 2.8 Búsqueda de valores iniciales El uso de cualquier algoritmo numérico para encontrar las raíces de f (x) = O,requiere uno o más valores iniciales; además, en métodos como el de la bisección y el de posición fal- sa, los dos valores iniciales requeridos deben estar a los lados de la raíz buscada y sus va- lores funcionales correspondientes tienen que ser de signos opuestos. A continuación se dan algunos lineamientos generales para obtener valores aproxima- dos a las raíces de f (x) = O. 1. Por lo general, la ecuación cuyas raíces se buscan tiene algún significado físico; entonces, a partir de consideraciones físicas pueden estimarse valores aproximados a las raíces. Este razonamiento es particular para cada ecuación. A continuación se presenta un ejemplo para ilustrar esta idea . • Dowel M. and Jarrat P., A Modified Regula Falsi Method for Computing the Root of an Equation. BIT. Vol. II p. 168 (1971). Solución de ecuaciones no lineales 63 X2 = G(Xl). X = XO - (XI-XO) ' 2/ (X2-2*Xl+XO). PASO 4. SI ABS (X-XO) < EPS, IMPRIMIR X YTERMINAR. De otro modo CONTINUAR. PASO 5. Hacer 1 = 1 + 1 PASO 6. Hacer XO = X (actualiza XO) PASO 7. IMPRIMIR mensaje de falla: "EL MÉTODO NO CONVERGE A UNA RAÍZ" YTERMINAR. / MÉTODOS DE DOS PUNTOS Los métodos de dos puntos bisección y posición falsa garantizan convergencias, pero ya que puede ser muy lenta en algunos casos, conviene acelerarla. Enseguida se estudia una modificación de posición falsa que cumple con este cometido. MÉTODO ILLlNOIS* Esta técnica difiere del método de posición falsa (véase algoritmo 2.4) en que los valores (XI' F¡), (XD, FD) de las sucesivas iteraciones se determinan de acuerdo con las siguientes reglas: a) Si FD*FM > 0, hacer X D = X I' FD = FI b) Si FD*FM < 0, hacer FD = FJ2 Yen ambos casos se sustituye a XI con X M y FI con FM. El empleo de FD/2 en lugar de FD evita que uno de los extremos XI o X D se manten- ga fijo (caso frecuente en posición falsa). Esta modificación acelera considerablemente la convergencia del método. Los valores funcionales FI' FD empleados conservan sus signos opuestos. El algoritmo correspondiente puede obtenerse sustituyendo los pasos 6 y 7 en el algoritmo 2.4 con los incisos (a) y (b), respectivamente, y además un paso donde se susti- tuye a XI con X M y FI con FM. 2.8 Búsqueda de valores iniciales El uso de cualquier algoritmo numérico para encontrar las raíces def (x) = 0, requiere uno o más valores iniciales; además, en métodos como el de la bisección y el de posición fal- sa, los dos valores iniciales requeridos deben estar a los lados de la raíz buscada y sus va- lores funcionales correspondientes tienen que ser de signos opuestos. A continuación se dan algunos lineamientos generales para obtener valores aproxima- dos a las raíces def(x) =O. 1. Por lo general, la ecuación cuyas raíces se buscan tiene algún significado físico; entonces, a partir de consideraciones físicas pueden estimarse valores aproximados a las raíces. Este razonamiento es particular para cada ecuación. A continuación se presenta un ejemplo para ilustrar esta idea. • Dowel M. and Jarrat P., A Modified Regula Falsi Methodfor Computing the Root ofan Equation. BIT. Vol. II p. 168 (1971).
  • 77. 64 Métodos numéricos aplicados a la ingeniería Determine el valor inicial en la solución de una ecuación de estado. Solución El cálculo del volumen molar de un gas dado, a cierta presión y temperatura también dadas, es un problema común en termodinámica. Para realizar dicho cálculo se emplea alguna de las ecuaciones de estado conocidas. Una de ellas es la ecuación de Beattie-Bridgeman: RT j3 y 8 P=-+-+-+- Y y2 v» y4 (2.24) donde los parámetros j3, y, y 8 quedan determinados al fijar el gas de que se trata, su temperatura T y su presión P. En las condiciones expuestas, el problema se reduce a encontrar el o los valores de y que satisfagan la ecuación 2.24, o en otros términos, a determinar las raíces del poli- nomio en V. E !(Y) = P y4 - R T y3 - j3 y2 - Y Y - 8 = O, (2.25) que resulta de multiplicar por Y4 la ecuación 2.24 y pasar todos sus términos a un solo miembro. La solución de la ecuación 2.25 tiene como primer problema encontrar cuando me- nos un valor inicial Yocercano al volumen buscado V. Este valor Yo,se obtiene a partir de la ley de los gases ideales; así: RT Yo=-' P que generalmente es una primera aproximación razonable. Como puede verse, el razonamiento es sencillo y se basa en el sentido común y las le- yes básicas del fenómeno involucrado. 2. Otra manera de conseguir información sobre la función, que permita determinar valores iniciales "adecuados", consiste en obtener su gráfica aproximada median- te un análisis de! (x), a la manera clásica del cálculo diferencial e integral, o bien como se ha venido sugiriendo, con algún software comercial y, en el mejor de los casos, empleando ambos. A continuación se presentan los pasos del análisis de la función! (x) y de la construcción de su gráfica en la forma clásica. a) Determinar el dominio de definición de la función. b) Determinar un subintervalo de a), que puede ser a) mismo. Es un intervalo donde se presupone que es de interés analizar la función. Evalúese la función en los si- guientes puntos de ese subintervalo: puntos extremos y aquéllos donde sea fácil el cálculo de! (x). En los siguientes pasos todo estará referido a este subintervalo. e) Encontrar los puntos singulares de la función (puntos en los cuales es infinita o no está definida). ti) La primera y la segunda derivadas dan información muy útil sobre la forma de la función, aun más útil que información de valores computados; por ejemplo, dan los intervalos de crecimiento y decrecimiento de la función. Por esto, ob- téngase la primera derivada y evalúese en puntos apropiados, en particular en puntos cercanos a aquéllos donde la función ya está evaluada y en los que es fá- cil esta evaluación. e) Encontrar los puntos máximo y mínimo, así como los valores de la función en esos puntos. 64 Métodos numéricos aplicados a la ingeniería Determine el valor inicial en la solución de una ecuación de estado. Solución El cálculo del volumen molar de un gas dado, a cierta presión y temperatura también dadas, es un problema común en termodinámica. Para realizar dicho cálculo se e;nplea alguna de las ecuaciones de estado conocidas. Una de ellas es la ecuación de Beattie··Blidgeman: RT jJ y 8 P=-+-+-+- Y y2 y3 y 4 (2.24) donde los parámetros jJ, y, y 8 quedan determinados al fijar el gas de que se trata, su temperatura T y su presión P. En las condiciones expuestas, el problema se reduce a encontrar el o los valores de y que satisfagan la ecuación 2.24, o en otros términos, a determinar las raíces del poli- nomio en V. (2.25) que resulta de multiplicar por Y4 la ecuación 2.24 y pasar todos sus términos a un solo miembro. La solución de la ecuación 2.25 tiene como primer problema encontrar cuando me- nos un valor inicial Yo cercano al volumen buscado V. Este valor Yo' se obtiene a partir de la ley de los gases ideales; así: RT Yo =- ' P que generalmente es una primera aproximación razonable. Como puede verse, el razonamiento es sencillo y se basa en el sentido común y las le- yes básicas del fenómeno involucrado. 2. Otra manera de conseguir información sobre la función, que permita determinar valores iniciales "adecuados", consiste en obtener su gráfica aproximada median- te un análisis de! (x), a la manera clásica del cálculo diferencial e integral, o bien como se ha venido sugiriendo, con algún software comercial y, en el mejor de los casos, empleando ambos. A continuación se presentan los pasos del análisis de la función! (x) y de la construcción de su gráfica en la forma clásica. a) Determinar el dominio de definición de la función. b) Determinar un subintervalo de a), que puede ser a) mismo. Es un intervalo donde se presupone que es de interés analizar la función. Evalúese la función en los si- guientes puntos de ese subintervalo: puntos extremos y aquéllos donde sea fácil el cálculo de!(x). En los siguientes pasos todo estará referido a este subintervalo. e) Encontrar los puntos singulares de la función (puntos en los cuales es infinita o no está definida). d) La primera y la segunda derivadas dan información muy útil sobre la forma de la función, aun más útil que infoffi1ación de valores computados; por ejemplo, dan los intervalos de crecimiento y decrecimiento de la función. Por esto, ob- téngase la primera derivada y evalúese en puntos apropiados, en particular en puntos cercanos a aquéllos donde la función ya está evaluada y en los que es fá- cil esta evaluación. e) Enco'1trar los puntos máximo y mínimo, así como los valores de la función en esos puntos.
  • 78. Solución de ecuaci ones no lineales 65 f) Los dominios de concavidad y convexidad de la curva, y los puntos de inflexión es información cualitativa y cuantitativa, que se obtienen a partir de la segunda derivada y son imprescindibles para este análisis. g) Obtener las asíntotas de la función. Éstas, en caso de existir, indican cierta re- gularidad en los comportamientos de la gráfica de y =f (x) al tender x o y hacia infinito. h) Descomponer la función en sus partes más sencillas que se sumen o se multipli- quen. Graficar cada parte y construir la gráfica de la función original, combinan- do las gráficas de las partes y la información conseguida en los pasos anteriores. Ejemplo 2.11 Análisis de una función. A continuación se presenta el análisis clásico de la función f(x) = x - e1-x (1 + In x) hecho por Pizer.* Nótese que In x está definida sólo para x> O, así que f (x) está definida sólo en (O, 00). En este ejemplo ilustrativo, se analiza la función en todo el dominio de definición; es decir, el intervalo de interés será (O, 00). Un punto donde es fácil evaluar la función es en x = 1, ya que la parte exponencial y la parte logarítmica se determinan fácilmente en ese punto. f(l) = 1 - e1 - 1 (l + In 1) = O De esta forma, se ha encontrado una raíz de la ecuación Xl = 1. En x = 10 f(lO) = 10 - e" (l + In 10) "" 10 Enx = 100 f(100) = 100 - e-99 (l + In 100) "" 100 Con esta información puede adelantarse que la función tiene la asíntota y = x, la función identidad. Un punto donde la función no está definida es en el extremo x = O. Al analizarlo se ad- vierte que cuando x -+ O, el In x -+ - 00 y f (x) -+ 00 y se encuentra una asíntota más de la función, que es la parte positiva del eje y. Por un lado, x -+ 00, In x -+ 00, pero e1-x se acer- ca más rápidamente a cero y, por tanto, el producto e1-x (l + In x ) tiende a cero, dejando como resultado global que f (x) -+ =. Se concluye que f (x) -+ 00 cuando x -+ O, o cuando x -+ =.Comof(x) no tiene otros puntos singulares, se da por terminado el inciso e). Al calcular la primera y segunda derivadas def(x), se tiene que f' (x) = 1- e1-x (l/x - 1-In x) y f " (x) = e1-x (2/x + l/x2 - 1- In x) Al evaluar f' (x) en x = 1, se obtiene f' (1) = 1. Cuando x -+ oo,f' (x) -+ 1. Lo que se sabe hasta aquí de la función, se muestra en la figura 2.9 a. Como f (x) es continua (todas las funciones sencillas que la forman lo son) en (O, 00), deberá haber por lo menos otra raíz de f (x) en (O, 1). • Stephen, M. Pizer. Numerical Computing and Mathematical Analysis. S.R.A., (1975) pp. 176-179. Ejemplo 2.11 Solución d e ecuaciones no lineales 65 j) Los dominios de concavidad y convexidad de la curva, y los puntos de inflexión es información cualitativa y cuantitativa, que se obtienen a partir de la segunda derivada y son imprescindibles para este análisis. g) Obtener las asíntotas de la función. Éstas, en caso de existir, indican cierta re- gularidad en los comportamientos de la gráfica de y = f (x) al tender x o y hacia infinito. h) Descomponer la función en sus partes más sencillas que se sumen o se multipli- quen. Graficar cada parte y construir la gráfica de la función original, combinan- do las gráficas de las partes y la información conseguida en los pasos anteriores. Análisis de una función. A continuación se presenta el análisis clásico de la función f(x) = x - e1- x (1 + In x) hecho por Pizer.* Nótese que In x está definida sólo para x> O, así que f (x) está definida sólo en (O, 00). En este ejemplo ilustrativo, se analiza la función en todo el dominio de definición; es decir, el intervalo de interés será (O, 00). Un punto donde es fácil evaluar la función es en x = 1, ya que la parte exponencial y la parte logarítmica se determinan fácilmente en ese punto. f (1) = 1 - e1- 1 (l + In 1) = O De esta forma, se ha encontrado una raíz de la ecuación Xl = l. En x = 10 f (lO) = 10 - e-9 (1 + In 10) "" 10 Enx = 100 f(lOO) = 100 - e-99 (1 + In 100) "" 100 Con esta información puede adelantarse que la función tiene la asíntota y = x, la función identidad. Un punto donde la función no está definida es en el extremo x =O. Al analizarlo se ad- vierte que cuando x -+ O, el In x -+ - 00 y f (x) -+ 00 y se encuentra una asíntota más de la función, que es la parte positiva del eje y. Por un lado, x -+ 00, In x -+ 00, pero e1- x se acer- ca más rápidamente a cero y, por tanto, el producto e1- x (1 + In x) tiende a cero, dejando como resultado global que f (x) -+ oo. Se concluye que f (x) -+ 00 cuando x -+ O, o cuando x -+ oo. Comof(x) no tiene otros puntos singulares, se da por terminado el inciso c). Al calcular la primera y segunda derivadas def(x), se tiene que f' (x) = 1 - e1- x (l/x - 1 - In x) y f" (x) = e1- x (2/x + lIx2 - 1 -In x) Al evaluarf' (x) en x = 1, se obtienef' (1) = 1. Cuando x -+ oo,f' (x) -+ l. Lo que se sabe hasta aquí de la función, se muestra en la figura 2.9 a. Comof (x) es continua (todas las funciones sencillas que la forman lo son) en (O, 00), deberá haber por lo menos otra raíz de f (x) en (O, 1). • Stephen, M. Pizer. Numerical Computing and Mathematical Analysis. S.R.A., (1975) pp. 176-179.
  • 79. .. 66 Métodos nu méricos aplicados a la ingeniería y a) y e) y / / / / / / / / / / / / / / Figura 2.9 Construcción de la gráfica de f[x) = x - e1-x (1 + In x). e) ( x b) x y y=x y = x-el - x (1 + lnx) x El inciso e) del análisis de la función no procede en este caso, ya que sería tan com- plejo como encontrar las raíces de f (x). En su lugar se analiza la forma de la curva con la segunda derivada. Evaluando f" (x) en valores muy grandes de x, se tiene que f' I (x) < O, o sea que la función es convexa para valores muy grandes de x (también se dice que la cur- va gira su convexidad hacia la parte positiva del eje y). Además, se tienef" (1) = 2, lo que indica que la función es cóncava en x = 1 (o en otras palabras gira su convexidad hacia la parte negativa del eje y). La información se muestra en la figura 2.9 b. Se puede obtener aún más información def(x), analizando las funciones elementales que la componen, como x, el-x, y 1 + In x. La familiaridad con las gráficas de las funcio- nes elementales es útil cuando se consideran funciones más complejas. Las partes en que se puede descomponer f (x) se muestran en la figura 2.9 c. Primero nótese que la gráfica de 1 + In x es la de In x aumentada en una unidad, y que la gráfica de el-x es la de e-X llevada 66 Figura 2.9 Construcción de la gráfica de f[x) = x - el - x (1 + In x). Métodos numéricos aplicados a la ingeniería y ( a) x b) x y y y=x e) y y =x-el - x (1 + Inx) x El inciso e) del análisis de la función no procede en este caso, ya que sería tan com- plejo como encontrar las raíces def (x). En su lugar se analiza la forma de la curva con la segunda derivada. Evaluando f // (x) en valores muy grandes de x, se tiene que f // (x) < O, o sea que la función es convexa para valores muy grandes de x (también se dice que la cur- va gira su convexidad hacia la parte positiva del eje y). Además, se tiene!, / (1) = 2, lo que indica que la función es cóncava en x = 1 (o en otras palabras gira su convexidad hacia la parte negativa del eje y). La información se muestra en la figura 2.9 b. Se puede obtener aún más información def(x) , analizando las funciones elementales que la componen, como x, el-x, y 1 + In x. La familiaridad con las gráficas de las funcio- nes elementales es útil cuando se consideran funciones más complejas. Las partes en que se puede descomponerf(x) se muestran en la figura 2.9 c. Primero nótese que la gráfica de 1 + In x es la de In x aumentada en una unidad, y que la gráfica de el- x es la de e-X llevada
  • 80. Solución de ecuaciones no lineales 67 una unidad a la derecha. Multiplicando e1-x y 1 + In x entre sí (Fig. 2.9 d), se ve que este producto es negativo entre cero y algún valor menor que 1, tiende a cero cuando x aumen- ta y permanece debajo de y = x para x > 1. Como la derivada del producto es cero en x = 1, la curva del producto tiene ahí un má- ximo y el resto de la gráfica puede obtenerse como se ilustra en la figura 2.9 e). Nótese que los ceros de f (x) son los puntos donde el producto e1-x (1 + In x) y la fun- ción identidad y = x se intersectan. Esto significa que sólo hay dos raíces de la función. También puede concluirse que hay una raíz en x = 1 Yotra cerca de x = 0.5, por lo que 0.5 sería un valor. inicial adecuado para calcular esta segunda raíz. Actualmente se puede recurrir a programas comerciales con facilidades de graficación para visualizar funciones matemáticas; no obstante, es necesario verlos como auxiliares en esta tarea y no como algo que permita sustituir el análisis tradicional y mucho menos los conceptos. Por ejemplo, si graficamos con Matlab la función en el intervalo [-3, 3] obten- dríamos la figura 2.10. 20 O -20 -40 -60 -80 -100 -120 Figura 2.10 -3 -2 -1 O 2 3 x = -3:0.1:3; f = x - exp(l' - x) .*(l+log(x)); plot (x, f, 'k') Lo cual ciertamente es algo que requiere una lectura en términos de lo que se "ve", de lo que el programa hace, de los mensajes de error que pudieran darse y de los conceptos in- volucrados. En este caso, Matlab muestra las siguientes advertencias: Warning: Log of zero. > In D: Archivos de programaMatlabbine2_10.m at line 2 Warning: Imaginary parts of complex X and/or y arguments ignored. > In D: Archivos de programaMatlabbine2_10.m at line 3 La primera significa que se está evaluando la función en x = O,Ycomo ya es sabido, In (O) no está definido y de ahí la interrupción de la gráfica alrededor de ese punto; de igual ma- nera, el logaritmo de números negativos genera valores complejos, sin embargo, Matlab ignora la parte imaginaria de los valores de la función y con la parte real continúa la gra- ficación. De no haber hecho estas consideraciones pensaríamos que existe gráfica a la iz- quierda y a la derecha de cero, y además que hay una raíz negativa. Si se elige el intervalo (O, 5) se obtiene la gráfica de la figura 2.1l.
  • 81. 68 Métodos nu méricos aplicados a la ingeniería 5 4 3 2 o -1 ~~--~--~~~~--~--~~--~~ Figura 2.11 O 0.5 ~5 2 ~5 3 3.5 4 ~5 5 x=0.05:0.l: 5; f=x-exp (l-x) .* (l+log (x)); plot (x, f, 'k') La cual, aunque ya es muy parecida a la mostrada en la figura 2.9 e, no revela por sí mis- ma, por ejemplo, que es cóncava hacia arriba en el intervalo comprendido entre x = O Y x '" 1.6, y que es cóncava hacia abajo después de x = 1.6. Lo anterior se puede comprobar obteniendo la segunda derivada y observando el signo de dicha derivada. En este caso f 11 (x) = e1-x ( ~ +..!.- - 1 - In x) x x2 donde puede observarse que en O< x :s; 1 la segunda derivada es positiva; y para algún va- lor de x alrededor de 1.6, la segunda derivada es negativa y se mantiene con ese signo al aumentar x. El valor de x, donde la segunda derivada es cero, es el punto donde la curva cambia de concavidad, y encontrar este valor implica resolver una ecuación no lineal en una incógnita:f" (x) = O.Resolviendo esta ecuación utilizando como valor inicial 1.6 ob- servado en la gráfica y con la instrucción fzero ('exp (l-x) * (2/x+ 1/x-2-1-1og (x)) , ,1.6) Matlab reporta ans = l. 6952 Podemos apreciar también en la gráfica de la figura 2.11 dos raíces; sin embargo, ¿có- mo podríamos saber que son las únicas? Una forma sería extender el intervalo de graficación en el sentido positivo del eje x y/o ver si la función es creciente o si tiene asíntotas. Una for- ma de auxiliarnos con un graficador sería graficar para valores de x muy grandes, por ejem- plo [O,200], con lo que se obtiene la gráfica de la figura 2.12. 200r-----~------~------_r----~ 150 100 50 -50L-----~------~------~----~ Figura 2.12 O 50 100 150 200 x=O.Ol:O.l: 200; f=x-exp(l-x) .*(l+log(x)); plot (x, r, 'k') 2.9 Eje 68 Figura 2.11 Figura 2.12 Métodos numéricos aplicados a la ingeniería x=0.05:0.1: 5; f=x- exp(l-x) .*(l +log(x)); plot (x, f, 'k') o 0.5 0.5 2 2.5 3 3.5 4 4.5 5 La cual, aunque ya es muy parecida a la mostrada en la figura 2.9 e, no revela por sí mis- ma, por ejemplo, que es cóncava hacia arriba en el intervalo comprendido entre x = OY x '" 1.6, y que es cóncava hacia abajo después de x = 1.6. Lo anterior se puede comprobar obteniendo la segunda derivada y observando el signo de dicha derivada. En este caso x =e -+-- -n xf " () l-x (2 1 1 1 ) x x2 donde puede observarse que en O< x :s; 1 la segunda derivada es positiva; y para algún va- lor de x alrededor de 1.6, la segunda derivada es negativa y se mantiene con ese signo al aumentar x. El valor de x, donde la segunda derivada es cero, es el punto donde la curva cambia de concavidad, y encontrar este valor implica resolver una ecuación no lineal en una incógnita:f" (x) = O. Resolviendo esta ecuación utilizando como valor inicial 1.6 ob- servado en la gráfica y con la instrucción fzero( 'exp (l - x)* (2/x+1 /x~2-1-1og(x))' ,1.6) Matlab reporta ans = l. 6952 Podemos apreciar también en la gráfica de la figura 2.11 dos raíces; sin embargo, ¿có- mo podríamos saber que son las únicas? Una forma sería extender el intervalo de graficación en el sentido positivo del eje x y/o ver si la función es creciente o si tiene asíntotas. Una for- ma de auxiliamos con un graficador sería graficar para valores de x muy grandes, por ejem- plo [O, 200], con lo que se obtiene la gráfica de la figura 2.12. 200 150 100 50 50 -50 O 50 100 150 200 x=O.Ol:O.l: 200; f=x- exp (l-x). * (l+log (x)); plot (x, f , 'k')
  • 82. m Solución de ecuaciones no lineales 69 Nuevamente una lectura de esta gráfica revela que la función es creciente y que se acerca a la función y = x; no obstante, es necesario precisar esto como lo hicimos en el aná- lisis clásico. Una vez que hayamos determinado las dos asíntotas de las funciones, podemos ase- gurar que sólo hay dos raíces reales en el intervalo (O, 1.5), cuya obtención puede hacerse con alguno de los métodos vistos. Con la instrucción Matlab. fzero('x - exp(1-x).*(1+log(x));0.3) Se obtiene ans 0.4967 2.9 Raíces complejas Hasta ahora se han discutido sólo técnicas para encontrar raíces reales de ecuaciones de la forma f (x) = O. Sin embargo, a menudo se presentan ecuaciones polinomiales con coefi- cientes reales, cuyas raíces son complejas, o bien polinomios complejos, y ecuaciones tras- cendentes con raíces reales y complejas. Generalmente, dichas ecuaciones pueden resolverse por el método de Newton-Raphson (Sec. 2.2), pero proponiendo un valor inicial X o complejo o bien por algún otro método. MÉTODO DE NEWTON-RAPHSON Supóngase que se tiene (2.26) con todos los coeficiente a¡ reales. f I (x) es un polinomio de grado (n - 1) Y de coeficien- tes también reales f I (x) = n anxn - l + (n - 1) all _ lxn-2 + ... + 2a~ + al Si el valor inicial X o es real, entonces (2.27) también será real y todos los valores xi siguientes. Consecuentemente no se puede encon- trar una raíz compleja de la ecuación 2.26 si se inicia con un valor X o real. Si por el contrario, el valor inicial X o es complejo, Xl entonces será complejo, x2 tam- bién, y así sucesivamente. De esta manera, si el proceso converge, puede encontrarse una raíz x compleja. Ejemplo 2.12 Encuentre las raíces complejas de la ecuación f (x) = x2 + 4 = O, con el método de Newton-Raphson. Solución Al derivar f (x) se tiene f'(x)=2x Solución de ecuaciones no lineales 69 Nuevamente una lectura de esta gráfica revela que la función es creciente y que se acerca a la función y = x; no obstante, es necesario precisar esto como lo hicimos en el aná- lisis clásico. Una vez que hayamos determinado las dos asíntotas de las funciones, podemos ase- gurar que sólo hay dos raíces reales en el intervalo (O, 1.5), cuya obtención puede hacerse con alguno de los métodos vistos. Con la instrucción Matlab. fzero('x - exp(1-x).*(1+1og(x));0.3) Se obtiene ans 0.4967 2.9 Raíces complejas Hasta ahora se han discutido sólo técnicas para encontrar raíces reales de ecuaciones de la forma f (x) = O. Sin embargo, a menudo se presentan ecuaciones polinomiales con coefi- cientes reales, cuyas raíces son complejas, o bien polinomios complejos, y ecuaciones tras- cendentes con raíces reales y complejas. Generalmente, dichas ecuaciones pueden resolverse por el método de Newton-Raphson (Sec. 2.2), pero proponiendo un valor inicial X ocomplejo o bien por algún otro método. MÉTODO DE NEWTON-RAPHSON Supóngase que se tiene (2.26) con todos los coeficiente a¡ reales. f I (x) es un polinomio de grado (n -1) y de coeficien- tes también reales f I (x) =n anxn - l + (n - 1) an _ lxn-2 + ... + 2a~ + al Si el valor inicial X oes real, entonces (2.27) también será real y todos los valores Xi siguientes. Consecuentemente no se puede encon- trar una raíz compleja de la ecuación 2.26 si se inicia con un valor X oreal. Si por el contrario, el valor inicial X oes complejo, Xl entonces será complejo, x2 tam- bién, y así sucesivamente. De esta manera, si el proceso converge, puede encontrarse una raíz x compleja. Ejemplo 2.12 Encuentre las raíces complejas de la ecuación f (x) =x2 + 4 =O, con el método de Newton-Raphson. Solución Al derivarf (x) se tiene f'(x)=2x
  • 83. -------~--------------------------------:----- 70 Métodos numéricos aplicados a la ingeniería Sea X o = j el valor inicial propuesto. Aplicando la ecuación 2.12 con este valor inicial, se tiene: (j2 + 4) xI = j - 2 (j) -1 + 4 3 pero (j)2 = -1, entonces: xI = j - = j - - 2j 2j Multiplicando y dividiendo por j el término 3/(2j), se obtiene: xI = j - (-1.5 j) = 2.5 j . (2.5 j)2 + 4 . x2 = 2.5) - = 2.05 ) 2(2.5 j) (2.5 j)2 + 4 = 2.001 . x3 = 2.5 j - 2(2.05 j) ) La sucesión de valores complejos xo' xi' ... , va acercándose rápidamente a la raíz x l = 2j f (x 1) = f (2 j) = (2 j)2 + 4 = -4 + 4 = O Para evaluar la distancia entre dos valores complejos consecutivos, se utiliza donde las barras representan el módulo del número complejo xi+1 - xi" Esto es, si xi+1 - Xi = a + b j Entonces I xi+1 - Xi I = Ja2 + b2 Por lo que se tiene para la sucesión previa IXI - X o I= I2.5 j - j I= J 02 + (1.5)2 = 1.5 IX 2 - xI 1=1 2.05 j - 2.5 j I = J 02 + (-0.45)2 = 0.45 IX 3 - X 2 I = 2.001 j - 2.05 j = J02 + (-0.049)2 = 0.049 y la convergencia es notoria. En caso de tener raíces complejas una ecuación polinomial con coeficientes reales; és- tas aparecen en parejas; es decir, si X = a + b j es raíz, también lo será X = a - b j (toda vez que al multiplicarlos deben producir los coeficientes reales). Por esto: x2 = -2j es la segunda raíz que se busca. f(x 2) =f(-2j) = (_2j)2 + 4 = -4 + 4 = O El problema queda terminado. Para realizar los cálculos de este ejemplo, puede usar el guión de Matlab dado en el Ejemplo 2.4, con el valor inicial xO=li, con lo que Matlab realiza los cálculos con aritmética compleja. El lector puede apreciar aún más la utilidad de Matlab con este ejemplo. 70 Métodos numéricos aplicados a la ingeniería Sea X o= j el valor inicial propuesto. Aplicando la ecuación 2.12 con este valor inicial, se tiene: (j2 + 4) xI = j - 2 (j) -1 + 4 3 pero (j)2 = -1, entonces: xI = j - = j - - 2j 2j Multiplicando y dividiendo por j el término 3/(2j), se obtiene: xI =j - (-1.5 j) =2.5 j . (2.5 j)2 + 4 . x2 =2.5) - =2.05 ) 2(2.5 j) (2.5 N + 4 = 2.001 . x3 = 2.5 j - 2(2.05 j) ) La sucesión de valores complejos xo' xl' ... , va acercándose rápidamente a la raíz x I = 2j f (x 1) =f (2 j) = (2 N + 4 = -4 + 4 = O Para evaluar la distancia entre dos valores complejos consecutivos, se utiliza donde las barras representan el módulo del número complejo x i+1 - xi" Esto es, si xi+1 - Xi = a + b j Entonces I xi+1 - Xi I = Ja2 + b2 Por lo que se tiene para la sucesión previa IXl - X oI= I2.5 j - j I= J02 + (1.5)2 = 1.5 IX2 - XI 1=1 2.05 j - 2.5 ji = J02 + (-0.45)2 = 0.45 IX 3 - X 2 I= 2.001 j - 2.05 j = J02 + (-0.049)2 = 0.049 y la convergencia es notoria. En caso de tener raíces complejas una ecuación polinomial con coeficientes reales, és- tas aparecen en parejas; es decir, si X = a + b j es raíz, también lo será X = a - b j (toda vez que al multiplicarlos deben producir los coeficientes reales). Por esto: es la segunda raíz que se busca. f(x 2) =f(-2j) = (_2j)2 + 4 = -4 + 4 = O El problema queda terminado. Para realizar los cálculos de este ejemplo, puede usar el guión de Matlab dado en el Ejemplo 2.4, con el valor inicial xO=li, con lo que Matlab realiza los cálculos con aritmética compleja. El lector puede apreciar aún más la utilidad de Matlab con este ejemplo.
  • 84. ¡=2j es, és- a vez oen con este Solución de ecuaciones no lineales 71 Si bien se resolvió una ecuación cuadrática que no representa dificultad, el método también puede emplearse para un polinomio de mayor grado, siguiendo los mismos pasos. El lector puede crean un programa para el algoritmo en algún lenguaje de alto nivelo en un pizarrón electrónico como Mathcad. MÉTODO DE MÜLLER Un método deducido por Müller, * se ha puesto en práctica en las computadoras con éxito sorprendente. Se puede usar para encontrar cualquier tipo de raíz, real o compleja, de una función arbitraria. Converge casi cuadráticamente en un intervalo cercano a la raíz y, a di- ferencia del método de Newton-Raphson, no requiere la evaluación de la primera derivada de la función, y obtiene raíces reales y complejas aun cuando estas raíces sean repetidas. La aplicación del método requiere valores iniciales y es una extensión del método de la secante, el cual aproxima la gráfica de la función f (x) por una línea recta que pasa por los puntos (Xi_l,J (Xi_1)) y (xi,J (x¡)). El punto de intersección de esta línea con el eje x da la nueva aproximación xi+ ¡. En lugar de aproximar f (x) por una función lineal (línea recta o polinomio de grado 1), resulta natural tratar de obtener una convergencia más rápida aproximandof(x) por un poli- nomio p (x) de grado n > 1que coincida conf(x) en los puntos de abscisas xi' xi_I"'" xi_ll ' y determinar X i + l como una de las raíces de p (x). A continuación se describe el caso n = 2, donde el estudio detallado de Müller encon- tró que la elección de n da resultados satisfactorios. Se toman tres valores iniciales xo, xi' x2 y se halla el polinomio p (x) de segundo gra- do que pasa por los puntos (xo,J (xo))' (xl,J (XI)) y (x2,J (x2)), y se toma una de las raíces de p (x), la más cercana a x2 como la siguiente aproximación x3 . Se repite la operación con los nuevos valores iniciales xi' x2' x3, y se termina el proceso tan pronto como se satisfa- ga algún criterio de convergencia. La figura 2.13 ilustra este método. Sean x.; Xi_l' xi_2' tres aproximaciones distintas a una raíz de f (x) = O. Usando la si- guiente notación: t,=f(x¡) kl=f(xi_¡) k2 =f(xi_2) en el capítulo 5 se demostrará que con (2.28) (2.29) la función (2.30) • Müller, D.E. "A Method of Solving Algebraic Equations Using an Automatic Cornputer". Mathematical Tables and Other Aids to Computation (MTAC), 10. pp. 208-215 (1956). Solución de ecuaciones no lineales 71 Si bien se resolvió una ecuación cuadrática que no representa dificultad, el método también puede emplearse para un polinomio de mayor grado, siguiendo los mismos pasos. El lector puede crean un programa para el algoritmo en algún lenguaje de alto nivelo en un pizarrón electrónico como Mathcad. MÉTODO DE MÜLLER Un método deducido por Müller,* se ha puesto en práctica en las computadoras con éxito sorprendente. Se puede usar para encontrar cualquier tipo de raíz, real o compleja, de una función arbitraria. Converge casi cuadráticamente en un intervalo cercano a la raíz y, a di- ferencia del método de Newton-Raphson, no requiere la evaluación de la primera derivada de la función, y obtiene raíces reales y complejas aun cuando estas raíces sean repetidas. La aplicación del método requiere valores iniciales y es una extensión del método de la secante, el cual aproxima la gráfica de la función/(x) por una línea recta que pasa por los puntos (Xi_l,f (Xi_I)) y (xi,f (x)). El punto de intersección de esta línea con el eje x da la nueva aproximación xi+ l' En lugar de aproximar/ex) por una función lineal (línea recta o polinomio de grado 1), resulta natural tratar de obtener una convergencia más rápida aproximando/ (x) por un poli- nomio p (x) de grado n > 1 que coincida con/(x) en los puntos de abscisas Xi' Xi_P "" Xi_n' y determinar Xi+1 como una de las raíces de p (x). A continuación se describe el caso n = 2, donde el estudio detallado de Mül1er encon- tró que la elección de n da resultados satisfactorios. Se toman tres valores iniciales xo, xl' x2 Yse halla el polinomio p (x) de segundo gra- do que pasa por los puntos (xo,f (xo))' (xl,f (XI)) y (x2,f(x2)), y se toma una de las raíces de p (x), la más cercana a x2 como la siguiente aproximación x3. Se repite la operación con los nuevos valores iniciales x" x2' x3, y se termina el proceso tan pronto como se satisfa- ga algún criterio de convergencia. La figura 2.13 ilustra este método. Sean Xi' Xi_1' X i_2' tres aproximaciones distintas a una raíz de / (x) = O. Usando la si- guiente notación: /¡ = /(x) h-I =/(xi_ ,) h-2 =!(xi_2) en el capítulo 5 se demostrará que con la función (2.28) (2.29) (2.30) • Müller. D.E. "A Method of Solving Algebraic Equations Using an Automatic Computer". Mathematical Tables and Other Aids to Computation (MTAC). 10. pp. 208-215 (1956).
  • 85. 72 Figura 2.13 Interpretación . gráfica del método de Müller. r Métodos numéricos aplicados a la ingeniería es la parábola única que pasa por los puntos (x¡,f), (x¡_i'kl) y (x¡_2,k2). El lector recor- dará que la manera usual de escribir un polinomio de segundo grado o parábola es: p(x) = ao + a1x + ar2 y xI I I I I : y = p(x) Al comparar esta última expresión con la ecuación 2.30 se establece la siguiente identifi- cación: a2 =f [Xi' X¡_¡, X¡_2] a¡ =f [Xi' X¡_¡] - (X¡ + x¡_¡)a2 ao =¡;- X¡ (j [Xi' X¡_¡] - X¡_I a2) Una vez calculados los valores de ao' a¡ y a2, las raíces de p (x) se determinan a partir de la fórmula cuadrática 2aoxi + 1 = -----=----- - a¡ ± (a2¡ - 4aOa2) 1/2 cuya explicación se encuentra en el problema 2.31, Y en el ejercicio 1.3 del capítulo 1. Se selecciona el signo que precede al radical de manera que el denominador sea má- ximo en magnitud,* y la raíz correspondiente es la siguiente aproximación xi + l . La razón para escribir la fórmula cuadrática de esta manera es obtener mayor exactitud (véase Probo 2.31), ya disminuida por las diferencias de las ecuaciones 2.28 y 2.29, que se utilizan en el cálculo de ao' a¡ Y a2, Yque son aproximaciones a las derivadas de la funciónf(x). Puede ocurrir que la raíz cuadrada en la ecuación 2.31 sea compleja. Si f (x) no está definida para valores complejos, el algoritmo deberá reiniciarse con nuevos valores inicia- les. Si f (x) es un polinomio, la posibilidad de raíces complejas es latente y el valor de x puede considerarse como aproximación a alguna de estas raíces y, por tanto, deberá em- plearse en la siguiente iteración . (2.31) • Con esto se encuentra el valor más cercano a x;. 72 Figura 2.13 Interpretación . gráfica del método de Müller. Métodos numéricos aplicados a la ingeniería es la parábola única que pasa por los puntos (x¡,f), (x¡_l'k¡) y (Xi- 2,k2). El lector recor- dará que la manera usual de escribir un polinomio de segundo grado o parábola es: p(x) = ao + a¡x + ar 2 y x : y = p(x) Al comparar esta última expresión con la ecuación 2.30 se establece la siguiente identifi- cación: a2 = f [Xi' X¡_l' Xi_2] al =f [Xi' Xi_¡] - (X¡ + x¡_I)a2 ao =1; - Xi (j [Xi' X i_¡] - X¡_l a2) Una vez calculados los valores de ao, al Ya2, las raíces de p (x) se determinan a partir de la fórmula cuadrática (2.31) cuya explicación se encuentra en el problema 2.31, Yen el ejercicio 1.3 del capítulo 1. Se selecciona el signo que precede al radical de manera que el denominador sea má- ximo en magnitud,* y la raíz correspondiente es la siguiente aproximación xi+l . La razón para escribir la fórmula cuadrática de esta manera es obtener mayor exactitud (véase Probo 2.31), ya disminuida por las diferencias de las ecuaciones 2.28 y 2.29, que se utilizan en el cálculo de ao' al Ya2, Yque son aproximaciones a las derivadas de la funciónf(x). Puede ocurrir que la raíz cuadrada en la ecuación 2.31 sea compleja. Sif (x) no está definida para valores complejos, el algoritmo deberá reiniciarse con nuevos valores inicia- les. Si f (x) es un polinomio, la posibilidad de raíces complejas es latente y el valor de x puede considerarse como aproximación a alguna de estas raíces y, por tanto, deberá em- plearse en la siguiente iteración. • Con esto se encuentra el valor más cercano a x;.
  • 86. Solución de e cuaciones no lineales 73 Ejemplo 2.13 Encuentre una raíz real de la ecuación polinomial f (x) = x3 + 2x2 + lOx - 20 = O, con el método de Müller. • Solución Primera iteración Al seleccionar como valores iniciales a xo=O; x¡=l; y evaluar la función f (x) en estos puntos, se tiene x2 = 2 fo = -20; t.=-7; f2 = 16 Se calculan ahora los coeficientes del polinornio de segundo grado f[ ] f¡-fo . xl' X o = -"----=- x¡ -xo -7 + 20 ---=13 1-0 23 -13 ---=5 2-0 Por tanto a2 =j[x2, xl' xo] = 5 al = j[x2, Xl] - (X2 + Xl) a2 = 23 - (2 + 1)5 = 8 40 = f2 - X2 (f [X2, Xl] - x¡a2) = 16 - 2 (23 - 1(5» = -20 Se calculan los denominadores de la ecuación 2.31 -al +(a2¡ - 4aOa2)l/2 = -8 + (64 + 400)1/2 = 13.54066 -al _(a2] - 4aOa2)1I2 = -8 - (64 + 400)112= -29.54066 Como el segundo es mayor en valor absoluto, se usa en la ecuación 2.31, de donde 2(-20) ----= 1.35407 -29.54066 Segunda iteración Recorriendo ahora los subíndices de x, se tiene: Xo = 1; XI =2; X 2 = 1.35407 f2 = -0.30959fo = -7; t,= 16; En consecuencia: 16 + 7 {[xl' xo] = = 23 . 2-1 -0.30959 - 16 f [x2, x¡] = = 25.24978 1.35407 - 2 Solución de ecuaciones no lineales 73 Ejemplo 2.13 Encuentre una raíz real de la ecuación polinomial J(x) =x3 + 2x2 + lOx - 20 =O, con el método de Müller. • Solución Primera iteración Al seleccionar como valores iniciales a Xo =O; x l =l ; y evaluar la función J(x) en estos puntos, se tiene Jo = -20; Se calculan ahora los coeficientes del polinomio de segundo grado Por tanto a2 = f[x2, xl' xo] = 5 23 -13 - - - = 5 2-0 a¡ = f[x2, Xl ] - (X2 + Xl) a2 =23 - (2 + 1)5 =8 ao =J2 - x2 (j [X2, Xl] - x¡a2) =16 - 2 (23 - 1(5)) =-20 Se calculan los denominadores de la ecuación 2.31 -al +(a2¡ - 4aO a2)1/2 = -8 + (64 + 400)112 = 13.54066 -al -(a2¡ - 4aO a2)I/2 =-8 - (64 + 400)¡/2 =-29.54066 Como el segundo es mayor en valor absoluto, se usa en la ecuación 2.31, de donde Segunda iteración 2(-20) = 1.35407 -29.54066 Recorriendo ahora los subíndices de x, se tiene: En consecuencia: Xo= 1; Jo =-7; X¡ = 2; JI = 16; 16 + 7 f[xl' xo] = 2 _ 1 = 23 X2 =1.35407 J2 = -0.30959 -0.30959 - 16 f[x2, x ¡] = =25.24978 1.35407 - 2
  • 87. 74 Métodos numéricos aplicados a la ingeniería 25.24978 - 23 f[x2, xI' xo] = = 6.35405 1.35407 - 1 De donde: a2 =1[x2' X¡, xo] = 6.35405 a¡ =1[x2' Xl] - (X2' + x¡)a2 = 25.24978 - (1.35407 + 2)6.35405 = 3.87077 ao =12 -x2 ({[x2' Xl] -x¡a2) = -0.30959 - 1.35407 (25.24978 - 2 (6.35405)) = - 17.29190 Calculando los denominadores de la ecuación 2.31 -al + (a2¡ - 4aOa2)1I2 = 17.39295 -al - (a - 4aOa2)J/2 = -25.26855 Como el segundo es mayor en valor absoluto, se usa en la ecuación 2.31, de donde 2aox3 = = 1.36865 -al - (a2¡ - 4aOa2)1I2 La tabla 2.5 se obtiene repitiendo el procedimiento. Tabla 2.5 s. I Xi+¡ -Xi I O O 1 1 1.00000 2 2 1.00000 3 1.35407 0.64593 4 1.36865 0.01458 5 1.36881 0.00016 Para llevar a cabo los cálculos que se muestran en la tabla anterior, puede emplearse Ma- tlab o la TI-92 Plus. eps=O.OOl;eps1=O.OOOl; xO=O; x1=1; x2=2; for i=l z: 5 fO=xO~3+2*xO~2+10*xO-20; fl=x1 ~3+2*x1~2+1(J~xl-20; f2=x2~3+2*x2~2+10*x2-20; f10=(f1-fO)/(xl-xO); f21=(f~-f1)/(x2-x1); f21Ó=(f21-flO) / (x2-xO); a2=f21O; a1=f21- (X2+xl) *a2; aO=f2-x2*(f21-x1*a2); e2_13 ( ) -, Prgm Define F(x)=x~3+2*x-2+10*x-20 .OOl->eps: .Oüi+epsl : O.->xO 1.->x1 : 2.->x2 For i, 1, 5 f (xO)-+fO : f (x1)->fl f (x2)->f2 : (fl-fO)/(x1-xO)->flO (f2-f1)/(x2-x1)->f21 (f21-flO)/(x2-xO)->f210 : f210->a2 f21- (x2+x1)*a2-+a1 f2-x2* (f21-x1*a2) -+aO
  • 88. dl=-al+ (al A2-4*aO~a2)AO.5; d2=-al-(alA2-4*a~a2)AO.5; if abs (dl) >abs (d2) x3=2*aO/dl; el se x3=2'aO/d2; end f3=x3A3+2*x3A2+l~x3-20; dist=abs (x3-x2) ; disp ([x3, dist)) if or ( (dist<eps) , (abs (f3)~<epsl) ) break else xO=xl;xl=x2;x2=x3; end end !7Z5:3 ZTITrrmr: Solución de ecuaciones no lineales 75 -al +-Y (al A2-4*a~a2) +cü -al--Y (al A2-4*a~a2)->d2 If abs (dl) >abs (d2) then Z.'aO/dl->x3 Else 2*aO/d2->x3 EndIf abs (x3-x2) +diet: fonnat (x3, "f5") &" ''->d d&fonnat (dist, "f5")->d Disp d If dist<eps or abs (f (x3) ) <epsl Exit x i+ xO : x2->xl : x3-> x2 EndFor EndPrgm Encuentre las raíces complejas de la ecuación polinomial del ejemplo 2.12 f (x) = x2 + 4 = O, con el método de Müller. Solución Primera iteración Al elegir como valores iniciales: Xo = O; x¡ = 1; y evaluar la función en estos puntos, se tiene t.=5;fo=4; Se calculan ahora los coeficientes del polinomio de segundo grado f[ ] f¡ - fo __ 5 - 4 -_ 1 xi' Xo = 1 _ Ox¡ -xo Por tanto 0-1 --=1 -1- O a2 =f[x2, xi' xo] = 1 a¡ =f[x2, xl] - (X2 +x¡)a2 = 0- (-1 + 1)(1) = O ao =f2 - x2 (f [x2, x¡] - x¡a2) = 5 - (-1)(0 - 1(1» = 4 Calculando los denominadores de la ecuación 2.31 -al + (a2¡ - 4aOa2)¡/2 = O+ (O- 4(4)(1»¡/2 = (_16)112= 4 j -al - (a2¡ - 4aOa2)1I7 = O- (O- 4(4)(1»112 = ....{-16)1I2 = - 4 j dl=-al+ (al A2-4*aa~a2) AO. 5; d2=-al - (al A2- 4*aO*a2) AO.5; if abs (dl) >abs (d2) x3=2*aO/dl; else x3=2'aO/d2; end f3=x3 A3+2*x3A2+lO*x3- 20; dist=abs (x3-x2) ; disp ([x3, distJ) Solución de ecuaciones no lineales 75 -al +..J (al A2-4*aO*a2) ---'dl - al - ..J (al A2- 4*aO*a2)---'d2 If abs (dl) >abs (d2) then 2"aO/dl---'x3 Else 2*aO/d2---'x3 EndIf abs (x3-x2)---'dist if ar ( (dist<eps) , (abs (f3).<epsl) ) break fannat (x3, "f5") &" "---'d d&fannat (dist, "f5")---'d Disp d If dist<eps ar abs (f (x3) ) <epsl else end end xO=xl;xl=x2; x2=x3; Exit xl---'xO : x2---'xl : x3---'x2 EndFar EnclPrgm Encuentre las raíces complejas de la ecuación polinomial del ejemplo 2.12 f (x) = x2 + 4 = O, con el método de Müller. Solución Primera iteración Al elegir como valores iniciales: Xo=O; X¡ = 1; y evaluar la función en estos puntos, se tiene fo =4; f¡ = 5; Se calculan ahora los coeficientes del polinomio de segundo grado Por tanto f[ ] fl - fo __ 5 - 4 -_ 1 xl' X o = 1 _ O X I - xo a2 =f[x2, xi' xo] = 1 0-1 - - = 1 -1- 0 a¡ =f[x2, x ¡] - (x2 +xl)a2 =0- (-1 + 1)(1) =O ao =f2 - x2 (f [x2, x¡] - x la2) =5 - (-1)(0 - 1(1» =4 Calculando los denominadores de la ecuación 2.31 - al + (a2 1 - 4aOa2 ) 1/2 =O+ (O - 4(4)(1»1/2 =(_ 16)112 =4 j - al - (a2 1 - 4aOa2)1I7 =O- (O - 4(4)(1»1/2 =-{- 16)1/2 =- 4 j
  • 89. -----------------------------------------------------------------~-------- 76 Métodos numéricos aplicados a la ingeniería Como son de igual magnitud se usa cualquiera, por ejemplo 4j. Entonces: _ 2ao _ 2(4) _ 2 x3 - ------- -al + (a2¡ - 4aOa2)l!2 4j j al multiplicar numerador y denominador por j, queda 2 . 2' x 3 = -:- ..!.. = _J = - 2j J j -1 Hay que observar que aun cuando xo, x ¡ y x2 son números reales, x3 ha resultado un núme- ro complejo y además es la raíz buscada, lo cual resulta lógico, ya que la ecuación polino- mi"l es una parábola y el método de Müller consiste, en el caso n = 2, en usar una parábola pa- ra sustituir la función. La otra raíz es el complejo conjugado de x3 ' o sea 2j. Para realizar los cálculos de este ejemplo, puede usar el guión de Matlab dado en el ejemplo 2.13, con los valores iniciales xO = O; xl = 1; x2 = -1 Y los cambios correspon- dientes de la función. I A continuación se proporciona el algoritmo del método de Müller para el caso n = 2. Para encontrar una raíz real o compleja de la ecuaciónf(x) = O, incluir la funciónf(x) y los DATOS: Valores iniciales XO, Xl, X2; criterio de convergencia EPS, criterio de exactitud EPSI y núme- ro máximo de iteraciones MAXIT. La raíz aproximada X o un mensaje de falla.RESULTADOS: PASO 1. Hacer I = 1 PASO 2. Mientras I < MAXIT, repetir los pasos 3 a 7. PASO 3. Hacer FlO = (F(XI)-F(XO» / (XI-XO). F21 = (F(X2)-F(XI» / (X2-XI). F210 = (F21-FlO) / (X2-XO). A2 = F21O. Al = F21-(X2+XI)*A2. AO = F (X2)-X2*(F21-XI *A2). DI = -AI+(AI **2-4*AO*A2)**0.5. D2 = -AI-(AI **2-4* AO*A2)**0.5. PASO 4. Si ABS (DI) > ABS (D2) hacer X3 = 2*AOIDI En caso contrario hacer X3 = 2*AOID2. PASO 5. Si ABS (X3-XO) < EPS OABS (F (X3» < EPS1. IMPRIMIR X3 y TERMINAR. De otro modo, continuar. PASO 6. Hacer XO = Xl. Xl = X2 (actualización de valores iniciales). X2 =X3. PASO 7. Hacer I = I + 1. PASO 8. IMPRIMIR mensaje de falla: "EL MÉTODO NO CONVERGE A UNA RAíz" y TERMINAR. 76 Métodos numéricos aplicados a la ingeniería Como son de igual magnitud se usa cualquiera, por ejemplo 4j. Entonces: 2aox3 = ------"---- -al + (a2¡ - 4aOa2)l!2 al multiplicar numerador y denominador por j, queda 2(4) 4j 2 . 2' x3 =---:- ~ =_J =- 2j J j -1 2 j Hay que observar que aun cuando xo, x ¡ y x2 son números reales, x3 ha resultado un núme- ro complejo y además es la raíz buscada, lo cual resulta lógico, ya que la ecuación polino- mial es una parábola y el método de Müller consiste, en el caso n =2, en usar una parábola pa- ra sustituir la función. La otra raíz es el complejo conjugado de x3, o sea 2j. Para realizar los cálculos de este ejemplo, puede usar el guión de Matlab dado en el ejemplo 2.13, con los valores iniciales xO =O; xl = 1; x2 =-1 Ylos cambios correspon- dientes de la función. I A continuación se proporciona el algoritmo del método de Müller para el caso n =2. a: ID li ;" ;- ' .,4;... ''''.;ALGORITMO 2.6 Metodode Müller Para encontrar una raíz real o compleja de la ecuaciónf(x) = O, incluir la funciónf(x) y los DATOS: RESULTADOS: Valores iniciales XO, Xl, X2; criterio de convergencia EPS, criterio de exactitud EPSI y núme- ro máximo de iteraciones MAXIT. La raíz aproximada X o un mensaje de falla. PASO 1. Hacer I = l PASO 2. Mientras I < MAXIT, repetir los pasos 3 a 7. PASO 3. Hacer FlO = (F(XI)-F(XO» / (XI- XO). F21 = (F(X2)-F(XI» / (X2-XI). F210 = (F21-FlO) / (X2-XO). A2 = F21O. Al = F21-(X2+XI)*A2. AO = F (X2)-X2*(F21-XI *A2). DI = -AI+(AI **2-4*AO*A2)**0.5. D2 = -AI-(AI**2-4*AO*A2)**0.5. PASO 4. Si ABS (DI) > ABS (D2) hacer X3 = 2*AOIDI En caso contrario hacer X3 = 2*AOID2. PASO 5. Si ABS (X3-XO) < EPS OABS (F (X3» < EPSl. IMPRIMIR X3 y TERMINAR. De otro modo, continuar. PASO 6. Hacer XO = Xl. Xl = X2 (actualización de valores iniciales). X2 =X3. PASO 7. Hacer I = I + 1. PASO 8. IMPRIMIR mensaje de falla: "EL MÉTODO NO CONVERGE A UNA RAíz" y TERMINAR.
  • 90. Solución de ecuaciones no lineales 77 La siguiente sección puede omitirse sin pérdida de continuidad en el resto del material. 2.10 Polinomios y sus ecuaciones EVALUACiÓN DE POLlNOMIOS Método de Horner Se desea evaluar un polinomio p(x) en un valor particular de x. Por ejemplo, sea el poli- nomio p (x) = 4 .0 + 3 x3 - 2 x2 + 4 x - 8, (2.32) que se desea evaluar en x = 2. Factorícese x en los primeros cuatro términos p (x) = (4 x3 + 3 x2 -2 x + 4) x - 8 Dentro de los paréntesis, factorizar x en los primeros tres términos p (x) = «4 x2 + 3 x - 2) x + 4) x-8 Dentro de los paréntesis interiores, factorícese x en los primeros dos términos p (x) = ( ( (4 x + 3 ) x - 2) x + 4) x - 8 El método de Homer consiste en evaluar, secuencialmente, los paréntesis en esta expre- sión: Paso 1. Evaluar (4 x + 3) en x = 2: 4(2) + 3 =11 Paso 2. Evaluar ( (l1)x - 2) en x = 2: (11) 2 - 2 = 20 Paso 3. Evaluar ( (20) x + 4 ) enx = 2: (20) 2 + 4 = 44 Paso 4. Evaluar (44 ) x - 8 en x = 2: (44)2-8 = 80 Así, p (2) = 80. Este proceso puede llevarse a cabo sin las factorizaciones. Escribase P4 (x) = a4.0 + a3 x3 + a2 x2 + aJ x + ao Para la ecuación 2.32, a4 = 4, a3 = 3, a2 = -2, al = 4 Yao = -8 Conviene almacenar los valores intermedios de la evaluación de esta ecuación: 11, 20, 44 Y 80, como b3, b2, bl Ybo' respectivamente. Sea además, por conveniencia, b4 = a4 (= 4). Ahora dispónganse los coeficientes, el valor de x donde se desea evaluar el polinomio y b4 en la siguiente forma: x=2 4 3 -2 4 -8 En la columna de a3 , se desarrolla el paso 1: 4(2) +3 = 11. Esto puede verse como multipli- car b4 por el valor de x (= 2) Y sumar el producto a a3 . Llámese este resultado b3 . Esto es:
  • 91. ----~------------------------------~'"1'T----- 78 Métodos numéricos aplicados a la ingeniería x=2 4 (2) = 8 4 3 -2 4 -8 + En la columna de a2, se desarrolla el Paso 2: (11)2 - 2 = 20. Esto es, multiplíquese b3 por el valor de x (= 2) Ysúmese el producto a a2 . Llámese este resultado b2 . Lo anterior se ilus- tra así x=2 11(2) = 22 4 3 -2 4 -8 + b2 = 20 Repitiendo este proceso hasta calcular bo se tiene x=2 44(2) = 88 4 3 -2 4 -8 + + 20(2) = 40 b, = 4 El valor p (2) resulta en bo. b2 = 20 b¡ =44 bo = 80 Evalúe el polinomio enx = 3, mediante el método de Horner. Solución La no aparición de los términos en x4 y en x2 del polinomio significa que sus coeficientes son cero; para fines del método en estudio, dichos ceros deben aparecer en el arreglo Coeficientes de: Para Término xs x4 x3 x2 x independiente as = 1 a4 = O a3 =-4 a2 = O a¡ = 2 ao = 3 x=3 + + + + PAS 1(3) = 3 3(3) = 9 5(3) = 15 15(3) = 45 47(3) = 141 PAS bs = 1 b4 = 3 b3 = 5 b2 = 15 b, = 47 bo = 144 PA~ De aquí p (3) = 144.
  • 92. Solución de ecuaciones n o lineales 79 Se generaliza este método con polinornios de cuarto grado; sin embargo la extensión a cualquier grado, es inmediata. Así: x + + + + x x x x donde puede verse que: b4 = a4, esto es (2.33) Mediante una sustitución regresiva puede verse con claridad por qué p (x) = bo' Sustituyendo en bo = ao + blx a b, por al + bZX, se tiene: bo = ao + (al + b2x)x y ahora se reemplaza en la última expresión b2 con a2 + b3 x y así sucesivamente, con lo cual se obtiene: bo = ( ( (a4x + a3)x + a2)x + al)x + ao = p (x) Las ecuaciones 2.33 representan un algoritmo programable y, como se verá más adelante, de elevada eficiencia para evaluar un polinornio p (x) en algún valor particular de x. Se describe enseguida el algoritmo de Horner. ALGORITMO 2.7 Método de Horner Para evaluar el polinomio p (x) = a"x" + a,,_lx,,-1 + ... + a1x + ao proporcionar los DATOS: n: Grado del polinornio. a", all _ I, ... , ao: Coeficientes del polinornio. t: Valor de x en donde se desee evaluar p (x) p (t) en bo'RESULTADOS: PASO l. Hacer b" = «; PASO 2. Para k = n-l, n-2, ... , O realizar el paso 3. PASO 3. Hacer bk = bk+1 t + ak• PASO 4. IMPRIMIR bo' Solución de ecuaciones no lineales 79 Se generaliza este método con polinomios de cuarto grado; sin embargo la extensión a cualquier grado, es inmediata. Así: x x donde puede verse que: b4 = a4, b3 = a3 + b4x, esto es + x + + + x x Mediante una sustitución regresiva puede verse con claridad por qué p (x) =bo' Sustituyendo en bo = ao + blx a bl por al + b2x, se tiene: bo = ao + (al + b2x)x (2.33) y ahora se reemplaza en la última expresión b2 con a2 + b3x y así sucesivamente, con lo cual se obtiene: bo = ( ( (a4x + a3)x + a2)x + al)x + ao = p (x) Las ecuaciones 2.33 representan un algoritmo programable y, como se verá más adelante, de elevada eficiencia para evaluar un polinomio p (x) en algún valor particular de x. Se describe enseguida el algoritmo de Homer. ALGORITMO 2.7 Método de Horner Para evaluar el polinomio DATOS: RESULTADOS: PASO 1. Hacer bll = all p (x) = allx" + all_1x"-1+ ... + a,x + ao proporcionar los n: Grado del polinomio. all' a ll _ l ,· .. , ao: Coeficientes del polinomio. t: Valor de x en donde se desee evaluar p (x) p (t) en bo' PASO 2. Para k = n-l, n-2,..., Orealizar el paso 3. PASO 3. Hacer bk = bk+l t + ak• PASO 4. IMPRIMIR bo'
  • 93. 80 Métodos numéricos ap licados a la ingeniería Método de Horner iterado El método de Homer tiene otras características, que se analizarán enseguida. Tómese de nuevo el polinomio general de cuarto grado P4 (x) y divídase entre (x - t), donde t es un valor particular de x, lo que se expresa como: P4 (x) = (x - t) q (x) + R, (2.34) donde q (x) es el polinomio cociente (en este caso de tercer grado) y R una constante lla- mada residuo. Sustituyendo x con t se obtiene P4 (t) = R, de modo que el polinomio evaluado en un valor particular de x es igual al residuo R de la división, R = bo. Al derivar la ecuación 2.34 con respecto a x (recuérdese que t y R son constantes), se tiene: P4' (x) = (x - t)q' (x) + q (x) Haciendo x = t resulta (2.35) esto es, la derivada del polinomio P4 (x) evaluada en x = t es el cociente q (x) evaluado en t, toda vez que y en general (2.36) donde b4, b3 , b2 Yb, son los valores intermedios que resultan en la evaluación de P4 (x) en t por el método de Homer (véase Ej. 2.15). Así pues, si después de evaluar P4 (x) en t se desea evaluar también p,' (x) en t, puede aplicarse una vez más el método de Homer a los valores intermedios b4, b3, b2 Y bl' como se ilustra enseguida. E Sea P (x) = 3x3 - 4x - 1. Evalúe a) P (2) b) P' (2) Solución a) Para evaluar P (2), se tiene x=2 al ao -4 -1 + + 6(2) = 12 8(2) = 16 b¡ = 8 bo = 15 3 o + 3(2) = 6 y P (2) = 15. b) Como se dijo
  • 94. entre (x - t), (2.34) constante lla- al~do en un nst~ntes), se (2.35) evaluado en (2.36) deP4 (x) en 4 (x) en t se Horner a los Solución de ecuaciones no lineales 81 Para evaluar p' (2) se emplea de nuevo el método de Horner. Esto se logra eficiente- mente, repitiendo los pasos de los cálculos descritos; esto es bajo b3, b2 Y b, del arreglo anterior. Para almacenar los nuevos valores intermedios de esta evaluación se emplean e3 , e2 y e,. Nótese que como b, es el término independiente de p' (x), el proceso de evalua- ción termina una vez que se obtuvo e" y éste es el valor buscado de p' (2). x=2 3 a2 al ao O -4 -1 + + + 3 (2) = 6 6 (2) = 12 8 (2) = 16 b2 = 6 b, = 8 bo =15 + + 3 (2) =6 12 (2) = 24 e2 = 12 el = 32 x=2 De esto, p' (2) = 32. El lector puede verificar el resultado derivando p (x) y evaluando la derivada en x = 2. En la práctica, los cálculos suelen disponerse sin tantos comentarios. Evalúe 5x3 - 2x2 + 10 Y su primera derivada en x = 0.5 Solución 0.5 5 a2 al ao -2 O 10 + + + 2.5 0.25 0.125 b2 bl bo 0.5 0.25 10.125 + + 2.5 1.50 e2 l.3 1.75 0.5 5 De esto p (0.5) = 10.125 Yp' (0.5) = 1.75. En este punto conviene presentar el algoritmo de Horner iterado para evaluar un polino- mio y su primera derivada en un valor t.
  • 95. 82 Métodos numéricos aplicados a la ingeniería ALGORITMO 2.8 Método de Horner iterado Para evaluar el polinomio p (x) = anx" + an_Ix"-1 + ... + alx + ao y su primera derivada p' (x) en x = t, proporcionar los DATOS: n: Grado del polinomio, an, an_l, ... , ao: Coeficientes del polinomio. t: Valor de x en donde se desea evaluar p (x) y p' (x). p (t) en bo y p' (t) en el'RESULTADOS: PASO l. Hacer bn = an y en = bn· PASO 2. Para k = n-l, n-2, ... , 1 realizar los pasos 3 y 4. PASO 3. Hacer bk = bk+1 t + ak. PASO 4. Hacer ek = ek+1 t + bk. PASO 5. Hacer bo = bit + ao' PASO 6. IMPRIMIR bo y eI: CUENTA DE OPERACIONES Si bien la implementación del método de Horner en una computadora es una de sus ven- tajas, no lo es menos su eficiencia, que se verá a continuación, contando las operaciones en el método de evaluación usual y comparando su número con el del método de Horner. Tomando de nuevo el polinomio general de cuarto grado P4 (x) = a4x4 + a3 x3 + a2 x2 + a¡ x + aa a) Método usual a4x4 requiere cuatro multiplicaciones a3 x3 requiere tres multiplicaciones a2 x2 requiere dos multiplicaciones a¡x requiere una multiplicación a4x4 + a3x3 + a2x2 + alx + aa necesita cuatro sumas/restas. En total se realizan 10 multiplicaciones y cuatro sumas/restas. b) Método de Horner »,= a4 b3 = b4 X + a3 b2 = b3 X + a2 b, = b2 X + a¡ ba = b, x + aa Se requiere una multiplicación y una suma para cada b. En total cuatro multiplicaciones y cuatro sumas/restas. Hay una reducción de 60% en el número de multiplicaciones requeridas y, consecuen- temente, un error de redondeo menor. Eje 82 Métodos numéricos aplicados a la ingeniería ALGORITMO 2.8 Método de Horner iterado Para evaluar el polinomio p (x) = all:;;" + al _lx"- 1 + ... + a¡x + ao y su primera derivada p' (x) en x = t, proporcionar los DATOS: RESULTADOS: n: Grado del polinomio, all' all_l , •• •, ao: Coeficientes del polinomio. 1: Valor de x en donde se desea evaluar p (x) y p' (x). p (t) en bo y p' (t) en el' PASO 1. Hacer bn = all y ell = bn· PASO 2. Para k = n-l, n- 2,... , 1 realizar los pasos 3 y 4. PASO 3. Hacer bk = bk+1 t + ak• PASO 4. Hacer ek = ehl t + bk . PASO 5. Hacer bo= bIt + ao' PASO 6. IMPRIMIR boy el' CUENTA DE OPERACIONES Si bien la implementación del método de Horner en una computadora es una de sus ven- tajas, no lo es menos su eficiencia, que se verá a continuación, contando las operaciones en el método de evaluación usual y comparando su número con el del método de Horner. Tomando de nuevo el polinomio general de cuarto grado P4 ex) =a4x4 + a3 x3 + a2 x2 + a¡ x + ao a) Método usual a4 x4 requiere cuatro multiplicaciones a3x3 requiere tres multiplicaciones a2x2 requiere dos multiplicaciones a¡x requiere una multiplicación a4x4 + a3x3 + a2x2 + a lx + aonecesita cuatro sumas/restas. En total se realizan 10 multiplicaciones y cuatro sumas/restas. b) Método de Horner b4 = a4 b3 =b4 X + a3 b2 = b3 X + a2 bl = b2 X + a¡ bo= b¡ x + ao Se requiere una multiplicación y una suma para cada b. En total cuatro multiplicaciones y cuatro sumas/restas. Hay una reducción de 60% en el número de multiplicaciones requeridas y, consecuen- temente, un error de redondeo menor.
  • 96. Solución de ecuaciones no lineales 83 A continuación se verá una aplicación del método de Homer en la búsqueda de raíces reales de ecuaciones de la formaf(x) = O, dondef(x) es un polinomio de grado n. Combinando las ecuaciones 2.34 y 2.36 Y el resultado R = bo. f(x) = (x - t) (b4x3 + b3 x2 + b2x + b¡) + bo y como f (t) = bo' f(x) = (x - t) (b4x3 + b3x2 + b2x + b¡) +f(t) Si t es una raíz de f (x) = O, se tiene f (t) = O Y la expresión resultante f(x) = (x - t) (b4x3 + b3x2 + b~ + b¡) indica que x = t es una raíz (lo cual ya se sabía), pero lo más importante es que las raíces restantes de f (x) = O son las raíces de b4x3 + b3x2 + b~ + b¡ = O, (2.37) una ecuación polinomial de tercer grado y, por tanto, más fácil de manejar que la ecuación original; además, sus coeficientes son los valores ya citados b4' b3 , b2 Y b ¡. Si se sospecha que la raíz t se repite (es decir t es raíz de la ecuación 2.37), véase el valor de e¡ del método de Homer iterado, ya que éste será muy cercano a cero si así fue- ra; esto es p' (t) = O en ese caso. Ahora, desarróllese el método de Newton-Raphson con el método de Homer iterado, llamado método de Birge- Vieta. RAíCES DE UNA ECUACiÓN POLlNOMIAL Pn(x) = O Método de Birge-Vieta" De los métodos vistos para encontrar raíces, el de Newton-Raphson resulta el más adecua- do para ser empleado en conjunción con el método de Homer iterado. Se resuelve a con- tinuación un ejemplo con esta combinación. Aproxime las raíces reales del polinomio p (x) = 4x4 + 3x3 - 2x2 + 4x - 8 Solución PASO 1. Al analizar gráficamente la función se advierte que tiene dos raíces reales, una alrededor de 1, y la otra alrededor de -2. PASO 2. Se elige O como valor inicial para encontrar la primera raíz. PASO 3. Con el método de Homer bo = -8 Y e¡ = 4 PASO 4. Con el método de Newton-Raphson t¡ = to - bofe¡ = O- (-8) /4 = 2 PASO 5. Al repetir los pasos 3 y 4 se tiene t2 t¡ bofe¡ 2 - 8/16 = 1.5 t3 t2 bofe¡ 1.5 - 23.875/72.25 = 1.1696 t4 t3 bo/e¡ 1.1696 - 6.2258/37.2287 = 1.0023 * Este método también se conoce como Newton-Raphson-Horner.
  • 97. 84 Métodos numéricos aplicados a la ingeniería Este proceso converge al valor 0.9579 PASO 6. Se toma 0.9579 como primera raíz del polinomio. PASO 7. El polinomio de menor grado que se obtiene con esta raíz conduce a p (x) = 4x3 + 6.831315x2 + 4.5435x + 8.3518 PASO 2. Se elige nuevamente O como valor inicial para encontrar la segunda raíz. PASO 3. Con el método de Horner bo = 8.3518 Y e, = 4.5435 PASO 4. Con el método de Newton-Raphson t[ = to - bofe, = O- 8.3518/4.5435 = -1.8382 PASO 5. Al repetir los pasos 3 y 4 se tiene 11 t2 = t, - bofe, = -1.8382 - (-1.7623) /19.9772 = -U500 t3 = t2 - bofe¡ = -1.7500 - (-1.1575) /17.3841 = -1.7434 Este proceso converge al valor -1.7433 PASO 6. Se toma -1.7433 como segunda raíz del polinomio. PASO 7. El polinomio disminuido con esta raíz conduce a p (x) = 4x2 - 0.141885x + 4.79085 Que tiene las raíces: 0.01774 ± 1.09426j Matlab posee una función que calcula to- das las raíces de ecuaciones polinornia- les, suministrando los coeficientes del polinomio. Para este caso la instrucción quedaría: La calculadora TI-92 Plus también obtie- ne estas raíces; las reales las obtiene con la instrucción Roots([4 3 -2 4 -8]) y las complejas con y se obtiene como respuesta: ans = -1.74332500029465 0.01773561271143 + 1. 09425660030108i 0.01773561271143 - 1.09425660030108i 0.95785377487178 En el CD se encuentra el PROGRAMA 2.1 para este algoritmo. En cada etapa se ha calculado una aproximación a cada una de las raíces reales de p (x) = O; conforme se avanza en las etapas, los coeficientes b" b2, ... , », de cada etapa se alejan de los valores verdaderos, debido a la propagación de errores, y las aproximaciones a las raíces correspondientes también son más inexactas. Para disminuir la pérdida de Eje 84 Métodos numéricos aplicados a la ingeniería Este proceso converge al valor 0.9579 PASO 6. Se toma 0.9579 como primera raíz del polinomio. PASO 7. El polinomio de menor grado que se obtiene con esta raíz conduce a p (x) = 4x3 + 6.831315x2 + 4.5435x + 8.3518 PASO 2. Se elige nuevamente Ocomo valor inicial para encontrar la segunda raíz. PASO 3. Con el método de Horner bo=8.3518 Ye, =4.5435 PASO 4. Con el método de Newton-Raphson t[ =to- bofe, =O- 8.3518/4.5435 =- 1.8382 PASO 5. Al repetir los pasos 3 y 4 se tiene t2 =t, - bofe, =-1.8382 - (-1.7623) /19.9772 =-1.7500 t3 =t2 - bofe, =-1.7500 - (-1.1575) / 17.3841 =-1.7434 Este proceso converge al valor -1.7433 PASO 6. Se toma -1.7433 como segunda raíz del polinomio. PASO 7. El polinomio disminuido con esta raíz conduce a p (x) = 4x2 - 0.141885x + 4.79085 Que tiene las raíces: 0.01774 ± 1.09426j Matlab posee una función que calcula to- das las raíces de ecuaciones polinomia- les, suministrando los coeficientes del polinomio. Para este caso la instrucción quedaría: Roots([4 3 -2 4 -8]) y se obtiene como respuesta: ans = -1 .74332500029465 0.01773561271143 + 1 . 09425660030108i 0 . 01773561271143 - 1. 09425660030108i 0 . 95785377487178 La calculadora TI-92 Plus también obtie- ne estas raíces; las reales las obtiene con la instrucción y las complejas con En el CD se encuentra el PROGRAMA 2.1 para este algoritmo. En cada etapa se ha calculado una aproximación a cada una de las raíces reales de p (x) =O; conforme se avanza en las etapas, los coeficientes b" b2, . . . , bn de cada etapa se alejan de los valores verdaderos, debido a la propagación de errores, y las aproximaciones a las raíces correspondientes también son más inexactas. Para disminuir la pérdida de
  • 98. Solución de ecuaciones no lineales 85 exactitud se ha sugerido trabajar primero con la raíz más pequeña en valor absoluto, lue- go con la raíz real restante más pequeña en magnitud, y así sucesivamente. (2.40) Método de Lin * En 1941, S.N. Lin publicó un procedimiento que se fundamenta en el resultado y en que si t es una raíz de P« (x) = O, entonces: R = O = bIt + ao o t = - arJb, (t) (2.38) Se ha escrito b¡ (t) en lugar de b ; para hacer énfasis en que el valor de b, (y de las demás b) depende del valor t donde se evalúa f (x) y así ver el lado derecho de la ecuación 2.38 como una función de t. Lo que puede escribirse como: ~ t = - arJb, (t) = g (t) (2.39) Y se le puede aplicar el método de punto fijo, empezando con un valor inicial to cercano a la raíz t, de modo que: Restando en ambos lados to o y se obtiene el algoritmo de Lin. Este método no requiere el cálculo de las e como el de Birge- Vieta, por lo que el trabajo por iteración se reduce a la mitad. Esta reducción contras- ta con un orden bajo de convergencia y la inestabilidad propia del método de punto fijo. Ejemplo 2.19 Encuentre una raíz real de la ecuación .0 -.3x3 + 2x -1 = O, con el método de Lin y un valor inicial to = 2.8 Solución Primera iteración R ( 2.8 ) = 0.2096; b¡ (2.8) = 0.432; t¡ = to - R (to) / b, (to) = 2.8 - 0.2096 / 0.432 = 2.3148 • En el capítulo 4 se desarrolla el método de Bairstow. Solución de ecuaciones no lineales 85 exactitud se ha sugerido trabajar primero con la raíz más pequeña en valor absoluto, lue- go con la raíz real restante más pequeña en magnitud, y así sucesivamente. Método de Lin* En 1941, S.N. Lin publicó un procedimiento que se fundamenta en el resultado R =f(t) = bo = bit + ao y en que si t es una raíz de PI1 (x) = O, entonces: R =O=bit + ao o t = - arJb, (t) (2.38) Se ha escrito b¡ (t) en lugar de b l para hacer énfasis en que el valor de b¡ (y de las demás b) depende del valor t donde se evalúaf (x) y así ver el lado derecho de la ecuación 2.38 como una función de f. Lo que puede escribirse como: '~ t = - arJb, (t) = g (t) (2.39) y s'e-ie puede aplicar el método de punto fijo, empezando con un valor inicial tocercano a la raíz t, de modo que: Restando en ambos lados to o (2.40) y se obtiene el algoritmo de Lin. Este método no requiere el cálculo de las e como el de Birge-Vieta, por lo que el trabajo por iteración se reduce a la mitad. Esta reducción contras- ta con un orden bajo de convergencia y la inestabilidad propia del método de punto fijo. Ejemplo 2.19 Encuentre una raíz real de la ecuación x4 -3x3 + 2x -1 = O, con el método de Lin y un valor inicial fo = 2.8 Solución Primera iteración R ( 2.8 ) =0.2096; b¡ (2.8) = 0.432; t i =to - R (to) / b, (to) =2.8 - 0.2096 / 0.432 =2.3148 • En el capítulo 4 se desarrolla el método de Bairstow.
  • 99. 86 Métodos numéricos aplicados a la ingeniería Segunda iteración R (2.3148) = -4.8692; bl (2.3148) = -1.6715; t2 = ti - R (ti) / b, (ti) = 2.3148 - (-4.8692) / (-1.6715) = -0.5983 Al continuar las iteraciones se advierte que el método es inestable y no llega a la raíz 2.78897. I La estabilidad" del método puede mejorarse en una raíz xk' si se conoce una buena apro- ximación a xk . Para esto se incorpora el parámetro A a la ecuación 2.40 de Lin y queda R ti = to - A- bl donde: A=- feO) to!' (to) Con to = 2.8, A = 0.018555 Y la fórmula modificada de Lin, en general es R t=t-A- bl (2.41) Ejemplo 2.20 Con la fórmula modificada de Lin, aproxime una raíz real de la ecuación f(x) =.0 - 3x3 + 2x -1 = O, use como valor inicial to = 2.8 Solución feO) = -1; t'(2.8) = 19.248 A = - (-1) / 2.8 / 19.248 = 0.018555 Primera iteración R ( 2.8 ) = 0.2096; bl (2.8) = 0.432; ti = to - A R (to) / b, (to) = 2.8 - 0.018555 (0.2096) /0.432 = 2.791 Segunda iteración R (2.791) = 0.03808; », (2.791 ) = 0.37194; t2 = ti - A R (tI) / bl(tl) = 2.791 - 0.018555 (0.03808) / (0.37194) = 2.7891 Al continuar las iteraciones se encuentra la raíz 2.78897 * Hildebrand. lntroduction to Numerical Analysis. McGraw Hill, 2a. Ed., pp. 591-595. 86 Métodos numéricos aplicados a la ingeniería Segunda iteración R (2.3148) =-4.8692; bl (2.3148) =- 1.6715; t2 = ti - R (ti) / b l (ti) = 2.3148 - (-4.8692) / (-1.6715) = -0.5983 Al continuar las iteraciones se advierte que el método es inestable y no llega a la raíz 2.78897. I La estabilidad* del método puede mejorarse en una raíz xk' si se conoce una buena apro- ximación a xk. Para esto se incorpora el parámetro Aa la ecuación 2.40 de Lin y queda donde: R ti = to- A- bl A=- feO) to!' (to) Con to= 2.8, A= 0.018555 Yla fórmula modificada de Lin, en general es R t = t-A- bl (2.41) Ejemplo 2.20 Con la fórmula modificada de Lin, aproxime una raíz real de la ecuación Solución f(x) =.0 - 3x3 + 2x -1 = O, use como valor inicial to=2.8 feO) = -1 ; !' (2.8) = 19.248 A= - (-1) / 2.8 / 19.248 = 0.018555 Primera iteración R ( 2.8 ) = 0.2096; bl (2.8) = 0.432; ti = to- AR (to) / b¡ (to) = 2.8 - 0.018555 (0.2096) / 0.432 = 2.791 Segunda iteración R (2.791) = 0.03808; b¡ (2.791 ) = 0.37194; t2 = ti - AR (tI) / b¡(t¡) = 2.791 - 0.018555 (0.03808) / (0.37194) =2.7891 Al continuar las iteraciones se encuentra la raíz 2.78897 * Hildebrand. Introduction fo Nurnerical Analysis. McGraw Hill, 2a. Ed., pp. 591-595.
  • 100. Solución de ecuaciones no lin eales 87 Los métodos anteriores son válidos para raíces reales y complejas. Sin embargo, para las segundas deberá inicializarse con un número complejo y llevar a cabo las operaciones complejas correspondientes. Cuando los coeficientes de P" (x) = Oson reales, las raíces com- plejas aparecen en pares conjugados x k = a + bj, X k+¡ = a - bj, lo que se puede aprovechar buscando en P, (x) = O el factor cuadrático (x - x k) (x - x k+l) = x2 - 2ax + (a2 + b2) de coeficientes reales que genera X k YX k+! Factores cuadráticos. Método de Lin Sea el polinomio f(x) = xn + an_¡x,,-l + ... + a2x2 + a¡x + aa Si an no es uno,f(x) puede dividirse entre a" para obtener la ecuación 2.42. Al dividir la ecuación 2.42 entre la expresión cuadrática x2 + px + q f (x) = x" + an_¡xn-¡ + ... + a2x2 + a¡x + aa = (x2 + px + q) (xn-2 + bn_3 xn-3 + ... + b¡x + ba) + Rx + S, (2.42) (2.43) (2.44) donde Rx + S es el residuo lineal de la división, y R Y S dependen de p y q. Para que la ecuación 2.43 sea un factor cuadrático de la 2.42 (es decir, que la divida exactamente) es necesario que el residuo lineal sea cero o simbólicamente que R (p, q) = O S (p, q) = O (2.45)y De donde nuestro objetivo será encontrar p y q, tales que se cumplan las ecuaciones 2.45. Conviene tener un método que permita calcular R y S sin verificar la división de la 2.42 por la 2.43. Para obtenerlo, se igualan los coeficientes de las mismas potencias de x en los dos miembros de la ecuación 2.44 a,,_¡ = b"_3 + P an_2 bn-4 + p b"_3 + q an _ 3 bn_ 5 + p bn-4 + q bn_ 3 (2.46) a¡ = p ba + q b, + R aa = q ba + S Despejando bk de la expresión general (usando para ello ak+2 = bk + P bk+¡ + q bk+2) se ob- tiene para k = n-3, n-4, ... , O (2.47) con (2.48)y Solución de ecuaciones no lineales 87 Los métodos anteriores son válidos para raÍCes reales y complejas. Sin embargo, para las segundas deberá inicializarse con un número complejo y llevar a cabo las operaciones complejas correspondientes. Cuando los coeficientes de Pn (x) = Oson reales, las raíces com- plejas aparecen en pares conjugados x k = a + bj, X k+¡ = a - bj, lo que se puede aprovechar buscando en P" (x) = Oel factor cuadrático (x - x k) (x - x k+ 1) =x2 - 2ax + (a2 + b2) de coeficientes reales que genera X k YX k+! Factores cuadráticos. Método de Lin Sea el polinomio ¡(x) = xn + an_¡xn-I + ... + a2x2 + a )x + aa Si an no es uno,f(x) puede dividirse entre an para obtener la ecuación 2.42. Al dividir la ecuación 2.42 entre la expresión cuadrática X2 + px + q ¡(x) =Xl + an_)xn- ) + ... + a2x2 + a)x + aa =(x2 + px + q) (xn - 2 + bn _ 3xn-3 + ... + b¡x + ba ) + Rx + S, donde Rx + S es el residuo lineal de la división, y R YS dependen de p y q. (2.42) (2.43) (2.44) Para que la ecuación 2.43 sea un factor cuadrático de la 2.42 (es decir, que la divida exactamente) es necesario que el residuo lineal sea cero o simbólicamente que R (p, q) = O y S (p, q) = O (2.45) De donde nuestro objetivo será encontrar p y q, tales que se cumplan las ecuaciones 2.45. Conviene tener un método que permita calcular R y S sin verificar la división de la 2.42 por la 2.43. Para obtenerlo, se igualan los coeficientes de las mismas potencias de x en los dos miembros de la ecuación 2.44 all _¡ = bn_3 + p an_2 bn-4 + p bll _ 3 + q an_3 bn_5 + p bn-4 + q bn _ 3 a¡ = p ba + q b¡ + R aa = q ba + S (2.46) Despejando bk de la expresión general (usando para ello ak+2 =bk + p bk+) + q bk+2) se ob- tiene para k = n-3, n-4,... , O (2.47) con y (2.48)
  • 101. 88 Métodos numéricos aplicados a la ingeniería el algoritmo buscado para obtener los coeficientes del polinomio cociente de la 2.44 y además R = a¡ - p ba - q b¡ S = aa - qba Al emplear las condiciones de la ecuación 2.45 a¡ - p ba - q b¡ = O aa - q ba = O se pueden obtener, despejando, valores de p y q para formar una nueva expresión 2.43, qui- zás más cercana al factor cuadrático que andamos buscando. El método de Lin consiste en: (2.49) (2.50) (2.51) PASO l. Proponer aproximaciones iniciales de los valores desconocidos p y q (pueden llamarse Pa y qa)' PASO 2. Emplear las ecuaciones 2.47 para obtener aproximaciones de bll _ 3, bn-4'" , b¡, ba. PASO 3. Calcular R y S. Si son cero o suficientemente cercanas a éste, el problema está terminado. En caso contrario, se estiman nuevos valores de P y q (pueden llar- marse e, y q¡) y para volver al paso 2. Encuentre los factores cuadráticos de la ecuación polinomial de grado cuatro f (x) = .0 - 8x3 + 39x2 - 62x + 50 = O Solución PASO 1. PASO 2. Se propone P = O Y q = O. b3 = O; b2 =1; b¡ = a3 - P b2 - q b3 = -8; R = a¡ - P ba - q b ; = -62PASO 3. ba = a2 - p b, - q b2 = 39. S = aa - q ba = 50 a - q b -62 p¡ = ¡ ¡ =--=-1.5897; ba 39 q¡ = aa / ba = 50/39 = 1.2821 Al repetir los pasos 2 y 3 se encuentra la siguiente sucesión de valores: p q R S -1.9358 1.8164 -10.0204 14.7086 -2.0109 1.9708 -1.4494 3.9l71 -2.0090 2.0011 0.0469 0.7586 -2.0034 2.0030 0.l396 0.0458 -2.0009 2.00l3 0.0632 -0.0410 -2.0001 2.0004 0.0187 -0.0235
  • 102. Solución de ecuaciones no lineales 89 44 Y Por lo que el factor cuadrático es .49) .sO) Para llevar a cabo los cálculos que se muestran en la tabla anterior, puede usar Matlab o la TI-92 Plus. .s1) ) qui- % Método de Lin format short % Datos n=5; a=[50 -62 39 -8 1J; p=0; q=0; b(n-1)=0; b(n-2)=1; i=l; R=l; S=l; whiIe or (and(abs(R»=O.Ol,abs(S»=O.Ol),i>lO) for L=l: n-3 k=n-L-2; b(k)=a(k+2)-Ff-b(k+l)-q*b(k+2); end R=a(2) -Ff-b (1) -q"b (2) ; S=a(1) -q*b (1) ; p= (a (2) -q*b (2)) /b (1); q=a (1) /b (1) ; disp ([p,q,R,SJ) i=i+l; end den , bo' está llar- e2_21( ) Prgm 5->n : so-ein -62->a[2J 39--+a[3J: -8->a[4J 1->a[5J : o-un, : ()-->b[2J 1->b[n-2J O+bl n-L] ()-->p : O+q l->i: Lr+r : I+s : CIrIO Disp" p q R S" Loop For L, 1, n-3 tr-Ir-Zr+k: a [k+2J -p'b [k+1J-q"b [k+2J->b [kJ EndFor a[2J-Ff-b[lJ-cf'b [2J->r a[lJ-clb[lJ->s (a [2J -q*b[2J) /b[lJ->p a[lJ/b[lJ->q format (p, "f4") s" "&format (q, "f4") &" "r+d d&fo:anat(r, "f4")&" "&format(s,"f4") ->d Disp d If abs(r)<.Ol or abs(s)<.Ol Exit EndLoop EndPrgm Solución de ecuaciones no lineale s 89 Por lo que el factor cuadrático es Para llevar a cabo los cálculos que se muestran en la tabla anterior, puede usar Matlab o la TI-92 Plus. % Método de Lin fonnat short % Datos n=5; a=[50 -62 39 -8 lJ; p=0; q=0; b(n-l)=O; b(n-2)=1; i=l; R=l; S=l; while or (and(abs(R»=O.Ol,abs(S»=O.Ol),i>lO) for L=l: n-3 k=n-L-2; b(k)=a(k+2)-¡f-b(k+l)-q*b(k+2); end R=a (2) -¡f-b (1) -q"'b (2) ; S=a (1) -cfb (1) ; p= (a (2) -cfb (2)) lb (1); q=a (1) lb (1) ; disp ([p,q,R,SJ) i=i+l; end e2_2l( ) Prgm 5->n : 50->a[lJ 1->a[5J : O->b[lJ O->b[n-l] -62->a[2J : O->b[2J 39->a[3J : -8->a[4J 1-+b[n-2J O->p : O->q l->i: l->r : l->s : ClrIO Disp" p q R S" Loop For L, 1, n-3 n-L-2->k a [k+2J -p~b [k+lJ -q""b [k+2J->b [kJ EndFor a [2J -¡f-b[lJ -cfb [2J->r a[lJ-cfb[lJ->s (a [2J -cfb[2J) Ib[lJ-+p a[lJ/b[lJ->q fonnat (p, "f4") &" "&fonnat (q, "f4") &" "->d d&fo.rmat (r, "f4") &" "&fonnat (s, "f4") ->d Disp d If abs(r)<.Ol or abs(s)<.Ol Exit EndLoop EndPrgm
  • 103. 90 Métodos numéricos aplicados a la ingeniería Ejercicios / 6 32 2.1 La ecuación de estado de Van der Walls para un gas real es: a ( P + V2)( V - b ) = RT (1) donde: P = presión en atm T = temperatura en K R = constante universal de los gases en atm-L / (gmol K) = 0.08205 V = volumen molar del gas en L/gmol a, b = constantes particulares para cada gas Para los siguientes gases, calcule Va 80°C para presiones de 10,20, 30 Y 100 atm. Gas a b C02 3.599 0.04267 Dimetilarnina 37.49 0.19700 He 0.03412 0.02370 Óxido nítrico 1.34 0.02789 Solución La ecuación 1 también puede escribirse como pV3 - bPV2 - RTV2 + a V - a b = O (2) que es un polinornio cúbico en el volumen molar V; entonces, para una P y una T dadas, puede escribirse como una función de la variable V f(V) = p V3 - (P b + R T) V2 + a V - a b = O (3) Esta ecuación se resuelve con el método de posición falsa para encontrar el volumen molar. VALORES INICIALES El PROGRAMA 2.2 del CD realiza los cálculos necesarios para resolver esta ecuación, usan- do como intervalo inicial: VI = 0.8 v y VD = 1.2 v, donde v = RT / P, el volumen molar ideal. (Se resuelve sólo el caso del CO2 a 10 atm y 80°C, dejando como ejercicio para el lector los demás casos.) Los valores obtenidos para las diferentes iteraciones son los siguientes:
  • 104. Solución de ecuaciones no lineales 91 iteración VM (L/ gmol) If(V M) I 1 2.603856 0.1362 X 102 2 2.734767 0.5711 X 101 3 2.785884 0.2141 X 101 4 2.804528 0.7685 5 2.811156 0.2716 6 2.813489 0.9546 X 10-1 7 2.814309 0.3348 X 10-1 8 2.814596 0.1173 X 10-1 9 2.814697 0.4113 X 10-2 10 2.814732 0.1441 X 10-2 11 2.814744 0.5050 X 10-3 12 2.814749 0.1769 X 10-3 13 2.814750 0.6200 X 10-4 Se utilizó el criterio de exactitud If(V) I < 10-4 aunque puede verse que desde la iteración 7, el cambio en los valores de VM son solamen- te en la cuarta cifra decimal, que en este caso representan décimas de mililitro. Resultado: el volumen molar del CO2 a una presión de 10 atm y una temperatura de 80°C (= 353.2 K) es 2.81475 Llgmol. Los cálculos pueden realizarse con el siguiente guión de Matlab: P=10; R=O.08205; ~80+273.2; a=3.599; b=O.04267; v-=R"'T/P; vi=O.8*v; vd=l.2*v; Eps=O.OOOl; fi=F"vi "3- (F"b+R"T}*vi "2+a*vi -a*b; fd=pI'vd" 3- (F"b+R"'T)*vd"2+a*vd-a* b; fm=l; k=O; while abs (fm) > Eps k=k+l; vm=(vi*fd-vd*fi)/(fd-fi); fm=pI'vm"3- (pI'b+R"T) vm"2+a*vm-a*b; fprintf ('%3d %8.6f %8. 4en' .k, vm,abs (fm)) if fd*fm > O vd=vm; fd=fm; else vi=vm; fi=fm; end end
  • 105. 92 Métodos numéricos aplicados a la ingeniería También puede resolverse este problema con la función fzero de Matlab, para lo cual es necesario escribir la siguiente función y grabarla en el área de trabajo de Matlab con el nombre Vander.m: function f=Vander (V) P=lO; R=0.08205; T=80+273.2; a=3.599; b=0.04267; f=P*V/3- (P*b+R*T) *V/2+a*V-a*b; Ahora use: P=10; R=0.08205; T=80+273.2; fzero ('Vander', R*T/P) -- ~. En este caso el resultado que proporciona Matlab es: ans = 2.8148 Dado que la función de este problema es un polinornio de tercer grado en el volumen, tam- bién puede usarse la función roots que calcula todas las raíces de un polinornio. Para ello use el guión que se proporciona enseguida: P=10; R=0.08205; T=80+273.2; a=3:599; b=0.04267; roots ( [P - (P*b+R*T) a -a*b] En este caso el resultado que proporciona Matlab es: ans = 2.8148 0.0630 + 0.0386i 0.0630 - 0.0386i Dado que el polinornio es de tercer grado, siempre tendremos tres raíces. Las posibilida- des matemáticas son: tres raíces reales distintas, tres raíces reales iguales, dos raíces rea- les iguales y una distinta, una raíz real y dos complejas conjugadas. En cada uno de estos casos, ¿cuál de las tres correspondería al volumen buscado y qué significado tendrían las dos restantes? En el caso de la TI-92 Plus puede usar: Al usar Solve (10vA3-(.4267+. 08205*353.2) vA2+3.5Q9v-3.599*. 04267= O,v) se obtiene: v=2.81475 y al usar cSolve(10vA3-(.4267+.08205*353.2)vA2+3.599v-3.59~'.04267=0, v) se obtiene: v=.062962+.038622i or v=.062962-.038622i or v=2.81475 92 Méto dos n u méricos aplicados a la ingeniería También puede resolverse este problema con la función fzero de Matlab, para lo cual es necesario escribir la siguiente función y grabarla en el área de trabajo de Matlab con el nombre Vander.m: Ahora use: function f=Vander (V) P=10; R=0.08205; T=80+273.2; a=3.599; b=0.04267; f=P*V/ 3- (P*b+R*T) *V/2+a*V-a*b; P=10; R=0.08205; T=80+273.2; fzero ( 'Vander', R*T/P)-- -. En este caso el resultado que proporciona Matlab es: ans = 2.8148 Dado que la función de este problema es un polinomio de tercer grado en el volumen, tam- bién puede usarse la función roots que calcula todas las raíces de un polinomio. Para ello use el guión que se proporciona enseguida: P=10; R=0.08205; T=80+273.2; a=3 : 599; b=0.04267; roots ( [P - (P*b+R*T) a -a*b] ) En este caso el resultado que proporciona Matlab es: ans = 2.8148 0.0630 + 0.0386i 0.0630 - 0.0386i Dado que el polinomio es de tercer grado, siempre tendremos tres raíces. Las posibilida- des matemáticas son: tres raíces reales distintas, tres raíces reales iguales, dos raíces rea- les iguales y una distinta, una raíz real y dos complejas conjugadas. En cada uno de estos casos, ¿cuál de las tres correspondería al volumen buscado y qué significado tendrían las dos restantes? En el caso de la TI-92 Plus puede usar: Al usar Solve (10vA3-(.4267+. 08205*353.2) v A2+3.5Q9v-3.599*. 04267=O, v) se obtiene: v=2.81475 y al usar cSolve(10vA3- (.4267+.08205*353.2)vA2+3.599v-3.59~'.04267=0, v) se obtiene: v=.062962+.038622i or v=.062962-.038622i or v=2.81475
  • 106. .:;0cual con el ,tam- . Para ilida- s rea- estos las E 93Solución de ecuaciones no lineales 2.2 La fórmula de Bazin para la velocidad de un fluido en canales abiertos está dada por: v = c (re)l/2 con 87 c=------ m 0.552+-- (r)I/2 donde: m = coeficiente de rugosidad r = radio hidráulico en pies (área dividida entre el perímetro mojado) e = pendiente de la superficie del fluido v = velocidad del fluido en pies/segundos Calcule el radio hidráulico correspondiente a los siguientes datos (dados en unidades con- sistentes) por el método de Steffensen. m = 1.1; e = 0.001; v=5 Solución 87 (re)I/2 Sustituyendo c en v: v = ------ m 0.552+-- (r)I/2 o bien m (0.552 + --) v = 87 (r)I/2 (e)l/2 (r) l/2 multiplicando ambos lados por (r)I/2 [0.552(r)l/2 + m] v = 87 (e)I/2r y "despejando" r se llega a: [0.552(r)I/2 + m] v r=------- 87 (e)l/2 una de las formas de g (r) = r, necesaria para el método de Steffensen. Sin embargo, antes de usar el método, conviene averiguar el comportamiento de g' (r) , 0.552 v g (r)= 174 (r) 112 (e) 1/2 sustituyendo valores: , 0.5 g (r) = (r)l/2 Como el radio hidráulico debe ser mayor de cero, ya que un valor negativo o cero no ten- dría significado físico y como Ig' (r) I < 1 para (r)l/2 > 0.5, o r » 0.7, se selecciona como valor inicial de raLO. Con esto: g' (1) = 0.5 Solución de ecuaciones no lineales 93 2.2 La fórmula de Bazin para la velocidad de un fluido en canales abiertos está dada por: v = c (re)l/2 Solución con 87 c= - - - - - - m 0.552+-- (r)I/2 donde: m = coeficiente de rugosidad r = radio hidráulico en pies (área dividida entre el perímetro mojado) e = pendiente de la superficie del fluido v =velocidad del fluido en pies/segundos Calcule el radio hidráulico correspondiente a los siguientes datos (dados en unidades con- sistentes) por el método de Steftensen. o bien m = 1.1; e =0.001; v = 5 87 (re)I/2 Sustituyendo c en v: v = - - - - - - m 0.552 +-- (r)I/2 m (0.552 + - - ) v = 87 (r)I /2 (e)1I2 (r) 1/2 multiplicando ambos lados por (r)I/2 [0.552(r)1I2 + m] v = 87 (e)I/2r y "despejando" r se llega a: [0.552(r)I/2 + m] v r=----...".....-- 87 (e)l/2 una de las formas de g (r) =r, necesaria para el método de Steffensen. Sin embargo, antes de usar el método, conviene averiguar el comportamiento de g' (r) , 0.552 v g (r) = 174 (r) 112 (e)I/2 sustituyendo valores: , 0.5 g (r) = (r)l/2 Como el radio hidráulico debe ser mayor de cero, ya que un valor negativo o cero no ten- dría significado físico y como I g' (r) I < 1 para (r)I/2 > 0.5, o r> 0.7, se selecciona como valor inicial de raLO. Con esto: g' (1) = 0.5
  • 107. 94 Métodos numéricos aplicados a la ingeniería y el método puede aplicarse con cierta garantía de convergencia: Primera iteración "o = 1 [0.552 (1)1/2+ 1.1] (5) rl = g (ro) = = 3.00235 87 (0.001)1/2 [0.552 (3.00235)1/2 + 1.1] (5) r2 = g (rl) = 87 (0.001)1/2 3.73742 (rl - ro)2 (3.00235 - 1)2 r3=rO- =1- =4.16380 r2 - 2rl + ro 3.73742 - 2 (3.00235) + 1 Segunda iteración Tomando ahora como nuevo valor inicial r3 = 4.16380, se tiene: 'o = 4.16380 [0.552 (4.16380)1/2 + 1.1] (5) rl = g (ro) = = 4.04622 87 (0.001)1/2 [0.552 (4.04622)1/2 + 1.1] (5) r2 = g (rl) = = 4.01711 87 (0.001)1/2 6 (4.04622 - 4.16380)2 r =4.1 380------------ 3 4.01711 - 2(4.04622) + 4.16380 = 4.00753 Dado que la sucesión es convergente y que se trata del radio de un canal abierto, donde la exactitud después del primer decimal no es necesaria, se toma como valor a r = 4 pies. Los cálculos pueden realizarse con Matlab o con la TI-92 Plus. m=l.l; e=O.OOl; v=5; rO=l; for i=1:4 rl=(O.552*rOAO.5+m)*v/(87*eAO.5); r2=(O.552*rlAO.5+m)*v/(87~eAO.5); r=rO- (rl-rO) A2/ (r2-2~rl+rO); fprintf ('%2d %8.5f %8.5f %8.5fn', i , rl, r2, r) rO=r; end 94 Métodos numéricos aplicados a la ingeniería y el método puede aplicarse con cierta garantía de convergencia: Primera iteración ro = 1 [0.552 (1)1/2 + 1.1] (5) rl = g (ro) = = 3.00235 87 (0.001)1/2 [0.552 (3.00235)1/2 + 1.1] (5) ~ r2 = g (rl ) = = 3.7-,742 87 (0.001)1/2 r 3 = ro _ (rl - ro)2 = 1 _ (3.00235 -1)2 = 4.16380 r2- 2rl + ro 3.73742 - 2 (3.00235) + 1 Segunda iteración Tomando ahora como nuevo valor inicial r3 = 4.16380, se tiene: ro = 4.16380 [0.552 (4.16380)1/2 + 1.1] (5) rl = g (ro) = = 4.04622 87 (0.001)1/2 [0.552 (4.04622)1/2 + 1.1] (5) r2 = g (rl ) = = 4.01711 87 (0.001)1/2 6 (4.04622 - 4.16380)2 r = 4.1 380- - -- - - - - - - -- 3 4.01711 - 2(4.04622) + 4.16380 = 4.00753 Dado que la sucesión es convergente y que se trata del radio de un canal abierto, donde la exactitud después del primer decimal no es necesaria, se toma como valor a r =4 pies. Los cálculos pueden realizarse con Matlab o con la TI-92 Plus. m=l.l; e=O.OOl; v=5; rO=l; for i=1:4 rl=(O .552*rOAO.5+m)*v/(87*eAO.5}; r2=(O.552*rl AO.5+m}*v/(87*eAO.5); r=rO- (rl -rO) A2/ (r2-2~rl+rO); fprintf ('%2d %8.5f %8.5f %8.5fn', i, rl, r2, r) rO=r; end
  • 108. ( a Solución de ecuaci ones no lineales 95 P2_2( Prgm 1.1 ...•m : .OOl ...•e : 5....• v : 1....• rO ClrIO For i, 1, 4 (.55?-Y(rO) +m)*v / (87'-'-Y(e) ) ...•x (.55?-Y(x) +m)*v / (87*-Y(e) ) ...•Y rO- (x-rO) /''2/ (y-?x+rO) ...•r fonnat (i, "It)") &" "&format (x, "f5") ...•d ds" "&fonnat (y, "f5") &" "&format (r, "f5") ...•d Disp d r+rt) EndFor EndPrgm 2.3 La siguiente fórmula es atribuida a Francis" y se aplica a un vertedor con contracciones Q = 3.33(B - 0.2 H)(H3)1I2, donde: Q = cantidad de agua que pasa por el vertedor en piesi/s B = ancho del vertedor en pies H = carga sobre la cresta del vertedor en pies Si se sabe que B varía de Oa 5 y Q de Oa 33, calcule los valores de H correspondien- tes a las siguientes parejas de valores de By Q (las unidades son consistentes), con el mé- todo de Newton-Raphson. B 3 2 4 3.6 Q 12 20 13 30 Solución Se escribe la ecuación en la forma f(H) = 3.33 (B - 0.2 H) (H3)112- Q = O Se deriva ff (H) = 3.33 (B - 0.2 H) (1.5 )H1I2 + (H3)1I2 (3.33) (-0.2) Y sustituyendo en la férmula de Newton-Raphson af (H) y f ' (H), se tiene: 3.33(B - 0.2H) (H3yl2 - Q H¡+l = H¡ - 4.995(B _ 0.2H) HII2¡ _ 0.666 (H3)1I2 Para elegir un valor inicial de H en cada caso, se considera que por cuestión de diseño H debe ser menor que B. Por lo anterior, se sugiere utilizar como valor inicial Ho = B/2. Para la pareja B = 3, Q = 12 Primera iteración Ho = B/2 = 3/2 = l.5 * J. Lipka. Computaciones gráficas y mécanicas. CECSA (1972) pp. 139·141. Solución de ecuaciones no lineales 95 P2_2 ( Prgm 1.1 -+m : .OOl-+e : 5. -+v : 1. -+r O CirIO For i , 1, 4 ( . 552*"l(rO) +m) * v / (87""'; (e) ) -+x (. 552*"';(x) +m)*v / (87*"'; (e) ) -+y r O- (x- r O) /''2/ (y - 2*x +rO) -+r fonnat (i, "f O") &" "&format (x, "f5")-+d d&" " &f ormat (y, "f5") &" " &f onnat (r, " f5")-+d Disp d r-+rO EndFor EndPrgm 2.3 La siguiente fórmula es atribuida a Francis' y se aplica a un vertedor con contracciones Q = 3.33(B - 0.2 H)(H3)1/2, donde: Q = cantidad de agua que pasa por el vertedor en pies3/s B = ancho del vertedor en pies H = carga sobre la cresta del vertedor en pies Si se sabe que B varía de Oa 5 y Qde Oa 33, calcule los valores de H correspondien- tes a las siguientes parejas de valores de By Q (las unidades son consistentes), con el mé- todo de Newton-Raphson. B 3 2 4 3.6 Q 12 20 13 30 Solución Se escribe la ecuación en la forma f(H) = 3.33 (B - 0.2 H) (H3)112 - Q = O Se deriva f' (H) = 3.33 (B - 0.2 H) (1.5 )HII2 + (H3)1I2 (3.33) (-0.2) Ysustituyendo en la férmula de Newton-Raphson af (H) y f I (H), se tiene: 3.33(B - 0.2H) (H3yl2 - Q H¡+I =H¡ - 4.995(B _ 0.2H) H1I2¡ _ 0.666 (H3)1I2 Para elegir un valor inicial de H en cada caso, se considera que por cuestión de diseño H debe ser menor que B. Por lo anterior, se sugiere utilizar como valor inicial Ho = BI2. Para la pareja B =3, Q =12 Primera iteración Ho = B/2 = 3/2 = 1.5 * J. Lipka. Computaciones gráficas y mécanicas. CECSA (1972) pp. 139-141.
  • 109. 96 Métodos numéricos aplicados a la ingeniería H = 1.5 _ 3.33 [3 - 0.2 (1.5) ] (1.53 )112 - 12 = 1.2046 1 4.995[3 _ 0.2 (1.5) ] (1.5)112 - 0.666 (1.53)1/2 Segunda iteración 6 3.33 [3 - 0.2 (1.2046)](1.20463)112 - 12 H2 = 1.204 - = 1.1942 4.995[3 - 0.02 (1.2046)] (1.2046)1/2 - 0.666 (1.20463)1/2 Tercera iteración 9 3.33 [3 - 0.2 (1.1942)](1.19423)112 - 12 H = 1.1 42 - = 1.1942 3 4.995[3 - 0.2 (1.1942) ] (1.1942)1/2 - 0.666 (1.19423)1/2 El método ha convergido al valor 1.1942 y se toma como carga sobre la cresta del vertedor 1.2 pies; las demás cifras significativas no interesan, por el sentido físico que tiene H. Los resultados para las siguientes parejas de B y Q se dan a continuación: B 3.62 4 Q H 20 2.5 30 2.0 13 1.0 Los cálculos pueden realizarse con Matlab o con la Tl92-Plus. ~ B=3; Q=12; H=B/2; Eps=O.Ol; dist=l; While dist > Eps F=3.33*(B-0.2*H)*HA 1.5-Q; DF=4.995* (B-O. 2*H)*WO. 5-0. 66fi!'W1.5; H1=H-F/DF; dist=abs (H1-H) ; disp([H1,dist] ) ; H=H1; end P2_3( Prgm Define f(h) =3.33 (b-.2h) hA 1.5-q Define df(h) =4.995 (b-.2h) ,J(h) -.66hA 1.5 3.->b : 12.->q : b/2->h : .Ol.+eps : ClrIO Loop h-f(h) /df (h)->h1 abs (h1-h) ->dist fonnat (h, "f3") s« "&fonnat (dist, "f5")->d Disp d h1->h If Dist<eps Exit EndLoop EndPrgm 96 Métodos numéricos aplicados a la ingeniería H = 1.5 _ 3.33 [3 - 0.2 (1.5) ] (1.5 3 )112 - 12 1.2046 1 4.995[3 _ 0.2 (1.5) ] (1.5)112 - 0.666 (1.53)1/2 Segunda iteración 3.33 [3 - 0.2 (1.2046)](1.20463)112 - 12 . H2 = 1.2046 - = 1.1942 4.995[3 - 0.02 (1.2046)] (1.2046)112 - 0.666 (1.20463)1/2 Tercera iteración 3.33 [3 - 0.2 (1.1942)](1.19423)112 - 12 H = 1.1942 - = 1.1942 3 4.995[3 - 0.2 (1.1942) ] (1.1942)1/2 - 0.666 (1.19423)112 El método ha convergido al valor 1.1942 y se toma como carga sobre la cresta del vertedor 1.2 pies; las demás cifras significativas no interesan, por el sentido físico que tiene H. Los resultados para las siguientes parejas de B y Q se dan a continuación: B Q H 2 20 2.5 4 13 1.0 3.6 30 2.0 Los cálculos pueden realizarse con Matlab o con la TI92-Plus. B=3; Q=12; H=BI2; Eps=O.Ol; dist=l ; While dist > Eps F=3 . 33'" (B- O. 2!'H)*W1 . 5- Q; DF=4 . 995* (B-O.2!'H)*WO . 5- 0. 6661'W'1.5; H1=H- FIDF; dist=abs (H1-H) ; disp ( [H1 , dist] ) ; H=H1 ; end P2_3 ( ) Prgm Define f(h) =3.33 (b-.2h) h"1 . 5- q Define df (h) =4 .995 (b-.2h) --./(h) - .66h"1.5 3 .->b : 12.->q : bl2->h : . Ol->eps : ClrIO Loop h-f(h) Idf (h)->h1 abs (hl - h) ->dist format (h, "f3") &" " &format (dist, "f5")->d Disp d hl->h If Dist<eps Exit EndLoop EndPrgm
  • 110. En la solución de problemas de valor inicial en ecuaciones diferenciales por transforma- das de Laplace" se presentan funciones racionales del tipo Solución de ecuaciones no lineales 97 ( 2.4 F (s) = p¡ (s) P2 (s) 42 donde PI YP2 son polinomios con: grado p¡ ~ grado P2· La expresión deF (s) en fracciones parciales es parte importante del proceso de solu- ción y se realiza descomponiendo primero P2 (s) en sus factores más sencillos posibles. En la solución de un problema de valor inicial'" (PVI) que modela un sistema de control lineal, la función de transferencia es (obtenida al aplicar la transformada de La- place al PVI) e (s) 24040 (s + 25) F (s) = -- = ----,-----,,------- R (s) s4 + 125 s3 + 5100 S2 + 65000 s + 598800 Para expresar en términos más sencillos a F (s) se resuelve primero la ecuación polinomial S4 + 125 s3 + 5100 S2 + 65000 s + 598800 = O Con el método de Müller (programa 2.3 del disco), se tiene SI = -6.6 + 11.4 i S2 = -6.6 - 11.4 i s3 = -55.9 + 18 i S4 = -55.9 -18 i Para obtener estos resultados se puede usar la siguiente instrucción de Matlab roots ( [1 125 5100 65000 598800] ) Con lo que se obtiene: ans -55.8899 + 18.0260i -55.8899 - 18.0260i -6.6101 + 11.3992i -6.6101 - 11.3992i .. y los factores buscados son: 1; " (s + 6.6 - 11.4i):(s + 6.6 + 11.4i) (s + 55.9 - 18i) (s + 55.9 + 18i) con lo que F (s) queda 24040 (s + 25) F(s)=----- FI F2 F3 F4 donde: • Spiegel, Murray R., Applied Differential Equations. 2nd Ed Prentice Hall, Inc (1967), pp. 263-270 . •• Véase capítulo 7. Solución de ecuaciones no lineales 91 2.4 En la solución de problemas de valor inicial en ecuaciones diferenciales por transfonna- das de Laplace*se presentan funciones racionales del tipo F (s) = PI (s) P2 (s) donde PI YP2 son polinomios con: grado PI :S; grado P2· La expresión de.F (s) en fracciones parciales es parte importante del proceso de solu- ción y se realiza descomponiendo primero P2 (s) en sus factores más sencillos posibles. En la solución de un problema de valor inicial** (PVI) que modela un sistema de control lineal, la función de transferencia es (obtenida al aplicar la transformada de La- place al PVI) . e (s) 24040 (s + 25) F (s) = - - = -----,----.....,-- - - - - - R (s) S4 + 125 s3 + 5100 s2 + 65000 s + 598800 Para expresar en términos más sencillos a F (s) se resuelve primero la ecuación polinomial S4 + 125 s3 + 5100 S2 + 65000 s + 598800 =O Con el método de Müller (programa 2.3 del disco), se tiene S I = - 6.6 + 11.4 i S2 = -6.6 - 11.4 i s3 =- 55.9 + 18 i S4 = -55.9 -18 i Para obtener estos resultados se puede usar la siguiente instrucción de Matlab roots ( [1 125 5100 65000 598800] ) Con lo que se obtiene: ans - 55.8899 + 18.0260i -55.8899 - 18 . 0260i -6.6101 + 11.3992i - 6 .6101 - 11.3992i .. . y los factores buscados son: l' " (s + 6.6 - 11.4i)"(s + 6.6 + 11.4i) (s + 55.9 - 18i) (s + 55.9 + 18i) con lo que F (s) queda donde: 24040 (s + 25) F(s) = - - - - - F¡ F2 F3 F4 • Spiegel, Murray R., Applied Differential Equations. 2nd Ed Prentice Hall, lnc (1967), pp. 263-270. •• Véase capítulo 7.
  • 111. 98 Métodos numéricos aplicados a la ingeniería • I El segundo paso que completa la descomposición pedida es encontrar los valores de A" A2' A3' A4 que 'satisfagan la ecuación . ..l /., A A A A F(S)=_I +_2 +_3 +_4 FI F2 F3 F4 Esto se logra pasando el denominador de F (s) al lado derecho 24040 (s +.,25) = AIF2F3F4 + A2F¡F3F4 + A3FIF2F4 + A4FIF2F3 Ydando valores a s, por ejemplo s = s l' Así 24040 (-6.6 + 11.4i + 25 ) = Al (-6.6 + llAi + 6.6 + 11.4i)(-6.6 + llAi + 55.9 - 18i)(-6.6 + llAi + 55.9 + 18i), ya que: A2FIF3F4 = A3F¡F2F4 = A4FIF2F3 = O. Al despejar Al y realizar operaciones, se encuentra su valor Fi Com; de I Al = 1.195 -7.904i Procediendo de igual manera, se calcula A2' A3' YA4 con s = s2' S = s3 Ys = S4' respectiva- mente. Esto se deja como ejercicio para el lector. ar 2.5 Una vez descompuesto F (s) = e (s) / R(s) en fracciones parciales (véase ejercicio ante- rior), se les aplica el proceso de "transformación" inversa de Laplace, que da como resul- tado la solución del problema de valor inicial. Sea esta solución F (t) = 1.21e-6.6t sen (llAt - 111.7°) + 0.28e-55.9t sen (18t + 26.1°) La solución obtenida debe analizarse matemáticamente e interpretarse físicamente si pro- cede. BREVE ANÁLISIS CLÁSICO Si t es el tiempo, el intervalo de interés es t » O. En los términos primero y segundo deF (t) aparece la función seno, que es oscilato- ria, afectada de la función exponencial. Ésta tiende a cero cuando t tiene valores superio- res al; se lleva tanto sus factores como la función F (t) a dicho valor, con lo cual la gráfica F (t) se confunde con el eje t para t :::::1. Estas funciones son conocidas como oscilatorias amortiguadas y sus gráficas son del tipo mostrado en la figura 2.14. Si, por el contrario, el exponente de e es positivo, al tender t a infinito, la función es creciente y tiende rápidamente a infinito; lo cual se conoce como función oscilatoria no amortiguada. Por otro lado, obsérvese que la contribución numérica del segundo término de F (t) es despreciable, y que el análisis y la gráfica de F (t) pueden obtenerse sin menoscabo de exactitud con el primer término. Si se dan algunos valores particulares a t se obtiene: 0.0 0.2 004 0.6 0.8 1.0 F (t) -1.124 0.105 0.044 -0.023 0.005 -4.22 X 10-5 98 Métodos numéricos aplicados a la ingeniería , I El segundo paso que completa la descomposición pedida es encontrar los valores de A" A2, A3, A4 que satisfagan la ecuación ,j.',., A A A A F(s)=-¡ +_2 + _ 3 +_4 FI F2 F3 F4 Esto se logra pasando el denominador de F (s) alIado derecho 24040 (s +,25) =A¡F2F3F4 + A2F¡F3F4 + A3FIF2F4 + A4FIF2F3 Ydando valores a s, por ejemplo s = sl' Así 24040 (-6.6 + 11.4i + 25 ) = Al (-6.6 + 11Ai + 6.6 + 11.4i)(- 6.6 + 11Ai + 55.9 - 18i)(-6.6 + 11Ai + 55.9 + 18i), ya que: A2FIF3F4 =A3F¡F2F4 =A4FIF2F3 =O. Al despejar A l y realizar operaciones, se encuentra su valor Al =1.195 -7.904i Procediendo de igual manera, se calcula A2, A3, YA4 con s =s2' S =s3 Ys =S4' respectiva- mente. Esto se deja como ejercicio para el lector. 2.5 Una vez descompuesto F (s) = e (s) / R(s) en fracciones parciales (véase ejercicio ante- rior), se les aplica el proceso de "transformación" inversa de Laplace, que da como resul- tado la solución del problema de valor inicial. Sea esta solución F (t) = 1.21e-6.6t sen (lIAt - 111.7°) + 0.28e-55.9t sen (l8t + 26.1°) La solución obtenida debe analizarse matemáticamente e interpretarse físicamente si pro- cede. BREVE ANÁLISIS CLÁSICO Si t es el tiempo, el intervalo de interés es t> O. En los términos primero y segundo deF (t) aparece la función seno, que es oscilato- ria, afectada de la función exponencial. Ésta tiende a cero cuando t tiene valores superio- res al; se lleva tanto sus factores como la función F (t) a dicho valor, con lo cual la gráfica F (t) se confunde con el eje t para t :::: 1. Estas funciones son conocidas como oscilatorias amortiguadas y sus gráficas son del tipo mostrado en la figura 2.14. Si, por el contrario, el exponente de e es positivo, al tender t a infinito, la función es creciente y tiende rápidamente a infinito; lo cual se conoce como función oscilatoria no amortiguada. Por otro lado, obsérvese que la contribución numérica del segundo término de F (t) es despreciable, y que el análisis y la gráfica de F (t) pueden obtenerse sin menoscabo de exactitud con el primer término. Si se dan algunos valores particulares a t se obtiene: 0.0 0.2 004 0.6 0.8 1.0 F (l) -1.124 0.105 0.044 -0.023 0.005 -4.22 X 10-5
  • 112. (as de i), tiva- ante- esul- ipro- ilato- erio- áfica n del ón es a no (t) es o de Solución de ecuaciones no lineales F(t) Figura 2.14 Comportamiento de una función oscilatoria amortiguada. Estos valores señalan claramente la presencia de raíces reales en los intervalos (0,0.2), (0.4,0.6), (0.6,0.8), (0.8,1.0): (véase Fig. 2.15). Utilizando como valores iniciales 0.1, 0.5, 0.7, Y 0.9 Y el método de Newton-Raphson se obtiene, respectivamente: ti = 0.171013; t2 = 0.44659; t3 = 0.72217; r, = 0.99775 Los posibles máximos y mínimos de esta función se consiguen resolviendo la ecuación que resulta de igualar con cero la primera derivada de F (t) F' (t) = 13.794e-6.6t cos (11.4t-111.7°) -7.986e-6.6t sen (l1.4t - 111.7") + 5.04e-55.9/ cos (18t + 26.1°) -15.652 e-55.9/ sen (18t + 26.1°) = O Aprovechando las evaluaciones que se hicieron de F ' (t) en el método de Newton-Raph- son, se tiene: 0.0 0.3 0.6 0.9 1.00.1 F' (t) -0.040 7.849 -0.900 0.196 -0.035 -0.00184 Con los valores iniciales dados a la izquierda, se obtuvieron las raíces anotadas a la de- recha to = O to = 0.2 to = 0.45 to = 0.75 ti = 0.00175 t2 = 0.26277 t3 = 0.53834 t,= 0.81399 Con los valores de la función en diferentes puntos, sus raíces y puntos máximos y míni- mos, la gráfica aproximada de F (t) se muestra en la figura 2.12 Este análisis se puede comprobar con el PROGRAMA 2.2 del CD o el Matlab, por ejemplo. 99 Figura 2.14 Comportamiento de una función oscilatoria amortiguada. Solución de ecuaciones no lineale s 99 F(t) Estos valores señalan claramente la presencia de raíces reales en los intervalos (0,0.2), (0.4,0.6), (0.6,0.8), (0.8,1.0): (véase Fig. 2.15). Utilizando como valores iniciales 0.1, 0.5, 0.7, Y0.9 Yel método de Newton-Raphson se obtiene, respectivamente: ti = 0.171013; t2 = 0.44659; t3 = 0.72217; t4 = 0.99775 Los posibles máximos y mínimos de esta función se consiguen resolviendo la ecuación que resulta de igualar con cero la primera derivada de F (1) F I (l) =13.794e-6.6t cos (11.41-111.7°) -7.986e-6.6/ sen (l1.4t - 111.7°) + 5.04e-55.9/ cos (l8t + 26.1°) - 15.652 e-55.9/ sen (18t + 26.1°) = O Aprovechando las evaluaciones que se hicieron de F I (t) en el método de Newton-Raph- son, se tiene: 0.0 0.1 0.3 0.6 0.9 1.0 F I (t) - 0.040 7.849 - 0.900 0.196 -0.035 -0.00184 Con los valores iniciales dados a la izquierda, se obtuvieron las raíces anotadas a la de- recha to= O lo =0.2 lo = 0.45 to= 0.75 ti = 0.00175 12 =0.26277 t3 =0.53834 t4 = 0.81399 Con los valores de la función en diferentes puntos, sus raíces y puntos máximos y míni- mos, la gráfica aproximada de F (t) se muestra en la figura 2.12 Este análisis se puede comprobar con el PROGRAMA 2.2 del CD o el Matlab, por ejemplo.
  • 113. 100 Métodos numéricos aplicados a la ingeniería 0.2 O 0.44 0.72 -0.2 -0.2 -0.2 -0.2 -1 Figura 2.15 Gráfica de la -1.2 función F (~. O 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 u ml 6 2.6 32 Determine la cantidad de vapor V (moles/hr) y la cantidad de líquido L (moleslhr) que se generan en una vaporización instantánea continua a una presión de 1600 psia y una tem- peratura de 120 o F de la siguiente mezcla. Componente Composición z¡ K¡ =yJx¡ CO2 0.0046 1.65 CH4 0.8345 1.80 C2H6 0.0381 0.94 C3HS 0.0163 0.55 i-C4 HIO 0.0050 0.40 n-C4H,o 0.0074 0.38 CSH'2 0.0287 0.22 C6H'4 0.0220 0.14 C7H'6 0.0434 0.09 Solución Con base en la figura 2.16 Un balance total de materia da F = L + V Un balance de materia para cada componente da: (1) i = 1,2, ... , n (2) Las relaciones de equilibrio líquido-vapor establecen K=~1 Xi i = 1,2,..., n (3)
  • 114. Solución de e cuaciones no lineales 101 Vapor Generado V (moles/h), Y¡ Alimentación F(mollh) Figura 2.16 Esquema de una vaporización instantánea (flash) de una mezcla multicomponente. Z¡ Líquido Sustituyendo la ecuación 3 en la 2 se obtiene Fz, = L.x, + VK,x¡ i = 1,2, ..., n (4) L (moles/h), x¡ o bien Fz, = x¡ (L + VK) i = 1,2, ..., n de donde Fz¡ x¡=--'-- L+ VK¡ Sustituyendo la ecuación 1 en esta útlima se obtiene: i = 1,2, ..., n Fz¡ x· = ----'---- I F + V (K¡ -1) Las restricciones de composición establecen i = 1,2, ..., n (5) 11 L x¡= 1 i= 1 11 L Y¡= 1 i= 1 fl 11 I. s,», - I. ¡= 1 ¡= 1 x.=O1. Por lo que puede escribirse: n L Y¡ ¡= 1 o bien: o simplemente: n L xi (Ki - 1) = O i= 1 (6) sustituyendo la ecuación 5 en la 6 se obtiene: f Fz¡ (K¡ - 1) = O i= 1 F + V(K¡ - 1) (7) Figura 2.16 Esquema de una vaporización instantánea (flash) de una mezcla multicomponente. Solución d e ecuaciones no lineales Alimentación F(mollh) Z¡ Sustituyendo la ecuación 3 en la 2 se obtiene Fz¡=Lx¡ + VK.xi o bien Fz¡= x¡ (L + VK) de donde Fz¡ x¡=----'~ L+ VK¡ i = 1,2,.. " n i = 1, 2,.. " n i = 1,2" ," n Sustituyendo la ecuación 1 en esta útlima se obtiene: Vapor Generado V(moles/h), Yi Líquido L (moles/h), Xi Fz¡ x· =----'-- - 1 F + V (K¡ -1) i = 1,2,.. " n Las restricciones de composición establecen Por lo que puede escribirse: o bien: o simplemente: 11 11 L x¡ = 1 L Y¡= 1 i~ I i= 1 n 11 L Y¡ - L x¡ = O ¡~ I i= I 11 ¡= 1 ¡= 1 11 x. = OL L x¡ (K¡ - 1) = O i = 1 sustituyendo la ecuación 5 en la 6 se obtiene: 11 Fz . (K. - 1) L 1 1 = 0 ¡~ I F + V(K¡ - 1) 101 (4) (5) (6) (7)
  • 115. 102 Métodos numérico s aplicados a la ingeniería VALORES INICIALES El valor de V que satisface la ecuación 7 está comprendido en el intervalo O :::;;V:::;;F, por 10 que la estimación de un valor inicial de Ves difícil, ya que el valor de F puede ser muy grande. Esta dificultad se reduce normalizando el valor de V; esto es, dividiendo numera- dor y denominador de la ecuación 7 entre F, para obtener 11 z. (K - 1) L " i=ll+lfI(K¡-I) (8) donde lfI = V/F La ecuación 8 equivale a la 7, pero expresada en la nueva variable lfI cuyos límites son: La ecuación 8 es no lineal en una sola variable (lfI), que se resolverá con el método de New- ton-Raphson. Hay que observar que esta ecuación es monotónica decreciente, por lo que el valor inicial puede ser cualquier número dentro del intervalo [O, 1], por ejemplo lfIo = O. El PROGRAMA 2.4~ del CD emplea lfIo = Ocomo estimado inicial y I! -z.(K - 1)2 l' (lfI) = i~1 [1 + 'lfI (Ki _ 1)]2 A continuación se muestran los valores que adquiere lfI y f (lfI) a lo largo de las iteracio- nes realizadas. Iteración lfI f (1p) 1 0.9328799 -8.79 X 10-2 2 0.8968149 -1.29 X 10-2 3 0.8895657 -3.5 X 10-4 4 0.8893582 -2.68 X 10-7 5 0.8893580 -1.5 X 10-13 RESULTADOS Para F = 1 moles/h Vapor generado: V = 0.889358 moles/h Líquido generado: L = 0.11 0642 moles/h Composiciones del líquido y del vapor generados: Componente Vapor (y)Líquido (x) CO2 CH4 C2H6 C3Hg i-C4HIO n-C4HIO CSH12 C6Hl4 C7HI6 0.00291 0.48759 0.04025 0.02718 0.01072 0.01650 0.09370 0.09356 0.22760 0.00481. 0.87766 0.03783 0.01495 0.00429 0.00627 0.02061 0.01310 0.02048
  • 116. Solución de ecuaciones no lineales 103 Los cálculos de este problema pueden realizarse con Matlab o con la TI-92 Plus. or uy ra- n: Z=[0.0046 0.8345 0.0381 0.0163 0.0050 ... 0~·0074 0.0287 0.0220 0.0434]; K=[1.65 1.80 0.94 0.55 0.40 ... 0.38 0.22 0.14 0.09]; Eps=le-3; f=l; Fi=O; i =0; fprintf(' Fi f(Fi) n') whi1e and(abs(f»Eps,i<10) f=sum ((Z. * (K-1)) ./ (1+Fi * (K-J))) ; df=sum ((-Z. * (K-1) . -2) ./(l+Fi*(K-1)). -2); FiJ=Fi-f/df; fprintf('%10.6f %8.2en' ,Fi,f) Fi=FiJ; i=i+J; end fprintf('Fi= %10.6fn',Fi) fprintf('x(i) y(i) n') for i=1:9 X(i) =Z (i) / (l+Fi* (K(i) -1)); y (i) =K (i) *x (i) ; fprintf ('%10.5f %10.5fn' .x (i) ,Y (i)) end (8) IV- el p2_6( ) Prgm .0046-+z[1] . 8345-+z[2] .0163-+z [4] .0050-+z [5] .0287-+z[7] .0220-+z[8] 1.65-+ k [1] 1. Br+k: [2] . 55-+k[4] . 40-+k [5] . 22-+k [7] . 14-k[8] .001-+eps J-+f : O-+fi: WhiJe ebs (f) >eps or i <10 O-+f : (r+d For i,l,9 f+z [i]* (k [i] -1) / (1+fi* (k [i] -1) -t f ci-z [i]* (k [i] -1) A2/ (1+fi* (k [i] -1)) -2-+d EndFor fi-f/d-->fi Disp fi EndWhiJe EndPrgm .0381-+z[3] .0074-+z[6] .0434-+z[9] . 94-+k [3] . 38-+k[6] .09-+k[9] Or+i : C1rIO También puede utilizarse la función fzero de Matlab: Con su editor de texto escriba el siguiente guión y grábelo con el nombre Flash. m en el directorio de trabajo de Matlab: Solución de ecuaciones no lineales 103 Los cálculos de este problema pueden realizarse con Matlab o con la TI-92 Plus. Z= [0 . 0046 0 . 8345 0 . 0381 0 . 0163 0 . 0050 ... 0 . 0074 0 . 0287 0. 0220 0 . 0434] ; K= [1 . 65 1.80 0 . 94 0 . 55 0 . 40... 0.38 0 .22 0 . 14 0 . 09] ; Eps=le-3; f =l ; Fi=O; i =0; fprintf(' Fi f(Fi) n') whi1e and(abs (f»Eps , i<10) f=sum ((Z . *(K- 1)) . / (1 +Fi *(K- J))) ; df=sum((-Z .* (K- 1) . -2) . /(1+Fi*(K-1)) . -2) ; Fil=Fi - f/df; fprintf ('%10 . 6f %8.2en' , Fi , f) Fi=Fil ; i=i+1; end fprintf('Fi= %10.6fn',Fi) fprintf('x(i) y(i) n') for i=1 : 9 X (i) =Z (i) / (l+Fi* (K(i) - 1)) ; y (i) =K(i) *x(i) ; fprintf ('%10 . 5f %10 . 5fn' , X (i) , Y(i)) end p2_6( ) Prgm . 0046-+z [1] . 0163-+ z[4] . 0287-+z[7J 1 . 65-+k[1] . 55-+k[4J .22-+k[7J . 8345-+z[2] . 0050-+ z [5J . 0220-+z[8J 1 . 8-+k[2] .40-+k[5] . 14- k[8] . 0381-+z[3J .0074-+ z[6] . 0434-+z [9] . 94-+k[3J . 38-+k[6J . 09-+k[9] . 00l-+eps 1-+f : 0-+fi : 0-+i : C1rIO While abs (f » eps or i <10 O-+f : O-+d For i , 1, 9 f+z [i]* (k [i] -1) / (1+fi* (k [i] - 1)-+f d- z [iJ* (k[iJ - 1) "2/ (l+fi* (k[iJ - 1) ) -2-+d EndFor fi-f/d-+fi Disp fi EndWhile EndPrgm También puede utilizarse la función fzero de Matlab: Con su editor de texto escriba el siguiente guión y grábelo con el nombre F1a sh . m en el directorio de trabajo de Matlab:
  • 117. 104 Métodos num éricos aplicados a la ingeniería function f=Flash (Fi) Z=[0.0046 0.8345 0.0381 0.0163 0.0050 ... 0.0074 0.0287 0.0220 0.0434J; K=[1.65 1.80 0.94 0.55 0.40 ... 0.38 0.22 0.14 0.09J; f =sum ( (Z . * (K -1) ) . / (1 +Fi.* (K - 1) ) ) ; Ahora use el guión dado enseguida para resolver el problema: l' Z=[0.0046 0.8345 0.0381 0.0163 0.0050 ... 0.0074 0.0287 0.0220 0.0434J; K=[1.65 1.80 0.94 0.55 0.40 ... 0.38 0.22 0.14 0.09J; Fi=fzero ('Flash',O) for i=1:9 X (i)=Z (i)/ (1+Fi * (K (i)-1) ) ; Y(i)=K(i)*X(i) ; fprintf('%10.5f %10.5fn',X(i),Y(i)) end ~ 2.7 Considere un líquido en equilibrio con su vapor. Si el líquido está formado por los com- ponentes 1,2,3 Y4, con los datos dados a continuación calcule la temperatura y la compo- sición del vapor en el equilibrio a la presión total de 75 psia. 1 2 3 4 Composición del Presión de vapor de líquido % mol componente puro (psia) a 150°F a 200°F 10.0 25.0 200.0 54.0 14.7 60.0 30.0 4.0 14.7 6.0 0.5 5.0 Componente Utilice la siguiente ecuación para la presión de vapor: i = 1,2, 3,4; n Solución La presión total del sistema será: PT = L P¡ i= 1 (1) Si se considera que la mezcla de estos cuatro componentes, a las condiciones de presión y temperatura de este sistema, ob~ece las leyes de Raoult y de Dalton 4 PT= L PiQ X¡ ¡= 1 (2) donde: p¡Q = presión de vapor de cada componente. PT = presión total del sistema.
  • 118. Solución de ecuaci ones no lineales 105 P¡ = presión parcial de cada componente X¡ = fracción mol de cada componente en el líquido De la ecuación de presión de vapor se tiene que p¡O = exp (A¡ + B¡ /T) de las ecuaciones 1 y 2 resulta i = 1,2, 3, 4 (3) 4 PT = L X¡ exp (A¡ + BJT) ¡= 1 (4) de donde puede establecerse 4 f(l) = PT- L X¡ exp (A¡ + BJT) = O ¡= 1 (5) A¡ Y B¡ pueden obtenerse como sigue Si se hace pt = presión de vapor del componenete ia TI = 150 °P = 609.56 °R pg,¡ = presión de vapor del componente i a T2 = 200 "F = 659.56 °R entonces in (po¡ ) = A + B./T¡,lit i = 1,2,3,4 (6) y 1n (p02 . ) = A + B./ T,2,1 l 1 i = 1,2,3,4 (7) restando la ecuación 7 de la 6 se tiene de donde pO ln(~) P2,i B¡ = -:-1------=1"'- - -- TI T2 Conociendo B¡ se puede obtener A¡ de la ecuación 6 (8) A = In (pOI ) - B/T¡t ,1 1 i = 1,2, 3,4 (9) VALORES INICIALES Para estimar un valor inicial de T para resolver la ecuación 5, se considera el compo- nente dominante de la mezcla, en este caso el componente 2, y se usa PT en lugar de pg en la ecuación de presión de vapor de donde (lO) Solución de ecuaciones no lineales 105 p¡ = presión parcial de cada componente X¡ = fracción mol de cada componente en el líquido De la ecuación de presión de vapor se tiene que p¡o = exp (A¡ + B¡ /T) de las ecuaciones 1 y 2 resulta i = 1,2, 3, 4 4 PT = I, X¡ exp (A¡ + B¡lT) ¡= , de donde puede establecerse 4 f(T) =PT - I, X¡ exp (A¡ + B¡lT) =O ¡= , A¡ YB¡ pueden obtenerse como sigue Si se hace p~,¡ =presión de vapor del componenete i a TI = 150°F =609.56 °R pg,¡ =presión de vapor del componente i a T2 =200°F =659.56 °R entonces In (po,.) = A + B/T,,1 , 1 i =1,2, 3,4 y 1n ( p~ ) =A + B/ T2_ .1 1 I i = 1,2,3,4 restando la ecuación 7 de la 6 se tiene °In ( p~,¡ ) =B¡ (1 / T, - 1/ T2 ) de donde P2,i pO In (--f!-) P2,¡ B¡ =-1----"1"- - - - T, T2 Conociendo B¡ se puede obtener A¡ de la ecuación 6 A = In (pO, ) - B./T,I ,1 l i =1,2,3,4 VALORES INICIALES (3) (4) (5) (6) (7) (8) (9) Para estimar un valor inicial de T para resolver la ecuación 5, se considera el compo- nente dominante de la mezcla, en este caso el componente 2, y se usa PT en lugar de pg en la ecuación de presión de vapor de donde (10)
  • 119. I ' 106 Métodos numéricos aplicados a la ingeniería Con este resultado inicial y las consideraciones ya anotadas, el PROGRAMA 2.5 del CD, utiliza el método de Newton-Raphson con 4 l' (T) = - L x¡ exp (A¡ + B¡ IT) (-B¡ I T 2) ¡= 1 (11) y reporta los siguientes resultados después de cuatro iteraciones Temperatura del sistema = 209.07 °F = 668.63 °R (temperatura de burbuja) Composición del vapor en equilibrio E: Componente (i ) Yi 1 2 3 4 0.3761 0.5451 0.0729 0.0059 (e Los cálculos de este problema pueden realizarse con el siguiente guión de Matlab: P1=[25 14.74 0.5); P2=[200 60 14.7 5}; T1=150+459.56; T2=200+459.56; B=log(P1./P2)/(1/T1-1/T2); A=log(P1) -B/Tl; X=[0.10 0.54 0.30 0.06}; PT=75; i=O; f=l; Eps=O.OOOOOl; T=B(2) / (log (PT)-A (2)) ; fprintf (' T f (T) n' , T, f) while and (abs (f»Eps,i<lO) f=PT-sum (X.*exp (A+B/T) ) ; df=sum (X.*exp (A+B/T) . * (B/T/''2) ) ; Tl=T-f/df; fprintf('%10.2f %8.2en' ,T,f) T=Tl; i=i+l; end fprintf (' y (i) n' ) for i=1:4 y (i) = (X (i)*exp (A(i) +B(i) /T)) /PT; fprintf('%10.4f n',Y(i)) end ~ 2.8 Se emplea un intercambiador de calor (Fig. 2.17) para enfriar aceite. Encuentre la tempe- ratura de salida del aceite y del agua enfriadora (TH2 y TC2 , respectivamente), para gastos de aceite de 105,000; 80,000; 50,000; 30,000 y 14,000 lbmlh. 106 ~ 2.8 ~ Métodos numéricos aplicados a la ingeniería Con este resultado inicial y las consideraciones ya anotadas, el PROGRAMA 2.5 del CD, utiliza el método de Newton-Raphson con 4 f' (7) = - L X¡ exp (A¡ + BJ7) (-B¡ / T 2) ¡ = 1 y reporta los siguientes resultados después de cuatro iteraciones Temperatura del sistema = 209.07 °F = 668.63 °R (temperatura de burbuja) Composición del vapor en equilibrio Componente (i) Yi 2 3 4 0.3761 0.5451 0.0729 0.0059 Los cálculos de este problema pueden realizarse con el siguiente guión de Matlab: P1=[25 14 . 74 0.5} ; P2=[200 60 14. 7 5}; T1=150+459 . 56; T2=200+459.56; B=log(P1 . /P2)/(1/T1 -1/T2) ; A=log(P1) -B/T1; X=[0 . 10 0.54 0. 30 0. 06} ; PT=75; i=O ; f=1 ; EPs=0.000001; T=B (2) / (log (PT) -A(2) ) ; fprintf (' T f (T) n' , T, f) while and(abs (f»EPs,i<10) f=PT- sum (X.*exp (A+BIT)) ; df=sum (X. *exp (A+BIT) .* (BIT/''2)) ; T1=T-fldf; fprintf('%10 .2f %8 . 2en' , T, f ) T=T1; i=i+1; end fprintf (' y (i) n') for i=1 : 4 y (i) = (X (i)*exp (A (i) +B (i) /T)) /PT; fprintf(' %10. 4f n' , Y(i)) end (11) Se emplea un intercambiador de calor (Fig. 2.17) para enfriar aceite. Encuentre la tempe- ratura de salida del aceite y del agua enfriadora (TH2 y Te2, respectivamente), para gastos de aceite de 105,000; 80,000; 50,000; 30,000 y 14,000 lbmlh.
  • 120. Solución de ecuaciones no lineales 107 agua: 300 gal/min (fluido 2) I TC,=80FCp,=)BTu/()bF) r---------------------------~-----, A = 879ft2 aceite TH, = 250 F U= 120 BTU hft'FCp, = 0.5 BTU/(I b F) (fluido i) Figura 2.17 Esquema de un intercambiador de calor con flujo a contracorriente. TC =? 2 Solución Un balance de calor para el aceite da: Q¡ = w¡CP¡ (TH¡ - TH2) Un balance de calor para el agua da: La ecuación que rige la transferencia de calor a través de este equipo es: Q = U A I1Tm donde: U = coeficiente global de transferencia de calor A = área total de tranferencia de calor (TH¡ - TC2 ) - (TH2 - TC¡ ) I1Tm = ---'---=----=-----=--- in ( TH) - TC2 ) TH2-TC) Para encontrar TH2 y TC2 debe cumplirse que Q) = Q2 = Q, o bien: Q - -1=0 Q¡ Pero Q sólo podrá calcularse cuando se conozcan todas las temperaturas. Para resolver es- te problema se propone el siguiente procedimiento. Establecer que TH2 sea la única variable; entonces, Q2 puede escribirse en función de TH2 como sigue Q2 = Q) = w¡ Cp; (TH¡ - TH2) = w2 CP2 (TC2 - TC)) de donde puede despejarse TC2 w¡ Cp . TC2 = -- (TH¡ -TH2) + Te) w2CP2 Con todo esto ya puede establecerse Q en función de TH2 , y así escribir la ecuación 5 tam- bién en función de dicha variable única: (1) (2) (3) (4) (5) (6) (7) Figura 2.17 Esquema de un intercambiador de calor con flujo a contracorriente. Solución Solución de ecuaciones no lineales 107 agua: 300 gal/min (fluido 2) I TC,= 80F Cp, =IBTU/( lbF) r----------------------------L-----, aceite TH = 250 F, ---~] Cp, = 0.5 BTU/(I b F) (fluido ]) U= 120 BTU hft'F A = 879fe TC = ?, Un balance de calor para el aceite da: Un balance de calor para el agua da: La ecuación que rige la transferencia de calor a través de este equipo es: Q= U A I1Tm donde: U = coeficiente global de transferencia de calor A = área total de tranferencia de calor (TH] - TC2) - (TH2 - TC[ ) I1Tm = - ----'---""------'=---------"-- ln ( TH I - TC2 ) TH2- TC] Para encontrar TH2 y TC2 debe cumplirse que Q] = Q2 = Q, o bien: Q - - 1 =0 Q[ TH, = ? (1) (2) (3) (4) (5) Pero Qsólo podrá calcularse cuando se conozcan todas las temperaturas. Para resolver es- te problema se propone el siguiente procedimiento. Establecer que TH2 sea la única variable; entonces, Q2 puede escribirse en función de TH2 como sigue Q2 = Q¡ = w] Cp] (TH] - TH2) = w2 CP2 (TC2- TC¡) de donde puede despejarse TC2 w] Cp] TC2 =- - (TH I -TH2) + TC¡ w2CP2 (6) (7) Con todo esto ya puede establecerse Q en función de TH2, y así escribir la ecuación 5 tam- bién en función de dicha variable única: /
  • 121. l' - . 108 Métodos numéricos aplicados a la ingeniería VALORES INICIALES Para estimar un valor inicial de TH2 cabe apoyarse en la figura 2.18, la cual muestra una gráfica de temperaturas en este tipo de intercambiadores de calor. De acuerdo con esta gráfica, se tienen las siguientes restricciones y Te¡ < Te2 < TH¡ Como en este caso no se dispone de mayor información, el PROGRAMA 2.6 del CD em- plea el método de la bisección con TH2! = Te¡ + 0.5 Y TH2D = TH¡ - 0.5 para resolver la ecuación 8. T TH, Figura 2.18 Gráfica de temperaturas TH2 contra longitud en un TC2 intercambiador TC, de calor con flujo a contracorriente. O L x Para un gasto de aceite de 105,000 lbmlh RESULTADOS TH2 =113 Te2 = 128 Los cálculos de este problema pueden realizarse con el siguiente guión de Matlab:
  • 122. Solución de ecuaciones no lineales 109 wl=105000; w2=300*6(J1'2.2i'3.785; cpl=0.5; CP2=1; 0=120; A=879; TH1=250; TC1=80; EPs=O.OOOl; TH2i=TC1+O.5; TH2d=TH1-O.5; fm=l; Ql=wl*cpl* (THl-TH2i); TC2=Q1I (w2i'CP2)+TC1; DTm=((TH1-TC2)-(TH2i-TC1))/log((THl-TC2)/(TH2i-TC1)); fi=[J!'A*!YI'm/Ql-l; Ql=wl*CP1*(THl-~~d); TC2=Ql/(w2"CP2)+TC1; !YI'm=((TH1-TC2)-(TH2d-TC1))/log((TH1-TC2)/(TH2d-TC1)); fd=[J!'!f"DTm/Ql-l; if fi*fd<O while abs (fm) > EPs TR2m=(TH2i+TH2d)/2; Ql=wl*CP1* (TH1-TH2m) ;TC2=Ql/ (w2*CP2)+TC1; lYI'm=((THl-TC2)-(TH2m-TC1))/log((THl-TC2)/(TH2m-TC1)); fm=LFA*DTm/Ql-l; if fi*fm < O TH2d=TH2m; fd=fm; else TH2i=TH2m; fi=fm; end end else disp ('TH2iy TH2d no encierran una raíz') break end TH2=(TH2i+TH2d)/2; Ql=wl*cpl* (THl-TH2); TC2=Ql/ (w2"CP2)+TC1; fprintf('TH2= %8.2f TC2= %8.2fn',TH2,TC2) 2.9 El siguiente circuito representa en forma muy simplificada un generador de impulsos pa- ra probar el aislamiento de un transformador en circuito abierto. Considérese el gap como un interruptor. Las condiciones iniciales en el transformador y la inductancia son cero. Use los si- guientes datos para encontrar v2 (t): Figura 2.19 Circuito representativo de un generador de impulsos. CI = 12.5 X 10-9 Id, RI = 2 Kohms, C2 = 0.3 X 10-9 Id, R2 = 3 Kohms, gap L¡ +~ I ______________________________ J GENERADOR DE IMPULSOS L¡ = 0.25 X 10-3 Hy VI = 300 Kv TRANSFORMADOR Solución de ecuaciones no lineales 109 wl=105000; w2=300;'6(J1'2.2"3.785; cpl=0.5; CP2=1; U=120; A=879; TH1=250; TCl=80; EPs=O . OOOl; TH2i=TC1+0.5; TH2d=TH1-0.5; fm=l; Ql=wl*cpl* (THl-TH2i); TC2=Ql/(w2"CP2) +TC1; DTm=((TH1- TC2) -(TH2i-TC1))/log((THl-TC2)/(TH2i -TC1))¡ fi=[JI'A*DTm/Ql- l; Ql=wl*cpl*(TH1-~Y2d); TC2=Ql/(w2"CP2)+TC1¡ DTm=((THl-TC2)-(TH2d-TC1))/log((TH1-TC2)/(TH2d-TC1))¡ fd=[JI'lf"DTm/Ql-l; if fi*fd<O while abs (fm) > EPs TH2m=(TH2i+TH2d)/2; Ql=wl*CP1* (TH1-TH2m) ; TC2=Ql/ (w2*CP2) +TC1; DTm=((THl-TC2)-(TH2m-TC1))/log((THl- TC2)/(TH2m- TC1)) ¡ fm=[j'A*DTm/Ql-l ; if fi*fm < O TH2d=TH2m; fd=fm ; else TH2i=TH2m¡ fi=fm; end end else disp ('TH2i y TH2d no encierran una raíz') break end TH2=(TH2i+TH2d)/2¡ Ql=wl*CP1* (TH1-TH2); TC2=Ql/ (w2'CP2) +TC1; fprintf('TH2= %8.2f TC2= %8.2fn' , TH2,TC2) 2.9 El siguiente circuito representa en forma muy simplificada un generador de impulsos pa- ra probar el aislamiento de un transformador en circuito abierto. Figura 2.19 Circuito representativo de un generador de impulsos. Considérese el gap como un interruptor. Las condiciones iniciales en el transformador y la inductancia son cero. Use los si- guientes datos para encontrar v2 (t): CI = 12.5 X 10-9 fd, RI = 2 Kohms, C2 = 0.3 X 10-9 fd, R2 = 3 Kohms, ----- - ------------ - ------------ gap I +~o------:-r I ______________________________ J GENERADOR DE IMPULSOS L¡ =0.25 X 10-3 Hy VI = 300 Kv TRANSFORMADOR
  • 123. 110 Métodos numéri cos aplicados a la ingeniería Solución Estableciendo las ecuaciones para el circuito. Figura 2.20 Circuito. di (t) 1 v¡ (t) = (R¡ + R2)i¡ (t) + L, ¡ + - J i,(t) dt - R2i2(t) dt e¡ (1) I • (2) 1 v2 (t) = - J i2 (t) dt e2 Aplicando la transformada de Laplace y considerando que las condiciones iniciales son cero, se tiene: (3) V¡ 1 I¡ (s) - = (R¡ + R2)I¡ (s) + L, sl, (s) + - -- - Ri2 (s) S e, s (4) 1 12 (s) o = - R2I¡ (s) + Ri2 (s) + - --- e2 (s) (5) Despejando I¡ (s) de la ecuación 5 y sustituyendo en la ecuación cuatro se tiene: V¡ 12 (s) = -------!...------ (R¡ + LIS + l/e¡s)(s + lIR2e2) + l/e2 al aplicar la transformada inversa de Laplace a la ecuación 3 y recordando que las condi- ciones iniciales son cero (6) 1 12 (s) V2 (s)=- -- e2 (s) (7) Se sustituye la ecuación 6 en la 7 ~ e2 V2(s)=--------~------- s ((R¡ + L¡s + _l_)(s + __ 1_) + _1_ ) e¡s R2 e2 e2 y simplificando se llega a: V2 (s) = --------- s3 + P ¡ S 2 + P2S + P3 v (8) 110 Métodos numéricos aplicados a la ingeniería Solución Estableciendo las ecuaciones para el circuito. Figura 2.20 Circuito. (1) (2) 1 v? (t) =- I i2 (t) dt - C2 (3) Aplicando la transformada de Laplace y considerando que las condiciones iniciales son cero, se tiene: (4) 1 /2 (s) 0= - R2 /, (s) + R?/2 (s) + - - -- - C2 (s) (5) Despejando J, (s) de la ecuación 5 y sustituyendo en la ecuación cuatro se tiene: V, J2 (s) = - - - - - - - - " - - - - - - (R, + L,s + I/C,s)(s + lIR2C2) + lIC2 (6) al aplicar la transformada inversa de Laplace a la ecuación 3 y recordando que las condi- ciones iniciales son cero Se sustituye la ecuación 6 en la 7 y simplificando se llega a: V 2 (s) = _1_ /2 (s) C2 (s) (7) (8)
  • 124. • Solución de ecuaciones no lineales 111 con La ecuación 8 puede escribirse: V V? (s) = -------- - (s + a) (s + b) (s + e) cuya transformada inversa de Laplace es ( e:" e !" e-c1 v2 (t) = V + + ----- (b-a) (e-a) (e-b) (a-b) (a-e) (b-e) donde a, b y e son las raíces de la ecuación s3 + PI s2 + P2 S + P3 = O La primera raíz, obtenida con el programa 2.3 del apéndice, es a = - 1.5874547 X 104 Se reduce el grado del polinomio y aplicando la fórmula cuadrática, se tiene b = -4.547618 X 106 + l.310346 X 106 i e = -4.547618 X 106 - l.310346 X 106 i Recuerde que puede utilizar la función roots de Matlab. Estos valores se sustituyen en la ecuación 9 y se tiene: v 2 (t) = 300 ( 0.6e-1.5874547 x ¡O"¡ _e-4·547618 x 10 6 1 [ 0.6 cos (1.310346 X 106t) + 2.072102 sen (l.310346 X 106t) ]) donde t está en segundos y v2 (t) en Kvolts. 2.10 Se tiene una columna articulad a en ambos extremos (véase Fig. 2.21a). Aplicando una car- ga vertical pequeña P (de modo que no se pandee), se obtiene una reacción R de igual mag- nitud y de sentido contrario en la base. Si ahora se aplica una carga horizontal PH se obtiene un pandeo infinitesimal (imperceptible a la vista), que se ha magnificado en la fi- gura 2.2Ib, con fines de ilustración. Si se empieza a "jugar" aumentando P y disminuyen- do PH' de modo que se mantenga el mismo pandeo en la columna, va a llegar un momento (9) Solución de ecuaciones no lineales 111 con v =_ V_1_ =__V_1'------_ C2 L1 75 X 10- 15 La ecuación 8 puede escribirse: V V? (s) =-------- - (s + a) (s + b) (s + e) cuya transformada inversa de Laplace es v2 (t) = V + + - - - - ( e-at e-bt e-GI (b-a) (e-a) (e-b) (a-b) (a-e) (b-e) donde a, b y e son las raíces de la ecuación s3 + PI s2 + P2 S + P3 = O La primera raíz, obtenida con el programa 2.3 del apéndice, es a = - 1.5874547 X 104 Se reduce el grado del polinomio y aplicando la fórmula cuadrática, se tiene b = -4.547618 X 106 + 1.310346 X 106 i e = -4.547618 X 106 - 1.310346 X 106 i Recuerde que puede utilizar la función roots de Matlab. Estos valores se sustituyen en la ecuación 9 y se tiene: v2 (t) = 300 ( 0.6e-1.5874547 x 10 4 ( _e-4·547618 x 106( [ 0.6 cos (1.310346 X 106t) + 2.072102 sen (1.310346 X 106 t) ]) donde t está en segundos y v2 (t) en Kvolts. (9) 2.10 Se tiene una columna articulada en ambos extremos (véase Fig. 2.2Ia). Aplicando una car- ga vertical pequeña P (de modo que no se pandee), se obtiene una reacción R de igual mag- nitud y de sentido contrario en la base. Si ahora se aplica una carga horizontal PH se obtiene un pandeo infinitesimal (imperceptible a la vista), que se ha magnificado en la fi- gura 2.2Ib, con fines de ilustración. Si se empieza a "jugar" aumentando P y disminuyen- do PH' de modo que se mantenga el mismo pandeo en la columna, va a llegar un momento
  • 125. ~~_.~~----~~--------~----------------------------------------------------~----------------~--~-- 112 Métodos numéricos aplicados a la ingeniería P P y..,¿.----+y Figura 2.21 Columna articulada. Res la reacción de la carga. x! R=P e) e en que PH valga cero y el valor de P correspondiente será llamado la carga crítica de pan- deo Pc. Para obtener esta carga crítica se hace un análisis de la estabilidad de la columna, usando la proposición de Jacobo Bernoulli: la curvatura producida en una viga debida a la flexión es directamente proporcional al momento flexionante e inversamente proporcional a la rigidez, es decir: K=~ El' donde K es la curvatura, M el momento flexionante, E es el módulo de elasticidad del ma- terial e 1el momento de inercia que depende de la forma de la sección transversal de la co- lumna. El producto El se conoce como la rigidez a la flexión de la columna. Por otro lado I I . K=---¡::::::.==:==- 11+ ( dy )2 Y dx y ya que el pandeo es infinitesimal 2 (las pendientes de las tangentes a la curva elásti- ca) son muy pequeñas, despreciándose y quedando entonces la curvatura aproximada por d2 y K""-- dx? De igual modo se tiene que M = -Py, donde el signo es convencional. Sustituyendo se tiene Py -o El' Haciendo A = ~ y observando que el desplazamiento y de la columna en ambos extro- El mos es nulo se tiene el siguiente problema de valores en la frontera: d2 y --+A2 y=0 dx2 y (O) = O Y (L) = O 112 Figura 2.21 Columna articulada. Res la reacción de la carga. Métodos numéricos aplicados a la ingeniería p p ";NJ----+y b) e) en que PH valga cero y el valor de P correspondiente será llamado la carga crítica de pan- deo Pc. Para obtener esta carga crítica se hace un análisis de la estabilidad de la columna, usando la proposición de Jacobo Bernoulli: la curvatura producida en una viga debida a la flexión es directamente proporcional al momento flexionante e inversamente proporcional a la rigidez, es decir: K = ~ El' donde K es la curvatura, M el momento flexionante, E es el módulo de elasticidad del ma- terial e 1el momento de inercia que depende de la forma de la sección transversal de la co- lumna. El producto El se conoce como la rigidez a la flexión de la columna. Por otro lado K=--¡::::== = =- 11+ ( dy )2 Y dx y ya que el pandeo es infinitesimal:; (las pendientes de las tangentes a la curva elásti- ca) son muy pequeñas, despreciándose y quedando entonces la curvatura aproximada por d2y K"" - - dx2 De igual modo se tiene que M = - Py, donde el signo es convencional. Sustituyendo se tiene Py - o El' Haciendo A=~ y observando que el desplazamiento y de la columna en ambos extro- El mos es nulo se tiene el siguiente problema de valores en la frontera: d 2y --+A2 y=0 dx 2 y (O) = O Y (L) =O
  • 126. z= =EZ ; Solución de ecuaciones no lineales 113 ')()---+) Y Figura 2.22 Columna articulada y empotrada en 'la base. x R=P cuya solución analítica da lugar a Si ahora se tiene una columna articulada por arriba y empotrada en el piso (véase Fig. 2.22) Y se quiere conocer la carga crítica de pandeo correspondiente, el análisis de la esta- bilidad de la columna conduce al problema de valores en la frontera siguierite: d2y HA__ +~2y= X dx? f, El y (O) ~ O Y (L) = O y' (L) = O La solución analítica de este tipo de problemas produce, en pasos intermedios, ecua- ciones no lineales en una incógnita. Así, para nuestro problema, se tiene: 'AL = tan 'AL que habrá que resolver para encontrar y en función de x. Solución Con el objeto de simplificar, haremos, x = 'AL con lo que la ecuación anterior queda: tan x = x Resolviendo con el método de Newton-Raphson se obtiene x = 4.493409. ~ 2.11 La respuesta de un sistema de control de retroalimentación simple, mostrado en la figura 2.23, está dada por la expresión" c= G1G2R+~U l+G l+G donde G = G¡G2 H. Cuando el factor del denominador, 1 + G, se Iguala a cero, se obtiene la ecuación característica del sistema de lazo cerrado. Las raíces de la ecuación caracterís- tica determinan la forma o tipo de la respuesta C(t) a cualquier función forzante particular R(t) o U(t) . • Cughanowr, Process Systems Analysis and Control, Second Edition, McGraw Hill Intemational Editions. Figura 2.22 Columna articulada y empotrada en ' la base. Solución de ecuaciones no lineales 113 -----+) Y R=P x cuya solución analítica da lugar a Si ahora se tiene una columna articulada por arriba y empotrada en el piso (véase Fig. 2.22) Yse quiere conocer la carga crítica de pandeo correspondiente, el análisis de la esta- bilidad de la columna conduce al problema de valores en la frontera siguierite: d2y HA dx 2 + ')..} y = El x y (O) ~ O Y (L) = O y' (L) = O La solución analítica de este tipo de problemas produce, en pasos intermedios, ecua- ciones no lineales en una incógnita. Así, para nuestro problema, se tiene: AL =tan AL que habrá que resolver para encontrar y en función de x. Solución Con el objeto de simplificar, haremos, x = AL con lo que la ecuación anterior queda: tan x =x Resolviendo con el método de Newton-Raphson se obtiene x = 4.493409. 6 2.11 La respuesta de un sistema de control de retroalimentación simple, mostrado en la figura 2.23, está dada por la expresión* c= G1G2R+~U l+G l+G donde G = G¡G2H. Cuando el factor del denominador, 1 + G, se Iguala a cero, se obtiene la ecuación característica del sistema de lazo cerrado. Las raíces de la ecuación caracterís- tica determinan la forma o tipo de la respuesta C(t) a cualquier función forzante particular R(t) o U(t) . • Cughanowr, Process Systems Analysis and Control, Second Edition, McGraw Hill Intemational Editions.
  • 127. 114 Métodos num éricos aplicados a la ingeniería Figura 2.23 R Sistema de control de retroalimentación simple. I---r-- ..•.C El método de lugar geométrico de las raíces es un procedimiento gráfico para encon- trar las raíces de 1 + G = O, cuando uno de los parámetros de G varía continuamente. En este caso el parámetro que variará es la ganancia (o sensitividad) Kc del controlador. En el diagrama de bloques de la figura 2.23 G¡=Kc 1 G2 =------ ("r¡s + 1)("r2 s + 1) 1 H=-- "r3s+ 1 Para este caso, la función de transferencia de lazo abierto es: K G(s) = ------- (s - p¡)(s - P2)(S - P3) va raíces; incre 0.1 pa con ir que puede escribirse en la forma b) Di; lugar I de Se llama a los términos p¡, P2 YP310s polos de la función de transferencia de lazo abier- to. Un polo de G(s) es cualquier valor de s para el cual G(s) es infinito. Por tanto p¡ = -llr¡ es un polo de G(s). La ecuación característica del sistema de lazo cerrado es: K 1 + -------- = O (s - p¡)(s - P2)(S - P3) Esta expresión puede escribirse: (s - p¡)(s - P2)(s - P3) + K = O Si por ejemplo, los polos fueran -1, -2 Y-3, respectivamente, tendríamos: (s + l)(s + 2)(s + 3) + K = O donde K = 6Kc. Expandiendo el producto de esta ecuación resulta: s3 + 6s2 + lIs + (K + 6) = O, 114 Métodos numéricos aplicados a la ingeniería Figura 2.23 R Sistema de control de retroalimentación simple. El método de lugar geométrico de las raíces es un procedimiento gráfico para encon- trar las raíces de 1 + G = O, cuando uno de los parámetros de G varía continuamente. En este caso el parámetro que variará es la ganancia (o sensitividad) Kc del controlador. En el diagrama de bloques de la figura 2.23 G¡ =Kc 1 G2 = - - -- - - ('r¡s + 1)('r2s + 1) 1 H =-- 'r3s + 1 Para este caso, la función de transferencia de lazo abierto es: que puede escribirse en la forma K G(s) = - - - - - - - (s - p¡)(s - P2)(S - P3) Se llama a los términos p¡, P2 YP310s polos de la función de transferencia de lazo abier- to. Un polo de G(s) es cualquier valor de s para el cual G(s) es infinito. Por tanto p¡ =-111"¡ es un polo de G(s). La ecuación característica del sistema de lazo cerrado es: K 1 + - - - - - - - - = O (s - p¡)(s - P2)(S - P3) Esta expresión puede escribirse: (s - p¡)(s - P2)(S - P3) + K =O Si por ejemplo, los polos fueran -1, -2 Y-3, respectivamente, tendríamos: (s + l)(s + 2)(s + 3) + K = O donde K = 6Kc. Expandiendo el producto de esta ecuación resulta: s3 + 6s2 + lIs + (K + 6) =O,
  • 128. ¡er- -!lr¡ una ecuación polinomial de tercer grado en s. Para cualquier valor particular de la ganan- cia del controlador Kc' podemos obtener las raíces de la ecuación característica. Por ejem- plo, si K, = 4.41 (K = 26_5), tenemos: s3 + 6s2 + l l s + 32.5 = O - - -K Raíz real 1 a 1 b ..•. 0.000 -1.00000 -2.00000 -3.00000 h 0.100 -1.05435 -1.89897 -3.04668 ~ 0.200 -1.12111 -1.79085 -3.08803 0.300 -1.21352 -1.66106 -3.12542 0.11.00 _<'1<;070 _1 d?01<; -o no<?o- ._1" crvv 1) -oin'i Af-... n ~~ AnA'lC __ " nCAAI") K Raíz real 1 a 1 b ....I0.381 -1.37583 -1.47078 -3.15340 0.382 -1.38220 -1.46407 -3.15373 O:lR:l -1.38984 -1.45610 -3.15407- • 0.384 -l.4UUUU -1.44!JtiU -::l.1!J44U • 0.386 -3.15507 -1.42247 -0.02520 o.ss. w,;~,.I!J!J4L - .4ZZ::lL -U.U::l4tll K Raíz real 1. a I b ..•. t59.996 -5.99991 -0.00004 3.31655 -59.997 -5.99994 -0.00003-- 3.31657 - 59.998 -5.99996 -0.00002 3.31659 59.999 -5.99998 -0.60001 --- 3.31661 ~ tJU.UUL -tJ.uuuuu ; -UoUUUUU ~.~ltJtJ¿ 60.001 -6.00002 -0.00001 3.31664 er oo~ _~ 0000.11. -o OOOO? q q1~~~ 60.003 -6.00006 -0.00003 3.31668 ~OOOA _~ 00((0 _(((((.11. q'H~7( - Solución de ecuaciones no lineales 115 3.958 v.l/ I K3=60 I1- .../ 1/ / I 1/ I K2=0.384 ~ 1 Resolviendo por el método de Newton Raphson se encuentra una raíz real; posteriormen- te se degrada el polinomio con división sintética y se resuelve la ecuación cuadrática re- sultante, dando en este caso: a) Figura 2.24 a) Tabla de valores de las raíces; arriba con incrementos de 0.1para K; abajo con incrementos de 0.001. b) Diagrama del lugar geométrico de las raíces. 3.166 2.375 1.583 0.792 0.000 -0.79 -1.58 -2.37 -3.16 -3.95 -6.713 -5.299 -3.885 -2.471 -1.057 0.357 -6.006 -4.592 -3.178 -1.764 -0.350 b) r¡ = -5.10, r2 = -0.45 - 2.5}, r3= -0.45 + 2.5j. Seleccionando otros valores de K, se obtienen otros conjuntos de raíces. Para facilitar los cálculos se elaboró el PROGRAMA 2.8 (lugar geométrico de las raíces) que permite obte- ner estos conjuntos de raíces para diferentes valores de K, desde un valor inicial K = O, hasta algún valor seleccionado y con incrementos también seleccionados. El programa también grafica estos conjuntos de raíces, con lo que puede verse el lugar geométrico de las raíces. A continuación mostramos un segmento de la tabla generada por el programa para un valor máximo de K = 100 con incrementos de 0.1 y la gráfica respectiva. Las cel- das con fondo blanco representan raíces reales; las celdas con fondo amarillo representan la parte real y las azules la parte imaginaria de las raíces complejas, que aparecen siempre conjugadas a ± bj. Para simplificar la presentación, el programa escribe en la tabla sólo los valores de a y b. Nótese que hay tres ramas correspondientes a las tres raíces y que dichas ramas "emergen" o empiezan (para K = O) en los polos de la función de transferencia de lazo abierto (-1, -2, -3). El diagrama del lugar geométrico de las raíces es simétrico con res- pecto al eje real para cualquier sistema. Esto se debe al hecho de que la ecuación caracte- rística para un sistema físico tiene coeficientes reales y, por tanto, las raíces complejas de dicha ecuación aparecen en pares conjugados. El diagrama del lugar geométrico de las raíces tiene la ventaja de dar una idea a pri- mera vista del tipo de respuesta cuando se cambia continuamente la ganancia del contro-
  • 129. 'r~-----------------------------------------------------------------------------------------------=------=-=-- 116 Métodos numéricos aplicados a la ingeniería lador. Por ejemplo, el diagrama de la figura 2.24b revela dos valores críticos de K; uno es donde se hacen iguales dos de las raíces, y el otro es donde dos de las raíces son imagina- rios puros. Por tanto, si las raíces son todas reales, lo cual ocurre para K < K2 = 0.384 (Fig. 2.24b), la respuesta será no oscilatoria. Si dos de las raíces son complejas y tienen partes reales negativas (K2 < K < K3), la respuesta comprende términos senoidales amortiguados, que produce una respuesta oscilatoria. Si K> K3 dos de las raíces son complejas y tienen partes reales positivas, y la respuesta es senoidal creciente. 2.12 Es difícil situar el origen de los métodos numéricos; sin embargo, se conocía ya en Babilonia el método para calcular aproximaciones de raíces cuadradas, que contiene todos los elementos que caracterizan los métodos numéricos de hoy en día, excepto quizás por el uso de la computadora. Veamos por ejemplo cómo aproximaban ti. Tomaban un primer valor inicial: ~ = 1;30* [ ~ = 1;5] Como resultaba una aproximación mayor que el valor correcto ya que (~r = ~ = 2;15 > 2**, [ ( ~ r= ~ = 2.25]. Obtenían un segundo valor inicial que quedaba por abajo del valor correcto, dividiendo 2 por 3/2. El resultado es: 2 4 2 4 -- = -- = 1;20 [ -- = -- = 1.333333 ... ] (el resultado no es un decimal exacto) 3 3 3 3 2 2 Ahora se tienen dos valores, uno mayor y uno menor que el valor correcto; se obtiene una mejor aproximación de ti sacando la media artimética de ellos: media de 1;30 Y 1.5 + 1.333333 ... 1;20 es 1;25 [ = 1.416666 ... ], que resultaba mayor al valor correcto: 2 (1:25)2 =2;0,25 [(1.416666 ... )2 = 2.006943 ... ] Por tanto, 2 dividido por 1;25 da 1;24,42,21 [ 2 =1.411765 ... ], que es más peque- 1.416666 . ño que el valor correcto: [(1.411765 ... )2 = 1.993080 ]. El valor medio de estas dos últi- mas aproximaciones que encierran el valor correcto es: [ 1.416666 ... + 1.411765 ... ] 1;25 y 1;24,42,21 es 1;24,51,10 2 = 1.414215 ... ], (1.414215 ... )2 = 2.000004066225 este valor resulta ser la aproximación encontrada en nuestros textos.[2 = 1.414213562373 en calculadoras modernas. Comentarios. Conviene destacar varios aspectos, como por ejemplo: a) Se emplea un sistema numérico posicional (base 60) desarrollado por los babilo- nios para sus trabajos astronórnicos y matemáticos . • Nótese el uso del sistema sexagesimal (base 60): horas; minutos, segundos o grados; minutos, segundos y que la fracción 30 viene de multiplicar la fracción decimal 0.5 por 60. Entre [ lse escriben los valores en el siste- madecimal. •• La fracción sexagesimal 15 viene de multiplicar 0.25 por 60. 116 Métodos numéricos aplicados a la ingeniería lador. Por ejemplo, el diagrama de la figura 2.24b revela dos valores críticos de K; uno es donde se hacen iguales dos de las raíces, y el otro es donde dos de las raíces son imagina- rios puros. Por tanto, si las raÍCes son todas reales, lo cual ocurre para K < K2 = 0.384 (Fig. 2.24b), la respuesta será no oscilatoria. Si dos de las raÍCes son complejas y tienen partes reales negativas (K2 < K < K3), la respuesta comprende términos senoidales amortiguados, que produce una respuesta oscilatoria. Si K> K3 dos de las raíces son complejas y tienen partes reales positivas, y la respuesta es senoidal creciente. 2.12 Es difícil situar el origen de los métodos numéricos; sin embargo, se conocía ya en Babilonia el método para calcular aproximaciones de raíces cuadradas, que contiene todos los elementos que caracterizan los métodos numéricos de hoy en día, excepto quizás por el uso de la computadora. Veamos por ejemplo cómo aproximaban ti. Tomaban un primer valor inicial: ~ = 1;30* [ ~ = 1;5] Como resultaba una aproximación mayor que el valor correcto ya que (~ r= ~ = 2;15 > 2**, [ ( ~r= ~ = 2.25]. Obtenían un segundo valor inicial que quedaba por abajo del valor correcto, dividiendo 2 por 3/2. El resultado es: 2 4 2 4 - = - = 1;20 [ - = - = 1.333333...] (el resultado no es un decimal exacto) 3 3 3 3 2 2 Ahora se tienen dos valores, uno mayor y uno menor que el valor correcto; se obtiene una mejor aproximación de ti sacando la media artimética de ellos: media de 1;30 Y 1.5 + 1.333333... 1;20 es 1;25 [ = 1.416666.. .], que resultaba mayor al valor correcto: 2 (1:25)2 =2;0,25 [(1.416666...)2 = 2.006943...] Por tanto, 2 dividido por 1;25 da 1;24,42,21 [ 2 =1.411765 ...], que es más peque- 1.416666... ño que el valor correcto: [(1.411765 ...)2 = 1.993080...]. El valor medio de estas dos últi- mas aproximaciones que encierran el valor correcto es: [ 1.416666... + 1.411765... ] 1;25 y 1;24,42,21 es 1;24,51,10 2 = 1.414215...], (1.414215 ...)2 = 2.000004066225 este valor resulta ser la aproximación encontrada en nuestros textos.[2 = 1.414213562373 en calculadoras modernas. Comentarios. Conviene destacar varios aspectos, como por ejemplo: a) Se emplea un sistema numérico posicional (base 60) desarrollado por los babilo- nios para sus trabajos astronómicos y matemáticos. • Nótese el uso del sistema sexagesimal (base 60): horas; minutos, segundos o grados; minutos, segundos y que la fracción 30 viene de multiplicar la fracción decimal 0.5 por 60. Entre [ 1se escriben los valores en el siste- ma decimal. •• La fracción sexagesimal 15 viene de multiplicar 0.25 por 60.
  • 130. / Solución de ecuaciones no lineales 117 b) Es un método de dos puntos que encierran el valor buscado para luego tomar el punto medio (bisección). e) El orden de convergencia parece ser cuadrático porque el riúmero de cifras signi- ficativas correctas se duplica en cada iteración. d) Hay un criterio de terminación sustentado en la exactitud requerida por ellos pa- ra sus cálculos. e) Este método puede extenderse para resolver cierto tipo de ecuaciones polinómi- cas (véase Probo 2.19). f) Es un algoritmo que puede programarse fácilmente en una computadora. Problemas 2.1 Dadas las siguientes expresiones para x = g (x), obtenga g/ex) y dos valores iniciales que satisfagan la condición I g/ (x) I < 1 1 a) x=--- (x + 1)2 ( X - 1 )b)x=4+ -- x+I e) x = sen x d) tan x = In x ( 6 - X _X 3 )1/2 e) x = 4 sec x j) x=-- 2 2.2 Determine una g (x) y un valor inicial X o tales que I g/ (x) I < 1 en las siguientes ecuaciones: e) sen x + In x = O d) e-tanx=O e) )x3sen x - In (cos x) = 3 2.3 Resuelva por el método de punto fijo las ecuaciones de los problemas anteriores. 2.4 Generalmente hay muchas maneras de pasar de f (x) = O a x = g (x) e incluso se pueden obtener distintas formas de g (x) al "despejar" x de un mismo término de f (x). Por ejemplo, en la ecuación polinomial al "despejar" x del primer término se puede llegar a: a) x = 3) 2x + 2 2 2 e) X=-+- x x2 b) x = h + 2/x ¿Cuál g (x) sería más ventajosa para encontrar la raíz que está en el intervalo (1, 2)? Calcule con un mismo valor inicial dicha raíz emplenado las tres g (x) y compare resul- tados. 2.5 Utilice la fórmula de Francis (véase ejercicio 2.3) a) Encuentre una expresión H = g (H) tal que usando como valor inicial H = B/2, el método de punto fijo prometa convergencia (quizá sea necesaria una g (H) distinta para cada pareja B, Q dada). b) Con los valores de B y Q dados en el ejercicio 2.3 y los resultados del inciso a), calcu- le los respectivos valores de H que satisfacen la ecuación de Francis. / Solución de ecuaciones no lineales 117 b) Es un método de dos puntos que encierran el valor buscado para luego tomar el punto medio (bisección). e) El orden de convergencia parece ser cuadrático porque el riúmero de cifras signi- ficativas correctas se duplica en cada iteración. d) Hay un criterio de terminación sustentado en la exactitud requerida por ellos pa- ra sus cálculos. e) Este método puede extenderse para resolver cierto tipo de ecuaciones polinómi- cas (véase Probo 2.19). f) Es un algoritmo que puede programarse fácilmente en una computadora. Problemas 2.1 Dadas las siguientes expresiones para x = g (x), obtenga g'(x) y dos valores iniciales que satisfagan la condición I g'(x) I < 1 1 a) x= - - - (x + 1)2 d) tan x = In x b) x=4+ - - ( X - 1 ) x+1 ( 6 - X_X3)1I2 e) x = 4 e) x = sen x sec x j) x = - - 2 2.2 Determine una g (x) y un valor inicial X otales que I g' (x) I < 1 en las siguientes ecuaciones: e) sen x + In x = O d) e' -tanx=O e) ) x3sen x - In (cos x) = 3 2.3 Resuelva por el método de punto fijo las ecuaciones de los problemas anteriores. 2.4 Generalmente hay muchas maneras de pasar de f (x) = O a x = g (x) e incluso se pueden obtener distintas formas de g (x) al "despejar" x de un mismo término de f (x). Por ejemplo, en la ecuación polinomial al "despejar" x del primer término se puede llegar a: a) x = 3) 2x + 2 b) x = h + 2/x 2 2e) X=-+- x x2 ¿Cuál g (x) sería más ventajosa para encontrar la raíz que está en el intervalo (1, 2)? Calcule con un mismo valor inicial dicha raíz emplenado las tres g (x) y compare resul- tados. 2.5 Utilice la fórmula de Francis (véase ejercicio 2.3) a) Encuentre una expresión H = g (H) tal que usando como valor inicial H = B/2, el método de punto fijo prometa convergencia (quizá sea necesaria una g (H) distinta para cada pareja B, Qdada). b) Con los valores de B y Q dados en el ejercicio 2.3 y los resultados del inciso a), calcu- le los respectivos valores de H que satisfacen la ecuación de Francis.
  • 131. 118 Métodos numéricos aplicados a la ingeniería 2.6 Sea el polinomio de grado n en su forma más general f (x) = a,¡x" + an_l xn-l + an _ 2 x',-2 + ... + al x + ao a) Calcule el número de multiplicaciones y sumas algebraicas necesarias para evaluar f (x) en un punto dado mediante el método de Homer. b) Calcule el número de multiplicaciones y sumas algebraicas requeridas para evaluar f (x) en un punto dado usando la forma tradicional. Al comparar las cantidades de los incisos (a) y (b), encontrará que el número de multiplicaciones y sumas algebraicas en el arreglo de Homer se reduce prácticamente a la mitad. Como cada multiplicación in- volucra errores de redondeo, este método de evaluación es más exacto y rápido. 2.7 Elabore un programa que evalúe polinomios según la regla de Homer. 2.8 Resuelva las siguientes ecuaciones por medio del método de Newton-Raphson, a) In x - x + 2 = O e) x - 2 cos x = O b) xex-2=0 d) x3 - 5x =-1 2.9 Resuelva los siguientes sistemas de ecuaciones por medio del método de Newton-Raphson a) 2x3-y=0 b) 2x2_y=0 x3-2-y3=0 x=2_y2 e) x2 + 5X y2 -3z + 1 = O d) (x_l)1/2 + y x -5 = O x - sen y = 1 Y - sen x2 = O y-e-z=O 2.10 La manera más simple de evitar el cálculo de f' (x) en el método de Newton-Raphson es remplazarf'(x) en la ecuación 2.12 con un valor constante m. La fórmula resultante f(x) x.+l=x.- -- "m define un método de convergencia lineal para m en cierto intervalo de valores. a) Utilice este algortimo, conocido como el método de Wittaker, para encontrar una raíz real de la ecuación l ' f (x ) = x3 + 2 x2 +10 x - 20 = O b) Con este algoritmo encuentre una raíz en el intervalo (1.5, 2.5) de la ecuación f(x) = x3 - 12 x2 + 36 x - 32 = O 2.11 Demuestre que en el método de Newton-Raphson g' (x) = OYg " (x) ::f:. Opara raíces rea- les no repetidas. 2.12 Dado un polinomio de grado n (1) elabore un programa para encontrar todas las raíces reales y complejas de P" (x), median- te el método de Newton-Raphson. El programa deberá tener incorporada la división sintética para: a) Evaluar polinomios. b) Degradar polinomios cada vez que se encuentre una raíz (véase Seco 2.10).
  • 132. Solución de ecuac iones no lineales 119 2.13 Demuestre que en el método de Newton-Raphson f" (x) 2!1' (x) SUGERENCIA: Utilice la ecuación E2 E3 E = g' (x) E + g" (x) -' + g'" (x) -' + ... ,+1 1 2! 3! y los resultados del problema 2.11 2.14 El siguiente algoritmo se conoce como método de Richmond y es de tercer orden 2f(x)f' (x¡) Xi+1 =x¡- 2rJ/(x)]2_f(x)f" (x) Resuelva las ecuaciones de los problemas 2.8 y 2.9 con este algoritmo y compare los re- sultados con los obtenidos con el método de Newton Raphson; por ejemplo, la velocidad de convergencia y el número de cálculos por iteración. 2.15 Obtenga la expresión 2.14 del algoritmo de posición falsa, utilizando la semejanza de los triángulos rectángulos cuyos vértices son: A XI X M y BX D X w en la figura 2.7 2.16 La expresión 2.13, puede escribirse también X i _1 f (x) - xJ (xi _ 1 ) x· 1 =1+ f(x)-f(xi _ 1 ) Explique por qué, en general, es más eficiente la ecuación 2.13 que la ecuación anterior en la aplicación del método de la secante. 2.17 Resuelva por el método de la secante, posición falsa o bisección las siguientes ecuaciones a) x log x-lO = O b) sen x - ese x + 1 = O e) e' + 2-X + 2 cos x - 6 = O á) eX + x3 + 2x2 + lOx - 20 = O l SUGERENCIA: Utilice un análisis preliminar de estas funciones para obtener valores iniciales apropiados. 2.18 Elabore un programa para encontrar una raíz de f (x) = O, por el método de posición falsa, dada f (x) como una tabla de valores. 2.19 Encuentre una aproximación a 3[2 y a f3 mediante el método de la bisección. El cálculo deberá ser correcto en cuatro dígitos significativos. Sugerencia: considere f (x) = x3 - 2 = O Yf (x) = x2 - 3 = O, respectivamente. 2.20 Utilice la expresión 2.15 para hallar el número aproximado de iteraciones n a fin de en- contar una raíz de x2 + 10 cos x = O con una aproximación de 10-3. Encuentre además dicha raíz. 2.21 Aplique el método de bisección y el de posición falsa a la ecuación 7x-3 ----=0 (x - 0.45)2 Use los intervalos (0.4, 0.5) Y (0.39, 0.53). Explique gráficamente los resultados. 2.22 Demuestre que en el caso de convergencia de una sucesión de valores xo' xi' x2' •.. a una raíz x en el método de punto fijo se cumple que Solución de ecuacion es no lineales 119 2.13 Demuestre que en el método de Newton-Raphson SUGERENCIA: Utilice la ecuación f 11 (x) 2!1' (x) E 2 E 3 E . = g' (x) E + gil (x) _ ' + gil' (x) - ' + ... 1+1 1 2! 3! y los resultados del problema 2.11 2.14 El siguiente algoritmo se conoce como método de Richmond y es de tercer orden 2f(x)f' (x¡) Xi + 1 = x¡- 2rJ'(x)]2 _ f(x)f" (x) Resuelva las ecuaciones de los problemas 2.8 y 2.9 con este algoritmo y compare los re- sultados con los obtenidos con el método de Newton Raphson; por ejemplo, la velocidad de convergencia y el número de cálculos por iteración. 2.15 Obtenga la expresión 2.14 del algoritmo de posición falsa, utilizando la semejanza de los triángulos rectángulos cuyos vértices son: A XI XM y Bxo Xw en la figura 2.7 2.16 La expresión 2.13, puede escribirse también Xi _1 f (x) - xJ (xi _ J ) x· 1 =1 + f(x) - f(xi _ 1 ) Explique por qué, en general, es más eficiente la ecuación 2.13 que la ecuación anterior en la aplicación del método de la secante. 2.17 Resuelva por el método de la secante, posición falsa o bisección las siguientes ecuaciones a) x log x-lO = O b) sen x - csc x + 1 = O e) eX + 2-x + 2 cos x - 6 =O á) eX + x3 + 2x2 + lOx - 20 = O SUGERENCIA: Utilice un análisis preliminar de estas funciones para obtener valores iniciales apropiados. 2.18 Elabore un programa para encontrar una raíz def (x) =O, por el método de posición falsa, dadaf (x) como una tabla de valores. 2.19 Encuentre una aproximación a 3f2 y a f3 mediante el método de la bisección. El cálculo deberá ser correcto en cuatro dígitos significativos. Sugerencia: considere f (x) =x3- 2 =OYf (x) =x2 - 3 =O, respectivamente. 2.20 Utilice la expresión 2.15 para hallar el número aproximado de iteraciones n a fin de en- contar una raíz de X2 + 10 cos x = O con una aproximación de 10-3. Encuentre además dicha raíz. 2.21 Aplique el método de bisección y el de posición falsa a la ecuación 7x-3 ---~ = O (x - 0.45)2 Use los intervalos (0.4, 0.5) Y(0.39, 0.53). Explique gráficamente los resultados. 2.22 Demuestre que en el caso de convergencia de una sucesión de valores xo' xi' x2' ... a una raíz x en el método de punto fijo se cumple que
  • 133. 120 Métodos numéricos aplicados a la ingeniería E· 1 lím _,+_ = g' (x) ,-+0-:. E. 1 2.23 Las siguientes sucesiones convergen y los límites de convergencia de cada una se dan al lado derecho (_ 1 ) k a) xk=--- k lím {xk } = O k->oc b) xn = n In ( 1 + lIn) 2k+1 + ( _ l)k e) xk = -----,---- 2k ti) xk=l+e-k lím {xn } = 1 k->oc lím {xk } = 2 k->oc lím {xk } = 1 k->e< Genere en cada inciso la sucesión finita: xl' x2' x3, ... , XJO Aplique después el algoritmo de Aitken a estas sucesiones para generar las nuevas suce- siones x' l' x' 2' X' 3' ... observe qué ocurre y dé sus conc1uisiones. 2.24 Modifique el algoritmo 2.5 de Steffensen, incorporando una prevención para el caso en que el denominador de la ecuación 2.22 sea muycercano a cero. 2.25 Encuentre una aproximación 3[2 Y a f3 con el método de Sú~ffensen. El cálculo deberá ser correcto en cuatro dígitos significativos. Compare los resultados con los obtenidos en el problema 2.19. 2.26 Aproxime una solución para cada una de las siguientes ecuaciones con una aproximación de 10-5, usando el método de Steffensen con X o = O. a) 3x-x2+ex-2=0 b) 4.1x2-1.3eX=0 e) x2+2xeX-e2x =0 2.27 Encuentre la gráfica aproximada de las siguientes funciones en los intervalos indicados 2 a) f(x) = eX + X - 1000; (1, 10) b) f(x) = Xl- 2x + 10; (-=,00) e) f(x) = 4 (x - 2)l/3 + sen (3x); [0,00) ti) f(x) = he-x2/2 ; - 00 < X < 00 e) f (x) = x2 - 4 + In 3x + 5 sen x 2.28 Utilizando el método del Newton-Raphson con valores iniciales complejos (a + bi), en- cuentre las raíces complejas del polinomio f (x) = x3 + 4x + 3x2 + 12 2.29 Utilizando el método de Müller con valores iniciales reales, encuentre las raíces comple- jas del polinomio del problema 2.28. 2.30 Encuentre las raíces faltan tes de la ecuación polinomial usada a lo largo del capítulo para ilustrar los distintos métodos f(x) = x3 + 2X2+ 10 x - 20 = O, pero usando ahora el método de Newton-Raphson con valores iniciales complejos. 2.31 La solución general de la ecuación polinomial p (x) = ao + al x + a2 x2 120 Métoc;los numérico s aplicados a la ingeniería E · I lím _ ,+_ = g' (x) , -+0:: E . 1 2.23 Las siguientes sucesiones convergen y los límites de convergencia de cada una se dan al lado derecho (_ 1 ) k a) xk = - -- k b) xn = n In ( 1 + lIn) 2k+1 + ( _ l)k e) xk = ----,---- - 2k d) xk = l+e-k lím {xk } =O k-> oc lím {xn } = 1 k ->oc lím {xk } = 2 k-> oc lím {xk } = 1 k-> cx Genere en cada inciso la sucesión finita: x I' x2' x3, .. . , xlO Aplique después el algoritmo de Aitken a estas sucesiones para generar las nuevas suce- siones x' l' x'2' X' 3' ... observe qué ocurre y dé sus conc1uisiones. 2.24 Modifique el algoritmo 2.5 de Steffensen, incorporando una prevención para el caso en que el denomiQador de la ecuación 2.22 sea muy·cercano a cero. 2.25 Encuentre una aproximación 3[2 y a f3 con el método de Stf:ffensen. El cálculo deberá ser correcto en cuatro dígitos significativos. Compare los resultados con los obtenidos en el problema 2.19. 2.26 Aproxime una solución para cada una de las siguientes ecuaciones con una aproximación de 10-5, usando el método de Steffensen con X o=O. a) 3x-x2 + ex -2 = 0 b) 4.1x2 - 1.3eX=0 e) x2 + 2xeX - e2x =0 2.27 Encuentre la gráfica aproximada de las siguientes funciones en los intervalos indicados 2 a) f (x) = eX + x - 1000; (1 , 10) b) f(x) =:x!< - 2x + 10; (-=,00) e) f(x) =4 (x - 2)l/3 + sen (3x); [0,00) d) f(x) = he-x2/2 ; - 00 < x < 00 e) f (x) =x2 - 4 + In 3x + 5 sen x 2.28 Utilizando el método del Newton-Raphson con valores iniciales complejos (a + bi), en- cuentre las raÍCes complejas del polinomio f (x) = x3 + 4x + 3x2 + 12 2.29 Utilizando el método de Müller con valores iniciales reales, encuentre las raíces comple- jas del polinomio del problema 2.28. 2.30 Encuentre las raíces faltantes de la ecuación polinomial usada a lo largo del capítulo para ilustrar los distintos métodos f(x) =x3 + 2x2 + 10 x - 20 =O, pero usando ahora el método de Newton-Raphson con valores iniciales complejos. 2.31 La solución general de la ecuación polinomial p (x) = ao+ al x + a2 x2
  • 134. Solución de ecuactories no lineales 121 es a) Demuestre que Xlx2 =ac!a2 b) Utilizando a), demuestre que una forma alterna para encontrar las raíces de p (x) = ao + al x + a2 x2 = O es 2 ao Xl=----~~====~ -al + J a'[ - 4aOa2 e) Calcule la raíz x2 de p (x) = x2 + 81 x - 0.5 = O usando aritmética de cuatro dígitos con las dos formas presentadas y sustituya ambos re- sultados en p (x). Compare la exactitud de los resultados y explique la diferencia. Puede usar Mathematica o Fortan. d) Calcule la raíz Xlde p (x) = x2 + 81 x - 0.5 = O 2.32 Elabore un programa de propósito general para encontrar todas las raíces reales y comple- jas de una ecuación polinomial de la forma Pn (x) = ao + al x + a2 x2 + ... + anxn con el método de Müller. 2.33 El siguiente algortimo, de orden tres, es conocido como método de Laguerre np(x) . X i + 1 = Xi - ------':==_ , t = O, 1, 2, ... p' (x) ± JH (x) donde n es el grado de la ecuación polinornial p ( x ) = O, cuyas raíces se desea encontrar H (x) = (n-1) [(n-1) (P'(xi ))2 - np (x) p" (x)] y el signo del radical queda determinado por el signo de p' (x). Este método, que funciona con orden 3 para polinornios CUyáSraíces son todas reales y dis- tintas, converge sólo linealmente para raíces múltiples. En el caso de raíces complejas poco se sabe del orden de convergencia; no obstante, ésta es alta para raíces complejas simples. Fi- nalmente, se hace la observación de que un valor de Xi real pude producir una H (x) nega- tiva y, por tanto, generar un valor de xi + l complejo y eventualmente levar a una raíz compleja de la ecuación p (x) = O. Resuelva las siguientes ecuaciones con el método de Laguerre a) x4 - 8.2 x3 + 39.41 x2 - 62.26 x + 30.25 = O b) x4 - 15.2 x3 + 59.7 x2 - 81.6 x + 36 = O e) x5 - 10 x4 + 40 x3 - 80 x2 + 79 x - 30 = O á) x5 - 3.7 x4 + 7.4 x3 - 10.8 x2 +10.8 x - 6.8 = O 2.34 Se ha encontrado una simplificación" al algoritmo de Müller (véase algoritmo 2.6), y es • Hildebrand, B. Introduction lo Numerical Analysis. 2a. ed. McGraw-Hill (1974) pp. 580-581. Solución de ecuaciones no lineales 121 es a) Demuestre que xlxl =ar!al b) Utilizando a), demuestre que una forma alterna para encontrar las raíces de p (x) = ao + al x + al xl = O es e) Calcule la raíz xl de p (x) = xl + 81 x - 0.5 = O usando aritmética de cuatro dígitos con las dos formas presentadas y sustituya ambos re- sultados en p (x). Compare la exactitud de los resultados y explique la diferencia. Puede usar Mathematica o Fortan. d) Calcule la raíz xl dt; p (x) =xl + 81 x - 0.5 =O 2.32 Elabore un programa de propósito general para encontrar todas las raíces reales y comple- jas de una ecuación polinomial de la forma Pn (x) = ao + al x + al xl + ... + anxn con el método de Müller. 2.33 El siguiente algortimo, de orden tres, es conocido como método de Laguerre np(x) . Xi+1 =xi - ------'--- , l =O, 1, 2, ... p' (x) ± JH (x) donde n es el grado de la ecuación polinomial p ( x ) = O, cuyas raíces se desea encontrar H (x) = (n-l) [(n-l) (P'(x¡))l - np (x) p" (x)] y el signo del radical queda determinado por el signo de p' (x). Este método, que funciona con orden 3 para polinomios CUyáS raíces son todas reales y dis- tintas, converge sólo linealmente para raíces múltiples. En el caso de raíces complejas poco se sabe del orden de convergencia; no obstante, ésta es alta para raíces complejas simples. Fi- nalmente, se hace la observación de que un valor de Xi real pude producir una H (x) nega- tiva y, por tanto, generar un valor dexi+l complejo y eventualmente levar a una raíz compleja de la ecuación p (x) = O. Resuelva las siguientes ecuaciones con el método de Laguerre a) x4 - 8.2 x3 + 39.41 xl - 62.26 x + 30.25 = O b) x4 - 15.2 x3 + 59.7 xl - 81.6 x + 36 =O e) x5 - 10 x4 + 40 x3 - 80 xl + 79 x - 30 =O d) x5 - 3.7 x4 + 7.4 x3 - 10.8 Xl +10.8 x - 6.8 = O 2.34 Se ha encontrado una simplificación* al algoritmo de MüIler (véase algoritmo 2.6), y es • Hildebrand, B. lnlroduction lo Numerical Analysis. 2a. ed. McGraw-Hill (1974) pp. 580-581.
  • 135. 122 Métodos numéricos aplicados a la ingeniería 2A¡ Xi+ = xi - ----;::.===== 1 + J 1 - 4 A¡ + Il¡ i = 2,3,4 ... (1) donde: 1; f[x¡,x¡_,x¡_2] A¡ = - , f.1¡ = ----''---'--''----'--=- w¡ w¡ y =f[ x, x. ] + (+. _ F. ) f[ Xi' xi-!' X¡_2 ] 1 1- i¡ Ji-I f[ ] Xi,Xi_1 Para esta modificación el orden de convergencia está dado por: f "'(x) E i+ "" - 6f' (x) E i E i-l E i-2 Resuelva las ecuaciones dadas en los problemas 2.17, 2.26 Y 2.33 con estealgoritmo. 2.35 Con la fórmula 1 del problema 2.34 y algunas consideraciones teóricas que se omiten por ser más bien tema del análisis numérico, se llega a modificaciones del método de la secan- te, con lo cual se consigue en éstas un orden de convergencia mayor de 2. a) La primera modificación está dada por la ecuación i = 1,2,... (1) 1 + J 1 - 4 Il¡ Ai pero ahora k=1; 1 f/' y La interpretación geométrica de este método consiste en reemplazar la funciónf(x) en cier- to intervalo con una parábola que pasa por el punto (Xi_, h-l) y es tangente a la curva de f (x) en (Xi' 1;). Para la ecuación 1 se tiene que f" '(x) E.¡""- E 2 E·1 1+ 61' (x) 1 1- Y se ha encontrado que es aproximadamente de orden 2.41 b) La segunda modificación está dada por la expresión 2(fJ 1;') xi+1 =xi_1 + --r=========== 1 + h -2 rJ;1;" / ({¡')2] (2) y en ésta el orden de convergencia es 3, y se sabe que: f "'(x) E "" - ---- E3 i+l 6f'(x) 1 122 Métodos numéricos aplicados a la ingeniería i = 2, 3, 4 ... 1 + J1 - 4 A¡ + 11; donde: y Para esta modificación el orden de convergencia está dado por: f "'(x) E i+1 "" - 6f' (x) E i E ;-1 E ;-2 (1) Resuelva las ecuaciones dadas en los problemas 2.17, 2.26 Y2.33 con estealgoritmo. 2.35 Con la fórmula 1 del problema 2.34 y algunas consideraciones teóricas que se mniten por ser más bien tema del análisis numérico, se llega a modificaciones del método de la secan- te, con lo cual se consigue en éstas un orden de convergencia mayor de 2. a) La primera modificación está dada por la ecuación i = 1, 2,... (1) pero ahora A. = 1; 1 f/' y La interpretación geométrica de este método consiste en reemplazar la funciónf(x) en cier- to intervalo con una parábola que pasa por el punto (x;_I' h-I) y es tangente a la curva de f (x) en (Xi' 1;). Para la ecuación 1 se tiene que f'" (x) E. 1 ""- E 2 E' 11+ 6l' (x) 1 1- Yse ha encontrado que es aproximadamente de orden 2.41 b) La segunda modificación está dada por la expresión 2(fJ1;') x;+1 = x i_1 + - --¡========== 1 + JI - 2 rJ;1;" / ({¡')2] y en ésta el orden de convergencia es 3, y se sabe que: f "'(x) E "" - - - - - E 3 ;+1 61'(x) , (2)
  • 136. (l) Solución de ecuaciones no lineales 123 Aquí, la curva que reemplaza a f (x) en cierto intervalo es una parábola que coincide con la curva de f (x) en Xi y tiene la misma pendiente y curvatura que f (x) en Xi' Resuelva las ecuaciones dadas en los problemas 2.17, 2.26 Y2.33, usando las modificacio- nes de los incisos (a) y (b). e) De estas fórmulas pueden obtenerse otras más simples mediante aproximaciones. Por ejemplo, si}'¡ es pequeña, puede hacerse ( }'¡}'¡")1/2 }'¡}'¡" 1-2 -- "",1--- (J¡')2 (j '¡ )2 en la ecuación 2 y obtener la fórmula simplificada !;/}'¡' Xi + 1 = Xi - 1 _}'¡it /2 (J¡')2 para la cual [( f"(X))2 f"'(X)] 3 E¡+I"'" 2f'(x) - 6f'(x) E¡ obsérvese que también es de tercer orden, pero sin raíz cuadrada. Esta fórmula se atribu- ye a Halley. Los métodos iterativos basados en esta expresión algunas veces se denominan métodos de Bailey o métodos de Lambert. el) Si se aproxima [ 1_ }'¡}'¡" ]-1 "'" 1 + }'¡}'¡" 2 (J¡, )2 2(J¡ ')2 en la fórmula de Halley, se obtiene la iteración }'¡[1 }'¡!;"] Xi + 1 = Xi - J: + 2 (J¡')2 con [ ( f "(X))2 f'" (x) ] Ei+l"'" 2 2f'(x) - 6f'(x) E? cuyo orden es tres también y se llama fórmula de Chebyshev. Resuelva las ecuaciones dadas en los problemas 2.17, 2.26 y 2.33, empleando los algorit- mos de Halley y Chebyshev cuando sean aplicables y compare los resultados obtenidos con los algoritmo s de los incisos (a) y (b). 2.36 La ecuación de estado de Beattie-Bridgeman en su forma virial es: PV = RT + vf3 + L + --ª-V2 V3 donde: P = presión de atm T = temperatura en K V = volumen molar en Ugmol R = Constante universal de los gases en atm U(gmol K) f3 = R T Ba -Aa - Re /T2 y= -R T Ba b + Aaa -R Ba c/T2 (4) Solución de ecuaciones no lineales 123 Aquí, la curva que reemplaza af (x) en cierto intervalo es una parábola que coincide con la curva def(x) en x¡ y tiene la misma pendiente y curvatura quef(x) en Xi' Resuelva las ecuaciones dadas en los problemas 2.17, 2.26 Y2.33, usando las modificacio- nes de los incisos (a) y (b). e) De estas fórmulas pueden obtenerse otras más simples mediante aproximaciones. Por ejemplo, si1; es pequeña, puede hacerse 1 - 2 - - =1- ( 1;1;" )1/2 _ 1;1;" (J¡')2 (j'y en la ecuación 2 y obtener la fórmula simplificada 1; /1;' x¡+ 1 = xi - 1 _1;1;" / 2 (J¡')2 para la cual [ ( f" (x) )2 f'" (x) ] E¡+I '" 2f'(x) - 6f'(x) E [ obsérvese que también es de tercer orden, pero sin raíz cuadrada. Esta fórmula se atribu- ye a Halley. Los métodos iterativos basados en esta expresión algunas veces se denominan métodos de Bailey o métodos de Lambert. d) Si se aproxima [ 1 _ 1;1; " ]-1 '" 1 + 1;1; " 2 (J¡ , )2 2(J¡ ')2 en la fórmula de Halley, se obtiene la iteración 1; [1 1;1;" 1Xi + 1 =Xi - J: + 2 (J¡ ')2 con [ ( f "(X))2 f'" (x) 1 E¡+l'" 2 2f'(x) - 6f'(x) E? cuyo orden es tres también y se llama fórmula de Chebyshev. (4) Resuelva las ecuaciones dadas en los problemas 2.17, 2.26 y 2.33, empleando los algorit- mos de Halley y Chebyshev cuando sean aplicables y compare los resultados obtenidos con los algoritmos de los incisos (a) y (b). 2.36 La ecuación de estado de Beattie-Bridgeman en su forma virial es: PV = RT + .Ji + ...L + ~V V2 V3 donde: P = presión de atm T = temperatura en K V = volumen molar en Ugmol R = Constante universal de los gases en atm U(gmol K) f3 = R T Bo -Ao- Re/T2 y= - RTBob+Aoa-RBoc/T2
  • 137. 124 Métodos numéricos aplicados a la ingeniería 8= RBobc/T2,y Ao' Bo' a, b, e = constantes particulares para cada gas. Calcule el volumen molar V a 50 atm y 100°C para los siguientes gases Gas Ao a Bo b e X 10-4 He 0.0216 0.05984 0.01400 0.000000 0.0040 H2 0.1975 -0.00506 0.02096 -0.43590 0.0504 °2 1.4911 0.02562 0.04624 0.004208 4.8000 ·2.37 La ecuación de estado de Redlich-Kwong es: [a]P + V-b = RT TII2V(V+b) ( ) donde: P = presión en atm T = temperatura en K V = volumen molar en Ugmol R = constante universal de los gases en atm-U(gmol K) R2 Te2.5 a = 0.4278 --- Pe RTc b=0.0867-- Pe Calcule el volumen molar V a 50 atm y 100°C para los siguientes gases Gas Pe (atm) Te (K) He 2.26 5.26 H2 12.80 33.30 °2 49.70 154.40 Compare los resultados obtenidos con los del problema 2.36. 2.38 Mediante la ecuación de estado de Van der Walls (véase ejercicio 2.1), encuentre el volu- men molar V del CO2 a 80°C y 10 atm, utilizando los métodos de Newton-Raphson y de Richmond (véase Probl. 2.14). 2.39 Descomponga en fracciones parciales las siguientes funciones racionales 52.5 s (s + 1) (s + 1.5) (s + 5) a) F (s) = ---,--------::------:--- s4 + 20.75 s3 + 92.6 s2 + 73.69 s lOA b) F (s) = ---,---------,------ s3 + 101.4 S2+ 142.7 s + 100 0.47 KG(S3 + 4.149s2 + 6.362 s + 4.255) e) F (s) = ---=----------- s4+7s3+11s2+5s 100 (s2 + 3.4s + 2.8) el) F (s) = --::------,-----:,-----::--- SS+10 s4 + 32 s3 + 38 s2+ 15s
  • 138. Solución de ecuaciones no lineales 125 2.40 Una forma alterna para resolver el problema de vaporización instantánea (véase ejercicio 2.6) es: Tomando en cuenta que I. x¡ = 1 Y que I. Y¡ = 1, o bien I. K¡x¡ = 1, puede escribirse (todas las sumatorias sobre i son de 1 a n ) o también I. K¡x. ln---' =0 I. s, Siguiendo la secuencia mostrada en el ejercicio 2.6, se llega a la expresión: s.«I. 1 1 1 + lf/(K¡ - 1) In ----'---'---- = O I. z¡ . l+lf/(K¡-l) Utilice el método de posición falsa y los datos del ejercicio 2.6 para resolver esta última ecuación. 2.41 Para el cálculo de la temperatura de burbuja de una mezcla multicomponente a la presión total P se utiliza la ecuación n f( T) = L ¡= 1 K¡ x¡ -1 = O donde x¡ y K¡, i = 1, 2, ... n son la fracción mol en la fase líquida y la relación de equilibrio del componente i, respectivamente, y T (la raíz de la ecuación 1) es la temperatura de bur- buja. Determine la temperatura de burbuja a 10 atm de presión total de una mezcla cuya com- posición en la fase líquida es 45% mal de n-butano, 30% mal de n-pentano y 25% mal de n-hexano. Los valores de K¡ a 10 atm son Componente n-butano K (T) con T en °C para 35 :S;T:S; 205°C -0.17809 + 1.2479 X 10-2 T + 3.7159 X 10-5 T2 0.13162 - 1.9367 X 10-3 T + 7.1373 X 10-5 T2 0.13985 - 3.8690 X 10-3 T + 5.5604 X 10-5 T2 n-pentano n-hexano 2.42 Para el cálculo de la temperatura de rocío de una mezcla multicompnente a la presión to- tal P se utiliza la ecuación. n f( T) = L ¡= 1 donde Y¡y K¡, i = 1,2,..., n son la fracción mal en la fase vapor y la relación de equilibrio del componente i; respectivamente, y T (la raíz de la ecuación) es la temperatura de rocío. Determine la temperatura de rocío a 10 atm de presión total de una mezcla cuya composi- ción en la fase líquida es 45% mal de n-butano, 30% mal de n-pentano y 25% mal, de n-he- xano. Los valores de K¡ a 10 atm se proporcionan en el problema 2.41. 2.43 Para obtener la temperatura de burbuja de una solución líquida de CC14 y CF4 en equili- brio con su vapor, se llegó a la ecuación: (1) (1) S o lución de ecuaciones no lineales 125 2.40 Una forma alterna para resolver el problema de vaporización instantánea (véase ejercicio 2.6) es: Tomando en cuenta que I x¡ = 1 Yque I Y¡ = 1, o bien I Kr:; = 1, puede escribirse o también (todas las sumatorias sobre i son de 1 a n ) IKx. ln - -' -' =0 I x¡ Siguiendo la secuencia mostrada en el ejercicio 2.6, se llega a la expresión: K.z·I 1 1 1 + l¡t(K¡ - 1) In - ---'-- -'----- = O I z¡ 1+l¡t(K¡ - I) Utilice el método de posición falsa y los datos del ejercicio 2.6 para resolver esta última ecuación. 2.41 Para el cálculo de la temperatura de burbuja de una mezcla multicomponente a la presión total P se utiliza la ecuación n f(T) = L. K¡ x¡ - 1 = O (1) ¡= 1 donde x¡ y K¡, i = 1, 2, ... n son la fracción mol en la fase líquida y la relación de equilibrio del componente i, respectivamente, y T (la raíz de la ecuación 1) es la temperatura de bur- buja. Determine la temperatura de burbuja a 10 atm de presión total de una mezcla cuya com- posición en la fase líquida es 45% mol de n-butano, 30% mol de n-pentano y 25% mol de n-hexano. Los valores de K¡ a 10 atm son Componente n-butano n-pentano n-hexano K (T) con T en oC para 35 ~ T ~ 205 oC -0.17809 + 1.2479 X 10-2T + 3.7159 X 10-5 T2 0.13162 - 1.9367 X 10-3 T + 7.1373 X 10-5 T2 0.13985 - 3.8690 X 10-3 T + 5.5604 X 10-5 T2 2.42 Para el cálculo de la temperatura de rocío de una mezcla multicompnente a la presión to- tal P se utiliza la ecuación. n f(T) = L. (1) ¡ = 1 donde Y¡ y K¡, i = 1, 2,..., n son la fracción mol en la fase vapor y la relación de equilibrio del componente i, respectivamente, y T (la raíz de la ecuación) es la temperatura de rocío. Determine la temperatura de rocío a 10 atm de presión total de una mezcla cuya composi- ción en la fase líquida es 45% mol de n-butano, 30% mol de n-pentano y 25% mol, de n-he- xano. Los valores de K¡ a 10 atm se proporcionan en el problema 2.41. 2.43 Para obtener la temperatura de burbuja de una solución líquida de CC14 y CF4 en equili- brio con su vapor, se llegó a la ecuación:
  • 139. 126 Métodos numéricos aplicados a la ingeniería 760 = 0.75 [ 106.898-1221.8/ (T +227.4)] + 0.25 [ 106.195-376.7]/ (T+241.2)] Aplicando un método iterativo de dos puntos, encuentre la temperatura de burbuja T con una aproximación de 10-2 aplicado a f (T). 2.44 En la solución de ecuaciones diferenciales ordinarias con coeficientes constantes, es nece- sario resolver la " ecuación auxiliar asociada", que resulta ser un polinomio cuyo grado es igual al orden de la ecuación diferencial. ASÍ, si la ecuación diferencial está dada por ylv+2yl/-8y=0 (1) la ecuación auxiliar asociada es m4 + 2 m2 - 8 = O cuyas cuatro raíces: mi' m2 , m3 y m4 se emplean de la siguiente manera para dar la solución general de la ecuación l. Encuentre la solución general de la ecuación 1 y de las siguientes ecuaciones diferenciales yVI+2yIV+yl/=0 yl/'-4yl/+4y'=0 2.45 La ecuación 4 del ejercicio 2.8 se aplica para calcular la ~Tm, cuando TC1 - TC2 *TH2 - TC] Cuando el gradiente TH] - TC2 es muy cercano al gradiente TH2 - TC] se deberá utilizar la siguiente expresión para el cálculo de ~ Tm Modifique el programa 2.6 del ejercicio 2.8 de modo que se utilice la ~Tm dada arriba cuando o 2.46 I ( TH¡ - TC2 ) - ( TH2 - TC¡ ) I < 10-2 y la ecuación (4) del ejercicio 2.8 en caso contrario. Si el cambiador de calor del ejercicio 2.8, se opera en paralelo, esto es: aceite TH] '" 250°F agua Te¡ '" 80°F o 2.47 Encuentre TH2 Y TC2 en estas nuevas condiciones de operación. Suponga que el fenómeno de la transmisión de calor en un cierto material obedece en for- ma aproximada al modelo T=To+ i(J3( <Xi t2 e-:X 2 /(4<Xt») Calcule el tiempo requerido para que la temperatura a la distancia x alcance un valor da- do. Use la siguiente información 126 Métodos numéricos aplicados a la ingeniería 760 = 0.75 [ 106.898-1221.8/ (T +227.4)] + 0.25 [ 106.195-376.7]/ (T+241.2)] Aplicando un método iterativo de dos puntos, encuentre la temperatura de burbuja T con una aproximación de 10-2 aplicado af (T). 2.44 En la solución de ecuaciones diferenciales ordinarias con coeficientes constantes, es nece- sario resolver la " ecuación auxiliar asociada", que resulta ser un polinomio cuyo grado es igual al orden de la ecuación diferencial. Así, si la ecuación diferencial está dada por ylv+2y"-8y=0 (1) la ecuación auxiliar asociada es m4 + 2 m2 - 8 =O cuyas cuatro raíces: mi' m2, m3 y m4 se emplean de la siguiente manera para dar la solución general de la ecuación l. Encuentre la solución general de la ecuación 1 y de las siguientes ecuaciones diferenciales yVI+2 yIV+ y "=0 y"'-4y"+4y'=0 2.45 La ecuación 4 del ejercicio 2.8 se aplica para calcular la ~Tm, cuando TC1 - TC2 *TH2 - TC] o 2.46 o 2.47 Cuando el gradiente TH1 - TC2 es muy cercano al gradiente TH2 - TC] se deberá utilizar la siguiente expresión para el cálculo de ~Tm Modifique el programa 2.6 del ejercicio 2.8 de modo que se utilice la ~Tm dada arriba cuando I ( TH¡ - TC2 ) - ( TH2 - TC¡ ) I< 10-2 y la ecuación (4) del ejercicio 2.8 en caso contrario. Si el cambiador de calor del ejercicio 2.8, se opera en paralelo, esto es: agua Te¡ = 80 0p I aceite TH] = 250 0p ---~ Encuentre TH2 YTC2 en estas nuevas condiciones de operación. Suponga que el fenómeno de la transmisión de calor en un cierto material obedece en for- ma aproximada al modelo T=To+ i (t3( <Xi t2 e-X 2 /(4<X t ») Calcule el tiempo requerido para que la temperatura a la distancia x alcance un valor da- do. Use la siguiente información
  • 140. Solución de ecuacione s no lineales 127 To = 25°C; q = 300 BTU/h ft2; a = 0.04 ft2/h; x = 1 ft; k = 1 BTU/h ft2 °F T = 120°F f3 = 2 °Fft °C1/2 h1/2 2.48 El factor de fricciónfpara fluidos pseudoplásticos que siguen el modelo de Ostwald-De- Waele se calcula mediante la siguiente ecuación 1 4 0.4 - = --log (RefI-O.5n) -- f nO.75 n1.2 Encuentre el factor de fricción f, si se tiene un número de Reynolds Re de 6000 y un va- lor de n = 0.4. 2.49 La siguiente relación entre el factor de fricción f y el número de Reynolds Re se cumple cuando hay flujo turbulento de un fluido en un tubo liso 1 - = - 0.4 + 1.74 In (Re.J 1) f Construya una tabla de valores de f correspondientes a números de Reynolds de 104 hasta 106 con intervalos de 104. 2.50 Para determinar la constante de nacimientos de una población se necesita calcular A en la siguiente ecuación 0.435 X 106 1.546 X 106 = 106 eA + (eA - 1) A, . con una aproximación de 10-3. 2.51 Graficar por separado las funciones y = x y y = tan x (véase ejercicio 2.10). Encuentre las raíces en el intervalo (O, 35) ¿nota usted alguna relación entre ellas? ¿Podría explicar esta relación? Solución de ecuaciones no lineales 127 To= 25 oC; q = 300 BTU/h ft2; a =0.04 ft2/h; x =1 ft; k = 1 BTU/h ft2 °F T = 120 °F f3 = 2 °Fft °C1/2 hl /2 2.48 El factor de fricciónfpara fluidos pseudoplásticos que siguen el modelo de Ostwald-De- Waele se calcula mediante la siguiente ecuación 1 4 0.4 - = --log (Refl -O.Sn) - - f nO.7S n1.2 Encuentre el factor de fricción f, si se tiene un número de Reynolds Re de 6000 y un va- lor de n = 0.4. 2.49 La siguiente relación entre el factor de fricción f y el número de Reynolds Re se cumple cuando hay flujo turbulento de un fluido en un tubo liso 1 - = - 0.4 + 1.74 In (Re"'¡1) f Construya una tabla de valores def correspondientes a números de Reynolds de 104 hasta 106 con intervalos de 104. 2.50 Para determinar la constante de nacirnlentos de una población se necesita calcular le en la siguiente ecuación 0.435 X 106 1.546 X 106 = 106 eA + (eA - 1) A, . con una aproximación de 10-3. 2.51 Graficar por separado las funciones y =x y y =tan x (véase ejercicio 2.10). Encuentre las raíces en el intervalo (O, 35) ¿nota usted alguna relación entre ellas? ¿Podría explicar esta relación?
  • 141. CAPÍTULO 3 MATRICES y SISTEMAS DE ECUACIONES LINEALES A dónde nos dirigimos En este capítulo estudiaremos las técnicas de solución de sistemas de ecuaciones linea- les cuadrados Ax = b. Para ello, primero realizaremos un repaso de álgebra de matrices y, para sustentar teóricamente los métodos, revisaremos las ideas de ortogonalización de vectores. Posteriormente se exponen las dos ideas sobre las que se desarrollan, en los métodos numéricos, las soluciones de los sistemas: la eliminación de Gauss para los métodos di- rectos y la iteración de Jacobi para los iterativos. Para establecer la velocidad de cálculo y el "trabajo computacional" en los métodos directos, se analiza el número de operaciones de éstos y con base en ello se determinan sus necesidades de memoria. Como consecuencia de lo anterior, se da particular aten- ción a los sistemas especiales: simétricos, bandeados y dispersos, entre otros. Así, estu- diaremos los métodos que aprovechan estas características para lograr reducir con esto el número de operaciones y los requerimientos de máquina. Los métodos iterativos se vinculan con el método de punto fijo del capítulo 2, apro- vechando las ideas ahí desarrolladas como la de aceleración de la convergencia, Al final del capítulo, se presenta una comparación entre ambas familias para brin- darle al lector los elementos necesarios para seleccionar la más adecuada a su proble- ma en particular. Dado que el mundo real puede verse como grupos de objetos o partes trabajando en conjunto o bien conectadas de alguna manera que forman un todo, creemos que con estos conocimientos lograremos brindarle al lector una mejor comprensión de la ex- traordinaria cantidad de situaciones que pueden representarse con los sistemas o grupos de ecuaciones donde cada una de ellas corresponde a alguna de sus partes, por ejemplo: en circuitos, estructuras, columnas de destilación a régimen permanente. Introducción La solución de sistemas de ecuaciones lineales es un tema clásico de las matemáticas, ri- co en ideas y conceptos, y de gran utilidad en ramas del conocimiento tan diversas como economía, biología, física, psicología, etc. La resolución de sistemas casi de cualquier nú- mero de ecuaciones (lO, 100, 1000, etc.) es una realidad hoy día gracias a las computado- ras, lo cual proporciona un atractivo especial a las técnicas de solución directas e iterativas: su programación, la cuenta de los cálculos necesarios, la propagación de errores, etcétera. Sin embargo, todo lo anterior requiere una revisión de los conceptos básicos sobre matrices, ortogonalización de vectores, y la existencia y unicidad de las soluciones; por tanto, estos conceptos dan inicio al capítulo. MATRICES y SISTEMAS DE ECUACIONES LINEALES A dónde nos dirigimos En este capítulo estudiaremos las técnicas de solución de sistemas de ecuaciones linea- les cuadrados Ax =b. Para ello, primero realizaremos un repaso de álgebra de matrices y, para sustentar teóricamente los métodos, revisaremos las ideas de ortogonalización de vectores. Posteriormente se exponen las dos ideas sobre las que se desarrollan, en los métodos numéricos, las soluciones de los sistemas: la eliminación de GauSs para los métodos di- rectos y la iteración de Jacobi para los iterativos. Para establecer la velocidad de cálculo y el "trabajo computacional" en los métodos directos, se analiza el número de operaciones de éstos y con base en ello se determinan sus necesidades de memoria. Como consecuencia de lo anterior, se da particular aten- ción a los sistemas especiales: simétricos, bandeados y dispersos, entre otros. Así, estu- diaremos los métodos que aprovechan estas características para lograr reducir con esto el número de operaciones y los requerimientos de máquina. Los métodos iterativos se vinculan con el método de punto fijo del capítulo 2, apro- vechando las ideas ahí desarrolladas como la de aceleración de la convergencia. Al final del capítulo, se presenta una comparación entre ambas familias para brin- darle al lector los elementos necesarios para seleccionar la más adecuada a su proble- ma en particular. . Dado que el mundo real puede verse como grupos de objetos o partes trabajando en conjunto o bien conectadas de alguna manera que forman un todo, creemos que con estos conocimientos lograremos brindarle al lector una mejor comprensión de la ex- traordinaria cantidad de situaciones que pueden representarse con los sistemas o grupos de ecuaciones donde cada una de ellas corresponde a alguna de sus partes, por ejemplo: en circuitos, estructuras, columnas de destilación a régimen pe~·manente. Introducción La solución de sistemas de ecuaciones lineales es un tema clásico de las matemáticas, ri- co en ideas y conceptos, y de gran utilidad en ramas del conocimiento tan diversas como economía, biología, física, psicología, etc. La resolución de sistemas casi de cualquier nú- mero de ecuaciones (10, 100, 1000, etc.) es una realidad hoy día gracias a las computado- ras, lo cual proporciona un atractivo especial a las técnicas de solución directas e iterativas: su programación, la cuenta de los cálculos necesarios, la propagación de errores, etcétera. Sin embargo, todo lo anterior requiere una revisión de los conceptos básicos sobre matrices, ortogonalización de vectores, y la existencia y unicidad de las soluciones; por tanto, estos conceptos dan inicio al capítulo.
  • 142. 130 Métodos numéricos aplicados a la ingeniería 3.1 Matrices Una matriz es un conjunto de elementos ordenados en filas y columnas como: al,l al,2 al,3 al,n a2,1 a2,2 a2,3 a2,n a3,1 a3,2 a3,3 a3,1l am,1 am,2 am,3 am.n Los elementos zz. .son números reales o complejos, o funciones de una o varias variables.l,} En este libro sólo se tratarán matrices cuyos elementos son números reales. Para denotar matrices se utilizarán las primeras letras mayúsculas del alfabeto en cur- sivas A, B, e, etc. Cuando se hace referencia a una matriz es conveniente especificar su número de filas y columnas. Así, la expresión A de m X n, indica que se trata de una ma- triz de m filas y n columnas o de m X n elementos. A "m X n" se le conoce como las di- mensiones de A. Si el número de filas y de columnas es el mismo; esto es m = n, se tiene una matriz cuadrada de orden n o simplemente una matriz de orden n. Para ciertas demostraciones es más conveniente la notación [ai,j l, [bi,j l,etc., en lugar de A, B, etcétera. Dos matrices son iguales cuando tienen el mismo número de filas y columnas (las mismas dimensiones) y, además, los elementos correspondientes son iguales. Por ejemplo, las matrices y son de orden tres y tienen los mismos elementos. Aun así son distintas, ya que los elemen- tos correspondientes no son todos iguales. El elemento de la segunda fila y la segunda co- lumna de A, a 22 es 5 y el correspondiente de B, b22 es 5; pero el elemento de la segunda fila y la primera columna de A, a2 1 es 4 y el correspondiente a B, b2 l' es 2., , OPERACIONES ELEMENTALES CON MATRICES Y SUS PROPIEDADES Se definirán dos operaciones en el conjunto establecido de las matrices. SUMA DE MATRICES Para sumar dos matrices A y B han de ser de las mismas dimensiones; si esto es cierto, la suma es una matriz e de iguales dimensiones que A y que B, y sus elementos se obtienen sumando los elementos correspondientes de A y B. Para mayor claridad
  • 143. Matrices y sistemas de ecuaciones lineales 131 A + B e al,l al,2 al,!! bl,l bl,2 bl,11 al,l + bl,l al,2 + bl,2 ... al,!! + bl,!! a2,! a2,2 a2,!! b2,l b2,2 b2,n a2,l + b2,l a2,2 + b2,2 ... a2,1l + b2,!! + bm,!!am,11 el,l el,2'" el,1l c2,lel,2'" e2,1l (3.1) o también [ a, .]+ [ b, ,] = [a, ,+ b. ] = [ e, , ]1,] 1,] 1,] 1,] 1,] (3.2) Sumar las matrices [~8.5 -~J [-~ 2 ~J-1.3 Y 8 Solución [4 8.5 -3J [-1 2 ~J [4-1 8.5 + 2 -3-~J D 10.5 -7J 2 -1.3 7 + 5 8 3 2+5 -1.3 + 8 7+3 6.7 10 2X3 2 x 3 2X3 2 x 3 Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. A=[4 8.5 -3; 2 -1.3 7J B=[-1 2 -4; 5 8 3J C=A+B [4, 8.5, -3; 2, -1.3, 7J...•a [-1, 2, -4; 5, 8, 3J ....•b e+b+c La conmutatividad y asociatividad de la suma de matrices son propiedades heredadas de las propiedades de la suma de los números reales. Así, la conmutatividad puede verse cla- ramente en la ecuación 3.1, ya que: a, ,+ b" = b, ,+ a, ,= e, ,1,] j,j 1,] 1,] l,j donde a ' representa un elemento cualquiera de A y bl'J' su correspondiente en B. Por tan-~ , to, es cierto que De igual manera puede verse la asociatividad (ai,j + bi) + di) = ai,j + (bi,j + di)
  • 144. 132 Métodos numéricos aplicados a la ingeniería o bien (A + B) + D = A + (B + D) donde D es una matriz de las mismas dimensiones que A y que B. Además, si se denota con O a la matriz cuyos elementos son todos cero (matriz cero); es decir, o O O O O O O O O O O O O y por -A la matriz cuyos elementos son los mismos que A, pero de signo contrario -A -al,l -al,2 -a2,1 -a2,2 l' -am,n se tiene: A + O =A, A + (-A) = O (3.3) (3.4) A partir de la ecuación 3.4, puede definirse la resta entre A y B como A + (-B) o más simple A-B PRODUCTO DE MATRICES POR UN ESCALAR Así Como se ha definido la suma de matrices, también se puede formar el producto de un número real a y una matriz A. El resultado, denotado por AA, es la matriz cuyos elemen- tos son los componentes de A multiplicados por a. Así, se tiene al,l a¡,2 al,1l aal,l aal,2 aal,11 a2,1 a2,2 a2,n aa2,1 aa2,2 aa2,n a A=a (3.5) am,l am,2 am,n aam,l aam,2 ... aam,n o bien a [a . .] = [ a a .] (3.6)1,] 1,]
  • 145. Matrices y sistemas de ecuaciones lineales 133 Ejemplo 3.2 ~o][548 -2.3 Multiplique la matriz 7.2 por 2. 43 -13 Solución [5.8 -2.32] [2(58)2(-2.3) 2(2)J [16 -4.6 2~J2 4 7.2 10 = 2(4) 2(7.2) 2(10) = 8 14.4 43 -13 5 2(43) 2(-13) 2(5) 86 -26 10 Las principales propiedades algebraicas de esta multiplicación son: a (A + B) (a+f3)A (af3) A lA A, a A + aB , distributividad respecto a la suma de matrices. aA + f3A, distributividad respecto a la suma de escalares. a (f3A ), asociatividad. (3.7) (3.8) (3.9) (3.10) donde a y f3son dos escalares cualesquiera, y A YB dos matrices sumables (con igual nú- mero de filas e igual número de columnas). Las ecuaciones 3.7 a 3.10, se comprueban con facilidad a partir de las definiciones de suma de matrices y multiplicación por un escalar. Sólo se demostrará la 3.9; las otras que- dan como ejercicio para el lector. De la definición (Ec. 3.5), aplicada allado izquierdo de la ecuación 3.9. (af3) A = (a f3) a""n (a f3) a¡,¡ (a f3) a¡,2 (a f3) a2,¡ (a f3) a2,2 De la asociatividad de la multiplicación de los números reales se tiene: (af3) A = a (f3 am,n) a (f3al) a (f3a¡,2) a (f3a2,¡) a (f3a2,2) Al aplicar la ecuación 3.5 en sentido inverso dos veces: f3a¡,¡ f3a1,2 f3a¡,n (af3) A = a f3a2,l f3a2,2 f3a2,n f3«; 1 f3am,2 f3am,n
  • 146. " 134 Métodos numéricos aplicados a la ingeniería al,1 al,2 (a{J) A = a f3 a21 a2,2 am,1 a""2 se llega al lado derecho de la ecuación 3.9, con lo cual concluye la demostración. MULTIPLICACiÓN DE MATRICES Dos matrices A y B son conformes en ese orden (primero A y después B ), si A tiene el mis- mo número de columnas que B tiene de filas. Se definirá la multiplicación sólo para matrices conformes. Dada una matriz A de m X n y una matriz B de n X p, el producto es una matriz C de m X p cuyo elemento gene- ral cij se obtiene por la suma de los productos de los elementos de la i-ésima fila de A y la j-ésima columna de B. Si: al,l a1,2 a2,1 a2,2 A= a¡,l a¡,2 b . bn.j n,p CI,I cI,2 c lJ "'lC2,1 C2,2 c 2J c2,p AB=C= C¡,I C¡,2 G.. c¡,pi.j donde: o bien: 11 C . = L a k bk . para i = 1,2, ... , m y j = 1,2, ... , p l,] k= l 1, ,]
  • 147. Multiplicar 1., matrices A = [~ 2 -~]Y B = [-! 1 -~]3 2 --4 2 Solución A B C D 2 !][-~1 -2] [0-2+12 1+4+6 -2+6+3J [101I -2~] 3 2 3 = 0-3+16 2+6+8 --4+9+4 = 13 16 --4 -5 4 2 1 0+4-20 3-8-10 -6-12-5 -16 -15 En orden inverso B A C t! 1 -n [~ 2 3] [0+2-6 0+3+8 0+4+IOJ = [~ 11 I~]2 3 4 = -1+4+9 -2+6-12 -3+8-15 -8 -10 2 --4 -5 4+4+3 8+6--4 12+8-5 11 10 15 Para realizar los cálculos puede usarse Matlab o la TI-92 Plus ...---------------------------~~~====-iIIi Matrices y sistemas de ecuaciones lineales 135 A=[1 2 3; 2 3 4; 3 -4 -5] B=[O 1 -2; -1 2 3; 4 2 1] disp( 'e = A':' B') e=A*B disp ('e = B * A') e=B*A [1,2,3; 2,3,4; 3, -4, -5]--+ a [0,1, -2;-1,2,3;4,2, l I=b a*b--+c b*a--+c Obsérvese que A B ;é B A; es decir, la multiplicaci6n de matrices no es conrnutativa. Este hecho deberá tenerse siempre en cuenta al multiplicar matrices. A continuación se verán las propiedades de distributividad y asociatividad del produc- to de matrices. A (B + C) AB+AC (3.11) (3.12) Con la notación de sumatoria se comprobará la ecuación 3.11; la 3.12 queda como ejerci- cio para el lector. Demostración de la ecuación 3.11. Sea ei,j un elemento cualquiera de la matriz producto A B, esto es:
  • 148. 136 Métodos numéricos aplicados a la ingeniería y di,j el elemento correspondiente del producto A e n d= L akck· 1,] k = 1 1, -l Al sumarios se obtiene el elemento correspondiente del lado derecho de la ecuación 3.11 el cual es igual al elemento de la i-ésima fila y la j-ésima columma del lado izquierdo de la ecuación 3.11, con lo que finaliza la demostración. A continuación se da el algoritmo para multiplicar matrices. Para multiplicar las matrices A y B, proporcionar los DATOS: Número de filas y columnas de A y B; N, M, NI, MI, respectivamente, y sus elementos. RESULTADOS: La matriz producto e de dimensiones N X MI o el mensaje "LAS MATRICES A Y B NO PUEDEN MULTIPLICARSE" . PASO 2. PASO 3. Si M = NI continuar, de otro modo IMPRIMIR "LAS MATRICES A Y B NO SE PUEDEN MULTIPLICAR" y TERMINAR. Hacer 1 = l. Mientras 1 ~ N, repetir los pasos 4 a 12. PASO 4. HacerJ = 1. PASO 5. Mientras J ~ MI, repetir los pasos 6 a 11. PASO 6. Hacer e (1, J) = O. PASO 7. Hacer K = 1. PASO 8. Mientras K ~ M, repetir los pasos 9 y 10. PASO 9. Hacer e (1, J) = e (l, J) + A (1, K) * B (K, J). PASO 10. Hacer K = K + 1. PASO 11. Hacer J = J + 1. PASO 12. Hacer 1 = 1 + 1. IMPRIMIR las matrices A, B Y e y TERMINAR. PASO 1. PASO 13. Elaborar un programa para multiplicar matrices, utilizando el algoritmo 3.1 Solución Ver el 'PROGRAMA 6 32 del CD. SUGERENCIA: Este material puede complementarse e incluso enriquecerse si se cuenta con un pizarrón electrónico, por ejemplo el Mathcad, ya que permite, una vez entendida la mecánica de las operaciones matriciales, averiguar sus propiedades e incluso motivar algunas demostraciones. En adelante se hará referencia al Mathcad y a Matlab, pero puede usarse un software equivalente. 136 Métodos numéricos aplicados a la ingeniería ydi,j el elemento correspondiente del producto A e n d=Lakck · 1,] k = 1 1, ,} Al sumarlos se obtiene el elemento correspondiente del lado derecho de la ecuación 3.11 n n n e·· + d.. = L a k bk + L a· k Ck = L a k (bk · + Ck .),1,] 1,] k = 1 1, ,] " = 1 1, ,] k = 1 1, ,] ,] el cual es igual al elemento de la i-ésima fila y la j-ésima columma del lado izquierdo de la ecuación 3,11, con lo que finaliza la demostración. A continuación se da el algoritmo para multiplicar matrices. Para multiplicar las matrices A y B, proporcionar los DATOS: Número de filas y columnas de A y B; N, M, NI, MI, respectivamente, y sus elementos. RESULTADOS: La matriz producto e de dimensiones N X MI o el mensaje "LAS MATRICES A Y B NO PUEDEN MULTIPLICARSE". PASO 1. Si M = NI continuar, de otro modo IMPRIMIR "LAS MATRICES A Y B NO SE PUEDEN MULTIPLICAR" y TERMINAR. PASO 2. Hacer 1 = l . PASO 3. Mientras 1:<:; N, repetir los pasos 4 a 12. PASO 4. Hacer J = 1. PASO 5. Mientras J:<:; MI, repetir los pasos 6 a 11. PASO 6. Hacer e (1, J) = O. PASO 7. PASO 8. Hacer K = l. Mientras K:<:; M, repetir los pasos 9 y 10. PASO 9. Hacer e (1, J) = e (I, J) + A (1, K) * B (K, J). PASO 10. Hacer K = K + 1. PASO 11. Hacer J =J + 1. PASO 12. Hacer 1= 1+ 1. PASO 13. IMPRIMIR las matrices A, B Y e y TERMINAR. Elaborar un programa para multiplicar matrices, utilizando el algoritmo 3.1 Solución Ver el P~QG,~lfA 3~IJ del CD. 6 32 SUGERENCIA: Este material puede complementarse e incluso enriquecerse si se cuenta con un pizarrón electrónico, por ejemplo el Mathcad, ya que permite, una vez entendida la mecánica de las operaciones matriciales, averiguar sus propiedades e incluso motivar algunas demostraciones. En adelante se hará referencia al Mathcad y a Matlab, pero puede usarse un software equivalente.
  • 149. Matrices y sistemas de ecuaciones lineales 137 MATRICES ESPECIALES En una matriz cuadrada A, el conjunto de elementos en donde el primero y el segundo su- bíndices son iguales -es decir, i = j- forman la diagonal principal. Por ejemplo, en la matriz de 4 X 4 que se da a continuación, los elementos dentro de la banda constituyen la diagonal principal. [ a" al,2 al,3 a'A la2,1 a2,2 a2,3 a2,4 a3,1 a3,2 a3,3 a34 a4,1 a4,2 a4,3 a4,4 Una matriz de orden n con todos sus elementos debajo de la diagonal principal iguales a ce- ro se llama matriz triangular superior. Si todos los elementos por encima de la diagonal principal son cero en una matriz, entonces será una matriz triangular inferior; en caso de que una matriz tenga únicamente ceros arriba y abajo de la diagonal principal, se tiene una matriz diagonal y, si en particular, todos los elementos de la diagonal son 1, entonces se obtiene la matriz unitaria o matriz identidad. Matriz triangular superior Matriz triangular inferior o o O o O a1,2 a2,2 o O an_l,n O O O O an,n an.l an.2 an.3 an.II _ 1 al/,n Matriz diagonal Matriz unitaria o identidad al,1 O O O 1 O O O O a2,2 O O O 1 O O O O a3,3 O O O 1 O O O O all,n O O O 1 A continuación se dan algunos casos particulares de matrices cuadradas especiales Triangular Triangular superior inferior Diagonal Unitaria 1 3 -4 4 O O 2 O O 1 O O O 6 2 -2 -1 O O -6 O O 1 O O O -5 7 5 3 O O 8 O O 1
  • 150. 138 Métodos numéricos aplicados a la ingeniería La matriz unitaria se denota, independientemente de su orden, como I. Dada una matriz A de m X n, la matriz de n X m que se obtiene de A intercambiando sus filas por sus columnas se denomina matriz transpuesta de A y se denota por AT . Es- to es A= a1•1 al,2 al,n a2,1 a2,2 a2,n al,1 a2,1 am,1 al,2 a2,2 am,2 AT= al,,. a2,1I a m,n Ejemplo 3.5 Dada la matriz A, encuentre su transpuesta. [ , o 3 6 3 5 2 4 7 5 ~] 3 X 5 Solución 5 X 3 Una matriz cuadrada para la que AT = A, recibe el nombre de matriz simétrica. Por ejemplo 2 3 1 !J y son iguales, y por tanto A es simétrica. Si A YB son dos matrices cuadradas, tales que AB = 1 = BA, se dice que B es la inversa de A y se representa generalmente como A-l. Ejemplo 3.6 Demuestre que B es la inversa de A, si: 3 4 3 y B = [-~ -i -~]-1 O 1
  • 151. Matrices y sistemas de ecuaciones lineales 139 Solución AB" D 3 !] [-~-3 -~] [~ O ~] "1 4 1 1 3 -1 O O Por tanto, A-l = B Para realizar los cálculos puede usarse Matlab o la TI-92 Plus A=[l 3 3; 1 4 3; 1 3 4J B=[7 -3 -3; -1 1 O; -1 O 1J disp('I=A*B') I=A*B [1,3,3;1,4,3;1,3,4J-ta [7,-3,-3;-1,1,0;-1,0,lJ-tb a*b-tI En particular si A es diagonal; es decir, al,l O O O l/al,l O O O O a2,2 O O O l/a2,2 O O A= , entonces A-l = O O «: O O l/a m,n La demostración se deja como ejercicio para el lector. Es importante señalar que no todas las matrices tienen inversa. Si una matriz la tiene, se dice también que es no singular, y singular en caso contrario. Más adelante se ven métodos para encontrar la inversa de una matriz. MATRIZ PERMUTADORA Una matriz, cuyos elementos son ceros y unos, y donde sólo hay un uno por cada fila o co- lumna, se conoce como matriz permutadora o intercambiadora; por ejemplo, las ma- trices 1 O O son casos particulares de matrices intercambiadoras. El efecto de multiplicar una matriz permutadora P por una matriz A en ese orden es intercambiar las filas de A; al multiplicar en orden inverso, se intercambian las columnas deA.
  • 152. 140 Métodos numéricos aplicados a la ingeniería Multiplique la matriz A del ejemplo 3.6 por la matriz permutadora P de 3 X 3 dada arriba. Solución a) Cálculo de P A: D 1 [ [¡ 3 !] [¡ 4 !lO 4 3 O 3 3 P A e 3. Obsérvese que la matriz producto ees la matriz A con la primera y segunda filas inter- cambiadas b) Cálculo de A P [¡ 3 !] [! 1 ~][; 1 ;]4 O 1 3 O 1 A P D Obsérvese que la matriz producto D es la matriz A con la primera y segunda columnas in- tercambiadas. Para realizar los cálculos puede usarse el siguiente guión de Matlab o la TI-92 Plus: [1,3,3; 1,4,3; 1,3, 4]~ a {0,1,0;1,0,O;0,0,1]~p p*a~c a*~d A={1 3 3; 1 4 3; 1 3 4] P={O 1 O; 1 O O; O O 1] disp ('C=P * A') C=P*A disp ('D=A * P') D=A*P La matriz identidad es un caso particular de matriz permutadora y su efecto es dejar igual la matriz por la que se multiplica (ya sea por la derecha o por la izquierda). Este hecho, jun- to con el ejemplo 3.7, manifiesta que cuando aparece un 1 en la diagonal principal de una matriz permutadora, la fila o columna correspondiente de la matriz por la que se multipli- que no sufre cambio alguno. Véase que hay un 1 en la posición (3, 3) de la matriz P y que la fila 3 y la columna 3 deA no sufrieron intercambio en los incisos a) y b), respectivamente, en el ejemplo 3.7. rEi~'~tJ:S' Sin multiplicar diga qué efecto tendrá sobre una matriz cualquiera A de 4 X 4 la siguiente matriz: O O O 1 O O 1 O ~l E
  • 153. Matrices y sistemas de ecuaciones lineales 141 Solución Análisis de la multiplicación P A . Los unos en las posiciones (1, 1) Y (3, 3) indican que las filas 1 y 3 de A no sufrirán efecto alguno. Por otro lado, los unos de la segunda y cuarta filas cuyas posiciones son (2, 4) y (4, 2) indican que las filas 2 y 4 de A se intercambiarán (nótese que en el ejemplo 3.7, los unos fuera de la diagonal ocupan las posiciones (1, 2) Y (2, 1) y las filas 1 y 2 se intercambian). El lector puede generalizar estos resultados de manera muy sencilla. 3.2 Vectores Las matrices donde m > 1 y n = 1 (es decir, están formadas por una sola columna) son lla- madas matrices columna o vectores. De igual manera, si m = 1 Yn >1, se tiene una matriz fila o vector. Los vectores se denotarán con las letras minúsculas en negritas: a, b, x, etc. En estos casos no será necesaria la utilización de doble subíndice para la identificación de sus elementos y un vector x de m elementos (en columna) queda simplemente como: x= Un vector y de n elementos (en fila) queda como: Por ejemplo, los siguientes vectores están en columna: y estos en fila o O O O O [ O 1 Ol, [ 3 5 7 2 ], [ O O O O Ol. Obsérvese que si se tiene un vector columna, la transpuesta será un vector fila y vice- versa. Dado x = Obtener la transpuesta de los vectores columna y fila dados arriba. Matrices y sistemas de ecuaciones lineales 141 Solución Análisis de la multiplicación P A . Los unos en las posiciones (1, 1) Y (3, 3) indican que las filas 1 y 3 de A no sufrirán efecto 3.1guno. Por otro lado, los unos de la segunda y cuarta filas cuyas posiciones son (2, 4) y (4, 2) indican que las filas 2 y 4 de A se intercambiarán (nótese que en el ejemplo 3.7, los unos fuera de la diagonal ocupan las posiciones (1, 2) Y (2, 1) y las filas 1 y 2 se intercambian). El lector puede generalizar estos resultados de manera muy sencilla. 3.2 Vectores Las matrices donde m > 1 y n = 1 (es decir, están formadas por una sola columna) son lla- madas matrices columna o vectores. De igual manera, si m =1 Yn >1, se tiene una matriz fila o vector. Los vectores se denotarán con las letras minúsculas en negritas: a, b, x, etc. En estos casos no será necesaria la utilización de doble subíndice para la identificación de sus elementos y un vector x de m elementos (en columna) queda simplemente como: x = Un vector y de n elementos (en fila) queda como: Por ejemplo, los siguientes vectores están en columna: y estos en fila o O O O O [010],[3572],[00000]. Obsérvese que si se tiene un vector columna, la transpuesta será un vector fila y vice- versa. Dado x = Obtener la transpuesta de los vectores columna y fila dados arriba.
  • 154. 142 Métodos numéricos aplicados a la ingeniería Solución mr = [100], 13~llT lJ = [3 105] El o o o o o [O 1 O]' = [!l[3 5 7 2]' = m = [00000] T [00000]'= m Como en el texto resulta generalmente difícil expresar un vector en columna, se usará al- gunas veces su transpuesta. MULTIPLICACiÓN DE VECTORES Dado que los vectores son sólo casos particulares de las matrices, siguen las mismas re- glas de multiplicación que éstas. Sea por ejemplo a = [al a2 ... an] y b" = [bl b2 ••• bn], el producto a b es: Ej~ a b = [al a2 ... all ] 1 X n = al bl + a2 b2 + ... + an bll 1 X 1 bn n X 1 El producto de a por b es el número real al bl + a2 b2 + ... + an bn, que también puede verse como una matriz de 1 X 1. Multiplicando en orden inverso bl bl al bl a2 bl < b2 b2 al b2 a2 b2 «: ba= [al a2 ... an] = bll 1 X n bn al bn a2 bn =; n X 1 nXn se obtiene una matriz de n X n.
  • 155. e Matrices y sistemas de ecuaciones lineales 143 Ejemplo 3.10 Dados a = [ 1 57] Y bT = [O -2 3], obtener ab y ba Solución ab= = 1(0) + 5(-2) + 7(3) = 11 1 x 1 [1 57] 1 x 3 3 x 1 y [ 0] [ 0(1) b a = -2 [1 5 7] = -2(1) 3 3(1) 0(7)] [ °-2(7) = -2 3(7) 3 ° 0J-10 -14 15 21 0(5) -2(5) 3(5) Puede multiplicarse también un vector por una matriz y viceversa si las dimensiones son adecuadas. Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. a=[l 5 7] b=[O; -2; 3] ab=a*b ba=b*a [l,5,7] ....•a [O;-2,3] ....•b a*b ....•ab b*a ....•ba Ejemplo 3.11 . [0Multiplique el vector a = [1 -23] por la matriz B= -~ 4 8 1 ~] Solución a B e [-! 4 ~][1 -2 3] 8 [11 -9 14] 1 X 3 1 1 X 3 3 X 3 los elementos de e se calculan como: 1(0) + (-2) (-1) + 3(3) = 11 1(4) + (-2) (8) + 3(1)= -9 1(3) + (-2) (2) + 3(5) = 14 Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
  • 156. 144 Métodos numéricos aplicados a la ingeniería [1,-2,3]--->a [0,4,3;-1,8,2;3,1,5] ·"D a*b--->e a=[l -2 3] B=[O 4 3; -1 8 2; 3 1 5] c=a*B Efectuar la multiplicación en orden inverso (B a) no es posible, por no ser conformes en ese orden. En cambio, sí puede multiplicarse B por algún vector columna d de tres elemen- tos. Así: 4 8 1 3 X 3 [ 0(1) + 4(0) + 3(2)] -1(1) + 8(0) + 2(2) 3(1) + 1(0) + 5(2) 3 X 1 3 X 1 PRODUCTO PUNTO DE VECTORES Definición. Dados dos vectores a y b con igual número de elementos, por ejemplo n, su producto punto (o escalar), denotado por a . b, es un número real obtenido de la siguiente manera al b¡ a2 b2 a· b= a¡ s, + a2 b2+ ... + an bn (3.13) an bll Si a = [!] y b= [ -~] , obtenga el producto punto. 2.5 Solución a . b = 2(-3) + 1(0) + 6(2.5) = 9 Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. I In! e Ion: [2,1,6]--->a [-3;0;2.5]--->b a*b--->ab a=[2 1 6] b=[-3; O; 2.5] ab=a*b
  • 157. Matrices y sistemas de ecuaciones lineales 145 Este producto punto así definido tiene las siguientes propiedades a) a . b = b . a conmutatividad. b) (a + b) . e = a . e + b . e distributividad. e) (a. a) . b = a. (a . b) para cualquier número real (l. Asociatividad. d) a- a ;::O ya· a = O si y sólo si a = O. Positividad de la definición. (3.14) (3.15) (3.16) (3.17) Sólo se demostrará la propiedad (a) y se dejarán las restantes como ejercicio para el lector. Demostración de (a) y b· a = b¡ a¡ + b2a2 + ... + bpn Por la conmutatividad de la multiplicación de los números reales se tiene que y por tanto a v b = b v a Enseguida se definirán conceptos tan importantes como la longitud de un vector, el ángulo entre dos vectores cualesquiera y distancia entre vectores en función del producto punto. Cada una de estas ideas tiene un significado bien definido en los vectores de dos ele- mentos en la geometría analítica, y es razonable pedir que cualquier definición que se adopte se reduzca a la ya conocida. Con esto en mente, se pueden obtener definiciones aceptables extendiendo las fónriulas correspondientes de la geometría analítica a vectores de n elementos. LONGITUD DE UN VECTOR La noción de longitud para vectores de dos elementos está dada por la siguiente definición: Sea x un vector cualquiera de dos elementos, sil longitud denotada por Ixl es el nú- mero real no negativo" I~Gráficamente se representa así (3.18) Figura 3.1 Interpretación gráfica de la longitud de un vector. • Se dice que un número real es no negativo cuando s610 puede ser cero o positivo. Figura 3.1 Interpretación gráfica de la longitud de un vector. Matrices y sistemas de ecuaciones lineales 145 Este producto punto así definido tiene las siguientes propiedades a) a· b =b . a conmutatividad. b) (a + b) . e =a . e + b . e distributividad. e) (a. a) . b =a. (a . b) para cualquier número real a . Asociatividad. d) a· a ;:: Oya· a = Osi y sólo si a =O. Positividad de la definición. (3.14) (3.15) (3.16) (3.17) Sólo se demostrará la propiedad (a) y se dejarán las restantes como ejercicio para el lector. Demostración de (a) y b· a = b¡ a¡ + b2a2 + ... + bpn Por la conmutatividad de la multiplicación de los números reales se tiene que y por tanto a·b = b·a Enseguida se definirán conceptos tan importantes como la longitud de un vector, el ángulo entre dos vectores cualesquiera y distancia entre vectores en función del producto punto. Cada una de estas ideas tiene un significado bien definido en los vectores de dos ele- mentos en la geometría analítica, y es razonable pedir que cualquier definición que se adopte se reduzca a la ya conocida. Con esto en mente, se pueden obtener definiciones aceptables extendiendo las fórmulas correspondientes de la geometría analítica a vectores de n elementos. LONGITUD DE UN VECTOR La noción de longitud para vectores de dos elementos está dada por la siguiente definición: Sea x un vector cualquiera de dos elementos, sil longitud denotada por Ixl es el nú- mero real no negativo* I.:.:.=!.:.!l (3.18) Gráficamente se representa así • Se dice que un número real es no negativo cuando s6lo puede ser cero o positivo.
  • 158. 146 Métodos numéricos aplicados a la ingeniería La ecuación 3.18 puede escribirse en términos del producto punto como: Ixl= ¡-x:x (3.19) lo cual está bien definido para vectores de n elementos y puede, por tanto, tomarse como lon- gitud de estos últimos. Definición. La longitud (o norma) de un vector x de n componentes, con n ;::::1, está dada por el número real no negativo.* Ixl = J xl + xi ...+ x,; (3.20) Ixl=~ Ejel Ejemplo 3.13 Si a = , encuentre su norma. Solución la I = J 25 + 9 +16 = 7.0711 Para realizar los cálculos puede usarse el siguiente guión de'Matlab o la TI-92 Plus. I [5,3,4]-4a . norm (a) -4 norma a=[5 3 4] Norma=norm (a) ÁNGULO ENTRE VECTORES Hay que recordar que si se tienen dos vectores de dos componentes, ambos distintos del vector cero, la fórmula' cos e x • y Ixl I Y I (3.21) es una consecuencia inmediata de la ley de los cosenos. Como la expresión x·y Ixl I Y r ' está bien definida para vectores distintos del vector cero, de n componentes, parece con- veniente usarla como definición del ángulo entre vectores de más de dos componentes. Sin embargo, sería necesario probar primero que el rango o codo minio de esta expresión -usando vectores x, y de n componentes- es el intervalo cerrado [-1, 1], para que así se guarde consistencia con el primer miembro de la ecuación 3.21.** F vec • Se conoce también como norma eucIideana y algunos autores la representan por Lz. •• Recuérdese que la función cos tiene como rango el intervalo [-1, 1]. 146 Ejemplo 3.13 Solución Métodos numéricos aplicados a la ingeniería La ecuación 3.18 puede escribirse en términos del producto punto como: I x l= ¡-X;X (3.19) lo cual está bien definido para vectores de n elementos y puede, por tanto, tomarse como lon- gitud de estos últimos. Definición. La longitud (o norma) de un vector x de n componentes, con n ;::: 1, está dada por el número real no negativo.* Ixl= ~ Ixl = Jxt + xi ... + x,; (3.20) Si a = , encuentre su norma. I a I = J25 + 9 +16 = 7.0711 Para realizar los cálculos puede usarse el siguiente guión de'Matlab o la TI-92 Plus. a=[5 3 4] Norma=norm (a) ÁNGULO ENTRE VECTORES I [5 ,3, 4] ->a ~ norm (a ) -> norma Hay que recordar que si se tienen dos vectores de dos componentes, ambos distintos del vector cero, la fórmula' cos e x • y Ixl I Y I es una consecuencia inmediata de la ley de los cosenos. Como la expresión x'y I x l I Y l ' (3.21) está bien definida para vectores distintos del vector cero, de n componentes, parece con- veniente usarla como definición del ángulo entre vectores de más de dos componentes. Sin embargo, sería necesario probar primero que el rango o codominio de esta expresión -usando vectores x, y de n componentes- es el intervalo cerrado [-1 , 1], para que así se guarde consistencia con el primer miembro de la ecuación 3.21.** • Se conoce también como norma eucIideana y algunos autores la representan por Lz' •• Recuérdese que la función cos tiene como rango el intervalo [- 1, 1].
  • 159. 2l) Matrices y sistemas de ecuaciones lineales 147 La demostración está fuera de los objetivos de este libro, pero el lector interesado pue- de encontrarla en Kreider et. al.* Definición. Si x y y son vectores distintos del vector O, con n componentes, el cose- no del ángulo entre ellos se define como: x'y cos ()=--- Ixl I Y I Si alguno de los vectores es el vector cero, se hace cos ()igual a cero. Ejemplo 3.14 Si x" = [2 -34 1 ] YyT = [ -1 242], calcule el ángulo entre ellos. Solución cos ()= 2(-1) + (-3) (2) + 4(4) + 1(2) = 0.3651 J 4 + 9 + 16 + 1 J 1 + 4 + 16 + 4 de donde ()= 68.58 Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. x=[2 -3 4 1J y=[ -1 2 4 2J ct=(x*y')/(norm(x)*norm(y)) teta=acos(ct)/pi*180 [2,-3,4,lJ-+x [-1,2,4,2J-+y dotp (x,y) / (norm (x) *norm (y)) -+ct cos-1 (ct)/JtI'180-+teta DISTANCIA ENTRE DOS VECTORES Uno de los tres conceptos que aún no se analiza es el de distancia entre dos vectores de n componentes. De nueva cuenta esto se hará "copiando" la definici0ñ dada en la geometría analítica, donde la distancia entre x y y es la longitud del vector ( x - y ) (véase Fig. 3.2). Definición. La distancia entre dos vectores x y y de n componentes es d(x, y) = I x - y I (3.22) definición que satisface las siguientes propiedades y Figura 3.2 Resta de vectores en el plano. x * Kreider, Kuller, Ostberg, Perkins. An Introduction 10 Linear Analysis. Addison-Wesley (1966). Matrices y sistemas de ecuaciones lineales 147 La demostración está fuera de los objetivos de este libro, pero el lector interesado pue- de encontrarla en Kreider et. al.* Definición. Si x y y son vectores distintos del vector O, con n componentes, el cose- no del ángulo entre ellos se define como: x'y cos ()=--- Ixl I Y I Si alguno de los vectores es el vector cero, se hace cos () igual a cero. Ejemplo 3.14 Si xT = [2 -34 1 ] Yy T = [-1 242], calcule el ángulo entre ellos. Solución Figura 3.2 Resta de vectores en el plano. cos () = de donde () = 68.58 2(-1) + (-3) (2) + 4(4) + 1(2) = 0.3651 J4 + 9 + 16 + 1 J1 + 4 + 16 + 4 Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. x=[2 - 3 4 1J [2 , -3 , 4 , lJ ->x [-1 , 2 , 4 , 2J ->yy=[ -1 2 4 2J c t=(x*y') / (norm(x)*n orm (y )) t eta=acos (ct)/pi*180 dotp (x,y) / (norm(x)*norm(y)) -> ct cos-1 (ct)/Jtl'180->t e ta DISTANCIA ENTRE DOS VECTORES Uno de los tres conceptos que aún no se analiza es el de distancia entre dos vectores de n componentes. De nueva cuenta esto se hará "copiando" la definicióii dada en la geometría analítica, donde la distancia entre x y y es la longitud del vector ( x - y ) (véase Fig. 3.2). Definición. La distancia entre dos vectores x y y de n componentes es d(x, y) = I x - y I (3.22) definición que satisface las siguientes propiedades y x * Kreider, Kuller, Ostberg, Perkins. An lntroduction to Linear Analysis. Addison- Wesley (1966).
  • 160. lipa 148 Métodos numéricos aplicados a la ingeniería a) La distancia entre dos vectores es un número real no negativo que es cero si y só- lo si se trata del mismo vector; es decir, 3.3 d( x, y ) ~ O Y d( x, y) = O si y sólo si x = y (3.23) b) Es independiente del orden en que se tomen los vectores; esto es d(x, y) = d(y, x) e) Finalmente, satisface la desigualdad del triángulo, conocida en la geometría en los términos: la suma de las longitudes de los catetos de un triángulo es ma- yor o igual a la longitud de la hipotenusa: esto es d(x, y) + d(y, z) ~ d(x,z) Eje para tres vectores cualesquiera x, y y z. Calcule la distancia entre x y y dadas por: x" = [O 35 1 ], yT = [ -2 1 -3 1 ] Solución Primero se obtiene x - y x-y= m-UJ = m La norma de este vedar es: Ix - y I = J 22 + 22 + 82 + 02 = [Ti = 8.4853, y, por tanto, la distancia entre x y y es 8.4853 unidades de longitud. Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. X=[O 3 5 1J y=[-2,l,-3,lJ dist=norm (x-yL [O,3,5,lJ ....•x [-2,l,-3,l} ....•y norm (x-y) ....•dist Obsérvese que ninguno de estos tres conceptos tiene representación geométrica cuando el número de componentes de los vectores es mayor de tres. SUGERENCIA: Explore con Mathcad, Matlab o algún software disponible, las operaciones vistas y sus propiedades. Ejer 148 Métodos numéricos aplicados a la ingeniería a) La distancia entre dos vectores es un número real no negativo que es cero si y só- lo si se trata del mismo vector; es decir, d( x, y ) ~ OYd( x, y) = Osi y sólo si x = y (3.23) b) Es independiente del orden en que se tomen los vectores; esto es d(x, y) = d(y, x) e) Finalmente, satisface la desigualdad del triángulo, conocida en la geometría en los términos: la suma de las longitudes de los catetos de un triángulo es ma- yor o igual a la longitud de la hipotenusa; esto es d(x, y) + d(y, z) ~ d(x,z) para tres vectores cualesquiera x, y y z. Calcule la distancia entre x y ydadas por: xT = [O 3 5 1 ], yT = [ -2 1 - 3 1 ] Solución Primero se obtiene x - y x-y= m-UJ = m La norma de este vector es: I x - y I = J22 + 22 + 82 + 02 = [7i =8.4853, y, por tanto, la distancia entre x y y es 8.4853 unidades de longitud. Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. x=[O 3 5 l} y=[-2,l,-3,l] dist=norm (x-y) [O,3,5,l}-+x [-2,l,-3,l]-+y norm (x-y) -+dist Obsérvese que ninguno de estos tres conceptos tiene representación geométrica cuando el número de componentes de los vectores es mayor de tres. SUGERENCIA: Explore con Mathcad, Matlab o algún software disponible, las operaciones vistas y sus propiedades.
  • 161. Matrices y sistemas de ecuaciones lineale s 149 3.3 Independencia y ortogonalización de vectores Una expresión de la forma (3.26) donde a" ~, ... , an son números re~es y xi' x2'... , Xn son vectores de m elementos cada uno, se llama combinación lineal de los vectores xi' x2'··· , xn. ¿La expresión es una combinación lineal? Solución Sí; es una combinación lineal de [ 1 043 ]T, [ -42 1.65 F y [ 5 -2 O 1] T, con los esca- lares 2.5,3 Y-7, respectivamente. I A menudo los elementos de un vector Xi de una combinación lineal, tendrán dos subíndi- ces; el primero indica la fila a que pertenece y el segundo se refiere al vector a que corres- ponde, así Xli X2i Xi = Se dice que un vector x = [xi' X2' .•• xmF, depende linealmente de un conjunto de vectores de m elementos xi' x2' ... xn' si se pueden encontrar escalares al a2, ... an , tales que se cumpla la siguiente ecuación vectorial (3.27) Si, por el contrario, no existen escalares que satisfagan tal ecuación, x es un vector lineal- mente independiente de Xl x2' ... , x¡¡'En otras palabras, X es linealmente dependiente de xl, x2'··· xn si y sólo si X es una combinación lineal de xi' x2'··· xll ' Dado el conjunto de dos vectores de dos elementos: y demuestre que el vector xT = [O 8]T es linealmente dependiente de dicho conjunto. Solución Es suficiente encontrar dos escalares al y a2 tales que la combinación al Xl + a2 x2 repro- duzca a x. Por observación se advierte que los números al = 1 Y a2 = 2 cumplen este re- quisito. M at rices y s istemas de ecuaciones lineales 149 3.3 Independencia y ortogonalización de vectores Una expresión de la forma (3.26) donde al' az,... ,a n son números reales y X" x2' ... , Xn son vectores de m elementos cada uno, se llama combinación lineal de Íos vectores x" x2'··· , Xn ' ¿La expresión es una combinación lineal? Solución Sí; es una combinación lineal de [ 1 043 ]T, [ -42 1.65 JT y [ 5 - 2 O 1] T, con los esca- lares 2.5, 3 Y-7, respectivamente. I A menudo los elementos de un vector Xi de una combinación lineal, tendrán dos subíndi- ces; el primero indica la fila a que pertenece y el segundo se refiere al vector a que corres- ponde, así Xi = Se dice que un vector X = [x" x2' ... xmF, depende linealmente de un conjunto de vectores de m elementos xl' x2' ... xn' si se pueden encontrar escalares al a2, . . . an , tales que se cumpla la siguiente ecuación vectorial (3.27) Si, por el contrario, no existen escalares que satisfagan tal ecuación, x es un vector lineal- mente independiente de Xl x2' ... , xn ' En otras palabras, X es linealmente dependiente de Xl, x2'··· xn si y sólo si X es una combinación lineal de x" x2'··· xll ' Dado el conjunto de dos vectores de dos elementos: y demuestre que el vector xT = [O 8]T es linealmente dependiente de dicho conjunto. Solución Es suficiente encontrar dos escalares al y a 2 tales que la combinación al Xl + a 2 x2 repro- duzca a x. Por observación se advierte que los números al = 1 Ya2= 2 cumplen este re- quisito.
  • 162. 150 Métodos numéricos aplicados a la ingeniería Generalmente, encontrar los escalares o la demostración de que no existen es un problema difícil que requiere una técnica específica, misma que se desarrolla más adelante. INDEPENDENCIA DE CONJUNTOS DE VECTORES Un conjunto de vectores dado Yl' Y2"" Yn' es linealmente dependiente si por lo menos uno de ellos es combinación lineal de alguno o todos los vectores restantes. Si ninguno lo es, se dice que es un conjunto linealmente independiente. Sea el siguiente conjunto de cuatro vectores de tres elementos cada uno. Determine si es linealmente dependiente o independiente. Solución Este conjunto es linealmente dependiente, ya que Y3 se obtiene de la combinación YY4 se obtiene de combinar Y¡ y Y2 en la siguiente forma [ O.03~ -0.9 O o m + 0.3 Ir gl in Si se considera el conjunto formado sólo por Y, y Y2' se tiene que es linealmente indepen- diente, ya que ninguno se obtiene multiplicando al otro por algún escalar. Cualquier conjunto que tenga el vector cero (vector cuyos componentes son todos ce- ro) como uno de sus elementos, es linealrnente independiente, ya que dicho vector podrá obtenerse siempre de cualquier otro vector del conjunto por la combinación Un conjunto formado por un solo vector (distinto de O) es linealmente independiente. o x',i O X2,i 0= =0 O Xn,i Ir gl
  • 163. Matrices y sistemas de ecuaciones line ales 151 INTERPRETACiÓN GEOMÉTRICA DE LA INDEPENDENCIA LINEAL Es conveniente estudiar la independencia lineal desde el punto de vista geométrico, aun- que esto sólo valga para vectores de dos y tres componentes. Considérense los tres vecto- res del ejemplo 3.17 en el plano x-y (Fig. 3.3). Por la geometría se sabe que dos vectores que se cortan forman un plano (por ejemplo XI y x2 forman el plano x-y). Por tanto, es na- tural pensar que si se tiene un tercer vector del plano x-y, éste pueda obtenerse de alguna combinación de los que se cortan, por ejemplo x3 de XI y x2' aplicando la ley del parale- logramo. Si, por otro lado, se tienen dos vectores de dos componentes linealmente dependien- tes, esto se manifiesta geométricamente como paralelismo (véanse los vectores XI y x2 de la Fig. 3.4). Es evidente que estos vectores paralelos no forman un plano y un tercer vector x3 que no sea paralelo a ellos no podrá generarse con una combinación lineal de XI y x2. En conclusión, la característica geométrica de dos vectores linealmente independien- tes es que se cortan en un punto. En cambio, dos vectores linealmente dependientes son paralelos. y 10 Figura 3.3 Interpretación geométrica de independencia lineal en el plano. 2 4 6 8 x y Figura 3.4 Interpretación geométrica de dependencia lineal en el plano. x Figura 3.3 Interpretación geométrica de independencia lineal en el plano. Figura 3.4 Interpretación geométrica de dependencia lineal en el plano. Matrices y sistemas de ecuaciones lineales 151 INTERPRETACiÓN GEOMÉTRICA DE LA INDEPENDENCIA LINEAL Es conveniente estudiar la independencia lineal desde el punto de vista geométrico, aun- que esto sólo valga para vectores de dos y tres componentes. Considérense los tres vecto- res del ejemplo 3.17 en el plano x-y (Fig. 3.3). Por la geometría se sabe que dos vectores que se cortan forman un plano (por ejemplo XI y x2 forman el plano x-y). Por tanto, es na- tural pensar que si se tiene un tercer vector del plano x-y, éste pueda obtenerse de alguna combinación de los que se cortan, por ejemplo x3 de XI y x2' aplicando la ley del parale- logramo. Si, por otro lado, se tienen dos vectores de dos componentes linealmente dependien- tes, esto se manifiesta geométricamente como paralelismo (véanse los vectores XI y x2 de la Fig. 3.4). Es evidente que estos vectores paralelos no forman un plano y un tercer vector x3 que no sea paralelo a ellos no podrá generarse con una combinación lineal de XI y x2. En conclusión, la característica geométrica de dos vectores linealmente independien- tes es que se cortan en un punto. En cambio, dos vectores linealmente dependientes son paralelos. y 10 2 4 6 8 x y x
  • 164. 152 Métodos numéricos apl icados a la ingeniería CONJUNTOS ORTOGONALES DI';: VECTORES Ejel Dos vectores de igual número de componentes son ortogonales o perpendiculares si el co- seno del ángulo entre ellos es cero. De acuerdo con esta definición, el vector cero es orto- gonal con cualquier otro vector; en general, x y y son ortogonales si y sólo si x o y = XI Yl + x2 Y2 + ... + xn YIl = O, derivada esta expresión del hecho que cos () = _x_o .:....Y_ Ixl I Y I A continuación se generaliza la definición de ortogonalidad. Un conjunto de vectores Xl' x2 ' ... xn forma un conjunto ortogonal si Xi:# Opara 1 ~ :{n, y 1~j:{n (3.28) siempre que i ;f. j. Determine si los vectores Xl y x2 del ejemplo 3.17 son ortogonales. Solución Son perpendiculares en el sentido usual del término (véase Fig. 3.3) Yesto es 10que sig- nifica la definición, dada para cualquier número de componentes. ¿El conjunto siguiente es ortogonal? x, ltl ~= m, ~= m Solución Sí, ya que XI o x2 = Xl o x3 = x2 o x3 = O En cambio, si se adiciona a este conjunto el vector el conjunto resultante xl' x2' x3' x4 no es ortogonal, pues x4 o x2 = 1 ;f. O Fi Ortogo en el, 152 Solución Métodos numéricos aplicados a la ingeniería CONJUNTOS ORTOGONALES DE VECTORES Dos vectores de igual número de componentes son ortogonales o perpendiculares si el co- seno del ángulo entre ellos es cero. De acuerdo con esta definición, el vector cero es orto- gonal con cualquier otro vector; en general, x y y son ortogonales si y sólo si x o y = XI YI + X2Y2 + .. . + Xn YIl = O, derivada esta expresión del hecho que cos () = _x_o_Y_ Ixl I Y I A continuación se generaliza la definición de ortogonalidad. Un conjunto de vectores XI' X2' ... xn forma un conjunto ortogonal si Xi :# Opara 1 ~ :5n, y l~j :5 n (3.28) siempre que i :f; j. Determine si los vectores x I y x2 del ejemplo 3.17 son ortogonales. Son perpendiculares en el sentido usual del término (véase Fig. 3.3) Yesto es 10 que sig- nifica la definición, dada para cualquier número de componentes. ¿El conjunto siguiente es ortogonal? x, m· ~= m· ~= m Solución Sí, ya que XI o x2 =XI o x3 =x2 o x3 = O En cambio, si se adiciona a este conjunto el vector el conjunto resultante xl' x2' x3' x4 no es ortogonal, pues x4 o x2 = 1 :f; O
  • 165. Matrices y sistemas de ecuaciones lineales 153 Corrobore si el siguiente conjunto de vectores es ortogonal Solución Xl • x2 = (-3) (2) + 4(2) + 1(-2.0003) = -0.0003 Obsérvese que los vectores son "casi" ortogonales. Esto ocurre con frecuencia y en los cálculos prácticos será preciso decidir con qué cercanía a cero se aceptará que un produc- to punto de dos vectores "es cero" y, por tanto, que los vectores son ortogonales. De nue- vo e denotará el límite de aceptación o de rechazo. El valor que tome e estaría en función del instrumento con que se lleven a cabo los cálculos. Por ejemplo, para una calculado- ra de nueve dígitos de exactitud e puede ser 10-4. Con e = 10-4 los vectores de este ejem- plo no son ortogonales. Así pues, E usado de esta manera puede llamarse criterio de ortogonalidad. ORTOGONALlZACIÓN Se ha llegado al punto central de esta sección, donde es posible construir un conjunto de vec- tores ortogonales (ortogonalización) a partir de un conjunto de vectores linealmente indepen- dientes. Enseguida se considerará uno de los métodos más difundidos, la ortogonalización de Gram-Schmidt, aunque pueda representar ciertas dificultades computacionales. MÉTODO DE GRAM-SCHMIDT En lugar de empezar con el caso más general, se introducirá el proceso de ortogonaliza- ción con dos ejemplos; el primero se tiene cuando se toman dos vectores Xl y x2 del pla- no x-y, linealmente independientes y a partir de ellos se forma el conjunto ortogonal el y e 2 . La figura 3.5 muestra la manera natural de resolver este caso; simplemente se toma el = Xl Y e2 como la "componente" de x2 perpendicular a Xl' Así, se escribe e2 en la forma (3.29) y sólo queda determinar (X,1,2 de manera que la condición el • e2 = O se cumpla. Esto da la ecuación (3.30) Figura 3.5 Ortogonalización en el plano x-y. Solución Figura 3.5 Ortogonalización en el plano x-y. Matrices y sistemas de ecuaciones lineales 153 Corrobore si el siguiente conjunto de vectores es ortogonal Xl • x2 = (- 3) (2) + 4(2) + 1(-2.0003) = -0.0003 Obsérvese que los vectores son "casi" ortogonales. Esto ocurre con frecuencia y en los cálculos prácticos será preciso decidir con qué cercanía a cero se aceptará que un produc- to punto de dos vectores "es cero" y, por tanto, que los vectores son ortogonales. De nue- vo E denotará el límite de aceptación o de rechazo. El valor que tome E estaría en función del instrumento con que se lleven a cabo los cálculos. Por ejemplo, para una calculado- ra de nueve dígitos de exactitud E puede ser 10-4. Con E =10-4 los vectores de este ejem- plo no son ortogonales. Así pues, E usado de esta manera puede llamarse criterio de ortogonalidad. ORTOGONALlZACIÓN Se ha llegado al punto central de esta sección, donde es posible construir un conjunto de vec- tores ortogonales (ortogonalización) a partir de un conjunto de vectores linealmente indepen- dientes. Enseguida se considerará uno de los métodos más difundidos, la ortogonalización de Gram-Schmidt, aunque pueda representar ciertas dificultades computacionales. MÉTODO DE GRAM-SCHMIDT En lugar de empezar con el caso más general, se introduCirá el proceso de ortogonaliza- ción con dos ejemplos; el primero se tiene cuando se toman dos vectores XI y x2 del pla- no x- y, linealmente independientes y a partir de ellos se forma el conjunto ortogonal el y e2. La figura 3.5 muestra la manera natural de resolver este caso; simplemente se toma el = XI Y e2 como la "componente" de x2 perpendicular a XI' Así, se escribe e2 en la forma (3.29) y sólo queda determinar (X1.2 de manera que la condición e l • e 2 = Ose cumpla. Esto da la ecuación (3.30)
  • 166. " 154 Métodos numéricos aplicados a la ingeniería y finalmente: X2• el 0. 12 =--- , el· el De este modo e2 queda determinado en función de XI y x2' y el conjunto Xl' X2 se ha ortogonalizado. (3.31) Ortogonalice xl = [2 2]T Yx2 = [3 O]T Solución y 1, ' con [2 2F· [3 O]T a - ---=---_=_ 1,2 - [2 2]T. [2 2]T 6 3 4 + 4 4 Sustituyendo queda: e2 = [3 O]T- ~ [2 2F = [3 O]T- [~ ~]T = [1.5 -1.5F Al graficar estos vectores se obtiene la siguiente figura y Figura 3.6 Ortogonalización de vectores. x x,= [:] - [1.5]e2 - -1.5 Ort Obsérvese la perpendicularidad de el y e2· Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. ~ xl=[2; 2J x2=[3; OJ el=xl alfa12=(el'*x2)/(el'*el) e2=x2-alfa:{.2*el [2;2J~xl [3;OJ~x2 x l=+e I dotP(el,x2)/dotP(el,el)~a12 x2-a12*el~e2 154 Métodos numéricos aplicados a la ingeniería y finalmente: X2 ' el Ct.1 2 =--- , el • e l (3.3 1) De este modo e2 queda determinado en función de XI y x2' y el conjunto xI' x2 se ha ortogonalizado. Ejemplo 3.22 Ortogonalice xI =[2 2]T Yx 2 =[3 O]T Solución Figura 3.6 Ortogonalización de vectores. y con [2 2]T. [3 Of Ct. - -- -- - - 1,2 - [2 2]T. [2 2]T 6 4+4 3 4 Sustituyendo queda: e2 = [3 O]T - ~ [2 2]T = [3 O]T - [~ ~]T = [1.5 - 1.5]T Al graficar estos vectores se obtiene la siguiente figura y x Obsérvese la perpendicularidad de el y e2. Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. xl=[2; 2J x2=[3; OJ el=xl alfa12=(el '*x2) / (el ' *el) e2=x2- alfa¡2*el [2 ; 2J ....xl [3 ; OJ ....x2 xl"" el dotP (el , x2) / dotP (el, el) ....a12 x2- a12*el ....e2
  • 167. Matrices y sistemas de ecuaciones lineales 155 Como segundo ejemplo se ortogonalizará el conjunto arbitrario xl' x2' x3 de vectores lineales independientes de tres componentes. El procedimiento es esencialmente igual al que se usó antes, y se empieza escogiendo e¡ = Xl' El segundo paso es determinar e2 de acuerdo con el par de ecuaciones e2 • el = O, e2 = x2 - a¡,2 e¡ de las que se obtiene nuevamente que X2' el a¡,2=--- el • el Obsérvese que e2 :;:. O; de lo contrario se cumpliría la primera de las ecuaciones 3.32 y en la segunda se tendría que x2 = al,2el = al,2 xl' O sea que x2 estaría en función de xl' lo cual es imposible por la independencia lineal de XI y x2 . Para el tercer vector se recurre nuevamente a una representación geométrica, en don- de se verá que el proceso de ortogonalización puede completarse tomando e3 como la com- ponente de x3 perpendicular al plano formado por los vectores el y e2 (Fig.3.7).* De esto se tiene e3 = x3 - al,3e¡ - ~,3e2 y se puede encontrar al,3 y ~,3 por medio de las condiciones de ortogonalidad e¡ • e2 = el • e3 = e2 • e3 = O Figura 3.7 Ortogonalización en el espacio x-y-z. I I I I - - -~--=ii-l /' Multiplicando en forma punto los dos miembros de la ecuación 3.34 por el Y después por e2 , se obtiene el par de ecuaciones e3 el O x3 e¡ a1,3e¡ e¡ ~,3e2 e¡ e3 e2 O x3 e2 al,3e¡ e2 a2,3e2 e2 o bien x3 el = al,3 el • el x3 e2 = a2,3 e2 • e2 • Recuérdese que dos líneas que se cortan solamente en un punto forman un plano. r:x:-- (3.32) (3.33) (3.34) (3.35) (3.36)
  • 168. 156 Métodos nu méricos aplicados a la ingeniería resolviendo para <x1,3 y para <X2,3' se tiene x3• el <Xl,3 =e-:e'1 1 y con esto termina la ortogonalización del conjunto xl' x2' x3' Ortogonalice los vectores Solución el = Xl' e2 = x2 - al,2 el' Y e3 = x3 - al,3el - az,3e2' / ,,--~- - - - - -/o / I / I // I x3 ='11, 1, l]T I / J I T .11 e~= [-0.5,0.5, O] / I I / -'- ~ ~- T I / x2 = [O, 1, O] / I / I / / / Figura 3.8 Ortogonalización en el espacio. / / / / / I / LI'_ / / / Xl = el = [1, 1, OF donde a¡,2 al,3' y az,3 se obtienen de las ecuaciones x2• el a¡,2=~' ¡ 1 . x3• el a ----1,3 - el· el ' Al verificar los cálculos se llega a al,2 = 1/2, a¡,3 = 1, az,3 = O y sustituyendo e¡ =[11 O]T, e2 =[-1/21/2 O]T, e3 =[O 01 ]T Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. 156 Solución Figura 3.8 Ortogonalización en el espacio. Méto d os n u m é rico s aplic a dos a la in geniería resolviendo para <x1,3 y para <X2,3' se tiene x 3 • el <Xl,3 = e-;e-' 1 1 y con esto termina la ortogonalización del conjunto xl' x2' x3. Ortogonalice los vectores / L"_ / / / / / / / / / - .../ 1I el =Xl' e 2 =x2 - al ,2 el' y e 3 = x3 - al ,3e l - ~,3e2' - - - -'1 / / I / I I T e~ = [-0.5,0.5, O] I ~r- /~ T / x2 = [O, 1, O] / / / / donde a l ,2 a l ,3' y ~,3 se obtienen de las ecuaciones x2 • el a ----1,2 - el. el ' Al verificar los cálculos se llega a . x3 • el a - - --l,3 - el · el ' al ,2 = 1/2, al ,3 = 1, ~,3 =O y sustituyendo el =[11 O]T, e 2 =[-1/21/2 O]T, e 3 =[O 01 ]T Para realizar los cálculos puede usarse Matlab o la TI-92 Plus.
  • 169. Matrices y sistemas de ecuaciones lineales 157 .:;. xl=[1; 1; OJ x2=[0; 1; O] x3=[l; 1; lJ el=xl alfa12=(el'*x2)/(el'*el) e2=x2-alfa12*el alfa13=(el'*x3)/(el'*el) alfa23= (e2'*x3) / (e2'*e2) e3=x3-alfa13*el-alfa23*e2 xl->el dotP(el,x2) /dotP(el,el) ->a12 x2-a12*el->e2 dotP(el ,x3) /dotP(el ,el) ->al3 dotP(e2,x3)/dotP(e2,e2j->a23 x3-a13*el-a23*e2->e3 [l;l;OJ->xl [O; 1;OJ->x2 [1; 1; 1]->x3 Una vez realizado lo anterior, se pude pasar el caso general de ortogonalizar un conjunto de n vectores linealmente independientes xl' x2' ... , x" de n componentes cada uno. Pri- mero se efectuará el = xl' después e2= x2 -al,2 el' donde al,2 se escoge de manera que el . e2 = O. De aquí que X2 • el al,2 = --e-:-e 'I I Yla independencia lineal de XI y x2 implica que e2 -:f. O. Unicamente queda por demostrar que este proceso puede continuar hasta obtener un conjunto ortogonal el' e2, ... e". Para ello, supóngase que se llegó al conjunto ortogonal el' e2, .•• , em con m < n. Para continuar un paso más efectúese y determínese al m+l' ~ m+1... , am m+l' de manera que em+1sea ortogonal a cada elemen- to del conjunto e'l' e2 , ... ',em. Consecuentemente el conjunto de ecuaciones es Xm+1 • el xm+l • e2 al,m+1 (el· el) = O, ~,m+1 (e2 • e2) = O, am,m+1 (em• em) = O, y por tanto: que determinan em+ l' De nuevo, la independencia lineal de XI' x2'· .. , xm+ 1, implica que em+ I -:f. O.Por tanto, el proceso de ortogonalización se ha aumentado en un paso y con el mismo argumento puede continuarse hasta tener m = n. Lo anterior queda condensado en el si- guiente teorema. TEOREMA 3.1 Sean XI' x2' •.. , x"' un conjunto de vectores linealmente independientes de n componentes cada uno. A partir de ellos se puede construir un conjunto ortogonal el' e2,··· , en de la siguiente manera (3.37) Matrices y sistemas de ecuaciones lineales 157 xl=[l; 1; OJ x2=[0; 1; O] x3=[l; 1 ; 1] el=xl alfa12=(el'*x2)/(el'*el) e2=x2- alfa12*el alfa13=(el'*x3)/(el '*el) alfa23= (e2'*x3) / (e2'*e2) e3=x3-alfa13~el-alfa23*e2 xl-+el [l ; l ; O]-+xl [O ; 1 ; 0]-+x2 [1 ; 1; 1] -+x3 dotP (el , x2) /dotP (el , el) -+a12 x2- a12*el-+ e2 dotP(el ,x3) /dotP(el ,el) -+a13 dotP(e2,x3)/dotP(e2,e2j-+a23 x3-al3*el - a23*e2-+e3 Una vez realizado lo anterior, se pude pasar el caso general de ortogonalizar un conjunto de n vectores linealmente independientes xl' x2' ... , xI! de n componentes cada uno. Pri- mero se efectuará el =Xl' después e2=x2 -al ,2 el' donde al ,2 se escoge de manera que el . e2 =O. De aquí que y la independencia lineal de XI y x2 implica que e2 ::f:. O. Unicamente queda por demostrar que este proceso puede continuar hasta obtener un conjunto ortogonal el' e2, .. . en' Para ello, supóngase que se llegó al conjunto ortogonal el' e2, .. • , em con m < n. Para continuar un paso más efectúese y determínese al m+l' ~ m+1 . . . , am m+l' de manera que em+1 sea ortogonal a cada elemen- to del conjunto e'l' e2, •.. " em. Consecuentemente el conjunto de ecuaciones es y por tanto: Xm+1 • el xm+l • e2 a l•m+1 (el · el) = O, ~.m+l (e2 • e2) = O, am•m+1 (em • em) =O, Xm+1 • el x m+1 • e2 x m+1 • e", al.m+1 = e e ,~. m+1 = e e ,... , am, m+ 1 = e e l· I 2· 2 m· m que determinan em+ I. De nuevo, la independencia lineal de XI' x2'· .. , xm+ l. implica que em+ I ::f:. O. Por tanto, el proceso de ortogonalización se ha aumentado en un paso y con el mismo argumento puede continuarse hasta tener m = n. Lo anterior queda condensado en el si- guiente teorema. T EOREMA 3.1 Sean XI' x2' . . . , x"' un conjunto de vectores linealmente independientes de n componentes cada uno. A partir de ellos se puede construir un conjunto ortogonal el ' e2,... , ende la siguiente manera (3.37)
  • 170. XI= m X2 = [H X3 = mSolución el = xi' e2 = X2 - al,2 el' ~~" donde: x2• el m m 6 aI2=--- m [~J - , el • el 5 Sustituyendo e2 = m ~m PJ_6/5 e3 = X3 - al,3 el - a2,3 e2, donde x3 • el m·m 3 x 3 • e 2 m ·[tJ 35 a1,3 = el· el m [~J 5 ' a2,3 = e2• e2 145 [~]['~~_6/5 _6/5 Sustituyendo e, = [:] [2J [ ~J [-"''']3 O - ~ 2 - 15/29-- 5 1 145 _6/5 - 20/29 158 Métodos numéricos aplicados a la ingeniería y 1 :s; t s: n-l donde x. 1· e.a - 1+ I i, i+l - e¡. e¡ (3.38) Pa Ortogonalice el siguiente conjunto de vectores lineal mente independientes PA PA PA PA N( Para los cálculos puede auxiliarse del guión del ejemplo 3,23, con los cambios perti- nentes,
  • 171. Matrices y sistemas de ecuacione s lineales 159 A continuación se presenta un algoritmo para ortogonglizar un conjunto de n vectores de n componentes cada uno por el método visto. ALGORITMO 3.2 Ortoqobanzación de Gram-Schmidt Para ortogonalizar un conjunto de N vectores lineal mente independientes de N componentes cada uno, proporcionar los DATOS: El número N y los vectores xl,x2, ... ,xN. RESULTADOS: El conjunto de vectores ortogonales el, e2, ... ,eN. PASO 1. Hacer e1=xl. P.~_SO2. Hacer 1=1. PASO 3. Mientras I ::;N - 1, repetir los pasos 4 a 10. PASO 4. Hacer e (1 +1) = x (1 + 1). PASO 5. Hacer J = 1. PASO 6. Mientras J ::;1, repetir los pasos 7 a 9. PASO 7. Hacer ex (J, I + 1) = (x (1 +1) • e (J))/(e (J) . e (J)). PASO 8. Hacer e (1 + 1 ) = e (1 + 1) - ex (J, I + 1 ) * e (J). PASO 9. Hacer J = J + 1. PASO 10. Hacer I = I +1 PASO ll.lMPRIMIR los vectores el, e2, ... , eN y TERMINAR. NOTA: En el paso 7, el punto indica producto escalar de dos vectores. En el 8, ex ( J, 1 + 1) es un escalar que multiplica al vector e (J) y la resta es vectorial. En los pasos 1,4, 7 Y 8 se trata de asignaciones de todos los componentes de un vector a otro. SUGERENCIA: Es recomendable trabajar con un programa desarrollado en un lenguaje de alto nivel (véase Probo 3.14) basado en el algoritmo 3.2 o en un pizarrón electrónico (Mathcad, por ejemplo) para evitar cálculos y analizar la ortogonalización más finamente. Una aplicación importante de los resultados obtenidos es determinar la independencia o de- pendencia lineal de un conjunto dado de vectores. Para esto se partirá de un conjunto lineal- mente dependiente particular, obsérvese qué ocurre en el proceso de ortogonalización. Sean XI = [1 2]T Y x2 = [- 2 -4] T. Obviamente ~ = -2 XI Efectuando el= XI = [1 2] T Y X 2 • el . [-2 -4F' [1 2F e2 = x2 - ~ el = [-2 -4] r - [1 2F' [1 2F [1 2F = l- 2 - 4 F- (-2 ) [1 2]T = [O O]T y, por tanto, e2 = O Si XI Yx2 son vectores linealmente dependientes cualesquiera, al aplicar el proceso de ortogonalización se tiene: Matrices y sistemas de ecuaciones lineales 159 A continuación se presenta un algoritmo para ortogon~lizar un conjunto de n vectores de n componentes cada uno por el método visto. ALGORITMO 3.2 Ortogonaliz8ción de Gram-Schmidt Para ortogonalizar un conjunto de N vectores linealmente independientes de N componentes cada uno, proporcionar los DATOS: El número N y los vectores xl,x2,... ,xN. RESULTADOS: El conjunto de vectores ortogonales el, e2,... ,eN. PASO 1. Hacer el=x1. P.'SO 2. Hacer 1=1. PASO 3. Mientras 1S N - 1, repetir los pasos 4 a 10. PASO 4. Hacer e (1 +1) = x (1 + 1). PASO 5. Hacer J = 1. PASO 6. Mientras J S 1, repetir los pasos 7 a 9. PASO 7. Hacer a (J, 1+ 1) = (x (1 +1) . e (J))/(e (J) • e (J)). PASO 8. Hacer e (1 + 1 ) = e (1 + 1) - a (J, 1 + 1 ) * e (J). PASO 9. Hacer J = J + 1. PASO 10. Hacer 1 = 1+1 PASO II.IMPRIMIR los vectores el, e2,... , eN y TERMINAR. NOTA: En el paso 7, el punto indica producto escalar de dos vectores. En el 8, a ( J, I + 1) es un escalar que multiplica al vector e (J) y la resta es vectorial. En los pasos 1,4, 7 Y8 se trata de asignaciones de todos los componentes de un vector a otro. SUGERENCIA: Es recomendable trabajar con un programa desarrollado en un lenguaje de alto nivel (véase Probo 3.14) basado en el algoritmo 3.2 o en un pizarrón electrónico (Mathcad, por ejemplo) para evitar cálculos y analizar la ortogonalización más finamente. Una aplicación importante de los resultados obtenidos es determinar la independencia o de- pendencia lineal de un conjunto dado de vectores. Para esto se partirá de un conjunto lineal- mente dependiente particular, obsérvese qué ocurre en el proceso de ortogonalización. Sean Xl = [1 2]T Y x2 =[- 2 -4] T. Obviamente ~ =- 2 Xl Efectuando el =Xl = [1 2] T Y _ x2 • el _ T [-2 -4]T' [1 2P T e2 - x2 - ~ el - [-2 -4] - [1 2]T. [1 2F [1 2] = [- 2 - 4 F - (-2 ) [1 2]T = [O O]T y, por tanto, e2 =O Si XI Yx2 son vectores linealmente dependientes cualesquiera, al aplicar el proceso de ortogonalización se tiene:
  • 172. 160 Métodos numéricos aplicados a la ingeniería el' el pero -- = 1, por tanto, e2 = O Y I e2 I= O. el' el Generalmente, para determinar si un conjunto dado Xl' X 2 ' ... , XII es linealmente depen- diente o independiente, se le aplica el proceso de ortogonalización de Gram-Schmidt. Supón- gase que se han obtenido en dicho proceso el' e2,... , e¡, a partir de xi' x2' ... , Xi. Si al querer obtener e¡+l resulta que Ie¡+l 1= O,o en términos prácticos su cercanía a cero satisface un cri- terio de ortogonalidad prestablecido I e¡+ll < E, el vector x¡ + 1 es lineal mente dependiente de los vectores xl' x2' ... , Xi; como consecuencia, el conjunto dado es linealmente dependien- te. Si, por el contrario, se obtienen el' e 2 , •.. , en tales que Ie j I> e para 1 -::;'j -::;,n, el conjunto en cuestión es linealmente independiente. Analice si los siguientes vectores son linealmente independientes. x, = ln x,= ln ~= III Solución Se aplica el proceso de Gram-Schmidt =0 lo cual implica que x2 es linealmente dependiente de Xl. El conjunto es linealmente depen- diente. Sin embargo, el proceso de ortogonalización puede continuar para ver si x3 es li- nealmente dependiente de xl 160 Métodos numéricos a plicados a la ingeniería e . e pero _ 1 _ 1 =1, por tanto, e2 =O Y I e2 I=O. el' el Generalmente, para determinar si un conjunto dado XI' X2' . . . , x" es linealmente depen- diente o independiente, se le aplica el proceso de ortogonalización de Gram-Schmidt. Supón- gase que se han obtenido en dicho proceso el' e2, ... , ei, a partir de xl' x 2' . .. , Xi' Si al querer obtener ei+1 resulta que Iei+1 1= O, o en términos prácticos su cercanía a cero satisface un cri- terio de ortogonalidad prestablecido Iei+l l < €, el vector Xi + I es linealmente dependiente de los vectores xl' x 2' . . . , Xi; como consecuencia, el conjunto dado es linealmente dependien- te. Si, por el contrario, se obtienen el' e2, •.. , en tales que Iej 1> € para 1 -::;'j -::;, n, el conjunto en cuestión es linealmente independiente. Analice si los siguientes vectores son linealmente independientes. x, = ln x, = ln ~=III Solución Se aplica el proceso de Gram-Schmidt lo cual implica que x2 es linealmente dependiente de Xl' El conjunto es linealmente depen- diente. Sin embargo, el proceso de ortogonalización puede continuar para ver si x3 es li- nealmente dependiente de X I
  • 173. Matrices y sistemas d e ecuaciones lineales 161 Obsérvese que en el cálculo de e3 se ignora a e2. Como e3 ::F- 0, xI y x3 son lineal mente in- dependientes. Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. x1=[0; 5; 5; O}; x2= [ O; 1; 1; O] x3=[1; 1; 1; 1] e1=x1 a1fa12= (el '*x2) / (el '*e1) e2=x2-a1fa12*e1 aifa13=(el'*x3)/(e1'*e1) if norm (e2) >= 1e-5 aifa23=(e2'*x3)/(e2'*e2) e3=x3-aifal3*e1-aifa23*e2 eise . e3=x3-aifal3*e1 end RANGO e3_25 () Progm [0;5;5;0]->xl : [0;1;1;0]->x2 [1;1;1;1]->x3 : CirIO xlr+e I : Disp el : Pause dotP(e1,x2)/(dotP(e1,el)->a12 x2-a12*e1->e2 : Disp e2 : Pause dotP (el ,x3) / (dotP (el ,el) ->a13 If norm(e2) >= lE-5 Then dotP(e2,x3)/(dotP(e2,e2)->a23 x3-a13*e1-a23'"e2->e3 Eise x3-al3*el->e3 EndIf Disp e3 EndPrgm El número de vectores linealmente independientes de un conjunto dado recibe el nombre de rango o característica del conjunto. Así, el conjunto del ejemplo 3.25 tiene un rango de 2. Para un conjunto de m vectores, cada uno de n componentes, el rango puede ser co- mo máximo igual al menor de m o n. RANGO DE UNA MATRIZ Una matriz puede verse como un conjunto de vectores; más claramente, la matriz. anz,n al,l al,2 a2,1 a2,2 A= am•l a",.2
  • 174. r" 162 Métodos numéri cos aplicados a la ingeniería se puede tratar como un conjunto de n vectores columna de m componentes cada uno (o bien m vectores fila de n componentes cada uno); es decir, como A = [x¡ X2 ... Xn l donde al•l al,2 al,n a2,1 a2,2 a2,n xl= x2 = X =11 am,l am,2 <: o como: Yl Y2 A= YII/ donde Y¡ = [al,l al,2'" al,fl l, Y2 = [a2,1 a2,2'" a2,,, l ,...,YI1l = [am,l am,2'" am,1l l En estas condiciones puede hablarse del rango de una matriz, en donde el rango de una matriz A está dado por el numero máximo de vectores columna o vectores fila, lineal- mente independientes: Así la matriz A = ~~ I IIcuyas columnas son los elementos del conjunto dado en el ejemplo 3.25, tiene rango 2. Cuando el rango de una matriz cuadrada de orden n es menor que n, se dice que la ma- triz es singular. Lo cual significa también que su determinante es cero (véase Probo 3.18). Si las columnas de la matriz son "casi" linealmente dependientes, recibe el nombre de casi singular o mal condicionada (véase sistemas de ecuaciones mal condicionadas, Seco 3.4). En esta sección se ha considerado una serie de conceptos teóricos que, además de su interés por sí mismos, forman un marco que permitirá explicar de manera lógica ciertos al- goritmos importantes de las matemáticas y también conceptos de existencia y unicidad de las soluciones de los problemas que resuelven dichos algoritmos. 3.4 Solución de sistemas de ecuaciones lineales Gran número de problemas prácticos de ingeniería se reduce al problema de resolver un sistema de ecuaciones lineales. Por ejemplo, pueden citarse la solución de sistemas de ecuaciones no lineales, la aproximación polinomial, la solución de ecuaciones diferencia- les parciales, entre otros . • Puede demostrarse que el número máximo de vectores columna lineal mente independientes de una matriz A, es igual al número máximo de vectores fila linealmente independientes.
  • 175. -- - ·---------------------------------~~=~="Rlliilii Matrices y sistemas de ecuaciones lineales 163 Un sistema de m ecuaciones lineales en n incógnitas tiene la forma generalo (o 1 al,lxI + al,2x2 + + al,n x " b¡ a2,IxI + a2,2x2 + + a2,I1 xn b2 (3.39) am,)x¡ + am,2x2 + ... + «;», bm Con la notación matricial de puede escribir la ecuación anterior como: a¡,¡ a¡,2 a2,) a2,2 ... a¡,1l ... a2,II bm... am.1l y concretamente como A x = b. Donde A es la matriz coeficiente del sistema, x el vector incógnita y b el vector de términos independientes. Dados A y b, se entiende por resolver el sistema (Ec. 3.39) encontrar los vectores x que lo satisfagan. Antes de estudiar las técnicas que permiten encontrar x se expondrán al- gunas consideraciones teóricas. EXISTENCIA y UNICIDAD DE SOLUCIONES Si b es el vector cero, la ecuación 3.39 es un sistema homogéneo. Si por el contrario, b "# O,el sistema es no homogéneo. A continuación se define la matriz aumentada B, forma- da con los elementos de la matriz coeficiente A y los del vector b de la siguiente manera: al,) a¡,2 al,/Z b¡ a2,) a2,2 a2,/I b2 B= =[Alb] am,l am,2 <: bm Si el rango de la matriz coeficiente A y de la matriz aumentada B son iguales, se dice que el sistema (Ec. 3.39) es consistente. Si no ocurre esto, el sistema es inconsistente (por tan- to, un sistema homogéneo siempre es consistente). Un sistema inconsistente no tiene solu- ción, mientras que uno consistente tiene una solución única o un número infinito de soluciones, según como sea el rango de A en comparación con el número de incógnitas n. Si el rango de A es igual al número de incógnitas, la solución es única; si el rango de A es menor que dicho número, hay un número infinito de soluciones (véase Fig. 3.9).
  • 176. Figura 3.9 Solución de sistemas de ecuaciones lineales. Sistemas de ecuaciones lineales A x = b Rango A * rango B RangoA = rango B I I I Inconsistente ~ I Consistente ~ I I Sin solución 11 Rango A = n Rango A < n I I Número infinito Solución única de soluciones Ejer 164 Métodos numéricos aplicados a la ingeniería Ejemplo 3.26 Sea el sistema 2x,+4x2=6 3 x, + 6 x2 = 5 La matriz aumentada es: 4 6 I ~J Puede verse fácilmente que: rango de A = 1, rango de B = 2; como rango A :#= rango B, el sistema no tiene solución. Si el sistema es homogéneo 2x, + 4 x2 O 3 xl + 6 x2 O, la matriz aumentada es: D 4 I ~J6 y rango A = 1, rango B = 1, rango A < 2 = n; en este caso existe un número infinito de so- luciones. Para realizar los cálculos puede usarse el siguiente guión de Matlab: ~ A=[2 4; 3 6] rangoA=rank(A) B=[2 4 6; 3 6 5] rangoB=rank (B)
  • 177. ,el Matrices y sistemas de ecuaciones lineales 165 Ejemplo 3.27 Sea el sistema 2 xI + 3 L x2 + X3 O O xI + 2 x2 + x3 1 xI + O x2 + x3 O, donde la matriz aumentada es: [~ 1 1 1 3 2 O Obsérvese que la matriz coeficiente son los vectores del ejemplo 3.24, que son linealmen- te independientes y, por tanto, rango A = 3. Al aplicar el método de Gram-Schmidt para ortogonalizar el vector de términos inde- pendientes se observa que es linealmente dependiente y, por tanto, rango B = 3. El siste- ma es consistente y como rango A = número de incógnitas = 3, puede esperarse solución única del sistema. Esta comprobación se deja como ejercicio para el lector. MÉTODOS DIRECTOS DE SOLUCiÓN El prototipo de todos estos métodos se conoce como la eliminación de Gauss y se presen- ta a continuación. ELIMINACiÓN DE. GAUSS Considérese un sistema general de tres ecuaciones lineales con tres incógnitas. al,lx¡ + aJ•2xZ + a1,3x3 b¡ a2,¡x¡ + a2,2xZ + aZ,3x3 bz (3.40) a3,¡x¡ + a3,Zx2 + a3,3x3 b3 Como primer paso, se reemplaza la segunda ecuación con lo que resulte de sumarle la pri- mera ecuación multiplicada por (-az/a¡). De manera similar se sustituye la tercera ecua- ción con el resultado de sumarle la primera ecuación multiplicada por (-a3 '/aJ ,J)' Esto da lugar al nuevo sistema b¡ b' 2 b' 3 a¡,¡x¡ + aJ,zxz + a1,3x3 a' z,zXz + a'2,3x3 a' 3,ZX2 + a' 3,3X3 (3.41) en donde las a' y las b' son los nuevos elementos que se obtienen de las operaciones ya mencionadas, y en donde x¡ se ha eliminado en la segunda y tercera ecuaciones. Ahora, multiplicando la segunda ecuación de 3.41 por (-a'3,z1a'Z,Z) y sumando el resultado a la tercera ecuación de 3.41, se obtiene el sistema triangular b¡ b' z b" 3 (3.42)
  • 178. 166 Métodos numéricos aplicados a la ingeniería donde a"33 y b"3' resultaron de las operaciones realizadas y x2 se ha eliminado de la ter- :, cera ecuacion. El proceso de llevar el sistema de ecuaciones 3.40 a la forma de la ecuación 3.42 se conoce como triangularización. El sistema en la forma de la ecuación 3.42 se resuelve despejando de su última ecua- ción x3' sustituyendo x3 en la segunda ecuación y despejando x2 de ella. Por último, con x3 y x2 sustituidas en la primera ecuación de 3.42 se obtiene xI. Esta parte del proceso se lla- ma sustitución regresiva. Antes de ilustrar la eliminación de Gauss con un ejemplo particular, nótese que no es necesario conservar xl' x2 y x3 en la triangularización y que ésta puede llevarse a cabo usando solamente la matriz coeficiente A y el vector b. Para mayor simplicidad se emplea- rá la matriz aumentada B. = [A lb] Con esto se incorpora la notación matricial y todas sus ventajas a la solución de sis- temas de ecuaciones lineales. Ejemplo 3.28 Resuelva por eliminación de Gauss el sistema 4xI 9x2 + 2x3 5 2x1 4x2 + 6x3 3 XI x2 + 3x3 4 Solución La matriz aumentada del sistema es: [~ -9 2 n--4 6 -1 3 (3.43) (3.44) Triangularización Al sumar la primera ecuación multiplicada por (-2/4) a la segunda, y la primera ecuación multiplicada por (-1/4) a la tercera, resulta [~ -9 0.5 1.25 2 5 2.5 5]0.5 2.75 (3.45) Obsérvese que en este paso la primera fila se conserva sin cambio. Sumando la segunda fila multiplicada por (-1.25/0.5) a la tercera se obtiene la matriz' [~ -9 0.5 O 2 5 -10 o.~l1.5 (3.46) que en términos de sistemas de ecuaciones quedaría como * Nótese que los vectores columna de A se han ortogonalizado en la triangularización.
  • 179. r- 5 0.5 1.5 (3.47) Matrices y sistemas de ecuaciones lineales 167 se ua- x3 lIa- Un proceso de sustitución regresiva produce el resultado buscado. La tercera ecuación de 3.47 da el valor de x3 = -0.15; de la segunda ecuación se obtiene entonces: 0.5 x2 = 0.5 - 5x3 = 1.25 es bo ea- y por tanto x2 = 2.5 finalmente al sustituir x2 y x3 en la primera ecuación de la forma 3.47 resulta 4xI = 5 + 9 x2 -2x3 = 27.8, de modo que XI = 6.95 Con la sustitución de estos valores en el sistema original se verifica la exactitud de los resultados: Para realizar los cálculos puede usarse el siguiente guión de Matlab: sis- 43) A=[4 -9 2 5; 2 -4 6 3; 1-1 3 4] A(2, :)=A(2,:) - A(l, :)*A(2,1)IA(1,1); A(3, :)=A(3,:) - A(1, :)*A(3,1)IA(1,1); A A(3,:)=A(3,:) - A(2,:)*A(3,2)IA(2,2); x (3) =A(3, 4) lA (3,3) ; x (2)= (A(2, 4) -A(2,3) *x (3)) lA (2,2) ; x (1) =(A(1, 4) -A (1,2: 3) *x (2: 3)) lA (1,1) También puede-ebtenerse la solución directamente con las instrucciones siguientes: 44) ión A= [4 -9 2; 2 -4 6; 1 -1 3] b=[5; 3; 4] x=Ab simu1t([4,-9,2;2,-4,6;1,-1,3], [5; 3; 4]) . *z Como producto secundario de este trabajo, se puede calcular fácilmente el determinante de la matriz A del sistema original. La matriz coeficiente A pasa de la forma original a la matriz triangular superior: .45) [~ (3.48) 46) mediante operaciones que, de acuerdo con las reglas de los determinantes, no alteran el va- lor de lA 1.El determinante de la ecuación 3.48 es sólo el producto de los elementos de la diagonal principal, de modo que el resultado es lA I = 4(0.5)(-10) = -20 * Véase matrices mal condicionadas (Sec. 3.4.). Matrices y sistemas de ecuaciones lineales 167 5 0.5 1.5 (3.47) Un proceso de sustitución regresiva produce el resultado buscado. La tercera ecuación de 3.47 da el valor de x3 = -0.15; de la segunda ecuación se obtiene entonces: 0.5 x2 = 0.5 - 5x3 = 1.25 y por tanto x2 =2.5 finalmente al sustituir x2 y x3 en la primera ecuación de la forma 3.47 resulta 4xI = 5 + 9 x2 -2x3 = 27.8, de modo que XI = 6.95 Con la sustitución de estos valores en el sistema original se verifica la exactitud de los resultados: Para realizar los cálculos puede usarse el siguiente guión de Matlab: A=[4 -9 2 5; 2 -4 6 3; 1 -1 3 4] A(2,:)=A(2,:) - A(1,:)*A(2,1)IA(1,1); A(3, :)=A(3,:) - A(1, :)*A(3,1)IA(1,1); A A(3, :)=A(3,:) - A(2, :)*A(3,2) lA (2,2) ; x (3) =A(3, 4) lA (3,3) ; x (2) = (A (2, 4) -A (2,3)*x (3)) lA (2,2) ; x (1) = (A (1, 4) -A (1,2: 3) *x (2: 3)) lA (1,1) También p~~,de'obtenerse la solución directamente con las instrucciones siguientes: A= [4 -9 2; 2 -4 6; 1 -1 3] b=[5; 3; 4] simu1t([4,-9,2;2,-4,6;1,-1,3], [5; 3; 4]) x=Ab Como producto secundario de este trabajo, se puede calcular fácilmente el determinante de la matriz A del sistema original. La matriz coeficiente A pasa de la forma original a la matriz triangular superior: [~ -9 0.5 O -J] (3.48) mediante operaciones que, de acuerdo con las reglas de los determinantes, no alteran el va- lor de lA 1. El determinante de la ecuación 3.48 es sólo el producto de los elementos de la diagonal principal, de modo que el resultado es lA I= 4(0.5)(-10) =-20 * Véase matrices mal condicionadas (Sec. 3.4.).
  • 180. 168 Métodos numéri cos aplicados a la ingeniería Las ecuaciones para la triangularización, sustitución regresiva y cálculo del determi- nante de un sistema de n ecuaciones en n incógnitas A x = b por el método de eliminación de Gauss son: TRIANGULARIZACIÓN Para 1 ~ i ~ n-1 Para i +1 ~ k ~ n bk = bk - (ak,Jai,i )b¡ Para i +1 ~ j ~ n (3.49) SUSTITUCiÓN REGRESIVA x" = b/an,n Para i = n-1, n-2,... , 1 1 a··1,1 n [b. - L a x.] 1 j=i+l l,) } (3.50) CÁLCULO DEL DETERMINANTE n det A = I1 ai,i = al,l a 2,2 ... an,n i=l (3.51) El algoritmo para resolver Ax = b por eliminación de Gauss queda entonces Para obtener la solución de un sistema de ecuaciones lineales A x = b Yel determinante de A, proporcionar los DATOS: N número de ecuaciones, A matriz coeficiente y b vector de términos independientes. RESULTADOS: El vector solución x y el determinante de A o mensaje de falla "HAY UN CERO EN LA DIAGO- NAL PRINCIPAL". PASO 1. PASO 2. PASO 3. Hacer DET = 1. Hacer I = 1. Mientras 1 ::;N-1, repetir los pasos 4 a 14. PASO 4. Hacer DET = DET * A (I, 1). PASO 5. Si DET = O IMPRIMIR mensaje "HAY UN CERO EN LA DIAGONAL PRINCIPAL" YTERMI- NAR. De otro modo continuar. PASO 6. Hacer K = 1 + 1. PASO 7. Mientras K::; N, repetir los pasos 8 a 13. PASO 8. Hacer J = I + I. PASO 9. Mientras J::; N, repetir los pasos 10 y 11. PASO 10. Hacer A (K, J) =A (K, J) -A (K, 1)* A (1, J) / A (1, 1). PASO 11. Hacer J = J + 1. PASO 12. Hacer b ( K ) = b (K) -A (K, 1) * b ( I ) / A ( 1, I ). 168 Métodos numéricos aplicados a la ingeniería Las ecuaciones para la triangularización, sustitución regresiva y cálculo del determi- nante de un sistema de n ecuaciones en n incógnitas A x =b por el método de eliminación de Gauss son: T RIANGULARIZACIÓN Para 1 :s; i:S; n- 1 Para i +1 :s; k :s; n bk = bk - (ak,; la;,i )b¡ Para i +1 :s; j :s; n SUSTITUCiÓN REGRESIVA x" = b/an,n Para i =n-1, n-2,... , 1 1 a ··1, 1 CÁLCULO DEL DETERMINANTE n n [b. - La. x.] 1 j=i+l I,j j det A = n ai,i = al,l a 2,2 ... an,n i=l El algoritmo para resolver Ax =b por eliminación de Gauss queda entonces (3.49) (3.50) (3.51) Para obtener la solución de un sistema de ecuaciones lineales A x =b Yel determinante de A, proporcionar los DATOS: N número de ecuaciones, A matriz coeficiente y b vector de términos independientes. RESULTADOS: El vector solución x y el determinante de A o mensaje de falla "HAY UN CERO EN LA DIAGO- NAL PRINCIPAL". PASO 1. PASO 2. PASO 3. Hacer DET = 1. Hacer 1 = 1. Mientras 1 ::; N-1, repetir los pasos 4 a 14. PASO 4. Hacer DET = DET * A (1, 1). PASO 5. Si DET = O IMPRIMIR mensaje "HAY UN CERO EN LA DIAGONAL PRINCIPAL" YTERMI- NAR. De otro modo continuar. PASO 6. Hacer K = 1+ 1. PASO 7. Mientras K::; N, repetir los pasos 8 a 13. PASO 8. Hacer J = 1+ I. PASO 9. Mientras J::; N, repetir los pasos 10 y 11. PASO 10. Hacer A (K, J) =A (K, J) -A (K, 1)* A (1, J) / A (1, 1) . PASO 11. Hacer J = J + 1. PASO 12. Hacer b ( K ) = b (K) - A (K, 1) * b (1 ) / A (1, 1 ).
  • 181. Matrices y sistemas de ecuaCiO¡-leS lineales 169 PASO 13. Hacer K = K + l. PASO 14. Hacer 1 = 1 + 1. PASO 15. Hacer DET = DET * A (N":'N). PASO 16. Si DET = O IMPRIMIR mensaje "HAY UN CERO EN LA DIAGONAL PRINCIPAL" Y TERMINAR. De otro modo continuar. PASO 17. Hacer x (N) = b (N) I A (N, N). PASO 18. Hacer 1 = N -1. PASO 19. Mientras 1 ~ 1, repetir los pasos 20 a 26. PASO 20. Hacer x ( 1) = b ( 1 ). PASO 21. Hacer J = 1 + 1. PASO 22. Mientras J ::;N, repetir los pasos 23 y 24. PASO 23. Hacerx ( 1 ) = x (I ) - A (1, J ) * x ( J ). PASO 24. Hacer J = J + l. PASO 25. Hacer x ( 1 ) = x ( 1) I A (1 , 1 ) . PASO 26. Hacer 1 = 1 - l. PASO 27. IMPRIMIR x y DET Y TERMINAR. ELIMINACiÓN DE GAUSS CON PIVOTEO En la eliminación de xl de la segunda y tercera ecuaciones de la forma 3.40 se tomó como base la primera, por lo cual se denomina ecuación pivote o, en términos de la notación ma- tricial, fila pivote. Para eliminar x2 de la tercera ecuación de la forma 3.41, la fila pivote utilizada fue la segunda. El coeficiente de la incógnita que se va a eliminar en la fila pivo- te se llama pivote. En la eliminación que dio como resultado el sistema de ecuaciones 3.42, los pivotes fueron al,l Y a'2,2' Esta elección natural de los pivotes al,,, a' 2,2' d'3,3> etc., es muy conveniente tanto para trabajar con una calculadora como con una computa- dora; desafortunadamente falla cuando alguno de esos elementos es cero, puesto que los multiplicadores quedarían indeterminados [por ejemplo si al,l fuera cero, el multiplicador ( -a2,1 / al,l) no está definido]. Una manera de evitar esta posibilidad es seleccionar como pivote el coeficiente de máximo valor absoluto en la columna relevante de la matriz redu- cida. Como antes, se tomarán las columnas en orden natural de modo que se vayan elimi- nando las incógnitas también en orden natural x" x2' x3, etc. Esta técnica, llamada pivoteo parcial, se ilustra con la solución del siguiente sistema. Ejemplo 3.29 Resuelva el sistema 10 Xl + x2 - 5x3 1 -20 Xl + 3X2 + 20x3 2 5 Xl + 3x2 + 5x3 6. Solución La matriz aumentada es: [ 10 1 -5 ~]-2~ 3 20 3 5 (3.52) (3.53) El primer pivote debe ser (-20), ya que es el elemento de máximo valor absoluto en la pri- mera columna. Se elimina entonces Xl de la primera y tercera filas de la ecuación 3.52. Pa- ra ello, se suma a la primera fila la segunda multiplicada por (-10 / (-20)), Y a la tercera fila la segunda multiplicada por (-5 / (-20)). Con esto se obtiene la matriz reducida:
  • 182. 170 , , Métodos numéricos aplicados a la ingeniería H 6~] 5 20 10 2.5 3 3.75 (3.54) El siguiente pivote debe seleccionarse entre la primera y tercera filas (segunda columna) y en este caso es (3.75). Sumando a la primera fila la tercera multiplicada por (-2.5 / 3.75), resulta -2.33;] 6.5 o 3 3.75 -l.666 20 10 (3.55) que puesta en forma de sistema de ecuaciones queda: - l.666x3 -20x¡ + 3x2 + 20x3 3.75x2 + lOx3 -2.333 2 6.5 (3.56) De la primera ecuación de 3.56 -2.333 x3 = --- = 1.4 , -l.666 de la tercera ecuación 6.5 - 1O(l.4) x2 = 3.75 = -2, y finalmente de la segunda ecuación 2 - 3(-2) - 20(1.4) = 1 . x¡= -20 Para realizar los cálculos puede usarse el siguiente guión de Matlab: A=[10 1 -5 1; -20 3 20 2; 5 3 5 6J copia=A (2,:); A (2, :)=A(1,:); A (1,:) =copia; A (2, :) =A(2, :) - A(l,: )*A (2,1) lA (1,1) ; A (3, :)=A(3,:) - A(l, :)*A(3,l)IA(l,l); A A(3, :)=A(3,:) - A(2, :)*A (3,2) lA (2,2) ; A x (3) =A(3,4) lA (3,3) ; x (2) = (A(2,4) -A(2,3) *x (3)) IA(2,2) ; x (1) =(A (1,4) -A (1,2: 3) *x (2: 3)) lA (1,1) x Otra alternativa para solucionar el sistema de ecuaciones 3.52 es utilizar el mismo crite- rio de selección de los pivotes, pero llevando las filas pivote a las posiciones de modo que se obtenga la forma triangular en la eliminación. Para esto es necesario, por ejemplo, en la 170 Métodos numéricos aplicado s a la ingeniería H 2.5 3 3.75 5 20 10 6~] (3.54) El siguiente pivote debe seleccionarse entre la primera y tercera filas (segunda columna) yen este caso es (3.75). Sumando a la primera fila la tercera multiplicada por (-2.5 / 3.75), resulta o -l.666 3 20 3.75 10 -2.33~] 6.5 que puesta en forma de sistema de ecuaciones queda: - l.666x3 -20xl + 3x2 + 20x3 3.75x2 + lOx3 De la primera ecuación de 3.56 -2.333 -2.333 2 6.5 x3 =--- = 1.4 , -l.666 de la tercera ecuación 6.5 - 1O(l.4) x2 = 3.75 = -2 , y finalmente de la segunda ecuación 2 - 3(-2) - 20(1.4) XI = =1. -20 Para realizar los cálculos puede usarse el siguiente guión de Matlab: A=[10 1 -5 1; - 20 3 20 2; 5 3 5 6J copia=A (2, :); A (2, : ) =A (1, :); A (1, :) =copia; A (2, : )=A (2,:) - A(l,: )*A(2, 1) lA (1,1) ; A(3, :)=A(3,:) - A(1, :)*A(3,1)IA(1,1); A A(3, :)=A(3,:) - A(2, :)*A (3,2) lA (2,2) ; A x (3) =A (3, 4) lA (3,3) ; x (2) = (A (2, 4) - A(2, 3) *x (3)) lA (2,2) ; x (1) =(A (1,4) -A (1 , 2: 3)*x(2: 3)) lA (1,1) x (3.55) (3.56) Otra alternativa para solucionar el sistema de ecuaciones 3.52 es utilizar el mismo crite- rio de selección de los pivotes, pero llevando las filas pivote a las posiciones de modo que se obtenga la forma triangular en la eliminación. Para esto es necesario, por ejemplo, en la
  • 183. Matrices y sistemas de ecuaciones lineales 171 ecuación 3.52, intercambiar la segunda fila (donde se encuentra el elemento de máximo va- lor absoluto) con la primera, con lo que se obtiene: [ -20 10 5 3 20 1 -5 3 5 (3.53') que se reduce en la primera eliminación a 3 20 2.5 5 3.75 10 (3.54') Como el siguiente pivote es (3.75), se intercambian la segunda y la tercera filas de la ecua- ción 3.54', para obtener: 3 20 3.75 10 2.5 5 (3.54") la cual se reduce al eliminar x2 a 2 J6.5 -2.333 3 3.75 O 20 10 -1.666 (3.55') que tiene ya la forma triangular y está lista para la sustitución regresiva. En adelante, cualquier referencia a la eliminación con pivoteo que se haga, entraña la segunda al- ternativa. La sustitución regresiva proporciona los siguientes valores x3 = 1.4, x2 = -2, XI = 1 El determinante de A se calcula de nuevo, multiplicando entre sí los elementos de la dia- gonal principal de la matriz triangularizada (Ec. 3.55'), pero dicho producto es afectado por un cambio de signo por cada intercambio de filas que se verifique en la triangulariza- ción. En el caso en estudio det A = (-1)2 (-20) (3.75) (-1.666) = 125 ya que hubo dos intercambios de fila para llegar a la ecuación 3.55'. A fin de elaborar el algoritmo de este método, se utilizarán las ecuaciones 3.49 para la triangularización después de cada búsqueda del elemento de máximo valor absoluto y del intercambio de filas correspondiente. Una vez realizada la triangularización, se hará la sustitución regresiva con las ecuaciones 3.50 y el cálculo del determinante de la siguiente forma "detA = (-1)' Il a i==l l,l (3.57) donde r es el número de intercambios de filas que hubo en el proceso de triangularización. Matrices y s istemas de ecuaciones lineale s 171 ecuación 3.52, intercambiar la segunda fila (donde se encuentra el elemento de máximo va- lor absoluto) con la primera, con lo que se obtiene: [ - 20 10 5 3 20 1 -5 3 5 que se reduce en la primera eliminación a 3 20 2.5 5 3.75 10 (3.53') (3.54') Como el siguiente pivote es (3.75), se intercambian la segunda y la tercera filas de la ecua- ción 3.54', para obtener: [-2~ 3 20 H3.75 10 (3.54") 2.5 5 la cual se reduce al eliminar x2 a [-2~ 3 20 2 ]3.75 10 6.5 (3.55') O - 1.666 -2.333 que tiene ya la forma triangular y está lista para la sustitución regresiva. En adelante, cualquier referencia a la eliminación con pivoteo que se haga, entraña la segunda al- ternativa. La sustitución regresiva proporciona los siguientes valores x 3 = 1.4, x 2 = - 2, xI = 1 El determinante de A se calcula de nuevo, multiplicando entre sí los elementos de la dia- gonal principal de la matriz triangularizada (Ec. 3.55'), pero dicho producto es afectado por un cambio de signo por cada intercambio de filas que se verifique en la triangulariza- ción. En el caso en estudio det A = (-1)2 (- 20) (3.75) (- 1.666) = 125 ya que hubo dos intercambios de fila para llegar a la ecuación 3.55'. A fin de elaborar el algoritmo de este método, se utilizarán las ecuaciones 3.49 para la triangularización después de cada búsqueda del elemento de máximo valor absoluto y del intercambio de filas correspondiente. Una vez realizada la triangularización, se hará la sustitución regresiva con las ecuaciones 3.50 y el cálculo del determinante de la siguiente forma "detA =(- 1)' rr a i=l l,t (3.57) donde r es el número de intercambios de filas que hubo en el proceso de triangularización.
  • 184. 172 Métodos numéricos aplicados a la ingeniería ALGORITMO 3.4 Eliminacion de Gauss con pivoteo Para obtener la solución de un sistema de ecuaciones lineales A x = b Y el determinante de A, proporcionar los DATOS: N número de ecuaciones, A matriz coeficiente y b vector de términos independientes. RESULTADOS: El vector ~Qlución x Y el determinante de A o mensaje "MATRIZ SINGULAR, SISTEMA SIN SO- LUCION". PASO l. PASO 2. PASO 3. PASO 4. PASO 13. PASO 14. PASO 15. Hacer DET = l. Hacer R = O. Hacer I = l. Mientras I S;N - 1 repetir los pasos 5 a 12. PASO 5. Encontrar PIVOTE (elemento de mayor valor absoluto en la parte relevante de la columna 1 de A) y P la fila donde se encuentra PIVOTE. PASO 6. Si PIVOTE = O IMPRIMIR "MATRIZ SINGULAR SISTEMA SIN SOLUCION" y TERMINAR. En caso contrario continuar. PASO 7. Si P = I ir al paso 10. De otro modo realizar los pasos 8 y 9. PASO 8. Intercambiar la fila I con la fila P. PASO 9. Hacer R = R + l. PASO 10. Hacer DET = DET * A ( I, I ). PASO 11. Realizar los pasos 6 a 13 del algoritmo 3.3. PASO 12. Hacer! = 1 + l. Hacer DET = DET * A (N, N) * (-1 )**r Realizar los pasos 17 a 26 del algoritmo 3.3 IMPRIMTR x y DET YTERMINAR. Para terminar el tema, se compararán las técnicas de eliminación de Gauss con pivoteo y sin éste. Por brevedad, la primera se denominará GP y la' segunda G. 1. La búsqueda del coeficiente de mayor valor absoluto que se usará como pivote y el intercambio de filas significa mayor programación en GP. 2. Los factores (ak,¡ / a¡) de las ecuaciones 3.49 siempre serán menores que la unidad en valor absoluto en GP, con esto los elementos de A I b se conservan dentro de cierto intervalo, circunstancia valiosa en los cálculos computacionales. 3. Encontrar en GP un pivote igual a cero singnificaría que se trata de una matriz coe- ficiente A singular (det A = O) y que el sistema A x = b no tiene solución única. Encontrar en G un pivote igual a cero, no proporciona información alguna acerca del determinante de A y si detendría el proceso de triangularización. A pesar de la programación adicional y el mayor tiempo de máquina que se emplea en el método de Gauss con pivoteo, sus otras ventajas borran totalmente estas desventajas en la práctica; por tanto, el pivoteo natural se emplea sólo en circunstancias especiales, por ejemplo cuando se sabe por adelantado que no hay pivotes más grandes que los que van resultando en la diagonal principal. ELIMINACIÓN DE JORDAN Es posible extender los métodos vistos de modo que las ecuaciones se reduzcan a una for- ma en que la matriz coeficiente del sistema sea diagonal y ya no se requiera la sustitución regresiva. Los pivotes se eligen como en el método de Gauss con pivoteo, y una vez inter- cambiadas las filas se eliminan los elementos arriba y debajo del pivote. El sistema del ejemplo 3.28 ilustra este método. 172 Métodos numéricos aplicados a la ingeniería ALGORITMO 3.4 EliminaciÓn de Gauss con pivoteo Para obtener la solución de un sistema de ecuaciones lineales A x =b Yel determinante de A, proporcionar los DATOS: N númew de ecuaciones, A matriz coeficiente y b vector de términos independientes. RESULTADOS: El vector ilillución x y el determinante de A o mensaje "MATRIZ SINGULAR, SISTEMA SIN SO- LUCION". PASO 1. Hacer DET = 1. PASO 2. Hacer R = O. PASO 3. Hacer 1 = 1. PASO 4. Mientras I S; N - 1 repetir los pasos 5 a 12. PASO 5. Encontrar PIVOTE (elemento de mayor valor absoluto en la parte relevante de la columna I de A) y P la fila donde se encuentra PIVOTE. PASO 6. Si PIVOTE = OIMPRIMIR "MATRIZ SINGULAR SISTEMA SIN SOLUCION" y TERMINAR. En caso contrario continuar. PASO 7. Si P = I ir al paso 10. De otro modo realizar los pasos 8 y 9. PASO 8. Intercambiar la fila I con la fila P. PASO 9. Hacer R = R + 1. PASO 10. Hacer DET = DET *A ( 1, I ). PASO 11. Realizar los pasos 6 a 13 del algoritmo 3.3. PASO 12. Hacer! = I + 1. PASO 13. Hacer DET = DET * A (N, N) * (-1 )**r PASO 14. Realizar los pasos 17 a 26 del algoritmo 3.3 PASO 15. IMPRIMTR x y DET YTERMINAR. Para terminar el tema, se compararán las técnicas de eliminación de Gauss con pivoteo y sin éste. Por brevedad, la primera se denominará GP y la'segunda G. 1. La búsqueda del coeficiente de mayor valor absoluto que se usará como pivote y el intercambio de filas significa mayor programación en GP. 2. Los factores (ak,¡ / a¡) de las ecuaciones 3.49 siempre serán menores que la unidad en valor absoluto en GP, con esto los elementos de A Ib se conservan dentro de cierto intervalo, circunstancia valiosa en los cálculos computacionales. 3. Encontrar en GP un pivote igual a cero singnificaría que se trata de una matriz coe- ficiente A singular (det A =O) y que el sistema A x =b no tiene solución única. Encontrar en G un pivote igual a cero, no proporciona información alguna acerca del determinante de A y si detendría el proceso de triangularización. A pesar de la programación adicional y el mayor tiempo de máquina que se emplea en el método de Gauss con pivoteo, sus otras ventajas borran totalmente estas desventajas en la práctica; por tanto, el pivoteo natural se emplea sólo en circunstancias especiales, por ejemplo cuando se sabe por adelantado que no hay pivotes más grandes que los que van resultando en la diagonal principal. ELIMINACIÓN DE JORDAN Es posible extender los métodos vistos de modo que las ecuaciones se reduzcan a una for- ma en que la matriz coeficiente del sistema sea diagonal y ya no se requiera la sustitución regresiva. Los pivotes se eligen como en el método de Gauss con pivoteo, y una vez inter- cambiadas las filas se eliminan los elementos arriba y debajo del pivote. El sistema del ejemplo 3.28 ilustra este método.
  • 185. Solución Matrices y sistemas de ecuaciones lineales 173 Ejemplo 3.30 Por eliminación de Jordan, resuelva el sistema 4x¡ - 9x2 + 2x3 5 2x[ - 4x2 + 6x3 3 XI - x2 + 3x3 4 La matriz aumentada del sistema es [~ -9 2 n-4 6 -1 3 so- deA) Como en la primera columna el elemento de máximo valor absoluto se encuentra en la pri- mera fila, ningún intercambio es necesario y el primer paso de eliminación produce .En [~ 2 5 2_5 5 ]0_5 2.75 -9 0.5 l.25 El elemento de máximo valor absoluto en la parte relevante de la segunda columna (filas 2 y 3) es l.25; por tanto, la fila 3 debe intercambiarse con la 2. Sumando la segunda fila multiplicada por (-(-9) / l.25), a la primera fila y la segunda mul- tiplicada por ( -0.5 / 1.25) a la tercera se obtiene el nuevo arreglo [~ ;.75l 0.5 'j -9 l.25 0.5 2 2.5 5 [~ o 20 l.25 2.5 O 4 24.8 J2.75 -0.6 donde se han eliminado los elementos de arriba y abajo del pivote (nótese que en este pa- so el primer pivote no se modifica porque sólo hay ceros debajo de él). Por último, sumando la tercera multiplicada por (-20/4) a la primera fila ya la terce- ra multiplicada por (-2.5/4) a la segunda [~ 27.8 ] 3.125 -0.6 O l.25 O O O 4 que escrita de nuevo como sistema de ecuaciones da 4xI = 27.8 l.25 x2 = 3.125 4 x3 = -0.6 de donde el resultado final se obtiene fácilmente 27.8 x¡ = -- = 6.95 , 4 3.125 x2=--=2.5, 1.25 -0.6 x3 = -- =-0.15 4
  • 186. -~----------------------_._----~---- 174 Métodos numéricos aplicados a la ingeniería El determinante también puede calcularse lA I = (-1)¡ (4) (1.25) (4) = -20, donde la potencia 1 indica que sólo hubo un intercambio de filas. Para realizar los cálculos puede usarse el siguiente guión de Matlab: A=[4 -9 2 5; 2 -4 6 3; 1 -1 3 4] % No es necesario intercambiar filas for i=2:3 A(i, :)=A(i,:) - A(l, :)*A(i,l)/A(1,l); end A % Se intercambia la fila 2 con la fila 3 copia=A(3,:) ;A(3, :)=A(2,:) ;A(2, :)=copia; for i=1:3 if i -=2 A(i, :)=A(i,:) - A(2, :)*A(i,2)/A(2,2); end end A for i=1:2 A(i, :)=A(i, :)-A(3, :)*A(i,3)/A(3,3); end A for i=1:3 x(i)=A(i,4)/A(i,i) ; end x También puede obtenerse el determinante directamente con las instrucciones siguientes: A=[4 -9 2; 2 -4 6; 1 -1 3] det (A) I det([4,-9,2;2,-4,6;1,-1,3]) Si sólo se requiere calcular lA IYno la solución del sistema, el método de Jordan requie- re mayor trabajo que el método de eliminación de Gauss con pivoteo. CÁLCULO DE INVERSAS Si se tienen varios sistemas por resolver que comparten la misma matriz coeficiente; es decir, A x¡ = b¡, A x2 = b2, etc. pueden resolverse todos a un tiempo si se aplica al arreglo [ A I b¡ I b2 ... ] el proceso de eliminación, como antes y después, se realiza una sustitución regresiva par- ticular para cada columna del lado derecho de A. Como caso particular es factible encon- 174 Métodos numéricos aplicados a la ingeniería El determinante también puede calcularse l A I = (-1)¡ (4) (1.25) (4) = -20, donde la potencia 1 indica que sólo hubo un intercambio de filas. Para realizar los cálculos puede usarse el siguiente guión de Matlab: A=[4 -9 2 5; 2 -4 6 3; 1 -1 3 4] % No es necesario intercambiar filas for i=2:3 A(i, :)=A(i,:) - A(l, :)*A(i,1)/A(1,1); end A % Se intercambia la fila 2 con la fila 3 copia=A(3,:) ;A(3, :)=A(2,:) ;A(2, :)=copia; for i=l:3 if i -=2 A(i, :)=A(i,:) - A(2, :)*A(i,2)/A(2,2); end end A for i=1:2 A(i, :)=A(i, :)-A(3, :)*A(i,3)/A(3,3); end A for i=1:3 x (i)=A(i,4)/A(i,i) ; end x También puede obtenerse el determinante directamente con las instrucciones siguientes: A=[4 - 9 2; 2 - 4 6; 1 -1 3] det (A) I det([4,-9,2;2,-4,6;l, -1, 3]) Si sólo se requiere calcular lA IYno la solución del sistema, el método de Jordan requie- re mayor trabajo que el método de eliminación de Gauss con pivoteo. CÁLCULO DE INVERSAS Si se tienen varios sistemas por resolver que comparten la misma matriz coeficiente; es decir, A x¡ = b¡, A x2 = b2, etc. pueden resolverse todos a un tiempo si se aplica al arreglo [ A I b¡ I b2 . .. ] el proceso de eliminación, como antes y después, se realiza una sustitución regresiva par- ticular para cada columna del lado derecho de A. Como caso particular es factible encon-
  • 187. Matrices y sistemas de ecuaciones lineales 175 trar A-l si b¡ = el' b2 = e2,... , bn = e,/ Las n soluciones obtenidas forman las n columnas de la matriz inversa A-l. CÁLCULO DE LA INVERSA CON EL MÉTODO DE GAUSS CON PIVOTEO Como ejemplo se usará la matriz coeficiente del sistema (3.44) para obtener su inversa. Primero se forma el arreglo [~ -9 -4 -1 2 6 3 o 1 O 1 O O (3.58) nótese que a la derecha de A se tiene la matriz identidad correspondiente. Eliminando los elementos debajo del primer pivote (4), se llega al sistema [~ -9 2 1 O ~l0.5 5 -0.5 1 (3.59) 1.25 2.5 -0.25 O Se intercambian la segunda y tercera filas. [4 -92 1 O !]O 1.25 2.5 -0.25 O (3.60) O 0.5 5 -0.5 1 Ahora se elimina el segundo elemento de la tercera fila y el arreglo cambia a Con la sustitución regresiva para el primer vector al lado derecho de la matriz triangular resulta: 4x3 = - 0.4, de donde x3 = - 0.1; al sustituir x3 en la fila 2 se tiene uie- 1.25x2 = -0.25 - 2.5 (-0.1) Y x2 = O; Y reemplazando x3 y x2 en la fila 1, se obtiene 4xl = 1 + 9(0) - 2(-0.1) = 1.2 Y Xl = 0.3 Este primer vector solución representa la primera columna de A-[. Del mismo modo se cal- culan la segunda y la tercera columnas de A-[ con el segundo y tercer vectores del lado de- recho de la matriz triangular ir, [ 0.3 kl= O -0.1 -1.25 -0.5 0.25 2.3]1.0 -0.1 * En este caso el> ez, etc., son vectores de n elementos cuyo único elemento distinto de cero es el de la fila 1, 2, etc., y su valor es 1.
  • 188. 176 Métodos numéricos aplicados a la ingeniería CÁLCULO DE LA INVERSA CON EL MÉTODO DE JORDAN Se parte del mismo arreglo (Ec. 3.58) y también se eliminan los elementos debajo del pri- mer pivote para llegar a la ecuación 3.59. Se intercambian la segunda y tercera filas y se llega al sistema de ecuaciones 3.60. En este último arreglo se eliminan los elementos arri- ba y debajo del pivote (1.25) para llegar a: u O 20 -0.8 O ;2]1.25 2.5 -0.25 O O 4 -0.4 1 -0.4 arreglo que todavía se reduce a: U O O 1.2 -5 92]1.25 O O -0.625 1.25 , O 4 -0.4 1 -0.4 Y que con la primera columna a la derecha de la matriz diagonal produce 1.2 XI =-=0.3, 4 O x2=--=0, 1.25 -0.4 x3 = -- =-0.1, 4 con la segunda columna -5 XI = - = -1.25, 4 -0.625 x2 = --- = -0.5 , 1.25 X3 = 0.25 De igual manera con la tercera columna para llegar a [ 0.3 A-l= O -0.1 -1.25 -0.5 0.25 2.3]1.0 -0.1 Los métodos de eliminación vistos proporcionan la solución del sistema A x = b, el det A yA -1, siempre que A sea no singular. Obsérvese por otro lado que si se tiene un conjunto de vectores xi' x2, ... , xn de n com- ponentes cada uno y se quieren ortogonalizar, se aplica alguna de las eliminaciones vistas al conjunto dado tomado como una matriz. La técnica de Gauss con pivoteo también pue- de aplicarse -por ejemplo- para determinar si dicho conjunto es linealmente indepen- diente o no (cuando un elemento pivote ai,i es igual a cero, la fila correspondiente es linealmente dependiente de las filas anteriores). La sección que sigue puede omitirse sin pérdida de continuidad en los siguientes temas. CUENTA DE OPERACIONES Para establecer la velocidad de cálculo y el "trabajo computacional", se requiere conocer cuántos cálculos de los diferentes tipos se realizan. Considérese para ello la reducción del sistema general al,lxl + al,2x2 + + al,nxn bl a2,lx) + a2,2x2 + + a2,ll xll b2 (3.61) an,¡x¡ + an,2x2 + ... + an,nxn b"
  • 189. ••• zm"s=Cz'=;- Matrices y sistemas de ecuaciones lineales 177 a la forma triangular t¡,¡X¡ + t¡,zX2 + t2,zX2 + + t¡,,,xll = c¡ + t2,1(X" = c2 (3.62) o en notación matricial más compacta de [A lb] a [ TI e] , matrices ambas de n X (n + 1). Sea M,; = número de multiplicaciones o divisiones Sil = número de sumas y restas necesarias para ir del sistema 3.61 al 3.62. Evidentemente M¡ = O Y S¡ = O, ya que cualquier matriz A de 1 X 1 es triangular, Si n > 1, se considera la eliminación en la primera columna. Si la primera columna de A es distinta del vector cero, generalmente se intercambian filas a fm de llevar el elemento de máximo valor absoluto de la primera columna a la posición (1, 1). Denomínese de nuevo [A lb] el sistema resultante de este intercambio. Ahora debe restarse un múltiplo de la nueva primera fila: de cada fila: 2 -::;i -::;n (3.63) para producir filas de la forma: (3.64) Explícitamente, si ri = ai,¡ / al,!' al i,j = ai,j - r¡ a¡J b'¡ = b¡ - r,», (3.65) Se efectúa una división para producir r¡. La fórmula 3.65 requiere n multiplicaciones y un número igual de restas. Como se forman (n-1) filas, la eliminación en la primera colum- na se logra con: (n + 1) (n - 1) divisiones o multiplicaciones y n (n - 1) restas. La primera columna ya tiene ceros debajo de la posición (1, 1). Queda por reducir la ma- triz de (n -1) X n, matriz debajo de la primera fila ya la derecha de la primera columna. De la fórmula 3.66, se obtienen las fórmulas (3.66) Mil = (n + 1) (n -1) + MII _ I Sn = n (n -1) + Sn_1 Como MI = SI = D, se tiene para n ~ 2 Mil = (2 + 1) 1 + (3 + 1) 2 + ... + (n + 1) (n -1) Sil = 2(1) + 3(2) + ... + n (n -1) . (3.67) (3.68) Matrices y sistemas de ecuaciones lineales 177 a la forma triangular t¡,¡XI + t¡,:02 + t2,:02 + + tl,,(tn = CI + t2,1.x" = C2 (3.62) o en notación matricial más compacta de [A l b] a [ TI e] , matrices ambas de n X (n + 1). Sea M,; = número de multiplicaciones o divisiones Sn = número de sumas y restas necesarias para ir del sistema 3.61 al 3.62. Evidentemente MI = OYS¡ = O, ya que cualquier matriz A de 1 X 1 es triangular. Si n > 1, se considera la eliminación en la primera columna. Si la primera columna de A es distinta del vector cero, generalmente se intercambian filas a fm de llevar el elemento de máximo valor absoluto de la primera columna a la posición (1 , 1). Denomínese de nuevo [A lb] el sistema resultante de este intercambio. Ahora debe restarse un múltiplo de la nueva primera fila: de cada fila: para producir filas de la forma: Explícitamente, si ri = ai,¡ / al,!' al i,j = ai,j - r¡ a¡J b l ¡ = b¡ - r¡b¡ 2 -::; i -::; n (3.63) (3.64) (3.65) Se efectúa una división para producir r¡. La fórmula 3.65 requiere n multiplicaciones y un número igual de restas. Como se forman (n- l) filas, la eliminación en la primera colum- na se logra con: (n + 1) (n - 1) divisiones o multiplicaciones y n (n - 1) restas. (3.66) La primera columna ya tiene ceros debajo de la posición (1, 1). Queda por reducir la ma- triz de (n -1) X n, matriz debajo de la primera fila ya la derecha de la primera columna. De la fórmula 3.66, se obtienen las fórmulas M" = (n + 1) (n - 1) + Mn_¡ Sn = n (n - 1) + Sn_1 Como MI =SI =D, se tiene para n ~ 2 M n = (2 + 1) 1 + (3 + 1) 2 + ... + (n + 1) (n - 1) Sil = 2(1) + 3(2) + ... + n (n -1) (3.67) (3.68)
  • 190. >' 178 Métodos n uméricos aplicados a la ingeniería Fácilmente se verifica por inducción que: n-I 1 L t=-(n-1)n; 1=1 2 n 1 L t2 = -6 (n -1) n (2n -1) ; 1=1 Por tanto, como n-I M" = L (t + 1+ 1)t 1=1 y n-I Sil = L (t + 1) t 1=1 Entonces: Mn = ~ (n - 1)n (2n - 1) + (n - l)n 1 1 Sn = () (n - l)n (2n - 1) + 2(n-l)n (3.69) Se determinará el número mn de multiplicaciones o divisiones y el número sn de sumas o restas requeridas para resolver el sistema triangular [T Ix] = c. Sean n ~ 2 Y todas las ti,i "* O. Supóngase que se han calculado xI!' x,,_p"" x2; llámense mn_1 y S,,_Ilas operaciones realizadas para ello. Sea ahora . cl-tI2x2- ... -tln~n XI =' , (3.70) t1,1 El cálculo de xI requiere (n-l) multiplicaciones, una división y (n-l) restas. Entonces, pa- ra n ~ 2 Como mI m" = (n - 1 + 1) + m,,_1 s" = (n - 1) + S,,_I 1 y SI = O, se tiene (3.71) sn = 1 + 2 + 3 + ... + n = ~ n (n + 1) 1 + (n - 1) = 2 (n - 1) n (3.72) mn=I+2+3+ ... El resultado final se resume a continuación. El sistema 3.61 con matriz coeficiente A y determinante distinto de cero, puede resol- verse por el método de eliminación con pivoteo con un= M"+m,, =~ (n-l)n(2n-1) + (n-1)n + ~n (n+l) tn3 + n2 - ~ n multiplicaciones o divisiones y 1 1 1 Sil + Sil =()(n-l)n(2n-l) + 2(n-l) n +2(n-l)n (3.73) v = " tn3 + ~ n2 - ~ n sumas o restas. Obviamente, el "trabajo computacional" para resolver la ecuación 3.61 es función del nú- mero de operaciones necesarias (Ec. 3.73); por tanto, puede decirse que es proporcional a n3 . Por otro lado, las necesidades de memoria de máquina serán proporcionales a n2. 178 Métodos numéricos aplicados a la ingeniería Fácilmente se verifica por inducción que: ,,-1 1 I. t = -en - 1) n; t=1 2 " 1t~1 t2 = 7) (n -1) n (2n - 1) ; Por tanto, como ,,- 1 M = I. (t + 1 + l )t " t= 1 y ,,- 1 S = I. (t + 1) t " t= 1 Entonces: Mil = ~ (n - l)n (2n - 1) + (n - l)n (3.69) 1 1Sn = 7) (n - l)n (2n - 1) + 2 (n-l)n Se determinará el número mn de multiplicaciones o divisiones y el número sn de sumas o restas requeridas para resolver el sistema triangular [T I x ] =c. Sean n ;:: 2 Y todas las tu 1= O. Supóngase que se han calculado x"' X,,_l" ' " x2; llámense mn_l Y S,,_l las operaciones realizadas para ello. Sea ahora . c l -tI2 x2 - ... -tI";;:,, XI = ' , tl ,l (3.70) El cálculo de Xl requiere (n-l) multiplicaciones, una divisió!l y (n-l) restas. Entonces, pa- ra n;:: 2 Como mi m" = (n - 1 + 1) + m,,_1 s" = (n - 1) + S,,_I 1 y SI = O, se tiene mn = 1 + 2 + 3 + ... Sil = 1 + 2 + 3 + ... + n = ~ n (n + 1) 1 + (n - 1) = 2 (n - 1) n El resultado final se resume a continuación. (3.71) (3.72) El sistema 3.61 con matriz coeficiente A y determinante distinto de cero, puede resol- verse por el método de eliminación con pivoteo con u,, = M"+m,, =~ (n -l )n(2n -l ) + (n-l)n + ~n (n +l ) ~ n3 + n2 - ~ n multiplicaciones o divisiones y v = " 1 1 1 S" + s" =7) (n-l)n(2n-l) + 2 (n-l) n + 2 (n- l) n t n3 + ~ n2 - ~ n sumas o restas. (3.73) Obviamente, el "trabajo computacional" para resolver la ecuación 3.61 es función del nú- mero de operaciones necesarias (Ec. 3.73); por tanto, puede decirse que es proporcional a n3 . Por otro lado, las necesidades de memoria de máquina serán proporcionales a n2.
  • 191. .69) o t·1.1 nes .70) pa- .71) .72) sol- . .73) nú- ala Matrices y sistemas de ecuaciones lineales 179 SISTEMAS ESPECIALES Con frecuencia, la matriz coeficiente del sistema A x = b por resolver es simétrica, o bien gran número de sus componentes son cero (matrices dispersas). En estos casos algunos de los métodos conocidos pueden adaptarse, con lo cual se reduce el trabajo computacional y la memoria de máquina. Primero se tratará el caso de las matrices bandeadas (matrices dis- persas particulares); las matrices simétricas serán abordadas como un caso particular de los métodos L-U. Primero se darán algunos ejemplos particulares de matrices bandeadas 2 O O O O 4 O O O O 8 7 6 O O O 1 O O O 7 8 1 O O 9 3 O -2 O O O 5 O O O O 5 2 O 3 -1 8 9 10 O O O 7 O O O 1 3 5 O O 3 5 8 O O O O 6 O O O 3 4 O O 7 4 O Diagonal Tridiagonal Pentadiagonal Generalizando: Una matriz A de n X n es tridiagonal si a¡,j = O siempre que I i - j I > 1 , pentadiagonal si a., = O siempre que I i - j I > 2 , etcétera.I,} El ancho de banda es 1, 3, 5, etc., en las matrices diagonales, tridiagonales, pentadiago- nales, etc., respectivamente. Enseguida se adapta la eliminación de Gauss para la solución del sistema tridiago- nal A x = b; es decir, A es tridiagonal. MÉTODO DE THOMAS Sea el sistema tridiagonal de tres ecuaciones en tres incógnitas », Xl + Cl X2 a2 Xl + b2 X2 + C2 X3 a3 X2 + b3 X3 TRIANGULARIZACIÓN Si b¡ :t= O, se elimina xI sólo en la segunda ecuación, con lo que se obtiene como nueva se- gunda ecuación: b'2X2 + c'2x3 = d'2 con Si b' 2 :t= O,X 2 se elimina sólo en la tercera ecuación, y así se obtiene como nueva tercera ecuación con b'3=b3-a3 c'2/b'2; d'3=d3 -a3d'2/b'2 Generalizando: para un sistema tridiagonal de n ecuaciones en n incógnitas.
  • 192. - . 180 Métodos numéricos a plicados a la ingeniería TRIANGULARIZACIÓN Para i = 1,2, ... , n-1 si b' ¡-:1- O se elimina Xi sólo en la (i + l j-ésima ecuación, con lo que se obtiene como nue- va (i + l)-ésima ecuación con SUSTITUCiÓN REGRESIVA XIl = d'nlb'n y para i = n-1, n-2, ... , 1 Estas simplificación del algoritmo de Gauss, válida para sistemas tridiagonales se conoce como método de Thomas. Con su aplicación se consiguen las siguientes ventajas: • La memoria de máquina se reduce al no tener que almacenar los elementos de A que son cero. Obsérvese que en lugar de almacenar la matriz A, se guardan sólo los vec- tores a = [al' a2,··· , an], b = [bl' b2,··· ,bn] yc = [el' e2,··· , en] con a¡ = en = O, em- pleando 3n localidades en lugar de n X n localidades, ventaja muy importante cuando n es grande (n :2: 50). • No se requiere pivotear. • Sólo se elimina durante el r-ésimo paso de la triangularización la variable Xi en la ecuación i + 1, con lo que se reduce el número de operaciones. • Por último, en la sustitución regresiva debe reemplazarse sólo xi +¡ en la i-ésima ecuación para obtener Xi. Resuelva el sistema tridiagonal 3 x¡ 2x2 x¡ + 5x2 - 4x2 + = l.0 0.2x3 = 5.8 7x3 = 11.0, por el método de Thomas. Solución En este sistema [ l.0]d = 5.8 11.0 Pa Como b, -:1- O se calculan las componentes de la nueva segunda fila b'2 = b2 - a2 c¡ 1b¡ = 5 - 1 (-2) 1 3 = 5.6666 PA PAy e' 2 = e2 = -0.2 d'2 = d2 - a2 di lb ; = 5.8 - 1(1/3) = 5.4666 180 Métodos numéricos aplicados a la ingeniería TRIANGULARIZACIÓN Para i = 1,2,.. . , n- 1 si b'¡ ::F Ose elimina Xi sólo en la (i + l)-ésima ecuación, con lo que se obtiene como nue- va (i + l)-ésima ecuación con SUSTITUCiÓN REGRESIVA X n = d'nlb'n y para i =n- 1, n- 2, ... , 1 Estas simplificación del algoritmo de Gauss, válida para sistemas tridiagonales se conoce como método de Thomas. Con su aplicación se consiguen las siguientes ventajas: • La memoria de máquina se reduce al no tener que almacenar los elementos de A que son cero. Obsérvese que en lugar de almacenar la matriz A, se guardan sólo los vec- tores a = [al' a2,··· , an], b = [bl' b2, ··· ,bn] yc = [el' e2,··· , en] con a¡ = en = O, em- pleando 3n localidades en lugar de n X n localidades, ventaja muy importante cuando n es grande (n :2: 50). • No se requiere pivotear. • Sólo se elimina durante el i-ésimo paso de la triangularización la variable Xi en la ecuación i + 1, con lo que se reduce el número de operaciones. • Por último, en la sustitución regresiva debe reemplazarse sólo Xi+l en la i-ésima ecuación para obtener Xi. Resuelva el sistema tridiagonal por el método de Thomas. Solución En este sistema 3 Xl 2X2 Xl + 5x2 - 4x2 + = 1.0 0.2x3 = 5.8 7x3 = 11.0, d = 5.8 [ 1.0] Como bl ::F Ose calculan las componentes de la nueva segunda fila b'2= b2- a2 cl 1bl = 5 - 1 (- 2) 13 = 5.6666 y e'2 = e2 = -0.2 d'2 = d 2 - a2 di Ibl = 5.8 - 1(1/3) = 5.4666 11.0
  • 193. te la Matrices y sistemas de ecuacion es lineales 181 Como b'2 *- O, se forma la nueva tercera fila b'3 = b3 - a3 C / 2 Ib'2 = 7 - 4 (-0.2) 15.666 = 7.141176 d'3 = d3 - a3 d' 2 Ib'2 = 11.0- 4(5.4666) I 5.6666 = 7.1411760 El sistema equivalente resultante es: 0.2x3 7.141176 x3 1.0 5.4666 7.141176 y por sustitución regresiva se llega a: x3 =dI 3 Ib'3 =7.141176/7.141176= 1 x2 = ( d' 2 - c2 x3 ) / b' 2 = (5.4666 - 0.2 (1)) I 5.6666 = 1 x¡ = (d'¡ - e¡ x 2 ) / b¡ = (1.0 - (-2) (1) I 3 = 1 Nótese que d' ¡ = d¡ Y b/ 1 = b, Para realizar los cálculos puede usarse el siguiente guión de Matlab: b=[3 5 7] a=[O 1 4] c=[ -2 -0.2 O ] d=[1 5.8 11J for i=2:3 b (i) =b(i) -a (i)*c (i -1) lb (i -1) ; d(i)=d(i) -a (i)*d(i-1) lb (i-1) ; end x (3) =d(3) lb (3) ; for i=2:-1:1 x(i)= (d(i) -e (i)*x (i+1)) lb (i); end x A continuación se da el algoritmo de Thomas. ALGORITMO 3.5 Método de Thomas Para obtener la solución x del sistema triadiagonal A x = b proporcionar los DATOS: El número de ecuaciones N, los vectores a, b, e, y el vector de términos independientes d. RESULTADOS: El vector solución x o mensaje de falla "EL SISTEMA NO TIENE SOLUCIÓN". PASO l. PASO 2. Hacer 1 =1. Mientras 1 ~ N-I, repetir los pasos 3 a 6. PASO 3. Si b(l) *- O continuar. De otro modo IMPRIMIR el mensaje "EL SISTEMA NO TIENE SOLUCIÓN" y TERMINAR. PASO 4. Hacer b(l+l) = b(l+l) - a (1+1) *c ( 1 )/b ( 1 ). Matrices y sistemas de ecuaciones lineales 181 Como b'2 ::j:. O, se forma la nueva tercera fila b'3 = b3 - a3 e'2 Ib'2 = 7 - 4 (-0.2) I 5.666 = 7.141176 d' 3 = d3 - a3 d' 2 Ib'2 = 11.0 - 4(5.4666) I 5.6666 = 7.1411760 El sistema equivalente resultante es: y por sustitución regresiva se llega a: 0.2x3 7.141176 x3 x3 = d I 3 I b'3 =7.141176/7.141176 = 1 1.0 5.4666 7.141176 x2 = ( d'2 - e2 x3) / b' 2 = (5.4666 - 0.2 (1)) I 5.6666 = 1 x¡ = (d' ¡ - e¡ x 2) / b't = (1.0 - (- 2) (1)) I 3 = 1 Nótese que d' ¡ = d¡ Yb/ 1 = b¡ Para realizar los cálculos puede usarse el siguiente guión de Matlab: b=[3 5 7] a=[O 1 4] c=[ -2 -0.2 O ] d=[l 5.8 11J for i=2:3 b (i) =b (i) - a (i)*c (i - 1) /b (i-1) ; d(i)=d(i) -a (i)*d(i - 1)/b(i- 1); end x (3) =d(3)/b(3) ; for i=2:-1 : 1 x(i)=(d (i) - e (i)*x (i+1)) /b (i); end x A continuación se da el algoritmo de Thomas. ALGORITMO 3.5 Método de Thomas Para obtener la solución x del sistema triadiagonal A x = b proporcionar los DATOS: El número de ecuaciones N, los vectores a, b, e, y el vector de términos independientes d. RESULTADOS: El vector solución x o mensaje de falla "EL SISTEMA NO TIENE SOLUCIÓN". PASO 1. Hacer 1 =1. PASO 2. Mientras 1 ~ N-l, repetir los pasos 3 a 6. PASO 3. Si b(!) *- Ocontinuar. De otro modo IMPRIMIR el mensaje "EL SISTEMA NO TIENE SOLUCIÓN" Y TERMINAR. PASO 4. Hacer b(l+l) = b(I+1) - a (1+1) *c ( 1 )/b ( 1 ).
  • 194. 182 Métodos numéricos aplicados a la ingeniería PASO 5. Hacer d(l+ 1) = d(I+I) - a (1+1) *d ( I )/b ( I ) PASO 6. Hacer I = I + 1 PASO 7. Si b(N) 7c. O continuar. De otro modo IMPRIMIR mensaje "EL SISTEMA NO TIENE SOLUCIÓN" YTERMI- NAR. Hacer x (N) = d (N) / b(N) Hacer 1= N-I Mientras 1 ~ 1, repetir los pasos 11 y 12. PASO 11. Hacer x(l) = (d(l) - c(l) * x(I+I)/b(l) x(l+ l)/b(l) PASO 12. Hacer I = I -1 PASO 13. IMPRIMIR el vector solución x y TERMINAR. PASO 8. PASO 9. PASO la. MÉTODOS DE FACTORIZACIÓN Factorización de matrices en matrices triangulares La eliminación de Gauss aplicada al sistema (véase ejemplo 3.28) 9 x2 + 2 x3 4x2 + 6x3 x2 + 3x3 5 3 4 condujo en su fase de triangularización al sistema equivalente [~ -9 2 0.5 5 O -10 ~.5]1.5 donde se aprecia una matriz triangular superior de orden 3 que se denotará como U -9 2]0.5 5 O -10 Ahora se define una matriz triangular inferior L de orden 3, con números 1 a lo largo de la diagonal principal y con I¡.). igual al factor que permitió eliminar el elemento a· . del siste-, 0 ma 3.43 (por ejemplo, a fin de eliminar a2 ,1 = 2 se utilizó el factor 12,1 = 2/4; para eliminar a3 1 = 1, el factor 13 1 = 1/4, Y para hacer cero a a3 2 = -1 se empleó 132 = 1.25/0.5). Así, la 'matriz L queda ' " O 1 1.25/0.5 cuyo producto con U resulta en O 1 1.25/0.5 L la matriz coeficiente del sistema original. -9 0.5 O ~] =A, -10 U 182 PASO 7. PASO 8. PASO 9. Métodos numéricos aplicados a la ingeniería PASO 5. Hacer d(l+1) = d(I+1) - a (1+1) *d ( I )/b ( I ) PASO 6. Hacer I = I + 1 Si b(N) ~ Ocontinuar. De otro modo IMPRIMIR mensaje "EL SISTEMA NO TIENE SOLUCIÓN" YTERMI- NAR. Hacer x (N) = d (N) / b(N) Hacer I = N-I PASO 10. Mientras l 2: 1, repetir los pasos 11 y 12. PASO 11. Hacer x(I) = (d(I) - c(I) *x(I+I)/b(l) x(l+ l»/b(I) PASO 12. Hacer I = I -1 PASO 13. IMPRIMIR el vector solución x y TERMINAR. MÉTODOS DE FACTORIZACIÓN Factorización de matrices en matrices triangulares La eliminación de Gauss aplicada al sistema (véase ejemplo 3.28) 4 xI 9 x 2 + 2 x 3 5 2 xI - 4 x 2 + 6 x 3 = 3 XI - x2 + 3 x3 = 4 condujo en su fase de triangularización al sistema equivalente [~ - 9 2 0.5 5 O - 10 ~.5]1.5 donde se aprecia una matriz triangular superior de orden 3 que se denotará como U -9 2]0.5 5 O -10 Ahora se define una matriz triangular inferior L de orden 3, con números 1 a lo largo de la diagonal principal y con li,j igual al factor que permitió eliminar el elemento ai,j del siste- ma 3.43 (por ejemplo, a fin de eliminar a2 l = 2 se utilizó el factor 121 = 2/4; para eliminar a3 l = 1, el factor 13 l = 1/4, Ypara hacer ~ero a a3 2 =-1 se empleÓ 132 = 1.25/0.5). Así, la 'matriz L queda ' " cuyo producto con U resulta en O 1 1.25/0.5 L O 1 1.25/0.5 ~] [~ la matriz coeficiente del sistema original. -9 0.5 O U ~] =A, -10
  • 195. Ux=e Matrices y sistemas de ecuaciones lineales 183 Esta descomposición de A en los factores L y U es cierta en general cuando la elimi- nación de Gauss puede aplicarse al sistema A x = b sin intercambio de filas, o equivalen- temente si y sólo si los determinantes de las submatrices de A son todos distintos de cero al,1 al,,, al,1 al,2 I al,1 I ::f:.O, ::f:.0, ... , ::f:.0 a2,1 a2,2 a",1 «: El resultado anterior permite revolver el sistema A x = b, ya que sustituyendo A por L U se tiene L U x e b Solución Se hace U x = e, donde e es un vector desconocido [ e I c2 c3 ... c"F, que se puede obte- ner fácilmente resolviendo el sistema Le = b, con sustitución progresiva o hacia adelante, ya que L es triangular inferior (en el sistema del Ejemplo 3.28, e resulta [5 0.5 1.5]T). Una vez calculado e, se resuelve con sustitución regresiva, ya que U es triangular superior y de esa manera se obtiene el vector solución x (el sistema particular que se ha trabajado da x = [6.95 2.5 -0.15]T). MÉTODOS DE DOOLlTLE y CROUT Aun cuando las matrices L y U pueden obtenerse en la triagularización de la matriz au- mentada [A lb], es deseable encontrar un método más directo para su determinación. Es- to es factible analizando la factorización de A en las matrices generales de orden tres L y U, dadas a continuación. [" O L] [~" ul,2 U''] [a", al,2 a",]12,1 12,2 U2,2 U2,3 a2,1 a2,2 a2,3 13,1 13,2 O U3,3 a3,1 a3,2 a3,3 Análisis: Se multiplican a) Primera fila de L pcr las tres columnas de U II,IUI,I al,1 [l,IuI,2 al,2 11,luI,3 al,3· b) Segunda fila de L por las tres columnas de U [2,1 UI,I a2,1 [2,1 UI,2 + [2,2 U2,2 a2,2 [2,1 UI,3 + [2,2 U2,3 a2,3 .< .l
  • 196. 1 • 184 Métodos numéricos aplicados a la ingeniería e) Tercera fila de L por las tres columnas de U 13,1 UI,I a3,l 13,1 UI,2 + 13,2 U2,2 a3,2 13,1 UI,3 + 13,2 U2,3 + 13,3 U3,3 a3.3' se llega a un sistema de nueve ecuaciones en 12 incógnitas [1,1' 12,1' [2,2' [3,1' [3,2' [3.3' U1,I' U1,2' U1,3' U2,2' U2.3' U3,3' por lo que será necesario establecer tres condiciones arbitrarias so- bre las incógnitas para resolver dicho sistema. La forma de seleccionar las condiciones ha dado lugar a diferentes métodos; por ejemplo, si se toman de modo que [1,1 = 12,2 = 13,3 = 1, se obtiene el método de Doolitle; si en cambio se selecciona uI 1 = u22 = u33 = 1, el al- goritmo resultante es llamado método de Crout. ", Se continuará el desarrollo de la factorización. Tómese [1,1 == 12,2 = 13,3 = 1 Con estos valores se resuelven las ecuaciones directamente en el orden en que están dadas De (a) u1,I = al,l ' uI,2 = al,2' U 1,3= al,3 ' De (b) y sustituyendo los resultados (Ec. 3.74) (3.74) 12,1= a2,I / u1,1 = a2,1/ al,l ' 1 a2,I u2,2 = a2,2 - 2,1 UI,2 = a2,2 - al,2 al,l (3.75) a2,I U2,3 = a2,3 - 12,1 UI,3 = a2,3 - al,3 al,l De (e) y sustituyendo los resultados de las ecuaciones 3.74 y 3,75 [3,1 = a3,I / uI,1 = a3,l / al,l (3.76) a2,I a2,2 - al,2 al,l u3,3 = a3,3 - 13,1 U1,3 - 13,2 U2,3 = a3,2 - a3,I al,2 a3,1 al,l [a2,3 - a2,1 a 1,3]a3,3 - al,1 al,3- a2,1 al,1 a2,2 - al,2 al,l Las ecuaciones 3.74,3.75 Y 3.76, convenientemente generalizadas constituyen un método directo para la obtención de L y U, con la ventaja sobre la triangularización de que no se tiene que escribir repetidamente las ecuaciones o arreglos modificados de A x = b. A con- tinuación se resuelve un ejemplo.
  • 197. Matrices y sistemas de ecuaciones lineales 185 Ejemplo 3.32 Resuelva por el método de Doolitle el sistema 4xI - 9x2 + 2x3 5 2x1 - 4x2 + 6x3 3 xI - x2 + 3x3 = 4 Solución Con 11,1 = 12,2 = 13,3 = 1, se procede al cálculo de la primera fila de U U¡,I = 4; uI,2 = -9; u1,3 = 2, cálculo de la primera columna de L 11,1 = 1 (dato); 12,1 = 2/4 = 0.5; 13,1 = 1/4 = 0.25 cálculo de la segunda fila de U u2 ,1 = O (recuérdese que U es triangular superior) u2,2 = -4 - (2/4) (-9) = 0.5; u2,3 = 6 - (2/4) (2) = 5 cálculo de la segunda columna de L 11 ,2 = O (ya que L es triangular inferior) 12,2 = 1 (dato), [3,2 = (-1-(1/4) (-9» / (-4-(2/4) (-9» = 2.5 cálculo de la tercera fila de U, o más bien sus elementos faltantes, ya que por ser triangu- lar superior U3,1 = u3,2 = O u3 ,3 = 3 - (1/4) (2) - [(-1-(1/4)(-9»)/(-4-(2/4)(-9»)](6-(2/4)(2») =-10 Con esto se finaliza la factorización". Las matrices L y U quedan como sigue [1 O n [~ -9 -I~]L= 0.5 1 U= 0.5 (3.76) 0.25 2.5 O cuyo producto, como ya se comprobó, da A.' Se resuelve el sistema L e = b, donde b es el vector de términos independientes del sistema original el =5; e2 = 3 -0.5 (5) = 0.5 e3 =4 -0.25 (5) - 2.5(0.5)= 1.5,'todo no se A con- y, finalmente, al resolver el sistema U x = e se tiene la solución del sistema original: • Los cálculos se han llevado en el orden fila-columna, fila-columna, etc., por convenir a la elaboración de los algoritmos correspondientes.
  • 198. 186 Métodos numéricos apl icados a la ingeniería [~ -9 2][X¡~ [5 ~0.5 5 x2 0.5 O -10 x3 1.5 X3 = -0.15 x2 = (0.5 - 5 (-0.15» /0.5 = 2.5 x¡ = (5 + 9(2.5) - 2(--0.15»/4 = 6.95 [ 6.95] X = 2.5 --0.15 Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. ) '1 clear fonnat short A=[4 -9 2 ; 2 -4 6 ; 1 -1 3 J b=[5 3 4J [L, U,PJ=lu (A); L U % Se multiplica b por P para que refleje los % intercambios hechos en A para llegar a L y U b=lYP c(l)=b(1) ; c (2) =b (2) -L (2, l)*c (1) ; c (3) =b (3) -L (3, l)*c (1) -L (3,2)*c (2) ; c x (3)=c(3)/U(3,3) ; x (2) =(c (2) -U(2,3) *x (3)) /U(2,2) ; x (1) = (c (1) -U(1 ,2) *x (2) -U(l ,3)*x (3)) /U(1,l) ; x Al( Para f mente, DA RE PASO PASO PASO e3_32 () Prgm [4,-9,2;2, -4,6;1, -1,3J ....•a: [5,3, 4J....•b:ClrIO LU a,L,u,p:Disp L:Pause:Disp u:Pause lYp-+b:b[l, 1J....•c[lJ :b[1,2J -L[2, 1J*c [l} ....•c[2Jt b[1,3J -L[3,1J*c[lJ- L[3,2J*c[2J ....•c[3J Disp c:Pause D->x[l] :D->x[2J: c[3J1u[3,3J ....•x[3J (c[2J -u [2,3J*x[3J) /u [2,2J ....•x[2J (c[lJ -u [1,2J*x[2] -u [1 ,3J*x [3J) /u [1, 1J....•x [L] Disp x Los resultados intermedios difieren de los anotados anteriormente, debido a que Matlab realiza intercambios de fila para llegar a las matrices L y U. Sin embargo, los resultados finales son los mismos. 186 Métodos numéricos aplicados a la ingeniería [~ -9 2] [X¡~ [5 ~0.5 5 x2 0.5 O - 10 x3 1.5 X3 = -0.15 x2 = (0.5 - 5 (-0.15)) /0.5 = 2.5 x¡ = (5 + 9(2.5) - 2(-0.15))/4 = 6.95 X = 2.5 [ 6.95] -0.15 Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. elear fonnat short A=[4 - 9 2 ; 2 - 4 6 ; 1 - 1 3 J b=[5 3 4J [L, U,PJ=lu (A); L U % Se multiplica b por P para que refleje los % intercambios hechos en A para llegar a L y U b=1YP e(l)=b(1) ; e (2) =b (2) -L (2, l)*e (1) ; e (3) =b (3) - L (3, l)*e (1) - L (3,2)*e (2) ; e x (3) =e (3)IU(3,3) ; x (2) = (e (2) - U(2,3) *x (3)) IU(2,2) ; x (1) = (e (1) -U(1 ,2) *x (2) -U(l ,3)*x (3)) IU(1,l) ; x e3_32 () Prgm [4, -9,2;2, -4,6;1, -1,3j....a: [5,3, 4j....b:ClrIO LU a,L, u,p :Disp L:Pause:Disp u:Pause 1Yp->b:b[l, 1J....e[lj :b[1,2j - L[2, 1J*e[1 j ....e [2j. b[1,3] - L[3,1j*e[lJ - L[3,2]*e[2]....e[3] Disp c:Pause ()-->x[1] : ()-->x[2j : e[3J1u[3,3]....x[3] (e[2] - u [2,3]*x[3j) lu [2,2j ....x [2] (e [1] -u [1,2]*x[2] - u [1 , 3]*x [3] ) lu [1, l] ....x [1] Disp x Los resultados intermedios difieren de los anotados anteriormente, debido a que Matlab realiza intercambios de fila para llegar a las matrices L y U. Sin embargo, los resultados finales son los mismos.
  • 199. (3.77) Matrices y sistemas de ecuaciones lineales 187 Las ecuaciones 3.74, 3.75 Y 3.76 se generalizan para factorizar la matriz coeficiente del sistema A x = b, que puede resolverse por eliminación de Gauss sin intercambio de fi- las; se tiene entonces 1 j-l l.=- (a¡j- L ukjlik); i=i+ 1,... , n I,} Uj,j , k=1 ' , lu = 1; i = 1,2, ... , n o con la convención en las sumatorias que L = O. k=l Puede observarse al seguir las ecuaciones 3.74, 3.75 Y3.76 o bien las ecuaciones 3.77, que una vez empleada ai,j en el cálculo de u¡,j o l¡,j según sea el caso, esta componente de A no vuelve a emplearse como tal, por lo que las componentes de L y U generadas pueden guar- darse en A y ahorrar memoria de esa manera. El siguiente algoritmo de factorización de A ilustra esto. PASO 1. PASO 2. PASO 3. SiA(1,l) = O IMPRIMIR "LA FACTORIZACIÓN NO ES POSIBLE" YTERMINAR. De otro modo continuar. Hacer J = 1. Mientras J ~ N, repetir los pasos 4 a 25. ALGORITMO 3.6 Factorización directa Para factorizar una matriz A de orden N en el producto de las matrices L yU triangulares inferior y superior, respectiva- mente, con l¡,j = 1; i = 1, 2, ... , N, proporcionar los DATOS: El orden N y las componentes de la matriz A. RESULTADOS: Las matrices L y U en A o mensaje de falla "LA FACTORIZACIÓN NO ES POSIBLE". PASO 14. PASO 15. PASO 16. Hacer 1 = J. Mientras 1 ~ N, repetir los pasos 6 a 13. PASO 6. Hacer SUMAT = O. PASO 7. Si J = 1 ir al paso 12. De otro modo continuar. PASO 8. Hacer K = 1. PASO 9. Mientras K ~ J - 1, repetir los pasos 10 y 11. PASO 10. Hacer SUMAT = SUMAT+A(J,K)*A(K,I). PASO 11. Hacer K = K + 1. PASO 12. Hacer A(J,I) = A(J,I) - SUMAT. PASO 13. Hacer 1 = 1 + 1. Si J = N ir al paso 25. De otro modo continuar. Hacer 1 = J + 1. Mientras 1 ~ N, repetir los pasos 17 a 24. PASO 17. Hacer SUMAT = O. PASO 18. Si J = 1 ir al paso 23. De otro modo continuar. PASO 19. Hacer K = 1. PASO 20. Mientras K ~ J-1, repetir los pasos 21 y 22. PASO 21. Hacer SUMAT=SUMAT+A(K,J)*A(I,K). PASO 22. Hacer K = K + 1. PASO 23. Hacer A(I,J)=(A(I,J)-SUMAT)iA(J,J). PASO 24. Hacer 1 = 1 +1. PASO 4. PASO 5. Matrices y sistemas de ecuaciones lineales 187 Las ecuaciones 3.74, 3.75 Y 3.76 se generalizan para factorizar la matriz coeficiente del sistema A x =b, que puede resolverse por eliminación de Gauss sin intercambio de fi- las; se tiene entonces 1 j-l l . = - (a¡,j' - L uk,j·l¡,k); i = j + 1,... , n l,} Uj,j k=1 lu = 1; i = 1,2,... , n o con la convención en las sumatorias que L = O. k=l (3.77) Puede observarse al seguir las ecuaciones 3.74, 3.75 Y3.76 o bien las ecuaciones 3.77, que una vez empleada a· . en el cálculo de u· . o l . . según sea el caso, esta componente de A noIJ l,} l,} vuelve a emplearse como tal, por lo que las componentes de L y U generadas pueden guar- darse en A y ahorrar memoria de esa manera. El siguiente algoritmo de factorización de A ilustra esto. ALGORITMO 3.6 Factorización directa Para factorizar una matriz A de orden N en el producto de las matrices L yU triangulares inferior y superior, respectiva- mente, con l¡,j = 1; i = 1, 2,... , N, proporcionar los DATOS: El orden N y las componentes de la matriz A. RESULTADOS: Las matrices L y U en A o mensaje de falla "LA FACTORIZACIÓN NO ES POSIBLE". PASO l. Si A(l,1) = OIMPRIMIR "LA FACTORIZACJÓN NO ES POSIBLE" YTERMINAR. De otro modo continuar. PASO 2. Hacer J = l. PASO 3. Mientras J ~ N, repetir los pasos 4 a 25. PASO 4. Hacer 1 = J. PASO 5. Mientras 1 ~ N, repetir los pasos 6 a 13. PASO 6. Hacer SUMAT = O. PASO 7. PASO 8. PASO 9. PASO 12. PASO 13. Si J = 1 ir al paso 12. De otro modo continuar. Hacer K = 1. Mientras K ~ J - 1, repetir los pasos 10 y 11. PASO 10. Hacer SUMAT = SUMAT+A(J,K)*A(K,I). PASO 11. Hacer K = K + 1. Hacer A(J,I) = A(J,I) - SUMAT. Hacer 1 = 1 +1. PASO 14. Si J = N ir al paso 25. De otro modo continuar. PASO 15. Hacer 1 = J + 1. PASO 16. Mientras 1 ~ N, repetir los pasos 17 a 24. PASO 17. Hacer SUMAT = O. PASO 18. Si J = 1 ir al paso 23. De otro modo continuar. PASO 19. Hacer K = 1. PASO 20. Mientras K ~ J- 1, repetir los pasos 21 y 22. PASO 21. Hacer SUMAT=SUMAT+A(K,J)*A(I,K). PASO 22. Hacer K = K + l. PASO 23. Hacer A(I,J)=(A(I,J)-SUMAT}/A(J,J). PASO 24. Hacer 1 = 1 +1.
  • 200. 188 Métodos numérico s aplicados a la ingeniería PASO 25. Hacer J = J +1 PASO 26. Si A(N,N) = O IMPRIMIR "LA FACTORIZACIÓN NO ES POSIDLE" y TERMINAR. De otro modo conti- nuar. PASO 27. IMPRIMIR A YTERMINAR. Obsérvese que cualquier elemento a¡,i = O, impediría emplear este algoritmo; por otro la- do, al no pivotear no se reducen en lo posible los errores de redondeo. Para hacer eficien- te este algoritmo, debe incluirse un intercambio de filas como en la eliminación de Gauss con pivoteo. A continuación se presenta el algoritmo anterior, pero ahora con estas modi- ficaciones. ALGORITMO 3.7 Factorlzación con pivoteo Para factorizar una matriz A de orden N en el producto de las matrices L y U triangulares inferior y superior respectiva- mente, con l¡,¡ = 1; i = 1,2, ... , N, con pivoteo parcial, proporcionar los DATOS: El orden N y las componentes de la matriz A. RESULTADOS: Las matrices L y U en A o mensaje de falla "LA FACTORIZACIÓN NO ES POSIBLE". PASO 1. PASO 2. PASO 3. PASO 12. PASO 13. Hacer R = O (R registra el número de intercambios de fila que se llevan a cabo). Hacer J = 1. Mientras J::; N, repetir los pasos 4 a ll. PASO 4. Si J = N ir al paso 10. PASO 5. Encontrar PIVOTE y P (ver paso 5 de algoritmo 3.4). PASO 6. Si PIVOTE = O IMPRIMIR "LA FACTORIZACIÓN NO ES POSIBLE" Y TERMINAR. De otro modo continuar. PASO 7. Si P = J ir al paso 10. De otro modo continuar. PASO 8. Intercambiar la fila J con la fila P de A. PASO 9. Hacer R = R + 1. PASO 10. Realizar los pasos 4 a 24 de algoritmo 3.6. PASO 11. Hacer J = J +1. Si A(N,N) = O IMPRIMIR "LA FACTORIZACIÓN NO ES POSIBLE" YTERMINAR. De otro modo continuar. IMPRIMIR A YTERMINAR. I A continuación Se resuelve un sistema por el método de Doolitle usando la factorización con pivoteo. Ejemplo 3.33 Resuelva el sistema del ejemplo 3.29 l Ox, + -20x¡ + 5x¡ + 1 2 6 por el método de Doolitle, con pivoteo parcial Solución Al intercambiar la primera y segunda filas resulta la matriz aumentada siguiente: [ -20 A = 1~ 3 1 3 20 -5 5 188 Métodos numéricos aplicados a la ingeniería PASO 25. Hacer J = J +1 PASO 26. Si A(N,N) = OIMPRIMIR "LA FACTORIZACIÓN NO ES POSIDLE" y TERMINAR. De otro modo conti- nuar. PASO 27. IMPRIMIR A YTERMINAR. Obsérvese que cualquier elemento a¡ i = O, impediría emplear este algoritmo; por otro la- do, al no pivotear no se reducen en l¿ posible los errores de redondeo. Para hacer eficien- te este algoritmo, debe incluirse un intercambio de filas como en la eliminación de Gauss con pivoteo. A continuación se presenta el algoritmo anterior, pero ahora con estas modi- ficaciones. Al.GORITMO 3.7 Factorización con pivoteo Para factorizar una matriz A de orden N en el producto de las matrices L y U triangulares inferior y superior respectiva- mente, con lj.j =1; i =1,2,... , N, con pivoteo parcial, proporcionar los DATOS: El orden N y las componentes de la matriz A. RESULTADOS: Las matrices L y U en A o mensaje de falla "LA FACTORIZACIÓN NO ES POSIBLE". PASO 1. PASO 2. PASO 3. PASO 12. PASO 13. Hacer R = O(R registra el número de intercambios de fila que se llevan a cabo). Hacer J = 1. Mientras J :o; N, repetir los pasos 4 a ll. PASO 4. Si J = N ir al paso 10. PASO 5. Encontrar PIVOTE y P (ver paso 5 de algoritmo 3.4). PASO 6. Si PIVOTE = OIMPRIMIR "LA FACTORIZACIÓN NO ES POSIBLE" YTERMINAR. De otro modo continuar. PASO 7. Si P = J ir al paso 10. De otro modo continuar. PASO 8. Intercambiar la fila J con la fila P de A. PASO 9. Hacer R = R + 1. PASO 10. Realizar los pasos 4 a 24 de algoritmo 3.6. PASO 11. Hacer J = J +1. Si A(N,N) = OIMPRIMIR "LA FACTORIZACIÓN NO ES POSIBLE" YTERMINAR. De otro modo continuar. IMPRIMIR A y TERMINAR. I A continuación se resuelve un sistema por el método de Doolitle usando la factorización con pivoteo. Ejemplo 3.33 Resuelva el sistema del ejemplo 3.29 Solución lOx¡ + -20x¡ + 5x¡ + por el método de Doolitle, con pivoteo parcial 1 2 6 Al intercambiar la primera y segunda filas resulta la matriz aumentada siguiente: [ -20 A = 1~ 3 1 3 20 !]-5 5
  • 201. nti- la- ien- auss cdi- tiva- otro Matrices y sistemas de ecuaciones lineales 189 20 -5 5 Como la nueva a¡,¡ F O, se forma la primera fila de U y se guarda como primera fila deA. al,! = u¡,¡ = -20, a¡,2 = u¡,2 = 3, al,3 = u¡,3 = 20 Cálculo de .la primera columna de L y su registro, excepto 11,1' como primera columna deA a2,1 = 12,1 a3,¡ = 13,1 La matriz A resultante entonces es: A = [=~~5-0.25 11,1 = 1 (dato), 10/(-20) = - 0.5 5/(-20) = - 0.25 3 1 3 Se busca el nuevo pivote en la parte relevante de la segunda columna (segunda y tercera filas) y resulta ser el elemento a32 . Se intercambia la segunda fiÍa con la tercera y entonces queda: A= [ -20 -0.25 -0.5 3 3 1 20 5 -5 ~]Cálculo de la segunda fila de U (mejor dicho de los elementos distintos de cero de dicha fila y almacenamiento de éstos en las posiciones correspondientes de A): a2,2 = u2,2 = 3 (- 0.25)(3) = 3.75 a2,3 = u2,3 = 5 - (- 0.25)(20) = 10.0 Cálculo de la segunda columna de L; es decir, de los elementos debajo de 12,2 y almacena- miento de éstos en las posiciones correspondientes de A. 1 - (- 0.5)(3) a32 = 132= = 0.666666 " 3.75 Con estos valores la matriz A resultante es A = [=~~25 -0.5 3 3.75 0.6666 20 10 -5 ~]Como a 3 ,3 F O, se calcula u 3 ,3' que constituye la parte relevante de la tercera fila de U, y se almacena en a3,3' a 3 3 = U 33 = -5 - (- 0.5) (20) - (0.66666) (LO) = -1.6666 con lo cual la matriz aumentada queda como sigue: A = [=~~25 - 0.5 3 3.75 0.6666 20 10 - 1.6666 ~] Matrices y sistemas de ecuaciones lineales 189 Como la nueva al ,¡ F O, se forma la primera fila de U y se guarda como primera fila deA. al ,] = U¡ ,¡ = -20, a¡ ,2 = u¡,2 = 3, a¡,3 = u¡ ,3 = 20 Cálculo de .la primera columna de L y su registro, excepto l¡ ,1' como primera columna deA ll,l = 1 (dato), a 2,! = l2,¡ a 3,1 = l3,1 La matriz A resultante entonces es: A = [=~~5- 0.25 3 1 3 10/(-20) = - 0.5 5/(-20) = - 0.25 20 -5 5 Se busca el nuevo pivote en la parte relevante de la segunda columna (segunda y tercera filas) y resulta ser el elemento a32. Se intercambia la segunda fiÍa con la tercera y entonces queda: A = [ - 20 -0.25 -0.5 3 3 1 20 5 - 5 ~] Cálculo de la segunda fila de U (mejor dicho de los elementos distintos de cero de dicha fila y almacenamiento de éstos en las posiciones correspondientes de A): a2,2 =u2,2 =3 (- 0.25)(3) =3.75 a2,3 =u2,3 =5 - (- 0.25)(20) = 10.0 Cálculo de la segunda columna de L;es decir, de los elementos debajo de l2,2 y almacena- miento de éstos en las posiciones correspondientes de A. 1 - (- 0.5)(3) a 32 =l32 = =0.666666 " 3.75 Con estos valores la matriz A resultante es A = [=~~25-0.5 3 3.75 0.6666 20 10 -5 ~] Como a 3,3 F O, se calcula u 3,3' que constituye la parte relevante de la tercera fila de U, y se almacena en a3,3' a 3 3 = U33 = -5 - (- 0.5) (20) - (0.66666) (lO) = - 1.6666 con lo cual la matriz aumentada queda como sigue: A = [=~~25- 0.5 3 3.75 0.6666 20 10 - 1.6666 ~]
  • 202. 190 Métodos numé ricos aplicados a la ingeniería Al resolver los sistemas Le = b' conL= [ ~~;5 !6666 ~] y b' = m se tiene: 2 6 + 0.25(2) = 6.5 1 + 0.5(2) - 0.6666(6.5) = -2.33329 y Pl PP PP PP PP Ux=c [ -20 con U = ~ 3 3.75 O 20 ] 10 Y e como arriba. -1.6666 se tiene Xl= -2.33329 x3 = = 1.3999796 -1.66666 x 2 = 6.5 - 10(1.3999796) = -1.9999456 3.75 2 - 3(-1.9999456) - 20(1.3999796) = 0.99999 -20 PA PA PA Para realizar los cálculos puede usarse el siguiente guión de Matlab: elear A=[10 1 -5 ; -20 3 20 ; 5 3 5] b=[1 2 6] [L, U,P]=lu (A); L U %Semultiplica P por b transpuesto para %reflejar los intercambios hechos en A b=P'b' e(l)=b(1) ; e (2) =b (2) -L (2, l)*e (1); e (3) =b (3) -L (3, l)*e (1) -L (3,2) *e (2) ; e x (3) =e (3) fU(3,3); x (2) = (e (2) -U(2,3)*x (3)) fU(2,2) ; x (1)= (e (1) -U(l ,2)*x (2) -U(1, 3)*x (3)) fU(l,l) ; x PA PA 190 Métodos n umé ricos aplicados a la ingeniería Al resolver los sistemas Le = b' con L= [~0.25 -0.5 o 1 0.6666 ~] y b'~ m se tiene: y e l = 2 e2 = 6 + 0.25(2) = 6.5 e3 = 1 + 0.5(2) - 0.6666(6.5) =- 2.33329 Ux =c [ -20 con U = ~ 3 3.75 O 20 ] 10 Ye como arriba. - 1.6666 se tiene - 2.33329 x3 = = 1.3999796 -1.66666 x 2 = 6.5 - 10(1.3999796) =- 1.9999456 3.75 2 - 3(-1.9999456) - 20(1.3999796) O X l = - - - - -- - - - - -- - = .99999 -20 Para realizar los cálculos puede usarse el siguiente guión de Matlab: clear A=[10 1 -5 ; - 20 3 20 ; 5 3 5] b=[1 2 6] [L, U, P]=lu (A) ; L U . %Se multiplica P por b transpuesto para %reflejar los intercambios hechos en A b=P"b' e(l)=b(l) ; e (2) =b (2) - L (2 , l )*c(l ); e (3) =b (3) -L (3, l)*c (1) -L (3, 2) *c (2) ; e x (3) =c (3)IU(3 , 3) ; x (2) = (e (2) - U(2, 3) *x (3)) IU(2, 2) ; x (1) = (e (1) - U(l ,2)*x (2) - U(1 , 3) *x (3)) IU(1 , l) ; x
  • 203. Matrices y sistemas de ec uaciones lineales 191 A continuación se da el algoritmo de Doolitle ALGORITMO 3.8 Método de Doolitle Para obtener la solución del sistema A x = b Yel determinante de A, proporcionar los DATOS: N el número de ecuaciones, A la matriz aumentada del sistema. RESULTADOS: El vector solución x y el determinante de A o mensaje "LA FACTORIZACIÓN NO ES POSIBLE". PASO 1. PASO 2. PASO 3. PASO 4. PASO 5. PASO 13. PASO 14. PASO 15. PASO 23. PASO 24. Realizar los pasos 1 al 12 del algoritmo 3.7. Hacer c(l) = A(l,N+ 1). Hacer DET = A(l,l). Hacer I = 2. Mientras I ~ N, repetir los pasos 6 a 12. PASO 6. Hacer DET = DET *A(I,I). PASO 7. Hacer c(l) = A(I,N+1). PASO 8. Hacer J = 1. PASO 9. Mientras J ;::::1-1, repetir los pasos 10 y 11. PASO 10. Hacer c(l) = c(l) -A(I,J)* c(J) . PASO 11. Hacer J = J + 1. PASO 12. Hacer I = I +1. Hacer x(N) = c(N)/A(N,N). Hacer I = N -1. Mientras 1;::::1, repetir los pasos 16 a 22. PASO 16. Hacer xCI) = c(I). PASO 17. Hacer J = I +1. PASO 18. Mientras J ~ N, repetir los pasos 19 y 20. PASO 19. Hacer x(l) = x(l) - A(I,J) * x(J). PASO 20. Hacer J = J + 1. PASO 21. Hacer x(l) = x(I)/A(I,I). PASO 22. Hacer 1= 1-1. Hacer DET = DET *(-1) ** R. IMPRIMIR x y DET YTERMINAR. SISTEMAS SIMÉTRICOS En el caso de que la matriz coeficiente del sistema A x = b sea simétrica, los cálculos de la factorización (si es posible) se simplifican, ya que la segunda de las ecuaciones 3.77 se reduce a: a., 1 J,l.. 1 .Ó: 1 2 1ij=- l=J+ ,... ,n,J=, , ... ,n- , a·· JJ (3.78) Esto disminuye considerablemente el trabajo, en particular cuando n es grande. Ejemplo 3.34 Resuelva el sistema simétrico siguiente [! 1 O 4 Solución Cálculo de la primera fila de U y su registro en A. Mat rices y s is temas de ecuaciones lineales 191 A continuación se da el algoritmo de Doolitle ALGORITMO 3.8 Método de Doolitle Para obtener la solución del sistema A x =b Yel determinante de A, proporcionar los DATOS: N el número de ecuaciones, A la matriz aumentada del sistema. RESULTADOS: El vector solución x y el determinante de A o mensaje "LA FACTORIZACIÓN NO ES POSIBLE". PASO l. PASO 2. PASO 3. PASO 4. PASO 5. Realizar los pasos 1 al 12 del algoritmo 3.7. Hacer c(l) = A(I,N+1). Hacer DET = A(l,l). Hacer I = 2. Mientras 1 ~ N, repetir los pasos 6 a 12. PASO 6. Hacer DET = DET *A(I,I). PASO 7. Hacer c(I) = A(I,N+l). PASO 8. PASO 9. Hacer J = 1. Mientras J 2: 1-1, repetir los pasos 10 y 1l. PASO 10. Hacer c(l) = c(l) -A(I,J)* c(J) . PASO 11. Hacer J = J + 1. PASO 12. Hacer 1= I +1. PASO 13. Hacer x(N) = c(N)/A(N,N). PASO 14. Hacer 1= N -1. PASO 15. Mientras 12: 1, repetir los pasos 16 a 22. PASO 16. Hacer xCI) = c(I). PASO 17. Hacer J = 1 +1. PASO 18. Mientras J ~ N, repetir los pasos 19 y 20. PASO 19. Hacer x(l) = x(l) - A(I,J) * x(J). PASO 20. Hacer J = J + 1. PASO 21. Hacer xCI) = x(I)/A(I,I). PASO 22. Hacer 1 = 1- 1. PASO 23. Hacer DET = DET *(-1) ** R. PASO 24. IMPRIMIR x y DET YTERMINAR. SISTEMAS SIMÉTRICOS En el caso de que la matriz coeficiente del sistema A x =b sea simétrica, los cálculos de la factorización (si es posible) se simplifican, ya que la segunda de las ecuaciones 3.77 se reduce a: a·· 1 J,l . . 1 .' 1 2 1ij = - 1 = ] + ,... , n,] = , ,.", n- , a· · JJ (3.78) Esto disminuye considerablemente el trabajo, en particular cuando n es grande. Ejemplo 3.34 Resuelva el sistema simétrico siguiente [l 1 O 4 Solución Cálculo de la primera fila de U y su registro en A.
  • 204. 192 Métodos numéricos aplicados a la ingeniería a¡,¡ = U¡,¡ = 2, a¡,2 = u¡,2 = 1, a¡,3 = u¡,3 = 3. Cálculo de los elementos relevantes de la primera columna de L, usando la ecuación 3.78 y su registro en A. a¡3 a31 =13 ¡=-' =1.5 , , a i.i Cálculo de los elementos relevantes de la segunda fila de U y su registro en las posiciones correspondientes de A a2,2 = U2,2 = a2,2 -12,¡ u¡,2 = 0-0.5 (1) = -0.5 a2,3 = u2,3 = a2,3 - 12,1U¡,3 = 4 - 0.5 (3) = 2.5 Cálculo de los elementos relevantes de la segunda columna de L mediante la ecuación 3.78 y su registro en las posiciones correspondientes de A. a23 a3 2 = 132 = -'- = - 5, , a 2,2 Finalmente se calcula la componente U 3 ,3 (único elemento relevante de la tercera fila de U) y se verifica su registro en a3,3' a3,3 = U3,3 = a3,3 - 13,¡ U¡,3 - 13,2 U2,3 = 3 - 1.5(3) - (-5)(2.5) = 11 La factorización da como resultado [ ~.5 1.5 1 -0.5 -5 Con la resolución del sistema L e = b Para f mente [ ~.5 1.5 O 1 -5 Di RE se obtiene: e = [O 1 8F Y al resolver el sistema U x = e PASO PASO [~ 1 -0.5 O 3l2.5 J "11 se obtiene: [ -1.9091J x = 1.6364 0.7273 192 Métodos numéricos aplicados a la ingeniería a l ,1 =UI,I =2, a l ,2 = u I ,2 = 1, al ,3 =uI ,3 =3. Cálculo de los elementos relevantes de la primera columna de L, usando la ecuación 3.78 y su registro en A. al3 a3 1 = l3 1 = - ' = l.5, , a 1,1 Cálculo de los elementos relevantes de la segunda fila de U y su registro en las posiciones correspondientes de A a2,2 = u2,2 = a2,2 -l2,1 uI,2 = 0 - 0.5 (1) = - 0.5 a2,3 = u2,3 = a2,3 - l2,1 uI ,3 = 4 - 0.5 (3) = 2.5 Cálculo de los elementos relevantes de la segunda columna de L mediante la ecuación 3.78 y su registro en las posiciones correspondientes de A. a23 a3 2 = l3 2 = - '- = - 5, , a 2,2 Finalmente se calcula la componente U3,3 (único elemento relevante de la tercera fila de U) y se verifica su registro en a3,3' a3,3 = U3,3 = a3,3 - l3,1 U¡ ,3 - l3,2 U2,3 La factorización da como resultado [~.5 1.5 =3 - l.5(3) - (-5)(2.5) =11 1 - 0.5 - 5 Con la resolución del sistema L e =b [~.5 l.5 se obtiene: e = [O 1 8F Yal resolver el sistema U x =e [~ se obtiene: O 1 -5 1 -0.5 O 3l2.5 J "11 [ -l.9091J x = 1.6364 0.7273
  • 205. 'n c1ear A=[2 1 3; 1 O 4; 3 4 3} b=[O 1 3} A (2,1) =A (1,2) lA (1,1) ; A(3,1)=A(1,3)IA(1,1) ; A (2,2: 3) =A (2,2: 3) -A (2,1) *A (1,2: 3) ; A(3,2)=A(2,3)IA(2,2); A(3,3)=A(3,3)-A(3,1:2)*A(1:2,3) ; A c(l)=b(l); e (2) =b (2) -A (2, 1) *c (1); e (3) =b (3) -A ( 3, 1 : 2) *e (1 : 2) , ; e x=[O O O}; x(3)=c(~)IA(3,3); x (2) = (e (2) -A (2,3) *x (3) ) lA (2,2) ; x (1) = (e (1) -A (1,2: 3) *x (2: 3) , ) lA (1,1) ; x Matrices y sistemas de ecuaciones lineales 193 Para realizar los cálculos puede usarse el siguiente guión de Matlab: 78 U) Es importante observar que no se emplea pivoteo parcial y que si alguno de los elementos ui,i resulta ser cero, este método no es aplicable; como consecuencia, habrá que recurrir al método de Doolitle con pivoteo, por ejemplo, con lo cual se pierde la ventaja de que A es simétrica. A continuación se da el algoritmo correspondiente. ALGORITMO 3.9 Factorización de matrices simétricas Para factorizar una matriz A de orden n en el producto de las matrices L y U triangulares inferior y superior, respectiva- mente, con tu = 1; i = 1,2, ... , n, proporcionar los DATOS: El orden N y las componentes de la matriz simétrica A. RESULTADOS: Las matrices L y U en A o mensaje de falla "LA FACTORIZACIÓN NO ES POSIBLE". PASO 1. PASO 2. Hacer J = l. Mientras J :s; N, repetir los pasos 3 al 15. PASO 3. Hacer 1 = J. PASO 4. Mientras I:s; N, repetir los pasos 5 a 13. PASO 5. Hacer SUMAT = O. PASO 6. Si J = 1 ir al paso 11. De otro modo continuar. PASO 7. Hacer K = l. PASO 8. Mientras K:S; J - 1, repetir los pasos 9 y 10. PASO 9. Hacer SUMAT=SUMAT+A(J,K)*A(K,I). PASO 10. Hacer K = K + l. PASO 11. Hacer A(J,I) = A(J,I) - SUMAT. PASO 12. Si 1 > J Hacer A (I,J) = A (J,I)/A(J,J). De otro modo continuar. PASO 13. Hacer 1 = 1 + 1. Matrices y sistemas de ecuaciones lineales 193 Para realizar los cálculos puede usarse el siguiente guión de Matlab: c1ear A=[2 1 3 ; 1 O 4 ; 3 4 3] b=[O 1 3] A(2 , l)=A(1 , 2)IA(1 , l) ; A(3 , l )=A(1,3) IA(1 , l ) ; A(2,2:3)=A(2,2:3) -A(2 , l )*A(l ,2:3); A(3 , 2 )=A(2, 3 ) IA(2 , 2 ); A (3,3) =A (3,3) -A (3,1: 2 ) *A (1: 2,3) ; A e (1) =b (1) ; e (2) =b (2) - A (2, 1) *e (1) ; c(3)=b (3)-A(3, l : 2)*c(1:2) ' ; e x=[O O O]; x(3)=c(~)IA(3,3); x (2) = (e (2) -A (2, 3J*x (3 ) ) lA (2,2) ; x (1) = (e (1) -A (1,2: 3 ) *x (2: 3) , ) l A (1,1) ; x Es importante observar que no se emplea pivoteo parcial y que si alguno de los elementos ui,i resulta ser cero, este método no es aplicable; como consecuencia, habrá que recurrir al método de Doolitle con pivoteo, por ejemplo, con lo cual se pierde la ventaja de que A es simétrica. A continuación se da el algoritmo correspondiente. AlGORITMO 3.9 Factorización de matrices simétricas Para factorizar una matriz A de orden 17 en el producto de las matrices L y U triangulares inferior y superior, respectiva- mente, con tu =1; i =1,2, ... ,17, proporcionar los DATOS: El orden N y las componentes de la matriz simétrica A. RESULTADOS: Las matrices L y U en A o mensaje de falla "LA FACTOR1ZACIÓN NO ES POSIBLE". PASO 1. Hacer J = l. PASO 2. Mientras J ~ N, repetir los pasos 3 al 15. PASO 3. Hacer 1 = J. PASO 4. Mientras 1 ~ N, repetir los pasos 5 a 13. PASO 5. Hacer SUMAT = O. PASO 6. Si J = 1 ir al paso 11. De otro modo continuar. PASO 7. Hacer K = 1. PASO 8. Mientras K ~ J - 1, repetir los pasos 9 y LO. PASO 9. Hacer SUMAT=SUMAT+A(J,K)*A(K,I). PASO 10. Hacer K = K + 1. PASO 11. Hacer A(J,I) = A(J,I) - SUMAT. PASO 12. Si 1 > J Hacer A (I,J) = A (J,I)/A(J,J). De otro modo continuar. PASO 13. Hacer 1 = 1 + 1.
  • 206. 194 Métodos numéricos apl icados a la ingeniería PASO 14. Si A(J,J) = OIMPRIMIR "LA FACTORIZACIÓN NO ES POSIBLE" YTERMINAR. De otro mo- do continuar. PASO 15. Hacer J = J + 1. PASO 16. IMPRIMIR A YTERMINAR. MÉTODO DE CHOLESKY Una matriz simétrica A cuyas componentes son números reales, es positiva definida si y sólo si los determinantes de las sub matrices de A son positivos. al,1 al,2 al,,, al.1 al,2 a2,1 a2,2 a2,,, I al,1 I > O, > O,... , >0 a2,1 a2,2 a",1 a",2 <, En el caso de tener un sistema A x = b, con A positiva definida, la factorización de A en la forma L U es posible y muy sencilla ya que toma la forma L U, donde L es triangular inferior: 11,1 O 12, I 12,2 L= 1",1 1",2 O O i: Los cálculos se reducen, ya que ahora basta estimar n(n+ 1)/2 elementos (los I¡,j -:f. O), en lu- gar de los n2 elementos de una factorización nominal (los I¡,j tales que i <j Y los u¡,j tales que i ?:.j). El número de cálculos es prácticamente la mitad. Ejemplo 3.35 Resuelva el sistema de ecuaciones lineales 1 2 O cuya matriz coeficiente es simétrica y positivamente definida. Solución Factorización de A 13,1]13,2 13,3
  • 207. en lar Matrices y sistemas de ecuacione s lineales 195 De la multiplicación de matrices se tiene IT,I = al,l; 11,1 = ± ~l = ± 2 se toma el valor positivo de todas las raíces 11,1 12,1 = al,2; 11,1 13,1 = a1,3; 11,1 = 2 12,1 = ali 11,1 =112 = 0.5 13,1= ali 11,1 =2/2 = 1 12,2 = J a2,2 - IL12 + 12 - a .2,1 2,2 - 2,2 ' 12,2 = J 2 - 0.52 = 1.32287 -12 1 13 1 + a2 3 I - " , 3,2 - I 2,2 13 ,2 = _ 0.5 (1) = -0.37796 1.32287 13,1 + 1~,2 + 13,3 = a3,3 ; 13,3 = J a3,3 - 13,1 - 13,2 [3,3 = J 5 - 1 - 0.14286 = 1.96396 Al resolver el sistema: Lc=b [~5 o O J1.32287 O -0.37796 1.96396 CI = 0.5 c2 = (2 - 0.5(0.5»/1.32287 = 1.32287 c3 = (4 - 0.5 + 0.37796(1.32287»/1.96396 = 2.0367 Al resolver el sistema: Lrx=c [~ - 0.3~796] [~~] = 1.96396 x3 [ 0.5 ] 1.32287 2.0367 0.5 1.32287 O X 3 = 2.0367/1.96396 = 1.037 x2 = (1.32287 + 0.37796(1.037»/1.32287 = 1.29629 Xl = (0.5 - 0.5 (1.29629) - 1.037)/2 = -0.59259 El vector solución es: [ -0.59259] x = 1.29629 1.037 Matrices y sistemas de ecuaciones lineales 195 De la multiplicación de matrices se tiene IL = al ,l; 11,1 = ± A l = ± 2 se toma el valor positivo de todas las raÍCes 11,1 12,1 = a l ,2; 11,1 13,1 = al ,3 ; 11,1 = 2 12,1 = a l ,/ 11,1 =112 = 0.5 13,1 = al'/ 11,1 =2/2 = 1 12,2 = Ja2,2 -/L 12,2 = J2 - 0.52 = 1.32287 1 _ - 12,1 13,1 + a2,3 3,2 - 1 2,2 1 3 ,2 = _ 0.5 (1) = -0.37796 l.32287 ~ 1 + ~ 2 + I~ 3 =a3 3 ;. , , , 13,3 = Ja3,3 - I~,1 - l~,2 133 =J5 - 1 - 0.14286 = 1.96396 Al resolver el sistema: Lc = b [ ~5 o 1.32287 -0.37796 el = 0.5 e2 = (2 - 0.5(0.5))/l.32287 = l.32287 e3 = (4 - 0.5 + 0.37796(l.32287))/1.96396 =2.0367 Al resolver el sistema: V'x=c [~ 0.5 l.32287 O -0.3~79J [~~] = 1.96396 J x3 X3 = 2.0367/1.96396 = l.037 [ 0.5 ] l.32287 2.0367 x2 = (l.32287 + 0.37796(1.037))/1.32287 = l.29629 xI = (0.5 - 0.5 (l.29629) - l.037)/2 = -0.59259 El vector solución es: [ -0.59259] x = 1.29629 1.037
  • 208. 196 Métodos numéricos aplicados a la ingeniería Para realizar los cálculos puede usarse el siguiente guión de Matlab que utiliza la fun- ción chol (A), que devuelve la matriz triangular superior U de A, la cual deberá ser simé- trica y positiva definida: A= [4 1 2 U=chol (A) L=U' b=[l 2 4J c=inv(L)*b' x=inv (L' ) *c 1 2 O; 2 O 5J PAse Las fórmulas de este algoritmo para un sistema de n ecuaciones son ll,l -r-; t., = al/l¡,1 ( i-I )112 l=a-L[2k 1,1 1,1 k=1 1,. i=2,3",.,n i = 2,3'00' ,n i-I l = ~ (a - L l k 1k) ),1 1. 1,) k= l 1, t. 1,1 i = 2, 3'00' ,n j = i + 1, i + 2,... , n -} 1.= O1,) i < j A continuación se da el algoritmo para este método. Para factorizar una matriz positiva definida en la forma L U, proporcionar los DATOS: N, el orden de la matriz y sus elementos. RESULTADOS: La matriz L. PASO 1. PASO 2. PASO 3. Hacer L(l,l) =A (1,1) ** 0.5. Hacer 1 = 2. Mientras 1 ::;N, repetir los pasos 4 y 5. PASO 4. Hacer L(1,l) = A(l,I)/L(1,l) YL(I,I) = O. PASO 5. Hacer 1 = 1 + 1. Hacer 1 = 2. Mientras 1 ::;N, repetir los pasos 8 a 24. PASO 8. Hacer S = O. PASO 9. Hacer K = 1. PASO 10. Mientras K::; 1-1, repetir los pasos 11 y 12. PASO 11. Hacer S = S + L(1,K) **2. PASO 6. PASO 7. 196 Métodos numéricos aplicados a la ingeniería Para realizar los cálculos puede usarse el siguiente guión de Matlab que utiliza la fun- ción chol (A), que devuelve la matriz triangular superior U de A, la cual deberá ser simé- trica y positiva definida: rIl ,,-IIJt.. A= [4 1 2 1 2 O; 2 O 5] U=chol (A) L=U' b=[l 2 4] c=inv(L)*b' x=inv(L' )*c Las fórmulas de este algoritmo para un sistema de n ecuaciones son 11,1=~ li,1= al/ll,l ( i- I )l/2l=a-L[2k1,1 1,1 k= 1 1, ' i- I 1 = ~ Ca - L 1 k 1 k) J,l l.. I,J k=1 1, J, 1,1 1.= OI,J i = 2, 3,... , n i =2,3'00 ' , n i = 2, 3'00' ,n j =i + 1, i + 2,... , n -} i < j A continuación se da el algoritmo para este método. f' '; " , .' . i . " •., - , ALGORITMO 3.10 Método de Cholesky . Para factorizar una matriz positiva definida en la forma L U, proporcionar los DATOS: N, el orden de la matriz y sus elementos. RESULTADOS: La matriz L. PASO 1. Hacer L(l,l) =A (1,1) ** 0.5. PASO 2. Hacer 1 = 2. PASO 3. Mientras 1 ::; N, repetir los pasos 4 y 5. PASO 4. Hacer L(l,l) = A(l,I)/L(1,l) YL(I,I) = O. PASO 5. Hacer l = l + 1. PASO 6. Hacer 1 = 2. PASO 7. Mientras 1::; N, repetir los pasos 8 a 24. PASO 8. Hacer S = O. PASO 9. Hacer K = 1. PASO 10. Mientras K::; 1- 1, repetir los pasos 11 y 12. PASO 11. Hacer S = S + L(1,K) **2.
  • 209. Matrices y sistemas de ecuaciones lineales 197 PASO 12. Hacer K = K +l. PASO 13. Hacer L(I,!) = (A(I,I) - S) ** 0.5. PASO 14. Si 1 = N ir al paso 25. PASO 15. Hacer J = I + l. PASO 16. Mientras J :::;N, repetir los pasos 17 a 23. PASO 17. Hacer S = o. PASO 18. Hacer K = l. PASO 19. Mientras K:::; 1-1, repetir los pasos 20 y 2l. PASO 20. Hacer S = S + L(I,K)*L(J,K). PASO 21. Hacer K = K + l. PASO 22. Hacer L(J,I)=(A(I,J)-S)/L(I,I) y L(I,J) = O. PASO 23. Hacer J = J + l. PASO 24. Hacer I = 1 +1. PASO 25. IMPRIMIR L YTERMINAR. SISTEMAS DE ECUACIONES MAL CONDICIONADOS Algunos autores caracterizan los métodos de solución directos como aquellos con los que se obtiene la solución exacta x del sistema A x = b mediante un número finito de opera- ciones, siempre y cuando no existan errores de redondeo. Como estos errores son prácti- camente inevitables, se obtendrán en general soluciones aproximadas y, cuya sustitución en el sistema producirá una aproximación del vector b: b' Ay = b' ""b En general, pequeños errores de redondeo producen sólo pequeños cambios en el vector solución; en estos casos se dice que el sistema está bien condicionado. Sin embargo, en algunos otros los errores de redondeo de los primeros pasos causan errores más adelante (se propagan), de modo que la solución obtenida y resulta ser un vector distinto del vector solución; peor aún, en estos sistemas la sustitución de y satisface prácticamente dicho sis- tema. Este tipo de sistemas se conocen como mal condicionados. A continuación se pre- sentan dos ejemplos Sea el sistema mal condicionado" [ 1.99J 1.97 (3.79) cuya solución es XI = x2 = 1.00, y sea la matriz aumentada siguiente [ l.00 0.00 0.9900 0.0001 l.9900J 0.0001 ' el resultado de la triangularización. Si se redondea o corta a tres dígitos la última fila, que- daría como fila de ceros y el sistema original como un sistema sin solución única. Si, por otro lado, por un pequeño error en los cálculos se obtiene como solución de la ecuación 3.79 YI= O, Y2 = 2, * Forsythe, G.E. y Moler, C.B. Computer Solution of Linear Algebraic Systems. Englewood Cliffs, NJ. Prentice Hall (1967). Matrices y sistemas de ecuaciones lineales 197 PASO 12. Hacer K = K +1. PASO 13. Hacer L(I,!) = (A(r,!) - S) ** 0.5. PASO 14. Si 1 = N ir al paso 25. PASO 15. Hacer J = 1 + l. PASO 16. Mientras J :::; N, repetir los pasos 17 a 23. PASO 17. Hacer S = O. PASO 18. Hacer K = 1. PASO 19. Mientras K :::; 1-1, repetir los pasos 20 y 2l. PASO 20. Hacer S = S + L(l,K)*L(J,K). PASO 21. Hacer K = K + 1. PASO 22. Hacer L(J,I)=(A(I,J)-S)/L(l,l) y L(I,J) = O. PASO 23. Hacer J = J + 1. PASO 24. Hacer 1 = 1 +1 . PASO 25. IMPRIMIR L YTERMINAR. SISTEMAS DE ECUACIONES MAL CONDICIONADOS Algunos autores caracterizan los métodos de solución directos como aquellos con los que se obtiene la solución exacta x del sistema A x =b mediante un número finito de opera- ciones, siempre y cuando no existan errores de redondeo. Como estos errores son prácti- camente inevitables, se obtendrán en general soluciones aproximadas y, cuya sustitución en el sistema producirá una aproximación del vector b: b' Ay =b' "" b En general, pequeños errores de redondeo producen sólo pequeños cambios en el vector solución; en estos casos se dice que el sistema está bien condicionado. Sin embargo, en algunos otros los errores de redondeo de los primeros pasos causan errores más adelante (se propagan), de modo que la solución obtenida y resulta ser un vector distinto del vector solución; peor aún, en estos sistemas la sustitución de y satisface prácticamente dicho sis- tema. Este tipo de sistemas se conocen como mal condicionados. A continuación se pre- sentan dos ejemplos Sea el sistema mal condicionado" [ 1.99J 1.97 cuya solución es X I =x2 = 1.00, y sea la matriz aumentada siguiente [ 1.00 0.00 0.9900 0.0001 1.9900J 0.0001 ' (3.79) el resultado de la triangularización. Si se redondea o corta a tres dígitos la última fila, que- daría como fila de ceros y el sistema original como un sistema sin solución única. Si, por otro lado, por un pequeño error en los cálculos se obtiene como solución de la ecuación 3.79 * Forsythe, G.E. y Moler, C.B. Computer So/ution ol Linear Algebraic Systems. Englewood Cliffs, NJ. Prentice Hall (1967).
  • 210. 198 Métodos numéricos aplicados a la ingeniería que aunque distinta del vector solución da en la situación [~:~~ ~:~~J [~J = D:~~J prácticamente el vector b. Aun una solución tan absurda como Y,= 100, Y2 = -99, da resultados sorprendentemente cercanos a b [ 1.00 0.99 0.99J 0.98 [ 100J -99 = [1.99J 1.98 Algunas veces los elementos de A y b son generados por cálculos (véase algoritmo s 5.1 y 5.5) Y los valores resultantes de ambos son ligeramente erróneos. Sea el sistema mal condicionado 1.001 xI - x2 = 1 xI - x2 = O que se desea resolver, pero por errores de redondeo o de otro tipo, se obtiene en su lugar (3.80) Y, - 0.9999 Y2 = 1.001 Y, - 1.0001 Y2 = O, que difiere sólo "ligeramente" del sistema 3.80 Las soluciones exactas son, respectivamente, (3.80') [ 1000J x = 1000; = [5005.5005J y 5005.0000 cuya diferencia es notable a pesar de que los sistemas son casi idénticos. Para entender es- to se da a continuación una interpretación geométrica de los sistemas mal condicionados. INTERPRETACIÓN GEOMÉTR'CA DE UN SISTEMA MAL CONDICIONADO DE ORDEN 2 La solución de un sistema de dos ecuaciones en dos incógnitas a,., x, + al,2 x2 bl a2,' x, + a2,2 x2 = b2 es el punto de intersección de las rectas (~1) b, a',2 x,= a", al,' x2 b2 a2,2 x,= a2,' a2,1 x2 (3.82) (3.83) en el plano x2 - XI' Si el sistema 3.81 es mal condicionado, las rectas 3.82 y 3.83 son ca- si paralelas, pero resulta difícil decir dónde se cortan exactamente" (véase Fig. 3.10). * Nótese que hay una solución única, pero resulta difícil decir dónde está.
  • 211. .!D/) res- dos. 3.81) (3.82) (3.83) n ea- 3.10). ----------------------~----------~~~ .....=.".- Matrices y sistemas de ecuaciones lineales 199 Ecuación (3.82) Ecuación (3.83) Figura 3.10 Interpretación geométrica de un sistema mal condicionado de orden 2. Cualquier pequeño error de redondeo o de otro tipo puede alejar del vector solución, con lo que se produce una solución errónea y. No obstante esto, si y está en la región de cruce, el sistema 3.81 se satisface prácticamente con y. Hay que observar que la región de cruce es muy amplia y que algunos de sus puntos pueden estar muy alejados del vector solución . Una vez que se ha visto el comportamiento de los sistemas mal condicionados, resul- ta de interés determinar si un sistema dado está mal condicionado y qué hacer en tales casos para resolverlo. Hay varias formas de detectar si un sistema está malo bien condicionado; pe- ro quizá la más simple de ellas es la del determinante normalizado que se describe a conti- nuación. MEDIDA DE CONDICIONAMIENTO USANDO EL DETERMINANTE NORMALIZADO En el sistema 3.81 el determinante de la matriz coeficiente puede interpretarse en valor absoluto como el área del paralelo gramo cuyos lados son los vectores fila' [al.] al.2] Y [a2,] a2,2] (véase Fig. 3.11). Figura 3.11 Interpretación geométrica del determinante. Puede decirse lo mismo para los vectores columna. Figura 3.10 Interpretación geométrica de un sistema mal condicionado de orden 2. Figura 3.11 Interpretación geométrica del determinante. Matrices y sistemas de ecuaciones lineales 199 Ecuación (3.83) Ecuación (3.82) Cualquier pequeño error de redondeo o de otro tipo puede alejar del vector solución, con lo que se produce una solución errónea y. No obstante esto, si y está en la región de cruce, el sistema 3.81 se satisface prácticamente con y. Hay que observar que la región de cruce es muy amplia y que algunos de sus puntos pueden estar muy alejados del vector solución. Una vez que se ha visto el comportamiento de los sistemas mal condicionados, resul- ta de interés determinar si un sistema dado está mal condicionado y qué hacer en tales casos para resolverlo. Hay varias formas de detectar si un sistema está malo bien condicionado; pe- ro quizá la más simple de ellas es la del determinante normalizado que se describe a conti- nuación. M E DIDA DE CONDICIONAMIENTO USANDO EL DETERMINANTE NORMALIZADO En el sistema 3.81 el determinante de la matriz coeficiente puede interpretarse en valor absoluto como el área del paralelogramo cuyos lados son los vectores fila' [a l •1 a l ,2] Y [a2,1a2,2 ] (véase Fig. 3.11). Puede decirse lo mismo para los vectores columna.
  • 212. 200 Métodos numéricos apli cados a la ingeniería Figura 3.12 Interpretación geométrica del determinante. En el caso de un sistema general de orden 3, el determinante de la matriz coeficiente de dicho sistema es, en valor absoluto, el volumen del paralelepípedo cuyos lados son los vec- tores [al I al 2 al 3] , [a2 1 a22 a2 3] Y [a3 I a32 a3 3] (véase Fig. 3.12). Al ~uldpli¿ar cada'una' de Ías filas del ~iste'ma 3.81 por un factor, el sistema resultan- te es equivalente, pero la matriz coeficiente se ha modificado y, por ende, su determinante. Si, por ejemplo, se divide la primera y segunda ecuaciones de 3.81, respectivamente, entre: se obtiene como nueva matriz coeficiente cuyo determinante en valor absoluto es menor o igual a la unidad, ya que ahora Ia I= 1 Y I b I = 1 (véase Fig. 3.11). El determinante así obtenido se conoce como determinante normalizado y, en general, para sistemas de orden n la matriz coeficiente resultante de di- vidir la i-ésima fila por los factores" k = J a 2 1 + a 2 2 + ... + a2,."1 l, r, i = 1,2, ... , n tiene un determinante, en valor absoluto, menor o igual que la unidad. <: Si el sistema 3.81 está mal condicionado, los vectores fila [al,1 al,2] Y [a2,l a2,2] son casi paralelos y el determinante normalizado estará muy cercano a cero (muy pequeño). Si, por otro lado, los vectores fila son casi ortogonales (perpendiculares), el determinante estará muy cercano a la unidad, en valor absoluto. Resumiendo y precisando: para medir el condicionamiento de un sistema de orden n, se debe obtener el determinante normalizado de la matriz coeficiente de dicho sistema; y si su valor absoluto es "prominentemente menor" que 1, el sistema está mal condicionado en ca- so de tener un valor absoluto prominentemente cercano a 1, el sistema está bien condiciona- do. Esta lejanía o cercanía de 1 queda determinada por la precisión empleada. ** Ejemr:: s • Llamados factores de escalamiento . •• Young, D. M. Y Gregory, R. T. A Survey Of Numerical Mathematics, Vol. II Addison-Wesley (1973), pp. 812-820. 200 Figura 3.12 Interpretación geométrica del determinante. Métodos n uméricos aplicados a la ingeniería En el caso de un sistema general de orden 3, el determinante de la matriz coeficiente de dicho sistema es, en valor absoluto, el volumen del paralelepípedo cuyos lados son los vec- tores [al ,1a l ,2 a l ,3 ] , [a2,1a 2,2 a 2,3 ] y [a3,1a 3,2 a 3,3 ] (véase Fig. 3.12). Al multiplicar cada una de las filas del sistema 3.81 por un factor, el sistema resultan- te es equivalente, pero la matriz coeficiente se ha modificado y, por ende, su determinante. Si, por ejemplo, se divide la primera y segunda ecuaciones de 3.81, respectivamente, entre: se obtiene como nueva matriz coeficiente cuyo determinante en valor absoluto es menor o igual a la unidad, ya que ahora Ia I= 1 y I b I = 1 (véase Fig. 3.11). El determinante así obtenido se conoce como determinante normalizado y, en general, para sistemas de orden n la matriz coeficiente resultante de di- vidir la i-ésima fila por los factores* k¡ =J a~,1 + a~,2 + ... + a~,1I i = 1,2,... , n tiene un determinante, en valor absoluto, menor o igual que la unidad. "'-......! Si el sistema 3.81 está mal condicionado, los vectores fila [al ,1a l ,2 ] Y [a2,1a 2,2] son casi paralelos y el determinante normalizado estará muy cercano a cero (muy pequeño). Si, por otro lado, los vectores fila son casi oltogonales (perpendiculares), el determinante estará muy cercano a la unidad, en valor absoluto. Resumiendo y precisando: para medir el condicionamiento de un sistema de orden n, se debe obtener el determinante normalizado de la matriz coeficiente de dicho sistema; y si su valor absoluto es "prominentemente menor" que 1, el sistema está mal condicionado en ca- so de tener un valor absoluto prominentemente cercano al , el sistema está bien condiciona- do. Esta lejanía o cercanía de 1 queda determinada por la precisión empleada.** • Llamados factores de escalamiento. *. Young, D. M. YGregory, R. T. A SlIrvey 01Numerical Marhematics, Vol. II Addison- Wesley ( 1973), pp. 812-820.
  • 213. Matrices y sistemas de e cuaciones lineales 201 Si bien la técnica es útil, no resulta práctica en sistemas grandes, ya que el cálculo del determinante toma tiempo y es casi equivalente a resolver dichos sistemas. Entonces, si se sospecha que un sistema está mal condicionado, se analiza de la manera siguiente: a) Se resuelve el sistema original A x = b. b) Se modifican los componentes de A ligeramente y se resuelve el sistema resul- tante A' x = b. e) Si las dos soluciones son sustancialmente diferentes (estas diferencias se comparan con los cambios hechos en a¡), el sistema está mal condicionado. Una vez corroborado que un sistema grande está mal condicionado, deberán emplearse los métodos de solución vistos con ciertas recomendaciones. a) Aprovechar las características de la matriz coeficiente (matrices bandeadas, simé- tricas, diagonal dominantes, positivas definidas, etc.), para que el método seleccio- nado sea el más adecuado y se realicen, por ejemplo, menos cálculos. b) Emplear pivoteo parcial o total (véase Ejer. 3.9). e) Emplear doble precisión en los cálculos. Si aún después de seguir estas sugerencias persisten las dificultades, puede recurrirse a los métodos iterativos que se estudian más adelante y que son, en general, otra alternativa de solución de sistemas lineales mal y bien condicionados, con la ventaja de no ser tan sen- sibles a los errores de redondeo. MATRICES ELEMENTALES Y LOS MÉTODOS DE ELIMINACiÓN Nótese que cualquiera de los métodos de eliminación vistos para resolver el sistema A x = b involucra las siguientes operaciones sobre una matriz:':' a) Intercambio de filas. b) Multiplicación de la fila por un escalar, y e) Sustitución de una fila por la suma de ésta y alguna otra fila de la matriz. Estas operaciones pueden llevarse a cabo, mediante multiplicaciones de la matriz en cues- tión, por ciertas matrices especiales; por ejemplo, la matriz permutadora permite intercam- biar filas. Multiplicando en cambio por la izquierda una matriz B cualquiera por la matriz identidad correspondiente 1, pero sustituido uno de sus elementos unitarios por m (la posi- ción (i,i), por ejemplo), se multiplica la i-ésima fila de B por m. Ejemplo 3.36 Multiplique la matriz general B de 3 X 4 por la matriz identidad correspondien~ don- de se ha reemplazado el 1 de la posición (2, 2) con m. Solución [~ O ~][b" b1,2 bl,3 b",] [b" b1,2 b1,3 b" ]m b2,1 b2,2 b2.3 b2,4 = mb2.1 mb2,2 mb2,3 mb2,4 O b3,1 b3,2 b3,3 b3,4 b3,1 b3,2 b3,3 b3,4 Los resultados hablan por sí solos. Finalmente, cuando se multiplica por la izquierda una matriz general B por la matriz identidad correspondiente 1, en la que se ha sustituido uno de los ceros con m (el cero de • Generalmente se trata de la matriz aumentada [A lb].
  • 214. 202 Métodos numéricos aplicados a la ingeniería la posición (i,j), por ejemplo), se tiene el efecto de sustituir la fila i-ésima de B por la fila resultante de sumar ésta y la filaj-ésima de B multiplicada por m. Ejemplo 3.37 Sustituya la segunda fila de la matriz general B de 3 X 3 por el resultado de sumar di- cha segunda fila con la primera fila de B multiplicada por m. Solución Se sustituye el cero de la posición (2, 1) de la matriz 1 de 3 X 3 con m y se multiplica por la izquierda por B; es decir: [~ o 1 O b,,2 mb,,2 + b2,2 b3,2 Si se desea intercambiar columnas, multiplicarlas por un escalar o sustituir una columna por la suma de ésta y alguna otra, se procede siguiendo las mismas ideas, pero con las mul- tiplicaciones por la derecha sobre la matriz en cuestión. Estas matrices se conocen como elementales y se denotan como: Permutación: P Multiplicación por un escalar: M Sustitución: S Para aclarar la relación que existe entre estas matrices y los métodos de eliminación, se re- suelve nuevamente el ejemplo 3.30, pero ahora con matrices elementales. Ejemplo 3.38 Resuelva por eliminación de Jordan el sistema 4x, - 9x2 + 2x3 5 2x, - 4x2 + 6x3 3 x, - x2 + 3x3 4 con matrices P, M Y S. Solución La matriz aumentada es [~ -9 --4 -1 2 6 3 No se intercambian filas, ya que el elemento de máximo valor absoluto se encuentra en la primera. Para hacer cero el elemento (2, 1), se suma la primera fila multiplicada por -1/2 a la segunda; la siguiente matriz cumple con ese fin. O 1 O Para hacer cero el elemento (3,1) se suma la primera multiplicada por -114 a la tercera fi- la; esto es, 202 Métodos numéricos aplicados a la ingeniería la posición (i,j), por ejemplo), se tiene el efecto de sustituir la fila i-ésima de B por la fila resultante de sumar ésta y la filaj-ésima de B multiplicada por m. Ejemplo 3.37 Sustituya la segunda fila de la matriz general B de 3 X 3 por el resultado de sumar di- cha segunda fila con la primera fila de B multiplicada por m. Solución Se sustituye el cero de la posición (2, 1) de la matriz 1 de 3 X 3 con m y se multiplica por la izquierda por B ; es decir: Ejemplo 3.38 Solución [~ o 1 O b, ,2 mb, ,2 + b2,2 b3,2 Si se desea intercambiar columnas, multiplicarlas por un escalar o sustituir una columna por la suma de ésta y alguna otra, se procede siguiendo las mismas ideas, pero con las mul- tiplicaciones por la derecha sobre la matriz en cuestión. Estas matrices se conocen como elementales y se denotan como: Permutación: P Multiplicación por un escalar: M Sustitución: S Para aclarar la relación que existe entre estas matrices y los métodos de eliminación, se re- suelve nuevamente el ejemplo 3.30, pero ahora con matrices elementales. Resuelva por eliminación de Jordan el sistema 4x, - 9x2 + 2x3 5 2x, - 4x2 + 6x3 3 x , - x2 + 3x3 4 con matrices P, M YS. La matriz aumentada es [~ -9 2 n-4 6 = B -1 3 "'-v No se intercambian filas, ya que el elemento de máximo valor absoluto se encuentra en la primera. Para hacer cero el elemento (2, 1), se suma la primera fila multiplicada por -1/2 a la segunda; la siguiente matriz cumple con ese fin. O 1 O ~] =S, 1 Para hacer cero el elemento (3,1) se suma la primera multiplicada por -114 a la tercera fi- la; esto es,
  • 215. Matrices y sistemas de ecuaciones lineales 203 [-,~ O ~]1 = S2 O El efecto de SI Y S2 sobre B resulta en: [~ -9 2 ~5 ] ~ S,S, B0.5 5 1.25 2.5 2.75 Como el elemento de máximo valor absoluto es 1.25, se intercambia la segunda y tercera filas, para lo cual se emplea la matriz [~ O !~O =p¡ 1 l· Yqueda: [~ -9 2 ~75]1.25 2.5 P¡S2 SI B 0.5 5 0.5 re- la 1/2 fi- Para hacer cero los elementos (l ,2) Y (3 ,2) se suma la segunda multiplicada por (-(-9)/1.25) a la primera fila, y la segunda multiplicada por (-0.5/1.25) a la tercera, pro- ceso que se lleva a cabo con las matrices. Para eliminar los elementos (1, 3) Y (2, 3), se suma la tercera multiplicada por (-2014) a la primera fila y la tercera multiplicada por (-2.5/4) a la segunda, lo cual se logra con Ss y S6' respectivamente. (Se deja al lector determinar la forma que tienen Ss y S6.) El resultado es: 27.8 ] 3.125 -0.6 [~ -(-9)/1.25 ~]1 = S3 O y queda como resultado: U O 20 1.25 2.5 O 4 [~ O 1.25 O 24.8 ] 2.75 -0.6 O O 4 Todavía se puede multiplicar la primera fila por m¡ = 1/4, la segunda por m2 = 1/1.25 Yla tercera por m3 = 1/4, lo cual se consigue con O 1 O O~] = M" etcétera
  • 216. 204 Métodos num éricos aplicados a la ingeniería finalmente queda: [~ o 1 O O O 1 6.95]2.5 -0.15 que puesta nuevamente como un sistema de ecuaciones da: XI 6.95 x2 2.5 x3 -0.15, directamente la solución del sistema original A x = b. Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. ~ B=[4 -9 2 5; 2 -4 6 3; 1 -1 3 4] 51=[1 O O; -0.5 1 O; O O 1] 52=[1 O O; O 1 O; -0.25 O 1] B=52¡'51*B Pl= [1 O O; O O 1; O 1 O] B=Pl*B 53=[1 9/1.25 O; O 1 O; O O 1] 54=[1 O O; O 1 O; O -0.5/1.25 1] B=54*s.TB 55=[1 O -5; O 1 O; O O 1] 56=[1 O O; O 1 -2.5/4; O O 1] B=56*55"B Ma=[1/4 O O; O 1 O; O O 1] M2=[1O O; O 1/1.25 O; O O 1] M3=[1O O; O 1 O; O O 1/4] B---M3*M2*Ma':'B e3_38 () Prgm [4,-9,2,5;2, -4, 6,3;1,-1,3, 4]-4b [1, 0,0;-0.5,1,0;0, O.ii-»i [1, 0,0;0,1,0;-0.25, O, l]-4s2 s21 'sl*b-4b : Disp b : Pause [1, 0,0;0, 0,1;0,1, O]"-"'p1 p1*b-4b : Disp b : Pause [1,9/1.25,0;0,1,0;0, O,l]-4s3 [1, 0,0;0,1,0;0, -O. 5/1. 25,1]-4s4 s4*s3:'b-4b : Disp b : Pause [1,0,-5;0,1,0;0,0,lJ-4s5 [1, O, 0;0,1,-2.5/4;0, O,lJ-4s6 s6's5*b-4b : Disp b : Pause [1/4, 0,0;0,1,0;0, O.Lt+uú [1, 0,0;0,1/1.25,0;0, O,lJ-4m2 [1, 0,0;0,1,0;0, O,1/4J-4m3 m3"m2'ml*b-4b : Disp b EndPrgm 204 Métodos numéricos aplicados a la ingeniería finalmente queda: [~ o 1 O O O 1 6.95]2.5 -0.15 que puesta nuevamente como un sistema de ecuaciones da: XI 6.95 x2 2.5 x3 -0.15, directamente la solución del sistema original A x =b. Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. B=[4 - 9 2 5; 2 -4 6 3; 1 -1 3 4] 51=[1 O O; -0.5 1 O; O O 1] 52=[1 O O; O 1 O; - 0.25 O 1] B=5Z¡'51*B Pl= [1 O O; O O 1; O 1 O] B=PYB 53=[1 9/1 . 25 O; O 1 O; O O 1] 54=[1 O O; O 1 O; O - 0. 5/1 . 25 1] B=54*53"B 55=[1 O -5; O 1 O; O O 1] 56=[1 O O; O 1 - 2.5/4; O O 1] B=56*5S'B Ma=[1/4 O O; O 1 O; O O 1] M2=[1 O O; O 1/1 .25 O; O O 1] M3=[1 O O; O 1 O; O O 1/4] J3=M3l'M2*Ma':'B e3_38 () Prgm [4,-9, 2 ,5;2, -4, 6,3;1, -1 ,3, 4]-4b [1, 0,0;-0.5,1,0;0, 0,1]-4sl [1, 0,0;0,1,0;-0.25, O, 1]-4s2 sZI'sl':'b-4b : Disp b : Pause [1, O, O; O, 0,1 ; O,1, O] -4p1 p1*b-4b : Disp b : Pause [1 , 9/1 .25, 0; 0, 1 ,0;0, O, l]-4s3 [1 , 0, 0; 0, 1, 0; 0,-0 .5/1 . 25, 1]-4s4 s4':'s3¡'b-4b : Disp b : Pause [l , O, - 5;O, l , 0; O, O,l]-4s5 [1 , O, 0;0,1 ,-2.5/4; 0, O, lJ-4s6 s6"sS:'b-4b : Disp b : Pause [1/4, 0, 0 ; 0, 1, 0; 0, O, l]-4m1 [1 , 0, 0; 0, 1/1 .25, 0; 0, O,l]-4m2 [1 , 0, 0;0, 1 , 0;0, O, 1/4]-4m3 mYm2'ml*b-4b : Disp b EndPrgm
  • 217. Matrices y sistemas de ecuaciones lineales 205 Si el producto de las matrices elementales se denota por E E = M3 M2 MI S6 s. S4 S3 PI S2 S¡ , se tiene: E B = E [A I b 1 = [ 1 I x ] , de donde: EA =1 y EB=x resulta que E es la inversa de A E = A-I Por otro lado, se sabe que el determinante del producto de dos o más matrices es igual al producto de los determinantes de cada una de las matrices. detA B... = detA det B... de donde: det E A = det 1 o bien: det E det A = 1 y 1 --=detA det E de modo que el determinante de A está dado como la inversa del determinante de E y só- lo queda obtener det E. Esto parece complicado a simple vista; sin embargo, observando que en general (véase Probo 3.52) det P = -1, el determinante de una matriz permutadora es -1. det M = m, el determinante de una matriz multiplicadora es el factor m, que deberá ser dis- tinto de cero. det S = 1, el determinante de una matriz del tipo S es 1. Se tiene: det E = det M3 det M2 det MI det S6 det Ss det S4 det S3 det P, det S2 det SI sustituyendo y 1 detA = -- =-20 -0.05 Finalmente, para obtener E y por tanto A-I se toma SI como matriz pivote y sobre ella se efectúan las operaciones de intercambio de filas, multiplicación por un escalar, etc., que vayan indicando las matrices a su izquierda. Así: Matrices y sistemas de ecuaciones lineales 205 Si el producto de las matrices elementales se denota por E se tiene: E B =E [A I b 1= [11 xl , de donde: EA = 1 y EB=x resulta que E es la inversa de A E = A- I Por otro lado, se sabe que el determinante del producto de dos o más matrices es igual al producto de los determinantes de cada una de las matrices. de donde: o bien: y detA B... = detA det B... det E A = det 1 det E det A = 1 1 - - = detA det E de modo que el determinante de A está dado como la inversa del determinante de E y só- lo queda obtener det E. Esto parece complicado a simple vista; sin embargo, observando que en general (véase Probo 3.52) det P = -1, el determinante de una matriz permutadora es-l. det M = m, el determinante de una matriz multiplicadora es el factor m, que deberá ser dis- tinto de cero. det S = 1, el determinante de una matriz del tipo S es l. Se tiene: det E = det M3 det M2 det M I det S6 det Ss det S4 det S3 det PI det S2 det SI sustituyendo y 1 1 1 det E = m3 m2 mi (-1) = -"4 (1.25 ) "4 = -D.05 1 detA = - - = -20 -0.05 Finalmente, para obtener E y por tanto A- I se toma SI como matriz pivote y sobre ella se efectúan las operaciones de intercambio de filas, multiplicación por un escalar, etc., que vayan indicando las matrices a su izquierda. Así:
  • 218. 206 Métodos numéricos aplicados a la ingeniería ya que según se dijo, S2 tiene como efecto multiplicar la primera fila de SI por -1/4 y su- marla a la tercera fila de Si- Con P I en cambio se tiene: ya que PI intercambia las filas segunda y tercera de (S2 SI)' Continuando este proceso se llega a: [ ~.3 -0.1 -1.25 -0.5 0.25 2.3~ 1.0 = E = -0.1 3.5 Métodos iterativos Al resolver un sistema de ecuaciones lineales por eliminación, la memoria de máquina re- querida es proporcional al cuadrado del orden de A, y el trabajo computacional es proporcio- nal al cubo del orden de la matriz coeficiente A (véase Secc. 3.4). Debido a esto, la solución de sistemas lineales grandes (n ;:::50), con matrices coeficiente densas: se vuelve costoso y difícil en una computadora con los métodos de eliminación, ya que se requiere amplia me- moria; además, como el número de operaciones que se debe ejecutar es muy grande, se pue- den producir errores de redondeo también muy grandes. Sin embargo, se han resuelto sistemas de orden 1000, y aun mayor, con los métodos que se estudiarán en esta sección. Estos sistemas de un número muy grande de ecuaciones se presentan en la solución numérica de ecuaciones diferenciales parciales, en la solución de los modelos resultantes en la simulación de columnas de destilación, etc. En favor de estos sistemas, puede decir- se que tienen matrices con pocos elementos distintos de cero y que éstas poseen ciertas propiedades (simétricas, bandeadas, diagonal dominantes, entre otras), que permiten ga- rantizar el éxito en la aplicación de los métodos de esta sección. MÉTODOS DE JACOBI y GAUSS-SEIDEL Los métodos iterativos más sencillos y conocidos son una generalización del método de punto fijo, estudiado en el capítulo 2. Se puede aplicar la misma técnica a fin de elaborar métodos para la solución de A x = b, de la siguiente manera. Se parte de A x = b para obtener la ecuación Ax-b=O, (3.84) ecuación vectorial correspondiente af(x) = O. Se busca ahora una matriz B y un vector e, de manera que la ecuación vectorial x e B.x. +c, (3.85) sea sólo un arreglo de la ecuación 3.84; es decir, de manera que la solución de una sea tam- bién la solución de la otra. La ecuación 3.85 correspondería a x = g (x). A continuación se • Una matriz densa tiene pocos ceros como elementos. 206 Métodos numéricos aplicados a la ingeniería ya que según se dijo, S2 tiene como efecto multiplicar la primera fila de SI por -1/4 y su- marla a la tercera fila de Sl' Con PI en cambio se tiene: ya que PI intercambia las filas segunda y tercera de (S2 SI)' Continuando este proceso se llega a: [ ~.3 -0.1 -1.25 - 0.5 0.25 2.3¡1.0 = E = -0.1 3.5 Métodos iterativos Al resolver un sistema de ecuaciones lineales por eliminación, la memoria de máquina re- querida es proporcional al cuadrado del orden de A, y el trabajo computacional es proporcio- nal al cubo del orden de la matriz coeficiente A (véase Secc. 3.4). Debido a esto, la solución de sistemas lineales grandes (n ;::: 50), con matrices coeficiente densas,*se vuelve costoso y difícil en una computadora con los métodos de eliminación, ya que se requiere amplia me- moria; además, como el número de operaciones que se debe ejecutar es muy grande, se pue- den producir errores de redondeo también muy grandes. Sin embargo, se han resuelto sistemas de orden 1000, y aun mayor, con los métodos que se estudiarán en esta sección. Estos sistemas de un número muy grande de ecuaciones se presentan en la solución numérica de ecuaciones diferenciales parciales, en la solución de los modelos resultantes en la simulación de columnas de destilación, etc. En favor de estos sistemas, puede decir- se que tienen matrices con pocos elementos distintos de cero y que éstas poseen ciertas propiedades (simétricas, bandeadas, diagonal dominantes, entre otras), que permiten ga- rantizar el éxito en la aplicación de los métodos de esta sección. MÉTODOS DE JACOBI y GAUSS-SE IDEL Los métodos iterativos más sencillos y conocidos son una generalización del método de punto fijo, estudiado en el capítulo 2. Se puede aplicar la misma técnica a fin de elaborar métodos para la solución de A x =b, de la siguiente manera. Se parte de A x =b para obtener la ecuación Ax-b = O, (3.84) ecuación vectorial correspondiente af(x) = O. Se busca ahora una matriz B y un vector e, de manera que la ecuación vectorial x =Bx + c , (3.85) sea sólo un arreglo de la ecuación 3.84; es decir, de manera que la solución de una sea tam- bién la solución de la otra. La ecuación 3.85 correspondería a x =g (x). A continuación se • Una matriz densa tiene pocos ceros como elementos.
  • 219. y su- a re- rcio- ción oso y me- pue- uelto 'no ción antes ecir- iertas n ga- o de borar 3.84) tor e, 3.85) tam- ión se -------~------------..."..------------~~--~~""I'!1Ii Matrices y sistemas de ecuaciones lineales 207 propone un vector inicial x (O) como primera aproximación al vector solución X. Luego, se calcula con la ecuación 3.85 la sucesión vectorial x (1) x (2), , de la siguiente manera x(k+l) = B x(k) + e, k = O, 1,2, . donde: (3.86) Para que la sucesión x(OJ, x(l), ••• , x(n), ••• , converja al vector solución x es necesario que eventualmente xt, 1 ~ j ~ n (los componentes del vector x(m)), se aproximen tanto a x j ' 1 ~ j ~ n (los componentes correspondientes a x), que todas las diferencias I xt - x j I , 1 ~j ~ n sean menores que un valor pequeño previamente fijado, y que se conserven me- nores para todos los vectores siguientes de la iteración; es decir, lím (3.87) La forma como se llega a la ecuación 3.85 define el algoritmo y su convergencia. Dado el sistema A x = b, la manera más sencilla es despejar xl de la primera ecuación, x2 de la se- gunda, etc. Para ello, es necesario que todos los elementos de la diagonal principal de A, por razones obvias, sean distintos de cero. Para ver esto en detalle considérese el sistema general de tres ecuaciones (naturalmente puede extenderse a cualquier número de ecua- ciones). Sea entonces: al,l Xl + al,2 X2 + al,3 X3 bj a2,1 Xl + a2,2 X2 + a2,3 X3 b2 a3,1 Xl + a3,2 X2 + a3,3 X3 b3 con all' a22 y a33 distintos de cero. Se despeja xl de la primera ecuación, x2 de la segunda, y x 3 de la tercera, con lo que se obtiene: al,2 al,3 bl xl= x 2 - x3 +-- al,l al,l al,l a2,1 a2,3 b2 (3.88)x2 = - xl X 3 +-- a2,2 a2,2 a2,2 a3,1 a3,2 b3 X3 = - X¡ - X2 +-- a3,3 a3,3 a3,3 que en notación matricial queda: O al,2 al,3 b¡ xl a¡,¡ al,l Xl al,l a2,1 O a2,3 b2 (3.89)x 2 x2 + a2,2 a2,2 a2,2 x3 a3,1 a3,2 O x 3 b3 a3,3 a3,3 a3,3
  • 220. 208 Métodos numér icos aplicados a la ingeniería y ésta es la ecuación 3.86 desarrollada, con o aJ,2 al,3 bJ aJ,1 al,l al,l B a2,1 O a2,3 b2 yC= a2,2 a2,2 a2,2 a3,J a3,2 O b3 a3,3 a3,3 a3,3 Una vez que se tiene la forma 3.89, se propone un vector inicial x(O) que puede ser x(O) = 0, o algún otro que sea aproximado al vector solución x. Para iterar existen dos variantes 1. Iteración de Jacobí (método de desplazamientos simultáneos) Si Ej (3.90) es el vector aproximación a la solución x después de k iteraciones, entonces se tiene para la siguiente aproximación Xk+l al,l (bl - al,2 x~ - al,3x~) 1 1 X(k+l) xk+J (b k k) (3.91)2 2 - a2,1 Xl - a2,3x3 a2,2 k+l x3 (b3 - a3,1 x1 - a3,2X~) a3,3 o bien, para un sistema de n ecuaciones con n incógnitas y usando notación más compac- ta y de mayor utilidad en programación, se tiene: 11 x/+ l = - [-b + L a· . xk ], para 1 ::;i::; n ai,i 1 }=l i.) } Ni (3.92) 2. Iteración de Gauss-Seidel (método de desplazamientos sucesivos) En este método los valores que se van calculando en la (k+ l)-ésima iteración se emplean para calcular los valores faltantes de esa misma iteración; es decir, con X(k) se calcula X(k+l) de acuerdo con: 1 (bl - al,2 x{ - a 1,3 x~)k+l aJ,JxJ X(k+I) k+J (b k+l k) (3.93)x2 a2,2 2 - a2,J Xl - a2,3 X3 xk+J 1 (b3 - a 3 1 X1k+J - a 3 2 X{+I) 3 a3,3 ' ,
  • 221. er x(O) (3.90) para 3.91) pac- lean X(k+I) .93) Matrices y sistemas de ecuaciones lineales 209 o bien, para un sistema de n ecuaciones i-l 11 x/+I=- [-b+ L a .. xk+l+ L a .. xk],paralS:¡S:n ai,i I l= I 1, } } i=i+ I 1, } } (3.94) SUGERENCIA: El empleo de un pizarrón electrónico para los siguientes ejemplos o el de una calculadora programable, atenuaría considerablemente el trabajo de los cálculos. Ejemplo 3.39 Resuelva el siguiente sistema por los métodos de Jacobi y Gauss-Seidel 4xI x2 1 -XI + 4x2 x3 1 (3.95) x2 + 4x3 x4 1 x3 + 4x4 1 Solución Despejando xI de la primera ecuación, x 2 de la segunda, etc., se obtiene XI xzl4 + 1/4 x2 = x¡f4 + x/4 + 1/4 (3.96) x3 xzl4 + x/4 + 1/4 x4 + x3/4 + 1/4 Vector inicial Cuando no se tiene una aproximación al vector solución, se emplea generalmente como vector inicial el vector cero, esto es: x(O) = [O O O O]T a) Método de Jacobi El cálculo de x(l) en el método de Jacobi se obtiene reemplazando x(O) en cada una de las ecuaciones de 3.96 0/4 + 1/4 0/4 + 0/4 + 1/4 0/4 + 0/4 + 1/4 0/4 + 1/4 1/4 1/4 1/4 1/4 y entonces X(I) = [1/4 1/4 1/4 1/4]T Para calcular X(2) se sustituye X(I) en cada una de las ecuaciones de 3.96. Para simpli- ficar la notación se han omitido los superíndices. 1/16 + 114 1/16 + 1/16 + 1/4 1/16 + 1/16 + 1/4 1/16 + 1/4 0.3125 0.3750 0.3750 0.3125
  • 222. 210 Métodos numéricos aplicados a la ingeniería A continuación se presentan los resultados de subsecuentes iteraciones, en forma tabular Tabla 3.1 Solución del sistema 3.95 por el método de Jacobi. k Xk xk Xk xk 1 2 3 4 O 0.0000 0.0000 0.0000 0.0000 0.2500 0.2500 0.2500 0.2500 2 0.3125 0.3750 0.3750 0.3125 3 0.3438 0.4219 0.4219 0.3438 4 0.3555 0.4414 0.4414 0.3555 5 0.3604 0.4492 0.4492 0.3604 6 0.3623 0.4524 0.4524 0.3623 ... 7 0.3631 0.4537 0.4537 0.3631 11 8 0.3634 0.4542 0.4542 0.3634 9 0.3635 0.4544 0.4544 0.3635 10 0.3636 0.4545 0.4545 0.3636 Para realizar los cálculos puede usarse Matlab o la TI-92 Plus. % Método de Jacobi clear A=[4 -1 O O; -1 4 -1 O; O -1 4 -1; O O -1 4J b=[1 1 1 1J XO=zeros(1,4); K=O; Norma=1; fprintf('K X(l) X (2) X (3) X(4) Norman') while Norma> 0.0001 K=K+1; fprintf( '%2d' ,K) for i=1:4 suma=O; for j=1:4 if i -= j suma=suma+A(i,j)*XO (j); end end X (i) = (b (i) -suma) lA (i,i) ; fprintf( '%10.4f' ,X(i)) end Norma=norm (XO-X) ; fprintf( '%10. 4fn' ,Norma) XO=X; if K > 25 disp ('No se alcanzó la convergencia') break end end
  • 223. Matrices y sistemas de ecuaciones lineales 211 ·1 e3_39a () Prgm ClrIO : [4,-1, 0,0;-1,4, -1,0;0, -1,4, -1;0, O,-1, 4]-+a [l,l,l,l}-+b : [O,O,O,O]-+xO : xü+xl. : O+): : l-+norma Disp"k x(1) x(2) x(3) x(4) norma" While norma>1.s-4 k+Ir+k: : string(k)&""->d For i,1,4 0-+suma For j,1,4 If i-tj suma+ati, j ]*xO [1,j ]-+suma EndFor (b[l,i] -suma) la [i,i]-+xl [l,i] :d&format (xl [l,i] , "f4") &''''-+d EndFor norm(xl-xO)-+norma : d&format(norma,"f5")-+d : Disp d : xl-+xO If k>25 Then Disp "No se alcanzó la convergencia" Exit EndIf EndWhile EndPrgm b) Método de Gauss-Siedel Para el cálculo del primer elemento del vector x(l) , se sustituye x(O)en la primera ecuación de 3.96, para simplificar la notación se han omitido los superíndices. Xl = 0/4 + 1/4 = 1/4 Para el cálculo de x 2 de x(l), se emplea el valor de xl ya obtenido (1/4) y los valores x 2 ' x 3 y x4 de x(O). Así, 1 x2 = 4(4) + 0/4 + 1/4 = 0.3125 Con los valores de xl y x 2 ya obtenidos, y con x 3 y x 4 de x(O) se evalúa x 3 de x(l). X 3 = 0.3125/4 + 0/4 + 1/4 = 0.3281 Finalmente, con los valores de Xl X 2 y x3 calculados previamente, y con x4 de x(°l, se obtie- ne la última componente de x(l) X4 = 0.3281/4 + 1/4 = 0.3320 Entonces x(l) = [0.25 0.3125 0.3281 0.3320F Para la segunda iteración (cálculo de x(2») se procede de igual manera. Xl = 0.3125/4 + 1/4 = 0.3281 x2 = 0.3281/4 + 0.3281/4 + 1/4 = 0.4141 x3 = 0.4141/4 + 0.3320/4 + 1/4 = 0.4365 x4 = 0.4365/4 + 1/4 = 0.3591 e3_39a () Prgm Matrices y sistemas de ecuaciones lineales 211 ClrIO : [4, - 1, O, O; - 1 , 4, - 1, O; O, -1,4, -1;O, O, -1,4]-+a [l,l , l , l]-+b : [O, O, O, O]-+xO : xO-+xl : O-+k : l-+nonna Disp"k x(l) x(2) x(3) x(4) nonna" While nonna>1. E- 4 k+l-+k : string(k)&""-+d For i,1,4 0-+suma For j , 1, 4 If # j swna+a [i , j ]*xO [1, j ]-+swna EndFor (b[l ,i] - suma) la [i ,i]-+xl [l,i] : d&fonnat (xl [l , i] , " f4 ") &''''-+d EndFor nonn(xl- xO)-+nonna : d&fonnat(nonna,"f5")-+d : Disp d : xl-+xO If k>25 Then Disp "No se alcanzó la convergencia" Exit EndIf EndWhile EndPrgm b) Método de Gauss-Siedel Para el cálculo del primer elemento del vector x O) , se sustituye x(Ü) en la primera ecuación de 3.96, para simplificar la notación se han omitido los superíndices. X l = 0/4 + 1/4 = 1/4 Para el cálculo de x 2 de xO), se emplea el valor de xl ya obtenido (1/4) y los valores x 2 , x 3 y x4 de x(Ü). Así, 1 x2 =4(4) + 0/4 + 1/4 =0.3125 Con los valores de x l Yx 2 ya obtenidos, y con x 3 y x 4 de x(Ü) se evalúa x 3 de x(l). X3 = 0.3125/4 + 0/4 + 1/4 = 0.3281 Finalmente, con los valores de X l X 2 y x3 calculados previamente, y con x4 de x(Ü), se obtie- ne la última componente de x(l) X4 = 0.3281/4 + 1/4 = 0.3320 Entonces x(l) = [0.25 0.3125 0.3281 0.3320F Para la segunda iteración (cálculo de x(2» se procede de igual manera. Xl =0.3125/4 + 1/4 =0.3281 x2 = 0.3281/4 + 0.3281/4 + 1/4 =0.4141 x3 = 0.4141/4 + 0.3320/4 + 1/4 = 0.4365 x4 =0.4365/4 + 1/4 =0.3591
  • 224. 212 Métodos numéricos aplicados a la ingeniería Con lo que x(2) = [0.3281 0.4141 0.4365 0.359 n'. En la tabla 3.2 se presentan los resultados de las iteraciones subsecuentes. Tabla 3.2 Solución del sistema 3.95 por el método de Gauss-Seidel. k xk xk xk xk 1 2 3 4 O 0.0000 0.0000 0.0000 0.0000 0.2500 0.3125 0.3281 0.3320 2 0.3281 0.4141 0.4365 0.3591 3 0.3535 0.4475 0.4517 0.3629 4 0.3619 0.4534 0.4541 0.3635 ¡"1 5 0.3633 0.4544 0.4545 0.3636 11' 6 0.3636 0.4545 0.4545 0.3636 Para realizar los cálculos puede usarse Matlab o la TI-92 Plus: % Metodo de Gauss-Seidel clear;A=[4 -1 O O; -1 4 -1 O; O -1 4 -1; O O -1 4];b=[1 1 1 1] XO=zeros(1,4);X=XO;K=0;Norma=1; fprintf(' K X(1) X (2) X(3) X(4) Norman') while Norma> 0.0001 K=K+1; fprintf(' %2d ',K) for i=1:4 suma=O; for j=1:4 if i ~= j suma=suma+A(i,j)*X(j) ; end end X(i)=(b(i) -suma)/A(i,i); fprintf( '%10.4f' ,X(i)) end Norma=norm(XO-X) ; fprintf ( '%10. 4fn' ,Norma) XO=X; if K > 17 disp ('No se alcanzó la convergencia') break end end
  • 225. Matrices y sistemas de ecuaci ones lineales 213 e3_39b() Prgm C1r10 : [4, -1, O,O;-1,4, -1, O;O,-1,4, -1; O,O, -1,4] -> a [1,1,1,1]->b : [O,O,O,O]->xO : xtr+x.: : O+k: : l=+norme Disp "k x(l) x (2) x(3) x(4) nonna" Whi1e nonna>1.E-4 k+Ir+k: : string(k) &" "->d For i,1,4 O->swna For j,1,4 If #j swna+a[i, j }*x1 [1,j J->swna EndFor (b[l,iJ-swna) /a [i,i]->x1 [l,i] :d&fonnat (xl [l,iJ , "f4") &" "->d EndFor nonn(x1-xO)->nonna : d&fonnat(nonna,"f5")->d : Disp d : xl+xt) If k>25 Then Disp "No se alcanzó la convergencia" Exit Endlf EndWhile End.Prgm En la aplicación de estas dos variantes son válidas las preguntas siguientes: 1. ¿La sucesión de vectores xCI), X(2), x(3), ... , converge o se aleja del vector solución x = [x¡ X2 ••• xnll'? 2. ¿Cuándo detener el proceso iterativo? Las respuestas correspondientes, conocidas como criterio de convergencia, se dan a con- tinuación 1. Si la sucesión converge a x, cabe esperar que los elementos de x(k) se vayan acer- cando a los elementos correspondientes de X; es decir, rol a x¡; xk 2 a x2' etc., o que se alejen en caso contrario. 2. Cuando a) Los valores absolutos 1xt+ 11 - xt 1,1xf+ 1 - x{ 1,etc., sean todos menores de un número pequeño E en cuyo valor será dado por el programador. a bien b) Si el número de iteraciones ha excedido un máximo predeterminado MAXIT. Por otro lado, es natural pensar que si la sucesión xCO), x(ll, ... , converge a x, la distancia (véase Seco 3.2) de xCO) a x, de XCI) a x, etc., se va reduciendo; también es cierto que la dis- tancia entre cada dos vectores consecutivos xCO)y XCI), x(l) Y x(2), etc., se decrementa con- forme el proceso iterativo avanza; esto es, la sucesión de números reales 1 X(I)_XCO) 1 1 x(2) - x(l) 1 convergirá a cero. (3.97) Matrices y sistemas de ecuaciones lineales 213 e3_39b () Prgm C1rIO : [4, -1, O, 0;-1, 4, -1,0;0, -1, 4, -1;0, O, -1, 4]->a [ l , l , l ,l] ->b : [O, O, O, O]->xO : x O->x1 : O->k : l ->nonna Di sp "k x(l) x (2 ) x (3) x(4) nonna" Whi1e nonna>1. E- 4 k+1->k : s t ring (k ) &" ''->d For i, 1 , 4 O->swna For j , 1 , 4 If # j s wna+a [i , j }*x1 [1, j] ->swna EndFor (b[l,i]-swna) l a [i,i]->xl [ l,i] :d&fonnat (xl [l,i] , " f4 ") &" "->d EndFor nonn(xl-xO)->nonna : d&fonnat(nonna,"f5")->d : Disp d : xl->xO If k>25 Then Disp "No se alcanzó la convergencia" Exit Endlf EndWhile EndPr gm En la aplicación de estas dos variantes son válidas las preguntas siguientes: 1. ¿La sucesión de vectores xCI), X(2), x(3), ... , converge o se aleja del vector solución x = [Xl X2 ••• xnll'? 2. ¿Cuándo detener el proceso iterativo? Las respuestas correspondientes, conocidas como criterio de convergencia, se dan a con- tinuación 1. Si la sucesión converge a x , cabe esperar que los elementos de x (k) se vayan acer- cando a los elementos correspondientes de X; es decir, rol a x I; xk2 a x2' etc., o que se alejen en caso contrario. 2. Cuando a) Los valores absolutos Ixt+ 11- xt 1, Ixi+ ' - xi 1, etc., sean todos menores de un número pequeño E en cuyo valor será dado por el programador. O bien b) Si el número de iteraciones ha excedido un máximo predeterminado MAXIT. Por otro lado, es natural pensar que si la sucesión x (O), x (l), .. . , converge a x , la distancia (véase Seco 3.2) de x (O) a x , de X CI ) a x , etc., se va reduciendo; también es cierto que la dis- tancia entre cada dos vectores consecutivos x (O) y x(l ), x(l ) y x (21, etc., se decrementa con- forme el proceso iterativo avanza; esto es, la sucesión de números reales convergirá a cero. I X( I)-X(O) I I X(2) - x(!) I I X(k+I ) - x Ck) I (3.97)
  • 226. 214 Métodos numé ricos aplicados a la ingeniería 't '1 Si, por el contrario, esta sucesión de números diverge, entonces puede pensarse que el proceso diverge. Con esto, un criterio más es e) Detener el proceso una vez que I x(k+I) - x(k) I < e Al elaborar un programa de cómputo para resolver sistemas de ecuaciones lineales, gene- ralmente se utilizan los criterios a), b) y e) o la combinación de a) y b), o la de b) y e). Si se observan las columnas de las tablas 3.1 y 3.2, se advertirá que todas son suce- siones de números convergentes, por lo que ambos métodos convergen a un vector, presu- miblemente la solución del sistema 3.95. Si se tomara el criterio (a) con e = 10-2 Yel método de Jacobi, e se satisface en la sex- ta iteración de la tabla 3.1; en cambio si e = 10-3, se necesitan 10 iteraciones. Si se toma E = 10-3, el método de Gauss-Seidel y el criterio (a), se requerirían sólo seis iteraciones, como puede verse en la tabla 3.2. Aunque hay ejemplos en los que Jacobi converge y Gauss-Seidel diverge, y vicever- sa, en general puede esperarse convergencia más rápida por Gauss-Seidel, o una manifes- tación más rápida de divergencia. Esto se debe al hecho de ir usando los valores más recientes de X(k+I) que permitirán acercarse o alejarse más rápidamente de la solución. REARREGLO DE ECUACIONES Para motivar el rearreglo de ecuaciones, se propone resolver el siguiente sistema con el método de Gauss Seidel y con e = 10-2 aplicado a Ix(k+ 1)- X(k) l. -XI + 3x2 + 5x3 + 2x4 10 XI + 9x2 + 8x3 + 4x4 15 (3.98) x2 + x4 2 2xI + x2 + x3 x4 -3 Al resolver para XI de la primera ecuación, para x2 de la segunda, x3 de la cuarta, y x4 de la tercera se obtiene: XI 3x2 + 5x3 + 2x4 - 10 x2 -x/9 (8/9) x3 (4/9) x4 + 15/9 x3 - 2xI x2 + x4 - 3 x4 x2 + 2 Con el vector cero como vector inicial, se tiene la siguiente sucesión de vectores. Nótese que el proceso diverge. Tabla 3.3 Aplicación del método de Gauss-Seidel al sistema 3.98. k xk xk xk xk I X(k+l) - X(k) I 1 2 3 4 O 0.000 0.000 0.000 0.000 -10.000 2.7778 14.222 -0.7778 17.62 2 67.8889 -18.172 -12l.2 20.17 159.0 3 -631.1 170.7 1108.0 -168.71 1439.05
  • 227. el e- e- u- x- eis er- es- ás el 8) de Matrices y sistemas de ecuaciones lineales 215 Si el proceso iterativo diverge, como es el caso, un rearreglo de las ecuaciones puede originar convergencia; por ejemplo, en lugar de despejar XI de la primera ecuación, x2 de la segunda, etc., cabe despejar las diferentes Xi de diferentes ecuaciones, teniendo cuidado de que los coeficientes de las Xi despejadas sean distintos de cero. Esta sugerencia presenta, para un sistema de n ecuaciones, n! distintas formas de rearreglar dicho sistema. A fin de simplificar este procedimiento, se utilizará el siguien- te teorema. TEOREMA 3.2 Los procesos de Jacobi y Gauss-Seidel convergirán si en la matriz coeficiente cada elemento de la diagonal principal es mayor (en valor absoluto) que la suma de los valores absolutos de todos los demás elementos de la misma fila o columna (matriz diagonal dominante). Es decir, se asegura la convergencia si: 11 I a.1 > L I a.1 1,1 i=I l.) j*i y (3.99) 11 l zr.l > L I aJ .,; I /,1 i=) j:J!i Este teorema no será de mucha utilidad si se toma al pie de la letra, ya que contados sis- temas de ecuaciones lineales poseen matrices coeficiente diagonalmente dominantes; sin embargo, si se arreglan las ecuaciones para tener el sistema lo más cercano posible a las condiciones del teorema, algún beneficio se puede obtener. Ésta es la pauta para reordenar las ecuaciones y obtener o mejorar la convergencia, en el mejor de los casos. A continua- ción se ilustra esto, rearreglando el sistema 3.98, despejando XI de la ecuación 4, x2 de la ecuación 2, x3 de la ecuación 1, y x4 de la ecuación 3, para llegar a: XI = -xzl2 - x/2 + xi2 - 3/2 x2 = -x/9 - 8x/9 - 4xi9 + ]5/9 x3 x/5 3xzl5 2xi5 + 10/5 x4 -x2 + 2 Los resultados para las primeras 18 iteraciones con el vector cero como vector inicial se muestran en la tabla 3.4. Antes de continuar las iteraciones, puede observarse en la tabla 3.4 que los valores de x(l8) parecen converger al vector x = [-10 12]T Con la sustitución de estos valores en el sistema 3.98, se comprueba que XI = 1, x2 = 0.0, x3 = 1 Yx4 = 2 es el vector solución, y por razones obvias se detiene el proceso. Finalmente, las ecuaciones 3.99 son equivalentes (en sistemas de ecuaciones) a la ex- presión 2.10 del capítulo 2 que establece el criterio de convergencia del método iterativo para resolver f (x) = O.
  • 228. 216 Métodos numéricos apli cados a la ingeniería Tabla 3.4 Aplicación del método de Gauss-Seidel al sistema 3.98, rearreglando las ecuaciones para obtener una aproximación a un sistema diagonal dominante. k Xk x k xk xk I x(k+l) - X(k) I 1 2 3 4 O 0.0000 0.0000 0.0000 0.0000 1 -1.5000 1.8333 0.6000 0.1667 2.44 2 -2.6333 1.3519 0.5956 0.6481 1.32 3 -2.1496 1.0881 0.6580 0.9119 0.6140 4 -1.9171 0.8895 0.7181 1.1105 0.3695 5 -1.7486 0.7291 0.7686 1.2704 0.2867 6 -1.6134 0.5978 0.8102 1.4022 0.2337 PASO 1 7 -1.5030 0.4903 0.8444 1.5097 0.1907 8 -1.4125 0.4020 0.8724 1.5980 0.1567 PASO I 9 -1.3382 0.3297 0.8953 1.6703 0.1285 * Operacic 10 -1.2774 0.2704 0.9142 1.7296 0.10529 11 -1.2275 0.2217 0.9296 1.7783 0.08643 12 -1.1865 0.1818 0.9423 1.8182 0.07089 13 -1.1530 0.1491 0.9527 1.8509 0.06162 14 -1.1254 0.1223 0.9612 1.8777 0.04764 15 -1.1029 0.1003 0.9682 1.8997 0.03903 16 -1.0844 0.0822 0.9739 1.9178 0.03209 17 -1.0692 0.0674 0.9786 1.9326 0.02629 18 -1.0567 0.0553 0.9824 1.9447 0.02152 Se presenta a continuación un algoritmo para resolver sistemas de ecuaciones lineales con el método iterativo, en sus dos versiones: desplazamientos simultáneos y desplazamientos sucesivos. ALGORITMO 3.11 Métodos de Jacobi y Gauss-Seidel Para encontrar la solución aproximada del sistema de ecuaciones A x = b proporcionar los DATOS: El número de ecuaciones N, la matriz coeficiente A, el vector de términos independientes b, el vec- tor inicial xO, el número máximo de iteraciones MAXIT, el valor de EPS y M = O para usar JACO- Bl o M "* O para usar GAUSS-SEIDEL. RESULTADOS: La solución aproximada x y el número de iteraciones K en que se alcanzó la convergencia o mensa- je "NO SE ALCANZÓ LA CONVERGENCIA", la última aproximación a x y MAXIT. PASO l. PASO 2. PASO 3. Arreglar la matriz aumentada de modo que la matriz coeficiente quede lo más cercana posible a la diagonal dominante (véase Probo 3.55). Hacer K = 1 Mientras K ~ MAXIT, repetir los pasos 4 a 18.
  • 229. Matrices y sistemas de ecuacio nes lineales 217 PASO 4. Si M = O ir al paso 5. De otro modo Hacer ? x = xO.· PASO 5. Hacer 1 = l. PASO 6. Mientras 1 ~ N, repetir los pasos 7 a 14. PASO 7. Hacer SUMA = O. PASO 8. Hacer J = l. PASO 9. Mientras J ~ N, repetir los pasos 10 a 12. PASO 10. Si J = 1 ir al paso 12. PASO 11. Hacer SUMA = SUMA+A(I,J)*xO(J) PASO 12. Hacer J = J +l. PASO 13. Si M = O, hacer xCI) = (b(I)-SUMA)/A(I,l). De otro modo hacer xO(I)= (b(I)-SUMA)/(A(I,l). PASO 14. Hacer! = 1 + l. PASO 15. Si Ix - xOI ~ EPS ir al paso 19. De otro modo continuar. PASO 16. Si M = O, hacer xO = x. PASO 17. Hacer K = K + l. PASO 18. IMPRIMIR mensaje "NO SE ALCANZÓ LA CONVERGENCIA", el vector x, MAXIT y el mensaje "ITE- RACIONES" YTERMINAR. PASO 19. IMPRIMIR el mensaje "VECTOR SOLUCIÓN", x, K y el mensaje "ITERACIONES" y TERMINAR. *" Operaciones vectoriales. SUGERENCIA: Una vez más se recomienda programar el algoritmo 3.11 en un lenguaje de alto nivel (véase PROGRAMA 3.3 del CD), o bien en una calculadora o en un pizarrón electrónico o en Matlab, donde las operaciones vectoriales se ejecutan con sólo indicarlas. ACELERACIÓN DE CONVERGENCIA Si aún después de arreglado el sistema por resolver A x = b, conforme la pauta del teore- ma 3.2, no se obtiene convergencia por los métodos de Jacobi y Gauss-Seidel o es muy lenta (como sucedió con el sistema 3.98 de la sección anterior), puede recurrirse a los mé- todos de relajación que, como se hará notar posteriormente, son lo métodos de Jacobi y Gauss-Seidel afectados por un factor de peso w que, elegido adecuadamente, puede pro- ducir convergencia o acelerada si ya existe. Se describen a continuación estos métodos pa- ra un sistema de n ecuaciones en n incógnitas. Llámese N la matriz coeficiente del sistema por resolver, una vez que haya sido lleva- da a la forma más cercana posible a diagonal dominante, y después de dividir la primera fila entre al," la segunda entre a2,2"" , y la n-ésima entre all ,lI' N es una matriz con unos en la diagonal principal. A continuación descompóngase N en la siguiente forma: N=L+ 1+ U, donde L es una matriz cuyos elementos por debajo de su diagonal principal son idénticos a los correspondientes de N y ceros en cualquier otro sitio, 1es la matriz identidad y U una matriz cuyos elementos arriba de la diagonal principal son idénticos a los correspondien- tes de N y cero en cualquier otro sitio. Sustituyendo esta descomposición de N, el sistema que se quiere resolver quedaría: (L + 1 + U) x = b (3.100) Si ahora se suma x a cada miembro de la ecuación 3.100 se obtiene (L + 1 + U) x + x = b + x PASO 4. PASO 5. PASO 6. Matrices y sistemas de ecuaciones lineales 217 Si M = Oir al paso 5. De otro modo Hacer ':' x = xO. · Hacer 1 = 1. Mientras 1 <S; N, repetir los pasos 7 a 14. PASO 7. Hacer SUMA = O. PASO 8. Hacer J = 1. PASO 9. Mientras J <S; N, repetir los pasos 10 a 12. PASO 10. Si J = 1 ir al paso 12. PASO 11. Hacer SUMA = SUMA+A(I,J)*xO(J) PASO 12. Hacer J = J +l. PASO 13. Si M = O, hacer xCI) = (b(I)-SUMA)/A(I,I). De otro modo hacer xO(I)= (b(I)-SUMA)/(A(I,I). PASO 14. Hacer 1 = 1 + 1. PASO 15. Si Ix - xOI <S; EPS ir al paso 19. De otro modo continuar. PASO 16. Si M = O, hacer xO = x. PASO 17. Hacer K = K + 1. PASO 18. IMPRIMIR mensaje "NO SE ALCANZÓ LA CONVERGENCIA", el vector x, MAXIT y el mensaje "ITE- RACIONES" YTERMINAR. PASO 19. IMPRIMIR el mensaje "VECTOR SOLUCIÓN", x, K y el mensaje "ITERACIONES" y TERMINAR. *" Oper:lciones vectoriales. SUGERENCIA: Una vez más se recomienda programar el algoritmo 3.11 en un lenguaje de alto nivel (véase PROGRAMA 3.3 del CD), o bien en una calculadora o en un pizarrón electrónico o en Matlab, donde las operaciones vectoriales se ejecutan con sólo indicarlas. ACELERACIÓN DE CONVERGENCIA Si aún después de atTeglado el sistema por resolver A x =b, conforme la pauta del teore- ma 3.2, no se obtiene convergencia por los métodos de Jacobi y Gauss-Seidel o es muy lenta (como sucedió con el sistema 3.98 de la sección anterior), puede recurrirse a los mé- todos de relajación que, como se hará notar posteriormente, son lo métodos de Jacobi y Gauss-Seidel afectados por un factor de peso w que, elegido adecuadamente, puede pro- ducir convergencia o acelerarla si ya existe. Se describen a continuación estos métodos pa- ra un sistema de n ecuaciones en n incógnitas. Llámese N la matriz coeficiente del sistema por resolver, una vez que haya sido lleva- da a la forma más cercana posible a diagonal dominante, y después de dividir la primera fila entre al ,!' la segunda entre a 2,2'''' , y la n-ésima entre a ll , lI' N es una matriz con unos en la diagonal principal. A continuación descompóngase N en la siguiente forma: N= L+ 1 + U, donde L es una matriz cuyos elementos por debajo de su diagonal principal son idénticos a los correspondientes de N y ceros en cualquier otro sitio, 1 es la matriz identidad y U una matriz cuyos elementos arriba de la diagonal principal son idénticos a los cotTespondien- tes de N y cero en cualquier otro sitio. Sustituyendo esta descomposición de N, el sistema que se quiere resolver quedaría: (L + 1 + U) x = b (3.100) Si ahora se suma x a cada miembro de la ecuación 3.100 se obtiene (L + 1 + U) x + x =b + x
  • 230. 218 Métodos numéricos aplicados a la ingeniería "Despejando" x del lado izquierdo, se llega al esquema siguiente x = x + [b - L x - x - U x], (3.101) que puede utilizarse para iterar a partir de un vector inicial x(O). Nótese que la ecuación 3.101, puede reducirse a la ecuación 3,89, ya que sólo es un rearreglo de ésta. Al aplicar la ecuación 3.10 1, pueden presentarse de nuevo las dos variantes que die- ron lugar a los métodos de Jacobi y Gauss-Seidel, con lo que el esquema de desplazamien- tos simultáneos quedaría: Ej X(k+l) = X(k) + [b - L X(k) - X(k) - U X(k)] (3.102) y el de desplazamientos sucesivos así: X(k+l) = X(k) + [b - L X(k+l) - X(k) - U X(k)] (3.103) Llegar al esquema 3.102 y 3.103 no es simplemente para tener una versión distinta de las ecuaciones 3.89, sino para someterlo a un análisis que permita proponer "nuevos métodos" o mejoras en los que ya se tienen. Por ejemplo, factorizando x(k) dentro del paréntesis rec- tangular de la ecuación 3.102, se tiene: b - ( L + 1+ U) X(k) = b - N x(k) = r(k) (3.104) vector que se denota como r(k) y se llama vector residuo de la k-ésima iteración y puede tomarse como una medida de la cercanía de x(k) al vector solución x; si las componentes de r(k) o Ir(k) Ison pequeñas, X(k) suele ser una buena aproximación a x; pero si los elemen- tos de r(k) o Ir(k) I son grandes, puede pensarse que X(k) no es muy cercana a x. Aunque hay circunstancias donde esto no se cumple, por ejemplo, cuando el sistema por resolver está mal condicionado (véase Seco 3.4), es práctico tomar estos criterios como válidos. Al sustituir la ecuación 3.104, en la 3.102 queda X(k+l) = X(k) + r(k) (3.105) que puede verse como un esquema iterativo donde el vector de la (k+l)-ésima iteración se obtiene a partir del vector de la k-ésima iteración y el residuo correspondiente. Si la aplicación de la ecuación 3.105 a un sistema particular da convergencia lenta, entonces x(k+l) y X(k) están muy cercanas entre sí, y para que la convergencia se acelere puede intentarse afectar r(k) con un peso w > 1 (sobrerrelajar el proceso); si, en cambio, el proceso diverge Ir(k) Ies grande y convendría afectar r(k) con un factor w < 1 (subrela- jar el proceso), para provocar la convergencia. El esquema 3.105 quedaría en general así: X(k+l) = x(k) + w r(k) (3.106) o n xk+l = xCk)+ w [b - L a .. x k ] 1 l 1 j=l t.j ) j",¡ 1 -:;,i -:;,n , (3.107) para desplazamientos simultáneos. Para desplazamientos sucesivos, en cambio, quedaría X(k+l) = x(k) + w [b - L x(k+l) - x(k) - U X(k)] (3.108) o (3.109) 218 Métodos numéricos aplicados a la ingeniería "Despejando" x del lado izquierdo, se llega al esquema siguiente x =x + [b - L x - x - U x], (3.101) que puede utilizarse para iterar a partir de un vector inicial x(O). Nótese que la ecuación 3.101, puede reducirse a la ecuación 3,89, ya que sólo es un rearreglo de ésta. Al aplicar la ecuación 3.101, pueden presentarse de nuevo las dos variantes que die- ron lugar a los métodos de Jacobi y Gauss-Seide1, con lo que el esquema de desplazamien- tos simultáneos quedaría: X(k+ l) =X (k) + [b - L X(k) - X (k) - U X(k)] (3.102) y el de desplazamientos sucesivos así: X(k+ l) = X(k) + [b - L X(k+l) - X(k) - U X(k)] (3.103) Llegar al esquema 3.102 y 3.103 no es simplemente para tener una versión distinta de las ecuaciones 3.89, sino para someterlo a un análisis que permita proponer "nuevos métodos" o mejoras en los que ya se tienen. Por ejemplo, factorizando x(k) dentro del paréntesis rec- tangular de la ecuación 3.102, se tiene: b - ( L + 1 + U) X(k) = b - N x(k) = r(k) (3.104) vector que se denota como r(k) y se llama vector residuo de la k-ésima iteración y puede tomarse como una medida de la cercanía de x(k) al vector solución x; si las componentes de r(k) o Ir(k) Ison pequeñas, X(k) suele ser una buena aproximación a x; pero si los elemen- tos de r(k) o Ir(k) Ison grandes, puede pensarse que X (k) no es muy cercana a x. Aunque hay circunstancias donde esto no se cumple, por ejemplo, cuando el sistema por resolver está mal condicionado (véase Seco 3.4), es práctico tomar estos criterios como válidos. Al sustituir la ecuación 3.104, en la 3.102 queda X(k+l) =X(k) + r(k) (3.105) que puede verse como un esquema iterativo donde el vector de la (h l)-ésima iteración se obtiene a partir del vector de la k-ésima iteración y el residuo correspondiente. Si la aplicación de la ecuación 3.105 a un sistema particular da convergencia lenta, entonces x(k+l) y X(k) están muy cercanas entre sí, y para que la convergencia se acelere puede intentarse afectar r(k) con un peso w > 1 (sobrerrelajar el proceso); si, en cambio, el proceso diverge Ir(k) Ies grande y convendría afectar r(k) con un factor w < 1 (subrela- jar el proceso), para provocar la convergencia. El esquema 3.105 quedaría en general así: X(k+l) = x(k) + w r(k) (3.106) o n xk+l = x(k) + w [b - L a . . x k ] 1 1 I j= l l .} } 1 -:;, i -:;, n , (3.107) j", ¡ para desplazamientos simultáneos. Para desplazamientos sucesivos, en cambio, quedaría X(k+l) =x(k) + w [b - L x(k+l) - x(k) - U X (k) ] (3.108) o (3.109)
  • 231. 1) ón 'e- n- 2) 3) las s" c- ay stá S) se la, ere io, la- sí: 06) 07) 08) 09) Matrices y sistemas de ecuaciones lineales 219 Estos métodos se abrevian frecuentemente como SOR (del inglés Succesive Over-Re- laxation). En general, el cálculo de w es complicado y sólo para sistemas especiales (matriz coe- ficiente positivamente definida y tridiagonal) se tiene una fórmula: Ejemplo 3.40 Resuelva el sistema 3.98 -XI + 3x2 + 5x3 XI + 9x2 + 8x3 x2 2xI + x2 + x3 10 15 2 -3 con desplazamientos sucesivos, w = 1.3 Y con E = 10-2 aplicado a I X(k+l) - x(k) 1.(Puede seguir los cálculos con un pizarrón electrónico o con Matlab.) Solución La matriz N y el vector de términos independientes correspondiente son - 1I2 l4/9 2/5 ' 1 112 1 3/5 1 112 8/9 1 O b = [-3/2 15/9 10/5 2]T Descomposición de N L = [ 1~9 -115 O 1/2 8/9 O O - 1I2 l4/9 2/5 O O O 3/5 1 O O O O 112 O O O Primera iteración Obtención de x(1) a partir del vector inicial x (O) = [O O O OF y empleando la ecuación 3.108. Cálculo de x], esto es, i = 1 Yk + 1 = 1 o 4 xl = xp + 1.3[ b, - j:¡ IIJ xl - x? - j:2 U1J x/] Obsérvese que en la primera sumatoria el valor inicial (j=I) es mayor que el valor final (O); la convención en estos casos es que tal sumatoria no se realiza. Por tanto, Xl = O + 1.3[-3/2 - O - 112(0) -1/2(0) + 112(0)] = - 1.95 Cálculo de xi, esto es, i = 2 Yk+ 1 = 1 I x2 1 = x2 0 + 1.3 [ b2 -L J~I = O+ 1.3 [15/9 - 119(-1.95) - O- 8/9(0) - 4/9(0)] = 2.4483 Cálculo de xj, esto es, i = 3 Yk+l = 1 = O + 1.3 [10/5 - (-115)(-1.95) - (3/5) (2.4483) - O- 2/5(0)] = 0.1833 • Burden, R.L. y Faires, J'D. Análisis numérico. Grupo Editorial Iberoamérica (1985), pp. 475. # - Matrices y sistemas de ecuaciones lineales 219 Estos métodos se abrevian frecuentemente como SOR (del inglés Succesive Over-Re- laxatian). En general, el cálculo de w es complicado y sólo para sistemas especiales (matriz coe- ficiente positivamente definida y tridiagonal) se tiene una fórmula: Ejemplo 3.40 Resuelva el sistema 3.98 - XI + 3x2 X I + 9x2 x2 2xI + x2 + 5x3 + 8x3 + x3 + 2x4 + 4x4 + x4 x4 10 15 2 -3 con desplazamientos sucesivos, w = 1.3 Ycon E = 10-2 aplicado a I XCk+ I) - xCk) 1. (Puede seguir los cálculos con un pizarrón electrónico o con Matlab.) Solución La matriz N y el vector de términos independientes correspondiente son 112 112 N= l':9 -tal8/9 4/9 -115 3/5 1 2/5 ' b = [-3/2 15/9 10/5 2]T O 1 Descomposición de N L = l'~9 O O -1/5 3/5 O 1 Primera iteración O O O O O 1 n 1/2 O O O 1/2 8/9 O O - 1I2 l4/9 2/5 O Obtención de x(l) a partir del vector inicial x (O) = [O OOOF y empleando la ecuación 3.108. Cálculo de xl, esto es, i = 1 Yk + 1 = 1 o 4 xl = xp + 1.3[ bl -L II J' xl - x O - L U¡J' xJO ] pi J I j=2 Obsérvese que en la primera sumatoria el valorinicial (j=1) es mayor que el valor final (O); la convención en estos casos es que tal sumatoria no se realiza. Por tanto, Xl = O+ l.3[-3/2 - O- 1/2(0) - 112(0) + 1/2(0)] = - 1.95 Cálculo de xi, esto es, i = 2 Yk+1 = 1 1 4 X2 1 = x2 0 + 1.3 [ b2 -L 12J' xl - X 0_ L U 2J ' x/ ] pi J 2 j=3 = O+ l.3 [15/9 - 1/9(-1.95) - O- 8/9(0) - 4/9(0)] =2.4483 Cálculo de xj, esto es, i = 3 Yk+1 = 1 = O+ l.3 [10/5 - (-115)(-1.95) - (3/5) (2.4483) - O- 2/5(0)] =0.1833 • Burden, R.L. y Faires, J.D, Análisis numérico, Grupo Editorial Iberoamérica (1985), pp. 475,
  • 232. 220 Métodos numéricos aplicados a la ingeniería Cálculo de xJ, esto es, i = 4 Yk+1 = 1 3 xJ = x2 + 1.3 [ b4 -L J=I = O + 1.3 [2 - 0(-1.95) - 1(2.4483) - 0(0.1833) - O] = - 0.5828 Cálculo de Ix(l) - x(O) I = di d - )(xl- xO)2+(XI- xO)2+(XI- xO)2+(XI_ xO)2 1- 1 I 2 2 3 3 4 4 = )(-1.95)2 + (2.4483)2 + (0.1833)2 + (-0.5828)2 = 3.1891 Los valores mostrados en la tabla 3.5 se encuentran continuando las iteraciones. Tabla 3.5 Resultados obtenidos con w = 1.3. k Xk x k Xk xk I x(k+l) _ x(k) I 1 2 3 4 O 0.0000 0.0000 0.0000 0.0000 1 -1.9500 2.4483 0.1833 -0.5828 3.1891 2 -3.4544 2.0561 0.3462 0.1020 1.7066 3 -2.4089 1.4388 0.6945 0.6989 1.3971 4 -2.1597 0.8406 0.8110 1.2976 0.8898 5 -1.5322 0.4489 0.9334 1.6271 0.8190 6 -1.3312 0.2055 0.9674 1.8447 0.3848 7 -1.1140 0.0822 0.9968 1.9397 0.2689 8 -1.0563 0.0220 1.0005 1.9895 0.0972 9 -1.0046 -0.0004 1.0045 2.0037 0.0583 10 -0.9988 -0.0074 1.0028 2.0084 0.0103 11 -0.9919 -0.0070 1.0024 2.0066 0.0072 Para realizar los cálculos puede usarse el siguiente guión de Matlab: Ta %Método SOR clear A=[2 1 1 -1; 1 9 8 4; -1 3 5 2; O 1 O 1J b=[-3 15 10 2J for i=1:4 N(i, :)=A(i, :)/A(i,i); b(i)=b(i) /A(i,i); end N U=triu (N) L=tril (N) XO=zeros (1,4) ; X=XO; w=1.3; K=O;Norma=l; fprintf(' K X(1) X(2) X(3) X(4) Norman') whi1e Norma>O.Ol 2 3 4 5 6
  • 233. Matrices y sistemas de ecuaciones lin eales 221 k=k+1; fprintf( '%2s' ,k) for i=1:4 sumaL=O; sumaU=O; for j=1:4 if i-=j sumaL=sumaL+L (i, j) *X (j) ; sumaU=sumaU+U(i,j)':'XO (j); end end X (i) =X (i) +w* (b (i) -sumaL-X (i) -sumaU) ; fprintf( '%10. 4f' ,X(i)) end Norma=norm(XO-X); fprintf ( '%10. 4fn' ,Norma) XO=X; if K > 17 disp ('No se alcanzó la convergencia') break end end Al comparar estos resultados con los obtenidos en la tabla 3.4 (método de Gauss-Seidel aplicado al sistema que aquí se resuelve), se observa que la convergencia es acelerada y los cálculos se reducen a la mitad. COMPARACiÓN DE LOS MÉTODOS DIRECTOS E ITERATIVOS Una parte importante el análisis numérico es conocer las características (ventajas y des- ventajas) de los métodos numéricos básicos que resuelven una familia de problemas (en este caso A x = b), para así elegir el algoritmo más adecuado para cada problema. A continuación se presentan las circunstancias donde pudiera verse como ventajosa la elección de un método iterativo y también a qué se renuncia co.n esta decisión. Ventajas Tabla 3.6 Ventajas y desventajas de los métodos iterativos comparados con los métodos directos. Desventajas l. Probablemente más eficientes que los directos para sistemas de orden muy alto. 2. Más simples de programar. 3. Puede aprovecharse una aproximación a la solución, si tal aproximación existe. 4. Se obtienen fácilmente aproximaciones burdas de la solución. 5. Son menos sensibles a los errores de redondeo (valio- so en sistemas mal condicionados). 6. Se requiere menos memoria de máquina. Generalmen- te las necesidades de memoria son proporcionales al orden de la matriz. 1. Si se tienen varios sistemas que comparten la matriz coeficiente, esto no representará ahorro de cálculos ni tiempo de máquina, ya que por cada vector a la dere- cha de A tendrá que aplicarse el método seleccionado. 2. Aun cuando la convergencia esté asegurada, puede ser lenta y, por tanto, los cálculos requeridos para ob- tener una solución particular no son predecibles. 3. El tiempo de máquina y la exactitud del resultado de- penden del criterio de convergencia. 4. Si la convergencia es lenta, los resultados deben in- terpretarse con cautela. 5. No se tiene ventaja particular alguna (tiempo de má- quina por iteración) si la matriz coeficiente es simé- trica. 6. No se obtiene A-I ni det A . • Matrices y sistemas de ecuaciones lineales 221 k=k+1 ; fprin tf( ' %2s ' , k) f or i=1 : 4 sumaL=O ; suma U=O ; for j =1 : 4 if i-=j sumaL=sumaL+L (i, j ) *X (j ) ; sumaU=sumaU+U(i , j )*XO (j ); end end X (i ) =X (i ) +W-' (b (i ) -sumaL- X (i ) - sumaU) ; f printf( ' %10. 4f ' ,X(i)) end Norma=norm (XO-X); f printf( ' %10 . 4fn ' , Norma ) XO=X; if K > 17 di sp ('No se alcanzó la convergencia') b reak end end Al comparar estos resultados con los obtenidos en la tabla 3.4 (método de Gauss-Seidel aplicado al sistema que aquÍ se resuelve), se observa que la convergencia es acelerada y los cálculos se reducen a la mitad. COMPARACiÓN DE LOS MÉTODOS DIRECTOS E ITERATIVOS Una parte importante el análisis numérico es conocer las características (ventajas y des- ventajas) de los métodos numéricos básicos que resuelven una familia de problemas (en este caso A x =b), para así elegir el algoritmo más adecuado para cada problema. A continuación se presentan las circunstancias donde pudiera verse como ventajosa la elección de un método iterativo y también a qué se renuncia co.n esta decisión. Tabla 3.6 Ventajas y desventajas de los métodos iterativos comparados con los métodos directos. Ventajas l. Probablemente más eficientes que los directos para sistemas de orden muy alto. 2. Más simples de programar. 3. Puede aprovecharse una aproximación a la solución, si tal aproximación existe. 4. Se obtienen fácilmente aproximaciones burdas de la solución. 5. Son menos sensibles a los eITores de redondeo (valio- so en sistemas mal condicionados). 6. Se requiere menos memoria de máquina. Generalmen- te las necesidades de memoria son proporcionales al orden de la matriz. Desventajas 1. Si se tienen varios sistemas que comparten la matriz coeficiente, esto no representará ahorro de cálculos ni tiempo de máquina, ya que por cada vector a la dere- cha de A tendrá que aplicarse el método seleccionado. 2. Aun cuando la convergencia esté asegurada, puede ser lenta y, por tanto, los cálculos requeridos para ob- tener una solución particular no son predecibles. 3. El tiempo de máquina y la exactitud del resultado de- penden del criterio de convergencia. 4. Si la convergencia es lenta, los resultados debei] in- terpretarse con cautela. 5. No se tiene ventaja particular alguna (tiempo de má- quina por iteración) si la matriz coeficiente es simé- trica. 6. No se obtiene A- I ni det A.
  • 234. 222 Métodos numéricos aplicados a la ingeniería 3.6 Valores y vectores propios Si A es una matriz de números reales de orden n e 1 la matriz identidad de orden n, el po- linomio definido por peA) = det(A - Al) (3.110) i .1 se llama el polinomio característico de A. Es fácil ver que p es un polinomio de n-ésimo grado en A con coeficientes reales," y que, por tanto, la ecuación peA) = O (3.111) tiene n raíces, de las cuales algunas suelen ser complejas. Los ceros de esta ecuación, co- nocidos como valores característicos o propios de A, están ligados con la solución del sistema A x = b. Por ejemplo, el método de Gauss-Seidel, independientemente del vector inicial que se emplee, converge a la solución de A x = b si y sólo si los valores propios de B son todos menores de uno en valor absoluto." f' " ,; ""1 'Ejemplo 3.41 Dada la siguiente matriz, encuentre sus valores propios Ejen [~ -9 nA= -4 -1 Solución Se forma A - Al A-Al= [~ -9 ~l [~ O ~][T -9 3~A]-4 -A 1 -4-A -1 O -1 Se obtiene el determinante de este último arreglo det (A - Al) = (4 - A)(-4 - A)(3 - A) -4 - 54 - (2)(-4 - A)(l) - (-9)(2)(3 - A) - (6)(-1) (4 - A) Al desarrollar e igualar con cero se obtiene -A3 +3A2 -6A - 20 = O, el polinomio característico de A, cuyos ceros Al' ~, A3 son los valores buscados. El hecho de ser un polinomio cúbico con coeficientes reales garantiza una raíz real por lo menos. Con el método de Newton-Raphson y un valor inicial de -2 se llega a Al = -1.53968 El polinomio se degrada por división sintética I -1 -1.53968 . 3 1.53968 -6 -6.98965 -20 20 -1 4.53968 -12.98965 O 'Véase problema 3.59. ** J. N. Franklin, Matrix Theory. Prentice Hall, 1968.
  • 235. po- 10) ,'y 11) co- del tor s de por Matrices y sistemas de ecuaciones lineales 223 El polinomio degradado es: - A} + 4.53968A - 12.98965 = O, de donde, por aplicación de la fórmula cuadrática se tiene ~ = 2.26984 + 2.799553 i = 2.26984 - 2.799553 i Una vez obtenidos los valores propios de una matriz A de orden n, los vectores x "# O que resuelven el sistema A x = A¡ x, i = 1,2, ... , n (3.112) (A - Al) x = O se denominan vectores propios de A correspondientes a A¡. Como det(A - A¡l) = OYel sis- tema es homogéneo, se tiene un número infinito de soluciones para cada A¡. Ejemplo 3.42 Encuentre los vectores propios de la matriz del ejemplo 3.41, correspondientes al valor propio A¡ = -1.53968. Al resolver el sistema por alguno de los métodos de eliminaciónSolución [ 4 - (-1.53968) - 9 2] (A-A¡I)x= 2 -4-(-1.53968) 6 1 -1 3-(-1.53968) resulta una matriz triangular superior, por lo menos con una fila de ceros.* Para asegurar que esa(s) fila(s) de ceros sea(n) la(s) última(s) y que la sub matriz no singular resultante esté lo mejor condicionada posible, se usa pivoteo total (intercambio de filas y columnas) y escalamiento. Sea entonces la matriz por triangularizar =B -9 - 2.46032 -1 Nótese que el vector de términos independientes no se emplea porque todos sus componen- tes son cero. En lugar de emplear la norma enclideana para el escalamiento, se usará ahora la si- guiente norma, definida para un vector cualquiera y = [y¡, Y2"" Yn F, como y = I Y I I + I Y2 I + .,. + I Y" I ya que es más sencilla de calcular que la eucJideana y que para la primera, segunda y ter- cera filas de A es, respectivamente, [ 16.53968] 10.46032 6.53968 • Pizar, M. S. Numerical Computing and Mathematical Analysis. S.R.A. (1975) Matrices y sistemas de ecuaciones lineales 223 El polinomio degradado es: - A} + 4.53968A - 12.98965 = O, de donde, por aplicación de la fórmula cuadrática se tiene ~ = 2.26984 + 2.799553 i A3 = 2.26984 - 2.799553 i Una vez obtenidos los valores propios de una matriz A de orden n, los vectores x -:;:. O que resuelven el sistema A x = A¡ x, i = 1,2,.. . , n (A - A 1) x = O (3.112) se denominan vectores propios de A correspondientes a A¡. Como det(A - A¡I) =OYel sis- tema es homogéneo, se tiene un número infinito de soluciones para cada A¡. Ejemplo 3.42 Encuentre los vectores propios de la matriz del ejemplo 3.41, correspondientes al valor propio Al =-1.53968. Solución Al resolver el sistema por alguno de los métodos de eliminación [ 4 - (- 1.53968) - 9 (A - Al!) x = 2 - 4 - (- 1.53968) 1 -1 3-C-1.t968l] resulta una matriz triangular superior, por lo menos con una fila de ceros.* Para asegurar que esa(s) fila(s) de ceros sea(n) la(s) última(s) y que la submatriz no singular resultante esté lo mejor condicionada posible, se usa pivoteo total (intercambio de filas y columnas) y escalamiento. Sea entonces la matriz por triangularizar -9 - 2.46032 = B - 1 Nótese que el vector de términos independientes no se emplea porque todos sus componen- tes son cero. En lugar de emplear la norma enclideana para el escalamiento, se usará ahora la si- guiente norma, definida para un vector cualquiera y = [yl' Y2" " Y" ]T, como y = I YI I + IY2 I + .,. + I YI! I ya que es más sencilla de calcular que la eucIideana y que para la primera, segunda y ter- cera filas de A es, respectivamente, [ 16.53968] 10.46032 6.53968 • Pizar, M. S. Numerical Computing and Mathematical Analysis. S.R.A. (1975)
  • 236. 224 Métodos numéricos aplicados a la ingeniería Cada fila de la matriz B se divide entre su factor de escalamiento y se obtiene: [ 0.33493 B' = 0.19120 0.15291 -0.54415 -0.23520 -0.15291 0.12092] 0.57360 0.69417 En el pivoteo total es necesario registrar los cambios de columnas que se verifican, ya que éstos afectan el orden de las incógnitas. Para ello se utilizará un vector q, en donde apare- cen como elementos las columnas. Al principlo están en orden natural y se tiene: Se busca el elemento de máximo valor absoluto de B'. En este caso es b' 33 = 0.69417. Se intercambian las filas 1 y 3, Y las columnas 1 y 3 para llevar este elemento a la posición pivote (1, 1), teniendo cuidado de registrar los intercambios de columnas en q. Los resul- tados son: [ 0.69417 -0.15291 B" = 0.57360 -0.23520 0.12092 -0.54415 0.15291] 0.19120 , 0.33493 Se eliminan los elementos de la primera columna que están debajo del elemento pivote, con lo cual se produce: [ 0.69417 B'" = 0.0 0.0 ~ -0.15291 -0.10885 -0.51751 0.15291 J 0.06485 0.30830 Se busca el elemento de máximo valor absoluto en las dos últimas filas; resulta ser b'" 3 2 = -0.51751. Se intercambian las filas 2 y 3, y con esto se lleva a este elemento a la posición pivote (2, 2). Los resultados son: [ 0.69417 B/v = 0.0 0.0 -0.15291 -0.51751 -0.10885 y q = [ ~] , y, que no hubo intercambio de columnas 0.15291] 0.30830 0.06485 Se eliminan los elementos de la segunda columna que están debajo del elemento pivote y se produce [ 0.69417 BV = 0.00000 0.00000 -0.15291 -0.51751 0.00000 0.15291] 0.30830 -0.00000 una matriz triangularizada con una fila de ceros, la última como se planeó. La submatriz no singular de la que se habló al principio está formada por los elementos (1, 1), (1, 2), (2, 1) Y 224 Métodos numéricos aplicados a la ingeniería Cada fila de la matriz B se divide entre su factor de escalamiento y se obtiene: [ 0.33493 B' = 0.19120 0.15291 -0.54415 -0.23520 -0.15291 0.12092] 0.57360 0.69417 En el pivoteo total es necesario registrar los cambios de columnas que se verifican, ya que éstos afectan el orden de las incógnitas. Para ello se utilizará un vector q, en donde apare- cen como elementos las columnas. Al principIo están en orden natural y se tiene: q=U] Se busca el elemento de máximo valor absoluto de B' . En este caso es b'3,3 =0.69417. Se intercambian las filas 1 y 3, Ylas columnas 1 y 3 para llevar este elemento a la posición pivote (1, 1), teniendo cuidado de registrar los intercambios de columnas en q. Los resul- tados son: [ 0.69417 -0.15291 B" = 0.57360 -0.23520 0.12092 -0.54415 0.15291~ 0.19120 , 0.33493 Se eliminan los elementos de la primera columna que están debajo del elemento pivote, con lo cual se produce: [ 0.69417 B"' = 0.0 0.0 ~ -0.15291 -0.10885 -0.51751 0.15291 J 0.06485 0.30830 Se busca el elemento de máximo valor absoluto en las dos últimas filas; resulta ser b'" 3,2 = - 0.51751. Se intercambian las filas 2 y 3, Ycon esto se lleva a este elemento a la posición pivote (2, 2). Los resultados son: [ 0.69417 B/v = 0.0 0.0 -0.15291 -0.51751 -0.10885 y q = [ ~],ya qne no hnbo mtecc,,",bio de column"'. 0.15291] 0.30830 0.06485 Se eliminan los elementos de la segunda columna que están debajo del elemento pivote y se produce [ 0.69417 BV = 0.00000 0.00000 -0.15291 -0.51751 0.00000 0.15291] 0.30830 -0.00000 una matriz triangulruizada con una fila de ceros, la última como se planeó. La submatriz no singular de la que se habló al principio está formada por los elementos (1, 1), (l, 2), (2, 1) Y
  • 237. ue e- Se ión ul- te, ey no ) y Matrices y sistemas de ecuaciones lineales 225 (2,2). Al escribir el sistema en términos de XI' x2 y x3 ' y considerar los cambios de colum- nas que hubo, se tiene 0.69417 x3 - 0.15291 x2 + 0.15291 xI = O 0.00000 x3 - 0.51751 x2 + 0.30830 Xl = O Un sistema homogéneo de dos ecuaciones en tres incógnitas, cuyas infinitas soluciones pueden obtenerse en términos de alguna de las incógnitas. El sistema se resuelve en térmi- nos de XI 0.69417x3 - 0.15291 x2 = -0.15291 XI 0.00000 x3 - 0.51751 x2 = -0.30830 XI de donde X2 = 0.59573 XI x3 = -0.08905 XI Se da un valor particular a xl' por ejemplo XI = 1,y resulta = [ ~.59753] -0.08905 uno de los infinitos vectores propios de A correspondientes a Al' Comprobación Ya que por definición A x = Al X [~ ~][ ~.59573] - 0.08905 = -1.53968 [, ~.59573] -0.08905 -9 -4 -1 MÉTODO DE LAS POTENCIAS El método de las potencias permite calcular el valor y el vector característicos dominantes de una matriz A de orden n, cuando dicha matriz tiene n vectores característicos linealmen- te independientes: vI' v2' ... VII Y un valor característico A¡ estrictamente dominante en magnitud I Al I > I Az I ~ I ~ I ~ ... ~ I AIl I Se muestra a continuación dicho método. Dada la independencia lineal de los vectores característicos, cualquier vector V de n componentes puede expresarse como una combinación lineal de ellos: Multiplicando la ecuación anterior por la izquierda por A se tiene: Av = alAv¡ + a2Av2 + ... + a,,Avn = al AIVJ + a2A2v2 + ... + anAnVn Matrices y sistemas de ecuaciones lineales 225 (2,2). Al escribir el sistema en términos de xI' x2 y x3' y considerar los cambios de colum- nas que hubo, se tiene 0.69417 x3 - 0.15291 x2 + 0.15291 xl = O 0.00000 x3 - 0.51751 x2 + 0.30830 Xl =O Un sistema homogéneo de dos ecuaciones en tres incógnitas, cuyas infinitas soluciones pueden obtenerse en términos de alguna de las incógnitas. El sistema se resuelve en térmi- nos de Xl de donde 0.69417x3 - 0.15291 x2 =-0.15291 Xl 0.00000 x3 - 0.51751 x2 = -0.30830 XI X2 = 0.59573 Xl X3= -0.08905 XI Se da un valor particular a xl' por ejemplo XI =1, y resulta = [~.59753]-0.08905 uno de los infinitos vectores propios de A correspondientes a Al ' Comprobación Ya que por definición A x = Al X [~ -9 -4 -1 [ ~.59573]- 0.08905 =-1.53968 [ , ~.59573]- 0.08905 MÉTODO DE LAS POTENCIAS El método de las potencias permite calcular el valor y el vector característicos dominantes de una matriz A de orden n, cuando dicha matriz tiene n vectores característicos linealmen- te independientes: vI' v2' .. . VII Y un valor característico Al estrictamente dominante en magnitud I A.I I > I íLz I ~ I ~ I ~ ... ~ I An I Se muestra a continuación dicho método. Dada la independencia lineal de los vectores característicos, cualquier vector V de n componentes puede expresarse como una combinación lineal de ellos: Multiplicando la ecuación anterior por la izquierda por A se tiene: Av = alAvl + a2Av2 + ... + a,,Avn = al A.IVI + a2A2V 2 + ... + anAnVn
  • 238. 226 Métodos numéricos aplicados a la ingeniería Multiplicando repetidamente por A se llega a Akv = alA/vI + a2Alv2 + ... + anA/Vn y factorizando Akv = Alk [ alvl + a2 ( ~ )2 + ... + «.(~~)n1 y como Al es el mayor, todos los términos dentro del paréntesis rectangular tienden a ce- ro cuando k tiende a 00, excepto el primer término (si al *- O). Para k grande Akv "" A/al VI' Al tomar la relación de cualesquiera componentes correspondientes a Akv y Ak+IV, se obtiene una sucesión de valores convergentes a Al' ya que A/+lalvl . ---",-,j ""A¡ (3.113) A}a¡v¡,j Además, la sucesión AI-kA kV convergirá al vector característico V I multiplicado por a t Ejemplo 3.43 Encuentre el valor característico y el vector característico dominantes de la matriz coe- ficiente del siguiente sistema, usando el método de las potencias Solución Como generalmente no se conocen los vectores característicos, sino que ése es el propósi- to, se empieza a iterar con v = el = [1 O O]T. Primera iteración Primero se calcula el producto A v Ahora se calcula el producto A2 V Se calcula el primero de los valores de la ecuación 3.113, utilizando el primer componen- te de ambos productos Al,l "" 5/1 = 5 Segunda iteración Se calcula el producto A3 V 226 Métodos numéricos aplicados a la ingeniería Multiplicando repetidamente por A se llega a Akv = alA/vI + a2Alv2 + ... + anA/Vn y factorizando Akv = A¡k [ alv¡ + a2 ( ~ )2+ ... + an (~~ )n1 y como Al es el mayor, todos los términos dentro del paréntesis rectangular tienden a ce- ro cuando k tiende a 00, excepto el primer término (si a¡ *- O). Para k grande Akv "" A/al VI' Al tomar la relación de cualesquiera componentes correspondientes a Akv y Ak+IV, se obtiene una sucesión de valores convergentes a Al' ya que 1 k+1 V /,¡ al ¡,j ----,--------"'--""A¡ A}a¡v¡,j (3.113) Además, la sucesión Al-kAkV convergirá al vector característico V ¡ multiplicado por al' IEjemplo 3.4~ Encuentre el valor característico y el vector característico dominantes de la matriz coe- ficiente del siguiente sistema, usando el método de las potencias Solución Como generalmente no se conocen los vectores característicos, sino que ése es el propósi- to, se empieza a iterar con V =el =[1 OO]T. Primera iteración Primero se calcula el producto A v Ahora se calcula el producto A2 V Se calcula el primero de los valores de la ecuación 3.113, utilizando el primer componen- te de ambos productos Segunda iteración Se calcula el producto A3 V
  • 239. e- VI' se 3) si- en- Matrices y sistemas de ecuaciones lineales 227 El nuevo valor de la ecuación 3.113 es: AI,2 "" 13/5 = 2.6 Al continuar las iteraciones se obtiene: k 1 2 3 4 5 6 7 8 9 10 5.00000 2.60000 3.15385 2.95122 3.01653 2.99452 3.00183 2.99939 3.00020 2.99993 El proceso converge al valor propio dominante A1 = 3. El lector puede repetir el proceso, usando la segunda componente de cada producto Ak v. Para encontrar uno de los vectores propios correspondientes a Al = 3, se usa la fórmu- la A¡k Akv, resultando VI = [9841.7 9841.3 O]T, que normalizado da VI = [1 1 O]T. Debido a que Ak produce, por lo general, valores muy grandes o muy pequeños, conviene normalizar los productos Ak ven cada iteración, dividiendo cada elemento del vector en- tre el elemento de máximo valor absoluto de dicho vector. Los cálculos pueden realizarse con el siguiente guión de Matlab, en el que se obtiene la ecuación 3.113 con el elemento de máximo valor del segundo producto Ak v obtenido en cada iteración. A=[l 2 0;2 1 0;0 O -1}; v= [1; O; O}; Dist=l;R=O Eps=le-5;K=0; while Dist>Eps K=K+1; X=A-N'v; Y=A- (K+1)*v; [Z,I}=max(Y) ; Rl=Y(I)/X(I) ; fprintf(' %2d %10_5fn' ,K,R) Dist=abs (Rl-R) ; R=Rl; end v1=A-¡0'v/R Matrices y sistemas de ecuaciones lineales 227 El nuevo valor de la ecuación 3.113 es: AI.2 "'" 13/5 = 2.6 Al continuar las iteraciones se obtiene: k A.t,k 1 5.00000 2 2.60000 3 3.15385 4 2.95122 5 3.01653 6 2.99452 7 3.00183 8 2.99939 9 3.00020 10 2.99993 El proceso converge al valor propio dominante AJ = 3. El lector puede repetir el proceso, usando la segunda componente de cada producto Ak v. Para encontrar uno de los vectores propios correspondientes a Al =3, se usa la fórmu- la A¡kAkv, resultando V I =[9841.7 9841.3 O]T, que normalizado da v I =[1 1 O]T. Debido a que Ak produce, por lo general, valores muy grandes o muy pequeños, conviene normalizar los productos Ak v en cada iteración, dividiendo cada elemento del vector en- tre el elemento de máximo valor absoluto de dicho vector. Los cálculos pueden realizarse con el siguiente guión de Matlab, en el que se obtiene la ecuación 3.113 con el elemento de máximo valor del segundo producto Ak v obtenido en cada iteración. A= [l 2 0; 2 1 0; 0 O -1} ; v= [1 ; O; O} ; Dis t=l ; R=O Eps=le-5; K=0; while Dist>Eps K=K+1 ; X=A-K'v; Y=A - (K+1)*v ; [Z , I}=max(Y) ; Rl=Y (I ) / X(I) ; fprintf (' %2d %10. 5fn ' , K, R) Dist=abs (Rl - R) ; R=Rl ; end v1=A -i0'v/R
  • 240. 228 Métodos numéri cos aplicados a la ingeniería Ejercicios ~ 3.1 En una columna de cinco platos, se requiere absorber benceno contenido en una corriente de gas V, con un aceite L que circula a contracorriente del gas. Considérese que el benceno trans- ferido no altera sustancialmente el número de moles de V y L fluyendo a contracorriente, que la relación de equilibrio está dada por la ley de Henry (y = mx) y que la columna opera a ré- gimen permanente. Calcule la composición del benceno en cada plato. Datos: V = 100 moles/min; L = 500 moles/mino Yo = 0.09 fracción molar de benceno en V. X o = 0.0 fracción molar de benceno en L (el aceite entra por el domo sin ben- ceno). m = 0.12 Solución Los balances de materia para el benceno en cada plato son (véase Fig. 3.13). V •.. Ys L--- l X o , Fig. 3.13 Columna de absorción de cinco platos. Yo 228 Ejercicios ~ 3.1 Métodos numéricos aplicados a la ingeniería En una columna de cinco platos, se requiere absorber benceno contenido en una cOlTÍente de gas V, con un aceite L que circula a contracorriente del gas. Considérese que el benceno trans- ferido no altera sustancialmente el número de moles de V y L fluyendo a contracorriente, que la relación de equilibrio está dada por la ley de Henry (y =mx) y que la columna opera a ré- gimen permanente. Calcule la composición del benceno en cada plato. Datos: V = 100 moles/min; L = 500 moles/mino Yo = 0.09 fracción molar de benceno en V. X o= 0.0 fracción molar de benceno en L (el aceite entra por el domo sin ben- ceno). m = 0.12 Solución Los balances de materia para el benceno en cada plato son (véase Fig. 3.13). Fig. 3.13 Columna de absorción de cinco platos. L- ------,¡ X o , ~Yo V ... Ys I ~X I
  • 241. Matrices y sistemas de ecuaciones lineales 229 Plato Balance de benceno ede 5 L (xo - xs) + V (Y4 - Ys) = O s- 4 L (xs - x4) + V (Y3 - Y4) = O que 3 L (x4 - x3) + V (Y2 - Y3) = Oaré- 2 L (x3 - x2) + V (YI - Y2) = O L (x2 - Xl) + V (yo - Y¡) = O ben- Al sustituir la información que se tiene, las consideraciones hechas y rearreglando las ecuaciones, se llega a: 512 X s + 500 X s + 12 XI + 512 XI O O O O 9 12 x3 512 x3 + 500 x3 12 x2 512 x2 500 x2 Con el PROGRAMA 3.2 del CD, se obtienen los siguientes resultados X 2 = 4.32 X 10--4, X s = 5.8286 X 10-9, Xl = 0.018, x4 = 2.4869 X 10-7, ~~ 3.2 También pueden usarse las instrucciones en Matlab dadas en el ejemplo 3.28, con los cam- bios apropiados en los datos. Supóngase que se tiene una estructura cuadrada. A fin de analizarla se forma una malla imaginaria sobre dicha estructura, como se muestra en la figura siguiente. o o ) o o ) Figura 3.14 Estructura cuadrada. y se numeran los nodos, por ejemplo, como se muestra a continuación. 4 8 12 16 3 7 11 15 2 6 10 14 1 5 9 13 Cada nodo se identifica con a; por ejemplo, el 4 con al ' el 6 con a32, etc., y así quedat.] " formada una matriz A representativa de la estructura.
  • 242. 230 Métodos numéricos aplicados a la ingeniería Ciertas consideraciones de ingeniería determinan que ai,j *- O siempre que los nadas i y j sean vecinos o adyacentes." Para aclararlo, hay que observar que al nodo 5 le corres- ponde a4,2' Ycomo los nadas 4 y 2 no son vecinos a4,2 = O; al 11 en cambio le correspon- de a23 y como 2 y 3 son vecinos, a23 *- O. Por último a33 *- O, ya que el nodo 3 puede considerarse vecino consigo mismo. ' , Estas consideraciones generan matrices o sistemas dispersos o frecuentemente ban- deados. Estos sistemas suelen ser muy grandes, ya que las mallas se construyen con un gran número de nadas. En la aplicación del método de las rigideces," para calcular los desplazamientos en los nadas de una estructurada dada al aplicarse una carga en uno de los nadas, se obtiene el siguiente sistema de ecuaciones: 3.01687 0.00000 3.3750 -3.0000 0.00000 0.0000 dxB 1600 0.00000 3.01687 3.3750 0.0000 -0.01687 3.3750 dyB 0.00 105 3.37500 3.37500 900.00 0.0000 -3.37500 450.00 eB 0.00 ¡p"" -3.00000 0.00000 0.0000 3.0400 0.00000 6.0000 dxe 0.00 II 0.00000 -0.01687 -3.3750 0.0000 4.01687 -3.3750 dye 0.00 0.00000 3.37500 450.00 6.0000 -3.37500 2100.0 ee 0.00 donde la matriz coeficiente es conocida como la matriz de nadas, dB = [dxB dyb eB]T y de = [dxe dye edT son los vectores de desplazamiento de los nadas By C, respectivamente. Re- suelva dicho sistema. Solución La solución obtenida con el PROGRAMA 3.2 del CD o con Matlab, se da a continuación dxB = 0.47185; dxc = 0.46776; dyB = 0.00259; dyC = -0.00194; eB = -0.00125 ec = -0.00108 ~ 3.3 Determine las concentraciones molares de una mezcla de cinco componentes en solución a partir de los siguientes datos espectrofotométricos. Longitud Absorbancia molar del componente Absorbancia de onda j total 1 2 3 4 5 observada 1 98 9 2 1 0.5 0.1100 2 11 118 9 4 0.88 0.2235 3 27 27 85 8 2 0.2800 4 1 3 17 142 25 0.3000 5 2 4 7 17 118 0.1400 Asúmase que la longitud de la trayectoria óptica es unitaria y que el solvente no absorbe a estas longitudes de onda. Solución Si se considera que se cumple la ley de Beer, entonces a una longitud de onda dada, i , El nodo 7, por ejemplo, tiene como vecinos a los nadas 3, 6, 8 Y 11. " Carlos Magdalena. Análisis matricial de estructuras reticulares. Edición mimeográfica. ES lA, lPN.
  • 243. Matrices y sistemas de ecuaciones lineales 231 donde: ATOTi es la absorbancia total observada a la longitud de onda i. c¡.j es la absorbancia molar del componente j a la longitud de onda i. ej es la concentración molar del componente j en la mezcla. Al sustituir los valores de la tabla se obtiene 98 el + 9 e, + 2 e3 + c4 + 0.5 es 0.1100 n 11 el + 118 e2 + 9 e3 + 4 e, + 0.88 es 0.2235 e 27 el + 27 e2 + 85 e, + 8 e, + 2 es 0.2800 el + 3 e2 + 17 e3 + 142 C, + 25 es 0.3000 z c, + 4 e2 + 7 e3 + 17 e, + 118 es 0.1400 Un sistema de ecuaciones lineales con matriz coeficiente dominante. Esto sugiere resolver el sistema con el método de Gauss-Seidel. El PROGRAMA 3.3 del Cl) utiliza el método de Gauss-Seidel para resolver un sistema de ecuaciones lineales. Este programa se utilizó con el vector cero como vector inicial, por la relativa cercanía de cero con cada uno de los valores del lado derecho del sistema. Los resultados obtenidos son e- el = 0.000910 C, = 0.001664 e2 = 0.001569 es= 0.000740 W1~ 3.4 Determine la intensidad de corriente en cada rama del circuito que se muestra en la figu- ra 3.15. in Solución Se asigna un sentido y una letra a cada magnitud desconocida; los sentidos supuestos son enteramente arbitrarios. Hay que observar que la intensidad de corriente en R3, RI YEl es la misma y, por consiguiente, sólo se requiere una letra. Lo mismo ocurre para la intensi- dad de corriente en R2 , E2 Y R6. Los nodo s (puntos de la red en los cuales se unen tres o más conductores) se designan con las letras a, b, e, d. e,», E2 ,r2 R¡ a R2 i¡ ___ i3 --- i,l-- Es,rs R3 b R4 Rs d R6 ~i¡ i4--- e •• is --- i3 Figura 3.15 Circuito eléctrico con resistencias y fuentes de poder. i6 ---
  • 244. 232 Métodos numé ricos aplicados a la ingeniería Aplicación de la regla de los nodos de Kirchhoff a tres nadas cualesquiera Nodo L i =0 a il + i2 - i3 =0 b - il - i4 - i6 =0 C i4 + is - i2 =0 Si bien es cierto que hay un nodo más, el d, la aplicación de la regla daría una ecuación li- nealmente dependiente de las otras tres, esto es: Nodo d ecuación que se obtiene sumando las tres primeras; por ello resulta redundante y en gene- ral se aplica dicha regla a n-l nadas solamente. En la figura 3.16 se representa el circuito cortado en mallas. Considérese en cada ma- lla como positivo el sentido de las agujas del reloj. La regla de las mallas de Kirchhoff (L E, = L ik R, ) proporciona las siguientes ecuaciones: Malla 1 11 III L Ek = L ik Rk -E¡ - Es = ilRI + i¡ r¡ - i2 rs - i4 R4 + il R3 E2 + Es = i3r2 + i3 R2 + i3 R6 + is R, + i2 rs E4 = i4R4 - is Rs - i6 r4 - i6 R7 ~ ---R, El'r, E2,r2 R2 i, --- ,:IE,>', ar:i i3 --- • •R3 R4 Rs R6 e e ~ i, b i4 --- ~ is d ~ i3 R4 e Rs d b i4 ___ ~ is Figura 3.16 Circuito de la figura 3.15 cortado en mallas. Se tienen ecuaciones independientes, donde conocidas las Rk' las Ek y las rk' se pueden calcular las seis intensidades de corriente resolviendo el sistema. Para los siguientes da- tos, calcule las intensidades de corriente.
  • 245. Matrices y sistemas de ecuaciones lineales 233 k Ek (volts) r, (Q) Rk(Q) 1 12 0.1 25 2 10 0.5 40 3 16 n li- 4 12 0.5 20 5 24 0.2 9 6 4 7 20 Con el PROGRAMA 3.2 del CD se obtienen los siguientes valores para las intensidades de corriente k 1 2 3 4 5 6 -0.53811 0.65531.1934 0.68226 0.51115 -0.14415 3.5 Con los datos del diagrama siguiente (donde los porcentajes están dados en peso), encuen- tre posibles valores de las corrientes M" M2, M3 YM4. M {83% etanol , 17% agua Tanque de mezclado { 58% etanol 1----· M4 21 % metanol 21% agua M {61% metanol 2 39% agua { 24% metanol M3 55% etanol 21% agua Solución Mediante balances de materia por componente y global, se tiene Componente Balance de materia Etanol 0.83 M, + + 0.55 M3 0.58 M4 O Metanol 0.61 M2 + 0.24 M3 0.21 M4 O Agua 0.17 M, + 0.39 M2 + 0.21 M3 0.21 M4 O Global M· + M2 + M3 M4 O, l. Hay que observar que sólo se tienen tres ecuaciones linealmente independientes, pues la ecuación del balance global de materia es la suma de las otras tres. Por ser el sistema ho- mogéneo es consistente, y como el rango de la matriz coeficiente es menor que el número de incógnitas, el sistema tiene un número infinito de soluciones. Fijando una base de cálcu- lo, por ejemplo M4 = 100Kg, se obtiene el sistema:
  • 246. 234 Métodos numéricos aplicados a la ingeniería 0.83 M¡ O.17M¡ 0.61 M2 + 0.39 M2 + 0.55 M3 + 0.24 M3 + 0.21 M3 58 21 21 cuya solución se deja al lector, utilizando alguno de los programas vistos. Un granjero desea preparar una fórmula alimenticia para engordar ganado. Dispone de maíz, desperdicios, alfalfa y cebada, cada uno con ciertas unidades de ingredientes nutri- tivos, de acuerdo con la tabla siguiente UNIDADESDEINGREDIENTESNUTRITIVOSPORkg DECADAALIMENTODISPONIBLE ALIMENTO Ingrediente Requerimiento diario nutritivo Maíz Desperdicio Alfalfa Cebada Unidades / kg Carbohidrato 80 15 35 60 230 Proteína 28 72 57 25 180 Vitaminas 20 20 12 20 80 Celulosa 50 10 20 60 160 Costo $ 18 5 7 20 a) Determine los kilogramos necesarios de cada material para satisfacer el requeri- miento diario (presentado en la última columna). b) Determine el costo de la mezcla NOTA:La fórmula alimenticia debe contener los cuatro alimentos. Solución Si se llama Xl a los kg de maíz necesarios, x210s de desperdicio, ... , se tiene 80x¡ 28 Xl 20xI 50xI + 15 x2 + 35 x3 + 60 x4 + 72 x2 + 57 x3 + 25 x4 + 20x2 + 12x3 + 20x4 + 10 x2 + 20 x3 + 60 x4 230 180 80 160 Con el PROGRAMA3.2 del CD o con Matlab se obtiene: Xl = 1.8524, x2 = 1.0318, x3 = 0.6178, x4 = 0.745 De donde el costo de la mezcla es: Costo = 18*1.8524 + 5*1.03 + 7*0.61 + 20*0.745 = $ 57.66 3.7 En un sistema monofásico en equilibrio químico existen los siguientes compuestos: CO, H2' CH30H, H20 Y C2H6 · Calcule el número de reacciones químicas independientes. Se establece la matriz atómica listando los compuestos como cabezas de columna y los átomos como inicio de filas, de tal modo que la intersección muestre el número de átomos del compuesto correspondiente. Solución o
  • 247. Matrices y sistemas de ecuaciones lineales 235 Compuesto Átomo CO H2 CH30H HzÜ C2H6 C 1 O 1 O 2 H O 2 4 2 6 e a 1 O 1 1 O Si N es el número de compuestos en equilibrio químico, R el número de reacciones inde- pendientes, se tiene la siguiente relación discutida por Jouguet, Brinkey y otros" R=N-C donde C es el rango de la matriz atómica. Para encontrar el rango se utilizará el método de ortogonalización de Gram-Schmidt, aplicado a las columnas de la matriz atómica. Para esto, llámense xl' x2' ... Xs las colum- nas ca, H2,··· , C2H6. Por tanto: Nótese que como x2 es ortogonal a xl' el proceso da e2 = Xz. y o, los os ., * Jouguet, J. Ec. Polyt. París, 2, 62 (1921); Prigogine and Defay. J. Chem. Phys 15,614 (1947).
  • 248. I ,~,,¡~------------------------------------------------------------------------------------------------~ .. 236 Métodos numéricos aplicados a la ingeniería Por tanto e,~ m -(1) m -(2) m-m Esto indica que x3 es linealmente dependiente de x¡ y x2. Continuando el proceso de orto- gonalización, pero sin tomar en cuenta a e3 , se tiene: Fi~ Siste 1 2 Por tanto e,~ m ~ m -(1) m [~~1 Como el número de filas de la matriz atómica es 3, el máximo número de vectores lineal- mente independientes es 3 y como ya se ha encontrado que x ¡, x2 Y x4 son linealmente in- dependientes, X s es necesariamente dependiente de x ¡, x2 Y x4 Y es debe ser el vector cero (demostración que se deja al lector como ejercicio); entonces, el rango de la matriz atómi- ca es 3. Al aplicar la fórmula se tiene que el número de reacciones independientes para llegar al sistema en equilibrio químico mencionado es 2. Los cálculos pueden hacerse con Matlab usando el guión del ejemplo 3.23. 3.8 Analicemos las características de la vibración libre no amortiguada del sistema de tres grados de libertad mostrado en la figura 3.17. El sistema consta de tres masas mI' m2 y m3 , conectadas mediante los tres resortes mostrados, siendo sus constantes elásticas k.. k2 y k3' Los desplazamientos de las masas se definen mediante las coordenadas generaliza- das xl' x2 y x3' respectivamente, estando medido cada desplazamiento a partir de la posi- ción de equilibrio estático de la masa respectiva. Utilizando ya sea las ecuaciones de Lagrange o bien la segunda ley de Newton, se en- cuentra que las ecuaciones diferenciales de movimiento del sistema son: m¡x;' + (k¡ + k2)x¡ - kr2 = O m2x{ - kr¡ +(k2 + k3)x2 - k3x3 = O m3x; - k3x2 + k3x3 = O (1) 236 Métodos numéricos aplicados a la ingeniería Por tanto e3~ m- (1) m-(2) mm Esto indica que x3 es linealmente dependiente de x¡ y x2. Continuando el proceso de orto- gonalización, pero sin tomar en cuenta a e3, se tiene: Por tanto 1 2 Como el número de filas de la matriz atómica es 3, el máximo número de vectores lineal- mente independientes es 3 y como ya se ha encontrado que x¡, x2 y x4 son linealmente in- dependientes, Xs es necesariamente dependiente de x¡, x2 Y x4 Yes debe ser el vector cero (demostración que se deja al lector como ejercicio); entonces, el rango de la matriz atómi- ca es 3. Al aplicar la fórmula R = N - C = 5-3 = 2 se tiene que el número de reacciones independientes para llegar al sistema en equilibrio químico mencionado es 2. Los cálculos pueden hacerse con Matlab usando el guión del ejemplo 3.23. 3.8 Analicemos las características de la vibración libre no amortiguada del sistema de tres grados de libertad mostrado en la figura 3.17. El sistema consta de tres masas m!, m2 y m3, conectadas mediante los tres resortes mostrados, siendo sus constantes elásticas kl' k2 y k3. Los desplazamientos de las masas se defmen mediante las coordenadas generaliza- das xl' x2 y x3, respectivamente, estando medido cada desplazamiento a partir de la posi- ción de equilibrio estático de la masa respectiva. Utilizando ya sea las ecuaciones de Lagrange o bien la segunda ley de Newton, se en- cuentra que las ecuaciones diferenciales de movimiento del sistema son: m¡x;' + (k¡ + k2)x¡ - kzX2 = O m2x{ - kzXl +(k2 + k3)x2 - k3x3 = O m3x~ - k3x2 + k3x3 = O (1)
  • 249. orto- neal- te in- cero tórni- ibrio posi- een- (1) Matrices y sistemas de ecuaciones lineales 237 mi =m2=m3= 1.0 Kg s-/m kl = k2 = k3 = 10 Kg/m Figura 3.17 Sistema de tres grados de libertad. X3 Sabemos, de la teoría de las vibraciones, que la solución del sistema de ecuaciones (1) se puede escribir en la forma: XI =XI senpt x2 = X2 sen pt (2) x3 = X3 senpt En donde Xi' X2 y X3 son las amplitudes del movimiento de las masas respectivas, y p de- nota las frecuencias circulares naturales que corresponden a los modos principales de vi- bración del sistema. Sustituyendo la ecuación 2 y las derivadas correspondientes a esas expresiones en la ecuación 1, Y utilizando los valores de masas y de constantes elásticas mostrados en la fi- gura 3.17, obtenemos el siguiente conjunto de ecuaciones algebraicas homogéneas: lOX2 + (20 - p2)X2 -lOX2 o O O (3) Para obtener una solución distinta de la trivial de la ecuación 3, el determinante de la matriz coeficiente del sistema, debe ser igual a cero, de manera que -lO (20 _ p2) -10 (4) El desarrollo de este determinante resulta en el polinomio característico p6 _ 50p4 + 600 p2 - 1000 = O (5) que se puede escribir como ecuación cúbica en p2, de la forma (P2)3 _ 50(P2)2 + 600 p2 - 1000 = O (6) Se encuentra que las raíces de la ecuación 6 son: p? = 1.98 seg? pf = 1.98 seg-I pl = 32.5 seg? Estos valores característicos son los cuadrados de las frecuencias circulares del primero, segundo y tercer modos de vibración del sistema, respectivamente. Como la ecuación 3 constituye un conjunto homogéneo de ecuaciones simultáneas, no se puede obtener un conjunto único de valores para Xi' X2 y Xy Sin embargo, se pueden Figura 3.17 Sistema de tres grados de Matrices y sistemas de ecuaciones lineales 237 m) =m2 =m3 = I.OKgs2/m k) =k2 =k3 =10 Kg/m libertad. X3 Sabemos, de la teoría de las vibraciones, que la solución del sistema de ecuaciones (1) se puede escribir en la forma: x ) = X ) senpt x2 =X2 senpt x3 =X3 senpt (2) En donde X) ' X2 y X3 son las amplitudes del movimiento de las masas respectivas, y p de- nota las frecuencias circulares naturales que corresponden a los modos principales de vi- bración del sistema. Sustituyendo la ecuación 2 y las derivadas correspondientes a esas expresiones en la ecuación 1, Y utilizando los valores de masas y de constantes elásticas mostrados en la fi- gura 3.17, obtenemos el siguiente conjunto de ecuaciones algebraicas homogéneas: lOX2 + (20 - p2)X2 -lOX2 o O O (3) Para obtener una solución distinta de la trivial de la ecuación 3, el determinante de la matriz coeficiente del sistema, debe ser igual a cero, de manera que O-10 (20 _ p2) - 10 =0 -10 (lO - p2) El desarrollo de este determinante resulta en el polinomio característico p6 _ 50p4 + 600 p2- 1000 = O q.le se puede escribir como ecuación cúbica en p2, de la forma (p2)3 _ 50(p2)2 + 600 p2 - 1000 = O Se encuentra que las raíces de la ecuación 6 son: p)2 = 1.98 seg-2 pi = 1.98 seg-I pI =32.5 seg-2 (4) (5) (6) Estos valores característicos son los cuadrados de las frecuencias circulares del primero, segundo y tercer modos de vibración del sistema, respectivamente. Como la ecuación 3 constituye un conjunto homogéneo de ecuaciones simultáneas, no se puede obtener un conjunto único de valores para Xi' X2 y X3. Sin embargo, se pueden
  • 250. ,4 238 Métodos numéricos aplicados a la ingeniería determinar varias relaciones para las amplitudes, que proporcionarán la configuración del sistema para los diferentes modos de vibración cuando se define una amplitud unitaria pa- ra cualquiera de las masas. Por ejemplo, sustituyendo pf = 1.98 en la ecuación 3 se obtie- ne la siguiente configuración para el primer modo X2 = 1.80 XI X3 = 2.25 XI primer modo (7) En forma similar, las configuraciones del segundo y tercer modos, utilizando p:f = 15.5 y Pf = 32.5, respectivamente, son X2 = 0.45 XI } segundo modo (8) X3 =-0.80 XI X2 =-1.25 XI } tercer modo (9) X3 =0.555 XI Se puede ver en las tres últimas ecuaciones que si la amplitud de cualquiera de las masas se conoce o se supone para un modo particular de vibración, se puede determinar la con- figuración del sistema para ese modo. Como las ecuaciones 7 a 9 consisten en relaciones de amplitudes Xi' la substitución de la ecuación 2 en estas ecuaciones indica que las rela- ciones mostradas son también las relaciones de los desplazamientos. Por ejemplo, cuando mI tiene un desplazamiento de 1 cm y el sistema está vibrando en el segundo modo, los desplazamientos correspondientes de m2 y m3 serán 0.45 cm y 0.80 cm, respectivamente, y el movimiento de 1n3 estará 180 o fuera de fase con el de mI. Se puede agregar aquí que la configuración de un sistema, dada por las relaciones mostradas arriba, define también los desplazamientos iniciales que se tendrían que dar a las masas para que el sistema vi- brara en el modo asociado con esa configuración, sin que estuvieran presentes otros armó- nicos como cuando el sistema se suelta a partir del reposo. Problemas 3.1 Elabore un algoritmo general para sumar y restar matrices. 3.2 Con el algoritmo del problema anterior, elabore uno de propósito general para sumar y res- tar matrices. 3.3 Demuestre, partiendo de la definición del producto de una matriz por un escalar, las ecua- ciones 3.7, 3.8 y 3.10. 3.4 Demuestre la ecuación 3.12, utilizando la definición de multiplicación de matrices. 3.5 Con el programa 3.1 del disco multiplique las siguientes matrices l~ O O ~lll~4 Iq1 O 8 O 1 12 O O 15 16 17 l~ 3 4 ;] U 3 O ~l6 7 0.2 -1 O 5 4 5 O O 9 3 -2
  • 251. Matrices y sistemas de ecuaciones lineales 239 n del l~ O O ~J U 2 3 ¡~lapa- O 1 6 7 btie- 1 O 10 11 O O 14 15 16 (7) [-~l m5.5 y [01234] [3 8 -2 5 1] (8) l¡; 4 ¡~J l~ O O ~J 8 1 O 12 O 1 (9) 15 16 17 O O 3.6 La siguiente tabla representa las existencias en bodega de una agencia de refacciones pa- asas ra automóviles. con- MARCA Refacción M1 M2 M3 M4 MS M6 Rl 5 13 23 8 15 98 R2 16 45 11 54 10 86 R3 34 22 77 21 65 2 ó- R4 21 19 83 2 16 37 R5 8 97 69 27 14 3 En la siguiente tabla se dan los precios unitarios correspondientes a las refacciones de arriba. MARCA Yres- Refacción M1 M2 M3 M4 MS M6 ecua- R1 65000 73450 82500 71245 62350 76450 R2 3400 3560 2560 5790 4700 5000 R3 12500 13450 16400 15600 11650 9500 R4 895 940 780 950 645 1000 R5 5350 7620 6700 3250 5890 7000 Determine la inversión en bodega de la agencia. 3.7 Responda las siguientes preguntas. a) ¿Una matriz no cuadrada puede ser simétrica? b) ¿Una matriz diagonal es triangular superior, triangular inferior o ambas? e) ¿Una matriz diagonal tiene inversa con uno de sus elementos de la diagonal princi- pal igual a cero?
  • 252. 240 Métodos numéricos aplicados a la ingeniería 3.8 Multiplique una matriz permutadora (seleccione una cualquiera) por sí misma y observe el resultado. Generalice dicho resultado. Demuestre las ecuaciones 3.15, 3.16 Y3.17. Obtenga la ecuación 3.21 a partir de la ley de los cosenos. Elabore un algoritmo tal que, dados dos vectores de igual número de componentes, se de- termine e imprima la norma euclideana de estos vectores, su producto punto, el ángulo que guardan entre ellos y la distancia que hay entre ambos. Codifique el algoritmo del problema 3.11 y verifique este programa con las siguientes pa- rejas de vectores 3.9 3.10 3.11 3.12 a) m·m b) l~lUl e) ltJ liU0 3.13 El teorema 3.1 puede y debe emplearse también para ortogonalizar un conjunto de m vec- tores linealmente independientes de n componentes cada uno, con m < n. Por otro lado, de- muestre con el teorema mencionado, que cualquier conjunto de n vectores linealmente independientes con n componentes cada uno da como resultado un conjunto linealmente de- pendiente al adicionársele un vector xn+ I de n componentes. NOTA: Use como motivación algunos casos particulares sencillos: por ejemplo, a un conjunto particular de dos vectores lineal mente independientes con dos componentes cada uno, añada un tercer vector y aplique la ortogonalización al conjunto resultante. 3.14 Elabore una subrutina de propósito general para ortogonalizar un conjunto de m vectores linealmente independientes de n componentes cada uno (m < n) con el método de Gram- Schmidt. NOTA: Puede usar el algoritmo 3.2 como base. 3.15 Con la subrutina del problema 3.14 ortogonalice los siguientes conjuntos de vectores. a) 1 -2 3 7 5 -2 1 0.8 -3 4 5 7 4 5 3 XI = 7 ' x2 = 3 x3 = 15 x4 = 3.2 Xs = 1 8 12 3 9 7 0.3 O 2 40 8 b) m [~l mXI= , x2 = x3 = e) x,= HJ .x,= D]x3 = [;~J
  • 253. eel de- que pa- Matrices y sistemas de ecuaciones lineales 241 3.16 Modifique el programa del problema 3.14 de modo que: a) Dado un conjunto cualquiera de m vectores de n componentes cada uno tm-cn), se vayan ortogonalizando los linealmente independientes y se descarte los que resulten lineal mente dependientes. b) Imprima el número de vectores linealmente independientes del conjunto denotando este número como rango del conjunto. Corra el programa para determinar el rango de las siguientes matrices o conjuntos de vec- tores columna -~J vec- , de- ente e de- 3.17 3.18 lores ram- 1 -5 3 20 3 5 1-5] [103 20 , -20 355 Calcule el número de reacciones independientes en una reacción de pirólisis, en la cual se encuentran en equilibrio los siguientes compuestos 02' H2, CO, CO2' H2C03, CH30H, C2HsOH, (CH3)2 CO, CH4, CH3 CHO Y H20. Dada una matriz A de orden n, los términos a) Matriz singular (det A =0) b) Rango A < n e) Los vectores columna o fila de A son lineal mente dependientes están estrechamente relacionados. Demuestre que a) implica tanto b) como e). 3.19 ¿La coincidencia del número de incógnitas con el número de ecuaciones en un sistema de ecuaciones lineales implica que éste tiene solución única? Justifique su respuesta. 3.20 Dado el siguiente sistema de ecuaciones, encuentre dos valores de w que permitan tener solución única y diga qué valores de w permiten un número infinito de soluciones. 3.21 Si la matriz coeficiente del sistema A x = O es tal que det A = O; ¿dicho sistema tiene por ese hecho un número infinito de soluciones? 3.22 El método de eliminación de Gauss usualmente hace la transformación conocida como triangularización. [f' a>,4Ja 24, . a 3,4 a'¡ 2 , , a 2,2 O a'¡ 3 , , a? 3 ,-' a 3,3 En estas condiciones, una sustitución hacia atrás permite obtener la solución. Las ecuacio- nes 3.49 y 3.50 constituyen el algoritmo para el caso general.
  • 254. 242 Métodos numéricos aplicados a la ingeniería - Encuentre las ecuaciones correspondientes para resolver el sistema A x= b, pero ahora lle- vando a cabo la transformación. [ a:¡,¡ a 21 l' a 3,¡ o O a' 22 O l' a 3,2 a3,3 a:¡,4] a 24 l' a 3,4 y posteriormente una sustitución hacia delante. 3.23 Modifique el algoritmo 3.4, de modo que una vez encontrado el elemento pivote e inter- cambiadas las filas (si procede), se divida la fila pivote entre el elemento pivote. En el ca- so de un sistema de orden 3, el resultado en la triagularización sería y, por tanto, en la sustitución regresiva no se tendría que dividir entre los coeficientes de las incógnitas. Por otro lado, para el cálculo del determinante deben guardarse los pivotes para su empleo en la expresión Elabore un algoritmo para resolver un sistema de ecuaciones A x = b usando la elimina- ción de Jordan. Calcule el número de multiplicaciones, divisiones o ambas y la cantidad de sumas, restas o ambas que se requieren para resolver un sistema tridiagonal por el método de Thomas. Determine también las necesidades de memoria para este algoritmo. Utilice el subprograma que se da en el ejercicio 8.2 del capítulo 8 para resolver los siguien- tes sistemas [~ 1'11 11 11 detA = (-1)" Il a i=l 1,1 SUGERENCIA: Vea el PROGRAMA 3.1 del CD. 3.24 3.25 lIi!JI 3.26 a) 0.5 XI + 0.25 x2 0.3 x¡ + 0.8 x2 + 0.4 x3 0.2 x2 + x3 + 0.6x4 x3 3 x4 b) XI x2 1 2xI x2 + 3 x3 8 x2 + x3 4 e) 4x¡ + x2 -8 x¡ x2 + x3 3 x2 2x3 + 4x4 x3 x4 + Xs 2x4 + 6 Xs 0.32 0.77 -0.6 -2 -1 13 -3 2.1 3.4 3.27 Una matriz tridiagonal por bloques (o partida) es una matriz de la forma
  • 255. Matrices y sistemas de ecuaciones lineales 243 ra lle- BI el o o A2 B2 e2 o A= o A3 B3 e3 o o o o o ell _ 1 o o A" Bn inter- donde BI' B2,··· ,Bn son matrices de orden nl' n2,··· nn: respectivamente. A2, A3' ... , An son el ea- matrices de orden (n2 X ni)' (n3 X n2), ... , (n" X nll _ I), respectivamente, y e" e2,· .. en_1 son matrices de orden (nI X n2), (n2 X n3), ... , (nll _ 1 X nn)' respectivamente. Por ejemplo, las matrices a) donde B,= [ -! -n[B, el g,] -1 A= A2 B2 6 i = 1,2,3 o A3 B3 -1 tes de [-~O J]pleo y Ai+1 = e¡= -2 i = 1,2 O b) 1 5 3 5 8 9 -2 O O O O O 2 -1 O 1 4 O 7 O O O O O 4 3 6 7 3 2 3 O O O O O na- 7 3 6 4 5 8 9 4 5 5 4 3 restas 2 2 5 7 6 3 2 2 7 8 9 1 amas. 3 7 3 4 1 O 1 O -3 5 7 2 1 1 2 4 3 2 5 4 5 7 9 5 guien- O O O 5 7 9 5 O 5 7 4 2 O O O 4 8 2 2 -1 7 9 7 8 O O O 3 2 1 1 4 8 4 3 2 O O O 5 1 5 4 2 7 4 5 -1 O O O 2 9 7 3 3 2 7 2 2 son tridiagonales por bloques. Hay que observar que una matriz tridigonal por bloques no es tridiagonal en el sentido de la definición original. Elabore un algoritmo similar al algoritmo 3.5 para resolver sistemas tridiagonales por bloques A x = b. SUGERENCIA: Para el sistema donde se ha segmentado a x y b de modo tal que
  • 256. 244 Métodos numéricos aplicados a la ingeniería Xl Y b, son vectores de nI componentes (el orden de Bl), x2 y b2 son vectores de n2 componentes (el orden de B2), x3 y b3 son vectores de n3 componentes (el orden de B3), forme la matriz aumentada y elimine la matriz A2 por medio de los elementos de la diagonal principal de B 1; poste- riormente elimine la matriz A3 con los elementos diagonales de B2. Para iniciar la sustitu- ción regresiva, resuelva el sistema B3 x3 = b3 ' con el resultado resuelva el sistema B2 x2 = b2 - e, x3 Finalmente, sustituyendo x2' resuelva s, Xl = b, - el x2 Los sistemas pueden resolverse con alguno de los métodos vistos. 3.28 Resuelva el sistema tridiagonal por bloques 6 -1 O -2 O O O O O xl 3 -1 6 -1 O -2 O O O O x2 2 O 1 6 O O -2 O O O x3 3 -2 O O 6 -1 O -2 O O x4 1 O -2 O -1 6 -1 O -2 O Xs O O O -2 O -1 6 O O -2 x6 1 O O O -2 O O 6 -1 O x7 3 O O O O -2 O 1 6 -1 xg 2 O O O O O -2 O -1 6 x9 3 Utilice la sugerencia del problema 3.27, el algoritmo de ese ejercicio o ambos. 3.29 En la simulación de una columna de destilación de NP platos que separa una mezcla de NC componentes, el balance de materia por componente en cada plato, el balance de en- talpía en cada plato y la relación de equilibrio líquido-vapor de cada componente en cada plato, resultan en un sistema de NP(2NC+ 1) (dos veces el número de componentes más uno multiplicado por el número de platos) ecuaciones algebraicas no lineales. En la apli- cación del método de Newton-Raphson para un sistema no lineal es necesario resolver un sistema tridiagonal por bloques de orden NP(2NC+ 1) en cada iteración. Para una colum- na de cinco platos y tres componentes, el sistema tridiagonal por bloques por resolver en cada iteración es: Bl el Xl bl A2 B2 e2 X2 b2 A3 B3 e3 X3 b3 A4 B4 e4 X4 b4 As Bs Xs bs
  • 257. Matrices y sistemas de ecuaciones lineales 245 donde O O O 12204.1 9216.1 1262.6 1768.8 O O O O -1 O O O O O O O -1 O A2 = O O O O O O -1 O O O O O O O O O O O O O O O O O O O O O O O O 10550.0 1187.3 1636.7 2291.6 te- O O O O -1 O O 'tu- O O O O O -1 O A3= O O O O O O -1 O O O O O O O O O O O O O O O O O O O O O O O O 9863.2 1529.5 2109.1 2951.1 O O O O -1 O O O O O O O -1 O A4= O O O O O O -1 O O O O O O O O O O O O O O O O O O O O O O O O 8341.5 2227.6 3073.1 4294.5 O O O O -1 O O O O O O O -1 O A5 = O O O O O O -1 O O O O O O O O O O O O O O O O O O O O O 5522.3 6518.9 7105.4 18015.3 916.1 1262.6 1768.8 1 O O O 1 O 1 de O 1 O O O 1 O en- B,= O O 1 O O O 1 ada -0.065 0.9346 0.9346 2.93858 0.119 -0.4894 -0.4894 ás 0.0643 -0.9357 0.0643 0.30762 -0.033 0.1481 -0.0337 pli- 0.0011 0.0011 -0.9989 0.00643 -0.006 -0.0006 0.0524 un ffi- 5777.5 6941.9 7659.2 28231.1 1187.3 1636.7 2291.6 en 1 O O O 1 O 1 O 1 O O O 1 O B2 = O O 1 O O O 1 -0.l37 0.8625 0.8625 7.2004 0.8898 -1.6296 -1.6296 0.l314 -0.8686 0.l314 1.6619 0.5605 0.5605 -0.2482 0.0061 0.0061 -0.9989 0.0979 -0.0115 -0.0115 02374
  • 258. 246 Métodos nu méricos aplicados a la ingeniería 6099.7 7471.9 8357.4 27837.5 1529.5 2109.1 2951.1 1 O O O 1 O 1 O 1 O O O 1 O B3 = O O 1 O O O 1 -0.2217 0.7783 0.7783 5.6209 1.6619 -1.6521 -1.6296 0.1917 -0.8029 0.1971 2.1270 -0.4184 0.7336 -0.2482 0.0246 0.0246 -0.9754 0.3359 -0.0522 -0.0522 03355 6557.3 8540.2 9778.8 18947.5 2227.6 3073.1 4294.5 1 O O O 1 O 1 O 1 O O O 1 O B4 = O O 1 O O O 1 -0.4351 0.5649 0.5649 1.7373 2.2062 -0.8346 -0.8346 b 0.3456 -0.6544 0.3456 1.5331 -0.5106 0.6927 -0.5106 0.8923 0.8923 -0.9108 0.5003 -0.1322 -0.1322 0.3058 7547.5 9801.1 11480.6 12961.3 3065.4 4231.4 5904.4 1 O O O 1 O 1 O 1 O O O 1 O Bs = O O 1 O O O 1 -0.6827 0.3173 0.3173 0.7585 29.335 -3.9259 -3.9059 0.4311 -0.5689 0.4311 1.4233 -5.3074 9.3998 -5.3074 0.2516 0.2516 -0.7484 1.0573 -3.0980 -3.0980 2.8411 -5777.5 -6941.9 -7659.2 -17681.1 O O O O -1 O O O O O O O -1 O O O O el= O O O -1 O O O O O O O O O O O O O O O O O O O O O O O O -6099.6 -7471.9 -8357.4 -17974.2 O O O O -1 O O O O O F O O -1 O O O O e2 = O O O -1 O O O O O O O O O O O O O O O O O O O O O O O O -6757.4 -8540.2 -9778.7 -10606.0 O O O O -1 O O O O O O O -1 O O O O e3 = O O O -1 O O O O O O O O O O O O O O O O O O O O O O O O
  • 259. Matrices y sistemas de ecuaciones lineales 247 -7547.5 -9801.1 -11480.6 -11886.0 O O O O -1 O O O O O O O -1 O O O O C4= O O O -1 O O O O O O O O O O O O O O O O O O O O O O O O -3390307.1 -117198.1 -117288.9 --421289.9 348305.0 -6.7419 -70.6904 -16.5304 -3.9928 59.4815 13.4936 -16.8926 -18.9351 -52.9235 35.448 b,= 1.2278 , b2= 0.1614 , b3 = -2.1684 , b4= 2.2335 , bs= 3.1614 -0.009835 0.0142 0.02723 -0.0021 -0.01917 0.000629 0.00463 0.00536 -0.00192 -0.01459 0.000566 -0.00256 -0.0020 0.12736 -0.00998 3.30 Adapte la eliminación de Gauss a la solución del sistema pentadiagonal A x = b (A es una matriz pentadiagonal) y obtenga las ecuaciones correspondientes a esta adaptación. Figura 3.18 a) b) 3.31 Demuestre que la numeración de los nodos de la figura 3.14 con las consideraciones de que a¡,j i= O siempre que los nodos sean vecinos, genera una matriz tridiagonal. 3.32 Considere la estructura hexagonal de la figura 3.18a (véase Ej. 3.2.). Numere los nodos en la forma mostrada en la figura 3.18b, por ejemplo, y con consideraciones físicas que de- terminan que a¡,j i= O,cuando i y j son nodos vecinos, determine la matriz A representativa de dicha estructura. 3.33 Se tiene un sistema de tres rectores continuos tipo tanque perfectamente agitado trabajan- do en serie, en donde se lleva a cabo la reacción A --> Productos y se opera isotérmicamen- te (véase Fig. 3.19). Los volúmenes se mantienen constantes y son de 100,50 Y 50, litros respecti vamente. Un balance de materia en cada reactor, de acuerdo con la ecuación de continuidad, condu- ce al siguiente sistema de ecuaciones:
  • 260. 248 Métodos numéricos aplicados a la ingeniería Entrada - Salida -lo que = Acumulación reacciona FCAO+ FR CA3 - (F+FR)CA, -k, V, C~, dCA, dt (F+FR)CA1 - (F+FR)CA2 -k, V2C~2 dCA2 dt (F+FR)CA2 - (F+FR)CA3 -k, V3 C~3 dCA3 dt Calcule la concentración de A a régimen permanente en cada reactor si la reacción es de primer orden con respecto a A y la constante de velocidad de reacción k, es O.lmin-'. Las composiciones están dadas en mol/L. Figura 3.19 Sistema de tres reactores continuos tipo tanque agitado en donde se lleva a cabo la reacción A --> Productos. F = 10L/min CA =l.0 • o s = 10 L/min FR = 5 L/min C~ 3.34 Repita el problema 3.33, considerando que el reflujo es como se muestra en la figura 3.20 F = lOL/min Figura 3.20 Sistema de tres CA =1.0 • 1 L/min 2 L/min 2 L/min o reactores continuos tipo CA CA CA FR = 5 L/mintanque agitado, 1 2 3 en donde se VI = 100L V2 = 50 L V3 = 50 L lleva a cabo la reacción A --> CA CA CA S = 10 L/minI 2 3 Productos. 3.35 Calcule la composición del benceno en cada plato de la columna de absorción del ejerci- cio 3.1, si se modifica Yo a 0.2 de fracción molar. Use las consideraciones del mismo ejer- cicio. 3.36 Las reacciones químicas pueden escribirse como: 11 L xc, = O ;=1 1 1 donde: Xi es el coeficiente estequimétrico del compuesto i y c¡ el compuesto i. Por ejemplo, CH4 + 2 02 ---> CO2 + 2 H20
  • 261. Matrices y sistemas de ecuaciones lineales 249 puede escribirse como: Dado que los átomos se conservan en una reacción química, la ecuación de conservación del elemento k es: n L x-m'k = O;i=l 1 1,' k = 1,2, ... , m de as donde m¡,k es el número de átomos del elemento k en el compuesto i. Esta última expresión representa un conjunto de ecuaciones lineales, donde x¡ son las in- cógnitas. Lo anterior se conoce como el método algebraico de balanceo de ecuaciones químicas. Utilice este método para balancear la ecuación química 3.37 Fe(Cr02)2 + 02 + Na2C03 -t Fe2 03 + Na, Cr04 + CO2 Factorice las siguientes en la forma L U, con el algoritmo 3.6 a) [~ 1 -~] b) [34M 16100 -91]5 1.9999 17.01 9.6 8 1.6 5.2 1.7 e) [58 3.2 1125] á) l~OO2 4 X 10-4 5 X 10-4 8X I~J4.3 3.4 9.625 2.3 3 X 10-3 4 X 10-5 2.5 5.2 9.625 O 5 0.01 O O 2 - e) [~ O O ~J 1) l~ 6 1 I~J10 O 5 -2 9 5 5 7 10 3 3 9 12 24 .20 3.38 Factorice las matrices del problema 3.37, con el algoritmo 3.7. 3.39 Resuelva los siguientes sistemas de ecuaciones con el algoritmo 3.8 a) 4x¡ + x2 - x3 = 8 2x¡ + 5x2 5 3x¡ + 8x2 + 9x3 = O b) 3.444x¡ + 16100x2 - 9.1x3 = O 1.9999x¡ + 17.01x2 + 9.6x3 = 1 1.6x¡ + 5.2x2 + 1.7x3 = O e) 5.8x¡ + 3·2x2 + 11.24x3 20.24 4.3x¡ + 3.4x2 + 9.625x3 = 17.325 2.5x¡ + 5·2x2 + 9.625x3 = 17.325 l- er- el) 4x¡ + 5x2 + 2x3 x4 3 5x¡ + 8x2 + 7x3 + 6x4 2 3x¡ + 7x2 4x3 2x4 O -xI + 6x2 2x3 + 5x4 1 e) 2.156x¡ + 4.102x2 2.3217x3 + 6x4 18 -4.102x¡ + 6x2 + + 1.2x4 6.5931 -XI 5.7012x2 + 1.2222x3 3.4 6.532x¡ + 7x2 4x4 O
  • 262. 250 Métodos numéricos ap licados a la ingeniería 3.40 Factorice las matrices simétricas siguientes, mediante el algoritmo 3.9. a) [-¡ 5 n b) [ 333 4.81 -222J6 4.81 10.0 7.45 1 -2.22 7.45 15.0 72.0 0.00 0.00 9.00 0.00 0.00 0.00 2.88 0.00 0.00 0.00 -4.50 e) 0.00 0.00 18.00 9.00 0.00 0.00 9.00 0.00 9.00 12.00 0.00 0.00 0.00 0.00 0.00 0.00 33.00 0.00 0.00 -4.50 0.00 0.00 0.00 33.00 3.41· Con el algoritmo 3.9, elabore un algoritmo para resolver sistemas lineales simétricos y re- suelva con él los siguientes sistemas. a) -5x¡ + 5x2 + 3x3 1 5x¡ + 6x2 + x3 2 3x¡ + x2 + 7x3 3 b) 3.33x¡ + 4.81x2 - 2.22x3 5 4.81x¡ + 10.00x2 + 745x3 O -2.22x¡ + 7.45x2 + 15.00x3 2 e) 72x¡ + 9x4 2 2.88x2 -4.5x6 0.5 18x3 + 9x4 1 9x3 + 12x4 O 33xs 1.2 - 4.5x2 + 33x6 5 3.42 Use el algoritmo 3.10 para factorizar en la forma L U las siguientes matrices positivas de- finitivas. a) [4 -2 -!] b) U 1 2 -!J e) 10 O O -1 O -2 4 7 O O 5 O O 2 O -1 O 5 O O 2 O O 3 1 -1 O O 8 3 O 2 O 3 5 3.43 Mediante el algoritmo 3.10 elabore un algoritmo para resolver sistemas lineales con ma- triz coeficiente positiva definida y resuelva con él los siguientes sistemas. a) 4x¡ 2x2 O -2x¡ + 4x2 x3 0.5 x2 + 4x3 1 b) 5x¡ + x2 + 2x3 x4 1 x¡ + 7x2 + 3x4 2 2x¡ 5x3 + x4 3 -xI + 3x2 + x3 + 8x4 4 e) l Ox, x4 0.2 5x2 + 2x4 0.4 2x3 1.0 -xI + 8x4 + 3xs 0.6 2x2 + 3x4 + 5xs 0.8
  • 263. Matrices y sistemas de ecuaciones lineales 251 3.44 Si la factorización de A en las matrices L y U es posible, puede imponerse que ui,i = 1 con i = 1, 2, ... , n. Con estas condiciones obtenga las ecuaciones correspondientes a las ecuacio- nes 3.74, 3.75 Y 3.76, para el caso del orden de A igual a 3. También obtenga las ecuaciones correspondientes a la ecuación 3.77 para el caso general, orden de A igual a n. Este méto- do, como se recordará, es conocido como algoritmo de Crout. 3.45 Elabore un algoritmo para resolver un sistema de ecuaciones lineales con el método de Crout (véase algoritmo 3.8); resuelva los sistemas del problema 3.43 con el algoritmo en- contrado. 3.46 Demuestre que en la solución del sistema lineal A x = b, donde A es positiva definida, con el método de Cholesky se requiere efectuar: n raíces cuadradas re- n 3 + 9 n 2 + 2n lti licaci di ..------ mu tip icaciones o ivrsíones 6 n3 + 6 n2 -7n ------ sumas o restasy 6 cuando el orden de A es n. 3.47 Demuestre que si una matriz A es positiva definida, entonces au > Opara i =1,2, ... , n. 3.48 Los algoritmos de factorización, cuando son aplicables, se pueden simplificar considera- blemente en el caso de matrices bandeadas, debido al gran número de ceros que aparecen en estas matrices. Adapte el método de Doolitle o el de Crout para sistemas tridiagonales y una vez obtenidas las ecuaciones correspondientes, elabore un algoritmo eficiente. 3.49 En la solución de una estructura doblemente empotrada se obtuvo el siguiente sistema: de- 1 1 - c+- Ap=O El El donde El es el módulo de elasticidad del elemento, -1.80 p¡ 22.50 P2 c= -67.50 p= P3 0.00 P4 165.00 Ps 0.00 P6 72.00 0.00 0.00 9.00 0.00 0.00 0.00 2.88 0.00 0.00 0.00 -4.50 Y A= 0.00 0.00 18.00 9.00 0.00 0.00 9.00 0.00 9.00 12.00 0.00 0.00 0.00 0.00 0.00 0.00 33.00 0.00 0.00 -4.50 0.00 0.00 0.00 33.00 Encuentre p. ma- 3.50 Determine si el sistema que sigue está mal condicionado. [ ~:~~~~ 671.~~ -~:~l[~~l= [160~~:~~j 1.6000 5.20 1.7 x3 8.42 Resuélvalo usando la eliminación de Gauss y aritmética de cinco dígitos.
  • 264. 252 Métodos numé ricos aplicados a la ingeniería 3.51 La matriz H(IZ) de orden n o matriz de Hilbert, definida por 1 h .. = --- ; 1 ::;i ::; n; 1 ::;j ::;n, I,} i + j-1 es una matriz mal condicionada que surge, por ejemplo, al resolver las ecuaciones norma- les del método de aproximación por mínimos cuadrados (véase capítulo 5). Encuentre H(4l, H(S) y sus inversas por alguno de los métodos vistos; además, resuelva el sistema. H(4) X = [ 1 O 1 OF 3.52 Demuestre que: det P = -1, el determinante de una matriz permutadora es-l. det M = In, el determinante de una matriz multiplicadora es el factor In (m '* O). det S = 1, el determinante de una matriz del tipo S es 1. Sugerencia: Utilice la función determinante de una matriz de orden n. 3.53 Dados los siguientes sistemas de ecuaciones lineales: calcule las inversas, determinantes y soluciones correspondientes, usando matrices ele- mentales. 3.54 Resuelva los siguientes sistemas de ecuaciones lineales mediante los métodos de Gauss- Seidel y de Jacobi. a) [! -1 -~][;j= D] b) D 1 i][;j= [:] -1 2 -1 1 e) inciso c) del problema 3.41. d) 1 2 22 23 24 XI 13.4 1 6 62 63 64 x2 30.4 1 10 102 103 104 x3 41.8 1 20 202 203 204 x4 57.9 1 30 302 303 304 X s 66.5 d) 8 O 6 1 O O O O OO O XI 1 O 9 O O O O5 O 2 1 O x2 5 O 1 7 O O 1 2 O O 1 O x3 8 O 1 O 6 O O 1 O O O 1 x4 O O O O O9 O O O 1 1 1 Xs 8 O 1 O 2 O 10 1 O 3 O O x6 1 O O 5 O 2 2 10 O O O O x7 O O O O 6 1 O O 15 O 2 O x8 3 Fig TrE O 2 O O 4 O 1 1 20 1 O x9 O intercc O O O O O3 O 6 5 25 1 xIO 1 1 O 3 1 5 O 7 O O 1 12 XII 2
  • 265. Matrices y sistemas de ecuaciones lineales 253 3.55 Elabore un algoritmo para arreglar la matriz aumentada de un sistema, de modo que la ma- triz coeficiente quede lo más cercana posible a diagonal dominante. 3.56 Elabore un algoritmo para resolver un sistema de ecuaciones linales, usando los métodos SOR con w > 1 Y con w < 1. SUGERENCIA: Puede obtenerlo fácilmente modificando el algoritmo 3.11.rma- ¡fA), 3.57 Aplique la segunda ley de Kirchhoff a la malla formada por el contorno del circuito de la figura 3.15; es decir, no considere Es, R4 YRs- Demuestre que la ecuación resultante es li- nealmente dependiente de las tres obtenidas al seccionar en mallas dicho circuito. 3.58 Resuelva los sistemas de ecuaciones lineales del problema 3.54 con el algoritmo elabora- do en el problema 3.56. 3.59 Demuestre que la ecuación 3.11 O es un polinomio de grado n si A es una matriz de orden n e 1 es la matriz identidad correspondiente. 3.60 Encuentre los valores característicos (eigenvalores) de la matriz coeficiente del siguiente sistema. O). 1 0.3 7 2 2 5 O -2 1_0 : l-1[!] s ele- 3.61 Encuentre los vectores característicos (eigenvectores) correspondientes al valor caracterís- tico dominante (el de máximo valor absoluto) del ejemplo anterior. 3.62 Encuentre el valor característico dominante y los vectores característicos correspondientes del sistema de ecuaciones del problema 3.60. 3.63 Se tienen tres tanques cilíndricos iguales de 6 pies de diámetro, comunicados entre sí por medio de tubos de 4 pulgadas de diámetro y 2 pies de largo, como se muestra en la figura 3.21. El tercer tanque tiene una salida a través de un tubo de 4 pulgadas de diámetro y 8 pies de largo. Al primer tanque llega un fluido a razón de 0.1 pies cúbicos por minuto e inicialmente su nivel tiene una altura de 20 pies, mientas que el segundo y tercer tanques están vacíos. El fluido es un aceite viscoso cuya densidad es de 51.45 lbm /pie3, Y viscosi- dad es 100 centipoises. Calcule la altura del fluido en cada tanque cuando se alcance el ré- gimen permanente. auss- SUGERENCIA: Use la ecuación de Poiselle para el cálculo de la velocidad media del fluido a través de los tubos. F = 0.1 pie3/min , h,1 CD h,1 G) G) • 5 8 O 8 1 O 3 O 1 2 Figura 3.21 Tres tanques interconectados. L = 2' D = 2" L = 2' L = 8' D=4" D = 4"
  • 266. CAPÍTULO 4 SISTEMAS DE ECUACIONES NO LINEALES A dónde nos dirigimos En este capítulo estudiaremos las técnicas que nos permitirán resolver sistemas de ecuaciones no lineales,j (x) = O,vistas como la situación más general de los casos que analizamos en los capítulos 2 y 3. Para esto, utilizaremos sistemas de dos ecuaciones no lineales en dos incógnitas, lo cual no implica pérdida de generalidad y a cambio nos permitirá realizar los cálculos de manera más ágil y, sobre todo, presentar una interpre- tación geométrica del método. De esta manera, el lector tendrá frente a sí un reto de vi- sualización y entenderá por qué estos métodos requieren de numerosos cálculos. Además de las extensiones que se hacen del método de punto fijo, de Newton- Raphson y de bisección a sistemas no lineales, estudiaremos una fórmula que, median- te un planteamiento generalizado, nos permite proponer y explorar técnicas diferentes a las vistas anteriormente, como la del descenso de máxima pendiente y variantes a las ya conocidas como la de Newton-Raphson con optimización del tamaño de paso. Con este capítulo terminamos la parte algebraica del libro en la que se basarán los siguientes capítulos correspondientes a la parte de análisis y dinámica, ya que muchos de los problemas que veremos más adelante se reducen a resolver problemas de tipo al- gebraico; por ejemplo: cuando se resuelve una ecuación diferencial parcial donde se termina resolviendo un sistema lineal o no lineal de ecuaciones, o en el caso en que es necesario resolver problemas de absorción, destilación, diseño de reactores, diseño de vigas u otros de gran interés para el ingeniero. Introducción En el capítulo 2 se vio cómo encontrar las raíces de una ecuación de la forma: 1(X) =0. Por otro lado, en el capítulo 3 se estudiaron las técnicas iterativas de solución de un siste- ma de ecuaciones lineales A x = b. Estos dos son casos particulares de la situación más general, donde se tiene un siste- ma de varias ecuaciones con varias incógnitas, cuya representación es: 11(xl' x2' x3'··· , xl1) = O 12(x., x2' x3'··· , x) = O (4.1) donde f (xl' x2' x3, ... , x,) para 1 ~ i ~ n es una función (lineal o no) de las variables inde- pendientes Xl' X2' X3,··· , X,I" CAPÍTULO 4 SISTEMAS DE ECUACIONES NO LINEALES A dónde nos dirigimos En este capítulo estudiaremos las técnicas que nos permitirán resolver sistemas de ecuaciones no lineales,!(x) =O, vistas como la situación más general de los casos que analizamos en los capítulos 2 y 3. Para esto, utilizaremos sistemas de dos ecuaciones no lineales en dos incógnitas, lo cual no implica pérdida de generalidad y a cambio nos permitirá realizar los cálculos de manera más ágil y, sobre todo, presentar una interpre- tación geométrica del método. De esta manera, el lector tendrá frente a sí un reto de vi- sualización y entenderá por qué estos métodos requieren de numerosos cálculos. Además de las extensiones que se hacen del método de punto fijo, de Newton- Raphson y de bisección a sistemas no lineales, estudiaremos una fórmula que, median- te un planteamiento generalizado, nos permite proponer y explorar técnicas diferentes a las vistas anteriormente, como la del descenso de máxima pendiente y variantes a las ya conocidas como la de Newton-Raphson con optimización del tamaño de paso. Con este capltulo terminamos la parte algebraica del libro en la que se basarán los siguientes capítulos correspondientes a la parte de análisis y dinámica, ya que muchos de los problemas que veremos más adelante se reducen a resolver problemas de tipo al- gebraico; por ejemplo: cuando se resuelve una ecuación diferencial parcial donde se termina resolviendo un sistema lineal o no lineal de ecuaciones, o en el caso en que es necesario resolver problemas de absorción, destilación, diseño de reactores, diseño de vigas u otros de gran interés para el ingeniero. Introducción En el capítulo 2 se vio cómo encontrar las raíces de una ecuación de la forma: J(X) = 0. Por otro lado, en el capítulo 3 se estudiaron las técnicas iterativas de solución de un siste- ma de ecuaciones lineales A x = b. Estos dos son casos particulares de la situación más general, donde se tiene un siste- ma de varias ecuaciones con varias incógnitas, cuya representación es: J, (xi' x2' x3' ··· , x,,) =O J2 (Xl' X 2' X 3'··· , X,,) = O (4.1) donde.!; (x" X 2' X 3, ... , X II ) para 1 ~ i ~ n es una función (lineal o no) de las variables inde- pendientes x" x2' x3, ... , xl/.
  • 267. 256 Métodos numéricos aplicados a la ingeniería Si por ejemplo la ecuación 4.1 consiste sólo en una ecuación de una incógnita (n = 1), se tiene la ecuación 2.1. En cambio la ecuación 4.1 se reducirá al caso (3.39) si n > 1 Yfp f2,· .. 1" son todas funciones lineales de x" x2' x3, ... , x". Por todo esto, es fácil entender que los métodos iterativos de solución de la ecuación 4.1 son extensiones de los métodos para ecuaciones no lineales con una incógnita y emplean las ideas que se aplicaron al desarrollar los algoritmos iterativos para resolver A x = b. A continuación se dan algunos ejemplos. a) I, (x¡, x2 ) = X,2 + xl- 4 = O f2 (xl' x2) = x2 - x,2 = O b) t,(xl' x2) = 10 (x2 - x?) = O f2 (x., x2) = 1 - x, = O e) t.(xl' x2, x;) = x,x2x3 - lOx,3 + x2 = O f2 (xl' x2' x3) = XI + 2X2X3 + senx2 - 15 = O f3 (xl' x2' x3) = x2 2 - 5x,x3 - 3x3 3 + 3 = O 4.1 Dificultades en la solución de sistemas de ecuaciones no lineales Antes de desarrollar los métodos iterativos para resolver sistemas de ecuaciones no linea- les con varias incógnitas, se destacarán algunas de las dificultades que se presentan al apli- car estos métodos. • Es imposible graficar las superficies multidimensionales definidas por las ecuacio- nes de los sistemas para n > 2. • No es fácil encontrar "buenos" valores iniciales. Para atenuar estas dificultades proporcionamos algunas sugerencias antes de analizar un intento formal de solución de la ecuación 4.1. REDUCCiÓN DE ECUACIONES Resulta muy útil tratar de reducir analíticamente el número de ecuaciones y de incógnitas antes de intentar una solución numérica. En particular, hay que intentar resolver alguna de las ecuaciones para alguna de las incógnitas. Después, sustitúyase la ecuación resultante para esa incógnita en todas las demás ecuaciones; con esto el sistema se reduce en una ecuación y una incógnita. Continúe de esta manera hasta donde sea posible. Por ejemplo, en el sistema f,(xi' x2) = 10 (x2 - x,2) = O f2(xp x2) = l-x, = O se despeja x, en la segunda ecuación x, = 1 y se sustituye en la primera cuya solución, x2 = 1, conjuntamente con x, = 1 proporciona una solución del sistema da- do, sin necesidad de resolver dos ecuaciones con dos incógnitas. 256 Métodos numéricos aplicados a la ingeniería Si por ejemplo la ecuación 4.1 consiste sólo en una ecuación de una incógnita (n = 1), se tiene la ecuación 2.1. En cambio la ecuación 4.1 se reducirá al caso (3.39) si n > 1 YJI' J2,· .. 1" son todas funciones lineales de xi' x2, x3'··· , xl1 ' Por todo esto, es fácil entender que los métodos iterativos de solución de la ecuación 4.1 son extensiones de los métodos para ecuaciones no lineales con una incógnita y emplean las ideas que se aplicaron al desarrollar los algoritmos iterativos para resolver A x =b. A continuación se dan algunos ejemplos. a) JI (xi' x2) = X l 2 + xl - 4 = O J2(xi' x2) =x2 - x l 2 =O b) f., (xl' x2) = 10 (x2 - x?) = O J2 (xi' x2) = 1 - xI = O c) JI (xi' x2, x3) = x lx2x3 - lOxl 3+ x2 =O J2 (xi' x2, x3) =xI + 2x2x3 + senx2 - 15 =O J3 (xi' x2' x3) =x2 2 - 5xlx3 - 3x3 3 + 3 =O 4.1 Dificultades en la solución de sistemas de ecuaciones no lineales Antes de desarrollar los métodos iterativos para resolver sistemas de ecuaciones no linea- les con varias incógnitas, se destacarán algunas de las dificultades que se presentan al apli- car estos métodos. • Es imposible graficar las superficies multidimensionales definidas por las ecuacio- nes de los sistemas para n > 2. • No es fácil encontrar "buenos" valores iniciales. Para atenuar estas dificultades proporcionamos algunas sugerencias antes de analizar un intento formal de solución de la ecuación 4.1. REDUCCiÓN DE ECUACIONES Resulta muy útil tratar de reducir analíticamente el número de ecuaciones y de incógnitas antes de intentar una solución numérica. En particular, hay que intentar resolver alguna de las ecuaciones para alguna de las incógnitas. Después, sustitúyase la ecuación resultante para esa incógnita en todas las demás ecuaciones; con esto el sistema se reduce en una ecuación y una incógnita. Continúe de esta manera hasta donde sea posible. Por ejemplo, en el sistema JI(xl' x2) = 10 (x2- x12) =O Jlxl' x2) = 1 - XI = O se despeja XI en la segunda ecuación XI = 1 y se sustituye en la primera cuya solución, x2 =1, conjuntamente con XI = 1 proporciona una solución del sistema da- do, sin necesidad de resolver dos ecuaciones con dos incógnitas.
  • 268. 4.1 las ea- li- io- un itas de le una da- 1 I Sistema de ecuaciones no lineales 257 PARTICiÓN DE ECUACIONES A veces resulta más sencillo dividir las ecuaciones en subsistemas menores y resolverlos por separado. Considérese por ejemplo el siguiente sistema de cinco ecuaciones con cin- co incógnitas. I,(x" x2' x3, x4, xs) O fixl' x2' x4) O f3(x" x3, x4, xs) O f4(x2, x4) O fs(xl' x4) O En vez de atacar las cinco ecuaciones al mismo tiempo, se resuelve el subsistema forma- do porf2,f4 yfs- Las soluciones de este subsistema se utilizan después para resolver el sub- sistema compuesto por las ecuaciones f y f3' En general, una partición de ecuaciones es la división de un sistema de ecuaciones en subsistemas llamados bloques. Cada bloque de la partición es el sistema de ecuaciones más pequeño que incluye todas las variables que es preciso resolver. TANTEO DE ECUACIONES Supóngase que se quiere resolver el siguiente sistema de cuatro ecuaciones con cuatro in- cógnitas. f,(x2, x3) f2(x2, x3, x4) fixl' x2' x3' x4) fixl' x2, x3) O O O O No se pueden dividir en subsistemas, sino que es preciso resolverlas simultáneamente; sin embargo, es posible abordar el problema por otro camino. Supóngase que se estima un va- lor de x3. Se podría obtener así x2 a partir de fl' x4 de f2 y x, de f3' Finalmente, se compro- baría cou f¿ la estimación hecha de x3 . Sif4 fuese cero o menor en magnitud que un valor predeterminado o criterio de exactitud E, la estimación x3 y los valores de x2' x4 y x, obte- nidos con ella, serían una aproximación a la solución del sistema dado. En caso contrario, habría que proponer un nuevo valor de x3 y repetir el proceso. Nótese la íntima relación que guarda este método con el de punto fijo (Cap. 2), ya que un problema multidimensional se reduce a uno unidimensional en x3 VALORES INICIALES a) De consideraciones físicas Si el sistema de ecuaciones 4.1 tiene un significado físico, con frecuencia es posible aco- tar los valores de las incógnitas a partir de consideraciones físicas. Por ejemplo, si alguna de las variables Xi representa la velocidad de flujo de un fluido, ésta no podrá ser negati- va. Por tanto, Xi ¿ O. En el caso de que Xi represente una concentración expresada como fracción peso o fracción molar de una corriente de alimentación, se tiene que O ::::;Xi ::::; 1. (Para mayores detalles ver los ejercicios resueltos al final del capítulo). Sistema de ecuaciones no lineales 257 PARTIC iÓN DE ECUACIONES A veces resulta más sencillo dividir las ecuaciones en subsistemas menores y resolverlos por separado. Considérese por ejemplo el siguiente sistema de cinco ecuaciones con cin- co incógnitas. f, (xI' X2' X3' X4' X5) O fix i' X2' X4) O fix " X3' X4' X5) O f4(x2, X4) O f 5(xl' X4) O En vez de atacar las cinco ecuaciones al mismo tiempo, se resuelve el subsistema forma- do porf2,f4 y f5' Las soluciones de este subsistema se utilizan después para resolver el sub- sistema compuesto por las ecuaciones f l y f3' En general, una partición de ecuaciones es la división de un sistema de ecuaciones en subsistemas llamados bloques. Cada bloque de la partición es el sistema de ecuaciones más pequeño que incluye todas las variables que es preciso resolver. TANTEO DE ECUACIONES Supóngase que se quiere resolver el siguiente sistema de cuatro ecuaciones con cuatro in- cógnitas. f l(X2, x3) O f 2(x2, x3' x4) O fixl' x2' x3' x4) O fixi' x2' x3) O No se pueden dividir en subsistemas, sino que es preciso resolverlas simultáneamente; sin embargo, es posible abordar el problema por otro camino. Supóngase que se estima un va- lor de x3. Se podría obtener así x2 a partir de fi' x4 de f 2 y XI de f3' Finalmente, se compro- baría conf4la estimación hecha de x3. Sif4 fuese cero o menor en magnitud que un valor predeterminado o criterio de exactitud E, la estimación x3 y los valores de x2' x4 y XI obte- nidos con ella, serían una aproximación a la solución del sistema dado. En caso contrario, habría que proponer un nuevo valor de x3 y repetir el proceso. Nótese la íntima relación que guarda este método con el de punto fijo (Cap. 2), ya que un problema multidimensional se reduce a uno unidimensional en x3 VALORES INICIALES a) De consideraciones físicas Si el sistema de ecuaciones 4.1 tiene un significado físico, con frecuencia es posible aco- tar los valores de las incógnitas a partir de consideraciones físicas. Por ejemplo, si alguna de las variables X i representa la velocidad de flujo de un fluido, ésta no podrá ser negati- va. Por tanto, Xi 2: O. En el caso de que Xi represente una concentración expresada como fracción peso o fracción molar de una corriente de alimentación, se tiene que O::::; Xi ::::; 1. (Para mayores detalles ver los ejercicios resueltos al final del capítulo).
  • 269. 258 Métodos numéricos apl icados a la' ingeniería b) Visualización de raíces en sistemas de dos ecuaciones no lineales con dos incógnitas. Sea el sistema I, (x, y) = x2 - lOx + y2 + 8 = ° !2 (x, y) = xy2 + X - lOy + 8 = ° (4.2) Algebraicamente una solución o raíz del sistema 4.2 es una pareja X, y, tal que satisface ca- da una de las ecuaciones de dicho sistema. Nos permitiremos hacer la interpretación o vi- sualización de una raíz a través de varias etapas: Al graficar la función j. (x, y), se obtiene una superficie en el espacio, como se ve en la figura 4.1. Para apreciar mejor ésta y otras gráficas, se ha incluido una inserción a color (con las Fig. 4.1 a la Fig. 4.8) en páginas más adelante. Ir 10 1.5 30 20 z O -10 Figura 4.1 Intersección de la superficie fl (x, y) con el plano xy. -20 Ir La intersección, si hay, de la superficie r¡ (x, y) con el plano x - y puede resultar en una curva el' como se muestra en la figura 4.1. A lo largo de esta curva se da el hecho de que I, (x, y) = 0, dicho de otra manera, que los puntos de esta curva son la solución de la ecua- ción j, (x, y) = O, no del sistema 4.2. Repitiendo el mismo procedimiento con la superficie de la función j', (x, y), se obtie- ne otra curva e2 en el plano x - y, que ahora resulta ser la solución de la ecuación j, (x, y) = 0, ver figura 4.2. Finalmente, las intersecciones de las curvas e, y e2 del plano x - y, resultan ser pun- tos comunes a las tres superficies.j', (x, y)'!2 (x, y) y el plano x - y; dichos puntos satis- facen ambas ecuaciones del sistema 4.2 y son precisamente las raíces X, y que buscamos, ver figura 4.3. Partiendo de la raíz mostrada en la gráfica 4.3 se pueden proponer valores iniciales. Por último, resulta muy conveniente conocer bien las características de cada método de solución del sistema 4.1 para efectuar la elección más adecuada para el mismo. Se iniciará el estudio de dichos métodos con la extensión del método de punto fijo a sistemas de ecuaciones no lineales. 4, 258 Figura 4.1 Intersección de la superficie f1 (x, y) con el plano x-y. Métodos numéricos aplicados a la· ingeniería b) Visualización de raíces en sistemas de dos ecuaciones no lineales con dos incógnitas. Sea el sistema !, (x, y) =x2 - lOx + y2 + 8 =° !2 (x, y) =xy2 + X - lOy + 8 =° (4.2) Algebraicamente una solución o raíz del sistema 4.2 es una pareja X, ji, tal que satisface ca- da una de las ecuaciones de dicho sistema. Nos permitiremos hacer la interpretación o vi- sualización de una raíz a través de varias etapas: Al graficar la función!¡ (x, y), se obtiene una superficie en el espacio, como se ve en la figura 4.1. Para apreciar mejor ésta y otras gráficas, se ha incluido una inserción a color (con las Fig. 4.1 a la Fig. 4.8) en páginas más adelante. 30 20 10 z O -10 -20 .5 La intersección, si hay, de la superficie!, (x, y) con el plano x - y puede resultar en una curva e" como se muestra en la figura 4.1. A lo largo de esta curva se da el hecho de que !, (x, y) = 0, dicho de otra manera, que los puntos de esta curva son la solución de la ecua- ción!, (x, y) =O, no del sistema 4.2. Repitiendo el mismo procedimiento con la superficie de la función!2 (x, y), se obtie- ne otra curva e2en el plano x - y, que ahora resulta ser la solución de la ecuación!2 (x, y) = 0, ver figura 4.2. Finalmente, las intersecciones de las curvas e¡ y e2 del plano x - y, resultan ser pun- tos comunes a las tres superficies:!, (x, y)'!2 (x, y) y el plano x - y; dichos puntos satis- facen ambas ecuaciones del sistema 4.2 y son precisamente las raíces X, ji que buscamos, ver figura 4.3. Partiendo de la raíz mostrada en la gráfica 4.3 se pueden proponer valores iniciales. Por último, resulta muy conveniente conocer bien las características de cada método de solución del sistema 4.1 para efectuar la elección más adecuada para el mismo. Se iniciará el estudio de dichos métodos con la extensión del método de punto fijo a sistemas de ecuaciones no lineales.
  • 270. las. (4.2) e ca- o vi- e en pun- satis- fijo a Sistema de ecuaciones no lineales 259 Figura 4.2 Intersección de la superficie f2(x, y) con el plano x-y. 1.5 0.5o y o-0.5 x-1 -1.5 -1 30 20 10 -10 Figura 4.3 Intersección d~' las superficies -20 f; (x, y) y f2(x, y) con el plano xy. 1.5 Método de punto fijo multivariable ------ 4.2 Los algoritmo s estudiados en este capítulo son, en principio, aplicables a sistemas de cual- quier número de ecuaciones; sin embargo, para ser más concisos y evitar notación compli- cada, se considerará sólo el caso de dos ecuaciones con dos incógnitas. Éstas generalmente se escribirán como: f¡(x, y) = O f2(x, y) = O (4.3) y se tratará de encontrar pares de valores (x, y) que satisfagan ambas ecuaciones. Figura 4.2 Intersección de la superficie f2 (x, y) con el plano x-y. Figura 4 .3 Intersección d:.' las superficies f; (x, y ) y f2 (x, y) con el plano x-y. -,-,..' S istema de ecuacione s no lineales 259 1.5 .-.-~ --. 1.5 4.2 Método de punto fijo multivariable Los algoritmos estudiados en este capítulo son, en principio, aplicables a sistemas de cual- quier número de ecuaciones; sin embargo, para ser más concisos y evitar notación compli- cada, se considerará sólo el caso de dos ecuaciones con dos incógnitas. Éstas generalmente se escribirán como: f ¡(x, y) = O fix, y) = O y se tratará de encontrar pares de valores (x, y ) que satisfagan ambas ecuaciones. (4.3)
  • 271. 260 Métodos numéricos ap licados a la ingeniería Como en el método de punto fijo (Sec. 2.1), y en los métodos de Jacobi y Gauss-Sei- del (Sec. 3.5), se resolverá la primera ecuación para alguna de las variables, x por ejem- plo, y la segunda para y. x = gl(x, y) y = gzCx, y) (4.4) Al igual que en los métodos mencionados, se tratará de obtener la estimación (k + l j-ési- ma a partir de la estimación k-ésima con la expresión xk+1 = g l(x'<, yk) yk+1 = gzCxk, yk) (4.5) Se comienza con valores iniciales xO, ya, se calculan nuevos valores x', yl, Y se repite el proceso, esperando que después de cada iteración los valores de xk, yk se aproximen a la raíz buscada x,)I, la cual cumple con: x = gl(X,)I) )1 = gzC X,)I) Por analogía con los casos analizados, puede predecirse el comportamiento y las caracte- rísticas de este método de punto fijo multivariable. Como se sabe, en el caso de una variable la manera particular de pasar de f (x) = O a x = g(x), afecta la convergencia del proceso iterativo. Entonces debe esperarse que la for- ma en que se resuelve para x = gl(x, y) y y = gzCx, y) afecta la convergencia de las itera- ciones (4.5). Por otro lado, se sabe que el reordenarniento de las ecuaciones en el caso lineal afec- ta la convergencia, por lo que puede esperarse que la convergencia del método en estudio dependa de si se despeja x de f2 o de fl• Finalmente, como en el método iterativo univariable y en el de Jacobi y de Gauss-Sei- del, la convergencia --en caso de existir- es de primer orden, cabe esperar que el méto- do iterativo multivariable tenga esta propiedad. Ejemplo 4.1 Encuentre una solución del sistema de ecuaciones no lineales I,(x, y) = x2 - lOx + y2 + 8 = O f2(x, y) = xy2 + X - lOy + 8 = o. Solución Con el despeje de x del término (-lOx) en la primera ecuación, y de y del término (-lOy) en la segunda ecuación, resulta: X2+y2+8 x= 10 xy2+x+8 y= 10 o con la notación de la ecuación 4.5 (x'<)2 + (yk)2 + 8 xk+1 = _ 10 x'< (yk)2 + x'< + 8 yk+1 = 10 Con los valores iniciales xO = O,ya = O, se inicia el proceso iterativo.
  • 272. a r- a- Sistema de ecuacio nes no lineales 261 1- Primera iteración Xl = 0 2 + 0 2 + 8 = 0.8 10 yl = 0(0)2 + O + 8 = 0.8 10 1- Segunda iteración el la 2 (0.8)2 + (0.8)2 + 8 x = = 0.928 10 2 0.8(0.8)2 + 0.8 + 8 O 9 Y = = . 312 10 5) Al continuar el proceso iterativo, se encuentra la siguiente sucesión de vectores: k xk yk O 0.00000 0.00000 1 0.80000 0.80000 2 0.92800 0.93120 3 0.97283 0.97327 4 0.98937 0.98944 5 0.99578 0.99579 6 0.99832 0.99832 7 0.99933 0.99933 8 0.99973 0.99973 9 0.99989 0.99989 10 0.99996 0.99996 11 0.99998 0.99998 12 0.99999 0.99999 13 1.00000 1.00000 e- c- io l- o- y) Los cálculos pueden hacerse con Matlab o con la TI-92 Plus , XO=O; yO=O; fprintf (' k x (k) y (k) n') fprintf(' %2d %10.5f %10.5fn', O, xO, yO) for k=l: 13 x1=(xOA2+yOA2+8) /10; y1= (xO*yW2+xO+8) 110; fprintf(' %2d %10.5f %10.5fn' ,k,x1,y1) xO=x1; yO=y1; end
  • 273. 262 Métodos numéricos aplicados a la ingeniería Plus e4_1 ( ) Prgm Define g1(x, y) = (xA2+yA2+8)/10 Define g2(x, y) = (x~yA2+x+8)/10 O~xO : ~yO : ~k : ClrIO Disp "k x (k) y (k) rr string (k) S." "&format (xO, "f5") ~d ds " "&format (yO, "f5") r+d : Disp d For k, 1, 13 g1(xO, yO)-+x: g2(xO, yO)-+y string (k) &" "&format (x , "f5")-+d ds " "&format (y, "f5")->d : Disp d x-+ xO : y-+ yO EndFor EndPrgm Para observar la convergencia del proceso iterativo, se pudieron usar los criterios del capítu- lo anterior, como distancia entre dos vectores consecutivos, o bien las distancias componen- te a componente de dos vectores consecutivos. También existe un criterio de convergencia equivalente al de las ecuaciones 2.10 y 3.99 que puede aplicarse antes de iniciar el proceso iterativo mencionado, y que dice: I~!ll +1~!21~M<l; 1~~11+1~~21~M<l para todos los puntos (x, y) de la región del plano que contiene todos los valores (xk, yk) y la raíz buscada (x, .9). (4.6) Una condición suficiente aunque no necesaria, para asegurar la convergencia es que Por otro lado, si M es muy pequeña en una región de interés, la iteración converge rápidamen- te; si M es cercana a 1 en magnitud, entonces la iteración puede converger lentamente. Este comportamiento es similar al del caso de una función univariable discutido en el capítulo 2. Por lo general es muy difícil encontrar el sistema 4.4 a partir de la ecuación 4.3, de modo que satisfaga la condición 4.5. De todas maneras, cualquiera que sea el sistema (4.4) a que se haya llegado y que se vaya a resolver con este método, puede aumentarse la velocidad de convergencia usando desplazamientos sucesivos en lugar de los desplazamientos simultáneos del esquema 4.5. Es decir, se iteraría mediante xk + 1 = gl(Xk, yk) r:1 = g2(xk+ 1 , yk) (4.7) Como en el caso lineal (Jacobi y Gauss-Seidel), si la iteración por desplazamientos simul- táneos diverge, generalmente el método por desplazamientos sucesivos divergería más rá- pido; es decir, se detecta más rápido la divergencia, por lo que se recomienda en general el uso de desplazamientos sucesivos en lugar de desplazamientos simultáneos. 262 Métodos numéricos aplicados a la ingeniería Plus e4_1( ) Prgm Define g1(x, y) = (x A2+yA2+8)/10 Define g2(x, y) = (x~yA2+x+8)/10 O->xO : O->yO : O->k : ClrIO Disp "k x (k) y (k) " string (k) &" "& format (xO, "f5")->d d& " " &fonnat (yO, "f5") ->d : Disp d For k, 1 , 13 g1 (xO , yO)->x : g2 (xO, yO)->y string (k) &" "&forma t (x, "f5")->d d&" " &fonnat (y, "f5")->d : Disp d x-+xO : y->yO EndFor EndPrgm Para observar la convergencia del proceso iterativo, se pudieron usar los criterios del capítu- lo anterior, como distancia entre dos vectores consecutivos, o bien las distancias componen- te a componente de dos vectores consecutivos. También existe un criterio de convergencia equivalente al de las ecuaciones 2.10 y 3.99 que puede aplicarse antes de iniciar el proceso iterativo mencionado, y que dice: Una condición suficiente aunque no necesaria, para asegurar la convergencia es que I~!ll +1~!21 ~M<l; 1~~1 1 + 1~~21 ~M<l (4.6) para todos los puntos (x, y) de la región del plano que contiene todos los valores (xk, yk) y la raíz buscada (i, .H Por otro lado, si M es muy pequeña en una región de interés, la iteración converge rápidamen- te; si M es cercana a 1 en magnitud, entonces la iteración puede converger lentamente. Este comportamiento es similar al del caso de una función univariable discutido en el capítulo 2. Por lo general es muy difícil encontrar el sistema 4.4 a partir de la ecuación 4.3, de modo que satisfaga la condición 4.5. De todas maneras, cualquiera que sea el sistema (4.4) a que se haya llegado y que se vaya a resolver con este método, puede aumentarse la velocidad de convergencia usando desplazamientos sucesivos en lugar de los desplazamientos simultáneos del esquema 4.5. Es decir, se iteraría mediante Xk+ 1 = gl(xk, yk) yk+1 = g2(xk+1, l) (4.7) Como en el caso lineal (Jacobi y Gauss-Sei~el), si la iteración por desplazamientos simul- táneos diverge, generalmente el método por desplazamientos sucesivos divergería más rá- pido; es decir, se detecta más rápido la divergencia, por lo que se recomienda en general el uso de desplazamientos sucesivos en lugar de desplazamientos simultáneos.
  • 274. Sistema de ecuaciones no lineales 263 LEjemPIO 4.2' Resuelva el sistema del ejemplo 4.1 utilizando el método de punto fijo multivariable con desplazamientos sucesivos fl(x, y) = x2 - 10x + y2 + 8 = O tix, y) = xy2 + X - 10y + 8 = O SUGERENCIA: Se pueden seguir los cálculos con un pizarrón electrónico o se programa una calculadora. Solución Al despejar x del término (-lOx) y y del término (-lOy) de la primera y segunda ecuacio- nes, respectivamente, resulta pítu- nen- ncia eso Al derivar parcialmente, se obtiene dgl 2xk dgJ 2yk -- dX 10 dy 10 dg2 (/)2 + 1 dg2 2xk+1 l dX 10 dy 10 Y evaluadas en xO = OY en yO = O dgJ =0 dgl =0 dX xO dy xO yO yO dg2 =1110 dg2 =0 dX Xl dy Xl yO yO e con lo que se puede aplicar la condición 4.6 dgl + dg2 = O + 1/10 = 1/10 < 1 dX dX ~ + dg2 = O + O = O < 1 dY dy la cual se satisface; si los valores sucesivos de la iteración: xl, y'; x2, y2; x3, y3;... la satis- facen también, se llega entonces a X, y. (4.7) Primera iteración ul- rá- eral Xl = 0 2 + 0 2 + 8 = 0.8 10 0.8(0)2 + 0.8 + 8 yl = = 0.88 10
  • 275. 264 Métodos numéricos aplicados a la ingeniería Cálculo de la distancia entre el vector inicial y el vector [Xl, i]T I x(l) - x(O)I = )(0.8 - 0.0)2 +(0.88 - 0.00)2 = 1.18929 Segunda iteración x2 = (0.8)2 + (0.88)2 + 8 = 0.94144 10 y2 = 0.94144(0.88)2 + 0.94144 + 8 = 0.96704 10 Cálculo de la distancia entre [x2, y2F y [xl, yl F: Ix(2)- X(I) I = )(0.94144 - 0.8)2 + (0.96704 - 0.88)2 = 0.16608 A continuación se muestran los resultados de las iteraciones. k xk yk Ix(k+l) - x(k) I O 0.00000 0.00000 1 0.80000 0.88000 1.18929 2 0.94144 0.96705 0.16608 3 0.98215 0.99006 0.04677 4 0.99448 0.99693 0.01411 ALI 5 0.99829 0.99905 0.00436 6 0.99947 0.99970 0.00135 Para e 7 0.99983 0.99991 0.00042 G(I, x 8 0.99995 0.99997 0.00013 DA 9 0.99998 0.99999 0.00004 10 0.99999 1.00000 0.00001 RE 11 1.00000 1.00000 0.00001 PASO PASO Hay que observar que se requirieron once iteraciones para llegar al vector solución (1,1) contra 13 del ejemplo 4.1, donde se usaron desplazamientos simultáneos. Los cálculos pueden hacerse con Matlab o con la TI-92 Plus. xO=O; yO=O; fprintf (' k x (k) y (k) Dist n') fprintf(' %2d %10.5f %10.5fn', O, xO, yO) for k=l:11 X1= (xOA2+yOA2+8) /10; Y1= (x1*yOA2+xl+8) 110; Dist= ( (x1-xO) A2+ (y1-yO) A2) AO.5; Fprintf( '%2d %10.5f %10.5f %10.5fn', k, x I , yl , Dist) XO=x1; yO=y1; End PASO
  • 276. Sistema de ecuaciones no lineales 265 E4_2 ( ) Prgm Define gl(x,y) = (xA2+yA2+8)/10 Define g2 (x,y) = (x*yA2+x+8) /10 O--+xO : O--+yO : (r+): : CirIO Disp "k x (k) y (k) " string(k) &" "&format (xO, "f5")--+d d&" "&format(yO, "f5")--+d : Disp d for k, 1, 11 gl (xO,yO)--+x " g2(x,yO)--+y string (k) &" "format (x, "f5")--+d d&" "format (y, "f5")--+d: Disp d x+xt) : y--+yO EndFor EndPrgm A continuación se presenta un algoritmo para el método de punto fijo multivariable en sus versiones de desplazamientos simultáneos y desplazamientos sucesivos. ALGORITMO 4.1 Método de punto fUo multivariable Para encontrar una solución aproximada de un sistema de ecuaciones no lineales g (x) = x, proporcionar las funciones G(I, x), 1=1, 2, ... , N Y los DATOS: El número de ecuaciones N, el vector de valores iniciales x, el criterio de convergencia EPS, el nú- mero máximo de iteraciones MAXIT y M = O para desplazamientos sucesivos o M = 1 para despla- zamientos simultáneos. RESULTADOS: Una solución aproximada x o mensaje "NO HUBO CONVERGENCIA". ,1) PASO l. Hacer K = l. PASO 2. Mientras K ~ MAXIT, repetir los pasos 3 a 14. PASO 3. Si M = O, hacer xaux = x. De otro modo continuar. PASO 4. Hacer 1 = 1. PASO 5. Mientras I ~ N, repetir los pasos 6 y 7. PASO 6. Si M = O, hacer X(I) = G(I, x). De otro modo hacer XAUX(I) = G(I, x). PASO 7. Hacer I = I + 1. PASO 8. Hacer I = 1. PASO 9. Mientras I ~ N, repetir los pasos 10 y 11. PASO 10. Si ABS (XAUX(I) - X(I) > EPS ir al paso 13. De otro modo continuar. PASO 11. Hacer I = I + 1. PASO 12. IMPRIMIR x Y TERMINAR. PASO 13. Si M = 1 hacer x = xaux. De otro modo continuar. PASO 14. Hacer K = K + 1. PASO 15. IMPRIMIR mensaje "NO HUBO CONVERGENCIA" YTERMINAR. SUGERENCIA: Desarrolle este algoritmo con Mathcad o un software equivalente. E4_2 ( ) Prgm Sistema de ecuacion es no lineales 265 Define gl(x, y) = (xA 2+yA 2+8) /10 Define g2 (x,y) = (x*yA 2+x+8) /10 O--+xO : O--+yO : O--+k : CirIO Disp "k x (k) y (k) " string (k) &" "&format (xO, " f5")--+d d&" " &format (yO, "f5") --+d : Disp d for k, 1 , 11 gl (xO,yO)--+x " g2 (x,yO)--+y string (k) &" "format (x, " f5")--+d d&" "format (y, "f5")--+ d : Disp d x--+xO : y--+yO EndFor EndPrgm A continuación se presenta un algoritmo para el método de punto fijo multivariable en sus versiones de desplazamientos simultáneos y desplazamientos sucesivos. ALGORITMO 4.1 Método de punto fUo multivariable Para encontrar una solución aproximada de un sistema de ecuaciones no lineales g (x) = x, proporcionar las funciones G(l, x), 1=1, 2, ... , N Ylos DATOS: El número de ecuaciones N, el vector de valores iniciales x, el criterio de convergencia EPS, el nú- mero máximo de iteraciones MAXIT y M = Opara desplazamientos sucesivos o M = 1 para despla- zamientos simultáneos. RESULTADOS: Una solución aproximada x o mensaje "NO HUBO CONVERGENCIA". PASO l . Hacer K = 1. PASO 2. Mientras K ::; MAXIT, repetir los pasos 3 a 14. PASO 3. Si M = O, hacer xaux = x. De otro modo continuar. PASO 4. Hacer 1= 1. PASO 5. Mientras 1::; N, repetir los pasos 6 y 7. PASO 6. Si M =O, hacer XCI) = G(I, x). De otro modo hacer XAUX(I) =G(I, x). PASO 7. Hacer! = 1+ 1. PASO 8. Hacer 1= 1. PASO 9. Mientras 1::; N, repetir los pasos 10 y 11. PASO 10. Si ABS (XAUX(I) - XCI) > EPS ir al paso 13. De otro modo continuar. PASO 11. Hacer! = 1+ 1. PASO 12. IMPRIMIR x Y TERMINAR. PASO 13. Si M = 1 hacer x = xaux. De otro modo continuar. PASO 14. Hacer K = K + 1. PASO 15. IMPRIMIR mensaje "NO HUBO CONVERGENCIA" YTERMINAR. SUGERENCIA: Desarrolle este algoritmo con Mathcad o un software equivalente.
  • 277. 266 Métodos nu méricos aplicados a la ingeniería 4.3 Método de Newton-Raphson El método iterativo para sistemas de ecuaciones converge linealmente. Como en el méto- do de una incógnita, puede crearse un método de convergencia cuadrática, es decir, el mé- todo de Newton-Raphson multivariabe, a continuación se obtendrá este procedimiento para dos variables; la extensión a tres o más variables es viable generalizando los resultados. Supóngase que se está resolviendo el sistema. Nx, y) O f2(x, y) O, Donde ambas funciones son continuas y diferenciables, de modo que puedan expandirse en serie de Taylor. Esto es: df df 1 [ d 2 f 2 f(x,y)=f(a,b)+-(x-a)+-(y-b)+- --(x-a) + dX dX 2! dXdX d 2 f d2f]2 -- (x - a) (y - b) + -- (y - b)2 + ... dXdY dXdY dondef(x, y) se ha expandido alrededor del punto (a, b) y todas las derivadas parciales es- tán evaluadas en (a, b). Expandiendo I, alrededor de (xk, yk) 1 [ d2 ,!, d2 ,!(xk+! - xk)2 + 2 --'- (xk+! - xk)(yk+' -yk) + 2! dXdX dXdy (4.8) donde todas las derivadas parciales están evaluadas en (xk , yk). De la misma forma puede expandirse f2 como sigue: (4.9) De igual manera que en la ecuación 4.8, todas las derivadas parciales de 4.9 están evalua- das en (xk, yk). Ahora supóngase que xk+1 y yk+' están cerca de la raíz buscada (x, y) que los lados iz- quierdos de las dos últimas ecuaciones son casi cero; además, asúmase que xk .y yk están 266 Métodos numéricos aplicados a la in geniería 4.3 Método de Newton-Raphson El método iterativo para sistemas de ecuaciones converge linealmente. Como en el méto- do de una incógnita, puede crearse un método de convergencia cuadrática, es decir, el mé- todo de Newton-Raphson multivariabe, a continuación se obtendrá este procedimiento para dos variables; la extensión a tres o más variables es viable generalizando los resultados. Supóngase que se está resolviendo el sistema. Nx, y) O fzCx, y) O, Donde ambas funciones son continuas y diferenciables, de modo que puedan expandirse en serie de Taylor. Esto es: f(x, y) = f(a, b) + -(x - a) + -(y - b) + - - - (x - a)2 + df df 1 [ d2 f dx dx 2! dxdx 2 - - (x - a)(y-b)+-- (y-b)2 + ...dy d 2 f 1 dxdy dxdy dondef(x, y) se ha expandido alrededor del punto (a, b) y todas las derivadas parciales es- tán evaluadas en (a, b). Expandiendof l alrededor de (xk, yk) _ _ _J 1_ (xk+ 1 _ xk)2 + 2 __J 1_ (xk+ 1 _ xk)(yk+ 1 _ yk) +1 [ d U d U 2! dxdx dxdy (4.8) donde todas las derivadas parciales están evaluadas en (xk, yk). De la misma forma puede expandirsef2 como sigue: (4.9) De igual manera que en la ecuación 4.8, todas las derivadas parciales de 4.9 están evalua- das en (xk, yk). Ahora supóngase que xk+ 1 y yk+1 están cerca de la raíz buscada (x, y) que los lados iz- quierdos de las dos últimas ecuaciones son casi cero; además, asúmase que xk -y yk están
  • 278. a e s- .8) e .9) a- IZ- Sistema de ecuaciones no lineales 267 tan próximos de y:k+ 1 que pueden omitirse los términos a partir de los que se encuentran agrupados en paréntesis rectangulares. Con esto las ecuaciones 4.8 y 4.9 se simplifican a (4.10) Para simplificar aún más, se cambia la notación con (4.11 ) y así queda la (k + l)-ésima iteración en términos de la k-ésima, como se ve a continuación (4.12) La sustitución de la ecuación 4.11 en la 4.10 y el rearreglo dan como resultado: (4.13) el cual es un sistema de ecuaciones lineales en las incógnitas h y j (recuérdese que las de- rivadas parciales de la ecuación 4.13, así como 11y12 están evaluadas en (xk, yk) y, por tan- to, son números reales). Este sistema de ecuaciones lineales resultante tiene solución única, siempre que el de- terminante de la matriz de coeficientes o matriz jacobiana J no sea cero; es decir, si Precisando: el método de Newton-Raphson consiste fundamentalmente en formar y resol- ver el sistema 4.13, esto último por alguno de los métodos vistos en el capítulo 3. Con la solución y la ecuación 4.12 se obtiene la siguiente aproximación . Este procedimiento se repite hasta satisfacer algún criterio de convergencia estableci- do. Cuando converge este método, lo hace con orden 2, y requiere que el vector (xo' Yo) es- té muy cerca de la raíz buscada (x, )1). Sistema de ecuaciones no lineales 267 tan próximos de Y!+ 1 que pueden omitirse los términos a partir de los que se encuentran agrupados en paréntesis rectangulares. Con esto las ecuaciones 4.8 y 4.9 se simplifican a (4.10) Para simplificar aún más, se cambia la notación con (4.11) y así queda la (k + l)-ésima iteración en términos de la k-ésima, como se ve a continuación (4.12) La sustitución de la ecuación 4.11 en la 4.10 y el rearreglo dan como resultado: (4.13) el cual es un sistema de ecuaciones lineales en las incógnitas h y j (recuérdese que las de- rivadas parciales de la ecuación 4.13, así comoJI yJ2están evaluadas en (Y!, yk) y, por tan- to, son números reales). Este sistema de ecuaciones lineales resultante tiene solución única, siempre que el de- terminante de la matriz de coeficientes o matriz jacobiana J no sea cero; es decir, si Precisando: el método de Newton-Raphson consiste fundamentalmente en formar y resol- ver el sistema 4.13, esto último por alguno de los métodos vistos en el capítulo 3. Con la solución y la ecuación 4.12 se obtiene la siguiente aproximación. Este procedimiento se repite hasta satisfacer algún criterio de convergencia estableci- do. Cuando converge este método, lo hace con orden 2, y requiere que el vector (xo' Yo) es- té muy cerca de la raíz buscada (x, ji).
  • 279. 268 Métodos numéricos aplicados a la ingeniería INTERPRETACiÓN GEOMÉTRICA DEL MÉTODO DE NEWTON-RAPHSON Desarrollemos en etapas esta interpretación para un sistema de dos ecuaciones. Sea el sistema f¡(x, y) = x2 + y2 - 1 Nx, y) = x2 - y2 - 1 La gráfica def¡(x, y) se muestra en la figura 4.4 . 10 2 »-> : ...·t·· .s->: , •••••••••••••••• : j¡(x,y). ......... ····1··· .'-' -~.... ' 1" . ......! . 8 6 4 .... : 2 o ...¡..... -2 2 ..... : ..:....•.:: Figura 4.4 Gráfica de la superficie fdx, y). o -1 -2 -2 Si el punto de inicio es (Xo' Yo) = (1, 1), el plano tangente a la superficie j.tx, y) en el pun- to (1, 1,f(1, 1)) se muestra en la figura 4.5. 10 5 o -5 Figura 4.5 Plano tangente -10 a la superficie 2 f1 (x, y) en el punto (1,1,1). 268 Figura 4.4 Gráfica de la superficie f¡(x, y). Figura 4.5 Métodos numéricos aplic a dos a la ingeniería INTERPRETACiÓN GEOMÉTRICA DEL MÉTODO DE NEWTON-RAPHSON Desarrollemos en etapas esta interpretación para un sistema de dos ecuaciones. Sea el sistema f¡(x, y) =X2 + y2 - 1 Nx, y) =x2 - y2 - 1 La gráfica def¡(x, y) se muestra en la figura 4.4. 10 8 6 4 2 o - 2 2 .·······f······ o .'··r·········.:····J·~I(X,y) !.... _---r" : ······L. .¡..... .. " ~ .. ...." ......j ............:: -1 -1 o -2 -2 .....: 2 Si el punto de inicio es (xo' Yo) = (1, 1), el plano tangente a la superficief¡(x, y) en el pun- to (1 , 1,ft1 , 1)) se muestra en la figura 4.5. 10 5 o - 5 Plano tangente - 10 2 a la superficie 2 fl (x, y) en el punto (1,1,1).
  • 280. Sistema de e cuaciones no lineales 269 La intersección del plano tangente con el plano x - y, en caso de existir, es una línea recta r" como puede apreciarse en la figura 4.6. ea el ..- ..-- .----_.- '-" - -- _. - - -_. - -- ~- - --- -- - - -- -- _. ~- --- - -" _.' - ~_.. .-- - -- lO 8 6 4 2 O -2 -4 -6 -8 plano tangente j af(x,y) i ". --~ Figura 4.6 Intersección del plano tangente y el plano x-y. -LO 2 -2 -1-2 Si repetimos el procedimiento con la superficie fix, y), obtenemos la recta r2, como pue- de apreciarse en la figura 4.7. lpun- .-----:-- lO -- -'-- -~ : recta /'2 _.,- ~--' :"'-. 5 plano x-y T···<, '., O -5 -lO 2 _.- :~-:':-' Figura 4.7 Intersección del plano tangente y el plano x-y para la función f2 (x, yj. ..:. '. "plano tangente, ... ::.... .- <, --..,.". a ¡.,ex,y) _.- - •• -.-.---_.- ••• _---- __ o _', - _'" 2 ".: -1 O -2 -2 Figura 4.6 Intersección del plano tangente y el plano x-y. Figura 4.7 Intersección del plano tangente y el plano x-y para la función f2 (x, y). S istema de ecuaciones no lineales 269 La intersección del plano tangente con el plano x - y, en caso de existir, es una línea recta r" como puede apreciarse en la figura 4.6. 10 8 6 4 2 O -2 -4 -6 -8 -10 2 -----------':-------------------:---- .-" ----~ - - -- - --.- - . - - ~- _.- .-_.-- ____ __ f __ ------ -2 -2 ..- ..-- .----_.-. ". - 1 "T------ -- ---~--- -.-.~ '. plano'tangente j af(x,y) i ". --~ Si repetimos el procedimiento con la superficief2(x, y), obtenemos la recta r2, como pue- de apreciarse en la figura 4.7. 10 5 O -5 -10 2 ..::.= O -1 -2 .-----"! recta /'2 --.".- - 2 :---. ro. --~--.-- Pla~ox->··"""-..j ..::.,... plano tangente .... ......:::::~.:....<.... a Nx,y) ::::... ".: 2
  • 281. 270 Métodos numéricos aplica dos a la ingeniería Finalmente, la intersección de los dos planos tangentes con el plano x-y, en caso de existir, es la intersección de la recta r, con la recta r2 , punto (x" y,), como puede verse en la figura 4.8, donde se han omitido las superficies j.tx, y) y lix,y) a fin de mostrar más claramente a (x" y,). Obsérvese que la intersección de las rectas r, y r2 corresponde a la siguiente aproximación de una solución del sistema de ecuaciones no lineales . .... 1'.. .... ; ...................¡ plano tangente 10 ..······pianotangente ¡ a/¡{x,y!.. /"',.r~""- a Nx,y) .i->" j '" ."',,,"'/ <, /',/',..-, f-'-'- -v-, -;--v-. 5 o~_5i~-10 -15 2 2Figura 4.8 Intersección de los planos tangentes y el plano xy. x -2 -2 Podemos apreciar que este punto tiene aproximadamente las coordenadas (x., y,) = (1, 0.5) Y servirán como punto de partida para la siguiente iteración. El lector encontrará a conti- nuación un inserto a color donde podrá observar mejor las intersecciones de las superfi- cies y la raíz. Un ejercicio interesante para el lector consistiría en identificar los pasos correspon- dientes entre la interpretación gráfica dada y la del método de Newton-Raphson univariable; por ejemplo, la recta tangente a la gráfica de ftx) en (xo, ftxo)) corresponde a la superficie tangente a una de las gráficas del sistema en (xo, Yo,f(xo, Yo)), etcétera. Use el método de Newton-Raphson para encontrar una solución aproximada del sistema. Ejemplo ~] 1, (x, y) = x2-lOx + y2+ 8 = O I 12(x, y) = xy2 + X - lOy + 8 = O con el vector inicial: [xc, yO]T = [O, O]T. Solución Primero se forma la matriz coeficiente del sistema 4.13, también conocida como matriz de derivadas parciales di, =2x-1O dx dl_, _ = 2y dy dl'L- = 2xy 10 dy 270 Figura 4.8 Intersección de los planos tangentes y el plano xy. ~-::1 Ejemplo 4.3 Métodos numéricos a plicados a la ingeniería 10 5 -5 - 10 -15 2 Finalmente, la intersección de los dos planos tangentes con el plano x-y, en caso de existir, es la intersección de la recta r, con la recta r2, punto (x" y ,), como puede verse en la figura 4.8, donde se han omitido las superficiesJ¡(x, y) yJix, y) a fin de mostrar más claramente a (xi' y ¡). Obsérvese que la intersección de las rectas r¡ y r2 corresponde a la siguiente aproximación de una solución del sistema de ecuaciones no lineales. ...................! plano tangente ....··piano tangente ¡ a!¡(x,y!.. a Nx,y) ....j.... ..' ox ····r·· - 2 -2 f···· 2 Podemos apreciar que este punto tiene aproximadamente las coordenadas (xl' y¡) = (1, 0.5) Yservirán como punto de partida para la siguiente iteración. El lector encontrará a conti- nuación un inserto a color donde podrá observar mejor las intersecciones de las superfi- cies y la raíz. Un ejercicio interesante para el lector consistiría en identificar los pasos correspon- dientes entre la interpretación gráfica dada y la del método de Newton-Raphson univariable; por ejemplo, la recta tangente a la gráfica de fix) en (xo, fixo)) corresponde a la superficie tangente a una de las gráficas del sistema en (xo, yo,f(xo, Yo))' etcétera. Use el método de Newton-Raphson para encontrar una solución aproximada del sistema. J, (x, y) =X2 - lOx + y2 + 8 =O I J2 (x, y) =xy2 + X - lOy + 8 =O con el vector inicial: [xo, yO]T =[O, O]T. Solución Primero se forma la matriz coeficiente del sistema 4.13, también conocida como matriz de derivadas parciales dJ¡ = 2x - 1O dx dJ_,_ = 2y dy dJ~ = 2xy 10 dy
  • 282. atrizde k Xk yk I xk+l - xk I O 0.00000 0.00000 1 0.80000 0.88000 1.18929 2 0.99179 0.99171 0.22195 3 0.99998 0.99997 0.01163 4 1.00000 1.00000 0.00004 * Nótese que I x(l) - ¡¡ID) ! = Jh2 + j2 so de r más ea la 1,0.5) conti- uperfi- espon- iable; erficie ma. Sistema de ecuaciones no lineales 271 que aumentada en el vector de funciones resulta en: 2y 2xy -10 Primera iteración Al evaluar la matriz en [xo, yO]T se obtiene: o -10 que al resolverse por eliminación de Gauss da h = 0.8, j = 0.88 al sustituir en la ecuación 4.12 se obtiene: Xl = xO + h = O + 0.8 = 0.8 yl = yO + j = O + 0.88 = 0.88 Cálculo de la distancia entre x(O)y X(I) I x(l) - x(O)I = )(0.8 - 0)2 + (0.88 - 0)2 = 1.18929 Segunda iteración Al evaluar la matriz en [.xl; yl]T resulta [ -8.4 1.7744 -1.41440J -0.61952 1.76 -8.592 que por eliminación gaussiana da como nuevos resultados de h y j h = 0.19179,j = 0.11171 de donde: x2 = Xl + h = 0.8 + 0.19179 = 0.99179 y2 = yl + j = 0.88 + 0.11171 = 0.99171 Cálculo" de la distancia entre x(l) y x(2): I x(2)- x(l) I = ) (0.99179 - 0.8)2 + (0.99171 - 0.88)2 = 0.22190 Con la continuación de este proceso iterativo se obtienen los resultados siguientes:
  • 283. 272 Métodos numéricos apli cados a la ingeniería Hay que observar que se requirieron cuatro iteraciones para llegar al vector solución (1,1) contra once del ejemplo 4.2, donde se usó el método de punto fijo con desplazamien- tos sucesivos. Sin embargo, esta convergencia cuadrática implica mayor número de cálcu- los, ya que, como se puede observar, en cada iteración se requiere: a) La evaluación de 2 X 2 derivadas parciales. b) La evaluación de 2 funciones. e) La solución de un sistema de ecuaciones lineales de orden 2. Estos cálculos pueden realizarse con Matlab o con la TI-92 Plus. xO=O; yO=O; fprintf(' k fprintf(' %2d for k=l : 4 df1x=2*xO-1 O; df1y=2*yO; df2x=yOA2+1; df2y=2*xO*yO-10; f1=xOA2-10*xO+yOA2+8; f2=xO*yOA2+xO-10*yO+8 ; A=[df1x df1y; df2x df2y]; b=[-f1; -f2]; trj=inv tAr=b, x1=xO+hj (1); y1=yO+hj (2); Dist= ( (x1-xO) A2+(y1-yO) A2) AO.5; fprint(' %2d %10.5f %10.5f xO=x1; yO=y1; end x (k) %10.5f Y (k) Ix(k+1) -x (k) 1 n') %10.5fn' l O, xO, yO) %10.5fn', k, xl, y1, Dist) e4_3 ( Prgm Define f1 (x, y) = xA2-10':'x+yA2+8 Define f2 (x, y) =x*yA 2+x-lCI'y+8 Define df1x(x, y) =2*x-10 Define df1y(x, y) =2*y Define df2x(x, y) =yA 2+1 Define df2y(x, y) =2*x*y-10; O->xO O->yO 0-> k CirIO Disp"k x (k) y(k) Ix(k+1) -x(k)l" string(k) &" "&format (xO, "f5")->d d&" "%format (yO, "f5")--+d : Disp d For k, 1, 4 [df1x(xO,yO) ,df1y(xO,yO); df2x(xO,yO) ,df2y(xO,yO) ]--+a [-f1(xO, yO); -f2(xO,yO)]--+b simuit(a,b)--+dx : xO+dx[l]--+x : yO+dx[2]--+y norm (dx) +ai st: : norm (x) --+ x : norm (y)--+y string(k) '&" "&format (x, "f5")-td as" "&format (y1, "f5") +d : Disp d x+xt) : y->yO EndFor EndPrgm 272 Métodos numéricos aplicados a la ingeniería Ha~ que observar que se requirieron cuatro iteraciones para llegar al vector solución (1, 1) contra once del ejemplo 4.2, donde se usó el método de punto fijo con desplazamien- tos sucesivos. Sin embargo, esta convergencia cuadrática implica mayor número de cálcu- los, ya que, como se puede observar, en cada iteración se requiere: a) La evaluación de 2 X 2 derivadas parciales. b) La evaluación de 2 funciones. e) La solución de un sistema de ecuaciones lineales de orden 2. Estos cá1cuios pueden realizarse con Matlab o con la TI-92 Plus. xO=O ; yO=O ; fprintf( ' k x (k) Y (k) Ix(k+1) -x (k) I n') fprintf (' %2d %1 0.5f %10 . 5fn ', · O, xO , yO) for k=l : 4 dflx=2*xO- 1O; dfly=2*yO ; df2x=yO A 2+1; df2y=2*xO*yO-1 O; f1=xO A2-10*xO+yOA2+8; f2=xO*yOA2+xO-10*yO+8 ; A=[df1x df1y; df2x df2y] ; b=[-fl; -f2]; hj=inv (A) ':'b; x1=xO+hj (1) ; y1=yO+hj (2); Dist= ((x1-xO) A2+ (y1-yO) A2) AO. 5; fprint ( , %2d xO=x1 ; y O=y1 ; end Prgm %10 . 5f %1 0.5f %10.5fn' , k, xl , y1 , Dist ) Define fl (x, y) = x A2-10':'x+yA2+8 Define f2 (x, y) =x*yA2+x-1(J''''y+8 Define dflx(x, y) =2*x-10 Define dfly (x , y ) =2*y Define df2x (x, y ) =yA2+1 Define df2y(x , y) =2*x*y-10 ; O->xO O->yO 0->k C1rIO Disp "k x (k) y(k) Ix(k+1) -x (k)1 " string(k) &" " &format (xO, " f5")->d d&" " %format (yO , " f5") --+d : Disp d For k, 1 , 4 [dflx(xO , yO) ,dfly(xO, yO); df2x(xO,yO) ,df2y(xO,yO) ]->a [-fl (xO , yO) ; -f2 (xO ,yO) ] --+b simu1t(a , b ) ->dx : xO+dx[l]->x : yO+dx[2]--+y norm (dx) ->dist : norm (x) --+x : norm (y ) --+y string (k ) '&" " &format (x, " f5 ") --+d d& " " &format (y1, " f5 ") ->d : Disp d x--+xO : y--+yO EndFor EndPrgm
  • 284. ción ien- álcu- 1.5 ,1 Con el fin de ayudar al lector a visualizar la idea de raíz y el método de Newton-Raph- son, se presentan a continuación las gráficas de las Fig. 4.1 a la Fig. 4.8 a color. 10 .............. r········ " ..-.; . -; ..... --- -----f--- -o, 30 20 --'~' .," . ~ --- r..···--······ :.. .......... z O -10 -20 y -1 -1.5 -1 Figura 4.1 Intersección de la superficie fl (x, y) con el plano x-y. 30 20 10 ....-.~-_.... __ ..... --' ~" - -10 -20 1 1.5 0.5 Figura 4.2 Intersección de la superficie f2(x, y) con el plano x-y. Con el fin de ayudar al lector a visualizar la idea de raíz y el método de Newton-Raph- son, se presentan a continuación las gráficas de las Fig. 4.1 a la Fig. 4.8 a color. .--'- ;-" -;-_...--- ... .....:-._- 30 20 10 z O -10 -20 .5 Figura 4.1 Intersección de la superficie fl (x, y) con el plano xy. 30 20 10 z O -10 -20 1.5 x Figura 4.2 Intersección de la superficie f2 (x, y) con el plano xy.
  • 285. ·'!!I -----T--------- 30 10 1------------- .¡------ ---¡- ----~- ----------------- 20 -- ----~ - -_o~ _ ..... z O -10 -20 Raíz 1.5 O 0.5 Y -1 -1.5 -1 Figura 4.3 Intersección de las superficies fl [x, yj y f2(x, yj con el plano x-y. 1 .............. :..•:::..,.... >::-- 2 - _.' - ~-o_ 8 .-' ~- 10 L .-:-.-' ¡---. o, "o. ~-o._ 6 4 --0-00: 2 --o.; O -2 2 O -1 -2 -2 Figura 4.4 Gráfica de la superficie fdx, yj.
  • 286. 10 t,(X:y)················· ~ , . 5 o -5 2-10 2 1 -2 -2 Figura 4.5 Plano tangente a la superficie ~ (x, yj en el punto (1, 1. 1J. 10 8 6 ·····-------:-----------------------l------- 1,··· 4 2 O -2 -4 -6 ----1 plano tangentej af(x,y) .. ¡ ...:::::,;... . :-8 -10 2 -2 -2 -1 Figura 4.6 Intersección del plano tangente y el plano xy. 10 5 o -5 -10 2 punto de -2 Figura 4. S Plano tangente a la superficie r,Ix. YI en el punto 11 , 1, I}. 10 .................!...................._._"["---.._......···-.·.-.·.-.--.1._.... ......._---------_ ...!.-----------: : ¡ ! -----t------------- - 8 6 4 2 - 2 -6 -8 - 10 2 Figura 4.6 Intersección del plano tangente y el plano x:y. .. plano tangente.! .. af(x,y) .. i .... i ......-...! ._------! 2
  • 287. == 5 ··----1 I recta r2 .-- - --'"'~- --r' '-nr.---.-_ -------;--. r r <. ¡:.----- -; ¡.___ r----- p,~L~-yJ 10 o -5 -10 2 --_::-'~~:--- ...:::,,:.... plano tange~~~....:::>..... .:::-::< a Nx,y) .'.::. .1 O 2 -1 -2 -2 Figura 4.7 Intersección del plano tangente y el plano x-y para la función f2 (x, y). ---r-- ----1 ......................¡ plano tangente 10 ..········píá"nütangente i af¡(x,y!... aNx,y) ... .: ..' 5 Pa .•..... ": ..;Piá,;; O z -5 -10 -15 2 2 O na x -2 -2 Figura ~.8 Intersección de los planos tangentes y el plano x-y. -5 -10 2 O 10 5 1 O - 1 - ---_:-:.~.-.-:-- ----;-., -----r r-- t plano tangente____ -------- a .f;;(x,y) __-_------- F¡9~ra4. 7 Inte"eCC/ón del plano tongente y el plano x,y Para la función "'x.J1.-2 -2 - 1 O 1 ____o_oro 10 -------:-----------------T plano t~gente ----------plano tangente! af¡(x,y) _ a.f;;(x,y) ---1---- ______ 5 O z -5 -10 -15 2 O x , .-- : -1 F¡9~r. ~.8Inte"eCC/ón de lo, Plano, tangente, y el plano x,y -2 -2 -1 ro-o. ':----... -'f-··. r~ct~-;;---'7 '--'""-----... 1 2 2
  • 288. Sistema de ecuaciones no l ineales 273 GENERALIZACiÓN Para un sistema de n ecuaciones no lineales con n incógnitas (véase Ec. 4.1) y retornando la notación vectorial y matricial, las ecuaciones 4.13 quedan: di] h] + di] h2 + + di] h =-/] dx¡ dX2 dX II 11 dl2 h] + dl2 h2 + + dl2 hll =':"/2- dx] dX2 dXn (4.14) dJ" h] + dJ" h2 + + dJ" hl1 = -:J" dx¡ dX2 dXn o lh =-f donde las funciones f y las derivadas parciales d/¡I dxj , i = 1,2, ... , n;j = 1,2, ... , n están evaluadas en el vector x(k) y . h. = x.k+] ~ xk " , 1 :s; i:S; n (4.15) De donde: xk+] =xk+h. , " 1:s; t-: n (4.16) o x(k+]) = x(k) + h(k) y la matriz de derivadas parciales (matriz jacobiana), ampliada en el vector de funciones queda: di] dl¡ di] -/] dx] dX2 dXII d/2 d/2 d/2 -/2 dx] dX2 dx" dJ" dJ" ~f" -J" dx] dX2 dXn (4.17) o bien: [ll-f] Se presenta a continuación un algoritmo para este método. ALGOR¡TMO 4.2 Método de Newton-Raphson multivariable Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar la matriz jacobia- na ampliada con el vector de funciones (véase Ec. 4.17) y los DATOS: El número de ecuaciones N, el vector de valores iniciales x, el número máximo de iteraciones MA- XIT y el criterio de convergencia EPS .
  • 289. H 274 Métodos numéricos apli cados a la ingeniería RESULTADOS: El vector solución xn o mensaje "NO CONVERGE". PASO 1. Hacer K = 1. PASO 2. Mientras K::; MAXIT, repetir los pasos 3 a 9. PASO 3. Evaluar la matriz jacobiana aumentada (4.17). PASO 4. Resolver el sistema lineal (4.14). PASO S. Hacer" xn = x + h. PASO 6. Si 1 xn - x l » EPS ir al paso 8 . De otro modo continuar. PASO 7. IMPRIMIR xn y TERMINAR. PASO 8. Hacer x = xn. PASO 9. Hacer K = K + 1. PASO 10. IMPRIMIR "NO CONVERGE" Y TERMINAR. Ejemplo 4.4 Con algoritmo 4.2, elabore un programa de propósito general para resolver sistemas de ecuaciones no lineales. Luego úselo para resolver el sistema. J¡ 1¡ (xi' x2' x3) = 3xI - cOS(x2x3) - 0.5 = O 11(XI' xl' X3) = x¡l - 625xl = O f ( ) -xx 20 (1On:-3) O 3 Xi' x2, x3 = e '2 + X3 + 3 = ~ ~ En el disco se presenta el programa 4.1, que consta de los subprogramas GAUSSJORDAN y PIVOTEO, de propósito general; es decir, no dependen del sistema de ecuaciones para resolver. El usuario deberá escribir el programa principal que llama al subprograma FUNCIO- NES, donde proporcionará la matriz jacobiana ampliada (Ec. 4.17). La matriz jacobiana ampliada para el sistema es: 4.4Solución o -3xI + cOS(xlx3) + 0.5 ] -x21 + 625x -x < 20 10 rt - 3. -e '"2_ X3 ---- 3 x3 sen (xzX3) -1250xl 20 El programa queda finalmente como se muestra en el disco (programa 4.1). Su ejecución con el vector inicial [1 1 I]T produce los siguientes resultados. k Xl Xz x3 Distancia O 1.00000 1.00000 1.00000 1 0.90837 0.50065 -0.50286 1.5863 2 0.49927 0.25046 -0.51904 0.47982 3 0.49996 0.12603 -0.52045 0.12444 4 0.49998 0.06460 -0.52199 0.61446E-Ol 5 0.49998 0.03540 -0.52272 0.29214E-Ol 6 0.49998 0.02335 -0.52302 0.12052E-Ol 7 0.49998 0.02024 -0.52309 0.31095E-02 8 0.49998 0.02000 -0.52310 0.23879E-03· 9 0.49998 0.02000 -0.52310 0.14280E-05 • Operaciones vectoriales.
  • 290. a 0- ión Sistema de ecuaciones no lineales 275 La solución del sistema es: XI 0.49998176 x2 0.19999269E-Ol x3 -0.52310085 Los cálculos también pueden realizarse usando el guión de Matlab dado en el ejemplo 4.3, con los cambios correspondientes. Nótese que en cada iteración se requiere: a) La evaluación de n2 derivadas parciales, b) La evaluación de n funciones, e) La solución de un sistema de ecuaciones lineales de orden n, lo que representa una inmensa cantidad de cálculos. Debido a esto, se han elaborado mé- todos donde los cálculos no son tan numerosos y cuya convergencia es, en general, supe- rior a la del método de punto fijo (superlineal). A continuación se presentan dos de estos métodos, el de Newton-Raphson modificado y el método de Broyden, siendo este último también una modificación del método de Newton-Raphson. 4.4 Método de Newton-Raphson modificado El método de Newton Raphson modificado que se describe a continuación consiste en aplicar el método de Newton-Raphson univariable dos veces (para el caso de un sistema de n ecuaciones no lineales con n incógnitas, se aplicará n veces), una para cada variable. Cada vez que se hace esto, se consideran las otras variables fijas. Considérese de nuevo el sistema 11(X, y) = O 12(x, y) = O Tomando los valores iniciales xO, yO, se calcula a partir del método de Newton-Raphson univariable un nuevo valor xl así: fJ1/ox evaluada en xD, yO. Hay que observar que se ha obtenido xl a partir de 11 y los valores más recientes de x y y: xO, yO. Ahora emplearemos 12 y los valores más recientes de x y y: x', yO para calcular y1 l _ ° 12(Xl, yO) Y -y - fJNfJy , donde fJ1ifJy se evalúa en xl, yO. Se tiene ahora xl y yl. Con estos valores se calcula X2, des- pués y2, y así sucesivamente. Este método converge a menudo si xD, yO está muy cerca de x, y, y requiere la evaluación de sólo 2n funciones por paso (cuatro para el caso de dos ecuaciones que se está manejando). Hay que observar que se han empleado desplazamientos sucesivos, pero los desplaza- mientos simultáneos también son aplicables. Sistema de ecuaciones no lineales 275 La solución del sistema es: XI 0.49998176 x2 0.19999269E-01 x3 -0.52310085 Los cálculos también pueden realizarse usando el guión de Matlab dado en el ejemplo 4.3, con los cambios correspondientes. Nótese que en cada iteración se requiere: a) La evaluación de n2 derivadas parciales, b) La evaluación de n funciones, e) La solución de un sistema de ecuaciones lineales de orden n, 10 que representa una inmensa cantidad de cálculos. Debido a esto, se han elaborado mé- todos donde los cálculos no son tan numerosos y cuya convergencia es, en general, supe- rior a la del método de punto fijo (superlineal). A continuación se presentan dos de estos métodos, el de Newton-Raphson modificado y el método de Broyden, siendo este último también una modificación del método de Newton-Raphson. 4.4 Método de Newton-Raphson modificado El método de Newton Raphson modificado que se describe a continuación consiste en aplicar el método de Newton-Raphson univariable dos veces (para el caso de un sistema de n ecuaciones no lineales con n incógnitas, se aplicará n veces), una para cada variable. Cada vez que se hace esto, se consideran las otras variables fijas. Considérese de nuevo el sistema JI (x, y) = O J2 (x, y) = O Tomando los valores iniciales xO, yO, se calcula a partir del método de Newton-Raphson univariable un nuevo valor xl así: fJJ/fJx evaluada en xO, yO. Hay que observar que se ha obtenido Xl a partir deJI y los valores más recientes de x y y: xO, yO. Ahora emplearemos J2 y los valores más recientes de x y y: x l, yO para calcular yl I _ ° J2(Xl, yO) Y - y - fJNfJy , donde fJJifJy se evalúa en xl, yO. Se tiene ahora Xl y yl. Con estos valores se calcula X2, des- pués y2, y así sucesivamente. Este método converge a menudo si xO, yO está muy cerca de x,y, y requiere la evaluación de sólo 2n funciones por paso (cuatro para el caso de dos ecuaciones que se está manejando). Hay que observar que se han empleado desplazamientos sucesivos, pero los desplaza- mientos simultáneos también son aplicables.
  • 291. d 276 Métodos numéricos aplicados a la ingeniería Ejemplo 4.5 Resuelva el sistema i, (x, y) = X2 - lOx + y2 + 8 = O f2 (x, y) = xy2 + X - lOy + 8 = O Con el método de Newton-Raphson modificado, usando los valores iniciales .xO = O,yO = O. Puede seguir los cálculos con un pizarrón electrónico. Solución Primero se obtiene: d!, = 2.x_ 10 dX y d!2 -=2xy-1O dy Primera iteración Se evalúan j'¡ y dj/dX en [O,O]T: t.(O, O) = 8 y se sustituye 8 xl =0---=0.8 -10 Para el cálculo de y' se necesita evaluar f2 y d!idy en x', yO !2(0.8,0) = 0.8(0) + 0.8 - 10(0) + 8 = 8.8 df2 = 2(0.8)(0) - 10 =-10 dX xl yO se sustituye: 8.8 yl = O- -- = 0.88 -10 Segunda iteración NO.8, 0.88) = 1.4144 = -8.4 x' y' y x2 = 0.8 _ 1.4144 = 0.96838 -8.4 Ahora se evalüan z, y d!idY en (x2, y'): !2(0.96838,0.88) = 0.91830 = -8.29565 x2 yl y 276 Métodos numéricos aplicados a la ingeniería Ejemplo 4.5 Resuelva el sistema JI (x, y) =X2 - lOx + y2 + 8 =O J2 (x, y) =xy2 + x - lOy + 8 =O Con el método de Newton-Raphson modificado, usando los valores iniciales xfJ =O, yO =O. Puede seguir los cálculos con un pizarrón electrónico. Solución Primero se obtiene: d!1 = 2x - 10 dx y d!2-= 2xy -1O dy Primera iteración Se evalúan!1 y d/¡ldx en [O, O]T: y xfJ =-10 yO se sustituye 8 xl = O- - - = 0.8 -10 Para el cálculo de yI se necesita evaluar!2 y dJ/dy en Xl, yO !2 (0.8,0) = 0.8(0) + 0.8 - 10(0) + 8 = 8.8 X l = 2(0.8)(0) - 10 = -10 se sustituye: Segunda iteración yO I 8.8 y =0--=0.88 - 10 /¡(0.8, 0.88) = 1.4144 y Xl yI 1.4144 x2 =0.8 - =0.96838 -8.4 Ahora se eva1úan!2 y d!2/dyen (x2, yl): J2 (0.96838,0.88) = 0.91830 y x2 yI = -8.4 =-8.29565
  • 292. Sistema de ecuaciones no lineales 277 de donde: 0.91830 y2 = 0.88 - = 0.99070 -8.59565 = O. Los cálculos pueden continuarse y observarse con Matlab o con la TI-92 Plus xO=O; yO=O; fprintf(' k fprintf ( , %2d for k=l : 10 f1=xOA2-1U~xO+yOA2+8; dflx=2*xO-1 O; x1=xO-fl/dflx; f2=x1*yOA2+x1-10*yO+8; df2y=2* xl *yO-1 O; y1=yO-f2/df2y; fprintf(' %2d%10.5f%10.5f%10.5fn', Dist= ( (x1-xO) A2+ (y1-yO) A2) AO. 5; If Dist < Eps Break end xO=x1; yO=y1; end k, xl, y1, Dist) Eps=le-5; x (k) Y (k) Distn') %10.5f %1O.5fn', O, xO, yO) e4_5 ( Prgm Define f1(x,y) = xA2-10*x+yA2+8 Define f2 (x,y) =x*yA2+x-1U~y+8 Define df1x(x,y) =2*x-10 Define df2y(x,y) =2*x*y-10 O-+xO : O-+yO : O+k. : 1E-5->eps : CirIO Disp "k x (k) y(k) Ix(k+1) -x (k) I " string(k) &" "&format (xO, "f5")->d d&" "&format (yO, "f5") +a : Disp d for k, 1, 6 xO-fl (xO,yO) /dflx (xO,yO)-+x yO-f2 (xO,yO) /df2y (xO,yO)->y -Y ((x-xO) A2+ (y-yO) A2) =di st: string (k) &" "&format (x, "f5")-+d d&" "&format (y, "f5")-+d d&" "&format (dist, "f5")->d: Disp d x-+ xO : y-+ yO EndFor EndPrgm l· Se sugiere al lector continuar las iteraciones y calcular las distancias entre cada dos vec- tores consecutivos. Continúe hasta que xk "" 1 Y yk "" l. Compare además la velocidad de convergencia de este método con la velocidad de convergencia del método de Newton- Raphson y el de punto fijo para este sistema particular. Sistema de ecuaciones no lineales 277 de donde: 0.91830 y2=0.88 - =0.99070 -8.59565 Los cálculos pueden continuarse y observarse con Matlab o con la TI-92 Plus xO=O; yO=O ; Eps=le-5 ; fprintf( ' k x(k) Y (k) Distn ') fprintf (' %2d %10 . 5f %10 . 5fn ', O, xO , yO) for k =l : 10 f1=xO A2-10'xO+yOA2+8; dflx=2':'xO-1 O; x1=xO-fl/dflx; f2=x1*yOA2+x1-10*yO+8 ; df2y=2*x1*yO-1 O; y1=yO-f2/df2y; fprintf( ' %2d%10 . 5f%10 . 5f%10 . 5fn', k , xl , y1 , Dist) Dist= ((x1-xO) A2+ (y1-yO) A2) AO . 5 ; I f Dist < Eps Break end xO=x1; yO=y1 ; end Prgm Define f1 (x , y) = x A2-10*x+yA2+8 Define f2(x , y) =x*yA2+x-10"y+8 Define dflx(x, y) =2*x-10 Define df2y(x , y) =2"x*y-10 O->xO : O->yO : O->k : 1E-5->eps : ClrIO Disp "k x (k) Y (k) Ix(k+1) -x (k ) I " string(k) &" "&format (xO, " f5")->d d&" " &format (yO, "f5")->d : Disp d for k, 1, 6 xO-fl (xO , yO)/dflx(xO ,yO) ->x yO-f2 (xO,yO) /df2y (xO,yO)->y ,¡ ((x-xO) A2+ (y-yO) A2) ->dist string (k) &" " &format (x, "f5") -> d d&" " &format (y, " f5")->d d&" " &format (di st , "f5") ->d : Disp d x->xO : y->yO EndFor EndPrgm Se sugiere al lector continuar las iteraciones y calcular las distancias entre cada dos vec- tores consecutivos. Continúe hasta que xk "" 1 Yyk "" 1. Compare además la velocidad de convergencia de este método con la velocidad de convergencia del método de Newton- Raphson y el de punto fijo para este sistema particular.
  • 293. 278 Métodos numéricos apli cados a la ingeniería En la aplicación de este método se pudo tomar f2 para evaluar xl y fl' a fin de evaluar y1, así: 4 Xl = xO _ f2 (x o , ya) af¡ax ' I, (x', ya) yl = ya _ -----''-- __ af/oy , Esto puede producir convergencia en alguno de los arreglos y divergencia en el otro. Es po- sible saber de antemano si la primera o la segunda forma convergirán" para el caso de siste- mas de dos ecuaciones, pero cuando 3 ~ n las posibilidades son varias (n!) y es imposible conocer cuál de estos arreglos tiene viabilidad de convergencia, por lo cual la elección se con- vierte en un proceso aleatorio. Esta aleatoriedad es la mayor desventaja de este método. En general, para un sistema de n ecuaciones con n incógnitas: x" x2' ... , XII' el algorit- mo toma la forma: 1 ~ i ~ n (4.18) al; I -.. (k+ I k+ I k+ I k k) OX¡ Xl ' X2 , ... Xi_1 ' Xi , ... 'Xn. ALGORITMO 4.3 Método de Newton-Raphson modificado Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar las funciones F (1, x) y las derivadas parciales D (1, x) y los DATOS: El número de ecuaciones N, el vector de valores iniciales x, el número máximo de iteraciones MA- xrr, el criterio de convergencia EPS y M=O para desplazamientos sucesivos o Mel para desplaza- mientos simultáneos. RESULTADOS: El vector solución xn o mensaje "NO CONVERGE". PASO l. Hacer K =1. PASO 2. Mientras K:S; MAXIT, repetir los pasos 3 a 11. PASO 3. Si M = O hacer* xaux = x. PASO 4. Hacer 1 = 1. PASO 5. Mientras 1 :s;N, repetir los pasos 6 y 7. PASO 6. Si M = O hacer. XCI) = X(I)-F(I,x)/D(I,x). De otro modo hacer: XAUX(I) = XCI) - F(I,x)ID(I,x). PASO 7. Hacer 1 = 1 + 1. PASO 8. Si I xaux -x I >EPS ir al paso LO. De otro modo continuar. PASO 9. IMPRIMIR x y TERMINAR. PASO lO. Si M = l hacer x = xaux. PASO ll. Hacer K = K + 1. PASO 12. IMPRIMIR "NO CONVERGE" Y TERMINAR. *' Operaciones vectoriales. El método siguiente puede saltarse sin pérdida de continuidad . • Peter A. Stark. lntroduction lo Numeral Methods. Ed. McMillan. 278 Métodos numéricos aplicados a la ingeniería En la aplicación de este método se pudo tomarJ2 para evaluar x l yJI' a fin de evaluar y1, así: Xl = xO_ J2(xO, yO) dJldX ' JI (Xl, yO) y l= yO _ _ '-----__ dJ/ay , Esto puede producir convergencia en alguno de los arreglos y divergencia en el otro. Es po- sible saber de antemano si la primera o la segunda forma convergirán*para el caso de siste- mas de dos ecuaciones, pero cuando 3 ~ n las posibilidades son varias (n!) y es imposible conocer cuál de estos arreglos tiene viabilidad de convergencia, por lo cual la elección se con- vierte en un proceso aleatorio. Esta aleatoriedad es la mayor desventaja de este método. En general, para un sistema de n ecuaciones con n incógnitas: x I' x2' . .. , XII' el algorit- mo toma la forma: 1 ~ i ~ n (4.18) dh I:'1 (k+ I k+ I k+ I k k) ax¡ XI ' X2 , ... Xi_1 ' Xi , ... 'XH ALGORITMO 4.3 Método de Newton-Raphson modificado Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar las funciones F (1, x) y las derivadas parciales D (1, x) y los DATOS: El número de ecuaciones N, el vector de valores iniciales x, el número máximo de iteraciones MA- x¡!r, el criterio de convergencia EPS y M=Opara desplazamientos sucesivos o M=l para desplaza- mientos simultáneos. RESULTADOS: El vector solución xn o mensaje "NO CONVERGE". PASO l. Hacer K =1. PASO 2. Mientras K :o; MAXIT, repetir los pasos 3 a 11. PASO 3. Si M = Ohacer* xaux = x. PASO 4. Hacer I = 1. PASO 5. Mientras I :o; N, repetir los pasos 6 y 7. PASO 6. Si M = Ohacer. X(I) = X(I)-F(I,x)/D(I,x). De otro modo hacer: XAUX(I) = X(I) - F(I,x)ID(I,x). PASO 7. Hacer 1= I + 1. PASO 8. Si 1 xaux -x 1 >EPS ir al paso LO. De otro modo continuar. PASO 9. IMPRIMIR x y TERMINAR. PASO lO. Si M =1 hacer x = xaux. PASO l l. Hacer K = K + 1. PASO 12. IMPRIMIR "NO CONVERGE" Y TERMINAR. *' Operaciones vectoriales. El método siguiente puede saltarse sin pérdida de continuidad. * Peter A. Stark. lnlroduction lo Numeral Methods. Ed. McMillan.
  • 294. Sistema de ecuaciones no lineales 279 4.5 Método de Broyden Considérese ahora la generalización del método de la secante a sistemas multivariables, conocido como el método de Broyden. Según se vio en el capítulo 2, el método de la se- cante consiste en remplazar f I (xk ) del método de Newton-Raphson (4.19) por el cociente: e- le n- f(Xk) - f(xk_l) ""l' (x k ), xk -xk _ 1 obtenido con los resultados de dos iteraciones previas: xk y xk+1. Para ver la modificación o aproximación correspondiente del método de Newton- Raphson multivariable, conviene expresarlo primero en forma congruente con la ecuación 4.19, lo que se logra sustituyendo en la ecuación vectorial (véase Ec. 4.16) X(k+l) = x(k) + h(k) (4.20) el vector h(k) que, como se sabe, es la solución del sistema ]<k) h(k) = _f{k) Al multiplicar esta última ecuación por (J(k))-I se obtiene: h(k) = _(]<k))-I f{k) Y al remplazar la ecuación 4.21 en la 4.20 se llega a: x(k+I) = xCk)_(J(k)tl f{k) (4.21) (4.22) la ecuación correspondiente a la 4.14 para n > l. El método de la secante para sistemas de ecuaciones no lineales consiste en sustituir ](k) en la ecuación 4.22 con una matriz A(k) , cuyos componentes se obtienen con los resul- tados de dos iteraciones previas x(k) y x(k-I), de la siguiente manera": [f(X(k)) - f(X(k-I)) _A(k-I) (x(k) _ x(k-l))] (X(k) _ xCk-I))T A(k) = A(k-I) + _ l X(k) - x(k-I)J2 (4.23) o bien: (4.24) con la notación L'lf{k) = fX(k) - f(x(k-I)) L'lX(k) = x(k) - X(k-I) Para la primera aplicación de la ecuación 4.24 se requieren dos vectores iniciales: x(O) y x(l). Este último puede obtenerse de una aplicación del método de Newton-Raphson mul- tivariable * Dermis, J.E. Jr. y J.J. More (1977), "Quasi-Newton Methods, Motivation and Theory". SIAM Review, 19, No. 1 (46-89). Sistema de ecuaciones no lineales 279 4.5 Método de Broyden Considérese ahora la generalización del método de la secante a sistemas multivariables, conocido como el método de Broyden. Según se vio en el capítulo 2, el método de la se- cante consiste en remplazar! ' (xk) del método de Newton-Raphson por el cociente: ! (Xk) - ! (xk_ l ) "" l' (x k ), xk - xk _ 1 obtenido con los resultados de dos iteraciones previas: x k y x k+ 1. (4.19) Para ver la modif:.cación o aproximación correspondiente del método de Newton- Raphson multivariable, conviene expresarlo primero en forma congruente con la ecuación 4.19, lo que se logra sustituyendo en la ecuación vectorial (véase Ec. 4.16) X(k+l ) = X(k) + h (k) el vector h (k) que, como se sabe, es la solución del sistema J (k) h (k) =_ f{k) Al multiplicar esta última ecuación por (J(k»)-I se obtiene: h (k) = _(J(k»)- I f{k) y al remplazar la ecuación 4.21 en la 4.20 se llega a: X(k+ I) =x (k) _(¡(k»)- I f{k) la ecuación correspondiente a la 4.14 para n > l. (4.20) (4.21) (4.22) El método de la secante para sistemas de ecuaciones no lineales consiste en sustituir ¡(k) en la ecuación 4.22 con una matriz A(k) , cuyos componentes se obtienen con los resul- tados de dos iteraciones previas x (k) y x (k-Il, de la siguiente manera*: [f(X(k») - f(X(k- I») _A(k- I) (X(k) _ x (k- l »)] (X(k) _ x (k-I»)T A (k) =A (k- I ) + _ _ ___ _ __...,..,..,-_--,:-...,..,.-:,--_ _ _ ___ 1X(k) _ x(k- I)12 o bien: con la notación [óf{k) - A (k- I) ÓX(k)] (óx(k»)T A (k) = A (k- I) + __________ _ 1 Ó x(k) 12 óf{k) = fX(k) - f(x(k-I») óx(k) = x (k) - X(k-I) (4.23) (4.24) Para la primera aplicación de la ecuación 4.24 se requieren dos vectores iniciales: x (O) y X( I). Este último puede obtenerse de una aplicación del método de Newton-Raphson mul- tivariable * Dennis, J.E. Jr. y J.J. More (1977), "Quasi-Newton Methods, Motivation and Theory". SIAM Review, 19, No. (46-89).
  • 295. Ir em= 280 Métodos numéricos aplicados a la ingeniería cuya J(O)a su vez puede emplearse en 4.24, con lo cual ésta queda: (M(I) - J(O)~(l)) (L'lx(l))T A(l)= J(O)+---------- 1 L'lx(l) 12 (4.25) La inversión de A (k) en cada iteración significa un esfuerzo computacional grande (del or- den de n3) que, sin embargo, puede reducirse empleando una fórmula de inversión matri- cial de Sherman y Morrison. * Esta fórmula establece que si A es una matriz no singular y x y y son vectores, entonces A + xyT es no singular, siempre que yT A-I x =F l. Además, en este caso, A-I xyT A-I (A+ xyT)-1 = kl - ----- 1 + yT A-Ix Esta fórmula permite calcular (A (k))-I a partir de (A (k-I))-I, eliminando la necesidad in- vertir una matriz en cada iteración. Para esto, primero se obtiene la inversa de la ecua- ción 4.24. (4.26) Después se hace: A = A(k-I) (M(k) _ A(k-I) ~(k)) x=------- 1 L'lx(k) 12 y con lo que la última ecuación queda: y sustituyendo la ecuación 4.26 _ A(k-I) -1 [(A(k-I))-I M(k) - ~(k)] (L'lX(k))T (A(k-I))-I - ( ) - 1 ~(k) 12 + (~(k))T (A(k-I))-I L'lf'(k) _ 1 L'lx(k) 12 (4.27) Esta fórmula permite calcular la inversa de una matriz con sumas y multiplicaciones de matrices solamente, con lo que se reduce el esfuerzo computacional al orden n2 . • ibid. 280 Métodos numéricos aplicados a la ingeniería cuya JCO) a su vez puede emplearse en 4.24, con lo cual ésta queda: (M(I) - JCO) ~(I)) (~x(l))T A(J) = ](0) + ____----,-"..---::____ 1 ~x(J) 12 (4.25) La inversión de A(k) en cada iteración significa un esfuerzo computacional grande (del or- den de n3) que, sin embargo, puede reducirse empleando una fórmula de inversión matri- cial de Sherman y Morrison.* Esta fórmula establece que si A es una matriz no singular y x y y son vectores, entonces A + xyT es no singular, siempre que yT A - I x 7: 1. Además, en este caso, A-I xyT A-I (A + xyT)-1 = k l - - - - - - 1 + yT A-IX (4.26) Esta fórmula permite calcular (ACk))-I a partir de (ACk-I))-I, eliminando la necesidad in- vertir una matriz en cada iteración. Para esto, primero se obtiene la inversa de la ecua- ción 4.24. Después se hace: x= y con lo que la última ecuación queda: y sustituyendo la ecuación 4.26 A = ACk- l) (M(k) _ ACk- l) ~Ck)) 1 ~XCk) 12 _ ACk-l) -1 _ [(ACk-I))-1 M(k) - ~Ck)] (~XCk))T (ACk-I))-1 - ( ) 1 ~Ck) 12 + (~Ck))T (ACk-I))-1~fCk) - 1 ~xCk) ¡z (4.27) Esta fórmula permite calcular la inversa de una matriz con sumas y multiplicaciones de matrices solamente, con lo que se reduce el esfuerzo computacional al orden n2. • ibid.
  • 296. Sistema de e cuaciones no lineales 281 Ejemplo 4.6 Use el método de Broyden para encontrar una solución aproximada del sistema ¡I(x, y) = x2 - lOx + y2 + 8 = O Nx, y) = xy2 + X - lOy + 8 = O, tome como vector inicial: [xO, y0]T = [O,O]T.Se recomienda especialmente emplear un pi- zarrón electrónico para llevar los cálculos, y así poner la atención en el algoritmo y en el análisis de los resultados. 5) oro íri- Y Solución En el ejemplo 4.3 se encontró una solución aproximada de este sistema, empleando el mé- todo de Newton-Raphson y el vector cero como vector inicial. Con los resultados de la primera iteración del ejemplo 4.3 ]<0) = [-10 0J 1 -10 ' (]<O))-I = [-0.1 -0.01 0J (1) = [0.8 J -0.1 ' x 0.88a- se calcula (A(1))-1 con la ecuación 4.23 (Llx(l) - (1(0))-1 M(I)) (Llx(l))T (J(O))-1 (A(1))-1 - (]<O))-I + -'---'--:,:-:-:::--::-,--,:-....,.c,......-:-'-- (Llx(l))T (J(O))-1 Llf'CI) (A(I))-I = [-0.1 -0.01 0J + [~8] -[=~, -0.1 [.8 JT .88 -.~J [=~:~~~~8J[:~sJT [=:~1 -.~J [ =:~l -.~J [=~:~~~~8J =[-0.11015 -0.01546 -0.010079J -0.105404 Se calcula ahora x(2) empleando la ecuación: X(2) = x(l) - (A(l))-I f(l) [ .8 J [-0.11015 -0.010079J 1l.4144 J .88 - -0.01546 -0.105404 LO.61952 [ 0.96208J 0.96720 7) Para la segunda iteración se utilizarán las ecuaciones: [Llx(2) - (A(l))-I M(2)] (Llx(2)? (A(l))-I (A(2))-1 = (A(l))-I + _ (Llx(2)? (A(I))-I M(2) y de Al sustituir valores se obtiene: (3) = [0.997433J x 0.996786 Sistema de ecuacion e s no lineales 281 Ejemplo 4.6 Use el método de Broyden para encontrar una solución aproximada del sistema ¡I(x, y) = x2 - lOx + y2 + 8 = O Nx, y) =xy2 + X - lOy + 8 =O, tome como vector inicial: [xO, yO]T = [O, OF. Se recomienda especialmente emplear un pi- zarrón electrónico para llevar los cálculos, y así poner la atención en el algoritmo y en el análisis de los resultados. Solución En el ejemplo 4.3 se encontró una solución aproximada de este sistema, empleando el mé- todo de Newton-Raphson y el vector cero como vector inicial. Con los resultados de la primera iteración del ejemplo 4.3 ](0) = [ -10 0J 1 -10 ' (1(0»)-1 = [ -0.1 -0.01 0J (1) = [ 0.8 J-0.1 ' x 0.88 se calcula (A(1»)-1 con la ecuación 4.23 (Llx(1) - (1(0»)-1 M(I») (Llx(l)? (1(0»)-1 (A(I»)-I - (1(0»)-1+ -'-___-'--_---'--'--_--'.....-__ (~(l»)T (1(0»)-1 M'(I) (A(I»)-I = [-0.1 -0.01 0J + [~8]-[=~l -0.1 [.8 ] T .88 -.~J [=~:;~~~8J [:~8J T [=:~1 -.~J [ =.~1 -.~J [=~:;~~~8J =[-0.11015 -0.01546 -0.010079J -0.105404 Se calcula ahora x(2) empleando la ecuación: X(2) = x(l) - (A(l»)-l r ( l) [ .8 J [ -0.11015 -0.010079J 1l.4144 J .88 -0.01546 -0.105404 LO.61952 [ 0.96208J 0.96720 Para la segunda iteración se utilizarán las ecuaciones: [~(2) _ (A(l»)-I M(2)] (~(2)? (A(l»)-I (A(2»)-1 = (A(l»)-I + _____________ (~(2)? (A(l»)-I M(2) y Al sustituir valores se obtiene: (3) = [0.997433J x 0.996786
  • 297. 282 Métodos numéricos aplicados a la ingeniería La continuación de las iteraciones da X(4) = [ 0.9999037J 0.9998448 ' [ 0.9999999849J 0.9999999722 ' X(5) = [0.999998157J 0.999996667 x(7) = [~JX(6) = que es la solución del sistema, tal como se obtuvo en los ejemplos 4.2 y 4.3. Los cálculos pueden realizarse con Matlab o con la TI-92 Plus. ~ x=[O O]; Eps=le-8; fprintf(' k x(k) y(k)n') fprintf(' %2d %10.6f %10.6fn',0,x(l),x(2)) fl=x(l)A2-10*x(l)+x(2)A2+8; f2=x (1) *x (2) A2+x (1) -10*x (2) +8; dflx=2*x(l)-10; dfly=2*x(2); df2x=x (2) A2+1; df2y=2*x (1) *x (2) -10; J=[dflx dfly; df2x df2y]; FO=[fl; f2]; Jl=inv(J); dx=-Jl*fO; xl=x+dx'; for k=1:25 f1=xl (1) A2-10*xl (1) +xl (2) A2+8; f2=xl (1) *xl (2) A2+xl (1) -10*xl (2) +8; f=[fl; f2]; df=f-fO¡ Al=Jl+ (dx-Jl*df) *dx'*Jl/ (dx'*Jl*df); dx=-Al*f; x2=xl+dx'; Dist=norm(x2-xl); fprintf(' %2d %10.6f %10.6f %10.5en', ... k,xl (1) ,xl (2) ,Dist) xl=x2; Jl=Al; fO=f; if Dist < Eps; break; end end F F F p e4 6 ( Prgm Define fl(x)=x[1,1]A2-10*x[1,1]+x[1,2]A2+8 Define f2 (x) =x[1,1]*x[1,2] A2+x[1,l}-lO*x[1,2]+B Define dflx(x)=2*x[1,1]-lO : Define dfly(x)=2*x[1,2] Define df2x(x)=x[1,2]A2+1 Define df2y (x) =2*x [1, l]*x [1,2] -10 [O,O]--->x : lE-5--->eps : Or+k: : ClrIO Disp "k x (k) y (k) l x (k+l) -x (k) I string (k) &format (x [1,1] , "f7")--->d ds " "&format(x[1,2],"f7")--->d : Disp d [dflx(x),dfly(x);df2x(x),df2y(x)]--->j [fl(x);f2(x)]--->fO: jA-l--->jl : -jl*fO--->dx: x+dxt=+x L For k,1,25 [fl(x1);f2(x1)]--->f: f-fO--->dff j 1+ (dx-j l*dff) *dxT* j l/norm (dxT*j l*dff) --->al -al*f--->dx : xl+dxT--->x2 : norm (x2-xl) +ai s t: string (k) &format (x2 [1,1], "f7")--->d as : "&format(x2[1,2],"f7")--->d ds " "&format (dist, "f5")--->d : Disp d x 2---> xl al--->jl: f--->fO if dist < Eps exit EndFor EndPrgm 282 Métodos numéricos aplicados a la ingeniería La continuación de las iteraciones da X(4) = [0.9999037J 0.9998448 ' X (6) = [0.9999999849J 0.9999999722 ' X(5) = [0.999998157J 0.999996667 x(7) = [~J que es la solución del sistema, tal como se obtuvo en los ejemplos 4.2 y 4.3. Los cálculos pueden realizarse con Matlab o con la TI-92 Plus. x=[O O]; Eps=le-8; fprintf(' k x(k) y(k)n') fprintf (' %2d %10.6f %1 0.6fn',0,x(l),x(2)) fl=x (l) A2-10*x(l)+x(2 ) A2+8; f2=x (1) *x (2) A2+x (1) -lO*x (2) +8; df1x=2*x (l)-10; df1y=2*x(2); df2x=x (2) A2+1; df2y=2*x (1) *x (2) -10; J=[df1x df1y; df2x df2y]; FO=[f1; f2]; J1=inv(J); dx=- J1*fO ; x1=x+dx'; for k=1:25 f1=xl (1) A2- 10*xl (1) +xl (2) A2+8; f2=xl (1) *xl (2) A2+xl (1) -lO*xl (2) +8; f=[fl; f2]; df=f- fO; A1=J1+ (dx-J1*df) *dx'*J1/ (dx'*J1*df); dx=- A1*f; x2=x1+dx'; Dist=norm(x2 - x1); fprintf(' %2d %10 .6f %10 .6f %10 .5en', ... k,x1 (1) ,xl (2) ,Dist) x1=x2; J1=A1; fO=f; if Dist < Eps; break; end end e4 6 ( ) Prgm Define f1(x)=x[1,1]A2-10*x[1,1]+x[1 ,2]A2+8 Define f2 (x) =x[1,1 ]*x[1,2] A2+x[1,1] -lO*x[1,2]+8 Define dflx(x)=2*x[1 , 1]-lO : Define dfly(x)=2*x[1,2] Define df2x(x)=x[1,2]A2+1 Define df2y (x) =2*x [1, l]*x [1,2] -10 [O,O]--->x : 1E-5--->eps : O--->k : C1rIO Disp "k x (k) y (k) Ix (k+1) -x (k) I string(k) &format (x[l,l], "f7")--->d d&" " &format (x [1,2], "f7") ---> d : Disp d [df1x(x) ,df1y(x) ; df2x(x),df2y(x)]--->j [fl(x);f2(x)]--->fO: jA-l--->jl: -j1*fO--->dx: x+dxT--->x1 For k , 1,25 [fl(xl);f2(xl)]--->f: f - fO--->dff j 1 + (dx-j l*dff) *dxT* j l/norm (dxT* j l*dff) --->al -a1*f--->dx : x1+dxT--->x2 : norm (x2 - x1) --->dist string (k) &format (x2 [1 ,1] , "f 7")--->d d&" "&format(x2[1,2],"f7")--->d d&" " &format(dist,"f5")--->d : Disp d x 2--->xl a1--->jl: f ---> fO if dist < Eps exit EndFor EndPrgm
  • 298. Sistema de ecuaci ones no lineales 283 A continuación se presenta el algoritmo para este método. ALGORITMO 4.4 Método de Broyden Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar la matriz jacobia- na ampliada con el vector de funciones (véase Ec. 4.17) y los DATOS: Número de ecuaciones N, dos vectores de valores iniciales: xO y xl, el número máximo de iteracio- nes MAXIT y el criterio de convergencia EPS. RESULTADOS: Una aproximación a una solución: xn o el mensaje "NO CONVERGE" PASO 1. Calcular AK, la matriz inversa de la matriz jacobiana evaluada en xO. PASO 2. Hacer K = l. PASO 3. Mientras K::::;MAXIT, repetir los pasos 4 a 10. PASO 4. Calcular fO y f'l , el vector de funciones evaluado en xO y xl, respectivamente. PASO 5. Calcular (*)dx = xl - xO; df = fI - fo. PASO 6. Calcular AK1, la matriz que aproxima a la inversa de la matriz jacobiana (4.22), con la ecuación (4.27), usando como (A(k-1lt1 aAK. PASO 7. Calcular (*) xn = xl -AKl * n. PASO 8. (*) Si I xn - xl I ::::;EPS ir al paso 11. De otro modo continuar. PASO 9. Hacer (*) xO = xl; xl = xn; AK =AKl (actualización de xO, xl y AK). PASO 10. Hacer K = K + 1 PASO 11. Si K::::;MAXIT, IMPRIMIR el vector xn y TERMINAR. De otro modo IMPRIMIR "NO CONVERGE" YTERMINAR. * Operaciones matriciales. 4.6 Aceleración de convergencia Al igual que en los capítulos anteriores, una vez que se tienen métodos de solución funcio- nales, se mejorarán o crearán nuevos algoritmo s usando dicho conocimiento. También, co- mo ya se ha visto, esto se logra con un proceso de generalización y abstracción. Se procederá en esa dirección enseguida. En cada iteración de los algoritmos vistos se parte de un vector X(k que ahora se lla- mará punto base; desde ese punto se camina en una dirección, dada por un vector, que se denominará dirección de exploración. Considérese la figura 4.9 y el punto base (.xO, yO)"' = (2, 2). Si desde el punto base se camina en la dirección del vector d(O) = [4, l ]", se ter- minará pasando por el punto P (6, 3). Ry Punto base (.xD,yO) = (2,2) Figura 4.9 Punto base y vector de exploración. ~=-_________________________________________ x Dirección de exploración * De aquí en adelante se usará indistintamente n-adas ordenadas (xi' x2, ... , x,,) para representar un vector de n elementos y un punto en el espacio n-dimensional. Sistema de ecuaciones no lineales 283 A continuación se presenta el algoritmo para este método. ALGORITMO 4.4 Método de Broyden Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar la matriz jacobia- na ampliada con el vector de funciones (véase Ec. 4.l7) y los DATOS: Número de ecuaciones N, dos vectores de valores iniciales: xO y xl, el número máximo de iteracio- nes MAXIT y el criterio de convergencia EPS. RESULTADOS: Una aproximación a una solución: xn o el mensaje "NO CONVERGE" PASO 1. Calcular AK, la matriz inversa de la matriz jacobiana evaluada en xO. PASO 2. Hacer K = l. PASO 3. Mientras K:::; MAXIT, repetir los pasos 4 a 10. PASO 4. Calcular ro y fl, el vector de funciones evaluado en xO y xl, respectivamente. PASO 5. Calcular (*)dx = xl - xO; df = fl - ro. PASO 6. Calcular AKJ, la matriz que aproxima a la inversa de la matriz jacobiana (4.22), con la ecuación (4.27), usando como (A(k-l)-I a AK. PASO 7. Calcular (*) xn = xl - AKl *n . PASO 8. (*) Si I xn - xl I :::; EPS ir al paso 11. De otro modo continuar. PASO 9. Hacer (*) xO = xl; xl =xn; AK =AKl (actualización de xO, xl yAK). PASO 10. Hacer K = K + 1 PASO 11. Si K:::; MAXIT, IMPRIMIR el vector xn y TERMINAR. De otro modo IMPRIMIR "NO CONVERGE" YTERMINAR. * Operaciones matriciales. 4.6 Aceleración de convergencia Al igual que en los capítulos anteriores, una vez que se tienen métodos de solución funcio- nales, se mejorarán o crearán nuevos algoritmos usando dicho conocimiento. También, co- mo ya se ha visto, esto se logra con un proceso de generalización y abstracción. Se procederá en esa dirección enseguida. En cada iteración de los algoritmos vistos se parte de un vector x(k que ahora se lla- mará punto base; desde ese punto se camina en una dirección, dada por un vector, que se denominará dirección de exploración. Considérese la figura 4.9 y el punto base (xO,yO)"' = (2, 2). Si desde el punto base se camina en la dirección del vector deO) = [4, Ir, se ter- minará pasando por el punto P (6, 3). y R Figura 4.9 Punto base y vector de exploración. Punto base (.fl,yO) = (2,2) Dirección de exploración ~~_________________________________________ x * De aquí en adelante se usará indistintamente n-adas ordenadas (xi' x2, ... , x,,) para representar un vector de n elementos y un punto en el espacio n-dimensional.
  • 299. 284 Métodos numéricos aplicados a la ingeniería Al avanzar en cierta dirección de exploración a partir de un punto base, se llega a un nuevo punto que va a ser base para la siguiente iteración, pudiera ser el punto P (6, 3) o cualquier otro punto de R que dará la ecuación vectorial. x(1) = x(O) + t d (O) o en forma más general I x(k+l) = X(k) + t d (k) I (4.28) donde t es el factor de tamaño de la etapa y determina la distancia del desplazamiento en la dirección especificada. Esta ecuación se obtiene fácilmente por la suma de vectores en el pla- no, como se muestra en la figura 4.10. Para aclarar esta generalización, se identifica el algoritmo de Newton-Rapshon para sistemas de dos ecuaciones no lineales con la ecuación 4.28. Primero se reescribe la ecuación 4.13. di1 (k+' k) di1 (yk+l k) - f (-_1- k) Tx x - x + ay -y - - 1 X', Y para pasarla a notación matricial como sigue: y R Figura 4.10 Suma de vectores en el plano. x(l) = x(O) + t d(O) x que ahora, multiplicada por la inversa de la matriz jacobiana, llega a la forma di, di1 -1 dX dY " [f,(",,,~]["" "] Fi!j Inf/L di2 di2 Nxk,yk ) k+l kY -y e dX dy
  • 300. a un 3) o .28) en la pla- para 1 Sistema de ecuaciones no lineales 285 o también: [ X k + l ] [Xk] yk+1 yk (4.29) -1 y en esa última forma, ya como ecuación vectorial, se tiene la identificación total con la ecuación 4.28, con: -1 Hay que observar que en el método de Newton-Rapshon, el factor de tamaño de la etapa es constante en todos los pasos iterativos del proceso y que d(k) el vector de exploración, es el resultado de multiplicar la inversa de la matriz jacobiana por el vector de funciones. MÉTODO DE NEWTON RAPHSON CON OPTIMIZACIÓN DE t Con la ecuación 4.28 puede estudiarse cómo mejorar los métodos disponibles; por ejem- plo, se puede ver que en el algoritmo de Newton-Raphson tomar distintos valores de t lle- varía a distintos vectores x(k+l}, alguno más cercano a la raíz x que los demás (véase Fig. 4.11). La mejora es optirnizar el valor de t en el método de Newton-Rapshon. Para ejemplificar, tómense los valores de la primera iteración del ejemplo 4.3: k = O; X k = O; h = 0.8 j = 0.88yk = O; de aquí d(k) = [-0.8 - 0.88]T y la ecuación 4.29 queda: X(k+I) = xk + t df y(k+I) = yk + t d§ (x', yI) 5 t(x', yI) 4 t • (xo, yO) (x', yl) t3 t t • t con t = 2 •2 • tcon t = .5 con t = 1 • xFigura 4.11 Influencia de t en el vector xlk+l1. O 2 3 4 5 6 7 8 9 10
  • 301. 286 Métodos numéricos aplicados a la ingeniería Se lista ahora una serie de valores de t y los correspondientes valores de x(k+I): t X(k+l) yCk+l) -0.50 0.4 0.44 -.075 0.6 0.66 -1.00 0.8 0.88 -1.25 1.0 1.10 -1.50 1.2 1.32 Para determinar cuál de las x(k+1) está más cerca de la raíz x, se desarrolla un nuevo crite- rio de convergencia o avance sustentado en la definición de residuo de una funciónf(x, y), dada esta última así: El residuo de una funciónf (x, y) en un punto (xk, yk) es el valor de f en (xk, yk). ASÍ, en el sistema fl (x, y) = x2 + y2 - 4 = O f2 (x, y) = y - x2 = O en el punto (1, 1) los residuos son: I, (1,1) = 12 + 12 - 4 =-2 y En general, el valor de la función suma de residuos al cuadrado (4.30) será indicativa de la cercanía de x(k) con la raíz x. Con la aplicación de este concepto a los distintos vectores X(k+I) obtenidos arriba, se tiene Para t = -0.5 Zk+1 = [0.42 - 10(0.4) + 0.442 + 8]2 + [0.4(44)2 + 0.4 - 10(0.44) + 8]2 = 35.57 Para t = -0.75 : Zk+1 = 12.93 Para t = -1.0: Zk+1 = 2.38 Para t = -1.25 : Zk+1 = 0.67 Para t = -1.5 : Zk+1 = 4.31 De donde x(k+I) correspondiente a t = -1.25 resulta ser el más cercano a la raíz x = [1, l]T. Los valores propuestos de t anteriormente, se eligieron de manera arbitraria alrededor de -1 y aunque el valor de -1.25 es el mejor de ellos, no es el óptimo de todos los valores posibles para la primera iteración. A continuación se da una forma de seleccionar los valores de t. Se selecciona un intervalo de búsqueda [a, b], dentro de ese intervalo se calculan va- lores de t de la siguiente manera: b-a t=a+-- F y b-a t=b--- F
  • 302. te- .j), .30) erre or res va- Sistema de ecuaciones no lineales 287 donde F son los términos de la serie de Fibonacci. F = 1, 1, 2, 3, 5, 8, 13,21, 34, 55, ... Para cada valor de t se calcula su correspondiente Zk+l' y el valor mínimo Zk+l proporcio- nará el valor óptimo de t. Así, seleccionando el intervalo [-l.2, -1], el valor mínimo de Zk+l (= 0.4578) corres- ponde al valor óptimo de t (= -l.184) en la primera iteración de la solución del ejemplo 4.3 Una vez encontrado el valor óptimo de t se toma el vector xCI) correspondiente y se calcula d(l) para proceder a optimizar el valor de t en la segunda iteración: x(2) = x(l) + t d(l) Ejemplo 4.7 Modifique el programa del ejemplo 4.4 para incluir la optimización de t. Utilizando el programa resultante, resuelva el sistema del ejemplo 4.4. Solución Las modificaciones consisten en: - Elaborar un subprograma para encontrar el valor de t que minimice la función Zk' utilizando la búsqueda de Fibonacci. - Modificar el subprograma NEWTON del ejemplo 4.4 para utilizar ahora como cri- terio de convergencia o avance la función de Zk y la llamada al subprograma de bús- queda de Fibonacci. En el CD (PROGRAMA 4.2) se muestran los subprogramas NEWOPT y BUSCA resultantes. El programa principal y los subprogramas SIMULT y PIVOTEO no sufren cambio alguno. Con el programa resultate y con los valores iniciales xCO) = [1 1 I]T se obtienen los siguientes resultados: VARI 1 1.00000 l.00000 l.00000 FUNC 1 1.95970 -624.00000 29.83985 SUMA .39027E+06 TOPT= l.833 VARI 2 .83201 .08453 -1.75525 FUNC 2 1.00701 -3.77371 -24.70092 SUMA .62539E+03 TOPT= .9000 VARI 3 .53770 .04775 -.64629 FUNC 3 .11359 -1.13613 -2.47923 SUMA .74503E+Ol TOPT= .9000 VARI 4 .50380 .03001 -.53527 FUNC 4 .01153 -.30917 -.24846 SUMA .15745E+00 TOPT= 1.167 VARI 5 .49935 .02028 -.52103 FUNC 5 -.00190 -.00767 .04138 SUMA .17748E-02 TOPT= .9000 VARI 6 .49992 .02003 -.52289 FUNC 6 -.00019 -.00081 .00414 SUMA .17817E-04 TOPT= .9000 VARI 7 .49998 .02000 -.52308 FUNC 7 -.00002 :-.00008 .00041 SUMA .17825E-06 TOPT= .9000
  • 303. ti 288 Métodos numéricos apli cados a la ingeniería La solución del sistema es: X(l) = .49998116 X(2) = .19999571E-Ol X(3) = -.52309883 Obsérvense los valores de TOPT en las diferentes iteraciones. Los cálculos pueden realizarse con el siguiente guión de Matlab que usa la función min4_7 que hace la búsqueda de Fibonacci descrita anteriormente. Las instrucciones que conforman la función deben guardarse en un archivo separado con el nombre min4_7.m y posteriormente escribir el guión que la llama, grabarlo y ejecutarlo. function f=min4_ 7 (X,Dx) A = 0.5; B = 2.5; NP O; NU = 1; Menor = 1000000000; Top 1; for i = 1:20 NF = NU + NP; T = A + (B - A) /NF; XX=X+'1*Dx'; Suma=(-3*XX(1) +cos (XX(2)*XX (3) ) +0.5) "'2+... (-XX (1) "'2+ 625*XX (2) "'2) "'2+... (-exp (-XX (1) *XX(2) ) -20*XX (3) - (10*pi -3) /3) "'2; if Suma < Menor Menor = Suma; Topt = T; end T = B - (B - A) /NF; XX=X+1*Dx'; Suma=(-3*xx (1) +cos (XX(2) *XX (3)) +0.5) A2+... (-XX (1) "'2+ 625*XX (2) A2) A2+... (-exp (-XX (1)*XX (2)) -20*XX(3) - (UJ'pi-3) /3) A2; if Suma < Menor Menor = Suma; Topt = T; end NP = NU; NU = NF; end f=Topt; n=3; x=[l 1 1J; Maxit=25; Eps=le-5; Dist=l; Fprintf (' k xl x2 x3') fprintf(' Dist Toptn') fprintf(' %2d %10.5f %10.5f %10.5fn',0,x(1),x(2),x(3)) for k=l:Maxit J=[3 x(3)*sin(x(2)*x(3)) x(2)*sin(x(2)*x(3)); ... 2*x(1) -1250*x(2) O; -x(2)*exp(-x(1)*x(2)) -x (l)*exp (-x (l)*x (2)) 20]; b= [-3'x (1) +cos (x (2) *x (3)) +0. 5; ... -x (1) "'2+625*x (2) A2; ... -exp (-x (1) *x (2)) -20*x (3) - (10*pi -3) /3] ; dx=i.nv t-Ji=b t t=l : t=min4_7(x,dx); xl=x+t*dx'; Dist=norm(xl-x); fprintf(' %2d %10.5f %10.5f %10.5f %10.5e %6.3fn', ... k,xl (1) ,xl (2) ,xl (3) ,Dist, t) if Dist < Eps break end x=xl; end 288 Métodos numéricos aplicados a la ingeniería La solución del sistema es: XCI) = .49998116 X(2) =.19999571E-Ol X(3) =-.52309883 Obsérvense los valores de TOPT en las diferentes iteraciones. Los cálculos pueden realizarse con el siguiente guión de Matlab que usa la función min4_7 que hace la búsqueda de FilJonacci descrita anteriormente. Las instrucciones que conforman la función deben guardarse en un archivo separado con el nombre min4_7.m y posteriormente escribir el guión que la llama, grabarlo y ejecutarlo. function f=min4_7 (X,Dx) A = 0.5; E = 2.5; NP o; NU = 1; Menor = 1000000000; Top for i = 1:20 NF = NU + NP; T = A + (E - A) /NF; XX=X+'1*Dx'; Suma= (-3*XX (1) +cos (XX (2)*XX (3) ) +0 .5) "'2+... (-XX (1) "'2+625*XX (2) "'2) "'2+... (-exp (-XX (1) *xx (2)) -20*XX (3) - (10*pi - 3) /3) "'2; if Suma < Menor Menor = Suma ; Topt = T; end T = E - (E - A) / NF; XX=X+1*Dx'; Suma= (-3*xx (1) +cos (XX (2) *XX (3)) +0.5) A2+... (-XX (1) "'2+625*XX (2) A2) A2+... (-exp (- XX (1)*XX (2)) -20*XX (3) - (10*pi-3) / 3) A2; if Suma < Menor Menor = Suma; Topt = T; end NP = NU; NU = NF; end f=Topt ; n=3; x=[l 1 11; Maxit=25; Eps=le-5; Dist=l ; F'printf (' k xl x2 x3') fprintf(' Dist Toptn') fprintf(' %2d %10.5f %10 .5f %10.5fn',0,x(l),x(2 ), x (3)) for k=l:Maxit J=[3 x (3)*sin (x(2)*x(3)) x(2)*sin(x(2) *x(3));... 2*x(l) -1250*x(2) O; -x(2)*exp(- x(l)*x(2)) -x (1)*exp (-x (l)*x (2)) 201 ; b=[-3'x (1) +cos (x (2) *x (3)) +0. 5 ; ... -x (1) "'2+625*x (2) A2; ... -exp (-x (1) *x (2)) -20*x (3) - (10*pi - 3) /3] ; dx=inv(J)*b ; t=l; t=min4_7 (x,dx); xl=x+t*dx'; Dist=norm(xl-x); fprintf( ' %2d %10 . 5f %10 . 5f %10 . 5f %10.5e %6.3fn', ... k,xl (1) ,xl (2) ,xl (3) , Dist, t) if Dist < Eps end x=xl; end break 1;
  • 304. ción que 7.my 1; SistelT1ade ecuaciones no lineales 289 e4_7 ( ) Prgm @ Inicia el subprograma para búsqueda de Fibonacci local min4 7 Define min4_7(x,dx)=Prgm .5-+a : 2.5-+b : O+np : l=+riu 1000-+menor l=+t.opt: For i,1,20 nu+np+ni: For j,1,2 If j=l Then a+ (b-a) /nii+t: E1se b- (b-a) /nf-+ t EndIf x+t*dxT-+ xx fl (xx) A2+f2(xx) A2+f3(xx) A2-+suma If suma<menor Then suma-+menor tr+t.opt: EndIf EndFor riu+np nf-+nu EndFor topti+t: EndPrgm @ Inicia Newton-Raphson con optimización de t Define fl (x) =3*x[1, l]-cos (x[1,2]*x[1,3]) -.5 Define f2 (x) =x[1,1] A2-62j*x[1, 2J A2 Define f3 (x) =e " (-x [1, 1J*x [1,2J) +20*x [1,3] + (1O*II-3) /3 Define dfl2 (x) =x[1, 3]*sin (x[1,2J*x [1,3]) Define dfl3 (x) =x[1,2J*sin (x[1, 2]*x [1,3]) Define df21 (x)=2*x[1,1] Define df22(x)=-1250*x[1,2] Define df31 (x) =-x [1, 2]*eA(-x [1,l]*x [1,2]) Define df32 (x) =-x[l,l]*eA (-x [l,l]*x [1,2]) [l,l,l]-+x : 3-+n : 1E-5-+eps : C1rIO Disp "k xl x2 x3 Di.st:" "O "&format (x [1,1] , "f4") &" "&format (x [1,2J , "f4")-+d d&" "&format(x[1,3J,"f4")-+d : Disp d For k,1,25 [3,df12(x),df13(x);df21 (x),df22(x),O;df31 (x),df32(x),2 O]-+j [-fl (x) ;-f2 (x) ; -f3 (x) [r+b simu1t(j,b)-+dx : l=+t.opt: min4 7(x,dx) x+topt*dxT-+ xl norm (xl-x) -+dist string (k) & ""&format (xl [1,1] , "f5") &''''&format (xl [1,2], "f5")-+d ds" "&format (xl [1,3J, "f5") s" "&format (dist, "f5")-+d: Disp d xl=+x if dist<eps exit EndFor EndPrgm SistelT1a de ecuaciones no lineales 289 e4_7 ( ) Prgm @ Inicia el subprograma para búsqueda de Fibonacci local min4 7 Define min4_7(x,dx)=Prgm . 5-+a : 2 . 5-+b : O-+np : l-+nu For i,l ,20 nu+np-+nf For j , l , 2 If j=l Then a+ (b-a) /nf-+t E1se b - (b-a) /nf-+t Endlf x+t*dxT-+xx 1000-+menor fl (xx) " 2+f2 (xx) "2+f3 (xx ) "2-+suma If suma <menor Then suma-+menor t-+topt EndIf EndFor nu-+np EndFor topt-+ t EndPrgm nf-+nu @ Inicia Newton - Raphson con optimización de t Define fl (x) =3*x[l, l]-cos (x[1,2]*x[l,3]) -.5 Define f2 (x) =x [1,1] "2-62j*x[1,2] "2 l-+topt Define f3 (x) =e" (-x [l ,l]*x [1,2]) +20*x [1,3] + (1 0*II-3) /3 Define dfl2 (x) =x [1 , 3]*sin (x [1 , 2]*x [1 , 3]) Define dfl3 (x) =x [l , 2}*sin (x [1 , 2}*x [1 , 3]) Define df21 (x)=2*x[1,1] Define df22(x)=-1250*x[1 , 2] Define df31 (x)=- x[1 , 2Ye" (- x[1 , 1]*x[1 , 2]) Define df32 (x) =- x [l , lYe" (- x [l , l]*x[l , 2]) [l , l , l] -+x : 3-+n : 1E- 5-+eps : C1rIO Disp "k xl x2 x3 Dist " " 0 " &format (x [1,1] , "f4") &" " &format (x [1 , 2] , "f4")-+ d d&" "&format(x[1,3], "f4")-+ d : Disp d For k ,1,25 [3 ,df12(x), df13 (x);df21 (x ),df22(x),O;df31 (x),df32 (x ), 2O]-+j [ - fl (x) ;-f2 (x) ; -f3 (x) ] -+b simu1t (j , b) -+dx : l-+topt min4_7(x, dx) x+topt*dxT-+xl norm (xl - x) -+dist string (k) &""&format (xl [1,1] , "f5") &''''&format (xl [1 , 2] , " f5") -+d d&" " &format (xl [1,3] , "f5") &" " &format (dist, " f5")-+d : Disp d x1 -+x if dist<eps exit EndFor EndPrgm
  • 305. 290 Métodos numéricos aplicados a la ingeniería MÉTODO DE NEWTON-RAPHSON MODIFICADO CON OPTIMIZACIÓN DE T (MÉTODO SOR) En el método de Newton-Raphson modificado, la expresión general 4.18 puede identifi- carse con la ecuación 4.28 directamente con t = -1 /¡(X/+I,X2 k+I, ... , X¡_Ik+I,x/, ... ,x/) y dt = 1::; t-: n él/¡ I élx¡ (x/+I, x/+I, ... , X¡_/+I, x/, ... , x,,k) Con la optirnización del valor de t en cada iteración puede acelerarse la convergencia. El método así obtenido (4.31) se conoce como método SOR para sistemas no lineales. A continuación se resuelve un ejemplo con optimización de t. Ejemplo 4.8 Resuelva el siguiente sistema de ecuaciones empleando el método SOR para sistemas no lineales. !¡(x, y) = x2 - lOx + y2 + 8 = O fzCx, y) = xy2 + X - lOy + 8 = O Sean los valores iniciales xD = O Y yO = O SUGERENCIA: Puede seguir los cálculos usando Mathcad o un pizarrón electrónico disponible. Solución Primero se obtiene él!¡ = 2x _ 10 élx y ».- =2xy-10 ély . Primera iteración él! Se evalúa j', y _1 en [O,O]T élx él!¡ I!I (O, O) = 8, --..- _11 0=-10 ox r,y Se elige el intervalo de búsqueda [-1.5, -0.5] Y t = b - (b - a)/F, y el primer valor a prue- ba es: t = -1.5 Xl = xD + t !I (O, O) = O- 1.5 (~ ) = l.2 él!1I -10 élx (O, O) 290 Ejemplo 4.8 M é todos n uméricos a plicados a la ingeniería MÉTODO DE NEWTON-RAPHSON MODIFICADO CON OPTIMIZACiÓN DE T (MÉTODO SOR) En el método de Newton-Raphson modificado, la expresión general 4.18 puede identifi- carse con la ecuación 4.28 directamente con t =-1 dk ' = /¡(x/+I,x2k+I ,... , X¡_Ik+I,x/, ... ,x,/) y 1 ::; ¡::; n 1 él/¡ I élx¡ (xlk+l,xl+ I,... , X¡_Ik+ I,x/,... ,x/) Con la optimización del valor de t en cada iteración puede acelerarse la convergencia. El método así obtenido f (x/+ I, x2k+ I,... , X¡_ Ik+ I , xl,... , x/) xk+l = xk-t ¡ 1::;¡::;n 1 1 él/¡ ':Ix I( k+ 1 k+ 1 k+ I k k)u i X I ' X2 , ... , X 1_ 1 ,Xi , ... , Xn (4.31) se conoce como método SOR para sistemas no lineales. A continuación se resuelve un ejemplo con optimización de t. Resuelva el siguiente sistema de ecuaciones empleando el método SOR para sistemas no lineales. j¡(x, y) =x2 - lOx + y2 + 8 = O fix, y) =.xy2 + X - lOy + 8 =O Sean los valores iniciales xO =OYyO =O SUGERENCIA: Puede seguir los cálculos usando Mathcad o un pizarrón electrónico disponible. Solución Primero se obtiene Primera iteración él!1 = 2x _ 10 élx y él!2 - = 2xy-l0 ély . él! Se evalúa!1 y _ 1 en [O, O]T élx él!1 I! I (O, O) = 8, -':1-.1) 0 = -10 oX x~, y Se elige el intervalo de búsqueda [- 1.5, - 0.5] Y t = b - (b - a)/F, y el primer valor a prue- ba es: t =- 1.5 Xl = xO + t !I (O, O) = O- 1.5 (~ )= 1.2 él!1 I -10 élx (O, O)
  • 306. 1- ia. 1) un e- Sistema de ecuaciones no lineales 291 d1211zC1.2, O) = 9.2 - =-10 dy x', yO yl = yO + t fz(1.2, O) = 0- 1.5 (~) = 1.38 d12 I -10 dy (1.2, O) A partir del criterio de la suma de los residuos elevados al cuadrado, se tiene: 2 1 = 11 2 (1.2, 1.38) + 12 2 (1.2, 1.38) = [l.22 - 10(1.2) + 1.382 + 8]2 + [l.2(1.38)2 - 1.2 - 10(1.38) + 8]2 = 5.7877 El segundo valor a prueba es t = -1.0, con lo que se obtiene: Xl = 0.8 yl = 0.88 21 = 2.3843 Al continuar el proceso de búsqueda se tiene: t xl yl Zl -1.5000 1.2000 1.3800 5.7877 -1.0000 0.8000 0.8800 2.3843 -0.8333 0.6667 0.7222 8.4991 -0.7000 0.5600 0.5992 17.1088 Ahora se usa t = a + (b - a)/F, y se obtiene: t xl yl Zl -0.5000 0.4000 0.4200 37.0420 -1.0000 0.8000 0.8800 2.3843 -1.1667 0.9333 1.0422 0.6151 -1.3000 1.0400 1.1752 1.6312 Por tanto, el valor óptimo de t es -1.1666 y los valores correspondientes de [x', yl] = [0.9333, 1.0422] se toman como resultados finales de la primera iteración. , I Segunda iteración Con el mismo intervalo de búsqueda [-1.5, -0.5] se tiene, con t = b - (b - a)/F t -1.5000 -1.0000 -0.8333 -0.7000 1.048416 1.010055 0.997268 0.987039 0.997117 0.166991 1.002319 0.005733 1.006275 0.004285 1.010227 0.027122
  • 307. 292 Métodos numéricos aplicados a la ingeniería y con t = a + (b - a)/F ( Xl y1 Zl -0.5000 0.971694 1.017453 0.107664 -1.0000 1.010055 1.002319 0.005733 -1.1667 1.022842 0.999467 0.036085 -1.3000 1.033072 0.997987 0.078302 El valor óptimo de t es -0.8333 y los valores correspondientes de [x2, y2] = [0.997268, 1.006275] se toman como resultados finales de la segunda iteración. Al continuar el proceso iterativo se obtienen los siguientes valores k Xk yk Zk (Opf O 0.000000 0.000000 1 0.933333 1.042222 0.615080 -1.1667 2 0.997268 1.006275 0.004285 -0.8333 3 1.000854 1.001220 0.000084 -0.8333 4 1.000305 1.000076 0.000005 -1.0000 5 1.000019 1.000005 0.000000 -1.0000 Los cálculos pueden realizarse con el siguiente guión de Matlab que usa la función min4_8, que hace la búsqueda de Fibonacci descrita anteriormente o con la TI92 Plus. x=[O OJ; fprintf( • fprintf( • fprintf( • for k=1:10 t=min4_ 8 (x) ; fl=x (1) ~2-10*x (1) +x(2) ~2+8; dflx=2*x (1) -10; xl (1) =x (1) +t':'fl/dflx; f2=x1 (1) *x (2) ~2+x1(1) -10*x (2) +8; df2y=2*x1 (l)*x (2) -10; xl (2)=x (2) +t*f2/df2y; fl=x1 (1) ~2-10'''x1 (1) +x1 (2) ~2+8; f2=x1 (1)*x1 (2) ~2+x1(1) -10*x1 (2) +8; Z=fJA2+fr2; fprintf( • fprintf( , x=x1; if Z < Eps; brea k; end end Eps=le-6; k x (k) y (k) ,) z (k) Toptln') %2d %13.10f %13.10fln',0,x(1),x(2)) %2d %13.10f %13.10f' ,k,x1 (1) ,xl (2)) %13.10f %8.4fln',Z,t)
  • 308. Sistema de ecuaciones no lineales 293 function f=min4_ 8 (X) A = -1.5; B = -0.5; NP = O; NU = 1; Menor = 1000000000; Topt = 1; for i = 1:4 for j=1:2 NF = NU + NP; if j = = 1 T = B-(B - A)/NF; e1se T=A+(B-A)/NF; end f1=X(1) ~2-1o-"'(.X(l)+X(2) ~2+8; dflx=2*X(1) -10; XX(1) =X (1) +T"fl/dflx; f2=XX (1) *X (2) ~2+XX(1) -10*X (2) +8; df2y=2*XX (1) *X(2) -10; XX(2) =X (2) +T''f2/df2y; fl=XX(1) ~2-10*XX(1) +XX(2) ~2+8; f2=XX (1) *XX (2) ~2+XX(1) -10*XX (2) +8; Suma=fl~2+f2~2 if Suma < Menor Menor Suma; Topt T; end 268. end NP = NU; NU = NF; end f=Topt; e4_8 ( ) Prgm @ Inicia subprograma búsqueda de Fibonacci Local min4 8 Define min4_8(x)=Prgm -1.5 ...•a : -0.5 ...•b : l ...•topt O+rrp 1...•nu:10000 ...•menor For i,1,20 nu+np...•nf For j, 1,2 If j=l Then a+ (b-a) /nf ...•t E1se b- (b-a) /nf ...•t EndIf x+xx : x[1,l]+t*f1 (x)/df1x(x) ...•xx[1,l] x [1,2] +t* f2 (xx) /df2y (xx) ...•xx [1,2] fl (xx) ~2+f2(xx) ~2""suma If suma<menor Then suma...•menor : t ...•topt EndIf EndFor nu...•np : nf ...•nu EndFor topt ...•t EndPrgm @ Inicia Newton Raphson modificado Define f1 (x)=x[l,lr2-10*x[l,1]+x[1,2] ~2+8 Define f2 (x) =x [1, l]*x [1, 2] ~2+x[1,1] -10*x [1,2] +8 Define df1x(x)=2*x[l,1]-10 Define df2y (x) =2*x [1,l]*x[l ,2] -10 u. Sistema de ecuaciones no lineales 293 function f=min4_ 8 (X) A = - 1 . 5 ; B = - 0 . 5 ; NP = O; NU = 1 ; Menor = 1000000000; Topt = 1 ; for i = 1 : 4 for j=1 : 2 NF = NU + NP; if j = = 1 T = B-(B - A)/NF; e1se T=A+(B- A)/NF; end f1 =X(l) "2-10*X (l) +X(2) "2+8; df1x=2*X(l) - 10; XX (1) =X (1) +1*f1/df1x; f2=XX(l)*X(2) "2+XX (l) - 10*X(2) +8; df2y=2*XX (l)*X (2) - 10; XX (2) =X (2) +T:'f2/df2y; f1=XX(1) "2- 1 O*XX (1) +XX(2) "2+8 ; f2=XX (l)*XX (2) "2+XX (1) -10*XX (2) +8; Suma=f1 "2+f2"2 if Suma < Menor end Menor end NP = NU; NU = NF; end f=Topt ; e4_8 ( ) Prgm Suma ; Topt @ Inicia subprograma búsqueda de Fibonacci Local min4 8 Define min4_8(x)=Prgm T; - 1 . 5-+a : - 0 . 5-+b : l -+ topt O-+np 1--+nu : 10000-+menor For i , 1 , 20 nu+np-+nf For j , 1 , 2 If j=l Then a+ (b-a) /nf--+ t E1se b- (b-a ) /nf-+ t EndIf x-+xx : x[l,l]+t*f1 (x)/df1x(x) --+xx[l,l] x [1 , 2] +t*f2 (xx) /df2y (xx) --+xx [1 , 2] f1 (xx) "2+f2 (xx) "2-+suma If suma<menor Then suma-+menor : t -+ topt EndIf EndFor nu-+np : nf-+nu EndFor topt-+ t EndPrgm @ Inicia Newton Raphson modificado Define f1 (x ) =x[1 , 1]"2- l0* x[1 , 1] +x[1 , 2]"2+8 Define f2 (x) =x [1 , l]*x [1 , 2] "2+x [1 , 1] - lO*x [1 , 2] +8 Define df1x (x) =2*x[1 , 1] - 10 Define df2y (x) =2*x[1 , l]*x [1 , 2] -10
  • 309. 294 Métodos numér icos aplicados a la ingeniería [O,OJ ->X : 1.E-6->eps : ClrIO Disp "k xl x2 z topt" "O "&format (x[l,lJ, "f4")->d d&" "&format(x[1,2J,"f4")->d Disp d For k,1,10 min4 8 (x) x->xl x[l,lJ+topt*fl (x)/dflx(x) ->xl[l,lJ x [1,2J+topt* f2 (xl) /df2y (xl) r+x L[1,2J fl (xl) A2+f2 (xl) A2->zeta string (k) s: "&format (xl [1, L] , "f5")->d d&" "&format (xl [1,2J , "f5") s" "&format (zeta, "f5")->d d&" "&format (topt, "f5") ->d: Disp d xi+x If zeta <eps Exit EndFor EndPrgm MÉTODO DEL DESCENSO DE MÁXIMA PENDIENTE Fi~ GI super y dilSe ha visto cómo seguir un camino que permita ir disminuyendo z al optimizar el tamaño del paso t de un método conocido. Sin embargo, puede elaborarse un método de solución de (4.1), construyendo primero una dirección de exploración d que permita disminuir el valor de z en una cantidad localmente máxima y, una vez encontrada, buscar la t óptima en esa dirección. Para el desarrollo de este algoritmo son necesarias las siguientes consi- deraciones. La figura 4.12 representa la gráfica de la función z(x, y) = x2 + y2, Y sus curvas de ni- vel. Si, por ejemplo, se "está" en el punto (x, y, z) = (-1, -1, 2) de la superficie (ver Fig. 4.13), el gradiente de la función z(x, y), ------------- ===----8 = ===-------- 6 4 2 O 2 2 Y O Figura 4.12 O Gráfica de la -1 x función z(x. yj = x2 + y. -2
  • 310. Figura 4.13 Gráfica de la superficie z(x, y) y dirección del vector gradiente. ma nsi- lli- ig. Sistema de ecuaciones no lineales 295 __ - r 8 6 4 z , 2 -: O : " 2 , y O 2 -2 dirección del gradiente V'z(x, y) = [~~; 1 = [ ~; 1 evaluado en (x, y) = (-1, -1) es el vector [=~1 en el plano x - y cuya dirección nos indica hacia dónde avanzar en el mismo plano x - y, a fm de "as- cender" en la superficie (a partir de (-1, -1, 2)) lo más rápidamente posible". Como nues- tro interés es descender lo más bruscamente posible, se toma la dirección contraria del gradiente o, matemáticamente, se va en la dirección de - V'z(x, y) = [ ~l.Nótese que, si- guiendo la dirección opuesta del vector gradiente en la figura 4.13, se avanza hacia el pun- to (O, O) del plano x - y, que es donde la función z(x, y) tiene su mínimo. Otra propiedad del gradiente que puede ser útil para visualizar cómo encontrar un má- ximo o un mínimo es que es perpendicular a las curvas de nivel de la superficie. Las cur- vas de nivel de una superficie z(x, y) son el conjunto de puntos que satisfacen la ecuación z(x, y) = e, donde e es una constante. Así, para la superficie z(x, y) = x2 + y2, las curvas de nivel son la familia x2 + y2 = e, es decir, las circunferencias con centro en el eje z paralelas al plano x - y y a una altura e de éste, y de radiwc (ver Fig. 4.12). Si tomamos nueva- mente el punto (-1, -1, 2), la circunferencia x2 + y2 = 2 con centro en (O, O, 2) es la curva de nivel que lo contiene. Si tomamos el vector gradiente [ =~1 y lo llevamos paralelo al plano x - y al punto (-1, -1,2) encontramos que es perpendicular a la curva de nivel en ese punto (ver Fig. 4.14). Aun más, al avanzar desde ese punto en la dirección que señala el gradiente, se avanza sobre la superficie hacia curvas de nivel de mayor radio por el ca- mino más corto posible, ya que cualquier otra dirección que se tomara a partir de (-1, -1, 2) nos llevaría a otra curva de nivel; por ejemplo, x2 + y2 = 3 por un camino más largo (ver Fig.4.14) . • Cabe señalar que esto sólo es cierto para un entorno del punto (-1, -1) del plano x-y.
  • 311. 296 & Métodos numéri cos aplicados a la ingeniería Direcciones -0.8 alternativas al gradiente -0.2 -0.4 -0.6 -1.2 -1.4 -1.6 Figura 4.14 Perpendicu- laridad del vector gradiente a una curva de nivel. -1.8 o -1 Gradiente en (-1, -1, 2) Curva de nivel X2+y2=3 -2~----------~----------~----------~----------~ -2 -1.5 -1 -0.5 o Con esta definición de gradiente y sus propiedades, se retorna el asunto del cálculo de la dirección que asegura la disminución de z = I/(x) + 122(X) (función escalar de x y y), en una cantidad localmente máxima en un punto. Se determina el vector gradiente de z con signo negativo en dicho punto (el signo negativo se debe a que se quiere que z disminu- ya.). El vector gradiente de z se representa por Vz. Por tanto, la dirección de descenso más brusco es: con cada uno de los componentes de d calculados como: d=-(V'z) d -~ ,- dx ' d -~2- dy Ejemplo 4.9 Obtenga la dirección del descenso de máxima pendiente del sistema 1, (xl' x2, x3) 12(xl' x2, x3) 13 (x,, x2, x3) 3x, - costx, x3 ) - 0.5 = O x? - 625x} = O e-x,x2 + 20x3 + (IOn - 3)/3 = O use como vector inicial a Pa y 296 Figura 4.14 Perpendicu- laridad del vector gradiente a una curva de nivel. Métodos numéricos aplicados a la ingeniería o -0.2 -0.4 -0.6 -0.8 -1 -1.2 - 1.4 -1.6 -1.8 al gradiente Gradiente en (-1, -1, 2) Curva de nivel X2 +y2=3 -2~----------~----------~----------~----------~ -2 -1.5 -1 -0.5 o Con esta definición de gradiente y sus propiedades, se retoma el asunto del cálculo de la dirección que asegura la disminución de z =J¡2(X) + J}(x) (función escalar de x y y), en una cantidad localmente máxima en un punto. Se determina el vector gradiente de z con signo negativo en dicho punto (el signo negativo se debe a que se quiere que z disminu- ya.). El vector gradiente de z se representa por V'z. Por tanto, la dirección de descenso más brusco es: d=-(V'z) con cada uno de los componentes de d calculados como: d -~ 1 - dx ' d - ~2 - dy Ejemplo 4.9 Obtenga la dirección del descenso de máxima pendiente del sistema JI (xl' x2, x3) J2 (xl' x2, x3) J3 (xl' x2, x3) use como vector inicial a 3x, - cos(x2 x3) - 0.5 = O x? - 625xf = O e-x,x2 + 20x3 + (IOn: - 3)/3 = O
  • 312. Sistema de ecuaciones no lineal es 297 Solución z = [3x¡ - cos (x2 x3) - 0.5]2 + [x¡2 - 625xiJ2 + [e-X,X2 + 20x3 + (IOn: - 3)/3]2 d, = ~ = 6 (3x¡ - cos (XzX3) - 0.5) + 4x¡ (x¡2 - 625xi) ax¡ -2x2 e-X 'X2 [e-X ,X2 + 20x3 + (IOn: - 3)/3] azd2 = - = 2x3 sen (x2x3) [3x¡ - COS (x2 x3) - 0.5] aX2 -2500x2 (x¡2 - 625xi) - 2x1 e-X 'X2 [e-X ,X2 + 20x3 + (10n: - 3)/3] azd3 = - = 2x2 sen (xzX3) [3x¡ - cos (xzX3) - 0.5] + aX3 40 [e-X ,X2 + 20x3 + (IOn: - 3)/3] Al evaluar di' d2 , Y d3 en x(O) se obtiene: d¡ -9.0 d2 0.0 d3 418.87872 y entonces el vector dirección es: l -9 Jd = 0.00 418.87872la en on u- ás Una vez calculada la dirección, se utiliza una exploración unidimensional para localizar el mínimo en esta dirección (por ejemplo una búsqueda de Fibonacci). Ya localizado el mí- nimo, se calcula una nueva dirección de descenso de máxima pendiente y se repite el pro- cedimiento. Generalmente, el método se caracteriza por cortos movimientos en zig-zag que convergen muy lentamente a la solución; sin embargo, se utiliza para acercarse a la solución y después aplicar un método de alto orden de convergencia como el de Newton- Raphson; es decir, se emplea como un método para conseguir "buenos" valores iniciales. Este método puede ejemplificarse paso a paso con el Mathcad o un sofware equivalente y explorar con varios valores de t para encontrar el óptimo; cabe ensayado con diferentes sistemas e incluso proponer vectores de exploración, en fin, llevar la matemática a nivel experimental. ALGORITMO 4.5 Método del descenso de máxima pendiente Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar las funciones F(I,x) y las derivadas parciales de la función (ecuación (4.28» D(I,x) y los DATOS: Número de ecuaciones N, vector de valores iniciales x, número máximo de iteraciones MAXIT, cri- terio de convergencia EPS, intervalo de búsqueda [A,B] y el número de puntos de [A,B] por ensa- yarM. RESULTADOS: El vector solución x o mensaje "NO CONVERGE'. Solución Sistema de ecuaciones no lineales 297 z =[3x¡ - cos (X2X3) - 0.5]2 + [X¡2 - 625xi]2 + [C"X2 + 20x3 + (IOn: - 3)/3]2 d ¡ =~ = 6 (3x¡ - cos (X~3) - 0.5) + 4x¡ (x¡ 2- 625x:f) ax¡ - 2x2 e-X "'2 [e-X ,X2 + 20x3 + (IOn: - 3)/3] azd2 =- = 2x3sen (x2x3) [3x¡ - COS (x2x3) - 0.5] aX2 -2500x2 (x¡2 - 625x:f) - 2x1 e-X 'X2 [e-X ,X2 + 20x3 + (10n: - 3)/3] azd3=- =2x2sen (x~3) [3x¡ - COS (x~3) - 0.5] + aX3 40 [e-X ,X2 + 20x3 + (IOn: - 3)/3] Al evaluar di' d2, Y d3 en x(O) se obtiene: d¡ -9.0 d2 0.0 d3 418.87872 y entonces el vector dirección es: l-9 Jd = 0.00 418.87872 Una vez calculada la dirección, se utiliza una exploración unidimensional para localizar el mínimo en esta dirección (por ejemplo una búsqueda de Fibonacci). Ya localizado el mí- nimo, se calcula una nueva dirección de descenso de máxima pendiente y se repite el pro- cedimiento. Generalmente, el método se caracteriza por cortos movimientos en zig-zag que convergen muy lentamente a la solución; sin embargo, se utiliza para acercarse a la solución y después aplicar un método de alto orden de convergencia como el de Newton- Raphson; es decir, se emplea como un método para conseguir "buenos" valores iniciales. Este método puede ejemplificarse paso a paso con el Mathcad o un sofware equivalente y explorar con varios valores de t para encontrar el óptimo; cabe ensayarlo con diferentes sistemas e incluso proponer vectores de exploración, en fin, llevar la matemática a nivel experimental. ALGORITMO 4.5 Método del descenso de máxima pendiente Para encontrar una solución aproximada de un sistema de ecuaciones no lineales f(x) = O, proporcionar las funciones F(I,x) y las derivadas parciales de la función (ecuación (4.28» D(I,x) y los DATOS: Número de ecuaciones N, vector de valores iniciales x, número máximo de iteraciones MAXIT, cri- terio de convergencia EPS, intervalo de búsqueda [A,B] y el número de puntos de [A,B] por ensa- yarM. RESULTADOS: El vector solución x o mensaje "NO CONVERGE'.
  • 313. 298 Métodos numéricos aplicados a la ingeniería PASO 1. Hacer K = 1. PASO 2. Mientras K:<:;MXIT, repetir los pasos 3 a 27. PASO 3. Hacer Z = O. PASO 4. Hacer I = 1. PASO 5. Mientras I:<:;N, repetir los pasos 6 y 7. PASO 6. Hacer Z = Z + F(I, x) A2. PASO 7. Hacer I = I + 1. PASO 8. Si Z :<:;EPS ir al paso 29. De otro modo continuar. PASO 9. Hacer NP = O, NU = 1, MENOR = 1E20. PASO 10. Hacer J = 1. PASO 11. Mientras J :<:;M, repetir los pasos 12 a 25. PASO 12. Hacer S = NU + NP, T = A + (B-A)/S, L = 1. PASO 13. Hacer xa = x-T * dz. PASO 14. Hacer Z = O. PASO 15. Hacer 1= 1. PASO 16. Mientras I :<:;M, repetir los pasos 17 y 18. PASO 17. Hacer Z = Z + F(T, xa) A2. PASO 18. Hacer 1= I + 1 PASO 19. Si MENOR < Z, ir al paso 21. De otro modo continuar. PASO 20. Hacer MENOR = Z, TOPT = T. PASO 21. Si L = O ir al paso 24. De otro modo continuar. PASO 22. Hacer T = B-(B-A)/S, L = O. PASO 23. Ir al paso 13. PASO 24. Hacer NP = NU, NU = S. PASO 25. Hacer J = J + 1. PASO 26. Hacer x = x-TOPT * dz. PASO 27. Hacer K = K +1. PASO 28. IMPRIMIR "NO CONVERGE' Y TERMINAR. PASO 29. IMPRIMIR x y TERMINAR. 4. Ejemplo 4.10 Con el algoritmo 4.5, elabore un programa para resolver el sistema 11(x» x2' x3) 12(x,, x2' x3) 13 (x]> x2' x3) 3 xI - cos(x2 x3) - 0.5 = O X¡2 - 625x2 2 = O e-x,x2+ 20x3 + ( IOn: - 3)/3 = O use como vector inicial a Solución En el CD se presenta el PROGRAMA 4.3, basado en el método del descenso de máxima pen- diente y con búsqueda de Fibonacci. Para su empleo, el usuario proporcionará el procedimiento GRADTE, donde se forma la función z por minimizar y el gradiente de esta función Vz. Enseguida se anotan los re- sultados que se obtienen. 298 Métodos numéricos aplicados a la ingeniería PASO 1. Hacer K = 1. PASO 2. Mientras K ~ MXIT, repetir los pasos 3 a 27. PASO 3. Hacer Z = O. PASO 4. Hacer 1 = 1. PASO 5. Mientras 1 ~ N, repetir los pasos 6 y 7. PASO 6. Hacer Z = Z + F(I, x) A2. PASO 7. Hacer 1 = I + 1. PASO 8. Si Z ~ EPS ir al paso 29. De otro modo continuar. PASO 9. Hacer NP = O, NU = 1, MENOR = IE20. PASO 10. Hacer J = 1. PASO 11. Mientras J ~ M, repetir los pasos 12 a 25. PASO 12. Hacer S = NU + NP, T = A + (B-A)/S, L = l. PASO 13. Hacerxa = x-T*dz. PASO 14. Hacer Z = O. PASO 15. Hacer 1 = 1. PASO 16. Mientras 1 ~ M, repetir los pasos 17 y 18. PASO 17. Hacer Z = Z + F(T, Xa) A2. PASO 18. Hacer I = 1 + 1 PASO 19. Si MENOR < Z, ir al paso 21. De otro modo continuar. PASO 20. Hacer MENOR = Z, TOPT = T. PASO 21. Si L = Oir al paso 24. De otro modo continuar. PASO 22. Hacer T = B-(B-A)/S, L = O. PASO 23. Ir al paso 13. PASO 24. Hacer NP = NU, NU = S. PASO 25. Hacer J = J + 1. PASO 26. Hacer x = x-TOPT * dz. PASO 27. Hacer K = K +1. PASO 28. IMPRIMIR "NO CONVERGE' YTERMINAR. PASO 29. IMPRIMIR x y TERMINAR. Ejemplo 4.10 Con el algoritmo 4.5, elabore un programa para resolver el sistema Solución JI (XI' x2' x3) 3 x ¡ - cos(x2x3) - 0.5 = O J2 (xi' x2' x3) = x ¡2 - 625x2 2 =O J3 (xi' x2' x3) e-X 'X2+ 20x3 + ( IOn - 3)/3 =O use como vector inicial a En el CD se presenta el PROGRAMA 4.3, basado en el método del descenso de máxima pen- diente y con búsqueda de Fibonacci. Para su empleo, el usuario proporcionará el procedimiento GRADTE, donde se forma la función z por minimizar y el gradiente de esta función Vz. Enseguida se anotan los re- sultados que se obtienen.
  • 314. Sistema de ecuaciones no lineales 299 k Xl X2 X 3 Z t O 0.00000 0.00000 0.00000 1 0.01127 0.00000 -0.52458 1.11912e+002 0.00125 2 0.33117 -0.00002 -0.49597 2. 1500ge+000 0.03636 3 0.33479 0.00044 -0.52365 5.73944e-001 0.00125 4 0.50090 0.00759 -0.52085 2.58186e-001 0.05882 37 38 0.49998 0.49998 0.02000 0.02000 -0.52310 -0.52310 l.73843e-009 4.03291e-01O 0.03636 0.00077 Para finalizar este capítulo estudiaremos una aplicación del método de Newton-Raphson pa- ra encontrar factores cuadráticos de una ecuación polinornial con el método de Bairstow. 4.7 Método de Bairstow Este método, al igual que el método de Lin visto en el capítulo 2, permite obtener factores cuadráticos del polinomio" p(x) = aoX" + a1x"-1 + a2xll - 2 + ... + all , (4.32) aplicando el método de Newton-Raphson a un sistema relacionado con dicho polinomio. Más específicamente, la división de p(x) por el polinomio cuadrático x2 - ux - v (factor buscado) puede expresarse como: p(x) = (x2 - ux - v)q(x) + r(x) (4.33) donde q(x) es un polinomio de grado 11 - 2 Yr(x) el residuo lineal, dados respectivamente por q(x) = boX"-2 + b¡xn-3 + ... + bn_2 r(x) = bll _ 1 (u, v)(x - u) + bn (u, v) (4.34) (4.35) donde la notación bn_l(u, v) y bll (u, v) se usa para enfatizar que bn_1 y bn dependen de las u y v seleccionadas para formar el factor cuadrático. El factor cuadrático será un factor de p(x) si podemos escoger u y v de modo que bll(u, v) = O (4.36) Al desarrollar las operaciones indicadas en el lado derecho de la ecuación (4.33), se ob- tiene un polinomio cuyos coeficientes quedan expresados en términos de las b' s, u y v. Al igualar éstos con los coeficientes correspondientes de (4.32), se tiene a las b' s en la si- guiente forma: * Nótese que la forma en que se manejan los sub índices de los coeficientes difieren de la forma en que se usa- ron anteriormente y será exclusiva para esta sección.
  • 315. 300 Métodos n uméricos aplicados a la ingeniería ba = aa ba = aa b, - uba = al bl = al + uba b2 - ub ; - vba = a2 b2 = a2 + ub, + vba bk - ubk _ l - vbk _ 2 = ak bk = ak + ubk_l + vbk_2 b"_l - ubl1_2 - vb"_3 = a,,_l bl1 _ l = a,,_l + ub"_2 + vb"_3 bl1 - ubll _ l - vbn _ 2 = all bl1 = a" + ubll _ l + vbll _ 2 Si se hace artificialmente b, = OYb_2 = O,la expresión para bk vale para O::; k::; n, de mo- do que nuestra expresión general quedaría: O::;k5,n y en particular: ba = aa + ub_l + vb_2 b, = al + uba+ vo., Es interesante observar el carácter recursivo de las b' s ya que, por ejemplo, bk está expresa- da en términos de bk _ l y bk _ 2, Y ambas a su vez se pueden expresar en b' s cuyos subíndices son k - 2, k - 3 Y k - 3, k - 4, respectivamente. Continuando de esta manera, bk queda final- mente expresada en términos de los coeficientes de (4.32), que son conocidos, y obviamente de u y v que son propuestos. En adelante, todo se hará en forma recursiva, de modo que cual- quier cálculo relacionado con el sistema (4.36) quedará sujeto a un proceso de este tipo. La forma del factor cuadrático x2 - ux - v, tan artificial a primera vista, tiene su razón en la facilitación del cálculo de p(x) para un argumento complejo x = a + bi. Sean las ak reales. Haciendo u = 2a y v = -a2 - b2 , tenemos: x2 - ux - v = (a + bi)2 - 2a(a + bi) - (-a2 - b2) = a2 + 2abi - b2 - 2a2 - 2abi + a2 + b2 = O De esto, por la ecuación (4.32): p(x) = (x2 - ux - v)q(x) + r(x) = O + r(x) = bn_l(a + bi - 2a) + b" = bn_l(-a + bi) + b" Para obtener bl1 _ l y b" deberán evaluarse primero ba, b., ... , bn_2 y esto puede hacerse por aritmética real, ya que como vimos antes, se calculan en términos de los coeficientes del polinomio 4.32, que son reales y de u y v que también son reales, y sólo hasta el cálculo final se empleará aritmética compleja en la multiplicación de b"_l por (-a + bi). Si se diera el caso de que b"_l y bn fueran ceros, entonces p(x) = O, y los complejos conjugados a ± bi serían entonces ceros de p(x). El método de Bairstow consiste en usar el método de Newton para resolver el siste- ma (4.36). Las derivadas parciales de bl1 _ l y bn con respecto a u y v implican obtener primero las derivadas parciales de b,,_2' b"_3"" , b, Yba, dada la recursividad de b" y b"_l' Por esto, sea (4.37)
  • 316. mo- .37) por del ulo era bi te- las sea Sistema de ecuaciones no lineales 301 dbl C o=--= »¿ du db2 d(a2 + u(al + ubo) + vbo) cl = --a;;- = du = al + 'Iub¿ = b, + uCo C - db" - b ° n-l - du - n-l + UC,,_2 + VC,,_3 De este modo, las ck se calculan a partir de las bk , del mismo modo que las bk se obtuvie- ron a partir de las ako Los dos resultados que necesitamos son: db,,_1 C --- n-2 - du ' dbnC =-_. ,,-1 dL! db De igual modo, tomando derivadas respecto a v y haciendo dk = ~, encontramos: dv dbod2=--=O - dv dbl dl=--=O - dv db2 do=--=bo dv db3 d(a3 + ub.; + vbl) d(a3 + u(a2 + ub, + vbo) + vbl ) di = -- = = --=---=----'-----''----'- dv dv dv db d = --" = b + ud + vd11-2 dv 11-2 ,,-3 11-4 Como las ck y las dk satisfacen la misma recurrencia: <,= d_2 = O c_l = d, = O Co = do= bo Sistema de ecuaciones no lineales 301 db) Co= - - = bodu db2 d(az + u(a ) + ubo) + vbo) c )=--= =a1 +2ubO =b)+ucO du du C - db" - b . 1/-) - du - 11-) + uC,,_z + VC,,_3 De este modo, las ck se calculan a partir de las bk, del mismo modo que las bk se obtuvie- ron a partir de las ak. Los dos resultados que necesitamos son: db,,_) C - -- 17-2 - OU ' db"C =-- ,,-) du db De igual modo, tomando derivadas respecto a v y haciendo dk = ~, encontramos: dv dbo dz=-- =O - dv db) d)=-- =O - dv db2 do = - - =bo dv db3 d(a3 + ub2 + vb) d(a3 + u(a2 + ub) + vbo) + vb) d) =-- = =-~-----=---''----''------'- dv dv dv Como las ck y las dk satisfacen la misma recurrencia: c_2 =d_2 =O c_ ) =d_1 =O Co=do = bo
  • 317. [ . 302 Métodos numéricos ap licados a la ingeniería En particular dbll_l_ d - C dV - n-3 - 11-3' dbll ---d -cdV - n-2 - 11-2 y ahora se tiene todo para aplicar el método de Newton-Raphson. Supóngase que se tienen raíces aproximadas a ± bi de p(x) = O Ycon esto el factor cuadrático asociado x2 - ux - v, de p(x). Esto significa que tenemos raíces aproximadas de la ecuación 4.36. Aplicando el método de Newton-Raphson a (4.36) queda: cn _ 2h + cn _ 3k = -bn _¡ cll_¡h + cn_2k = -bll Dado que se trata de un sistema de dos ecuaciones lineales, se puede programar fácilmen- te la solución recurriendo a la regla de Cramer. h = bncn_3 - bll_lcn_2 , c2 - C C11-2 11-1 n-3 k = bl1_¡cll_l - bncn_2 c2 - C C11-2 11-1 11-3 Ejemplo 4.11 Encuentre los factores cuadráticos de la ecuación polinornial de cuarto grado p(x) = .0 - 8x3 + 39x2 - 62x + 50 = O Utilice como valor inicial x = O+ Oi; esto es, a = O Yb = O Solución Dado lo complejo del algoritmo, empezaremos identificando los elementos relevantes. ~ Grado del polinornio: n = 4. Coeficientes del polinornio: ao = 1;al = -8; a2 = 39; a3 = -62; a4 = 50. Factor cuadrático: U o = 2a = 2(0) = O; "o = _a2 - b2 = 02 - 02 = O. Cálculo de los coeficientes b de q(x) bo = ao = 1 b, = al + uobo = -8 + 0(1) = -8 b2 = a2 + uOb¡ + vobo = 39 + 0(-8) + 0(1) = 39 b3 = a3 + uOb2 + vObl = -62 + 0(39) + 0(-8) = -62 b4 = a4 + uOb3 + vOb2 = 50 + 0(-62) + 0(39) = 50 Recuérdese que b3 y b4 deberán tender a cero, en caso de convergencia. Cálculo de las derivadas parciales e Co = bo = 1 c¡ = b, + uoco = -8 + 0(1) =-8 c2 = b2 + uOcl + voco = 39 + 0(-8) + 0(1) = 39 c3 = b3 + uOc2 + vOc¡ = -62 + 0(39) + 0(-8) = -62 302 Métodos numéricos aplicados a la ingeniería En particular abll_ l _ d - c av - n-3 - 11-3' abll---d - cav - n-2 - 11-2 y ahora se tiene todo para aplicar el método de Newton-Raphson. Supóngase que se tienen raíces aproximadas a ± bí de p(x) = OYcon esto el factor cuadrático asociado x2 - ux - v, de p(x). Esto significa que tenemos raíces aproximadas de la ecuación 4.36. Aplicando el método de Newton-Raphson a (4.36) queda: cn_2h + cn_3k = -bn_¡ cll_¡h + cn_2k =- bn Dado que se trata de un sistema de dos ecuaciones lineales, se puede programar fácilmen- te la solución recurriendo a la regla de Cramer. Ejemplo 4.11 Encuentre los factores cuadráticos de la ecuación polinomial de cuarto grado p(x) =.0 - 8x3 + 39x2 - 62x + 50 =O Utilice como valor inicial x = O+ Oí; esto es, a = OYb = O Solución Dado lo complejo del algoritmo, empezaremos identificando los elementos relevantes. I~ I Grado del polinomio: n = 4. Coeficientes del polinomio: ao = 1; a¡ = -8; a2 = 39; a3 = -62; a4 = 50. Factor cuadrático: Uo = 2a = 2(0) = O; V o= _a2 - b2 = 02 - 02 = O. Cálculo de los coeficientes b de q(x) bo= ao= 1 b¡ = al + uobo = - 8 + 0(1) = -8 b2 = a2 + uOb¡ + vobo = 39 + 0(- 8) + 0(1) = 39 b3 = a3 + uOb2 + vOb ¡ = -62 + 0(39) + 0(-8) = -62 b4 = a4 + uOb3 + vOb2 = 50 + 0(- 62) + 0(39) = 50 Recuérdese que b3 y b4 deberán tender a cero, en caso de convergencia. Cálculo de las derivadas parciales c Co =bo= 1 c¡ = b¡ + uoco = - 8 + 0(1) =-8 c2 = b2 + uOc¡ + voco = 39 + 0(- 8) + 0(1) = 39 c3 = b3 + uOc2 + vOc] = -62 + 0(39) + 0(-8) = -62
  • 318. en v, el n- Sistema de ecuaciones no lineales 303 Formando el sistema linearizado se obtiene: cll _ 2h + cn_3k = - bn_¡ o bien c2h + e.k = - b3 o bien 39h + 8k = -(-62) cn_¡h + cll _ 2k = - bl1 o bien c3h + c2k = - b4 o bien -62h + 39k = -50 Al resolver este sistema por la regla de Cramer se obtiene: h = b4c¡ - b3c2 cl- c3c¡ b3 c3 - b4 c2 k= 2 = C2 - c3c¡ Cálculo del nuevo factor cuadrático 50(-8) - (-62)(39) = 1.96878 392 -(-62)(-8) -62(-62) - 50(39) = 1.84780 392 -(-62)(-8) U¡ = ua + h = O + 1.96878 = 1.96878 VI = va + k = O+ 1.84780 = 1.84780 Las nuevas aproximaciones a las raíces son: x = a + bi; donde a = u¡l2 = 1.96878/2 = 0.98439 y b = ± ) - VI - a2 = ± 1.67834i x = 0.98439 ± 1.67834i. Para ver si el proceso converge puede evaluarse el polinornio en las diferentes aproxima- ciones a las raíces y ver si lp(x) 1::::;e, en donde E, en este caso podría tomarse como 10-5. La ecuación 4.28 queda entonces: p(x) = x4 - 8x3 + 39x2 - 62x + 50 = -31.6831 ± 11.3870i 1 p(x) 1 = )(-31.6831)2 + (11.3870)2 = 33.6671 Al continuar el proceso iterativo, se obtienen los siguientes resultados: Segunda Iteración k O 1 2 3 4 bk 1 -6.03122 28.97366 -16.10175 71.83686 ck 1 -4.06244 22.82341 21.32595 1 p(x) 1 13.4132 Con estos valores x = 1.04666 ± 0.56619i Tercera Iteración k O 1 2 3 4 bk 1 -5.90668 25.21935 -0.84351 12.52183 ck 1 -3.81336 15.82070 37.67428 1 p(x) 1 0.170093 Con estos valores x = 1.00299 ± 0.99679i
  • 319. 304 Métodos numér icos aplicados a la ingeniería Cuarta Iteración k o 1 2 3 4 1 1 -5.99401 24.97649 0.08813 0.23405 -3.98802 14.97697 38.10619 Ip(x) 13.86 X 10-4 Con estos valores x = 1.00000033 ± 0.9999990063i Se puede ver que el proceso está convergiendo a las raíces x = 1 ± li. En el disco se encuentra el programa 4.4 que realiza estos cálculos. Ejercicios 4.1 Uno de los problemas de ingeniería química que mejor ilustra la reducción de ecuaciones es el cálculo de la fracción de vapor VIF en una vaporización instantánea (véase ejercicio 2.6), donde se tienen las ecuaciones i = 1,2, ... , n (1) (2) provenientes del balance de materiales, y las relaciones de equilibrio líquido-vapor K=~, x¡ i = 1,2, ... , n (3) donde: pO K.=-' , P i = 1, 2, ... , n (4) y i = 1,2, ... , n (5) con las constantes A¡, B¡ y C¡ dadas para cada componente i. Además se tiene: n ~x ¡=I t 11 ~ y= O ¡=I ' (6) 11 ~ Z = 1 ¡=I t (7) Por otro lado, se tiene en estos problemas generalmente especificadas: z¡, i = 1,2, ... , n - 1, P, T Y F. Para un número de componente n = 9: por ejemplo, se tiene entonces un sistema de 39 ecuaciones en las 39 incógnitas: L, V, x, y¡, K¡, p¡, i = 1,2, ... ,9 YZ9' que puede redu- cirse, en general, como sigue. Al combinar las ecuaciones (2) y (3) se eliminan las y¡, y se obtiene: Z¡ F x· =---'--- 1 (K¡, V + F) (8) 304 Métodos numéricos aplicados a la ingeniería Cuarta Iteración k O 1 2 3 4 bk 1 -5.99401 24.97649 0.08813 0.23405 ck 1 - 3.98802 14.97697 38.10619 Ip(x) 13.86 X 10-4 Con estos valores x = 1.00000033 ± 0.9999990063i Se puede ver que el proceso está convergiendo a las raÍCes x = 1 ± li. En el disco se encuentra el programa 4.4 que realiza estos cálculos. Ejercicios 4.1 Uno de los problemas de ingeniería química que mejor ilustra la reducción de ecuaciones es el cálculo de la fracción de vapor VIF en una vaporización instantánea (véase ejercicio 2.6), donde se tienen las ecuaciones i =1,2,... , n provenientes del balance de materiales, y las relaciones de equilibrio líquido-vapor donde: y K=~, pO K.= - ' , P i =1,2,... , n i = 1, 2,... , n i = 1,2,... , n con las constantes A i, Bi YCi dadas para cada componente i. Además se tiene: n n. ~x i=1 ' ~ y=O i=l ' 11 ~ Z = 1 i=1 ' (1) (2) (3) (4) (5) (6) (7) Por otro lado, se tiene en estos problemas generalmente especificadas: z¡, i = 1,2,... , n - 1, P, T Y F. Para un número de componente n = 9: por ejemplo, se tiene entonces un sistema de 39 ecuaciones en las 39 incógnitas: L, V, Xi' Yi' Ki, Pi' i = 1, 2,... ,9 YZ9' que puede redu- cirse, en general, como sigue. Al combinar las ecuaciones (2) y (3) se eliminan las Yi' y se obtiene: Zi F x· =----'--- , (K¡, V + F) (8)
  • 320. se es cio (1) (2) (3) (4) (5) (6) (7) de u- 8) Sistema de ecuaciones no lineales 305 Al combinar las ecuaciones (6) y (3): n 11 Lx L K¡x = O ¡=I ' ¡=I' o bien: 1/ Lx(1-K.)=O i=l I 1 (9) con la sustitución de (8) en (9) se tiene: ; z, F(l- K) z: -'-------'--=0 i=1 K¡ V + L (10) Pero de (1) L = F-V, con lo que queda finalmente: 11 z.(l-K.) L 1 '=0 i= I V (K, - 1) + F (11) Hay que observar que si se conocen los valores de z¡, i = 1,2, ... , n - 1 (usando la ecua- ción (7) se obtiene z.), los valores de A¡, B¡, C¡, i = 1, 2, ... , n y los valores de P y T (usando (5) y (4) se obtiene K¡, i = 1,2, ... , n) y F, la ecuación (11) es ya sólo función de V, con lo que se ha reducido el sistema de 39 ecuaciones con 39 incógnitas a una so- la ecuación con una incógnita (V), cuya solución puede obtenerse con alguno de los mé- todos del capítulo 2. 4.2 La presión requerida para sumergir un objeto pesado grande en un terreno suave y homo- géneo, que se encuentra sobre un terreno de base dura, puede predecirse a partir de la pre- sión requerida para sumergir objetos más pequeños en el mismo suelo. * En particular, la presión p requerida para sumergir una lámina circular de radio r, a una distancia d en el te- rreno suave, donde el terreno de base dura se encuentra a una distancia D > d debajo de la superficie, puede aproximarse mediante una ecuación de la forma: (1) donde kl, k2 Yk3 son constantes que, con k2 > O,dependen de d y la consistencia del terre- no pero no del radio de la lámina. a) Encuentre los valores de ki' k2 Y k3 si se supone que una lámina de radio de 1 pul- gada requiere una presión de 10 lb/pulg? para sumergirse 1 pie en el terreno lodoso; una lámina de radio 2 pulgadas, requiere una presión de 12 lb/pulg? para sumergir- se 1 pie; y una lámina de radio 3 pulgadas requiere una presión de 15 lb/pulg? (su- poniendo que el lodo tiene una profundidad mayor que 1 pie). b) Use los cálculos de a) para predecir cuál es la lámina circular de radio mínimo que se necesitaría para sostener un peso de 500lb en este terreno, con un hundimiento de menos de 1 pie. Solución Inciso a) Al sustituir los valores de r y p en (1) para los tres casos, se tiene: 10 = kl exp(k2) + k3 12 = k, exp(2k2) + 2k3 15 = k, exp(3k2) + 3k3 * Richard L. Burden y J. Douglas Faires. Análisis numérico. Grupo Editorial Iberoamericana (1985). Sistema de ecuaciones no lineales 305 Al combinar las ecuaciones (6) y (3): n 11 Lx L K¡x = O ¡=I I ¡=I I o bien: 1/ L x (l-K.) = O i=l 1 1 con la sustitución de (8) en (9) se tiene: ; Z¡ F(l- K) "-- -'--------'--=0 i=1 K¡ Y + L Pero de (1) L =F-Y, con lo que queda finalmente: 11 z.(l-K.) L 1 I =0 ¡=I Y (Ki - 1) + F (9) (10) (11) Hay que observar que si se conocen los valores de z¡, i = 1, 2,... , n - 1 (usando la ecua- ción (7) se obtiene zl/)' los valores de A¡, B¡, C¡, i = 1, 2, ... , n y los valores de P y T (usando (5) y (4) se obtiene K¡, i = 1, 2, ... , n) y F, la ecuación (11) es ya sólo función de Y, con lo que se ha reducido el sistema de 39 ecuaciones con 39 incógnitas a una so- la ecuación con una incógnita (Y), cuya solución puede obtenerse con alguno de los mé- todos del capítulo 2. 4.2 La presión requerida para sumergir un objeto pesado grande en un terreno suave y homo- géneo, que se encuentra sobre un terreno de base dura, puede predecirse a partir de la pre- sión requerida para sumergir objetos más pequeños en el mismo suelo.* En particular, la presión p requerida para sumergir una lámina circular de radio r, a una distancia d en el te- rreno suave, donde el terreno de base dura se encuentra a una distancia D > d debajo de la superficie, puede aproximarse mediante una ecuación de la forma: (1) donde kl , k2 Yk3 son constantes que, con k2 > O, dependen de d y la consistencia del terre- no pero no del radio de la lámina. a) Encuentre los valores de ki' k2 Y k3 si se supone que una lámina de radio de 1 pul- gada requiere una presión de 10 Ib/pulg2 para sumergirse 1 pie en el terreno lodoso; una lámina de radio 2 pulgadas, requiere una presión de 12 Ib/pulg2 para sumergir- se 1 pie; y una lámina de radio 3 pulgadas requiere una presión de 15 lb/pulg2 (su- poniendo que el lodo tiene una profundidad mayor que 1 pie). b) Use los cálculos de a) para predecir cuál es la lámina circular de radio mínimo que se necesitaría para sostener un peso de 500 lb en este terreno, con un hundimiento de menos de 1 pie. Solución Inciso a) Al sustituir los valores de r y p en (1) para los tres casos, se tiene: 10 = k¡ exp(k2) + k3 12 = k¡ exp(2k2) + 2k3 15 = kl exp(3k2) + 3k3 * Richard L. Burden y J. Douglas Faires. Análisis numérico. Grupo Editorial Iberoamericana (1985).
  • 321. ..,. 306 Métodos numéricos aplicados a la ingeniería un sistema de tres ecuaciones no lineales en las incógnitas k" k2 Y k3. Se despeja k3 de la primera ecuación Se sustituye k3 en las dos restantes y se tiene: 12 = k¡ exp(2k2) + 2[10 - k¡ exp(k2)] 15 = k¡ exp(3k2) + 3[10 - k¡ exp(k2)] o bien: !¡ (k" k2) = k¡ [exp (2k2) - 2exp (k2)] + 8 = O !2 (k" k2) = k¡[exp (3k2) - 3exp (k2)] + 15 = O (2) un sistema de dos ecuaciones no lineales en las incógnitas k¡ y k2. Al dividir miembro a miembro estas dos ecuaciones kj [exp (2k2) - 2exp (k2)] -8 k¡ [exp (3k2 ) - 3exp (k2 )] -15 se obtiene: 8 6 exp (k2) - - exp (2k2) - - = O 15 15 o bien: (3) una ecuación no lineal en la incógnita k2 , cuya solución con el método de Newton-Raps- han visto en el capítulo 2 es: k2 = 0.259695; al sustituir k2 en cualquiera de las ecuaciones (2) y despejar se tiene: -8 k¡ = = 8.771286, exp (2k2 ) - 2exp (k2 ) por último: Inciso b) Un peso de 500 lb sobre un disco de radio r producirá una presión de 500/(n:r2) lb/pulg-. Entonces: 500 p = -- = k¡ exp (k2 r) + k3 r n:r2 o bien: Para obtener el valor mínimo de r, se iguala! I (r) con cero 306 Métodos numéricos aplicados a la ingenie ría un sistema de tres ecuaciones no lineales en las incógnitas kp k2 Yk3. Se despeja k3 de la primera ecuación Se sustituye k3 en las dos restantes y se tiene: o bien: 12 = k¡ exp(2k2) + 2[10 - k¡ exp(k2)] 15 = k, exp(3k2) + 3[10 - k¡ exp(k2)] J¡ (kl' k2) = k, [exp (2k2) - 2exp (k2)] + 8 = O J2 (kl' k2) = k, [exp (3k2) - 3exp (k2)] + 15 =O un sistema de dos ecuaciones no lineales en las incógnitas k, y k2. Al dividir miembro a miembro estas dos ecuaciones k¡ [exp (2k2) - 2exp (k2) ] -8 k,[exp (3k2) - 3exp (k2)] - 15 se obtiene: 8 6 exp (k2 ) - - exp (2k2) - - = O 15 15 o bien: (2) (3) una ecuación no lineal en la incógnita k2, cuya solución con el método de Newton-Raps- hon visto en el capítulo 2 es: ~ = 0.259695; al sustituir k2 en cualquiera de las ecuaciones (2) y despejar se tiene: -8 k, = = 8.771286, exp (2k2) - 2exp (k2) por último: Inciso b) Un peso de 500 lb sobre un disco de radio r producirá una presión de 500/(n:r2 ) Ib/pulg2. Entonces: o bien: 500 p =-- =k¡ exp (k2 r) + k3 r n:r2 Para obtener el valor mínimo de r, se iguala!, (r) con cero
  • 322. la Sistema de ecuaciones no lineales 307 lo que origina una ecuación no lineal en la incógnita r, cuya solución por medio de algu- no de los métodos del capítulo 2 da r = 3.18516 pulg. que corresponde a un mínimo de f (r). El lector puede verificar esto usando alguno de los criterios del cálculo diferencial. 4.3 Resuelva el siguiente sistema verificando primero su partición. el: XI + x4 -10 = O e2: xlx4x3 - Xs - 6 = O 2) e 3 : XIX/ 7 (X4 - 5) - 8 = O e 4 : x4 - 3xI + 6 = O es: xIX3 - Xs + 6 = O a) Se forma una matriz de incidencia XI x2 x3 x4 X s 3) el 1 1 s- e2 1 1 1 1 e 3 1 1 1 e4 1 1 es 1 Solución Si bien la descomposición de un sistema en subsistemas es conocida como partición, la se- cuencia para resolver los subsistemas resultantes se denomina orden de precedencia del sistema. Existen algoritmos para partir un conjunto de ecuaciones y determinar el orden de precedencia. A continuación se seguirán las ideas de estos algoritmos a fin de partir el sis- tema dado. donde cada fila corresponde a una ecuación y cada columna a una variable. Un 1 aparece en la fila i y la columna}, si la variable xi aparece en la ecuación e¡. b) Se rearreglan las filas y columnas para apreciar mejor las particiones y el orden de precedencia. Así después de un rearreglo se llega a ~J ~J1 G 1 1 [~ donde se nota de inmediato que en las ecuaciones eI y e4 aparecen solamente las variables x¡ y x4 ' y constituyen entonces un subsistema que puede resolverse primero el: xl+x4=10 e4: -3x¡ + x4 = -6 resulta x2 = 4 Yx4 = 6.
  • 323. 308 Métodos numéricos aplicados a la ingeniería Estos valores se sustituyen en la ecuación e3 y ésta queda en función de x2 solamen- te; por tanto, como una ecuación en una incógnita e3 : 4X 2 1.7_8=0 resulta x2 = 1.5034 Finalmente, las ecuaciones e2 y es pueden resolverse para x3 y xs' lo que da X 3 1.255 X s 11.0202 4.4 En un reactor se efectúan las siguientes reacciones en fase gaseosa: A+B •••====~. (1) 2E (2) A la temperatura de la reacción, las constantes de equilibrio son kp¡=2.6 y kP2 = 3.1 Las composiciones iniciales son 2 mol/L de A y 1 mol/L de B. Calcule la composición a la salida del reactor, asumiendo que se alcanza el equilibrio. Solución Si x¡ representa los moles de A convertidos en la reacción (1), y x2 los moles de A conver- tidos en la reacción (2), entonces en el equilibrio tenemos: moles deA moles de B moles de C moles de D moles de E moles totales 2 -x¡ -x2 l-x¡ x¡ -x2 x¡ 2x2 3 Con la aplicación de la ley de acción de masas se obtiene: Para la reacción ( 1) 2.6 = (x¡ - x2)(xj) (2 - x¡ - x2)(l - x¡) Para la reacción ( 2 ) 3.1 = (2x2)2 (2 - x¡ - x2)(x¡ - x2) que es un sistema de dos ecuaciones no lineales en dos incógnitas, cuya solución por el método de Newton-Raphson, por ejemplo, exige: - Un vector inicial cercano a la solución, obtenible a partir de consideraciones físi- cas del problema. - La matriz jacobiana, ampliada con el vector de funciones, que es relativamente fá- cil, puesto que las derivadas parciales son directas. Vector inicial. En virtud de las funciones y la existencia inicial de 2 moles de A y 1 mol de B, se propone x¡ = 0.8 Yx2 = 0.4. Las derivadas parciales para la matriz jacobiana se dan a continuación 308 4.4 Métodos numéricos aplicados a la ingeniería Estos valores se sustituyen en la ecuación e3 y ésta queda en función de x2 solamen- te; por tanto, como una ecuación en una incógnita e3: 4X/7 _8 = 0 resulta x2 = 1.5034 Finalmente, las ecuaciones e2 y es pueden resolverse para x3 y xs' lo que da x3 1.255 X s 11.0202 En un reactor se efectúan las siguientes reacciones en fase gaseosa: (1) 2E (2) A la temperatura de la reacción, las constantes de equilibrio son kp ¡=2.6 y kP2 =3.1 Las composiciones iniciales son 2 mol/L de A y 1 mol/L de B. Calcule la composición a la salida del reactor, asumiendo que se alcanza el equilibrio. Solución Si x ¡ representa los moles de A convertidos en la reacción (1), y x2 los moles de A conver- tidos en la reacción (2), entonces en el equilibrio tenemos: moles deA 2 - Xl -x2 moles de B l-x l moles de C Xl - x2 moles de D xl moles de E 2x2 moles totales 3 Con la aplicación de la ley de acción de masas se obtiene: Para la reacción ( 1 ) 2.6 = (Xl - x2)(xJ) (2 - Xl - x 2)(l - Xl) Para la reacción ( 2 ) que es un sistema de dos ecuaciones no lineales en dos incógnitas, cuya solución por el método de Newton-Raphson, por ejemplo, exige: - Un vector inicial cercano a la solución, obtenible a partir de consideraciones físi- cas del problema. - La matriz jacobiana, ampliada con el vector de funciones, que es relativamente fá- cil, puesto que las derivadas parciales son directas. Vector inicial. En virtud de las funciones y la existencia inicial de 2 moles de A y 1 mol de B, se propone Xl =0.8 Yx2 =OA. Las derivadas parciales para la matriz jacobiana se dan a continuación
  • 324. Sistema de ecuaciones no lineales 309 n- (x, - x2) (x,) i, (x" x2) = (2 _ x, _ x 2 ) (1 _ x,) - 2.6 = O (2x2)2 f2(x"X2)= -3.1=0 (2 - x, - x2) (xI - x2) (2 - x, - x2)(1 - xl)(2xI - x2) - (XI - x2)(x,)( -3 + 2 xI + x2) «2 -x, -x2)(1-x,»2 (2 - x, - x2) (1 - x,) (x,) + (xI - x2)(x,) (x, - 1) «2 - x, - x2) (1 - x,»2 of2 (x" x2) -(2x2) 2 (2 - 2x,) ox, ( (2 - x, - x2) (x¡ - x2»2 8 (2 -x, -x2) (x, -x2) x2- 8 xl(-l + x2) ( (2 - x, - x2) (x, - X2»2 (1) (2) Las rio. Con el PROGRAMA 4.1 del CD se obtienen los siguientes resultados: k X(I) X(2) Distancia O 0.80000 0.40000 0.82175 0.46596 6.94595e-002 2 0.83460 0.45687 1.57387e-002 3 0.83176 0.4557l 3.06403e-003 4 0.83145 0.45566 3.18286e-004 5 0.83144 0.45565 1.21513e-005 6 0.83144 0.45565 4.10222e-007 La solución del sistema es: X(l) = 0.83144 X(2) = 0.45565 ver- 4.5 El mezclado imperfecto en un reactor continuo de tanque agitado, se puede modelar co- mo dos o más reactores con recirculación entre ellos, como se muestra en la figura si- guiente. físi- F = 25L/min F+ FR CA F CA I 2 . FR. r te fá- mol Figura 4.15 Reactores químicos con recirculación.
  • 325. 1'71'" 310 Métodos numéricos aplicados a la ingeniería En este sistema se lleva a cabo una reacción isotérmica irreversible del tipo A .E:B de orden 1.8 con respecto al reactante A. Con los datos que se proporcionan abajo, calcu- le la concentración del reactante A en los reactores 1 y 2 (CAl Y CA2respectivamente), una vez alcanzado el régimen permanente. Datos F = 25 L/min CAo= 1 mollL FR = 100 L/min VI = 80 L V2 = 20 L k = 0.2 (L/mol)o.s (min -1) Solución Con el balance del componente A en cada uno de los reactores se tiene Entra Sale Reacciona Acumulación Reactor 1 (1) Reactor 2 (F+FR)CAI- (FR+F)CA2-V2kcnA2=0 un sistema de dos ecuaciones no lineales en las incógnitas CAl y CA2. No obstante, se observa que despejando a CA2de la ecuación (1) (F + FR) CAl + VI k CltAI- F CAOCA2=----~~~~--~--~~--~~ FR (2) y sustituyéndola en la ecuación (2) (F + FR ) CAl + V I k C"Al - FC AO 125 CAl - 125 -----'-'----''-'-'----'------'-'-'------'=- FR _iv, [(F + FR) CAl + VI k C"AI - FCAO] 11 = O - FR el problema se reduce a una ecuación no lineal en la incógnita CAl' cuya solución se en- cuentra empleando alguno de los métodos del capítulo 2 y se deja al lector como ejercicio. CAl = 0.6493 CA2= 0.6352 4.6 En una lámpara de arco: de longitud de arco constante, se observa el voltaje V empleado por el arco para diversos valores de la corriente 1 Resultados: 1 0.5 1 2 4 8 12 V 160 120 94 75 62 56 Encuentre la ecuación que mejor represente estos valores, empleando el criterio de míni- mos cuadrados . • J. Lipka. Computaciones gráficas y mecánicas. Lipka J. CECSA. 310 Métodos numéricos aplicados a la ingeniería En este sistema se lleva a cabo una reacción isotérmica irreversible del tipo A ~ B de orden 1.8 con respecto al reactante A. Con los datos que se proporcionan abajo, calcu- le la concentración del reactante A en los reactores 1 y 2 (CAl YCA2 respectivamente), una vez alcanzado el régimen permanente. Datos VI = 80 L V2 = 20 L F = 25 Llmin CAO = 1 mollL FR =100 Llmin k = 0.2 (Llmol)o.8 (rnin - 1) Solución Con el balance del componente A en cada uno de los reactores se tiene Entra Sale Reacciona Reactor 1 Reactor 2 (F + FR ) CAl - (FR + F) CA2 - V2k cnA2 = O un sistema de dos ecuaciones no lineales en las incógnitas CAl y CA2. No obstante, se observa que despejando a CA2 de la ecuación (1) (F + FR ) CAl + V I k C/AI - F CAO CA2 =-----=.-'------'-'.:....---'----'-.:..:'--------'-''''- FR y sustituyéndola en la ecuación (2) (F + FR ) CAl + VI k cnAl - FCAO 125 CAI - 125 ------'-'--'-'-'----'------'-'-'-------'=- FR _ kV? [ (F + FR ) CAl + VI k cnAI - FCAO] 11 = O - FR Acumulación (1) (2) el problema se reduce a una ecuación no lineal en la incógnita CAl' cuya solución se en- cuentra empleando alguno de los métodos del capítulo 2 y se deja al lector como ejercicio. Resultados: CAl = 0.6493 CA2 =0.6352 4.6 En una lámpara de arco,* de longitud de arco constante, se observa el voltaje V empleado por el arco para diversos valores de la corriente 1 1 0.5 1 2 4 8 12 V 160 120 94 75 62 56 Encuentre la ecuación que mejor represente estos valores, empleando el criterio de míni- mos cuadrados. • J. Lipka. Computaciones gráficas y mecánicas. Lipka J. CECSA.
  • 326. Sistema de ecuaciones no lineales 311 SoluciónB Se traza el diagrama de dispersión cu- una v •150 • 100 • • •50 •(1) 2 5 10 1 (2) y se observe que la curva suave que pasa entre los puntos es hiperbólica y asintótica a al- guna recta horizontal V = c. Con esto, se supone que los datos pueden quedar relaciona- dos por la ecuación donde' b < O. Los parámetros a, b y e se determinan minimizando la función 6 f( a, b, c) = L (V; - al/ - C)2 ;=1 La ecuación (2) se deriva parcialmente con respecto a a, b y e, y se igualan a cero dichas derivadas parciales para obtener: 666 L vtr :« L I2b_c L Ib=O11 1 1 ;=J ;=1 ;=1 6 6 6 L V J/ lnl, - a L 1;2b lnl¡ - e L Illnl; = O ;=1 ;=J ;=1 6 6 b L V¡ - a L I¡ - 6 e = O ;=1 ;=J en- icio, 93 352 ado un sistema de tres ecuaciones no lineales en las incógnitas a, by c. Al despejar e de la tercera ecuación: 1 6 c=- L V. 6 ;=1 1 a 6 6 L Il ;=1 'ni- y sustituir en las dos primeras, se tiene: 6 6 1 6 6 6 I, (a b) = L V lb - a L Ilb - - [ LV] [ L lb] + [ --ª- L lb F= O , ;=1 1 1 ;=1 1 6 ;=1 1 ;=1 1 6 ;=J 1 • b > O en el caso de una parábola, con ordenada al origen c. (1) (2) (3) (4) (5)
  • 327. pr 312 Métodos n uméricos aplicados a la ingeniería un sistema de dos ecuaciones no lineales en las incógnitas a y b, cuya solución requiere valores iniciales. Para estimar valores iniciales, en la ecuación (1) se sustituyen tres de los puntos dados 160 = a 0.5b + e 75 = a 4b + e 56 = a l2b + e al despejar e de la tercera y sustituir en las dos primeras se tiene: 160 = a 0.5b + 56 - a 12b 75 = a 4b + 56 - a 12b o bien a (0.5b - 12b) 104 a(4b-12b) 19 Estas dos últimas ecuaciones se dividen miembro a miembro ,,' 0.5b - 12b 104 4b-12b 19 se rearregla 19 (0.5)b + 85 (12)b -104 (4)b = O y se resuelve esta ecuación no lineal con alguno de los métodos del capítulo 2 para obtener: b = -0.51952 de donde: a = 89.77 El sistema (5) se resuelve utilizando éstos como valores iniciales y el método de Newton- Raphson multivariable, con lo que resulta (1) a 87.78 b -0.532 y al sustituir en (4) se obtiene: e = 32.86 De tal manera que la ecuación que mejor ajusta los datos queda: , v = 87.78 1 -0.532 + 32.86 4.7 Para la obtención de butadieno a partir de etanol en fase vapor, se propone el siguiente me- canismo de reacción. CH3-CH2-OH ~('====== /OH CH2 = C,-----+ CH2 = CH2 .::,====== H , /011 CH2.:=C", + H2 . H (2) (3) 312 4.7 Métodos numéricos aplicados a la ingeniería un sistema de dos ecuaciones no lineales en las incógnitas a y b, cuya solución requiere valores iniciales. Para estimar valores iniciales, en la ecuación (1) se sustituyen tres de los puntos dados 160 = a 0.5b + e 75 = a 4b + e 56 = a 12b + e al despejar e de la tercera y sustituir en las dos primeras se tiene: 160 = a 0.5b + 56 - a 12b 75 = a 4b + 56 - a l2b o bien a (0.5" - 12b) 104 a (4b -12b) 19 Estas dos últimas ecuaciones se dividen miembro a miembro 0.5b - 12b 104 4b -12b 19 se rearregla 19 (0.5)b + 85 (12)b -104 (4)b = O y se resuelve esta ecuación no lineal con alguno de los métodos del capítulo 2 para obtener: b =-0.51952 de donde: a =89.77 El sistema (5) se resuelve utilizando éstos como valores iniciales y el método de Newton- Raphson multivariable, con lo que resulta a 87.78 b -0.532 y al sustituir en (4) se obtiene: e = 32.86 De tal manera que la ecuación que mejor ajusta los datos queda:, v=87.78 [ - 0.532 + 32.86 Para la obtención de butadieno a partir de etanol en fase vapor, se propone el siguiente me- canismo de reacción. CH3-CH2-OH .::,.====== / OH CH2 = C"-... + CH2 = CH2 .::.====== H . /0H. CH2.:= C", + H2 H CH2 = CH-HC = CH2 + H20 (1) (2) (3)
  • 328. Sistema de ecuaciones no lineales 313 uiere Calcule las composiciones en el equilibrio a 400 o C y 1 atm, si las constantes de equi- librio son 5.97, 0.27 Y 2.8 para las reacciones (1), (2) Y (3), respectivamente. Solución Base de cálculo: 1 mol de etanol. Si dos XI = moles de etileno producidas en la reacción (1) x2 = moles de hidrógeno producidas en la reacción (2) x3 = moles de agua producidas en la reacción (3) entonces en el equilibrio se tendrá: moles de etanol moles de etileno moles de agua moles de hidrógeno moles de acetaldehído moles de butadieno moles totales 1 - xI - x2 XI -x3 XI + x3 x2 x2 -x3 x3 1 + xI + x2 De acuerdo con la ley de acción de masas, se tiene: tener: (XI + x3) (xI - x3) [ P l,1nl 5.97 (1-xl -x2) 1 +xl +x2 0.27 = (x2 + x3) x2 [ P 1,1n2 (1-xl -x2) 1 +xl +x2 2.8 = (XI + x3) x3 [ P l,1n3 (XI - x3 )( x2 - x3 ) 1 + XI + x2 donde Sn, = número de moles de los productos-número de moles de los reactantes (en la reacción i). Por tanto: wton- ,1nl = 2 - 1 = 1 ,1n2 =2-1=1 ,1n3 =2-2=0 Por otro lado: P = 1 atm. Vector inicial. Luego de observar las funciones y el hecho de que la base de cálculo es 1 mol de etanol, se propone e me- XI = 0.7, X2 = 0.2, (1) Si se utilizaran las ecuaciones del sistema tal como están, se tendrían serios problemas, ya que si xI + x2 = 1, habría división entre cero. Un reacomodo de las ecuaciones permitiría no sólo evitar la división entre cero, sino obtener una convergencia más rápida. Por ejem- plo, podría escribirse el sistema así., p,1nl (XI + X 3 )(x l - x 3 ) -5.97(1 - XI - x 2 )(1 + XI + X 2 ),1nl = O p,1n2 (x 2 + x 3 )x 2 - 0.27(1 + XI + x 2 )(1 + XI + X 2 ),1n2 = O p,1n3 (XI + x 3 )x 3 - 2.8(xl - x 3 )(x 2 - x 3 )(1 + XI + x 2 ),1n3 = O (2) (3) Sistema de ecuaciones no lineales 313 Calcule las composiciones en el equilibrio a 400 o C y 1 atm, si las constantes de equi- librio son 5.97, 0.27 Y2.8 para las reacciones (1), (2) Y(3), respectivamente. Solución Base de cálculo: 1 mol de etanol. Si X ¡ = moles de etileno producidas en la reacción (1) x2 = moles de hidrógeno producidas en la reacción (2) x3 =moles de agua producidas en la reacción (3) entonces en el equilibrio se tendrá: moles de etanol moles de etileno moles de agua moles de hidrógeno moles de acetaldehído moles de butadieno moles totales 1 - x¡- x2 x ¡ -x3 x¡ + x3 x2 x2 -x3 x3 1 + xl + x2 De acuerdo con la ley de acción de masas, se tiene: 0.27 = (x2 + x3) x2 (1-x l -X 2 ) (xI + x3) x3 [ P 1~n32.8 = (X I - X3 ) (X2 - X3 ) 1 + XI + x2 donde ~ni =número de moles de los productos-número de moles de los reactantes (en la reacción i). Por tanto: Por otro lado: ~n¡ =2 - 1 = 1 ~n2 =2 - 1=1 ~n3 = 2-2 =0 P = 1 atm. Vector inicial. Luego de observar las funciones y el hecho de que la base de cálculo es 1 mol de etanol, se propone XI =0.7, X2 = 0.2, Si se utilizaran las ecuaciones del sistema tal como están, se tendrían serios problemas, ya que si X I + x2 = 1, habría división entre cero. Un reacomodo de las ecuaciones permitiría no sólo evitar la división entre cero, sino obtener una convergencia más rápida. Por ejem- plo, podría escribirse el sistema a'sí:. p~n¡ (XI + X3)(xl - x3) -5.97(1 - XI - x2 )(l + X I + X2)~nl = O p~n2 (x2 + x3)x2 - 0.27(1 + XI + x2)(1 + XI + X2)~n2 = O p~n3 (XI + x3)x3 - 2.8(xl - x3)(x2 - x3)(1 + XI + X2)~n3 =O
  • 329. 314 Métodos numéricos ap licados a la ingeniería Luego de sustituir valores y resolver el sistema de ecuaciones no lineales resultante con el PROGRAMA 4.1 del CD, se llega a los siguientes resultados X(1) 0.71230 X(2) 0.24645 X(3) 0.15792 4.8 En una columna de cinco platos, se quiere absorber tolueno contenido en una corriente de gas Vo (moles de gas sin tolueno/min), con un aceite Lo (moles de aceite sin tolueno/min). Considérese que la relación de equilibrio está dada por la ley de Henry (y = m x), y que la columna opera a régimen permanente. Calcule la composición de tolueno en cada plato. Datos: Vo = 39.6 moles/min Lo = 6.0 moles/min Las moles de tolueno/min que entran a la columna con el gas y el aceite, son res- pectivamente: TVo = 5.4 moles/min TLo = 0.0 moles/min m = 0.155 De aquí: Yo = 5.4 = 0.12 5.4 + 39.6 fracción mol de tolueno en el gas que entra. Solución Los balances de masa para el tolueno en cada plato son (véase Fig. 4.16). Plato Balance de tolueno Ys -Í Lo---- Figura 4.16 Columna de absorción de Vo + cinco platos. 4 t; = Lo+ TLi Vi= Vo+ TVi 1::; i s 5 X 1 314 Métodos numéricos aplicados a la ingeniería Luego de sustituir valores y resolver el sistema de ecuaciones no lineales resultante con el PROGRAMA 4.1 del CD, se llega a los siguientes resultados X(l) 0.71230 X(2) 0.24645 X(3) 0.15792 4.8 En una columna de cinco platos, se quiere absorber tolueno contenido en una corriente de gas Va (moles de gas sin tolueno/min), con un aceite Lo (moles de aceite sin tolueno/min). Considérese que la relación de equilibrio está dada por la ley de Henry (y = m x), y que la columna opera a régimen permanente. Calcule la composición de tolueno en cada plato. Datos: Va = 39.6 moles/min Lo =6.0 moles/min Las moles de tolueno/min que entran a la columna con el gas y el aceite, son res- pectivamente: TVo= 5.4 moles/min TLo =0.0 moles/min m = 0.155 De aquí: Yo = 5.4 = 0.12 5.4 + 39.6 fracción mol de tolueno en el gas que entra. Solución Los balances de masa para el tolueno en cada plato son (véase Fig. 4.16). Plato Ys Balance de tolueno Li = Lo+ TLi Vi = Vo+ TVi 1 S:¡ S: S Figura 4.16 Columna de absorción de Vo+ cinco platos.
  • 330. e e l· la Sistema de ecuaciones no lineales 315 2 3 4 5 (Vo + TVo)yo - (Vo + TV¡)y¡ + (Lo + TL2)x2 - (Lo + TL¡)x¡ = O (Va + TV¡)y¡ - (Vo + TV2)Y2 + (Lo + TL3)x3 - (Lo + TL2)x2 = O (VO + TV 2)Y2 - (VO + TV 3)Y3 + (Lo + TL4)x4 - (Lo + TL3)x3 = O (VO + TV 3)Y3 - (VO + TV 4)y 4 + (Lo + TL5)x5 - (Lo + TL4)x4 = O (VO + TV 4)y 4 - (Vo + TV 5)Y5 + (Lo + TLo)xo - (Lo + TL5)X5 = O donde TV¡, TL¡, O ::; i::;5, son los moles de tolueno/min que salen del plato i con el gas y el aceite, respectivamente. Como y demás y¡ = ITLX¡, y¡ = TV¡ + V o se obtiene: VOmx¡ TV ¡= --''----'- 1 - 11'lX¡ Por otro lado: L~r. TL=_lr_, , 1-x¡ para O::; i::; 5 Con la sustitución de y¡, TV¡ y TL¡ en los balances de masa anteriores, resulta el sistema no lineal siguiente: V m2 x 2 V m2 x 2 LoX 2 LoX52 __O V mx + o 4 _ V mx _ o 5 + L~r + __ 0_ - Lr _ o 4 1 o 5 1 Ira 1 o-s 1- 11'lX 4 - mX5 - Xo - x5 donde xi' x2'· .. ,x5 son las incógnitas. Este sistema se resuelve con el programa 4.2 con los siguientes valores iniciales x¡ = 0.4, x2 = 0.3, x3 ='O.~, x4 = 0.1, x5 = 0.05, los cuales se obtuvieron usando un perfil lineal de concentraciones a lo largo de la colum- na. Los resultados obtenidos son: Sistema de ecuacione s no lineales 315 (Va + TVo)yo - (Va + TV¡)y¡ + (Lo + TL2)x2 - (Lo + TL¡)x¡ = O 2 (Va + TV¡)y¡ - (Va + TV2)Y2 + (Lo + TL3)X3 - (Lo + TL2)x2 = O 3 (Va + TV2)Y2 - (Va + TV3)Y3 + (Lo + TL4)x4 - (Lo + TL3)x3 = O 4 (Va + TV3)Y3 - (Va + TV4)Y4 + (Lo + TL5)x5 - (Lo + TL4)x4 = O 5 (Va + TV4)Y4 - (Va + TV5)Y5 + (Lo + TLo)xo- (Lo + TL5)x5 = O donde TV¡, TL¡, O::;; i::;; 5, son los moles de tolueno/min que salen del plato i con el gas y el aceite, respectivamente. Como se obtiene: Por otro lado: TV¡ y. =----'----- I TV¡ + Va y demás y¡ = ¡TtX¡, VOmx¡ TV¡ =-"--------'- 1 - 11'tX¡ L~x: . TL=_lr_ , I 1-x¡ para O::;; i::;; 5 Con la sustitución de y¡, TV¡ y TL¡ en los balances de masa anteriores, resulta el sistema no lineal siguiente: V m2 x 2 V m2 x 2 LoX 2 LoX52 __ OV mx + o 4 _ V mx _ o 5 + L~x: + __0_ - Lx: _ o 4 1 o 5 1 lrO 1 lT-5 1- 11'tX4 - mX 5 - X o - x 5 donde xi' x2'· .. , x5 son las incógnitas. Este sistema se resuelve con el programa 4.2 con los siguientes valores iniciales x ¡ = 0.4, x2 = 0.3, x3 =·0.2, x4 = 0.1, x5 = 0.05, los cuales se obtuvieron usando un perfil lineal de concentraciones a lo largo de la colum- na. Los resultados obtenidos son:
  • 331. 316 Métodos numéricos aplicados a la ingeniería Distancia .62 120E-0 1 .85044E-02 .27569E-02 .91471E-03 .30494E-03 .10179E-03 .34040E-04 k X (1) X (2) X (3) X (4) X (5) O .40000 .30000 .20000 .10000 .05000 1 .45756 .30057 .19940 .12100 .06020 2 .45398 .30115 .20289 .12717 .06318 3 .45432 .30195 .20424 .12919 .06416 4 .45444 .30222 .20468 .12986 .06449 5 .45448 .30231 .20483 .13008 .06460 6 .45450 .30234 .20488 .13016 .06463 7 .45450 .30235 .20489 .13018 .06465 La solución del sistema es: X (1) .45450091 X (2) .30234605 X (3) .20489225 X (4) .13018015 X (5) .64646289E-Ol Problemas 4.1 Resuelva el sistema XIX 2 +X 6 X 4 18 x2+xS+x6 12 XI + In (xi x4) 3 x3 2 + x3 2 x2 + x4 = 4 x3(x3 + 6) = 7 utilizando las sugerencias dadas al principio de este capítulo (reducción, partición, entre otros). 4.2 Resuelva el sistema el: XI x3 -x4 1 e2 : xl x3 2 + X4 17 e3 : XI + x2 6 e4 : In X3 xl + X3 xl 1 mediante tanteo de ecuaciones. 4.3 A partir de consideraciones geométricas demuestre que el sistema no lineal x2+y2-x=0 x2_y2_y=0
  • 332. Sistema de ecuaciones no lineales 317 tiene una solución no trivial única. Además, obtenga una estimación inicial Xl, yO Y aproxi- me dicha solución, empleando el método de punto fijo. 4.4 Dado el sistema de ecuaciones no lineales x2 + Y = 37 x-y2=5 determine un arreglo de la forma g, (x, y) =x g2 (x, y) = y y un vector inicial x(O) que prometa convergencia a una solución; es decir, que se satisfa- ga el sistema de desigualdades (Ec. 4.6). 4.5 Encuentre una solución del sistema de ecuaciones del problema anterior, por medio del método de Newton-Raphson y tomando como valor inicial a) (x, y) = (5,0) b) (x, y) = (5,-1) ¿Qué criterios se pueden aplicar para saber si el proceso converge y, en tal caso, cómo se puede verificar que efectivamente se trata de una solución? SUGERENCIA: Emplee el CD del libro. 4.6 Utilice el método de punto fijo multivariable para encontrar una solución de cada uno de los siguientes sistemas. a) x,(4 - O.0003x, - 0.0004x2) = O x2(2 - 0.0002x¡ - 0.000Ix2) = O b) x,2+2x2 2-x2-2x3 =0 x,2 -8x2 2 + l Ox, = 0.0001 x,2/(7x2 x3 ) - 1 = O c) 2x, + x2 + x3 - 410g(lOx,) = O x, + 2x2 + x3 - 4 log(lOx2) = O x, x2 x3 -log (lOx3 ) = O ti) 3x, sen x2 -cos(x2 x3 ) sen x2 -serr-' (-0.52356) sen x2 = O x¡2 - 625xl = O exp(-x¡ x2) + 20x3 = 9.471975 SUGERENCIA: Utilice el Mathcad o sofware equivalente. 4.7 Elabore un programa para resolver sistemas de ecuaciones no lineales. Utilice para ello el algoritmo 4.1. Emplee el programa de problema 4.7 para resolver los sistemas del problema 4.6. Mediante el PROGRAMA 4.1 del CD (véase ejemplo 4.4), resuelva los siguientes sistemas de ecuaciones no lineales. . 4.8 4.9 a) (x¡ + cos x¡ x2x3 _1)"2 = O (l-x¡ )114 + x2 + x3 (0.05x3 - 0.15) = 1 1 + x¡2 + 0.1 xl- 0.01x2 -x3 = O b) 0.5 sen (x¡ x2) - xi(4n) - 0.5x¡ = O 0.920423 [exp (2x¡) - exp (1)] + 8.65256x2 -2exp(x¡) = O Emplee EPS = 10-4. -- Sistema de ecuaciones no lineales 317 tiene una solución no tlivial única. Además, obtenga una estimación inicial :xO, yO Yaproxi- me dicha solución, empleando el método de punto fijo. 4.4 Dado el sistema de ecuaciones no lineales determine un arreglo de la forma g, (x, y) =X g2 (x, y) = y y un vector inicial x(O) que prometa convergencia a una solución; es decir, que se satisfa- ga el sistema de desigualdades (Ec. 4.6). 4.5 Encuentre una solución del sistema de ecuaciones del problema anterior, por medio del método de Newton-Raphson y tomando como valor inicial a) (x, y) = (5,0) b) (x, y) = (5,-1) ¿Qué criterios se pueden aplicar para saber si el proceso converge y, en tal caso, cómo se puede verificar que efectivamente se trata de una solución? SUGERENCIA: Emplee el CD del libro. 4.6 Utilice el método de punto fijo multivariable para encontrar una solución de cada uno de los siguientes sistemas. 4.7 4.8 4.9 a) x,(4 - O.0003x, - 0.0004x2) = O xi2 - 0.0002x¡ - 0.000Ix2) =O b) x,2 + 2xl - x2-2x3 = 0 x,2 -8xl + 10x3 = 0.0001 x,2j(7x2x3 ) - 1 = O e) 2x, + x2+ x3 - 4Iog(lOx,) = O x , + 2x2 + x3 - 4 log(lOx2) = O x, x2x3 - log (lOx3) =O á) 3x, sen x2-cos(x2x3) sen x2-sen-' (-0.52356) sen x2= O x,2 - 625x} =O exp(-x, x2) + 20x3 = 9.471975 SUGERENCIA: Utilice el Mathcad o sofware equivalente. Elabore un programa para resolver sistemas de ecuaciones no lineales. Utilice para ello el algoritmo 4.1. Emplee el programa de problema 4.7 para resolver los sistemas del problema 4.6. Mediante el PROGRAMA 4.1 del CD (véase ejemplo 4.4), resuelva Jos siguientes sistemas de ecuaciones no lineales. . a) (x, +cosx,x2x3 -1)"2 = 0 (1 - x¡ )'/4 + x2 + x3 (0.05x3 - 0.15) = 1 1 + x? + 0.1 x} - 0.01x2- x3 =O b) 0.5 sen (x , x2) - xi(4n) - 0.5x, =O 0.920423 [exp (2x,) - exp (1)] + 8.65256x2-2exp(x,) =O Emplee EPS = 10-4.
  • 333. 318 Métodos numéricos aplicados a la ingen iería 4.10 Si en la aplicación del métodos de Newton-Raphson, en algún punto del proceso iterati- vo, por ejemplo x(i) , el determinante de la matriz jacobiana evaluado en ese punto es ce- ro, o muy cercano a cero, dicho proceso no puede continuarse. ¿Qué hacer en tales casos? (véase Probo 2.10). 4.11 Los métodos estudiados en este capítulo son aplicables también a sistemas de ecuaciones lineales y a ecuaciones no lineales en una variable, ya que estos dos son sólo casos particu- lares del caso general de sistemas de ecuaciones no lineales. Por ejemplo, si se aplicara el método de Newton-Raphson para resolver el sistema lineal 4x, - 9x2 + 2x3 5 2x, - 4x2 + 6x3 3 x, -x2 + 3x3 4 la matriz de derivadas parciales sería: -9 -4 -1 4.13 Encuentre la solución utilizando el algoritmo 4.2 con un vector inicial adecuado. Resuelva el problema 3.33 (considerando ahora que la reacción es de orden 0.5 con res- pecto a A y la constante de velocidad de reacción k, es 0.05 L-0.5mol°.5 mirr '. Emplee el programa del problema 4.7, o bien el PROGRAMA 4.1 del CD. Repita el problema 3.34, considerando que la reacción es de orden 0.5 y que la constante de velocidad de reacción es 0.05 L-o.s molo.s mirr '. ¿La conversión de A mejora recircu- lando los tres tanques en lugar de recircular solamente el primero? Utilice el método iterativo de punto fijo para resolver el sistema de ecuaciones no lineales del ejemplo 4.4, con el vector inicial ~ 4.12 4.14 a) con desplazamientos sucesivos b) con desplazamientos simultáneos Compare la convergencia en los dos casos. SUGERENCIA: Emplee el Mathcad o un software equivalente. 4.15 Resuelva el ejercicio 4.8, usando TVo = 9.9 4.16 Resuelva los sistemas de los problemas 4.6 y 4.9 por el método de Newton-Raphson mo- dificado. 4.17 Elabore un programa para resolver sistemas de ecuaciones no lineales por el método de Newton-Rapshon modificado, utilizando para ello el algoritmo 4.3. Resuelva con dicho programa el sistema x2 , +2xl+exp(x, +x2)=6.1718-x,x3 lOx2 = -x2 x3 sen (x, x3) + xl = 1.141-x, utilizando como vector inicial a x(O) = [l,I,I]T. 318 Métodos numéric o s a p licados a la ingeniería 4.10 Si en la aplicación del métodos de Newton- Raphson, en algún punto del proceso iterati- vo, por ejemplo x (i) , el determinante de la matriz jacobiana evaluado en ese punto es ce- ro, o muy cercano a cero, dicho proceso no puede continuarse. ¿Qué hacer en tales casos? (véase Probo 2.10). 4.11 Los métodos estudiados en este capítulo son aplicables también a sistemas de ecuaciones lineales y a ecuaciones no lineales en una variable, ya que estos dos son sólo casos particu- lares del caso general de sistemas de ecuaciones no lineales. Por ejemplo, si se aplicara el método de Newton-Raphson para resolver el sistema lineal ~ 4.12 4.13 4.14 4xI - 9x2 + 2x3 5 2x1 - 4x2 + 6x3 3 XI - x2 + 3x3 4 la matriz de derivadas parciales sería: -9 -4 -1 Encuentre la solución utilizando el algoritmo 4.2 con un vector inicial adecuado. Resuelva el problema 3.33 (considerando ahora que la reacción es de orden 0.5 con res- pecto a A y la constante de velocidad de reacción kl es 0.05 L-0.5 mol°.5 min-l . Emplee el programa del problema 4.7, o bien el PROGRAMA 4.1 del CD. Repita el problema 3.34, considerando que la reacción es de orden 0.5 y que la constante de velocidad de reacción es 0.05 L-o.s molo.s min-I . ¿La conversión de A mejora recircu- lando los tres tanques en lugar de recircular solamente el primero? Utilice el método iterativo de punto fijo para resolver el sistema de ecuaciones no lineales del ejemplo 4.4, con el vector inicial a) con desplazamientos sucesivos b) con desplazamientos simultáneos Compare la convergencia en los dos casos. SUGERENCIA: Emplee el Mathcad o un software equivalente. 4.15 Resuelva el ejercicio 4.8, usando TVo =9.9 4.16 Resuelva los sistemas de los problemas 4.6 y 4.9 por el método de Newton-Raphson mo- dificado. 4.17 Elabore un programa para resolver sistemas de ecuaciones no lineales por el método de Newton-Rapshon modificado, utilizando para ello el algoritmo 4.3. Resuelva con dicho programa el sistema X21 + 2xl + exp (xl + X2 ) =6.1718 -XI X3 lOx2 =- X2 X3 sen (XI X3) + x2 2 =1.14l-xl utilizando como vector inicial a x (O) = [l,l,l]T.
  • 334. rati- ales mo- de cho Sistema de ecuaciones no lineales 31 9 4.18 La siguiente tabla representa las temperaturas observadas TrC) a diferentes tiempos t (min) del agua en un tanque de enfriamiento o 1 2 3 105 7 15 20 T 92.0 85.3 79.5 74.5 67.0 60.5 53.5 45.0 39.5 Encuentre la ecuación de enfriamiento que mejor represente estos valores, empleando el criterio de mínimos cuadrados. Véase ejercicio 4.6. 4.19 La relación entre el rendimiento de un cultivo y la cantidad de fertilizante x, aplicado a ese cultivo, se ha formulado así: y = a - b d- donde O < d < 1 Dado los siguientes datos O 2 3 4x y 44.4 54.6 63.8 65.7 68.9 obtenga estimaciones de a, by d empleando el método de los mínimos cuadrados. (Véase ejercicio 4.6). 4.20 Resuelva los sistemas de ecuaciones no lineales del problema 4.9 con el método de Broy- den. Compare el número de iteraciones requerido con el número requerido en los métodos de punto fijo y de Newton-Raphson multivariable. Emplee en la comparación EPS = I x(i) - x(i-l) k 10-4. 4.21 Elabore un programa de cómputo para resolver sistemas de ecuaciones no lineales con el método de Broyden. Emplee para ello el algoritmo 4.4. Resuelva con dicho programa el sistema xl 2 + 2X2 2 + exp (xl + X2) = 6.1718 -Xl X3 lOx2 = -X 2 X 3 sen (Xl X3) + xl = 1.14l-xl, utilizando como vector inicial a x(O) = [l,I,I]T 4.22 El método de Broyden pertenece a una familia conocida como métodos de Cuasi-New- ton. Otro de los miembros de dicha familia se obtiene al reemplazar a J (k) de la ecuación 4.22 con una matriz A(k) , cuyos componentes son las derivadas parciales numéricas; esto es, consiste en aproximar las derivadas parciales analíticas de la matriz jacobiana J por sus correspondientes derivadas parciales numéricas. Por ejemplo, para una función de dos varia- ble f (x, y) las derivadas parciales numéricas quedan así: df dx f (x + h, Y ) - f ( x, y ) h y df f (x, y + h ) - f ( x, y ) dy h donde h es un valor pequeño. Sistema de ecuaciones no lineales 31 9 4.18 La siguiente tabla representa las temperaturas observadas TeC) a diferentes tiempos t (min) del agua en un tanque de enfriamiento o 1 2 3 5 7 10 15 20 T 92.0 85.3 79.5 74.5 67.0 60.5 53.5 45.0 39.5 Encuentre la ecuación de enfriamiento que mejor represente estos valores, empleando el criterio de mínimos cuadrados. Véase ejercicio 4.6. 4.19 La relación entre el rendimiento de un cultivo y la cantidad de fertilizante x, aplicado a ese cultivo, se ha formulado así: y = a - b dX donde O< d < 1 Dado los siguientes datos x O 2 3 4 Y 44.4 54.6 63.8 65.7 68.9 obtenga estimaciones de a, by d empleando el método de los mínimos cuadrados. (Véase ejercicio 4.6). 4.20 Resuelva los sistemas de ecuaciones no lineales del problema 4.9 con el método de Broy- den. Compare el número de iteraciones requerido con el número requerido en los métodos de punto fijo y de Newton-Raphson multivariable. Emplee en la comparación EPS = Ix(i) - x(i- l) k 10-4. 4.21 Elabore un programa de cómputo para resolver sistemas de ecuaciones no lineales con el método de Broyden. Emplee para ello el algoritmo 4.4. Resuelva con dicho programa el sistema xl 2 + 2X2 2 + exp (xl + x2 ) = 6.1718 -Xl X3 lOx2 = - x2 x3 sen(xl x3)+xl = 1.141-xl , utilizando como vector inicial a x(O) =[l,I,I]T 4.22 El método de Broyden pertenece a una familia conocida como métodos de Cuasi-New- ton. Otro de los miembros de dicha familia se obtiene al reemplazar a J (k) de la ecuación 4.22 con una matriz A (k) , cuyos componentes son las derivadas parciales numéricas; esto es, consiste en aproximar las derivadas parciales analíticas de la matriz jacobiana J por sus correspondientes derivadas parciales numéricas. Por ejemplo, para una función de dos varia- blef (x, y) las derivadas parciales numéricas quedan así: df f (x + h, Y ) - f ( x, y ) dX h y df f (x, y + h ) - f ( x, y ) dy h donde h es un valor pequeño.
  • 335. 320 Métodos numéricos apl icados a la ingeniería Con las ideas dadas, encuentre una solución aproximada del sistema de ecuaciones no li- neales siguiente usando como vector inicial [.xO, yO ]T = [O, O] T II (x, y) = x2 -lOx + y2 + 8 = O 12(x, y) = xy2 + X - lOy + 8 = O 4.23 Resuelva los sistemas de ecuaciones no lineales de los problemas 4.6 y 4.9, mediante el método de Newton-Raphson con optimización de t. I~I SUGERENCIA: Emplee el PROGRAMA 4.2 del CD. 4.24 Otra forma de seleccionar los valores del tamaño de la etapa t (véase Seco 4.6), consiste en dividir el intervalo de búsqueda [a, b] en dos partes iguales sucesivamente. Esto es: ~ 4.25 ti = (a + b)/2, t2 = (a + tl)/2, t4 = (t2 + tl)/2, t3 = (ti + b)/2 ts = (t3 + ti )/2, etcétera FiglJ Si: eva Gráficamente: a t2 ti t3 [----I~--~I __ -LI__ -'1 __ -LI---] t4 ts b Para cada valor de t se calcula el correspondiente Zk+i' Y el valor mínimo de Zk+1 propor- cionará el valor óptimo de t. Encuentre el valor óptimo de t en la primer iteración de la solución del ejemplo 4.3 usando este método de cálculo de t y el intervalo [-1.2, - 1] . Modifique el PROGRAMA 4.2 del CD de modo que se empleen los valores de t calculados en la forma indicada en el problema 4.24. Resuelva los siguientes sistemas de ecuaciones algebraicas no lineales, proponiendo en ca- da caso vectores iniciales. Emplee en cada caso los métodos que juzgue más convenientes y el software de que disponga. a) y sen x + cos x - z = O exp(x + y) - x2 cos x -n/l.15 = O y + 3xz + x3 = O b) ln(x y) + x2 y2 = 8 sen x + y exp(x) = 2 c) xl 3 + x2 3 -xl = 129 Xl 2 + xl- x3 2 = 9.75 Xl + x2 -x3 = 9.49 4.27 Se desea concentrar una solución con una concentración inicial de sólidos de 20% a una concentración final de 60% en un evaporador de doble efecto. Se dispone de vapor satu- rado a 0.68 atm (10 psig) y el segundo efecto que opera con una presión de vacío de 0.136 atm (2 psia). (Ver figura 4.17.) Si la alimentación al sistema, 18,240.6 kg./h, entra al primer efecto a 93.3 °C, determine el área de los evaporadores, Al y A2 , Yla cantidad de vapor requerido. 4.26 320 Métodos n u méricos aplicados a la ingeniería Con las ideas dadas, encuentre una solución aproximada del sistema de ecuaciones no li- neales siguiente usando como vector inicial [ xO, yO F = [O, O] T J I (x, y) = X2 -lOx + y2 + 8 = O J2 (x, y) = .xy2 + X - lOy + 8 = O 4.23 Resuelva los sistemas de ecuaciones no lineales de los problemas 4.6 y 4.9, mediante el método de Newton-Raphson con optimización de t. I~ I SUGERENCIA: Emplee el PROGRAMA 4.2 del CD. 4.24 Otra forma de seleccionar los valores del tamaño de la etapa t (véase Seco 4.6), consiste en dividir el intervalo de búsqueda [a, b] en dos partes iguales sucesivamente. Esto es: ~ 4.25 4.26 Gráficamente: ti = (a + b)/2, t2 = (a + tl )/2, t4 =(t2 + tl )/2, t3 = (ti + b)/2 ts = (t3 + t i)/2, etcétera t2 t[ t3 [--~I---'I--~I---'I --~I--_] a t4 t5 b Para cada valor de t se calcula el correspondiente zk+i' Yel valor mínimo de Zk+ 1 propor- cionará el valor óptimo de t. Encuentre el valor óptimo de t en la primer iteración de la solución del ejemplo 4.3 usando este método de cálculo de t y el intervalo [- 1.2, - 1] . Modifique el PROGRAMA 4.2 del CD de modo que se empleen los valores de t calculados en la forma indicada en el problema 4.24. Resuelva los siguientes sistemas de ecuaciones algebraicas no lineales, proponiendo en ca- da caso vectores iniciales. Emplee en cada caso los métodos que juzgue más convenientes y el software de que disponga. a) y sen x + cos x - z = O exp(x + y) - x2 cos x -n/1.l5 =O y + 3xz + x3 =O b) ln(x y) + x2 y2 =8 sen x + y exp(x) = 2 c) x l 3 + x2 3 -xl = 129 x l 2 + xl - x3 2 = 9.75 XI + x2 - x3 = 9.49 4.27 Se desea concentrar una solución con una concentración inicial de sólidos de 20% a una concentración final de 60% en un evaporador de doble efecto. Se dispone de vapor satu- rado a 0.68 atm (10 psig) y el segundo efecto que opera con una presión de vaCÍo de 0.136 atm (2 psia). (Ver figura 4.17.) Si la alimentación al sistema, 18,240.6 kg./h, entra al primer efecto a 93.3 oC, determine el área de los evaporadores, A l y A2, Yla cantidad de vapor requerido.
  • 336. Sistema de ecuaciones no lineales 321 Figura 4.17 Sistema de evaporación de doble efecto. Otros datos: Cp , F = 0.9 kcal/(kg 0c) Cp, Ll = 0.8 " Cp,L2 = 0.8 4.28 El método del eigenvalor (valor propio) dominante" para resolver sistemas de ecuaciones no lineales, consiste en emplear el siguiente algoritmo 1 x(k+2) = X(k) + __ [X(k+l) _ x(k)] 1 - "'-1 donde "'-1 es el eigenvalor dominante de la matriz jacobiana J (véase ecuación 4.17), eva- luada en x(k+l) y aproximado de la siguiente manera: I X(k+I) - X(k) I "'-------1- I X(k) _ x(k+l) I (f (Xk+l _ xk?)1/2 i::::l I 1 "'-1=------------- (f (Xk _ Xk-1)2)1/2 i=l 1 1 o bien: • E. Kehat and M. Shacham. Chemical Processes Simulation Programs-3: Solution of systemas of Non-Linear Equations. Process Technology lnternational, Vol. 18, pág. 181 (1973). UI = 3,516.5 kcal/thm") U2 = 2,440.4 " Figura 4.17 Sistema de evaporación de doble efecto. Otros datos: Sistema de ecuaciones no lineales 321 Cp , F =0.9 kcal/(kg oC) UI = 3,516.5 kcall(hm2 ) Cp, Ll =0.8 fI U2 = 2,440.4 fI Cp, L2 = 0.8 fI 4.28 El método del eigenvalor (valor propio) dominante' para resolver sistemas de ecuaciones no lineales, consiste en emplear el siguiente algoritmo 1x(k+2) =X(k) + __ [ X(k+I) _ x(k)] 1 - "'-¡ donde "'-1es el eigenvalor dominante de la matriz jacobiana J (véase ecuación 4.17), eva- luada en X(k+ I ) y aproximado de la siguiente manera: o bien: I X(k+ I) - X(k) I "'- - - - - - - I - I X(k) _ x(k+l) I (i (Xk+1 _ Xk)2)112 ;=1 I 1 "'-1 =------------- (i (Xk _ XH p)I/2 ;=1 1 1 * E. Kehat and M. Shacham. Chemical Processes Simulation Programs-3: Solution of systemas of Non-Linear Equations. Process Technology Inlernalional, Vol. 18, pág. 181 (1973).
  • 337. 322 Métodos numéricos aplicados a la ingeniería ( Hay que observar que para la primera aplicación de este algoritmo se requieren tres vec- tores iniciales x(O) , x(l) y x(2), los cuales pueden obtenerse, por ejemplo, con el método de punto fijo multivariable. Mediante este algoritmo resuelva el sistema: t. (x, y) = x2 -lOx + y2 + 8 = O f2 (x, y) = xy2 + X - lOy + 8 = O usando como vector inicial: [xD, yO] = [O,O]T y los resultados de las dos primeras iteracio- nes del ejemplo 4.1. 4.29 La convergencia del método del eigenvalor dominante (véase Probo 4.28), puede acelerar- se usando un factor t de la siguiente manera: X(k + 2) = X(k) + _t_ [x(k + 1) _ X(k) ], 1- Al y ensayando varios valores de t como se hizo en los métodos de Newton-Raphson con op- timización de t y del descenso de máxima pendiente. El valor de t puede calcularse tam- bién en cada iterción con una fórmula dada por Broyden," o sea usa un valor constante. Obtenga una aproximación a una solución del sistema dado en el problema 4.28 utilizan- do un valor de t = 0.7 4.30 Resuelva los sistema de ecuaciones no lineales de los problemas 4.6 y 4.9, empleando el método del descenso de máxima pendiente para obtener los valores iniciales; luego, con esos valores aplique el método de Newton-Ranphson o el método de Broyden. 4.31 Hay que observar que en el método del descenso de máxima pendiente se encuentra el mí- nimo local de la función Zk = f¡ 2 + f2 2 + ... + t;2. Este método puede emplearse para apro- ximar el mínimo local de una función dada analíticamente, tomando dicha función como z. Modifique el algoritmo 4.5 para aproximar los mínimos de las funciones siguientes, usando EPS = 10-5. 111 a) z(x, y) = sen (x + y) + sen x - cos y b) Z(x¡,x2,x3)=X12+xl-3xl c) z(xp x2, x3) = x/ + 2x2 4+ 3x3 3-1 SUGERENCIA: Grafique la superficie el inciso a) usando el Mathcad o el Graphics Calculus (GC). 4.32 Encuentre todos los factores cuadráticos de las ecuaciones polinominales siguientes: a) x8 + 13x6 + 35x4 - 13x2 - 36 = O b) x6 + (n;2 + 5)x4 + (5n;2 + 6)x2 + 6n;2 = O 4.33 ¿Qué pasa cuando se aplica el método de Bairstow a un polinomio que no tiene factores cuadráticos? Puede usar, por ejemplo, el polinomio -2.8x5 -1l.352x4 + 86.468x3 + 438.252x2 + 32.418x - 1309.484 . • c.G. Broyden. A Class of Methods for Solving Nonlinear Simultaneous Equiatiosns. Math Comp. 19 pág. 577 (1965). 322 Métodos numéricos aplicados a la ingeniería Hay que observar que para la primera aplicación de este algoritmo se requieren tres vec- tores iniciales x(O) , x(l) y X(2), los cuales pueden obtenerse, por ejemplo, con el método de punto fijo multivariable. Mediante este algoritmo resuelva el sistema: f¡ (x, y) = x2 -lOx + y2 + 8 =O f2 (x, y) =xy2 + X - lOy + 8 = O usando como vector inicial: [xD, yO] = [O,O]T y los resultados de las dos primeras iteracio- nes del ejemplo 4.1. 4.29 La convergencia del método del eigenvalor dominante (véase Probo 4.28), puede acelerar- se usando un factor t de la siguiente manera: X (k + 2) =X(k) + _t_ [x(k + 1) _ X(k) ], 1 - "'1 y ensayando varios valores de t como se hizo en los métodos de Newton-Raphson con op- timización de t y del descenso de máxima pendiente. El valor de t puede calcularse tam- bién en cada iterción con una fórmula dada por Broyden,* o sea usa un valor constante. Obtenga una aproximación a una solución del sistema dado en el problema 4.28 utilizan- do un valor de t =0.7 4.30 Resuelva los sistema de ecuaciones no lineales de los problemas 4.6 y 4.9, empleando el método del descenso de máxima pendiente para obtener los valores iniciales; luego, con esos valores aplique el método de Newton-Ranphson o el método de Broyden. 4.31 Hay que observar que en el método del descenso de máxima pendiente se encuentra el mí- nimo local de la función Zk =f¡2 + f 2 2 + ... + fn2. Este método puede emplearse para apro- ximar el llÚnimo local de una función dada analíticamente, tomando dicha función como z. Modifique el algoritmo 4.5 para aproximar los llÚnimos de las funciones siguientes, usando EPS = 10-5. a) z(x, y) =sen (x + y) + sen x - cas y b) z(xl' x2, x3) = x¡2 + xl-3x3 2 c) z(xl' x2, x3) =x¡2 + 2x2 4 + 3xl-l SUGERENCIA: Grafique la superficie el inciso a) usando el Mathcad o el Graphics Calculus (GC). 4.32 Encuentre todos los factores cuadráticos de las ecuaciones polinominales siguientes: a) x8 + 13x6 + 350 - 13x2 - 36 =O b) x6 + (n;2 + 5)0 + (5n;2 + 6)x2 + 6n;2 = O 4.33 ¿Qué pasa cuando se aplica el método de Bairstow a un polinomio que no tiene factores cuadráticos? Puede usar, por ejemplo, el polinomio -2.8x5 -11.3520 + 86.468x3 + 438.252x2 + 32.418x - 1309.484. • C.G. Broyden. A Class ofMethods for Solving Nonlinear Simultaneous Equiatiosns. Math Comp. 19 pág. 577 (1965).
  • 338. CAPÍTULO 5 APROXIMACIÓN FUNCIONAL E INTERPOLACIÓN A dónde nos dirigimos En este capítulo se estudiará la aproximación de funciones disponibles en forma discre- ta (puntos tabulados), con funciones analíticas sencillas, o bien de aproximación de fun- ciones cuya complicada naturaleza exija su reemplazo por funciones más simples. Para lograr esto partiremos de tablas de valores dados y, utilizando la familia de los polino- mios, aproximaremos una sección de la tabla por una línea recta, una parábola, etc. La elección del grado se hará analizando el fenómeno que originó los valores y, el tipo de aproximación, con base en la exactitud de éstos. En la parte final del capítulo se estudia la aproximación utilizando el criterio de los mínimos cuadrados y se incluyen aproximaciones multilineales. Las ideas y técnicas de interpolación-extrapolación permean el desarrollo de los métodos de los capítulos siguientes como integración, derivación, solución de ecuacio- nes diferenciales ordinarias y parciales e incluso se emplearon ya en la obtención de métodos para resolver ecuaciones no lineales. Introducción La enorme ventaja de aproximar información discreta o funciones "complejas", con fun- ciones analíticas sencillas, radica en su mayor facilidad de evaluación y manipulación, si- tuación necesaria en el campo de la ingeniería. Las funciones de aproximación se obtienen por combinaciones lineales de elementos de familias de funciones denominadas elementales. En general tendrán la forma a080 (x) + a[g[ (x) + ... + a"g" (x), donde aj , O< i < n, son constantes por determinar y g¡(x), O.,:;i":; n funciones de una fami- lia particular. Los monomios en x (xo, x, x2,... ) constituyen la familia o grupo más emplea- do; sus combinaciones generan aproximaciones del tipo polimonial El grupo conocido como funciones de Fourier 1, sen x, cos x, sen 2x, cos 2x, ... , al combinarse linealmente, genera aproximaciones del tipo: Il 11 ao + .L a¡ cos ix + .L bi sen ix 1;[ 1;[ El grupo de las funciones exponenciales 1, e', e2x , ... (5.1) (5.2) (5.3) CAPÍTULO 5 APROXIMACIÓN FUNCIONAL E INTERPOLACIÓN A dónde nos dirigimos En este capítulo se estudiará la aproximación de funciones disponibles en forma discre- ta (puntos tabulados), con funciones analíticas sencillas, o bien de aproximación de flm- ciones cuya complicada naturaleza exija su reemplazo por funciones más simples. Para lograr esto partiremos de tablas de valores dados y, utilizando la familia de los polino- mios, aproximaremos una sección de la tabla por una línea recta, una parábola, etc. La elección del grado se hará analizando el fenómeno que Oliginó los valores y, el tipo de aproximación, con base en la exactitud de éstos. En la parte final del capítulo se estudia la aproximación utilizando el criterio de los núnimos cuadrados y se incluyen aproximaciones multilineales. Las ideas y técnicas de interpolación-extrapolación permean el desarrollo de los métodos de los capítulos siguientes como integración, derivación, solución de ecuacio- nes diferenciales ordinarias y parciales e incluso se emplearon ya en la obtención de métodos para resolver ecuaciones no lineales. Introducción La enorme ventaja de aproximar información discreta o funciones "complejas", con fun- ciones analíticas sencillas, radica en su mayor facilidad de evaluación y manipulación, si- tuación necesaria en el campo de la ingeniería. Las funciones de aproximación se obtienen por combinaciones lineales de elementos de familias de funciones denominadas elementales. En general tendrán la forma (5.1) donde a¡, O< i < n, son constantes por determinar y g/x), O.,:; i":; n funciones de una fami- lia particular. Los monomios en x (xo, x, x2, ... ) constituyen la familia o grupo más emplea- do; sus combinaciones generan aproximaciones del tipo polimonial (5.2) El grupo conocido como funciones de Fourier 1, sen x, cos x, sen 2x, cos 2x, ... , al combinarse linealmente, genera aproximaciones del tipo: Il 11 ao + .L a¡ cos ix + .L b¡ sen ix I;! 1; (5.3) El grupo de las funciones exponenciales 1, eX, e2x, . . .
  • 339. 324 Métodos numéricos aplicados a la ingeniería también puede usarse del modo siguiente n L ae" i=ü (5.4) De estos tres tipos de aproximaciones funcionales, las más comunes por su facilidad de manejo en evaluaciones, integraciones, derivaciones, etc., son las aproximaciones polino- miales (5.2) y son las que se estudiarán a continuación. Sea una función f (x) dada en forma tabular Puntos o 1 2 n 5 x f (x,,)f(x) Para aproximar af(x) por medio de un polinomio del tipo 5.2, se aplica alguno de los cri- terios siguientes: el de ajuste exacto o el de mínimos cuadrados. La técnica del ajuste exacto consiste en encontrar una función polinomial que pase por los puntos dados en la tabla (véase Fig. 5.1). El método de mínimos cuadrados con- siste en hallar un polinomio que pase entre los puntos y que satisfaga la condición de mi- nimizar la suma de las desviaciones (d) elevadas al cuadrado; es decir, que se cumpla n L (d.)2 = mínimo i=ü 1 Cuando la información tabular de que se dispone es aproximada hasta cierto número de cifras significativas, por ejemplo la de tablas de logaritmos o de funciones de Bessel, se recomienda usar ajuste exacto. En cambio, si la información tiene errores considerables, como en el caso de datos experimentales, no tiene sentido encontrar un polinomio que pa- se por esos puntos sino más bien que pase entre ellos; entonces, el método de mínimos cuadrados es aplicable. y , , , f(X3) , = d3--------------~--- f(X2) /-d2 ----------/? - I I I Figura 5.1 f(xl) ------ .zz d, I Aproximación I polinomial con r I , I, criterio de , Ir ajuste exacto , I (curva I discontinua) y "-do I f(xo) - -9- I con mínimos I cuadrados I (curva llena). Xo XI X2 x3 X
  • 340. Tabla 5.1 Temperatura de ebullición de la acetona a diferentes presiones. Puntos O 2 3 4 5 6 T (0C) 56.5 78.6 113.0 144.5 181.0 205.0 214.5 P (atm) 1 2 5 10 20 30 40 e e Tabla 5.2 Temperatura de ebullición de la acetona a diferentes presiones. Puntos O 2 3 TCC) 56.5 113.0 18l.0 214.5 P (atm) 5 20 40 Aproximación funcional e interpolación 325 Una vez que se obtiene el polinomio de aproximación, éste puede usarse para obtener puntos adicionales a los existentes en la tabla, mediante su evaluación, lo que se conoce como interpolación. También puede derivarse o integrase a fin de obtener información adi- cional de la función tabular. A continuación se describen distintas formas de aproximar con polinomios obtenidos por ajuste exacto y su uso en la interpolación. En la sección 5.8 se describe la aproxima- ción polinomial por mínimos cuadrados, y en el capítulo 6 la derivación y la integración. 5.1 Aproximación polinominal simple e interpolación La interpolación es de gran importancia en el campo de la ingeniería, ya que al consultar fuentes de información presentadas en forma tabular, es frecuente no encontrar el valor buscado como un punto en la tabla. Por ejemplo, las tablas 5.1 y 5.2 presentan la tempe- ratura de ebullición de la acetona (C3H60) a diferentes presiones. Supóngase que sólo se dispusiera de la segunda y se desease calcular la temperatura de ebullición de la acetona a 2 atm de presión. Una forma muy común de resolver este problema es sustituir los puntos (O) y (1) en la ecuación de la línea recta: p (x) = ao + a jX, de tal modo que resultan dos ecuaciones con dos incógnitas que son ao Yaj• Con la solución del sistema se consigue una aproximación polinominal de primer grado, lo que permite efectuar interpolaciones lineales; es decir, se sustituye el punto (O) en la ecuación de la línea recta y se obtiene: . 56.5 = ao+ 1 al y al sustituir el punto (1) 113 = ao + 5 a" sistema que al resolverse da ao = 42.375 Yal = 14.125 Por tanto, estos valores generan la ecuación: p (x) = 42.375 + 14.125 x (5.5)
  • 341. 326 Métodos numéricos apli cados a la ingeniería La ecuación resultante puede emplearse para aproximar la temperatura cuando la pre- sión es conocida. Al sustituir la presión x = 2 atm se obtiene una temperatura de 70.6 "C. A este proceso se le conoce como interpolación. Gráficamente la tabla 5.2 puede verse como una serie de puntos (O), (1), (2) Y (3) en un plano P vs T (Fig. 5.2), en donde si se unen con una línea los puntos (O) y (1), por bús- queda gráfica se obtiene T '" 70.6 °C, para P = 2 atm. En realidad, esta interpolación sólo ha consistido en aproximar una función analítica desconocida [T =f (P)] dada en forma tabular, por medio de una línea recta que pasa por los puntos (O) y (1). Para aproximar el valor de la temperatura correspondiente a P = 2 atm se pudieron tomar otros dos puntos distintos, por ejemplo (2) y (3), pero es de suponer que el resultado tendría un margen de error mayor, ya que el valor que se busca está entre los puntos (O)y (1). Si se quisiera una aproximación mejor al valor "verdadero" de la temperatura busca- da, podrían unirse más puntos de la tabla con una curva suave (sin picos), por ejemplo tres (O), (1), (2) (véase Fig. 5.3) y gráficamente obtener T correspondiente a P = 2 atm. Analíticamente, el problema se resuelve al aproximar la función desconocida [T = f(P)] con un polinomio que pase por los tres puntos (O), (1) y (2). Este polinomio es una parábola y tiene la forma general P2(x) = ao + a¡x + a~2, (5.6) donde los parámetros ao, a¡ y a2 se determinan sustituyendo cada uno de los tres puntos conocidos en la ecuación 5.6; es decir: 56.5 =ao + a¡l + a212 113 = ao + a¡5- + a252 181 = ao + a¡20 + a2202 Al resolver el sistema se obtiene: ao = 39.85, al = 17.15, a2 = -0.50482 100 2 TOC 113 ------------------------------------ p¡ 110 90 80 70.6 70 ••• Figura 5.2 Interpolación gráfica de la 60 temperatura de 56.5 ebullición de la acetona a 2 50 L- __ ---'- --'- L- __ --'- -'--_-j~ atm. O I Po I 2 3 4 5 (5.7) 6 326 Figura 5 .2 Interpolación gráfica de la temperatura de ebullición de la acetona a 2 atm. Métodos numéricos aplicados a la ingeniería La ecuación resultante puede emplearse para aproximar la temperatura cuando la pre- sión es conocida. Al sustituir la presión x = 2 atm se obtiene una temperatura de 70.6 oC. A este proceso se le conoce como interpolación. Gráficamente la tabla 5.2 puede verse como una serie de puntos (O), (1), (2) Y(3) en un plano P vs T (Fig. 5.2), en donde si se unen con una línea los puntos (O) y (1), por bús- queda gráfica se obtiene T '" 70.6 oC, para P =2 atm. En realidad, esta interpolación sólo ha consistido en aproximar una función analítica desconocida [T = f (P)] dada en forma tabular, por medio de una línea recta que pasa por los puntos (O) y (1). Para aproximar el valor de la temperatura cOlTespondiente a P =2 atrn se pudieron tomar otros dos puntos distintos, por ejemplo (2) y (3), pero es de suponer que el resultado tendría un margen de eiTor mayor, ya que el valor que se busca está entre los puntos (O) y (1). Si se quisiera una aproximación mejor al valor "verdadero" de la temperatura busca- da, podrían unirse más puntos de la tabla con una curva suave (sin picos), por ejemplo tres (O), (1), (2) (véase Fig. 5.3) y gráficamente obtener T correspondiente a P = 2 atm. Analíticamente, el problema se resuelve al aproximar la función desconocida [T = f(P)] con un polinomio que pase por los tres puntos (O), (1) y (2). Este polinomio es una parábola y tiene la forma general P2(x) = ao + aJx + a~2, (5.6) donde los parámetros ao, a J y a2 se determinan sustituyendo cada uno de los tres puntos conocidos en la ecuación 5.6; es decir: Al resolver el sistema se obtiene: ao=39.85, T oe 56.5 = ao + a J1 + a212 113 = ao + a15-+ a252 181 =ao + a J20 + a2202 al = 17.15, a2 = -0.50482 113 --- - - --- ---------- --- ------- -- - -- -- - PI 110 100 90 80 70.6 70 ... 60 56.5 I Po 2 50 O 2 3 4 5 6 (5.7)
  • 342. Aproximación funcional e interpolación 327 200 TOC 181 180 160 J40 120 113 100 80 72.1 •• 60 56.5 Figura 5.3 Interpolación 40 2 gráfica con tres O O puntos. pre- 0c. 3) en bús- 10 15 20 (5.7) De tal modo que la ecuación polinomial queda: P2 (x) = 39.85 + 17.15x - 0.50482x2 25 P atm (5.8) y puede emplearse para aproximar algún valor de la temperatura correspondiente a un va- lor de presión. Por ejemplo si x = 2 atm, entonces: T '" P2 (2) = 39.85 + 17.15 (2) - 0.50482(2)2 '" 72.1 °C La aproximación a la temperatura "correcta" es obviamente mejor en este caso. Obsérve- se que ahora se ha aproximado la función desconocida [T =f (P)] con un polinomio de se- gundo grado (parábola) que pasa por los tres puntos más cercanos al valor buscado. En general, si se desea aproximar una función con un polinomio de grado n, se necesitan n + 1 puntos, que sustituidos en la ecuación polinomial de grado n: (5.9) generan un sistema de n + 1 ecuaciones lineales en las incógnitas ai , i = O, 1,2 ... , n. Una vez resuelto el sistema se sustituyen los valores de a¡ en la ecuación (5.9), con lo cual se obtiene el polinomio de aproximación. A este método se le conoce como aproxi- mación polinomial simple. Por otro lado, como se dijo al principio de este capítulo, puede tenerse una función conocida pero muy complicada, por ejemplo: f (x) = (2/x) 1/2 sen x (5.10) (5.11) la cual conviene, para propósitos prácticos, aproximar con otra función más sencilla, co- mo un polinomio. El procedimiento es generar una tabla de valores mediante la función original y a partir de dicha tabla aplicar el método descrito arriba.
  • 343. 328 Métodos numéricos apl:cados a la ingeniería ALGORITMO 5.1 Aproximación polinominal simple Para obtener los (n + 1) coeficientes del polinomio de grado n (n > O) que pasa por (n + 1) puntos, proporcionar los DATOS: El grado del polinomio N y las N + 1 parejas de valores (X(I), FX (1), 1=0,1, ... , N). RESULTADOS: Los coeficientes A(O), A(l), ... , A(N) del polinornio de aproximación. PASO l. Hacer I =O. PASO 2. Mientras I:S; N, repetir los pasos 3 a 9. PASO 3. Lacer B(I, O) = l. PASO 4. Hacer J = l. PASO 5. Mientras J :s;N, repetir los pasos 6 y 7. PASO 6. Hacer B(I, J) = B(I,J-l) * X(I). PASO 7. Hacer J = J+1. PASO 8. Hacer B(I,N+l) = FX(I). PASO 9. Hacer I = 1 + 1. PASO 10. Resolver el sistema de ecuaciones lineales B a = fx de orden N + 1 con alguno de los algoritmo s del capítulo 3. PASO 11. IMPRIMIR A(O), A(l), ... , A(N) YTERMINAR. 5.2 Polinomios de Lagrange El método de aproximación polinomial dado en la sección anterior, requiere la solución de un sistema de ecuaciones algebraicas lineales que, cuando el grado del polinomio es alto, puede presentar inconvenientes. Existen otros métodos de aproximación polinomial en que no se requiere resolver un sistema de ecuaciones lineales y los cálculos se realizan direc- tamente; entre éstos se encuentra el de aproximación polinomial de Lagrange. Se parte nuevamente de una función desconocidaf(x) dada en forma tabular y se asu- me que un polinomio de primer grado (ecuación de una línea recta) puede escribirse: (5.12) donde xl y Xo son los argumentos de los puntos conocidos [xo,f(xo)]' [XI,f(XI)], y ao y al son dos coeficientes por determinar. Para encontrar el valor de ao' se hace x = X o en la ecuación 5.12, que al despejar da: p (xo) f(xo) ao=--=--- Xo -Xl Xo-Xl (5.13) y para hallar el valor de al' se sustituye el valor de X con el de xi' con lo que resulta: P (Xl) f(XI) al =---=--- Xl-XO Xl-XO (5.14) de tal modo que al sustituir las ecuaciones 5.13 Y 5.14 en la 5.12 queda: (5.15) o en forma más compacta: p (x) = Lo (x)f(xo) + L¡ (x)f(xl) (5.16) 328 Métodos numéricos apl:cados a la ingeniería ALGORITMO 5.1 Aproximación polinominal simple Para obtener los (n + 1) coeficientes del polinorrtio de grado n (n > O) que pasa por (n + 1) puntos, proporcionar los DATOS: El grado del polinorrtio N y las N + I parejas de valores (X(I), FX (1), 1=0,1,... , N). RESULTADOS: Los coeficientes A(O), A(I),... , A(N) del polinorrtio de aproximación. PASO l. Hacer I = O. PASO 2. Mientras I:S; N, repetir los pasos 3 a 9. PASO 3. Lacer B(I, O) = l . PASO 4. Hacer J = l. PASO 5. Mientras J :s; N, repetir los pasos 6 y 7. PASO 6. Hacer B(I, J) = B(I,J-l) * X(I). PASO 7. Hacer J = J+1. PASO 8. Hacer B(I,N+l) = FX(I). PASO 9. Hacer I = 1 + 1. PASO 10. Resolver el sistema de ecuaciones lineales B a = fx de orden N + 1 con alguno de los algoritmos del capítulo 3. PASO 11. IMPRIMIR A(O), A(l), ... , A(N) YTERMINAR. 5.2 Polinomios de Lagrange El método de aproximación polinomial dado en la sección anterior, requiere la solución de un sistema de ecuaciones algebraicas lineales que, cuando el grado del polinomio es alto, puede presentar inconvenientes. Existen otros métodos de aproximación polinomial en que no se requiere resolver un sistema de ecuaciones lineales y los cálculos se realizan direc- tamente; entre éstos se encuentra el de aproximación polinomial de Lagrange. Se parte nuevamente de una función desconocidaf(x) dada en forma tabular y se asu- me que un polinomio de primer grado (ecuación de una línea recta) puede escribirse: (5.12) donde x, y Xo son los argumentos de los puntos conocidos [xo,f(xo)]' [XI,f(XI)], y ao y al son dos coeficientes por determinar. Para encontrar el valor de ao' se hace x = X o en la ecuación 5.12, que al despejar da: p (xo) f(xo) ao= - - = - - - (5.13) Xo -Xl Xo -Xl y para hallar el valor de al' se sustituye el valor de X con el de xi' con lo que resulta: P (Xl) f(x l) al = - - - = - - - (5.14) x ,-xo xl-xO de tal modo que al sustituir las ecuaciones 5.13 Y5.14 en la 5.12 queda: (5.15) o en forma más compacta: p (x) = Lo (x)f(xo) + L¡ (x)f(xl) (5.16)
  • 344. 3. de lto, que ec- asu- .12) yal n la .13) .14) .15) .16) Aproximación funcional e interpolación 329 donde: x-x Lo (x) = __ 1 xO-x¡ x-x L¡ (x) = __ o XI -xO (5.17)y De igual manera, un polinomio de segundo grado (ecuación de una parábola) puede escri- birse: (5.18) donde xo' x¡ y x2 son los argumentos correspondientes a los tres puntos conocidos [x(» f (xo)] , [xl,f(x¡)], [x2,f(x2)]; los valores de ao' al Y a2 se encuentran sustituyendo x = xo' x = x¡ y x = x2' respectivamente, en la ecuación 5.18 para obtener: y (5.19) cuyo reemplazo en dicha ecuación genera el siguiente polinomio (5.20) donde: Lo (x) = (x - xl) (x - x2) , (xo - xl) (xo - x2) (5.21) Por inducción el lector puede obtener polinomios de tercer, cuarto o n-ésimo grado; este último queda como se indica a continuación donde: LI (x) = (x - xo) (x - x2) (x - xll) (XI - xo) (xl - x2) (xI - x,,) que en forma más compacta y útil para programarse en un lenguaje de computadora que- daría: 11 PII (x) = L L¡ (x)f(x) i=O (5.22) Aproximación funcional e interpolación 329 donde: x-x Lo (x) = _ _1 Xo-XI y (5.17) De igual manera, un polinomio de segundo grado (ecuación de una parábola) puede escri- birse: (5.18) donde xo, XI y x2 son los argumentos correspondientes a los tres puntos conocidos [xO' f (xo)] , [x¡,f(x ¡)], [x2,f(x2)]; los valores de ao, a¡ y a2 se encuentran sustituyendo X = xo' x = X I YX = x2' respectivamente, en la ecuación 5.18 para obtener: y (5.19) cuyo reemplazo en dicha ecuación genera el siguiente polinomio (5.20) donde: (5.21) Por inducción el lector puede obtener polinomios de tercer, cuarto o n-ésimo grado; este último queda como se indica a continuación donde: que en forma más compacta y útil para programarse en un lenguaje de computadora que- daría: 1/ P" (x) = I, L¡ (x) f (x) ;=0 (5.22)
  • 345. 330 Métodos numéri cos aplicados a la ingeniería donde': 11 (x - x) L¡ (x) = Il -------'-- j=ü (x¡ - x) j# (5.23) Al combinarse linealmente con f (x¡), los polinomios L¡ (x), denominados polinomios de Lagrange, generan la aproximación polinomial de Lagrange a la información dada en for- ma tabular. Ejemplo 5.1 Para la tabla que se presenta a continuación a) Obtenga la aproximación polinomial de Lagrange con todos los puntos b) Interpole el valor de la funciónf(x) para x = 1.8 / o 2 3 f(x) -3 o 5 7 o 1 3 6 Solución a) Obsérvese que hay cuatro puntos en la tabla, por lo que el polinomio será de ter- cer grado. Al sustituir los cuatro puntos en las ecuaciones generales 5.22 y 5.23 se obtiene: P (x) - (x - 1) (x - 3) (x _ 6) -3 + 3 - (0-1)(0-3)(0-6) I O (X - O) (x - 3) (x - 6) ------- (1 - O)(1 - 3) (1 - 6) 5 + (x - O) (x - 1) (x - 6) (3 _ O) (3 _ 1) (3 _ 6) . 7 + (x - O) (x - 1) (x - 3) (6 _ O) (6 _ 1) (6 _ 3) al efectuar las operaciones queda: P3(x) = (x3 - lOx2 + 27x - 18) (l/6) + (x3 -7x2 + 6x) (-5/18) + (x3 - 4x2 + 3x) (7/90) y finalmente resulta: b) El valor de x = 1.8 se sustituye en la aproximación polinomial de Lagrange de ter- cer grado obtenida arriba y se tienef(1.8) '" 2. Los cálculos pueden hacerse con Matlab o con la TI-92 Plus 1. • rr (x - x¡) = (x - xI) (x - xZ) ... (x - XII). 1=1 330 Métodos n u méricos aplicado s a la in gen iería donde*: 11 (x-x) L¡ (x) = n --"-- j=ü (x¡ - x) j# (5.23) Al combinarse linealmente con f (x¡), los polinomios L¡ (x), denominados polinomios de Lagrange, generan la aproximación polinomial de Lagrange a la información dada en for- ma tabular. Ejemplo 5.1 Para la tabla que se presenta a continuación Solución a) Obtenga la aproximación polinomial de Lagrange con todos los puntos b) Interpole el valor de la funciónf(x) para x = 1.8 o 2 3 f(x) -3 o 5 7 o 1 3 6 a) Obsérvese que hay cuatro puntos en la tabla, por lo que el polinomio será de ter- cer grado. Al sustituir los cuatro puntos en las ecuaciones generales 5.22 y 5.23 se obtiene: -3 P3 (x) =(x - 1) (x - 3) (x - 6) (O _ 1) (O _ 3) (O _ 6) + I O (x - O) (x - 3) (x - 6) (1 _ O) (1 _ 3) (1 _ 6) 5 + (x - O) (x - 1) (x - 6) (3 _ O) (3 _ 1) (3 _ 6) . 7 + (x - O) (x - 1) (x - 3) (6 _ O) (6 _ 1) (6 _ 3) al efectuar las operaciones queda: P3(X) = (x3 - lOx2 + 27x - 18) (l/6) + (x3 -7x2 + 6x) (-5/18) + (x3 - 4x2 + 3x) (7/90) y finalmente resulta: 3 3 3 ? 276 P (x) = - - x - - x- + -- x - 3 3 90 90 90 b) El valor de x = 1.8 se sustituye en la aproximación polinomial de Lagrange de ter- cer grado obtenida arriba y se tienef(1.8) '" 2. Los cálculos pueden hacerse con Matlab o con la TI-92 Plus 1. • tI (x - x¡) = (x - xI) ( x - xz) ... (x - x ). ;=1 "
  • 346. r- se Aproximación funciona l e interpolación 331 ~ x= [O 1 3 6] ; y=[-3 O 5 7] ; e xi=1.8; r- yi=interp1 (x, xi)y, e5_1 () Prgm C1rIO {O, 1, 3, 6}-+a : {-3, O, 5, 7}-+y A+n : O+i: : De1var x For i, 1, n y[i]-+p For i, 1, n if i=] p* (x-a [j]) / (a [i] -a [j])-+p EndFor r+p+i: EndFor Disp "Po1inomio interpo1ante" Disp expand(r) : Pause FnOff : a[l]-.l* (a [n]-a[l])-+xmin a[n]+_l* (a [n]-a[l]-+xmax min(y)-.l*(max(y)-min(y)) -+ymin max (y) +.1* (max(y) -min (y)) +ymex DrawFunc r : NewP10t 1, 1, a, y FnOn : Pause setMode ("Sp1it 1 App", "Home") EndPrgm Obsérvese que si se remplaza x con cualquiera de los valores dados en la tabla, en la apro- ximación polinomial, se obtiene el valor de la función dado por la misma tabla. Encuentre tanto la aproximación polinomial de Lagrange a la tabla 5.2 como el valor de la temperatura para una presión de 2 atm utilizando esta aproximación. Solución a) Aproximación polinomial de Lagrange mediante dos puntos (n = 1) r- (5.24) al sustituir los primeros dos puntos de la tabla resulta: x-5 x-1 P (x) = -- 56.5 + -- 113 1-5 5-1
  • 347. 332 Métodos numéricos aplicados a la ingeniería Observe que la ecuación 5.24 es equivalente a la 5.5 y, por tanto, al sustituir x = 2 se obtiene el mismo resultado T ""70.6 °C, como era de esperar. b) Aproximación polinomial de Lagrange con tres puntos (n = 2) (X-Xl) (X-X2) (X-Xo) (X-X2) P2 (X) = f (Xo) + f (x.) (xo - Xl) (xo - X2) (Xl - Xo) (Xl - X2) (X-Xo) (X-Xl) + f(x2) (X2 - Xo) (X2 - Xl) al sustituir los primeros tres puntos de la tabla, se obtiene: (X) = (x-5) (x-20) 56.5+ (x-1)(x-20) 113+ (x-1)(x-5) 181 (5.25) P2 (1 - 5) (1 - 20) (5 - 1) (5 - 20) (20 - 1) (20 - 5) polinomio que puede servir para interpolar la temperatura de ebullición de la acetona a la presión de 2 atm; así el resultado queda T ""72.1. Observe que la ecuación 5.25 equivale a la 5.8. e) La tabla 5.2 contiene cuatro puntos, por lo que la aproximación polinomial de ma- yor grado posible es 3. Se desarrolla la ecuación 5.22 para n = 3 (5.26) Al sustituir los puntos de la tabla, se obtiene: (X - 5) (x - 20) (x - 40) (x - 1) (x - 20) (x - 40) 113 + P3 (x) = (1 _ 5)(1 _ 20) (1 _ 40) 56.5 + (5 - 1) (5 - 20) (5 - 40) (X - 1) (x - 5) (x - 40) (20 - 1) (20 - 5) (20 - 40) 181 + (X - 1) (x - 5) (x - 20) 214.5 (40 - 1) (40 - 5) (40 - 20) y al simplificar queda: P3 (x) = 0.01077 x3 - 0.78323 x2 + 18.4923 X + 38.774 Pa¡ el cual puede empelarse para encontrar el valor de la temperatura correspondiente a la pre- sión de 2 atm. Con la sustitución de X = 2 Y al evaluar pix) queda: T =f(2) ""p3(2) = 0.01077(2)3 + 0.78323(2)2 + 18.4923(2) + 38.774 = 72.7 Para realizar los cálculos puede usar Matlab o la TI92-Plus PA PA PA 332 Métodos n umé rico s a p licados a la ingen iería Observe que la ecuación 5.24 es equivalente a la 5.5 y, por tanto, al sustituir x = 2 se obtiene el mismo resultado T '" 70.6 oC, como era de esperar. b) Aproximación polinomial de Lagrange con tres puntos (n =2) (X-Xl) (X - X2) (X - Xo) (X-X2) P2 (X) = ! (Xo) + ! (Xl) (Xo- Xl) (Xo- X2) (Xl - Xo) (Xl - X2) (X-Xo) (X-XI) + !(X2) (X2 - XO) (X2 - XI) al sustituir los primeros tres puntos de la tabla, se obtiene: (X) = (x - 5) (x - 20) 56.5 + (x - 1) (x - 20) 113 + (x - 1) (x - 5) 181 (5.25) P2 (1 - 5) (1 - 20) (5 - 1) (5 - 20) (20 - 1) (20 - 5) polinomio que puede servir para interpolar la temperatura de ebullición de la acetona a la presión de 2 atm; así el resultado queda T '" 72.1. Observe que la ecuación 5.25 equivale a la 5.8. e) La tabla 5.2 contiene cuatro puntos, por lo que la aproximación polinomial de ma- yor grado posible es 3. Se desarrolla la ecuación 5.22 para n = 3 Al sustituir los puntos de la tabla, se obtiene: (X - 5) (x - 20) (x - 40) (x - 1) (x - 20) (x - 40) 113 + P3 (x) = (1 _ 5)(1 _ 20) (1 - 40) 56.5 + (5 - 1) (5 - 20) (5 - 40) (X - 1) (x - 5) (x - 40) (20 - 1) (20 - 5) (20 - 40) y al simplificar queda: 181 + (X - 1) (x - 5) (x - 20) 214.5 (40 - 1) (40 - 5) (40 - 20) P3 (x) =0.01077 x3 - 0.78323 x2 + 18.4923 x + 38.774 (5.26) el cual puede empelarse para encontrar el valor de la temperatura correspondiente a la pre- sión de 2 atm. Con la sustitución de x = 2 Yal evaluar pix) queda: T = f(2) '" pi2) = 0.01077(2)3 + 0.78323(2)2 + 18.4923(2) + 38.774 = 72.7 Para realizar los cálculos puede usar Matlab o la TI92-Plus
  • 348. 2 se 5.25) a la ivale ma- 5.26) ¡ ·1 pre- Aproximación funcional e interpolación 333 P=[l 5 T=[56.5 xi=2; yi=interp1 (P, T, xi) yi=interpl (P, T, xi, 'eubie') yi=interpl (P, T, xi., 'sp1ine') 20 40]; 113 181 214.5]; Sobre 'spline' vea la sección 5.7 e5_2 () Prgm CIrIO Request "Grado del po1inomio", n expr(n) +l=+n For i, 1, n Request "P("&string (i) &")", e expr(e)-->x[i] Request "T("&string (i) &")", e expr (e) -->y [i] EndFor Request "Presion a interpolar", e expr(e)-->xint: tr+r For i,l,n y[i]->p Forj, 1, n if ú!j p* (xint-a [j]) / (a [i] -a tin :» EndFor r+p+i: EndFor Disp "T("&format (xint, "fl") &")="&format (r, "f4") EndPrgm ALGORITMO 5.2 Interpolación con polinomios de Lagrande Para interpolar con polinomios de Lagrange de grado N, proporcionar los DATOS: El grado del polinornio N, las N + 1 parejas de valores (X(I), FX(I), 1=0,1, ... , N) Yel valor para el que se desea la interpolación XINT. RESULTADOS: La aproximación FXINT, el valor de la función en XINT. PASO l. Hacer FXINT = O. PASO 2. Hacer 1 = O. PASO 3. Mientras 1 ~ N, repetir los pasos 4 a 10. PASO 4. Hacer L = l. Aproximación funcional e interpolación 333 P=[l 5 20 40} ; T=[56. 5 113 181 214 . 5} ; xi=2; yi=interp1 (P, T, xi) yi=interpl (P, T, xi, 'eubie' ) yi=interpl (P, T, xi , ' spline ') Sobre 'spline' vea la sección 5.7 e5_2 () Prgm ClrIO Request " Grado del polinomio", n expr (n) +1--+n For i , 1 , n Request " P (" &string (i ) &")", e expr (e) --+x[i} Request " T( " &string (i) &")", e expr (e) --+y [i} EndFor Request "Presion a interpolar", e expr(e)--+xint: O--+r For i , l , n y[i} --+p For j , 1 , n if ioIj p* (xint -a [j] ) / (a [i] -a [j] )--+p EndFor r+p--+r EndFor Disp " T ("&format (xint, "fl") &") ="&format (r, "f4") EndPrgm ALGORITMO 5.2 Interpolación con polinomios de Lagrande Para interpolar con polinomios de Lagrange de grado N, proporcionar los DATOS: El grado del polinomio N, las N + 1 parejas de valores (X(1), FX(1), 1=0,1,... , N) Yel valor para el que se desea la interpolación XINT. RESULTADOS: La aproximación FX1NT, el valor de la función en X1NT. PASO l. Hacer FXINT = O. PASO 2. Hacer 1 = O. PASO 3. Mientras 1:0; N, repetir los pasos 4 a 10. PASO 4. Hacer L = 1.
  • 349. 334 Métodos numéricos aplicados a la ingeniería PASO 5. Hacer 1 = O. PASO 6. Mientras 1:S; N, repetir los pasos 7 y 8. PASO 7. Si I *JHacer L = L * (XINT-X(J))/(X(I)-X(J)). PASO 8. Hacer 1=1 + 1. PASO 9. Hacer FXINT = FXINT + L * (FX (1). PASO 10. Hacer I = 1 + 1. PASO 11. IMPRIMIR FXINT Y TERMINAR. Ejemplo 5.3 Solución Elabore un programa para aproximar la funciónf(x) = cos x en el intervalo [O, 8n] , con polinomios de Lagrange de grado 1,2,3, ... ,10. Use los puntos que se requieran, distri- buidos regularmente en el intervalo. Determine en forma práctica el error máximo que se comete al aproximar con los po- linomios de los diferentes grados y compare los resultados. El programa se encuentra en el CD (PROGRAMA 5.1).' Para calcular el error máximo se di- vidió el intervalo [ O, 8n] en 20 subintervalos y se calculó el valor con el polinomio inter- polante y el valor verdadero con la función cos x, determinando el error absoluto. Se obtuvieron los siguientes resultados. Grado Error máximo 1 2 3 4 5 6 7 8 9 10 2.23627 2.23622 3.17025 2.23627 4.04277 4.1879 5.68560 33.74134 12.82475 35.95l74 Se observa que al aumentar el grado del polinomio, el error absoluto máximo va aumen- tando. Antes de pasar al estudio de otra forma de aproximación polinomial (de Newton), se requie- re el conocimiento de las diferencias divididas, las cuales se presentan a continuación. 5.3 Diferencias divididas Por definición de derivada en el punto X o de una función analíticaj(x) se tiene: I' (x) = lím x-+x o x-xo 334 Métodos numéricos apl icados a la ingeniería PASO 5. Hacer J = O. PASO 6. Mientras J:S:; N, repetir los pasos 7 y 8. PASO 7. Si I *JHacer L = L * (XlNT-X(J))/(X(I)-X(J)). PASO 8. Hacer J=J + 1. PASO 9. Hacer FXINT = FXINT + L * (FX (1). PASO 10. Hacer I = I + 1. PASO 11. IMPRIMIR FXlNT Y TERMINAR. Ejemplo 5.3 Solución Elabore un programa para aproximar la funciónf(x) = cos x en el intervalo [O, 8n] , con polinomios de Lagrange de grado 1, 2, 3,... ,10. Use los puntos que se requieran, distri- buidos regularmente en el intervalo. Determine en forma práctica el error máximo que se comete al aproximar con los po- linomios de los diferentes grados y compare los resultados. El programa se encuentra en el CD (PROGRAMA 5.1). Para calcular el error máximo se di- vidió el intervalo [ O, 8n] en 20 subintervalos y se calculó el valor con el polinomio inter- polante y el valor verdadero con la función cos x, determinando el error absoluto. Se obtuvieron los siguientes resultados. Grado Error máximo 2.23627 2 2.23622 3 3.17025 4 2.23627 5 4.04277 6 4.1879 7 5.68560 8 33.74134 9 12.82475 10 35.95174 Se observa que al aumentar el grado del polinomio, el error absoluto máximo va aumen- tando. Antes de pasar al estudio de otra forma de aproximación polinomial (de Newton), se requie- re el conocimiento de las diferencias divididas, las cuales se presentan a continuación. 5.3 Diferencias divididas Por definición de derivada en el punto X ode una función analíticaj(x) se tiene: f' (x)
  • 350. po- di- ter- . Se Aproximación funcional e interpolación 335 Sin embargo, cuando la función está en forma tabular oPuntos 1 2 n uie- x Xn f(x) f(x,,) La derivada sólo puede obtenerse aproximadamente; por ejemplo, si se desea la derivada en el punto x, (xo< x < Xl)' puede estimarse como sigue: El lado derecho de la expresión anterior se conoce como la primera" diferencia dividida de f(x) respecto a los argumentos xoY xl' y se denota generalmente comof[xo, Xl] ; así, La relación entre la primera diferencia dividida y la primera derivada queda establecida por el teorema del valor medio siempre y cuando f (x) satisfaga las condiciones de aplicabilidad de dicho teorema. Para obtener aproximaciones de derivadas de orden más alto, se extiende el concepto de dife- rencias divididas a órdenes más altos como se ve en la tabla 5.3, en donde para uniformar la notación se han escrito los valores funcionales en los argumentos Xi' O ~ i ~ n, como f [Xi] Y se les llama diferencias divididas le orden cero. Por otro lado, de acuerdo con la tal ra 5.3, la diferencia de orden i es: En esta expresión pude observarse que: a) Para formarla se requieren i + 1 puntos y b) El numerador es la resta de dos diferencias de orden i - 1 Yel denominador la res- ta de los argumentos no comunes en el numerador . • Se llama también diferencia dividida de primer orden. Aproximación funcional e interpolación 335 Sin embargo, cuando la función está en forma tabular Puntos o 2 n x xl1 f(x) f(x,) La derivada sólo puede obtenerse aproximadamente; por ejemplo, si se desea la derivada en el punto x, (xo< x < xI)' puede estimarse como sigue: f' (x) '" f(x l) - f(xo) , XI-XO El lado derecho de la expresión anterior se conoce como la primera* diferencia dividida de f(x) respecto a los argumentos xoy x" y se denota generalmente comof[xo, x¡] ; así, La relación entre la primera diferencia dividida y la primera derivada queda establecida por el teorema del valor medio siempre y cuando f (x) satisfaga las condiciones de aplicabilidad de dicho teorema. Para obtener aproximaciones de derivadas de orden más alto, se extiende el concepto de dife- rencias divididas a órdenes más altos como se ve en la tabla 5.3, en donde para uniformar la notación se han escrito los valores funcionales en los argumentos Xi' O~ i ~ n, como f [Xi] Yse les llama diferencias divididas le orden cero. Por otro lado, de acuerdo con la tat fa 5.3, la diferencia de orden i es: En esta expresión pude observarse que: a) Para formarla se requieren i + 1 puntos y b) El numerador es la resta de dos diferencias de orden i - 1 Yel denominador la res- ta de los argumentos no comunes en el numerador. • Se llama también diferencia dividida de primer orden.
  • 351. Información f(x) Xof[xo] x Xlf[Xl] Primeras --- f[xo,X1]=f[Xl]-f[xo] XI-XO f[x1,X2]=f[X2]-f[XI] X2-XI Diferenciasdivididas SegundasTerceras f[x2,X3]=f[X3]-f[X2] X3f[X3]X3-X2 f[X3,X4]=f[X4]-f[X3] X4f[X4]X4-X3 f[x4,Xs]=f[xs]-f[X4] Xsf[xs]XS-X4 Tabla53'.Tabulacióngeneral,de'diferencias'd'',ivididas ~ (D- Oo, O (J) ::J e 3(D- -r o' o(J) O! u o' O!o, o(J) O! ¡¡¡ S' eo (D ::J iD' ~- Diferenciasdivididas ;~~__________~s:eg~u:n~d:as~__________-=~~~~~~~::~~~~~~J[xo,x11~J[xll-J[xolTcrce"'" Xlf[Xl]Xl-XO Información Xfex)Primeras Xof[xo] f[xI,X2]=f[X2]-f[xI] X2f[X2]X2-Xl f[x2,X3]=f[X3]-f[X2] X3f[X3]X3-X2 f[x3,X4]=f[X4]-f[X3] X4f[X4]X4-X3 f[x4,Xs]=f[xs]-f[X4] Xsf[xs]XS-X4 Tabla53•Tabula"clangeneralde'diferencias'd''d'IVIIdas :5: (D- OQ. O (JI ::J e 3(1)- ..., o' o (JI O! 'Q.. o' O! Q. o(JI O!
  • 352. Aproximación funcional e interpolación 337 Ejemplo 5.4 La información de la tabla siguiente se obtuvo del polinomio Puntos O 1 2 3 4 5 x -2 -1 -5 O -2 2 -2 3 7 6 142f(x) -18 A partir de ella, elabore una tabla de diferencias divididas. Solución Las primeras diferencias divididas mediante los puntos (O), (1) Y (1), (2), respectivamen- te, son: -5 - (-18) f [xo' Xl] = = 13; -1 - (-2) -2-(-5) f[xl' x2] = = 3 0-(-1) La segunda diferencia dividida mediante los puntos (O), (1) Y (2) es: 3 - 13 f [XÜ'xl' x2 ] = = -5 0-(-2) De igual manera se calculan las demás diferencias divididas, que se resumen en la siguien- te tabla Puntos X f(x) ler orden 2do orden 3er orden 40 orden O -2 -18 13 1 -1 -5 -5 3 2 O -2 -1 O O 1 3 2 -2 3 O 9 4 3 7 9 45 5 6 142 Debe notarse que todas las diferencias divididas de tercer orden tienen el mismo valor, in- dependientemente de los argumentos que se usen para su cálculo. Obsérvese también que las diferencias divididas de cuarto orden son todas cero, lo cual concuerda con que la ter- cera y cuarta derivada de un polinomio de tercer grado son -respectivamente- una cons- tante y cero, sea cual sea el valor del argumento x. El razonamiento inverso también es válido: si al construir una tabla de diferencias divididas en alguna de las columnas el va- lor es constante (y en la siguiente columna es cero), la información proviene de un poli no- mio de grado igual al orden de las diferencias que tengan valores constantes. Para realizar los cálculos puede usar Matlab.
  • 353. 338 Métodos numéricos ap licados a la ingeniería x= [-2 -1 023 6}; fx= [-18 -5 -2 -2 7142}; M=6;N=M-1; for i=l: N T(i,l) = (fx(i+l) -fx(i))/(x(i+l)-x(i)); end for ]=2 :N for i=j :N T (i,j) (T (i,j-1) -T(i-l,j -1)) / (x (i+l) - x(i-j+1)); end end T ALGORITMO 5.3 Tabla de diferencias divididas Para obtener la tabla de diferencias divididas de una función dada en forma tabular, proporcionar los DATOS: El número de parejas M de la función tabular y las parejas de valores (X (I),FX(I), 1= O, 1,2, ... , M-l). RESULTADOS: La tabla de diferencias divididas T. PASO 1. Hacer N = M-1. PASO 2. Hacer 1 = O. PASO 3. Mientras 1::; N-l, repetir los pasos 4 y 5. PASO 4. Hacer T(I,O) = (FX(I+ l)-FX(I))/(X(I+ l)-X(I)). PASO 5. Hacer 1 = 1+1. PASO 6. Hacer J = 1. PASO 7. Mientras J s N-I, repetir los pasos 8 a 12. PASO 8. Hacer 1 = J. PASO 9. Mientras 1::; N-l, repetir los pasos 10 y 11. PASO 10. Hacer. T(I,J) = (T(I,J-l) - T(I-l,J-l))/(X(I+l)-X(I-J)). PASO 11. Hacer! = 1 + 1. PASO 12. Hacer J = J + 1. PASO 13. IMPRIMIR T YTERMINAR. 5.4 Aproximación polinominal de Newton Puntos o 1 2 3 n Supóngase que se tiene una función dada en forma tabular como se presenta a continuación x X" f(x) f[xn ] 338 Métodos numéricos aplicados a la ingeniería x= [-2 - 1 023 6} ; fx= [ - 18 - 5 - 2 - 2 7142} ; M=6; N=M- 1; for i=l: N T(i,l) = (fx(i+l) - fx(i))/(x(i+l) - x(i)); end for ]=2 : N for i=j : N T (i,j) (T (i, j - 1) - T(i-l,j - 1)) / (x (i+l ) - x (i-j+1 )); end end T ALGORITMO 5.3 Tabla de diferencias divididas Para obtener la tabla de diferencias divididas de una función dada en forma tabular, proporcionar los DATOS: El número de parejas M de la función tabular y las parejas de valores (X (I),FX(I), 1= 0, 1,2, ... , M-l). RESULTADOS: La tabla de diferencias divididas T. PASO l. Hacer N = M-l. PASO 2. Hacer 1= O. PASO 3. Mientras 1::; N-l, repetir los pasos 4 y 5. PASO 4. Hacer T(I,O) = (FX(I+ l)- FX(I»/(X(I+1)-X(I». PASO 5. Hacer 1= 1+l. PASO 6. Hacer J = 1. PASO 7. Mientras J ::; N-l, repetir los pasos 8 a 12. PASO 8. Hacer 1 = J. PASO 9. Mientras 1::; N- l , repetir los pasos 10 y ll. PASO 10. Hacer. T(I,J) = (T(I,J- l) - T(I-l,J- l»/(X(I+l)- X(I- J». PASO 11. HacerI = I + l. PASO 12. Hacer J = J + l. PASO 13. IMPRIMIR T YTERMINAR. 5.4 Aproximación polinominal de Newton Supóngase que se tiene una función dada en forma tabular como se presenta a continuación Puntos o 1 2 3 n x f(x)
  • 354. 2,." , Aproximación funcional e interpolación 339 y que se desea aproximarla preliminarmente con un polinomio de primer grado que pasa, por ejemplo, por los punto (O) y (1). Sea además dicho polinomio de la forma: (5.27) ión donde Xo es la abscisadel punto (O) y ao' al son constantes por determinar. Para encontrar el valor de ao se hace x = xo' de donde ao = p(xo) = f [xo]' y a fin de encontrar el valor de al se hace x = xl' de donde al = ({[xI] - f[xo]) / (Xl- xo), o sea la primera diferencia di- vidida j'[x., xo]· Al sustituir los valores de estas constantes en la ecuación 5.27 ésta queda o sea un polinomio de primer grado en términos de diferencias divididas. y si ahora se desea aproximar la función tabular con un polinomio de segundo grado que pase por los puntos (O), (1) Y (2) Y que tenga la forma: (5.28) donde Xo y XI vuelven a ser las abscisas de los puntos (O) y (1) y ao' al y a2 son constantes por determinar, se procede como en la forma anterior para encontrar estas constantes; o sea, si X = xo' ao = P2 (xo) = f [xo] . f[ XI] - f [xo] SlX = xI' al = =f[xo'x¡] xl-xO Al desarrollar algebraicamente el numerador y el denominador de a2 se llega a" f[x2 ] - f[x¡] f[xl ] - f[xo] X2 -Xl XI -Xoa2 = ---"--'---------'--'-- = f[xo, XI' X2 ] X 2 -X o que es la segunda diferencia dividida respecto a X o' Xl y X2. Con la sustitución de estos coeficientes en la ecuación 5.28 se obtiene: P2(X) = f[xo] + (x - xo)f [xo' x¡] + (X-Xo) (x-xI) f[xo' Xl' X2] que es un polinomio de segundo grado en términos de diferencias divididas. Por inducción se puede establecer que, en general, para un polinomio de grado n es- crito en la forma Pn(X) = ao + al (x-xo) + a2 (x-xo) (X-XI) + ... + an (x-xo) (X-XI) (x-xn_l) (5.29) y que pasa por los puntos (O), (1), (2), ... , (n); los coeficientes aO' al' , an están dados por f[xo] f[xo' XI] f[xo, xi' x2] • Véase el problema 5.11. Aproximación funcional e interpolación 339 y que se desea aproximarla preliminarmente con un polinomio de primer grado que pasa, por ejemplo, por los punto (O) y (1). Sea además dicho polinomio de la forma: (5.27) donde Xoes la abscisa del punto (O) yao> a, son constantes por determinar. Para encontrar el valor de ao se hace x =xo' de donde ao =p(xo) =f [xo]' y a fin de encontrar el valor de a, se hace x = xj> de donde al = (f [x, ] - f [xo ]) / (xl - xo)' o sea la primera diferencia di- vididaf[xl' xo]' Al sustituir los valores de estas constantes en la ecuación 5.27 ésta queda o sea un polinomio de primer grado en términos de diferencias divididas. y si ahora se desea aproximar la función tabular con un polinomio de segundo grado que pase por los puntos (O), (1) Y (2) Y que tenga la forma: (5.28) donde Xoy x, vuelven a ser las abscisas de los puntos (O) y (1) y ao, al y a2 son constantes por detei-miri.ar, se procede como en la forma anterior para encontrarestas constantes; o sea, si x =xo> ao =P2 (xo) =f [xo] . f[ x,] - f[ xo] SI x =xl' al = =f[xo, XI] X¡-XO Al desarrollar algebraicamente el numerador y el denominador de a2 se llega a* f[x2] - f[x¡] f[x l] - f[xo] x2-XI x, - xoa2 = - --=--'--------'---"-- = f[xo> xl' x2] x2 - xo que es la segunda diferencia dividida respecto a xQ> XI y x2. Con la sustitución de estos coeficientes en la ecuación 5.28 se obtiene: P2(X) = f[xo] + (x - xo)f [xo' x¡] + (x-xo) (x-x,) f[xo> xl' x2] que es un polinomio de segundo grado en términos de diferencias divididas. Por inducción se puede establecer que, en general, para un polinomio de grado n es- crito en la forma (5.29) y que pasa por los puntos (O), (1), (2),... , (n); los coeficientes aQ> a" ... > an están dados por ao f[xo] a, f[xo, x ,] a2 f [xo> x" x2] • Véase el problema 5.11.
  • 355. .---------~----------------~----------------------------------=T~~~ 340 Métodos numéricos aplicados a la ingeniería Esta aproximación polinomial de Newton, la cual se puede expresar sintéticamente como: n k-I P" (x) = L ak Il (x -x) k=O i=O (5.30) Para realizar los cálculos puede usar Matlab. I Ejemplo 5.51 Elabore una aproximación polinomial de Newto~ para la información tabular de las pre- siones de vapor de la acetona (tabla 5.2) e interpole la temperatura para una presión de 2 atm. Solución Para el cálculo de los coeficientes del polinomio de Newton, se construye la tabla de dife- rencias divididas. Diferencias divididas Puntos P T Primera Segunda Tercera O 1 56.5 14.125 5 113 -0.50482 4.533 0.01085 2 20 181 -0.08167 1.675 3 40 214.5 a) Para n = 1 P (x) = ao + al (x-xo) = f[ Xo ] + f[ xo' XI ] (x-xo) Si x = 2,f(2) ""p(2) = 56.5 + 14.125(2-1) = 70.6 °C de la tabla se tienef[xo] = 56.5 y f[xO'xl] = 14.125, de donde: p (x) = 56.5 + 14.125 (x - 1) ecuación que equivale a las obtenidas anteriormente (5.5 y 5.24). b) Para n = 2 P2(X) = ao + al (x-xO) + a2(x-xO)(x-xl) = f[xo] + f[xO'xl] (x-xo) + f[xO'xl'x2] (x-xo) (x-xl) de la tabla se obtienen ao = f[xo] = 56.5, al =f[xo' x 1] = 14.125, a2 =f[xo' x l' x2] = -0.50482, que al sustituirse en la ecuación de arriba dan: . P2 (x) = 56.5 + 14.125 (x -1) - 0.50482(x -1)(x - 5) E ecuación que equivale a 5.8 y 5.25 Si x = 2,f(2) ""p2(2) = 56.5+14.125(2-1)-0.50482(2-1)(2-5)=72.1 °C e) Para n = 3
  • 356. Aproximación funcional e interpolación 341 nte P3 (x) = ao+a) (x-xo) + a2 (x-xo)(x-x)) + aix-xo)(x-x))(x-x2) = f[xoJ + f[xo,xd (x-xo) + f[xO,x»x2J (x-xo) (x-x))+ f [xQ>x»x2,x3J (x-xo)(x-x ))(x-x2) de la tabla se obtienen ao = f[xo J = 56.5, al = f[xo'x) J = 14.125, a2 = f[xO,x»x2J = -0.50842, a3 = f[ xO,xJ>x2,x3J = 0.01085. .30) que sustituidas generan el polinomio de aproximación P3 (x) = 56.5+ 14. 125(x-l)-0.50482(x-1)(x-5)+0.01085(x-l)(x-5)(x-20) y que es esencialmente el polinomio obtenido con el método de Lagrange (ecuación 5.26). dife- Si x = 2,f(2) "" P3 (2) = 56.5+14.125(2-1)-0.50482(2-1)(2-5)+ 0.01085(2-1)(2-5)(2-20) = 70.7 °C Para realizar los cálculos puede usar Matlab. c1ear x=[l 5 20 40]; fx=[56.5 113 181 214.5]; M=4;N=M-1; for i=l : N T (i,1) = (E: (i +1) -fx (i)) / (x (i +1) -x (i)) ; end for j=2:N for i=j:N T(i,j)=(T(i,j-1) -T(i-1,j-1)) l... (x(i+1)-x(i-j+1) ); end end T Xint=2; fprintf (' N Fxint In') px1=fx (1) +T (1,1) * (Xint-x (1) ) ; fprintf(' %d %6.1f In' ,1,px1) px2=fx (1) +T (1,1) * (Xint-x (1) ) +... T(2,2) * (Xint-x (1)) * (Xint-x (2)) ; fprintf(' %d %6.1f In' ,2,px2) px3=fx (1) +T (1, 1) * (Xint-x (1)) +... T(2,2) * (Xint-x (1))* (Xint-x (2)) +... T(3,3) * (Xint-x (1) ) * (Xint-x (2)) * (Xint-x (3)) ; fprintf(' %d %6.1f In' ,3,px3) 82, Ejemplo 5.6 Aproxime la temperatura de ebullición de la acetona a una presión de 30 atm usando aproximación polinomial de Newton de grado dos (véase Ej. 5.5). 1'6'_.5 3 Solución Se hace pasar el polinomio de Newton por los puntos (1), (2) Y (3), con lo que toma la forma Aproximación funcional e interpolación 341 P3 (x) = aO+ a l (X-XO) + a2 (X-XO)(X-X I ) + a3(x-xO)(X-XI )(X-X2) = f[xOJ + f[xo,xd (x-xo) +f[xO,Xp X2J (X-XO) (X-X I )+ f [xo'x pX2,X3J(X-XO)(X-X I)(X-X2) de la tabla se obtienen ao = f[xoJ=56.5, al = f[xO,x l J= 14.125, a2 =f [xO,xp x2J =--0.50842, a3 = f [ xO,xl'x2,x3J =0.01085. que sustituidas generan el polinomio de aproximación P3 (x) = 56.5+14.125(x-1)-0.50482(x-1)(x-5)+0.01085(x-1)(x-5)(x-20) y que es esencialmente el polinomio obtenido con el método de Lagrange (ecuación 5.26). Si x =2,f(2) '" P3 (2) = 56.5+14.125(2-1)-0.50482(2-1)(2-5)+ 0.01085(2-1)(2-5)(2-20) = 70.7 oC Para realizar los cálculos puede usar Matlab. c1ear x=[l 5 20 40]; fx=[56.5 113 181 214.5]; M=4;N=M-l; for i=l : N T (i,l) = (L~ (i +1) - fx (i)) / (x (i+l) -x (i)) ; end for j=2 : N for i=j : N T(i , j)=(T(i,j-l) - T(i-1 , j-1) )/.. (x(i+1)-x (i-j+1) ); end end T Xint=2; fprintf (' N Fxint In') px1=fx (1) +T (1 , 1) * (Xint - x (1) ) ; fprintf(' %d %6.1f In' ,1,px1) px2=fx (1) +T (1,1) *(Xin t-x (1) ) +... T (2,2) *(Xint-x (1)) *(Xint-x (2 )) ; fprintf( ' %d %6.1f In' ,2,px2) px3=fx (1) +T (1,1) *(Xint-x (1) ) +... T (2,2) *(Xint-x (1))* (Xint - x (2)) +... T (3,3) *(Xint-x (1) r' (Xint - x (2)) *(Xint-x (3)) ; fprintf(' %d %6.1f In' ,3,px3) Ejemplo 5.6 Aproxime la temperatura de ebullición de la acetona a una presión de 30 atm usando aproximación polinomial de Newton de grado dos (véase Ej. 5.5). 1'6'.S "3 Solución Se hace pasar el polinomio de Newton por los puntos (1), (2) Y(3), con lo que toma la forma
  • 357. ~~-~~~------.~.--------------------------------------------------------------------------~--------~- ¡ ~'l 342 Métodos numéricos aplicados a la ingeniería con los coeficientes dados ahora de la siguiente manera: ao = f[XI] al = f[xl' X2] a2= f[xl'X2'X3] Al sustituir: PA P2 (x) = f[xl] + f[xl' X2] (X~XI) + f[xl' x2, x3] (X-Xl) (X-X2) = 113 + 4.533(x - xl) - 0.08167(x - xl)(x - x2) y al evaluar dicho polinomio en X = 30, se obtiene la aproximación buscada 5. T = pzC30) = 113 + 4.533(30 - 5) - 0.08167(30 - 5)(30 - 20) = 205.9 El valor reportado en la tabla 5.1 es 205, por lo que la aproximación es buena. Para realizar los cálculos puede usar Matlab. c1ear x= [5 20 40 J; fx=[113 181 214.5J; M=3; N=M-1; for i=l : N T(i,l) = (fx(i+1) -fx(i))/(x(i+1)-x(i)) end for j=2:N for i=j:N T (i,j) = (T (i ,j-1) -T (i -1,j-1)) / ... (x(i+l) -x (i-j+l) ); end end T Xint=30; px2=fx(1) +T(l,l) * (Xint-x(l))+ ... T(2,2) * (Xint-x(1))*(Xint-x(2)); fprintf ('T (%2d)=%6.1fn' ,Xint, px2) Para interpolar con polinomios de Newton en diferencias divididas de grado N, proporcionar los DATOS: El grado del polinomio N, las N+ 1 parejas de valores (X(I), FX(I), 1=0, 1,2, ... , N) Y el valor para el que se desea interpolar XINT. RESULTADOS: La aproximación FXINT al valor de la función en XINT. PASO l. Realizar los pasos 2 a 12 del algoritmo 5.3. PASO 2. Hacer FXINT = FX(O). PASO 3. Hacer I = O. PASO 4. Mientras 1 ::;N~ 1, repetir los pasos 5 a 11. 342 Métodos numéricos aplicados a la ingeniería con los coeficientes dados ahora de la siguiente manera: ao= ![Xl] al = f[xl' X2] a2 = ! [xl' X 2' X 3] Al sustituir: P2 (x) = f[xl ] + f[xl' X2] (X-Xl) + f[xl' X2, X3] (X-Xl) (X-X2) = 113 + 4.533(x - xl) - 0.08l67(x - XI)(X - X2) y al evaluar dicho polinomio en X = 30, se obtiene la aproximación buscada T =pi30) = 113 + 4.533(30 - 5) - 0.08167(30 - 5)(30 - 20) = 205.9 El valor reportado en la tabla 5.1 es 205, por lo que la aproximación es buena. Para realizar los cálculos puede usar Matlab. c1ear x= [5 20 40 }; fx= [113 181 214.5J; M=3; N=M-1; for i =l : N T(i,l) = (fx(i+1) -fx(i))I(x(i+1 )-x(i)) end f or j=2 :N for i =j:N T (i,j) = (T (i, j-1) -T (i -1,j-1)) loo. (x(i+l ) -x (i-j +l ) ); end end T Xint=30; p x 2=fx(1) +T(l,l) * (Xint-x(l))+ oo. T(2,2) * (Xint-x(1))*(Xint-x(2)); fprintf ('T (%2d) =%6. 1fn' ,Xint, px2) i ;, &Jl 7F; t , # . * . ~ ALGORITMO 5.4 Interpolación pollnominal de Newton 1 Para interpolar con polinomios de Newton en diferencias divididas de grado N, proporcionar los DATOS: El grado del polinomio N, las N+1 parejas de valores (X(I), FX(I), 1=0, 1,2,... , N) Yel valor para el que se desea interpolar XINT. RESULTADOS: La aproximación FXINT al valor de la función en XINT. PASO l . Realizar los pasos 2 a 12 del algoritmo 5.3. PASO 2. Hacer FXINT = FX(O). PASO 3. Hacer I = O. PASO 4. Mientras 1 ::; N-l, repetir los pasos 5 a 11.
  • 358. Aproximación funcional e interpolación 343 PASO 5. Hacer P = 1. PASO 6. Hacer J = O. PASO 7. Mientras J ::; I, repetir los pasos 8 y 9. PASO 8. Hacer P = P * (XINT - X(J». PASO 9. Hacer J = J + 1. PASO 10. Hacer FXINT = FXINT + T(I,I)*P. PASO 11. Hacer I = I + 1. PASO 12. IMPRIMIR FXINT y TERMINAR. 5.5 Polinomio de Newton en diferencias finitas Cuando la distancia h entre dos argumentos consecutivos cualesquiera, es la misma a lo largo de la tabla, el polinomio de Newton en diferencias divididas puede expresarse con más sencillez. Para este propósito se introduce un nuevo parámetro s, definido en x = xo+sh, con el cual se expresa el factor productoria k-I rr (x - Xi)' i=O de la ecuación 5.30 en términos de s y h. Para esto obsérvese que xI - X o = h, x2 - X o = 2h, ... , x; - X o = ih Y que restando x;(O::; i::; n) en ambos miembros de x = X o + sh, se ob- tiene: x - Xi = Xo - Xi + sh = -ih + sh = h(s -i) para (O ::; i ::;n) Por ejemplo si i = 1, X-XI = h(s-l) si i = 2, X - x2 = h(s - 2) Al sustituir cada una de las diferencias (x - x¡) con h (s - i), en la ecuación 5.29, se llega a: P; (x) = Pn (xo + sh) = f[xo] + hsf[xo' XI] + h2 s(s-1)f[xo, xi' x2] + h3 s(s-1)(s-2)f[xo' xl' x2' x3] + ... + h" s(s-1)(s-2) ... (s-(n-l»f[xo' xp'" xn ] (5.31) o en forma compacta n k-I P (x) = L a hk rr (s - i) n k=O k ;=0 (5.32) Esta última ecuación puede simplificarse aún más si se introduce el operador lineal li,co- nocido como operador lineal en diferencias hacia delante y definido sobre f (x) como. lif(x) = f(x + h) - f(x) La segunda diferencia hacia delante puede obtenerse como sigue: li (lif(x» = li2 f(x) = li (¡(x + h) -f(x» = lif(x + h) - lif(x) =f (x + h + h) - f (x + h) - f (x + h) + f (x) = f (x + 2h) - 2f (x + h) + f (x) Aproximación funcional e interpolación 343 PASO 5. Hacer P = 1. PASO 6. Hacer J = O. PASO 7. Mientras J ::; 1, repetir los pasos 8 y 9. PASO 8. Hacer P = P * (XINT - X(J)). PASO 9. Hacer J = J + 1. PASO 10. Hacer FXINT = FXINT + T(I,IyP. PASO 11. Hacer 1 = 1 + 1. PASO 12. IMPRIMIR FXINT y TERMINAR. 5.5 Polinomio de Newton en diferencias finitas Cuando la distancia h entre dos argumentos consecutivos cualesquiera, es la misma a lo largo de la tabla, el polinomio de Newton en diferencias divididas puede expresarse con más sencillez. Para este propósito se introduce un nuevo parámetro s, definido en x = xo+sh, con el cual se expresa el factor productoria k- I n (x - x¡), ¡=o de la ecuación 5.30 en términos de s y h. Para esto obsérvese que x I - X o = h, x 2 - X o = 2h,... , x¡ - Xo = ih Y que restando x¡(O::;; i::;; n) en ambos miembros de x = X o + sh, se ob- tiene: x - x¡ = X o - x¡ + sh = -ih + sh = hes -i) para (O ::;; i ::;; n) Por ejemplo si i = 1, X-X I = h(s-l) si i = 2, X - x2 = hes - 2) Al sustituir cada una de las diferencias (x - x¡) con h (s - i), en la ecuación 5.29, se llega a: Pn (x) = P" (xo + sh) = f[xo]+ hsf[xo' XI ] + h2 s(s-I)f[xo' xi' x2] + h3 s(s-1)(s-2)f[xo' xi' x2' x3] + ... + h" s(s-I)(s-2) .. . (s-(n- l)f[xo' x p ' " xll ] o en forma compacta 11 k-I P (x) = L a hk I1 (s - i) 11 k=O k i=O (5.31) (5.32) Esta última ecuación puede simplificarse aún más si se introduce el operador lineal bo, co- nocido como operador lineal en diferencias hacia delante y definido sobref (x) como. bof(x) =f(x + h) - f(x) La segunda diferencia hacia delante puede obtenerse como sigue: bo (bof(x» =bo2 f(x) =bo (¡(x + h) -f(x)) = bof(x + h) - bof(x) = f (x + h + h) - f (x + h) - f (x + h) + f (x) =f(x + 2h) - 2f(x + h) + f(x)
  • 359. 344 Métodos numéricos aplicados a la ingeniería A su vez, las diferencias hacia delante de orden superior se generan como sigue: /1i f (x) = /1 (/1i-1 f (x)) Estas diferencias se conocen como diferencias finitas hacia delante. Análogamente cabe definir V como operador lineal de diferencias hacia atrás; así, la primera diferencia ha- cia atrás se expresa como: V f(x) = f(x) - f(x - h) La segunda diferencia hacia atrás queda: V2 f(x) = V(Vf(x)) = V(j(x) - f(x - h)) V2f(x) = f(x)-f(x-h)-f(x-h) +f(x-2h) V2f(x) = f(x)-2f(x-h) +f(x-2h) de tal modo que las diferencias hacia atrás de orden superior se expresan en términos ge- nerales como: Vi f(x) = V(Vi-l f (x)). Estas diferencias se conocen como diferencias finitas hacia atrás. Al aplicar /1 al primer valor funcional f [xoJ de una tabla se tiene: N (xo) =f[xlJ - f[xoJ = hf[xo'x¡], de manera que: Del mismo modo: f[x2J -2f[x¡J +f[xoJ 2 h2 por lo que: En general: (5.33) De igual manera, las diferencias divididas en función de las diferencias hacia atrás que- dan: (5.34) Consecuentemente, al sustituir f [xo' xp'" x;J, (O :s; i :s; n) en términos de diferencias fini- tas, la ecuación 5.31 queda: s (s-1) PIl (x) = PI1 (xo + sh) =f [xoJ + s/1f [xoJ + --- /12 f[xOJ + 2! 344 Métodos numéricos aplicados a la ingeniería A su vez, las diferencias hacia delante de orden superior se generan como sigue: f..i f (x) =f.. (I!:!/- ¡f (x» Estas diferencias se conocen como diferencias finitas hacia delante. Análogamente cabe definir V como operador lineal de diferencias hacia atrás; así, la primera diferencia ha- cia atrás se expresa como: V f(x) = f(x) - f(x - h) La segunda diferencia hacia atrás queda: V2 f(x) = V(Vf(x» = v(j(x) - f(x - h» V2f(x) = f(x)-f(x-h)-f(x-h) +f(x-2h) V2f(x) = f(x)-2f(x-h) +f(x -2h) de tal modo que las diferencias hacia atrás de orden superior se expresan en términos ge- nerales como: Vi f(x) =V(Vi-l f (x». Estas diferencias se conocen como diferencias finitas hacia atrás. Al aplicar f.. al primer valor funcionalf [xo] de una tabla se tiene: de manera que: Del mismo modo: por lo que: En general: N (xo) = f[x¡] - f[xo] = hf[xo'x¡], f [x2] -2f [Xl] + f [xo] 2 h2 (5.33) De igual manera, las diferencias divididas en función de las diferencias hacia atrás que- dan: (5.34) Consecuentemente, al sustituir f [xo' x p '" x;J, (O :s:; i :s:; n) en términos de diferencias fini- tas, la ecuación 5.31 queda: s (s-l) PIl (x) =PI1 (xo + sh) =f [xo] + sf..f [xo] + --- f.. 2f[xO] + 2!
  • 360. Aproximación funcional e interpolación 345 s (s-l) (s-2) A3f[ ] + ti X o + ... 3! (5.35) cabe ia ha- + s (s-l) (s-2) ... (s- (n-1) ) él '1[x o ] n! conocido como el polinomio de Newton en diferencias finitas hacia delante. Existe una expresión equivalente a la 5.35 para diferencias hacia atrás (polinomio de Newton en diferencias finitas hacia atrás), cuya obtención se motiva al final del ejemplo siguiente. La siguiente tabla proporciona las presiones de vapor en lb/plg? a diferentes temperatu- ras para el 1-3 butadieno s ge- Puntos o 1 2 3 4 5 50 24.94 60 30.11 70 36.05 80 42.84 90 50.57 100 59.30 Aproxime la función tabulada por el polinornio de Newton en diferencias hacia delante e interpole la presión a la temperatura de 64°F. Solución Primero se construye la tabla de diferencias hacia delante como sigue: Punto xi f[x¡] élf[x¡] él2f [x¡] él3j[x¡] él4j [Xi] O 50 24.94 _________ N [x o ] = 5.17 ______________ 1 60 30.11 él2j [x o ] = 0.77 ______________ élf[x¡] = 5.94 él3f [xoJ = 0.08 __________ 2 70 36.05 él2f[x,] = 0.85 él4j [xo] = 0.01 él3f [x¡] = 0.09 él2f[x2 ] = 0.94 él4j [x,] = -0.03 él3f [x2] = 0.06 élf[x2 ] = 6.79 3 80 42.84 élf[x3] = 7.73 4 90 50.57 élf[x4] = 8.73 5 100 59.30 (5.33) que- (5.34) fini- Observe que en esta información h= 10, el valor por interpolar es 64 y que el valor de s se obtiene de la expresión x = X o + sh; esto es: s= x - Xo = 64 - 50 = 1.4 h 10
  • 361. 346 Métodos numéricos aplicados a la ingeniería Si se deseara aproximar con un polinomio de primer grado, se tomarían sólo los dos primeros términos de la ecuación 5.35; o sea, p(x) =f[xo] + s L1f[xo] = 24.94 + 1.4(5.17) = 32.18 Hay que observar que realmente se está extrapolando, ya que el valor de x queda fuera del intervalo de los puntos que se usaron para formar el polinomio de aproximación. Intuitivamente se piensa que se obtendría una aproximación mejor con los puntos (1) y (2). Sin embargo, la ecuación 5.35 se desarrolló usando X o como pivote y para aplicarla con el punto (1) y (2) debe modificarse a la forma siguiente s (s - 1) P« (x) = f[xl + sh] = f[xl] + SL1f[x¡] + L1 2 f[ Xl] + ... 2! + s(s-l) ... (s-(n-1)) L1'1[x] I 1 n. (5.36) la cual usa como pivote Xl' Ycuyos primeros dos términos dan la aproximación polinomial de primer grado: x-x 64 - 60 p(x) = f [Xl] + sts f [Xl], donde ahora s = __ 1_= =0.4; h 10 al sustituir valores de la tabla se tiene: f(64) '" P (64) = 30.11 + 0.4(5.94) = 32.49 En cambio, si se deseara aproximar con un polinomio de segundo grado, se requeri- rían tres puntos y sería aconsejable tomar (O), (1) y (2) en lugar de (l ), (2) Y (3), ya que el argumento por interpolar está más al centro de los primeros. Con esta selección y la ecua- ción 5.35 queda donde: S _ x - X o _ 64 - 50 - - ---== 1.4; h 10 este valor se sustituye arriba y queda: p2(64) = 24.94 + 1.4(5.17) + 1.4 (1.4 - 1) 0.77 = 32.39 2! Si se quisiera interpolar el valor de la presión a una temperatura de 98°F, tendría que desa- rrollarse una ecuación de Newton en diferencias hacia delante, usando como pivote el pun- to (4) para un polinomio de primer grado o el punto (3) para un polinomio de segundo grado, etc. Sin embargo, esto es factible usando un solo pivote (el punto 5 en este caso), indepen- dientemente del grado del polinomio por usar, si se emplean diferencias hacia atrás. Para esto se debe desarrollar una ecuación equivalente a la 5.35, pero en diferencias hacia atrás; este desarrollo se presenta a continuación en dos pasos -el primero es un re- sultado necesario. Primer paso Obtención del polinomio de Newton en diferencias divididas hacia atrás de grado n apo- yado en el punto XII. 346 Métodos numéricos aplicados a la ingeniería Si se deseara aproximar con un polinomio de primer grado, se tomarían sólo los dos primeros términos de la ecuación 5.35; o sea, p(x) = f[xo] + s L1f[xo] = 24.94 + 1.4(5.17) = 32.18 Hay que observar que realmente se está extrapolando, ya que el valor de x queda fuera del intervalo de los puntos que se usaron para formar el polinomio de aproximación. Intuitivamente se piensa que se obtendría una aproximación mejor con los puntos (1) y (2). Sin embargo, la ecuación 5.35 se desarrolló usando X ocomo pivote y para aplicarla con el punto (1) y (2) debe modificarse a la forma siguiente s (s - 1) PI/ (x) =f[x I + sh] =f[x l ] + sL1f[x¡] + L12 f[ XI] + ... 2! s (s - 1) ... (s- (n - 1)) A 'f [ ]+ ,-,1/ X I I n. (5.36) la cual usa como pivote XI' Ycuyos primeros dos términos dan la aproximación polinomial de primer grado: X-X 64 - 60 p(x) =f[x¡] + SL1f[xl ], donde ahora s =__1_ = =OA; h 10 al sustituir valores de la tabla se tiene: f(64) '" p (64) = 30.11 + OA(5.94) = 32A9 En cambio, si se deseara aproximar con un polinomio de segundo grado, se requeri- rían tres puntos y sería aconsejable tomar (O), (1) Y(2) en lugar de (1), (2) Y(3), ya que el argumento por interpolar está más al centro de los primeros. Con esta selección y la ecua- ción 5.35 queda donde: S _ X - X o _ 64 - 50 - - - - - = 1.4; h 10 este valor se sustituye arriba y queda: p2(64) = 24.94 + 1A(5.17) + lA (lA - 1) 0.77 = 32.39 2! Si se quisiera interpolar el valor de la presión a una temperatura de 98 °F, tendlía que desa- rrollarse una ecuación de Newton en diferencias hacia delante, usando como pivote el pun- to (4) para un polinomio de primer grado o el punto (3) para un polinomio de segundo grado, etc. Sin embargo, esto es factible usando un solo pivote (el punto 5 en este caso), indepen- dientemente del grado del polinomio por usar, si se emplean diferencias hacia atrás. Para esto se debe desarrollar una ecuación equivalente a la 5.35, pero en diferencias hacia atrás; este desarrollo se presenta a continuación en dos pasos -el primero es un re- sultado necesario. Primer paso Obtención del polinomio de Newton en diferencias divididas hacia atrás de grado n apo- yado en el punto xl/.
  • 362. Aproximación funcional e interpolación 347 dos Para simplificar se inicia con n = 2 Yse asume que un polinomio de segundo grado en general tiene la forma: del P2(X) = ao + a¡(x - XII) + aix - x,.) (x - xlI_¡) donde ao' a¡ y a2 son las constantes por determinar y XII Y xlI _ 1 las abscisas de los puntos (n) y (n-l), respectivamente. Si X = XII' ao = pixl1) = f [xl1] Si X = x l1 _1' a¡ = P2 (xlI_¡) - P? (x,) = f [XII' x lI _¡] xn _ l -xn s (1) carla .36) al desarrollar algebraicamente el numerador y el denominador de a2 se llega a: mía! al sustituir estas constantes en el polinomio queda: P2 (x) = f [xl1] + (x - x,) f [xl1' xlI_¡] + (X-XII) (x-xn_¡) f [x"' xlI_1' xn_2] De lo anterior se puede inducir que, en general, para un polinomio de grado n escrito en la forma PII (x) = ao + a¡ (X-XII) + a2 (x-x,,) (X-XII_¡) + ... + all (x-x,,) (X-XII_¡)'" (x-x¡), (5.37) los coeficientes ao' al' a2, ... , a"están dados por ueri- ue el cua- ao =f[xn] al = f [Xn, XIl_1] Segundo paso Obtención del polinomio de Newton en diferencias finitas hacia atrás de grado n, apoya- do en el punto XII' Las ecuaciones' siguientes se pueden construir introduciendo el parámetro s definido ahora por la expresión x = xll + sh. X -xI! = sh x - xn_1 = xll - xlI_¡ + sh = his+ 1) x - xll_2 = xll - xll_2 + sh = h(s+2) desa- pun- do, x - Xo = xI! - Xo + sh = his+n) Al sustituir las ecuaciones anteriores y los coeficientes f [xl1] ,f [xI!' xn_¡] , ... ,f [x"' xn_l"" , xo] en la ecuación 5.37 en términos de diferencias finitas (Ec. 5.34), finalmente queda re- apo- * Recuérdese que se considera aquí que la diferencia entre dos argumentos consecutivos cualesquiera es h. Aproximación funcional e interpolación 347 Para simplificar se inicia con n =2 Yse asume que un polinomio de segundo grado en general tiene la forma: P2(X) =ao + al(x - x) + a2(x - x,,) (x - xll _ l ) donde ao' al Ya2 son las constantes por determinar y x" y xn _ 1 las abscisas de los puntos (n) y (n-1), respectivamente. Si x =xn' ao =pix,,) =f [x" ] Si x =X,,_l' al = P2 (xll _ l ) - P2 (x,) =f [x"' x ll _ l ] Xn_l -Xn S . P2 (xn_ 2) - pzCX,,) - f [ x,!, X,,_¡] (X"_2- x,,) 1 X =Xn_2' a2 = (XIl _ 2- X,,)(Xn _ 2- xll _ l ) al desarrollar algebraicamente el numerador y el denominador de a2 se llega a: al sustituir estas constantes en el polinomio queda: P2 (x) =f [XII] + (x - XII) f [xn, xlI _ l ] + (x-xl!) (x-xn_ l) f [x"' xlI_i' xlI_2] De lo anterior se puede inducir que, en general, para un polinomio de grado n escrito en la forma P" (x) = ao + al (x-x,) + a2 (x-x,,) (x-xn_ l) + ... + all (x-x,,) (X-X,,_l)·.· (X-Xl)' (5.37) los coeficientes ao' al' a2, .. . , a" están dados por ao = f[x,,] al = f [X"' XIl_ 1] Segundo paso Obtención del polinomio de Newton en diferencias finitas hacia atrás de grado n, apoya- do en el punto x". Las ecuaciones' siguientes se pueden construir introduciendo el parámetro s definido ahora por la expresión x =x" + sh. X -xll = sh x - xn_ 1 = x" - x,,_l + sh = h(s+ 1) x - xll _ 2 = xl! - xll _ 2 + sh = h(s+2) x - X o = xll - X o + sh = h(s+n) Al sustituir las ecuaciones anteriores y los coeficientes f [xll ] ,f [x"' xn_ l] ,... ,f[x"' x,._l' ... , xo] en la ecuación 5.37 en términos de diferencias finitas (Ec. 5.34), finalmente queda * Recuérdese que se cons¡dera aquí que la diferencia entre dos argumentos consecutivos cualesquiera es h.
  • 363. H'" 348 Métodos numéricos aplicados a la ingeniería s (s + 1) P" (x" + sh) =f[x,J + s V f[x,,] + 2! V 2f[xn] + ... + s (s + 1) ... (s + (n - 1)) Vil f[x ] , "n. (5.38) que es la ecuación de Newton en diferencias hacia atrás, Para realizar los cálculos puede usar Matlab o la TI-92 Plus x=[50 60 70 80 90 100J; fx=[24.94 30.11 36.05 42.84 50.57 59.30J; N=6; h=10; xint=64; for i=1:N-1 T(i,1)=fx(i+1) -fx(i); end for j=2:N-1 for i=j :N-1 T(i,j) =T(i,j-1) -T(i-1,j-1); end end T s=(xint-x(l))/h; fxint=fx(l)+s*T(l,l); fprintf('Grado 1 P(%4.0f)=%6.2fn',xint,fxint) fxint=fx (1) +s*T(l,l) +5* (s-1)/2*T(2,2); fprintf( 'Grado 2 P(%4.Of)=%6.2fn' ,xint,fxint) e5_7 () Prgm {50, 60, 70, 80, 90, 100j-+x : C1rIO {24.94, 30.11, 36.05, 42.84, 50.57, 59.30j-+y 6-+n : 10-+h : 64-+xint: newMat(n-l,n-l)-+t For i,1,n-1 y [i +1J-y [iJ-+t [i, 1J EndFor for j,2,n-1 for i,j,n-l t[i,j-1J-t[i-l,j-l]-+ t[i,jJ EndFor EndFor setMode ("Display Digits", "FIX 2") disp t: Pause (xint-x [1]) /tr+ s y[lJ+s*t[l,l] -+fxint "P("&format (xint, "Eo") &")="-+d d&format (fxint, "E?"} s" con grado 1"r+d disp d y [1] +s*t [1,1] +5* (5-1) /2*t [2,2J-+ fxint "P("&format (xint, "Eo") s ") ="-+d d&format (fxint, "tS") s " con grado 2"-+d disp d EndPrgm 348 Métodos numéricos aplicados a la ingeniería s (s + 1) PII (XII + sh) = f[xlI] + s Vf [xlI] + V 2f [x,J + ... 2! + s(s + I) ... (s + (n- l )) V"f[x ] I 11 n . que es la ecuación de Newton en diferencias hacia atrás, Para realizar los cálculos puede usar Matlab o la TI-92 Plus x = [50 60 70 80 90 100] ; fx=[24 . 94 30 . 11 36. 05 42 . 84 50 . 57 59 . 30] ; N=6; h=10; x i nt=64; for i=1 : N- 1 T (i , 1 ) =f x (i+1 ) - fx (i ); end f or j=2 : N-1 for i=j :N- 1 T (i, j ) =T (i , j - 1) - T (i-1 , j - 1 ) ; end end T s=(xint - x (l )) /h ; f xint=fx (1 ) +s* T (1 , 1) ; fprintf ( 'Grado 1 P (%4 . Of) =%6. 2fn ' , xin t , fxint ) fxint=fx (1 ) +s*T (1 , 1 ) +s* (s - l ) /Z¡'T (2 , 2) ; f printf ( 'Grado 2 P (%4 . Of) =%6. 2fn ' , xint ,fxin t) e5_7 () Prgm (50 , 60 , 70 , 80 , 90, 100} ~x : C1rIO (24 . 94 , 30 . 11 , 36 . 05 , 42 . 84 , 50 . 57, 59 . 30} ~y 6~n : 10~ h : 64~ xint : newMat (n -1 , n -1 )~ t For i , 1 , n - 1 y[i+1] - y [i] ~ t [i , l ] EndFor f or j , 2 , n-1 for i , j , n-1 t[i , j -1] - t[i -1 , j - 1] ~ t [i , j] EndFor EndFor setMode ( "Display Digi ts " , " FIX 2 ") disp t : Pause (xint-x [1]) /h~ s y[l]+s*t[l , l] ~ fxint " P( " &format (xint , " fO") &") ="~ d d&format (fxint , " f3 " ) & " con grado l "~ d disp d y[l]+s*t [l , l]+s* (s - l) /2* t [2 , 2] ~ fxint "P ("&format (xint , " fO") &") ="~ d d&format (fxint , " f3 " ) & " con grado 2"~ d disp d EndPrgm (5.38)
  • 364. Aproximación funcional e interpolación 349 Ejemplo 5.8 Interpole el valor de la presión a una temperatura de 98°F, utilizando la tabla de presio- nes de vapor del ejemplo 5.7 y el polinomio de Newton (5.38). Solución Primero se construye la tabla de diferencias hacia atrás como sigue: Punto xi f[xJ Vf[x¡] V2f[xJ V3f[xi] V4j [x¡] O 50 24.94 Vf[x,] = 5.17 60 30.11 V2j [x2]=0.77 Vf[x2]= 5.94 V3f [x3]=0.08 2 70 36.05 V2f [x3]=0.85 V4j [x4]=0.0 1 Vf[x3]=6.79 V3f [x4 ]=0.09 3 80 42.84 V2f [x4]=0.94 V4j [xs]=-O.03 Vf[x4] =7.73 V3f[xs]=0.06~ ~ 4 90 50.57 V2f[xS ]=1.00---- Vf[xs]=8.73 ~ 5 100 59.30~ Si se usa un polinomio de primer grado, se tiene de la ecuación 5.38. p(98) =f [xs] + s V f [xs] donde: x-x" 98 -100 s = --= =-0.2; h 10 y con la tabla de diferencias finitas hacia atrás p2(98) = 59.3 - 0.2(8.73) = 57.55 Si en cambio se usa un polinomio de segundo grado, se emplean los tres primeros térmi- nos de la ecuación 5.38, con lo cual la aproximación queda: s (s + 1) P2 (98) =f[xs] + s V f[xs] + V2f[xs] 2! = 59.3 - 0.2 (8.73) + -0.2 (-0.2 + 1) (1) = 57.67 2! Para realizar los cálculos puede usar Matlab o la TI-92 Plus.
  • 365. 350 Métodos numéricos aplicados a la ingeniería ~ x= [50 60 70 80 90 100J; fx=[24.94 30.11 36.05 42.84 50.57 59.30J; N=6; h=10; for i=1:N-1 T(i,1)=fx(i+1) -fx(i); end for j=2:N-1 for i=j :N-1 T(i,j)=T(i,j-1) -T(i-l,j-1); end end T Xint=98; s=(Xint-x(N))/h; px=fx(6) +s*T(5,1); fprintf(' T(%6.2f)= %6.2f In',Xint,px) px=fx (6)+s*T (5,1)+s* (s-l) /2*T (4,2) ; fprintf(' T(%6.2f)= %6.2f In' ,Xint,px) e5_8 () Prgm {50, 60, 70, 80, 90, 100}--+x {24.94, 30.11, 36.05, 42.84, 50.57, 59.30}--+y 6--+n: 10->h: newMat (n-Li ri-Lr+t: For i,1,n-1 y[i +lJ-y[iJ--+t [i, 1J EndFor For j,2,n-1 For i,j,n-1 t [i, j-1J -t [i-1, j-1J--+t [i,j J EndFor EndFor Disp t 98--+xint : (xint-x lnl ) /tr+s y [nJ +s*t [n-1, l l=y irn: Disp "y ("&format (xint, "fO") s") ="&format (yint, "f2") y [nJ +s*t [n-l, 1J +s* (s-l) /2*t [n-1 ,2J--+yint Disp ''y ("&format (xint, "Et)") s") ="&format (yint, "E?"} Si se deseara interpolar el valor de la presión a una temperatura de 82°F, tendría que usar- se la ecuación 5.38 pero apoyada en el punto n-l [punto (4) en este caso] ; esto es, s (s + 1) ... (s + (n - 1) ) + Vil f [xll _ 1 ] n! s (s + 1) 2 P" (XII _ 1 + sh) = f [Xn_1] + sV f [Xn_¡] + 2! V f [Xn_¡] + ... (5.39) 350 Métodos numéricos aplicados a la ingeniería x= [50 60 70 80 90 100J; fx=[24 . 94 30.11 36. 05 42 . 84 50.57 59 . 30J ; N=6; h=10; for i=1 : N- 1 T(i , 1)=fx(i+1) - fx(i) ; end for j=2:N- 1 for i=j : N- 1 T(i , j)=T(i , j - 1) - T(i - 1 , j-1 ); end end T Xint=98 ; s= (Xint-x(N))/h; px=fx(6) +s*T(5 , 1); fprintf (' T(%6.2f)= %6.2f In' , Xint ,px) px=fx(6) +s*T(5,1) +s* (s-l) /2*T (4, 2); fprintf(' T(%6.2f)= %6. 2f In' ,Xint,px) e5_8 () Prgm {50 , 60 , 70, 80 , 90, 100j--->x {24.94, 30 . 11 , 36 . 05 , 42 . 84, 50 . 57, 59 . 30j--->y 6--->n : 10--->h : newMat (n - 1 , n - 1) ---> t For i , 1 , n - 1 y[i +lJ - y[iJ --->t [i , 1J EndFor For j , 2 , n-1 For i,j,n-1 t [i , j - 1J - t [i - 1 , j - 1J ---> t [i , j J EndFor EndFor Disp t 98--->xint : (xint-x [nJ) /h--->s y [nJ +s*t [n-1, lJ--->yin t Disp "y ("&format (xin t , "fO") &") ="&format (yint, "f2") y [nJ +s*t [n - l, 1J +s* (s-l) /2*t [n-1 ,2J--->yint Disp ''y ("&format (xin t , " fO") &") ="&format (yint, "f2") Si se deseara interpolar el valor de la presión a una temperatura de 82 °F, tendría que usar- se la ecuación 5.38 pero apoyada en el punto n-l [punto (4) en este caso] ; esto es, s (s + 1) 2 P" (XII _ 1 + sh) = ![XIl _,] + sV! [xll _¡] + 2! V f [XII _ 1] + ... (5.39) s (s + 1) ... (s + (n - 1) ) + V"! [xII _, ] n!
  • 366. .39) Aproximación funcional e interpolación 351 NOTA: Es importante hacer notar que las tablas de los ejemplos 5.7 (diferencias hacia delante) y 5.8 (diferencias hacia atrás) presentan los mismos valores numéricos aunque los operadores y subíndices de sus argumentos no sean los mismos. Por lo anterior, el polinomio de Newton en diferencias hacia delante y su tabla correspondiente pueden usarse a fin de interpolar en puntos del final de la tabla con sólo invertir la numeración de los puntos en dicha tabla y los subíndices de los argumentos de cada columna de diferencias finitas (se ilustra enseguida en el Ejemplo 5.9). También es útil observar que los valores de la tabla utilizados en las ecuaciones 5.35, 5.36 o alguna modificación de éstas, son los de las diagonales trazadas de arriba hacia abajo (véa- se la tabla del ejemplo 5.7) y que los valores utilizados en 5.38, 5.39 o alguna modificación de éstas, son los de las diagonales trazadas de abajo hacia arriba (ver tabla del ejemplo 5.8). Se resuelve un ejemplo para ilustrar esto. Ejemplo 5.9 Con la ecuación 5.35 y la tabla de diferencias hacia delante del ejemplo 5.7, interpole la presión de vapor de 1-3 butadieno a la temperatura de 98°F, mediante un polinomio de primer y segundo grado. Solución Invertidos la numeración de los puntos en la tabla mencionada y los subíndices de los ar- gumentos de cada columna, la tabla toma el aspecto: Punto Xi f[x¡] Vf[xi] V2f[xi] V3f[Xi] V4j [X) 5 50 24.94 Vf[x4] = 5.17 4 60 30.11 V2f [x3]=0.77 Vf [x3]= 5.94 V3f [x2]=0.08 3 70 36.05 V2f [x2]=0.85 V:¡ [x ¡]=O.O1 Vf [x2]=6.79 V3f[x¡]=0.09 2 80 42.84 V2f [x¡]=0.94 V:¡ [xo]=-0.03 Vf[x¡]=7.73 V3f [xo]=0.06 1 90 50.57 V2f[xO]=1.00 Vf [xo]=8.73 O 100 59.30 Observe que todos los valores numéricos conservan su posición en la tabla. Se emplea la ecuación 5.35 con x = 98, xo = 100 Y h = 10, de donde: x-xos = --- h 98 - 100 = -0.2 10 al emplear un polinomio de primer grado se tiene: p (98) = 59.30 + (-0.2) (8.73) = 57.55 En cambio, con uno de segundo grado: (-0.2) (-0.2 + 1) P2 (98) = 59.30 + (-0.2) (8.73) + 1 = 57.63 2! Como se puede observar, son los mismos resultados que se obtuvieron en el ejemplo 5.8. En el CD encontrará el PROGRAMA 5.8 de Interpolación Numérica. Con este programa usted puede proporcionar la función como una tabla de puntos e interpolar para algún valor desea- do. Podrá también observar gráficamente los puntos dados, la función interpolante y el valor a interpolar
  • 367. 352 Métodos numérico s aplicados a la ingeniería 5.6 Estimación de errores en la aproximación En general, al aproximar una función por un polinomio de grado n, se comete un error; por ejemplo, cuando se utiliza un polinomio de primer grado, se remplaza la función verdade- ra en un intervalo con una línea recta (Fig. 5.4). En términos matemáticos, la función se podría representar exactamente como: (5.40) Donde R¡(x) es el error cometido al aproximar linealmente la funciónf(x) y p¡(x) es, por ejemplo, el polinomio de primer grado en diferencias divididas. Al despejar R¡(x) de la ecuación 5.40 y tomando como factor común (x - xo) queda: R¡(x) =f(x) -f[xo] - (x-xo)f[xo'x¡] ( f[x] - f[xo] ) = (x - xo) - f [ xo,x,] x-xo = (x- xo) (j [xo,x] - f [xÜ'x¡D al multiplicar y dividir por (x-x.) se obtiene: R,(x) = (x-xo) (x-x¡)f[x, xo' x,] dondef[x,xo'x,] es la segunda diferencia dividida respecto a los argumentos xo' x, y x. Re- sulta imposible calcular exactamentef[x, xo' x¡], ya que no se conoce laf(x) necesaria pa- ra su evaluación. Sin embargo, si se tiene otro valor de f (x), sea f (x2 ) (y si la segunda diferenciaf[x, XÜ' xl] no varía significativamente en el intervalo donde están los puntos xó' x, y x2 ), entonces R¡(x) se aproxima de la siguiente manera: R, (x) '" (x-xo) (x-x,) f[xo' x" x2] de tal modo que al sustituirlo en la ecuación original quede: f(x) --------- f(xl) --- -'. --, ,-,, : RI(x),, , , , , r r r , 'J(x), , ,,, " f(xo) " ", ', , , , , I I I I , I , , , Figura 5.4 Xo x XI X
  • 368. ;por de- n se .40) , por da: Re- apa- nda (r) ,,, Aproximación funcional e interpolación 353 Observe que el lado derecho de esta expresión es el poli nomio de segundo grado en dife- rencias divididas. Como se había intuido, esto confirma que -en general- se aproxima mejor la funciónfix) con un polinomio de grado dos que con uno de primer grado. Por otro lado, si se aproxima a funciónf(x) con un polinomio de segundo grado P2(x), se espera que el error Rix) sea en general menor. La función expresada en estos términos queda: f(x) = pix) + R2(x) =f[xo] + (x-xo)f[xo'x¡] + (x-xo) (x-x¡)f[xo' xl' x2] + R2(x) de donde Rix) puede despejarse: Rix) = f (x) - f[ Xo ] - (x - xo)f [xo' x¡] - (x - xo) (x - x¡) f[ XO'xl' x2] y como en el caso de un polinomio de primer grado, se demuestra * que el término del error para la aproximación polinomial de segundo grado es: Rix) = (x-xo) (x-x¡) (x-x2)f[xo' xl' x2] De igual modo quef[ x, XO'x¡] en el caso linealf[x, xo' x¡, x2] no se puede determinar con exactitud; sin embargo, si se tiene un punto adicional (x3,f(x3)), cabe aproximarf(x, xo, xl' x2 ] con: f[x, xo' xl' x2] ""f[xo, xI>x2' x3], que sustituida proporciona una aproximación a R2(x): Rix) "" (x-xo) (x-x¡) (x-x2)f[ xo, xI>x2, x3 ]. Si se continúa este proceso puede establecerse por inducción que: f (x) = p,,(x) + RI/(x), donde Pn (x) es el polinomio de grado n en diferencias divididas que aproxima la función tabulada, y Rn (x) es el término correspondiente del error. Esto es: P,,(x) = f [xo] + (x-xo) f [xo' x¡] + ... + (x-xo) (x-x.) ... (x-xl1_¡) f [xo"" , x/.] y o Rn (x) = [fr (x -x) 1 f[x, xo' X¡ ... , Xn] 1=0 (5.41) en dondef[ x, Xo' Xl"" , x,,] puede aproximarse con un punto adicional (x/1+1'f(x,,+¡)) así: f[x, xo, xl"'" xn] ""f[xo' xi' x2'···' X/l' xn+¡] entonces R,,(x) queda como: Rn (x) "" [;~ (x - x) 1 f [XO'Xl' x2··· , »; xl1+¡] (5.42) La ecuación f(x) = p,,(x) + RI1(x) es conocida como la fórmula fundamental de Newton en diferencias divididas. Al ana- lizar el factor productoria (producto acumulado) n I1 (x -x) ;=0 'Véaese el problema 5.24. Aproximación funcional e interpolación 353 Observe que el lado derecho de esta expresión es el polinomio de segundo grado en dife- rencias divididas. Como se había intuido, esto confirma que -en general- se aproxima mejor la funciónj(x) con un polinomio de grado dos que con uno de primer grado. Por otro lado, si se aproxima a funciónf(x) con un polinomio de segundo grado P2(x), se espera que el error R2(x) sea en general menor. La función expresada en estos términos queda: f (x) =pix) + R2(x) =f[xo] + (x-xo)f [xÜ'x l] + (X-Xo) (X-Xl) f[xo' Xi' x2] + R2(x) de donde Rix) puede despejarse: Rix) = f (x) - f[ Xo ] - (x - xo)f [xo, Xl] - (X - xo) (X - xl)f [xo' Xi' x2] y como en el caso de un polinomio de primer grado, se demuestra" que el término del error para la aproximación polinomial de segundo grado es: R2(x) = (x-xo) (X-Xl) (x-x2)f[xo' Xi' x2] De igual modo quef[ x, XÜ' XI] en el caso linealf[x, xo' XI' x2] no se puede determinar con exactitud; sin embargo, si se tiene un punto adicional (x3' f (x3)), cabe aproximarf [x, xo, xi' x2 ] con: f[x, xo' xi' x2] "" f[xo, Xl' X2' x3], que sustituida proporciona una aproximación a R2(x): Rix) "" (x-xo) (X-XI) (x-x2)./[ xo' xi' x2' x3]. Si se continúa este proceso puede establecerse por inducción que: f (x) = Pn(x) + Rn(x), donde Pn (x) es el polinomio de grado n en diferencias divididas que aproxima la función tabulada, y R" (x) es el término correspondiente del error. Esto es: PIl(x) = f [xo] + (x- xo) f [xo, xtl + ... + (x-xo) (X-X I) ... (x-xn_ l) f [xo"" , x/J y o RIl (x) =[[1 (x - x) 1f [x, Xo' Xl '" , Xn] 1=0 (5.41) en dondef[ x, xo' xi"" , xn] puede aproximarse con un punto adicional (x/1+i' f(xn+ l)) así: f[x, xo' x p "" x,,] ""f[xo' xi' x2,·.. , xn' xn+ l] entonces Rn(x) queda como: R" (x) "" [ ;~ (x - x) 1f [xo, XI' x2·.. , XII, xl1 + l ] La ecuación f(x) = PII(x) + Rn(x) (5.42) es conocida como la fórmula fundamental de Newton en diferencias divididas. Al ana- lizar el factor productoria (producto acumulado) "I1 (x -x) ;=0 • Véaese el problema 5.24.
  • 369. 354 Métodos numéricos aplicados a la ingeniería de Rn(x), se observa que para disminuido (y, por ende, disminuir el error RIl(x) ) deben usarse argumentos xi lo más cercanos posible al valor por interpolar x (regla que se había seguido por intuición y que ahora se confirma matemáticamente). También de esta produc- toria se infiere que en general en una extrapolación (x fuera del intervalo de las Xi usadas) el error es mayor que en una interpolación. Puede decirse también que si bien se espera una mejor aproximación al aumentar el grado n del polinomio P; (x), es cierto que el va- lor del factor productoria aumenta al incrementarse n, por lo que debe existir un grado óp- timo para el polinomio que se usará en el proceso de interpolación. Por último, en términos generales es imposible determinar el valor exacto de Rn(x); a lo más que se puede llegar es determinar el intervalo en que reside el error. Los ejemplos que se dan a continuación ilustran estos comentarios. Ejemplo 5.10 Suponga que tiene la tabla siguiente de la función cos x. Puntos o 1 2 3 x (grados) f(x) = cos x o 50 60 90 1.0000 0.6400 0.5000 0.0000 y desea interpolar el valor de la función en x = 10°. Solución Al interpolar linealmente con los puntos (O) y (1) queda: P (x) =f[ x¡] + (X-Xl) f[x l'x2] Al sustituir valores da pelO) = 0.9280. La interpolación con un polinomio de segundo grado y los puntos (O), (1) y (2) da: pix) = f[xo] + (x-xo)f [xo'x¡] + (x-xo)(x-x¡) f[x(Y xl' x2] Al sustituir valores resulta pilO) = 0.9845. Se interpola con un polinomio de tercer grado (usando los cuatro puntos) y queda P3(x) = f[xo] + (x-xo)f [xO'xI] + (x-xo)(x-x¡) f[xo' xl' x2] + (x-xo) (x-x¡) (x-x2)f [xo' xl' x2' x3] Al sustituir valores da P3(10) = 0.9764. El valor correcto de cos 10° hasta la cuarta cifra significativa es 0.9848, así que el error en por ciento para el primer grado es 5.77, para el segundo 0.03, y para el tercero 0.85 El grado óptimo del polinomio de aproximación para este caso particular es 2 (usan- do los puntos más cercanos al valor por interpolar: (O) (1) y (2). Si se usaran los puntos (O), (1) y (3) el error sería 1.80%, como puede verificar el lector. Ejemplo 5.11 Con la ecuación 5.41 encuentre una cota inferior del error de interpolación Rn(x) para x = 1.5 cuando f (x) = in x, n=3, xo=l, x¡=4/3, x2=5/3 Yx3 = 2. Solución La ecuación 5.41 con n = 3 queda: 354 Métodos numéricos aplicados a la ingeniería de Rn(x), se observa que para disminuirlo (y, por ende, disminuir el error R,,(x) ) deben usarse argumentos xi lo más cercanos posible al valor por interpolar x (regla que se había seguido por intuición y que ahora se confirma matemáticamente). También de esta produc- toria se infiere que en general en una extrapolación (x fuera del intervalo de las Xi usadas) el error es mayor que en una interpolación. Puede decirse también que si bien se espera una mejor aproximación al aumentar el grado n del polinomio Pn (x), es cierto que el va- lor del factor productoria aumenta al incrementarse n, por lo que debe existir un grado óp- timo para el polinomio que se usará en el proceso de interpolación. Por último, en términos generales es imposible determinar el valor exacto de Rn(x); a lo más que se puede llegar es determinar el intervalo en que reside el error. Los ejemplos que se dan a continuación ilustran estos comentarios. Ejemplo 5.10 Suponga que tiene la tabla siguiente de la función cos x. Puntos x (grados) f(x) =cos x o 1 2 3 o 50 60 90 1.0000 0.6400 0.5000 0.0000 y desea interpolar el valor de la función en x = 10°. Solución Al interpolar linealmente con los puntos (O) y (1) queda: P (x) = f[ x¡] + (X-Xl) f[xl'x21 Al sustituir valores da pelO) =0.9280. La interpolación con un polinomio de segundo grado y los puntos (O), (1) Y(2) da: pix) = f[xol + (x-xo)f [xo'x¡] + (x-xO)(x-xI ) f[xo' xI' xJ Al sustituir valores resulta pilO) = 0.9845. Se interpola con un polinomio de tercer grado (usando los cuatro puntos) y queda P3(x) = f[xol + (x-xo)f [xo,x¡l + (x-xo)(x-x¡) f[xo' xI' x21 + (x-xo) (X-XI) (x-x2)f[xO' xI' x2' x31 Al sustituir valores da pilO) = 0.9764. El valor correcto de cos 10° hasta la cuarta cifra significativa es 0.9848, así que el error en por ciento para el primer grado es 5.77, para el segundo 0.03, y para el tercero 0.85 El grado óptimo del polinomio de aproximación para este caso particular es 2 (usan- do los puntos más cercanos al valor por interpolar: (O) (1) y (2). Si se usaran los puntos (O), (1) Y(3) el error sería 1.80%, como puede verificar el lector. Ejemplo 5.11 Con la ecuación 5.41 encuentre una cota inferior del error de interpolación Rn(x) para X = 1.5 cuandof (x) = in x, n=3, xo=l, x ¡=4/3, x2=5/3 Yx3 =2. Solución La ecuación 5.41 con n =3 queda:
  • 370. gar a: rror au- tos Aproximación funcional e interpolación 355 donde el factor productoria puede evaluarse directamente como sigue 3 TI (x - x) = (1.5-1) (1.5--4/3) (1.5-5/3) (1.5-2) = 0.00694 ;=0 I En cambio, el factor f [x, xo' xi' x2' x3] es -como se ha dicho antes- imposible de deter- minar, pues no se cuenta con el valor de f (x) (necesario para su evaluación). Sin embar- go, el valor de f [x, xo' XI' x2' x3] está estrechamente relacionado con la cuarta deri vada de f (x), como lo expresa el siguiente teorema. Teorema * Seaf (x) una función de valor real, definida en [a,b] y k veces diferenciable en (a,b). Si xo' XI"" ,xkson k+1 puntos distintos en [a,b], entonces existe ~ e (a,b) tal que: f(k) (O f[xo' XI"" ,xk] = --- k! con ¡; e (min x max x.), O :s; i :s; n~ 1, I Al utilizar esta información se tiene, en general, f(II+I)(~) 11 RI1 (x) = TI (x - x¡) (n + 1)! ;=0 con ~ e (mín Xi, máx x¡), O ~ i ~ n y para n = 3 Se deriva sucesivamente f (x) cuatro veces y se tiene: f' (x) = l/x;!" (x) = -l/x2; f /" (x) = 2/x3,- fIV (x) = -6/~ Comoj'I" (x) es creciente en el intervalo de interés (1, 2) (al aumentar x en éste se incremen- tafIV (x), alcanza su valor mínimo en x = 1 y, por tanto, la cota inferior buscada está da- da por: fIV (1) 6 0.00694 -- = 0.00694 -- = -0.00174, 4! (1)44! es decir: R3 (1.5) ?: -0.00174 . Este valor indica que el error de interpolación cuando x = 1.5 es mayor o igual que -0.00174. Sin embargo, para conocer el intervalo donde reside el error, es necesario cono- cer la cota superior, que se calcula en el ejemplo siguiente. Ejemplo 5.12 Calcule la cota superior del error R3(x) del ejemplo anterior y confirme que al utilizar diferencias divididas para interpolar en x = 1.5, el error obtenido está en el intervalo cu- yos extremos son las cotas obtenidas. Use 0.40547 como valor verdadero en ln 1.5. Como se vio, la función -6/~ es creciente en (1, 2); por tanto alcanza su valor máximo en x = 2 Y la cota superior está dada por: Solución • Para su demostración véase Conte, S.D. y De Boor C. Análisis numérico. 2a . Ed., MC Graw-Hill (1967), pp. 226-227. Aproximación funcional e interpolación 355 donde el factor productoria puede evaluarse directamente como sigue 3 TI (x - x) = (1.5-1) (1.5--4/3) (1.5-5/3) (1.5-2) = 0.00694 ;=0 I En cambio, el factor f [x, xo' xl' x2' x3] es -como se ha dicho antes- imposible de deter- minar, pues no se cuenta con el valor de f (x) (necesario para su evaluación). Sin embar- go, el valor def [x, xo' xI' x2' x3] está estrechamente relacionado con la cuarta derivada de f (x), como lo expresa el siguiente teorema. Teorema * Seaf(x) una función de valor real, definida en [a,b] y k veces diferenciable en (a,b). Si xo' xI"'" xkson k+1 puntos distintos en [a,b] , entonces existe e; 10 (a,b) tal que: f (k) (e;) f[xo' xl"" ,xk] =--- k! con e; 10 (min x max x), O:s; i :s; n1, I Al utilizar esta información se tiene, en general, j(II+I)(e;) 11 Rn (x) = TI (x - x¡) (n + 1)! ;=0 con e; 10 (mÍn x máx x), O~ i ~ n1, I y para n = 3 Se deriva sucesivamentef (x) cuatro veces y se tiene: f' (x) = l/x;f" (x) = -l/x2; 1''' (x) = 2/x3;fTV (x) =-6/r ComofIV (x) es creciente en el intervalo de interés (1, 2) (al aumentar x en éste se incremen- tafTV (x), alcanza su valor mínimo en x = 1 y, por tanto, la cota inferior buscada está da- da por: fIV (1) 6 0.00694 - - = 0.00694 - - = -0.00174, 4! (1)44! es decir: R3 (1.5) ?: -0.00174 Este valor indica que el error de interpolación cuando x = 1.5 es mayor o igual que -0.00174. Sin embargo, para conocer el intervalo donde reside el error, es necesario cono- cer la cota superior, que se calcula en el ejemplo siguiente. Ejemplo 5.12 Calcule la cota superior del error R3(x) del ejemplo anterior y confirme que al utilizar diferencias divididas para interpolar en x = 1.5, el error obtenido está en el intervalo cu- yos extremos son las cotas obtenidas. Use 0.40547 como valor verdadero en [n 1.5. Solución Como se vio, la función - 6/r es creciente en (1, 2); por tanto alcanza su valor máximo en x = 2 Yla cota superior está dada por: • Para su demostración véase Conte, S.D. y De Boor C. Análisis numérico. 2a . Ed., MC Graw-Hill (1967), pp. 226-227.
  • 371. 356 Métodos numéricos aplicados a la ingeniería 0.00694 -6 = -0.00011, 24 4! es decir: R3 (1.5):S; -0.00011 Por medio de la interpolación con diferencias divididas con un polinomio de tercer grado se obtiene: P3 (1.5) = f[xo] + (1.5-xo)f [xo'x¡] + (1.5-xo)(1.5-x¡) f[xO 'x¡,x2 ] + (1.5-xo) (1.5-x) (1.5-x2 ) f[xO ,xl'x2 x3 ] = 0.40583 y el error es In 1.5 - P3 (1.5) = -0.00036 que, efectivamente, está en el intervalo [-0.00174, -0.00011] . 1", ,. 5.7 Aproximación polinominal segmentaria En alguno de los casos previos pudo pensarse en aproximar f (x) por medio de un polino- mio de grado "alto", 10 o 20. Esto pudiera ser por diversas razones: porque se quiere ma- yor exactitud; por manejar un solo polinomio que sirva para interpolar en cualquier punto del intervalo [a, b], etcétera. Sin embargo, hay serias objeciones al empleo de la aproximación de grado "alto"; la primera es que los cálculos para obtener Pn(x) son mayores, hay que verificar más cálcu- los para evaluar P; (x) y, lo peor del caso, es que los resultados son poco confiables como puede verse en el ejemplo 5.10. Si bien lo anterior es grave, lo es más que el error de interpolación aumenta en lugar de disminuir (véase Seco 5.6 y ejemplo 5.3). Para abundar un poco más en la discusión de la sección 5.6, se retornará el factor productoria de la ecuación 5.41. n Il (x - x.), ;=0 ' donde, si n es muy grande, los factores (x-x), son numerosos y, si su magnitud es mayor de 1, evidentemente su influencia será aumentar el error Rn(x). Para disminuir Rn(x), atendiendo el factor productoria exclusivamente, es menester que los factores (x-x) sean en su mayoría menores de 1 en magnitud, lo cual puede lograr- se tomando intervalos pequeños alrededor de X. Como el intervalo sobre el cual se va a aproximarf(x) generalmente se da de antemano, lo anterior se lograr dividiendo dicho in- tervalo en subintervalos suficientemente pequeños y aproximar f (x) en cada subintervalo por medio de un polinomio adecuado; por ejemplo, mediante una línea recta en cada su- bintervalo (véase Fig. 5.5) Esto da como aproximación de f (x) una línea quebrada o segmentos de líneas rectas -que se llamarán g) (x)- cuyos puntos de quiebre son xi' x2 , ... ,xn _¡. Las funcionesf(x) y g¡ (x) coinciden en xo' xl' x2, ... , x" Y el error en cualquier punto x de [xo' xll ] queda aco- tado, de acuerdo con el teorema del ejemplo 5.11 aplicado a cada subintervalo [Xi' xi +¡] con i = 0,1,2, ... ,n-l, por - f"@ R¡ (x) = If(x) -g¡ (x) 1 :s; máx 1--,-1 m~x 1(x - x) (x -xi+) 1a:S; s:S; b 2. 1 (5.43) de lín f 356 Métodos numéricos aplicados a la ingeniería -6 0.00694 = -0.00011, 24 4! es decir: R3 (1.5):S; -0.00011 Por medio de la interpolación con diferencias divididas con un polinomio de tercer grado se obtiene: P3 (1.5) = f[xo] + (1.5-xo)f [xo,x¡] + (1.5-xo)(1.5-x¡) f[xO'x¡,x2] + (1.5-xo) (1.5-xl) (1.5-x2) f[xO,xl'x2 x3] = 0.40583 y el error es In 1.5 - P3 (1.5) = -0.00036 que, efectivamente, está en el intervalo [-0.00174, -0.00011] . 5.7 Aproximación polinominal segmentaria En alguno de los casos previos pudo pensarse en aproximarf (x) por medio de un polino- mio de grado "alto", 10 o 20. Esto pudiera ser por diversas razones: porque se quiere ma- yor exactitud; por manejar un solo polinomio que sirva para interpolar en cualquier punto del intervalo [a, b], etcétera. Sin embargo, hay serias objeciones al empleo de la aproximación de grado "alto"; la primera es que los cálculos para obtener Pn(x) son mayores, hay que verificar más cálcu- los para evaluar Pn (x) y, lo peor del caso, es que los resultados son poco confiables como puede verse en el ejemplo 5.10. Si bien lo anterior es grave, lo es más que el error de interpolación aumenta en lugar de disminuir (véase Seco 5.6 y ejemplo 5.3). Para abundar un poco más en la discusión de la sección 5.6, se retomará el factor productoria de la ecuación 5.41. n 11 (x - x), i=O ' donde, si n es muy grande, los factores (x-x), son numerosos y, si su magnitud es mayor de 1, evidentemente su influencia será aumentar el error Rn(x). Para disminuir Rn(x), atendiendo el factor productoria exclusivamente, es menester que los factores (x-x) sean en su mayoría menores de 1 en magnitud, lo cual puede lograr- se tomando intervalos pequeños alrededor de X. Como el intervalo sobre el cual se va a aproximarf(x) generalmente se da de antemano, lo anterior se lograr dividiendo dicho in- tervalo en subintervalos suficientemente pequeños y aproximarf (x) en cada subintervalo por medio de un polinomio adecuado; por ejemplo, mediante una línea recta en cada su- bintervalo (véase Fig. 5.5) Esto da como aproximación de f (x) una línea quebrada o segmentos de líneas rectas -que se llamarán gl (x)- cuyos puntos de quiebre son xl' x2, ... , xn _¡. Las funcionesf(x) y g¡ (x) coinciden en xo' xl' x2, ... , xn y el error en cualquier punto x de [xo, xn ] queda aco- tado, de acuerdo con el teorema del ejemplo 5.11 aplicado a cada subintervalo [Xi' xi+¡] con i=0,1,2, ... ,n-l,por - f"@ R¡ (x) = If(x) -g¡ (x) 1:s; máx 1--,-1m~x 1(x - x) (x -xi+¡) 1a:S; s:S; b 2. 1 (5.43)
  • 372. Aproximación funcional e interpolación 357 Sif(x) fuera diferenciable dos veces en [xo' XII]' el valor máximo de I (x-x) (X-X¡+I) I para x E [Xi' X¡+! ] se dan en x = (x¡+x¡+ 1)/2, el punto medio de [x¡,xi+ 1]; de modo que máx I (x - x¡) (x - x¡+ 1) 1= máx x¡ + x¡+! - x¡) ( x¡ + x¡+! -X¡+I) 1i i 2 2 do máx 1 x¡+! -Xi X¡-X¡+I 1i 2 2 (x¡+! -x;>2 &2 máx = máx 1 1 4 i 4 or ter ar- aa m- alo su- las (x) co- on 43) Figura 5.5 Aproximación de f (x) por una línea quebrada. Figura 5.6 Aproximación de f(x) por parábolas. XIl
  • 373. 358 Métodos numéricos aplicados a la ingeniería Al sustituir en la ecuación 5.43 I I I f" (~)I ,óx2 R, (x) = f(x) -g, (x) < máx máx -,- a < ~ < b 2! 1 4 (5.44) Donde se aprecia que el error R,(x) puede reducirse tanto como se quiera, haciendo Az, pe- queño para toda i; por ejemplo, tomando un número suficientemente grande de subinter- valos en [a,b ], o bien empleando polinomios de grado dos (véase Fig. 5.6) para cada subintervalo [Xi' xi+d; de esta última manera se consiguen segmentos polinomiales de gra- do dos g2(x) cuyo término del error (5.44) correspondiente tendrá,óxp en lugar de ,óx? Es- to da una disminución del error respecto al empleo de líneas rectas. El empleo de polinomios de grado 3 en cada subintervalo [Xi' Xi+,] es de las técnicas más difundidas y se discute en detalle enseguida. APROXIMACiÓN CÚBICA SEGMENTARIA DE HERMITE Se parte del hecho que se tiene una funciónf(x) de valor real, dada en forma tabular o ana- lítica en el inetervalo [a,b] , con a = Xo < x, < x2 < ... <X" = b (5.45) Se quiere construir una función gix) con segmentos de polinomios cúbicos' p¡(x) en cada [xi' x¡+,] con i = 0, 1,2, ... ,n-l, tal que g3(x¡) =f(x¡) con i = = 0,1,2, ... ,n, de donde: p¡(x¡) =f(x¡)yP¡(x¡+,) =f(x¡+I)parai=O, 1,... ,n-l y esta última implica que: (5.46) i = 1,2, ... ,n de modo que gix) es continua en [a.b] y tiene los puntos interiores xi' x2, ... , x,,_, como puntos de quiebre o donde g3 (x) no es diferenciable en general. De acuerdo con el álgebra, se sabe que para que un polinomio cúbico quede determi- nado en forma única se requieren cuatro puntos. Hasta ahora, cada uno de los segmentos cúbicos Pi(X) tiene que pasar por (Xi' f (x)) y (xi+l' f(xi+1)), de modo que quedan dos pun- tos o condiciones que se pueden establecer para definir en forma única p¡(x). La elección de estas dos condiciones faltantes depende, por ejemplo, de la utilización que se vaya a dar a g3(x), de f(x) y del contexto donde se trabaje (de la ingeniería o mate- mático). Por ejemplo, desde el punto de vista de la ingeniería, sería deseable que g3(x) fuera di- ferenciable en los puntos interiores: xi' x2, ... , x,,_,; es decir, que g3(x) fuese suave en [a,b], en lugar de tener picos o puntos de quiebre. Esto se daría con dos condiciones como la 5.46, pero en derivadas; así i = 0,1, ... , n-l (5.47) previsto que f' (x) fuese conocida o aproximada en cada uno de los puntos XC' x]> ... ,XII. Con esto quedan cubiertas las dos condiciones faltantes . • En lo que sigue de esta sección, el subíndice indica el subintervalo, no el grado del polinomio como en otras ocasiones. 358 Métodos numéricos aplicados a la ingeniería Al sustituir en la ecuación 5.43 I I I f" (~) I Lix2 R, (x) = f(x) -g, (x) < máx m~x _,_ a < ~ < b 2! 1 4 (5.44) Donde se aprecia que el error R,(x) puede reducirse tanto como se quiera, haciendo Lix¡ pe- queño para toda i; por ejemplo, tomando un número suficientemente grande de subinter- valos en [a,b ], o bien empleando polinomios de grado dos (véase Fig. 5.6) para cada subintervalo [Xi' xi+,]; de esta última manera se consiguen segmentos polinomiales de gra- do dos g2(x) cuyo término del error (5.44) correspondiente tendrá Lix? en lugar de Lix? Es- to da una disminución del error respecto al empleo de líneas rectas. El empleo de polinomios de grado 3 en cada subintervalo [Xi' xi+,] es de las técnicas más difundidas y se discute en detalle enseguida. APROXIMACiÓN CÚBICA SEGMENTARlA DE HERMITE Se parte del hecho que se tiene una funciónf(x) de valor real, dada en forma tabular o ana- lítica en el inetervalo [a,b] , con a =Xo< x, < x2 < ... <XII =b (5.45) Se quiere construir una función g3(x) con segmentos de polinomios cúbicos' p¡(x) en cada [xi' x¡+ ,] con i = O, 1,2,... , n-l, tal que g3(x¡) =f(x¡) con i = = 0,1,2,... , n, de donde: p;Cx¡) =f (x¡)yP¡(x¡+,) = f(x¡+I)parai=O, 1,... ,n-l y esta última implica que: i = 1,2,.. . , n (5.46) de modo que gix) es continua en [a.b] y tiene los puntos interiores xi' x2, ... , x,,_, como puntos de quiebre o donde g3 (x) no es diferenciable en general. De acuerdo con el álgebra, se sabe que para que un polinomio cúbico quede determi- nado en forma única se requieren cuatro puntos. Hasta ahora, cada uno de los segmentos cúbicos p¡(x) tiene que pasar por (x¡, f (x)) y (x¡+l' f(x¡+l))' de modo que quedan dos pun- tos o condiciones que se pueden establecer para definir en forma única p¡(x). La elección de estas dos condiciones faltantes depende, por ejemplo, de la utilización que se vaya a dar a g3(x), def(x) y del contexto donde se trabaje (de la ingeniería o mate- mático). Por ejemplo, desde el punto de vista de la ingeniería, sería deseable que g3(x) fuera di- ferenciable en los puntos interiores: xi' x2,... , xn_ , ; es decir, que gix) fuese suave en [a,b], en lugar de tener picos o puntos de quiebre. Esto se daría con dos condiciones como la 5.46, pero en derivadas; así i = 0,1,... , n-l (5.47) previsto quef' (x) fuese conocida o aproximada en cada uno de los puntos xo' xl' ... , XII. Con esto quedan cubiertas las dos condiciones faltantes. • En lo que sigue de esta sección, el subíndice indica el subintervalo, no el grado del polinomio como en otras ocasiones.
  • 374. 5.44) gra- .2 Es- o de das y ana- 5.45) cada 5.46) como ernu- entos pun- ación mate- ra di- [a,b], mola Aproximación funcional e interpolación 359 De la ecuación 5.47 se infiere p' ¡-l (x) = p' ¡(x) i = 1,2, ... , n (5.48) 5.47) En este punto cabe empezar a hablar del cálculo de los polinomios p;Cx); por tanto, como paso siguiente se aproxima p¡(x), i= 1, 2, ... , n con diferencias divididas así. p¡ (x) = f (x) + f [x¡,x¡] (x-x) + f [Xi' Xi' x¡+d (x-x? (5.49) como: y al sustituir (x-x¡+l) con (x-x) + (X¡-x¡+l) y agrupar se tiene P¡ (x) = f (x) + f' (x)(x-x) +(f[x¡, Xi' x¡+ll - f[x¡, Xi' X¡+l,x+ll Ll.x) (x-x? + f[x¡, Xi' x¡+I,XI+ll (x-xy Para facilidad de manejo en su programación, la ecuación 5.50 se escribe: P·(x) = cl . + c2 . (x-x.) + c3 .(x-x.? + c4· (x-x.)3l ,1 ,1 l ,1 1 ,1 l (5.50) (5.51) con C2,i = f' (x), y f' (x¡+I)-2f[x¡,X¡+I] + C2,¡ &2 1 f' (X¡+l) - 2f[x¡, x¡+d+ f' (x) (X¡+l -x? (5.52) Ejemplo 5.13 Resuelva el problema del ejemplo 5.3 usando aproximación segmentaria, con polino- mios de grado 2, 4, 6, ... , 16 Yestime, como antes, el error máximo en forma práctica. Solución En el CD se encuentra el PROGRAMA 5.2 que realiza los cálculos solicitados Aproximación fu ncional e interpolación 359 De la ecuación 5.47 se infiere P'¡-l (x) = p'¡ (x) i = 1,2,... , n (5.48) En este punto cabe empezar a hablar del cákulo de los polinomios p¡(x); !JOf tanto, como paso siguiente se aproxima P¡(x), i = 1, 2, ... , n con diferencias divididas así. p¡ (x) = f(x) + f[ x¡,x¡] (x- x) + f[x¡, Xi' x¡+d (x-x? como: f [ ] 1, f (x¡ + tu) - f (x) =f'(x.) x¡,x¡ = 1m Ar~O tu ' y al sustituir (x-X¡+l) con (x-x) + (X¡-x¡+l) y agrupar se tiene Pi (x) = f (x) + f' (x)(x-x) +(f[x¡, Xi' X¡+l] - f[x¡, Xi' X¡+I .X+ l] tu) (x-x? + f[x¡, Xi' x¡+I.X l + l ] (x-xy Para facilidad de manejo en su programación, la ecuación 5.50 se escribe: con y P·(x) = e l . + e2 . (x-x.) + e 3 .(x-x? + e4 · (x-x.)31, ,1 , / 1 ,1 l ,l l f' (x¡+l) - 2f[x¡, x¡+¡] +f' (x) (X¡+l -x? e2,; = f' (x), f' (x¡+l) - 2f [X¡,X¡+I] + e2.¡ tu? (5.49) (5.50) (5.51) (5.52) Ejemplo 5.13 Resuelva el problema del ejemplo 5.3 usando aproximación segmentaria, con polino- mios de grado 2, 4, 6,... , 16 Yestime, como antes, el error máximo en forma práctica. Solución En el CD se encuentra el PROGRAMA 5.2 que realiza los cálculos solicitados
  • 375. 360 Métodos numéricos aplicados a la ingeniería Resultados Número de intervalos Error máximo 2 4 6 8 10 12 14 16 2.23620 2.23622 0.73979 0.04213 0.09341 0.06417 0.03299 0.01279 En contraste con la aproximación polinomial (véase el ejemplo 5.3), el error máximo de- crece conforme n crece. APROXIMACiÓN CÚBICA SEGMENTARIA DE BESSEL La aproximación cúbica de Hermite requiere el conocimiento def' (x), i = O, 1,... , n. Es- ta información, como se ha visto a lo largo del capítulo, no siempre existe, aún conocien- do f(x) analíticamente no siempre es fácil obtenerla. La aproximación cúbica segmentaria de Bessel se distingue por emplear una aproxi- mación de f' (x) por f'(x) '" f[xi_l> xi+¡], i = O, 1, ... , n (5.53) y en todo lo demás se procede tal como en la aproximación de Hermite. La expresión 5.53 requiere dos puntos adicionales a los que se tienen y son x_I y xll + i- ya que (5.54) llamadas derivadas frontera de g3(x). Una forma de obtenerlos es una nueva subdivisión de [a, b], como: podría también usarse (5.55) en caso de disponer de ellas y calcular las derivadas restantes de acuerdo con la ecuación (5.53). Otra forma sería tomar f' (xo) y f' (x,) de manera que g3(x) satisfaga las condiciones de extremo libre. (5.56) Independientemente de cómo se obtengan los puntos x_1 y xn+i' las funciones g3(x) y f(x) coinciden en los puntos de quiebre xo' xi' x2' ... , XII. Por esto gix) es continua en [a,b], y por la ecuación 5.48 también es continuamente diferenciable. Además, es posible, y se muestra adelante, determinar f ,(xo), ¡(XI)' ... ,¡(XII) de manera que la g3(x) resultante sea dos veces continuamente diferenciable. 360 Métodos numéricos aplicados a la ingeniería Resultados Número de intervalos 2 4 6 8 10 12 14 16 Error máximo 2.23620 2.23622 0.73979 0.04213 0.09341 0.06417 0.03299 0.01279 En contraste con la aproximación polinomial (véase el ejemplo 5.3), el error máximo de- crece conforme n crece. APROXIMACiÓN CÚBICA SEGMENTARlA DE BESSEL La aproximación cúbica de Hermite requiere el conocimiento def' (x), i =O, 1,... ,n. Es- ta información, como se ha visto a lo largo del capítulo, no siempre existe, aún conocien- do f(x) analíticamente no siempre es fácil obtenerla. La aproximación cúbica segmentaria de Bessel se distingue por emplear una aproxi- mación de f' (x) por f'(x) '" f[xi_J> xi+¡], i =O, 1,... , n (5.53) y en todo lo demás se procede tal como en la aproximación de Hermite. La expresión 5.53 requiere dos puntos adicionales a los que se tienen y son x_1 y xll + l' ya que llamadas derivadas frontera de g3(x), Una forma de obtenerlos es una nueva subdivisión de [a, b], como: (5.54) podría también usarse f'(xlI + I), (5.55) en caso de disponer de ellas y calcular las derivadas restantes de acuerdo con la ecuación (5.53). Otra forma sería tomar f' (xo) Yf' (x,,) de manera que gix) satisfaga las condiciones de extremo libre. (5.56) Independientemente de cómo se obtengan los puntos x_1 y x"+ l' las funciones g3(x) y f(x) coinciden en los puntos de quiebre xo' xl' x2,... , XII' Por esto gix) es continua en [a,b], y por la ecuación 5.48 también es continuamente diferenciable. Además, es posible, y se muestra adelante, determinar f ,(xo)' ¡(x¡), ... ,¡(x,,) de manera que la g3(x) resultante sea dos veces continuamente diferenciable.
  • 376. Aproximación funcional e interpolación 361 El método de determinar gix) con esta característica se conoce como aproximación cúbica de trazador, ya que la gráfica de g3(x) se aproxima a la forma que tomaría una va- rilla delgada flexible si se forzara a pasar por cada punto (xo,J(xo»' (x¡,J(x¡», ... , (x",J(x/). El requisito de que g3(x) sea continuamente diferenciable dos veces pude darse como: i = 1, 2,... , n-1 (5.57) o i = 1,2, ... , n-1, conforme la ecuación 5.51 (derivándola dos veces). Al sustituir las expresiones de la ecuación 5.52 en la última ecuación, se tiene: 2 (f [xi_i' x;l- f' (x¡_I» 6 A," + c4· I ll,l. I = fu: ,/- /- ¡-¡ i = 1, 2,... , n-1 Al continuar la sustitución y simplificar, se tiene: fu:J' (X¡_I) + 2(fu:¡_1+ fu:)!, (x) + fu:¡_d' (Xi+¡) = 3 (f[x¡_i' xJ Sx¡ + f[xi, X¡+I]fu:¡_I)' i = 1,2,... , n-1 Un sistema de n-1 ecuaciones lineales en las (n+1) incógnitas!, (xo),f' (XI),'" ,!'(xll ). Al obtenerf ,(xo) y f '(XII) de alguna manera (por ejemplo mediante las ecuaciones 5.53 o 5.55) se resuelve la 5.58 para!'(xl), !'(x2), ... ,!'(xll _¡) por alguno de los métodos vistos en el capítulo 3; no obstante, como el sistema 5.58 es tridiagonal, conviene utilizar el al- goritmo de Thomas. (5.58) Ejemplo 5.14 La siguiente tabla muestra las viscosidades del isopentano a 59°P y a diferentes presio- nes. Presión (psia) Viscosidad (micropoises) 426.690 2468 483.297 2482 497.805 2483 568.920 2498 995.610 2584 1422.300 2672 2133.450 2811 3555.750 3094 4266.900 3236 7111.500 3807
  • 377. 362 Métodos numéricos aplicados a la ingeniería Elabore un programa para aproximar el valor de la viscosidad a las presiones de 355.575, 711.150,2844.600,5689.200 Y8533.801 psia, utilizando la aproximación cúbica segmen- taria de Bessel. Solución En el CD se encuentra el PROGRAMA 5.3, el cual proporciona los siguientes resultados. Presión (psia) Viscosidad (micropoises) ~ 355.575 2453.56 711.150 2531.32 2844.600 2950.92 5689.200 3520.79 8533.801 4093.21 5.8 Aproximación polinominal con mínimos cuadrados Hasta ahora el texto se ha enfocado en encontrar un polinomio de aproximación que pase por los puntos dados en forma tabular. Sin embargo, a veces la información (dada en la tabla) tiene errores significativos; por ejemplo, cuando proviene de medidas físicas. En es- tas circunstancias no tiene sentido pasar un polinomio de aproximación por los puntos da- dos, sino sólo cerca de ellos (véase Fig. 5.7). No obstante, esto crea un problema, ya que se puede pasar un número infinito de cur- vas entre los puntos. Para determinar la mejor curva se establece un criterio que la fije y una metodología que la determine. El criterio más común consiste en pedir que la suma de las distancias calculadas entre el valor de la función que aproxima p(x) y el valor de la funciónf(x¡) dada en la tabla, sea mínima (véase Fig. 5.8); es decir, que mil.L p(x) - f (x) 1=1 111 = L d. = mínimo ;=1 1 y y = f(x) La función pasa entre los puntos o O Figura 5.7 Aproximación polinomial que pasa por entre XI x2 X x4 x5 x6 X los puntos. 3
  • 378. Aproximación funcional e interpolación 363 575, y en- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ~1I1 f(x,,) s. Figura 5.8 Ilustración de las distancias di a minimizar. Para evitar problemas de derivabilidad más adelante, se acostumbra utilizar las distancias di' elevadas al cuadrado: m m 2: [p(x)-f(xW= 2: d2 =mínimo i=1 1 I ¡=I 1pase n la es- da- En la figura 5.8 se observan los puntos tabulados, la aproximación polinomial p(x) y las distancias di entre los puntos correspondientes, cuya suma hay que minimizar. Si se utiliza (5.59)CUf- je y ade e la para aproximar la función dada por la tabla, el problema queda como el de minimizar m .2: [ao + a¡x¡ - f (x¡)F 1=1 (5.60) Hay que observar que del número infinito de polinomios que pasan entre los puntos, se se- lecciona aquél cuyos coeficientes ao Yal minimicen (5.60). En el cálculo de funciones de una variable, el lector ha aprendido que para encontrar el mínimo o máximo de una función, se deriva y se iguala con cero esa derivada. Después se resuelve la ecuación resultante para obtener los valores de la variable que pudieran mi- nimizar o maximizar la función. En el caso en estudio, donde se tiene una función por mi- nimizar de dos variables (ao Y al)' el procedimiento es derivar parcialmente con respecto a cada una de las variables e igualar a cero cada derivada, con lo cual se obtiene un siste- ma de dos ecuaciones algebraicas en las incógnitas ao Yal; o sea, o m - [2: (ao + alx¡ - f(x) )2] oao 1=1 entre (5.61) o m 2 - [2: (ao + alx¡ - f (X) ) ] oal 1=1 Se deriva dentro del signo de sumatoria x .' Figura 5.8 Ilustración de las distancias di a minimizar. Aprox imación funcional e interpolación 363 y [(x,,,) __ __ _______ __ __________ ___ __ __ _ ___ _____ __ _____ __ ____ ~I x Para evitar problemas de derivabilidad más adelante, se acostumbra utilizar las distancias di' elevadas al cuadrado: l1l 111 .2; [p(x) - f (x)]2 =L d)2 = mínimo 1=) 1=1 En la figura 5.8 se observan los puntos tabulados, la aproximación polinomial p(x) y las distancias di entre los puntos correspondientes, cuya suma hay que minimizar. Si se utiliza (5.59) para aproximar la función dada por la tabla, el problema queda como el de minimizar ti! .L [ao+ a¡xi - f(x)]2 I=¡ (5.60) Hay que observar que del número infinito de polinomios que pasan entre los puntos, se se- lecciona aquél cuyos coeficientes aoya) minimicen (5.60). En el cálculo de funciones de una variable, el lector ha aprendido que para encontrar el mínimo o máximo de una función, se deriva y se iguala con cero esa derivada. Después se resuelve la ecuación resultante para obtener los valores de la variable que pudieran mi- nimizar o maximizar la función. En el caso en estudio, donde se tiene una función por mi- nimizar de dos variables (aoya)), el procedimiento es derivar parcialmente con respecto a cada una de las variables e igualar a cero cada derivada, con lo cual se obtiene un siste- ma de dos ecuaciones algebraicas en las incógnitas ao Ya); o sea, o 111 - [L (ao+ a¡x¡ - f (x) )2] oao l=¡ o m 2 - [L (ao+ a)x¡ - f(x» ] oa¡ 1=) Se deriva dentro del signo de sumatoria 111 a m .L - [ ao+ a )x¡ - f (x) ]2 = .L 2 [ ao+ a)xi - f (x) ] 1 =O ,~ ) oao 1=) m O m L - [ao+ a¡x¡ - f(x)]2 = L 2 [ao+ a¡x¡ - f(x)] x = O i=loa¡ 1 i= ¡ 1 1 (5.61)
  • 379. 364 Métodos numéricos aplicados a la ingeniería al desarrollar las sumatorias se tiene: [ao + a1xI - f(xl)] + [ao + alx2 - f(x2)] + ... + [ao + a1xm - f(x,,)] = O [aoXl + alx1 2 - f (XI)x1] + [aoX2 + a1xl- f (x2)x2] + ... + + [aoX", + a1x,.? - f (x,) XIII] = O que simplificadas quedan: m. m m ao + al .L Xi = .L f (X) 1=1 1=1 In m 111 ao L X + al L x2 = L f(x) X i=1 1 i=1 1 i=l 1 1 El sistema se resuelve por la regla de Cramer y se tiene m 111 m 111 [L f (X) ] [L X?] - [L Xi ] [L f (X) Xi] 1=1 1=1 l=1 1=1 aO=------------n-'------m------------- mLx2-[LX]2 i=l 1 i=1 1 (5.62) que sustituidos en la ecuación 5.59 dan la aproximación polinomial de primer grado que mejor ajusta la información tabulada. Este polinomio puede usarse a fin de aproximar va- lores de la función para argumentos no conocidos en la tabla. Ejemplo 5.15 En la tabla siguiente se presentan los alargamientos de un resorte correspondientes a fuerzas de diferente magnitud que lo deforman. Puntos 2 3 4 5 Fuerza (kgf): X Longitud del resorte (m): y 6 0.225 7 0.260 o 0.120 2 0.153 3 0.170 Determine por mínimo cuadrados el mejor polinomio de primer grado (recta) que repre- sente la función dada. Solución Para facilitar los cálculos y evitar errores en los mismos, primero se construye la siguien- te tabla. Puntos Fuerza r, Longitud y, x2 x;y¡1 1 O 0.120 O 0.000 2 2 0.153 4 0.306 3 3 0.170 9 0.510 4 6 0.225 36 1.350 5 7 0.260 49 1.820 LXi = 18 LYi= 0.928 LX?= 98 L xiYi = 3.986
  • 380. Aproximación funcional e interpolación 365 Los valores de las sumatorias de la última fila se sustituyen en el sistema de ecuaciones 5.62 y se obtiene: ao = 0.11564 y al = 0.019434, de donde p (x) = 0.11564 + 0.019434 x. Los cálculos pueden realizarse con Matlab o con la TI-92 Plus. format long x=[O 2 3 6 7}; y=[0.120 0.153 0.170 0.225 0.260}; a=polyfit (x,y,l) fprint ('aO=%8. 5f a1=%9.6fn' , a (2) ,a (1) ) e5_15 () Prgm {O,2, 3, 6, 7}->1x : 5->n {.12, .153, .17, .225, .26}-> 1y LinReg lx, 1Y ShowStat lx [1}- .1* (max(lx) -min (lx)) -> xmin lx [n} +.1* (max(lx) -min (lx) ) -> xmax min (ly) -.1* (max(ly) -min (ly)) ->ymin max (ly) +.1* (max(ly) i +yme« regeq(x)->y1 (x) NewPlot 1,1,lx,ly setMode("Split 1 App","Graph") Pause setMode ("Split 1 App", "Hotne" EndPrgm Este programa genera las dos pantallas siguientes en la TI-92 Plus ~1~IAl2~ ,,~ '"~ ~ r~~ uolSTAT YAAS y=a . x-b a =.1119434 b =, 115639 corr =.993737 R2 =,987513 -e5-15( (Entar -OK ) ~ eS-ISO ~'1EnWM PiAD AF'pfi¡m: Fune 1l~:(I o o f¡ o f1P f' F;D:~r'1En~ur'1 . , El grado del polinornio no tiene relación con el número de puntos usados y debe seleccio- narse de antemano con base en consideraciones teóricas que apoyan el fenómeno estudia- do, el diagrama de dispersión (puntos graficados en el plano x-y) o ambos. El hecho de tener la mejor recta que aproxima la información, no significa que la infor- mación esté bien aproximada; quizá convenga aproximarla con una parábola o una cúbica.
  • 381. ~.~~~-------------------------~------ 366 Métodos numéricos aplicados a la ingeniería Para encontrar el polinomio de segundo grado P2(x) = ao + alx + a2x2 que mejor apro- xime la tabla, se minimiza (5.63) donde los parámetros ao' al y a2 se obtienen al resolver el sistema de ecuaciones lineales que resulta de derivar parcialmente e igualar a cero la función por minimizar con respec- to a cada uno. Dicho sistema queda: m m m m ao+ al L x·+ a2 L x2 = L f(x') i=l 1 i=l 1 i=l I m m m In ao L x·+ al L x2 + al L x3 = L f(x')x. i=l 1 i=l 1 i=l 1 i=l 1 1 (5.64) In m m m aO L x.2+al L x3+a2 L X4 = Lf(x.)x2, i=l 1 i=1 1 i=l 1 i=l 1 1 Cuya solución puede obtenerse por alguno de los métodos vistos en el capítulo 3. IEjemplo~~1;J El calor específico Cp (cal/k gmol) del Mn304 varía con la temperatura de acuerdo con la siguiente tabla. Punto 1 2 3 4 5 6 T (K) 280 -: Cp (cal/k gmol) 32.7 650 45.4 1000 52.15 1200 53.7 1500 52.9 1700 50.3 Aproxime esta información con un polinomio por el método de mínimos cuadrados. Solución El calor específico aumenta con la temperatura hasta el valor tabulado de 1200 K, para dis- minuir posteriormente en valores más altos de temperatura. Esto sugiere utilizar un poli- nomio con curvatura en vez de una recta, por ejemplo, uno de segundo grado, que es el más simple. Para facilitar el cálculo de los coeficientes del sistema de ecuaciones 5.64, se constru- ye la siguiente tabla. Puntos T Cp X.2 x3 X.4 Y~i Y~?l l l Xi Yi 280 32.7 0.78 x 105 0.022 X 109 0.062 X 1O11 9156 2.56 x 106 2 650 45.4 0.42 x 106 0.275 X 109 1.785 X 1O11 29510 19.18 x 106 3 1000 52.15 1.00 x 106 1.000 X 109 1.000 X 1012 52150 52.15 x 106 4 1200 53.7 1.44 x 106 1.728 X 109 2.074 X 1012 64440 77.33 x 106 5 1500 52.9 2.25 x 106 3.375 X 109 5.063 X 1012 79350 119.03 x 106 6 1700 50.3 2.89 x 106 4.900 X 109 8.350 X 1012 85510 145.37 x 106 ¿Totales 6330 287.15 8.08 X 106 11.3 X 109 166.7 X 1O11 320116 415.62 X 106
  • 382. apro- (5.63) neales espec- (5.64) con 6 X 106 8 X 106 5 X 106 3 X 106 3 X 106 7 X 106 2 X 106 Aproximación funcional e interpolación 367 Los coeficientes se sustituyen en el sistema de ecuaciones 5.64 y se obtiene: 6 ao + 6330 a] + 8.08 X 106 a2 = 287.15 6330 ao + 8.08 X 106 a] + 11.30 X 109 a2 = 320116 8.08 X 106 ao+ 11.30 X 109 al + 166.70 X lO]] a2 = 415.62 X 106 cuya solución por el método de eliminación Gaussiana arroja ao = 19.29544, a] = 0.053728, a2 = -2.08787 X 10-5, que forma la aproximación polinornial siguiente: Cp(T) "" P2 (T) = 19.29544 + 0.053728 T - 2.08787 X 10-5 T2 Los valores de las sumas no se escribieron con todas sus cifras significativas, pero el po- linornio de regresión se calculó usando todas las cifras que conserva la computadora. Los cálculos pueden realizarse con Matlab o con la TI-92 Plus. format long T=[2BO 650 1000 1200 1500 1700J; cp=[32.7 45.4 52.15 53.7 52.9 50.3J; a=polyfit(T,Cp,2); fprintf( 'aO=%B.5f al=%9.6f a2=%9. 6fn',a (3),a (2),a (1)) Tint=BOO; cpint=e (3) +a (2)*Tint+a (1) *Tint '2; fprintf (' Cp (%4. Of) =%6. 1fn' , Tint, Cpint) Otra forma, usando las ecuaciones normales para la regresión: T=[2BO 650 1000 1200 1500 1700J; Cp=[32.7 45.4 52.15 53.7 52.9 50.3J; A=[length(T) sum(T) sum(T.~2); ... sum(T) sum(T.~2) sum(T.'3); ... sum(T. ~2)sum(T. ~3)sum(T. ~4)J b=[sum(CP); sum(CP.*T); sum(Cp.*T.~2)] a=Ab for i=l:length(a) aa (i)=a (length (a) +l-i); end polyval (aa,BOO) Aproximación funcional e interpolación 367 Los coeficientes se sustituyen en el sistema de ecuaciones 5.64 y se obtiene: 6 ao + 6330 al + 8.08 X 106 a2 = 287.15 6330 ao+ 8.08 X 106 a l + 11.30 X 109 a2 = 320116 8.08 X 106 ao+ 11.30 X 109 a l + 166.70 X 1011 a2 =415.62 X 106 cuya solución por el método de eliminación Gaussiana arroja ao = 19.29544, al =0.053728, a2 =-2.08787 X 10-5 , que forma la aproximación polinomial siguiente: Cp(T) "" P2 (T) = 19.29544 + 0.053728 T - 2.08787 X 10-5 T2 Los valores de las sumas no se escribieron con todas sus cifras significativas, pero el po- linomio de regresión se calculó usando todas las cifras que conserva la computadora. Los cálculos pueden realizarse con Matlab o con la TI-92 Plus. format long T=[280 650 1000 1200 1500 1700]; cp=[32.7 45.4 52.15 53.7 52.9 50.3]; a=polyfit(T, Cp,2); fprintf( 'aO=%8.5f al=%9.6f a2=%9. 6fn',a (3),a (2),a (1)) Tint=800 ; cpint=a (3) +a (2) *Tint+a (1) *Tint '2; fprintf(' Cp(%4 . 0f)=%6.1fn', Tint ,Cpint) Otra forma, usando las ecuaciones normales para la regresión: T=[280 650 1000 1200 1500 1700]; Cp=[32.7 45.4 52.15 53.7 52.9 50.3J; A=[length(T) sum(T) sum(T.'2);... sum (T) sum(T. '2) sum(T.'3);... sum(T. '2) sum(T. -3) sum(T. -4)] b=[sum(CP); sum(CP.*T); sum(Cp .*T. -2)] a=Ab for i=l : length (a) aa (i) =a (length (a) +l - i) ; end polyval (aa,BOO)
  • 383. 368 Métodos numéricos aplicados a la ingeniería e5_16 () Prgm Define minimos(lx,ly,np,ng)=Prgm riq+lr+nec t Ztnec=lr+rm : newList (rmr+s t s+es For i,i,np Ir+x»: For j,l,nn If j~ec ss [j ]+xxi'iy[i]-+ss [j] xx"'ix[i]-+xx : s [j J+xx-+s [j] EndFor EndFor newMat (nec,nec) -+a newMat (nee, 1)+b np+e [l,lJ For i,l,nee For j,l,nee If not(i=l and j=l) s [j-2+iJ-+a [i,j J Endfor ss[iJ-+b[i,l] EndFor EndPrgm {280, 650,1000,1200,1500,1700}-+ Lx (32. 7,45.4,52.15,53. 7,52.9,50.3)-+ly : 6-+np: 2-+ng: CirIO minimos(lx,iy,np,ng) : simuit(a,b)-+e: O-+p: DeiVarx For i,1,ng+1 Disp "x ("&string (i) &") ="&format (e [i, 1J , "e6") p+e [i, 1J*x (i-1)-+p EndFor Disp p : Pause : FnOff ix[lJ-.1* (mex-Lx) -min (Lx) r +xmin ix[npJ+.1* (max(lx) -rain-Lx) ) -+xmax min (Ly) -.1* (max (Ly) -min (Ly) ),-+ymin max (ly) +.1* (max(Ly ) -min (iy)) -+ymax 2-+xres: O-+ysei :NewPiot 1,1, Lx , Ly : DrawFune p: FnOn: Pause setMode("Spiit 1 App","Home") EndPrgm Pal ~~CleanupO xl1.) =19.29544EO xI2.) =53.72770E~3 xI3.) =-20.87873E-6 -2.08787346697E-5·x2 + .053727701612·x + 1 PA PA Con este programa se otbienen los siguientes resultados: t'1En~U~'1 FmKO/30 FUtK PA. PA: .. , NOTA: Muchas de las calculadoras de mano cuentan con un programa interno para obtener esta aproximación; por otro lado, puede usarse un pizarrón electrónico para los cálculos (sumatorias, solución de ecuaciones, etcétera). PA~ 368 Métodos numéricos aplicados a la ingeniería e5_16() Prgm Define minimos (lx,ly,np,ng) =Prgm ng+1-+nee:2*nee-1-+nn : newList (nn)-+s:s-+ss For i,l , np l-+xx For j , l , nn If j9Jee ss [jJ+xxi'ly[iJ -+ss [j J xx"'lx[iJ -+xx : s[jJ+xx->s[jJ EndFor EndFor newMat (nee, nee)-+a For i,l,nee For j,l,nee If not(i=l and j=l) s [j - 2+iJ -+a [i , j J Endfor ss[iJ-+b[i,lJ EndFor EndPrgm newMa t (nee,l)-+b {280 , 650 , 1000,1200 , 1500, 1700}-+lx np-+a [l ,lJ (32. 7, 45.4 ,52. 15,53. 7, 52.9 , 50.3) -+ly : 6-+np : 2-+ng: ClrIO minimos(lx, ly,np , ng) : simult(a , b )-+ e : O-+p : DelVar x For i , 1 ,ng+1 Disp "x ("&string (i) &") ="&format (e [i , 1] , " e6") p+e [i, l]*x (i-1)-+p EndFor Disp p : Pause : FnOff lx[lJ-.1* (max-lx) - min (lx) )-+xmin lx[np]+ . l* (max (lx) -min-lx)) -+xmax min (ly) - .1* (max (ly) -min (ly) ),:-+ymin max (ly) +.1* (max (ly) - min (ly)) -+ymax 2-+xres: O-+ysel : NewPlot 1 , 1 , lx, 1y: DrawFune p : FnOn : Pause setMode(" Split 1 App","Home") EndPrgm Con este programa se otbienen los siguientes resultados: ~~cleanuPIJ xl1 . ) =19 .29544EO xI2 . ) =53 . 72770E ~ 3 xI3 . ) =-20 . 87873E- 6 - 2. 08787346697E- 5·x2 + . 053727701612 ·x + 1 FmK O/30 1if.llfS~ FUtK NOTA: Muchas de las calculadoras de mano cuentan con un programa interno para obtener esta aproximación; por otro lado, puede usarse un pizarrón electrónico para los cálculos (sumatorias, solución de ecuaciones, etcétera).
  • 384. Aproximación funcional e interpolación 369 I , Ejemplo 5.17 . Solución Use aproximación polinomial de segundo grado obtenida en el ejemplo anterior para aproximar el calor específico del Mn304 a una temperatura de 800 K. Con la sustitución de T = 800 K en el polinomio de aproximación se tiene: Cp (800) '" P2(800) = 19.29544 + 0.053728(800) - 2.08787 X lO-s (800)2. = 48.9 cal/K gmol. En caso de querer aproximar una función dada en forma tabular con un polinomio de gra- do más alto, n por ejemplo, el procedimiento es el mismo; esto es, minimizar la función In i~l [ao + a¡x¡ + a2x? + ... + «»: -f(x)] 2, lo cual se obtiene derivándola parcialmente con respecto a cada coeficiente aj , (O < j < n) e igualando a cero cada una de estas derivadas. Con esto se llega al sistema lineal mao + a¡ Lx + a2 Lx2 + + «: Lxn = Ly ao Lx + al Lx2 + a2 Lx3 + + an L xn+¡ = L xy ao LX2 + al Lx3 + a2Lr + + an L xn+2 = L x2y donde se han omitido, los subíndices i, de x y y, así como los límites de las sumatorias que van de 1 hasta m para simplificar su escritura. Aproximación con mfnimos cuadrados Para obtener los N+ 1 coeficientes del polinomio óptimo de grado N que pasa entre M parejas de puntos, proporcionar los DATOS: El grado del polinornio de aproximación N, el número de parejas de valores (X(I), FX(I), 1 = 1,2, ... , M). RESULTADOS: Los coeficientes A(O), A(l), ... , A(N) del polinomio de aproximación. PASO l. Hacer J = O. PASO 2. Mientras J:::; (2*N-1), repetir los pasos 3 aS. PASO 3. Si J :::;N Hacer SS(J) = O. De otro modo continuar. PASO 4. Hacer S(J) = O. PASO 5. Hacer J = J + 1. PASO 6. Hacer I = 1. PASO 7. Mientras 1:::;M, repetir los pasos 8 a 15. PASO 8. Hacer XX = 1. PASO 9. Hacer J = O. PASO 10. Mientras J :::;(2*N-1), repetir los pasos 11 a 14. PASO 11. Si J :::;N hacer SS(J) = SS(J) + XX*FX(I). De otro modo continuar. PASO 12. Hacer XX = XX*X(I). PASO 13. Hacer S(J) = S(J) + XX. PASO 14. Hacer J = J + 1. PASO 15. Hacer 1 = 1 +1. PASO 16. Hacer B (0,0) = M.
  • 385. 370 Métodos numéricos aplicados a la ingeniería PASO 17. Hacer I = O. PASO 18. Mientras I:S; N, repetir los pasos 19 a 24. PASO 19. Hacer J = O. PASO 20. Mientras J :s;N, repetir los pasos 21 y 22. PASO 21. Si l,t OYJ ,t O. Hacer B(I,1) = S(1-1+1). PASO 22. Hacer J = J + l. PASO 23. Hacer B(I,N+l) = SS(I). PASO 24. Hacer 1 = 1 + 1. PASO 25. Resolver el sistema de ecuaciones lineales B a = ss de orden N+ 1 con alguno de los algoritmos del capítulo 3. PASO 26. IMPRIMIR A(O), A(1), ... ,A(N) YTERMINAR. I En el CD encontrará el PROGRAMA 5.9 de Regresión. Con este programa usted puede pro- porcionar la función como una tabla de puntos, aproximar con el método de mínimos cua- drados utilizando un polinomio de grado seleccionado. Podrá además observar gráficamente los puntos dados, el polinomio de ajuste y el valor a interpolar. 5.9 Aproximación multilineal con mínimos cuadrados Con frecuencia se tienen funciones de más de una variable; esto es, f (u, v,z). Si se sospe- cha una funcionalidad lineal en las distintas variables; es decir, si se piensa que la función y = ao + a¡u + a2v + a3z Puede ajustar los datos de la tabla siguiente: Puntos u v Z y 1 u¡ v¡ z¡ f(ul' vI' z.) 2 u2 v2 Z2 f (u2' v2' Z2) 3 u3 v3 Z3 f (u3, v3' Z3) m Vm. Se puede aplicar el método de los mínimos cuadrados para determinar los coeficientes ao, al' a2 y a3 que mejor aproximen la función de varias variables tabulada. El procedimien- to es análogo al descrito anteriormente y consiste en minimizar la función. In .L [(ao + a[u¡ + a2v¡ + a3z¡)-y¡]2 <=[ que derivada parcialmente con respecto de cada coeficiente por determinar: ao, al' a2, a3 e igualada a cero cada una, queda a m m L [(ao + a,u. + a2v. + a3z.) - y]2 =2 L (ao + a,u. + a2v¡ + a3z· - y.) 1 = O a a o i=1 I 1 , , . 1=1 1 1 1 a m m L [(ao + a,u. + a2v. + a3z.) - y]2 =2 L (ao + a,u. + a2v. + a3z - y.) u, = Oi=1 /. 1 I I 1=1 1 I 1 1 1 m m L [(ao + aju. + a2v. + a3z.) - y]2 =2 L (ao + aju. + a2v. + a3z - y.) V = O;=1 I l 1 1 i=1 1 I 1 1 l E
  • 386. y = ao + a lu + a2 v a los datos de dicha tabla. ospe- Agua ( %) Cal ( % ) Puzol ana ( % ) nción y u v 27.5 2.0 18.0 . 28.0 3.5 16.5 28.8 4.5 10.5 29.1 2.5 2.5 30.0 8.5 9.0 31.0 10.5 4.5 32.0 13.5 1.5 tilo 3. Aproximación funcional e interpolación 371 ecuaciones que arregladas generan el sistema algebraico lineal siguiente: m ao + al L u + a2 L v + a3 L z ao L u + al L u2 + a2 L uv + a3 L u: ao L v + al L vu + a2 L v2 + a3 L vz ao L z + al L zu + a2 L zv + a3 L Z2 = Ly = Luy = Lvy = Lzy (5.65) en las incógnitas ao' al' a2 y a3. Para simplificar la escritura se han omitido los índices i, de u, v, y Z y los límites de las sumatorias, que van de 1 hasta m. pro- cua- ente Ejemplo 5.18 A partir de un estudio experimental acerca de la estabilización de arcilla muy plástica, se observó que el contenido de agua para moldeo con densidad óptima dependía lineal- mente de los porcentajes de cal y puzolana mezclados con la arcilla. Se tuvieron así los resultados que se dan abajo. Ajuste una ecuación de la forma: Solución El sistema por resolver es una modificación del sistema de ecuaciones 5.65 para una fun- ción y de dos variables u y v les ao' nao + al Lu + a2 Lv = Ly en- ao L u + al L u2 + a2 L uv = Luy ao L v + al L vu + a2 L v2 = Lvy Con el objeto de facilitar el cálculo del sistema anterior se construye la siguiente tabla. a2, a3 Ui Vi Yi u.2 UiVi v.2 «s. V)iz , 1 2.0 18.0 27.5 4.00 36.00 324.00 55.00 495.00 O 2 3.5 16.5 28.0 12.25 57.75 272.25 98.00 462.00 3 4.5 10.5 28.8 20.25 47.25 110.25 129.60 302.40 O 4 2.5 2.5 29.1 6.25 6.25 6.25 72.75 72.75 5 8.5 9.0 30.0 72.25 76.50 81.00 255.00 270.00 O 6 10.5 4.5 31.0 110.25 47.25 20.25 325.50 139.50 7 13.5 1.5 32.0 182.25 20.25 2.25 432.00 48.00 O L Totales 45.0 62.5 206.4 407.5 291.25 816.25 1367.85 1789.65
  • 387. 372 Métodos numéricos aplicados a la ingeniería Los coeficientes se sustituyen en el sistema de ecuaciones y al aplicar alguno de los mé- todos del capítulo 3, se obtiene: ao = 28.69, al = 0.2569, a2 = -0.09607 al sustituir estos valores se tiene: y = 28.69 + 0.2569 u - 0.09607 v Los cálculos pueden realizarse con Matlab o con la TI-92 Plus u=[2'; 3.5; 4.5; 2.5; 8.5; 10.5; 13.5]; v=[18; 16.5; 10.5; 2.5; 9; 4.5; 1.5]; y=[27.5; 28; 28.8; 29.1; 30; 31; 32]; A=[size(u,l) sum(u) sum(v) ; ... sum (u) sum(u. A2) sum(u. *v) ; ... sum (v) sum(v. *u) sum (v. A2)] ; b=[sum (y) ;sum (u. *y) ;sum (v. *y)] a=Ab pl Ej e5_18 () Prgm {2,3. 5, 4.5,2.5,8.5,10.5,13. 5} ....•u {18,16. 5,10.5,2. 5, 9, 4.5,1. 5} ....•v (27.5,28,28.8,29.1,30,31,32} ....•y @Nota: Las siguientes dos líneas son una sola instruccion [dim(u) ,sum(u) ,sum(v) ;sum(u) ,sum(u. A2) ,sum(u.*v); sum (v) , sum (v. *u) , sum (v. A2) J ....•a [sum(y) ;sum(y.*u) ;sum(y.*u) ] ....•b simult (a,b) ....•c Disp c EndPrgm Al graficar en el espacio la ecuación y = 28.69 + 0.2569 u - 0.09607 v, resulta un plano que pasa por entre los puntos experimentales, quedando algunos de ellos abajo y otros arri- ba y los demás en la superficie, pero la suma de los cuadrados de las distancias de estos puntos a la superficie es mínima, respecto a cualquier otro plano que pase entre dichos puntos (ver Fig. 5.9). 372 Métodos numéricos aplicados a la ingeniería Los coeficientes se sustituyen en el sistema de ecuaciones y al aplicar alguno de los mé- todos del capítulo 3, se obtiene: ao = 28.69, al = 0.2569, a2 = -0.09607 al sustituir estos valores se tiene: y = 28.69 + 0.2569 u - 0.09607 v Los cálculos pueden realizarse con Matlab o con la TI-92 Plus u=[2"; 3.5; 4.5; 2 . 5; 8. 5; 10.5; 13.5]; v=[18 ; 16.5; 10.5; 2 . 5; 9; 4. 5; 1.5]; y=[27.5; 28; 28 . 8; 29. 1; 30; 31; 32] ; A=[size(u,l) sum(u) sum (v) ; ... sum (u) sum (u . A2) s um (u. *v) ; ... sum (v) sum (v. *u) sum (v. A2)] ; b=[sum (y) ;sum (u. *y) ; sum (v. *y)] a=Ab e5_18 () Prgm {2, 3. 5, 4.5, 2 . 5, 8 . 5, 10 . 5, 13. 5} -> u {18, 16. 5, 10. 5, 2 . 5, 9, 4. 5, 1 . 5}->v (27 . 5 , 28 , 28 . 8 , 29 . 1 , 30 , 31 , 32}->y @Nota : Las siguientes dos líneas son una sola instruccion [dim(u) , sum(u) , sum(v) ; sum(u) , sum(u . A2) , sum(u .*v); sum(v) , sum(v.*u) , sum(v. A2) ] ->a [sum (y) ;sum(y .*u) ; sum(y.*u) ] ->b simult (a , b )-> c Disp e EndPrgm Al graficar en el espacio la ecuación y = 28.69 + 0.2569 u - 0.09607 v, resulta un plano que pasa por entre los puntos experimentales, quedando algunos de ellos abajo y otros arri- ba y los demás en la superficie, pero la suma de los cuadrados de las distancias de estos puntos a la supetiicie es minima, respecto a cualquier otro plano que pase entre dichos puntos (ver Fig. 5.9).
  • 388. los mé- y 33 (agua %) 32 31 30 29 28 Figura 5.9 Gráfica del plano y = 28.69 + 0.2569 u -0.09607vy algunos datos experimentales. 27 20 Ejercicios Aproximación funcional e interpolación 373 --,1 1 - -t- I I ..•. -- _-1 1 1 - -1- 1 1 ...,- - - 1 '"_ ....1'"..... I I I 1 ' ••• -.......... I ........•...... I •....... I ..... I 1..... I ~..... .....,..... I - 1......... I 1..... I I I I r-, I I .....1..... 'l..... , •.............I - -"...!~':":':":'>---~'--7.o-?'~/-=tz: ~ 1 '1 1 1 '1 1 1 , J 1 -- ---- ...•.:1 1 , ,1 -~1 1 _- _ -1- 1 1 _- _r " 1 I _ - .... - -t 1 1 .-_ ..•. - - I ~ .L~~L:;"..L/"'7~?"-", 1 ',1 .L~~L:"..L77~~-~ 1', 1 ',1 ~~~~~~~~~~, :t, 1 1 ...,- 1 1 15 15 10 5 ti (cal %) o o 5.1 A continuación se presentan las presiones de vapor del cloruro de magnesia. Puntos 4 5o 6 72 3 P (mmHg) 10 20 60 100 200 400 76040 TCC) 1142930 1316 1223 1418988 1050 1088 Solución Calcule la presión de vapor correspondiente a T = 1000 De. Como la información no está regularmente espaciada en los argumentos (T), pueden usar- se diferencias divididas o polinornios de Lagrange para la interpolación. (Se sugiere ver los PROGRAMAS 5.4 y 5.5 del CD). Con los polinornios de Lagrange de segundo grado se tiene: () -f( ) (x-xl)(x-x2) f() (x-xO)(x-x2) P2 X - Xo + XI (xo - XI) (xo - x2) (XI - xo) (XI - x2) +f(x 2 ) (x - xo) (x - XI) (x2 - xo) (x2 - XI) Al tomar las presiones como valores de la funciónf(x), las temperaturas como los argu- mentos x, seleccionar los puntos (O), (1) Y (2), Y sustituir los valores, se obtiene: n plano os arri- e estos dichos (1000 - 988) (1000 - 1050) (1000 - 930) (1000 - 1050) P2 (1000) = 10 (930 _ 988) (930 _ 1050) + 20 (988 - 930) (988 - 1050) + (1000 - 930) (1000 - 988) + 40 = 23.12 mmHg '" 23 mmHg (1050 - 930) (1050 - 988) Figura 5.9 Gráfica del plano y =28.69 + 0.2569 u -0.09607vy algunos datos experimentales. Ejercicios y 33 (agua %) 32 31 30 29 28 27 20 .... -,-1 I .... _.- _1 1 .... -1- .... -................ I Aproximación funcional e interpolación 373 '.... _.- - 1 1 ' .... --_ f 1 I .... - .... -"1 1 .-_ .... "" - I .~Á4077,":l' , 1 , ,1 -~ " , 1 , , ). , o O , 1 '1 ~, , , 1 '1 1 , , 1 ' J 1, , , 1 , ,1 1 , ,1 15 10 u (cal %) 5.1 A continuación se presentan las presiones de vapor del cloruro de magnesio. Solución Puntos o 2 3 4 5 6 7 P (mmHg) 10 20 40 60 100 200 400 760 TCC) 930 988 1050 1088 1142 1316 12231418 Calcule la presión de vapor correspondiente a T = 1000 oc. Como la información no está regularmente espaciada en los argumentos (T), pueden usar- se diferencias divididas o polinomios de Lagrange para la interpolación. (Se sugiere ver los PROGRAMAS 5.4 y 5.5 del CD). Con los polinomios de Lagrange de segundo grado se tiene: ( ) - f( ) (X-XI) (x-x2) f() (x-xo) (x-x2) P2 X - Xo + XI (xo- X I) (xo- x2) (XI - xo) (XI - x2) + f(x 2 ) (x - xo) (x - X I) (x2 - xo) (x2 - XI) Al tomar las presiones como valores de la función f (x), las temperaturas como los argu- mentos x, seleccionar los puntos (O), (1) Y(2), Ysustituir los valores, se obtiene: (1000 - 988) (1000 - 1050) (1000 - 930) (1000 - 1050) P2 (1000) = 10 (930 _ 988) (930 _ 1050) + 20 (988 _ 930) (988 - 1050) + (1000 - 930) (1000 - 988) + 40 = 23.12 mmHg '" 23 mmHg (lOSO - 930) (lOSO - 988)
  • 389. <> 374 Métodos numéricos aplicados a la ingeniería 5.2 Dada la tabla Puntos O 1 2 3 4 s, 1.00 1.35 1.70 1.90 3.00 f(x) 0.00000 0.30010 0.53063 0.64185 1.09861 Construya una tabla de diferencias divididas para aproximar f (x) en x = 1.50; utilice un polinomio de Newton de segundo grado. Solución A continuación se da la tabla de diferencias divididas. Diferencias divididas Puntos f(x) Primeras Segundas Terceras Cuartas o 1.00 0.00000 0.85743 1 1.35 0.3001O~ -0.28396 0.65866~ 0.10832 2 1.70 0.53063 -0.18647~ -0.03049 0.55610 -0.04735 3 1.90 0.64185 -0.10835 0.41524 4 3.00 1.09861 Se pueden seleccionar los puntos (O), (1) Y (2) para el polinornio de interpolación o bien (1), (2) Y (3). Se escoge el segundo conjunto de puntos, ya que están más cerca de 1.5 que el primero; sin embargo, al querer emplear la fórmula P2(X) =f[xo] + (x -xo)f[xo, x¡] + (x -xo) (x -xl)f[xO' xl' x2] y la tabla construida se deberá tener cuidado, ya que el valor X o de la fórmula en realidad corresponderá a XI de la tabla; x I de la fórmula, a x2 de la tabla, etc. Consecuentemente f [xo], f [xo, xl' x2] de la fórmula corresponderá af [XI]'! [xl' x2] y f [xl' x2' x3] de la tabla respectivamente (véase la línea diagonal de la tabla). Con la sustitución de valores queda p2(1.5) = 0.30010 + (1.5 - 1.35)(0.65866) + (1.5 - 1.35)(1.5 - 1.7)(-0.18647) = 0.40449 Una solución alterna es construir la tabla de diferencias de modo que quede como pun- to (O) el más cercano a 1.5 (1.35 en este caso), entre los puntos restantes se elige como punto (1) el más cercano a 1.5 (1.70 en este caso), etc. Adelante se muestra cómo que- da esta tabla.
  • 390. Aproximación funcional e interpolación 375 Diferencias divididas Puntos Xi ¡(X) Primeras Segundas Terceras Cuartas O 1.35 0.30010 0.65866 1 1.70 0.53063 -0.18647 0.55610 0.10846 2 l.90 0.64185 -0.22443 -0.030567 0.71320 0.05802 3 l.00 0.00000 -0.14900 0.54930 4 3.00 l.09861 con lo cual puede usarse el polinomio 9 P2(X) =f[xo] + (x-xo)f[xo'x¡] + (x-xo) (x-x¡)f[xO'x¡ox2] directamente, ya que ahora los subíndices de los argumentos de la fórmula y de la tabla se corresponden. Sustituyendo valores se tiene: p2(l.5) = 0.30010 + (l.5 - 1.35)(0.65866) + (l.5 - l.35)(l.5 - 1.7)(-0.18647) = 0.40449 Obsérvese que el valor interpolado es el mismo que se tuvo anteriormente. 5.3 Las densidades de las soluciones acuosas del ácido sulfúrico varían con la temperatura y la concentración de acuerdo con la tabla. bien que idad nlef tabla TCC) C (%) 10 30 60 100 5 l.0344 l.0281 l.0140 0.9888 20 1.1453 1.1335 1.1153 1.0885 40 1.3103 1.2953 1.2732 l.2446 70 l.6923 l.6014 l.5753 l.5417 pun- omo que- Solución a) Calcule la densidad a una concentración de 40% y una temperatura de 15°C. b) Calcule la densidad a 30°C y concentración de 50%. e) Calcule la densidad a 50°C y 60% de concentración. d) Calcule la temperatura a la cual una solución al 30% tiene una densidad de l.215. a) La temperatura se toma como el argumento x y las densidades (a 40%) como el va- lor de la funciónf(x). Con una interpolación lineal entre las densidades a 10 °C y 30°C se tiene: x-x x-x P (x) = --¡ f(x o ) + __ o f(x¡) xO-XI xl -xo
  • 391. 376 Métodos numérico s aplicados a la ingeniería d (15) "" 15 - 30 1.3103 + 15 - 10 1.2953 = 1.3066 10 - 30 30 - 10 b) Se toman ahora las concentraciones como argumentos x y las densidades (a 30°C) como los valores funcionales; luego, mediante una interpolación lineal entre las concentraciones a 40% y 70% queda: d (50) = 50 - 70 1.2953 + 50 - 40 1.6014 = 1.3973 40 -70 70 - 40 e) La densidad se aproxima a 50°C, utilizando primero la fila de 40% de concentra- ción y después la fila de 70% de concentración. Con estas densidades obtenidas a 50 °C se aproxima la densidad a 60% de concentración. Primer paso Aproximación de la densidad a 40% y 50°C. d "" 50 - 60 1.2953 + 50 - 30 1.2732 = 1.2806 30 - 60 60 - 30 Segundo paso Aproximación de la densidad a 70% y 50°C. d "" 50 - 60 1.6014 + 50 - 30 1.5753 = 1.5840 30 - 60 60 - 30 Tercer paso Aproximación de la densidad a 60% y 50°C usando los valores obtenidos en los pasos an- teriores d "" 60 -70 1.2806 + 60 - 40 1.5840 = 1.4829 40 -70 70 -40 d) En este caso es necesario interpolar los valores de la densidad a 30% de concentra- ción a diferentes temperaturas, para después interpolar la temperatura que corres- ponda a una densidad de 1.215. Primer paso Aproximación de la densidad a 30% y 10 0C. d "" 30 - 20 1.1453 + 30 - 40 1.3103 = 1.2278 40 - 20 20 - 40 Aproximación de la densidad a 30% y 30°C. d "" 30 - 20 1.1335 + 30 - 40 1.2953 = 1.2144 40 - 20 20 -40 Como la densidad dato (1.215) está entre estos dos valores obtenidos, la temperatura esta- rá también entre 10 °C y 30°C; por lo que interpolando linealmente entre estos dos valo- res de densidad (que ahora es el argumento x) se tiene: 376 M é todos n u m é ricos aplicados a la in g e niería 15 - 30 15 - 10 d (15) "'" 1.3103 + 1.2953 = 1.3066 10 - 30 30 - 10 b) Se toman ahora las concentraciones como argumentos x y las densidades (a 30 oC) como los valores funcionales; luego, mediante una interpolación lineal entre las concentraciones a 40% y 70% queda: d (50) = 50 - 70 1.2953 + 50 - 40 1.6014 = 1.3973 40 -70 70 - 40 e) La densidad se aproxima a 50 oC, utilizando primero la fila de 40% de concentra- ción y después la fila de 70% de concentración. Con estas densidades obtenidas a 50 oC se aproxima la densidad a 60% de concentración. Primer paso Aproximación de la densidad a 40% y 50 oc. d "'" 50 - 60 1.2953 + 50 - 30 1.2732 = 1.2806 30 - 60 60 - 30 Segundo paso Aproximación de la densidad a 70% y 50 oC. d "'" 50 - 60 1.6014 + 50 - 30 1.5753 = 1.5840 30 - 60 60 - 30 Tercer paso Aproximación de la densidad a 60% y 50 oC usando los valores obtenidos en los pasos an- teriores d "'" 60 - 70 l.2806 + 60 - 40 1.5840 = l.4829 40 -70 70 - 40 d) En este caso es necesario interpolar los valores de la densidad a 30% de concentra- ción a diferentes temperaturas, para después interpolar la temperatura que corres- ponda a una densidad de 1.215. Primer paso Aproximación de la densidad a 30% y 10 oc. d "'" 30 - 20 1.1453 + 30 - 40 1.3103 = l.2278 40 - 20 20 -40 Aproximación de la densidad a 30% y 30 oc. d "'" 30 - 20 1.1335 + 30 - 40 l.2953 = 1.2144 40 - 20 20 - 40 Como la densidad dato (1.215) está entre estos dos valores obtenidos, la temperatura esta- rá también entre 10 oC y 30 oC; por lo que interpolando linealmente entre estos dos valo- res de densidad (que ahora es el argumento x) se tiene:
  • 392. Aproximación funcional e interpolación 377 Segundo paso Aproximación de la temperatura a la que una solución con 30% de concentración tiene una densidad de l.21530°C) trelas T = l.215 - 1.2144 10 + l.215 - l.2278 30", 29.1 0C l.2278 - l.2144 l.2144 - 1.2278 5.4 Elabore un programa para leer una tabla de In pares de valores e interpolar o extrapolar, utilizando el polinomio de Newton de grado n en diferencias divididas. Pruebe este pro- grama con los datos del ejercicio 5.l.entra- idas a Solución En el disco se encuentra el programa 5.3 que lee a) el número de pares de valores (M); b) el grado del polinomio interpolante (N); e) el argumento que se desea interpolar (XINT), y á) los pares de valores (X(1), FX(1)), (X(2), FX(2)), ... , (X(M), FX(M)). Con esta informa- ción primero llama al subprograma TABLA que elabora la tabla de diferencias divididas. Con los valores resultantes y el argumento donde se quiere aproximar el valor de la función y el grado del polinornio interpolante, llama al subprograma INTERPOLA que realiza los cálculos de interpolación. El resultado es PARA XINT = 1000.0000 FXINT = 23.1201 5.5 Elabore un programa que lea una tabla de In (seleccionado por el usuario) pares de valo- res, y qué interpole o extrapole con el polinomio de Lagrange de orden In-l. os an- Solución En el disco se encuentra el programa 5.4, donde se leen M pares de valores XCI) y FX(I) de una tabla y el valor por interplar XINT. Resultado: PARA XINT = 1000.0000 FXINT = 23.1201 5.6 Con el programa 5.4 y la tabla de valores del ejercicio 5.1, calcule la presión de vapor del cloruro de magnesio a las siguientes temperaturas: a) 800°C (extrapolación) e) 1098 °C (interpolación) b) 950°C (interpolación) á) 1500°C (extrapolación) entra- orres- Solución PARA XINT = 800.0000 PARA XINT = 950.0000 PARA XINT = 1098.0000 PARA XINT = 1500.0000 FXINT = 18.1702 con los puntos (O), (1) Y (2). FXINT = 12.4972 con los puntos (O), (1) Y (2). FXINT = 65.5236 con los puntos (2), (3) Y (4). FXINT = 1156.1016 con los puntos (5), (6) Y (7). 5.7 Con la información del ejercicio 5.2 estime el error cometido R2 (l.5), aproximef(x) en x = l.5 con un polinornio de tercer grado y estime el error correspondiente R3 (1.5). Solución El valor obtenido con un polinomio de segundo grado (Ejer. 5.2) es: esta- valo- P2 (1.5) = 0.40449 Al usar la ecuación 5.41 y los valores de la segunda tabla de diferencias divididas (Ejer. 5.2), se tiene: R2 (x) '" (x- xo)(x-x¡) (x-x2) f[xo, xl' x2' x3] '" (l.5-1.35)(1.5-l.7)(l.5-1.9)(0.10846) = 0.00130 Aproximación funcional e interpolación 377 Segundo paso Aproximación de la temperatura a la que una solución con 30% de concentración tiene una densidad de 1.215 T = l.215 - l.2144 10 + 1.215 - l.2278 30", 29.1 oC l.2278 - l.2144 l.2144 - l.2278 5.4 Elabore un programa para leer una tabla de In pares de valores e interpolar o extrapolar, utilizando el polinomio de Newton de grado n en diferencias divididas. Pruebe este pro- grama con los datos del ejercicio 5.l. Solución En el disco se encuentra el programa 5.3 que lee a) el número de pares de valores (M); b) el grado del polinomio interpolante (N); e) el argumento que se desea interpolar (XINT), y á) los pares de valores (X(1), FX(1)), (X(2), FX(2)),... , (X(M), FX(M)). Con esta informa- ción primero llama al subprograma TABLA que elabora la tabla de diferencias divididas. Con los valores resultantes y el argumento donde se quiere aproximar el valor de la función y el grado del polinomio interpolante, llama al subprograma INTERPOLA que realiza los cálculos de interpolación. El resultado es PARA XINT = 1000.0000 FXINT =23.1201 5.5 Elabore un programa que lea una tabla de In (seleccionado por el usuario) pares de valo- res, y qué interpole o extrapole con el polinomio de Lagrange de orden 1n-1. Solución En el disco se encuentra el programa 5.4, donde se leen M pares de valores XCI) y FX(I) de una tabla y el valor por interplar XINT. Resultado: PARA XINT = 1000.0000 FXINT = 23.1201 5.6 Con el programa 5.4 y la tabla de valores del ejercicio 5.1, calcule la presión de vapor del cloruro de magnesio a las siguientes temperaturas: a) 800 oC (extrapolación) e) 1098 OC (interpolación) Solución PARA XINT = 800.0000 PARA XINT =950.0000 PARA XINT = 1098.0000 PARA XINT = 1500.0000 b) 950 OC (interpolación) á) 1500 oC (extrapolación) FXINT = 18.1702 con los puntos (O), (1) Y(2). FXINT =12.4972 con los puntos (O), (1) Y(2). FXINT = 65.5236 con los puntos (2), (3) Y(4). FXINT = 1156.1016 con los puntos (5), (6) Y(7). 5.7 Con la información del ejercicio 5.2 estime el error cometido R2 (1.5), aproximef(x) en x =1.5 con un polinomio de tercer grado y estime el error correspondiente R3 (1 .5). Solución El valor obtenido con un polinomio de segundo grado (Ejer. 5.2) es: P2 (1.5) = 0.40449 Al usar la ecuación 5.41 y los valores de la segunda tabla de diferencias divididas (Ejer. 5.2), se tiene: R2 (x) '" (x- xo)(x-x¡) (x-x2) f [xo' xi' x2' x3] '" (l.5-1.35)(l.5-1.7)(1.5-1.9)(0.10846) =0.00130
  • 393. 378 Métodos numér icos aplicados a la ingeniería Para aproximar f (x) en x = 1.5 con un polinomio de tercer grado se adiciona R2 (l.5) al valor P2 (l.5), se obtiene: P3 (l.5) = 0.40449 + 0.00130 = 0.40579 y la estimación del error en esta interpolación es: R3 (x) = (x-xO)(X-XI) (x-x2) (x-x3) f [xo, xl' x2' x3' x4] = (1.5-1.35)(1.5-1.7)(1.5-1.9)(1.5-l.0)(-0.030567) = 0.00018 Hay que observarse que R3 (l.5) es menor que R2(l.5), por lo que el polinomio de tercer grado da mejor aproximación a esta interpolación que el de segundo grado. 5.8 Para calibrar un medidor de orificio se miden la velocidad v de un fluido, y la caída de pre- sión ~p. Los datos experimentales se dan a continuación y se buscan los mejores paráme- tros a y b de la ecuación que represente estos datos: v = a(M)b (1) donde: v = velocidad promedio (pies/s) ~P = caída de presión (mm Hg) 2 3 4 5 6 7 8 9 10 11 vi 3.83 4.17 4.97 6.06 6.71 7.17 7.51 7.98 8.67 9.39 9.89 Mi 30.00 35.5 50.5 75.0 92.0 105.0 115.0 130.0 153.5 180.0 199.5 Solución Este problema puede resolverse mediante el método de mínimos cuadrados de la siguien- te manera: Se aplican logaritmos a la ecuación 1 y se tiene: In v = In a + b In (~P) (2) al definir y = In v; ao = In a; al = b; x = In (~P) y sustituir en la ecuación 2 queda: (3) ecuación de una línea recta. Si se calculan los parámetros ao y al de la recta (Ec.3) con el método de mínimos cua- drados, se obtienen (indirectamente) los mejores valores a y b que representan los datos experimentales. Para calcular ao y al se construye la siguiente tabla para que los cálculos sean más efi- cientes (puede usarse una hoja de cálculo electrónica o un pizarrón electrónico).
  • 394. 1- Aproximación funcional e interpolación 379 Puntos Vi Mi Yi xi x.2 s.»,1 In Vi In Mi (In MY In vi In Mi 1 3.83 30.0 1.34286 3.40120 11.56816 4.56734 2 4.17 35.5 1.42792 3.56953 12.74154 5.09700 3 4.97 50.5 l.60342 3.92197 15.38185 6.28857 4 6.06 75.0 l.8017l 4.31749 18.64072 7.77886 5 6.71 92.0 1.90360 4.52179 20.44658 8.60768 6 7.17 105.0 l.96991 4.65396 2l.65934 9.16788 7 7.51 115.0 2.01624 4.74493 22.51436 9.56692 8 7.98 130.0 2.07694 4.86753 23.69285 10.10957 9 8.67 153.5 2.15987 5.03370 25.33814 10.87214 10 9.39 180.0 2.23965 5.19296 26.96683 11.63041 11 9.89 199.5 2.29581 5.29581 28.04560 12.13545 Totales 20.83364 49.52087 226.99598 95.82182 Los valores de las sumatorias se sustituyen en el sistema de ecuaciones 5.62 y se tiene: 49.52087 1 226.99598 = -0.35904 49.52087 1 226.99598 1 11.0 20.83364 1 49.52087 95.82182 al = --------- = 0.50046 I ll.O 49.52087 1 49.52087 226.99598 1 20.83364 95.82182 1 11.0 49.52087 Ecuación resultante: y = -0.35904 + 0.50046 x De donde: in a = -0.35904 b = 0.50046 y a = 0.69835 Con estos valores, la ecuación que representa los datos experimentales queda: v = 0.69835 (~p)O.50046 Para este ejercicio recomendamos ver el PROGRAMA 5.6 del CD. 5.9 Al medir la velocidad (con un tubo de Pitot) en una tubería circular de diámetro interior de 20 cm, se encontró la siguiente información: v (cm/s) 600 550 450 312 240 o 3 7 8r (cm) 5 donde r es la distancia en cm medida a partir del centro del tubo. a) Obtenga la curva v =f (r) que aproxima estos datos experimentales. b) Calcule la velocidad en el punto r = 4 cm.
  • 395. 380 Métodos n uméricos aplicados a la ingeniería Solución a) Se asume que en la experimentación hay errores, de tal modo que se justifica usar una aproximación por mínimos cuadrados. Por otro lado se sabe que el perfil de velocidades en una tubería generalmente es de tipo parabólico, por lo que se ensa- yará un polinomio de segundo grado ver) = ao +al r + a2 r2 Al construir la tabla que proporcione los coeficientes del sistema de ecuaciones 5.64 se tiene Puntos v r r2 r3 r4 vr vr2 1 600 O O O O O O 2 550 3 9 27 81 1650 4950 3 450 5 25 125 625 2250 11250 4 312 7 49 343 2401 2184 15288 5 240 8 64 512 4096 1920 15360 Totales 2152 23 147 1007 7203 8004 46848 Estos valores se sustituyen en el sistema de ecuaciones 5.64 particularizado para un poli- nomio de segundo grado y se tiene: + 147 a2 + 1007 a2 + 7203 a2 2152 8004 46848 Al resolver para los parámetros ao' al Y a2 Y sustituidos en el polinomio propuesto queda: ver) = 601.714 - 3.0667 r - 5.347 r2 b) Con la sustitución r = 4, se obtiene: v(4) = 503.89 cro/s Hay que observar que la distribución de velocidades sólo se presenta del centro a la pared del tubo, ya que es simétrica. SUGERENCIA: Vea el PROGRAMA 5.7 del CD. 650 v 600 550 500 503.89 450 400 350 300 Distribución de 250 la velocidad del centro a la 200 pared de tubo. O 2 3 4 5 6 7 8
  • 396. Aproximación funcional e interpolación 381 5.10 El porcentaje de impurezas que se encuentra, a varias temperaturas y tiempos de esterili- zación en una reacción asociada con la fabricación de cierta bebida, está representado por los datos siguientes Tiempo de Temperatura °C esterilización (mín) Xl x2 75 100 125 15 14.05 10.55 7.55 14.93 9.48 6.59 20 16.56 l3.63 9.23 15.87 11.75 8.78 25 22.41 18.55 15.93 2l.66 17.98 16.44 Estime los coeficientes de regresión lineal en el modelo y = ao + a¡ x¡ + a2 x2 + a3 x¡2 + a4 xl + as XIX2 Solución Si bien el modelo no es lineal, puede transformarse en lineal con los siguientes cambios de variable. que sustituidos en el modelo propuesto dan y = ao + al XI + a2 X2 + a3 X3 + a4 X4 + as Xs cuyos parámetros, siguiendo el criterio de los mínimos cuadrados, pueden obtenerse a par- tir del sistema nao + a¡Lxl + a2Lx2 + a3 LX3 + a4Lx4 + as LXS Ly aOLx¡ + a¡ Lx21 + a2Lxlx2 + a3Lxlx3 + a4Lx]x4 + as LX]XS = LXIY aoLx2 + al L X2XI + a2 L x22 + a3 L X2X3 + a4L X2 X4 + as LX2XS = LX2Y aoL X3 + a¡ L X3X] + a2 L X3X2 + a3 L x23 + a4L X3 X4 + as L X3XS = LX3Y aoL X4 + a¡ LX4XI + a2 LX4X2 + a3Lx4x3 + a4L x24 + as L X4XS = LX4Y aoLXs + al LXSX¡ + a2LXsX2 + a3 LXSX3 + a4LXsX4 + as L x2s = LXsY Ahora, los valores de la tabla que se dan arriba se disponen así Puntos 1 2 3 4 5 6 7 XI 75 75 75 75 75 75 100 x2 15 15 20 20 25 25 15 Y 14.05 14.93 16.56 15.87 22.41 2l.66 10.55
  • 397. 382 Métodos numéricos aplicados a la ingeniería Se continúa adicionando las filas necesarias: x3' x4' xs' X¡2, X2 2,xI' x2 , ... y sumando los to- tales de cada una para conseguir los coeficientes y el vector de términos independientes del sistema. Dichos cálculos dan como resultado el siguiente sistema de ecuaciones: 18 1800 360 187500 7500 36000 ao 251.94 1800 187500 36000 20250000 750000 3750000 a¡ 24l70.0 360 36000 7500 3750000 162000 750000 a2 5287.9 187500 20250000 3750000 2254687500 78125000 405000000 a3 2420850.5 7500 750000 162000 78125000 3607500 16200000 a4 115143.0 36000 3750000 750000 405000000 16200000 78125000 as 508702.5 cuya solución por medio de alguno de los métodos del capítulo 3 es: ao = 56.4264, a3 = 0.00081632, a¡ = -0.362597, a4 = 0.0816, a2 = -2.74767 as = 0.00314 se sustituyen en el modelo y resulta: y = 56.4264 - 0.362597x¡ - 2.74767x2 + 0.00081632x¡2 + 0.0816xl + 0.00314x¡x2 Una vez obtenidos los coeficientes, puede estimarse el porcentaje de impurezas correspon- diente a un tiempo de estirilización y una temperatura dados; por ejemplo, a un tiempo de 19 min y una temperatura de 80°C se tiene un porcentaje de impurezas de: y = 56.4264 - 0.362597 (80) - 2.74767(19) + 0.00081632(80)2 + 0.0816(19)2+ 0.00314(80)(19) = 14.67 Problemas 5.1 La densidad del carbonato neutro de potasio en solución acuosa varía con la temperatura y la concentración de acuerdo con la tabla siguiente. TCOC) e (%) O 40 80 100 4 1.0381 1.0276 1.0063 0.9931 12 1.1160 1.1013 1.0786 1.0663 20 1.1977 1.1801 1.1570 1.1451 28 1.2846 1.2652 1.2418 1.2301 a) Calcule la densidad a 40°C y 15% de concentración. b) Calcule la densidad a 50°C y 28% de concentración. e) Calcule la densidad a 90°C y 25% de concentración. el) Calcule la concentración que tiene una solución de densidad 1.129 a una temperatura de 60 -c. Utilice interpolaciones cuadráticas en todos los incisos. 5.2 Los datos de presión-temperatura-volumen para el etano se muestran en la tabla siguien- te, donde la temperatura (1) está en °C, la presión (P) en atmósferas y el volumen especí- fico (1N) en moles/litro.
  • 398. a Aproximación funciona l e interpolación 383 p T 1 2 4 6 8 9 10 25 20.14 32.84 75 24.95 43.80 68.89 85.95 104.38 118.32 139.23 150 31.89 59.31 106.06 151.38 207.66 246.57 298.02 200 36.44 69.38 130.18 194.53 276.76 332.56 250 40.87 79.16 153.59 237.38 345.38 Calcule el volumen específico en moles/litro para una presión de 7 atmósferas y una tem- peratura de 175°C. 5.3 Dados: Puntos o 1 2 x e f(x) a) Encuentre los coeficientes ao' al' a2 , del polinomo de segundo grado que pasa por es- tos tres puntos, por el métodos de Lagrange. b) Realice el mismo proceso que en a) pero ahora empleando el método de aproxima- ción polinomial simple. e) Demuestre que los polinomios en los incisos a) y b) son el mismo, pero escrito en di- ferente forma. 5.4 Dada una función y =f(x) en forma tabular, a menudo se desea encontrar un valor x corres- pondiente a un valor dado de y; este proceso, llamado interpolación inversa, se lleva a cabo en la forma ya vista, pero intercambiando los papeles de x y y. Dada la siguiente tabla. Puntos o 1 2 3 4 5 6 x 0.0 2.5 5.0 7.5 10.0 12.5 15.0 y 10.00 4.97 2.47 1.22 0.61 0.30 0.14 a donde y es la amplitud de la oscilación de un péndulo largo, en cm y x es el tiempo medi- do en min desde que empezó la oscilación. Encuentre el polinomio de aproximación de Lagrange de segundo grado que pasa por los puntos (1), (2) y (3) y el valor de x correspondiente a y = 2 cm. 5.5 "Sea z(x) = I1 (x - x.). Demuestre que el polinomio 5.22 puede escribirse en la forma j=O J n f (x) Pn (x) = z (x) .L ----'--- l=O (x - x) z' (Xi) Use las ideas dadas en el problema anterior para demostrar que5.6 Í- 11 L L¡ (x) "" 1 para toda x. i=O
  • 399. 384 Métodos numéricos aplicados a la ingeniería SUGERENClA: Considere que la expresión dada corresponde al polinomio de aproxomación por polinomios de Lagrange de fix) = 1 (un polinomio de grado cero). 5.7 Demuestre que el polinomio de aproximación de Lagrange de primer grado puede escri- birse en notación de determinantes así PO,I (x) = _1_ I po(x) (xo - x) I xl-xO PI(X) (xl-x) donde Po (x) =f(xo) y PI(x) =f(xI) y los subíndices O y 1 de p(x) se refieren a los puntos (O) y (1) por donde pasa el polinomio de aproximación. Demuestre también que para el caso del polinomio de aproximación de Lagrange de segundo grado que pasa por los puntos (O), (1) Y (2). 1 POl2 (x) =-- " x2 -XI I PO,I (x) PO,2 (x) 5.8 Lo demostrado en el problema anterior es válido, en general, para aproximaciones de ter- cero, cuarto, ... , n grado. Aitken desarrolló un método para interpolar con este tipo de po- linomios y consiste en construir la tabla siguiente: Xo Po (xo-x) Xl PI PO,I (XI-X) X2 P2 PO,2 PO,I,2 (X2-X) X3 P3 PO,3 PO,I,3 PO,I,2,3 (XrX) X4 P4 PO,4 PO,I,4 PO,1,2,4 PO,I,2,3,4, (XCx) donde P, =f(x¡) y X el valor donde se desea interpolar. Para el cálculo de 1 PO,¡(x)=-- x¡-xO donde el denominador resulta ser (Xi -X) - (xo - X). En cambio para PO,I,i se usa 1 POI¡(X) =-- " X¡-XI PO,I (Xl - X) PO,¡ (X¡- X) cuyo denominador es (x¡-x) - (X I - x). Se aconseja denotar la abscisa más cercana a x como xo' la segunda más próxima a x como xi' Y así sucesivamente. Con ese ordenamiento los valores Po l' Po I ?, Po I 23' etc., representan la mejor aproxima- ción al valor buscado f (x) con polinomios de p~i;';ero, segundo, tercero, ... , n grado. Con el método descrito, aproxime el valor de la función de Bessel (lo) dada abajo en x = 0.8 Puntos O 1 2 3 X 0.5 l.00.7 0.9 lo (x) 0.93850.8812 0.80750.7652
  • 400. cri- tos de ter- po- ax a- 0.8 Aproximación funcional e interpolación 385 5.9 En el método de posición falsa (capítulo 2) se realiza una interpolación inversa: dados los puntos (xl,f (XI» y (xD,f (xD» se encuentra el polinomio p(x) que pasa por esos puntos y luego el valor de X correspondiente a p(x) = O. Discuta la interpolación inversa para encon- trar raíces de ecuaciones no lineales empleando tres puntos. 5.10 Demuestre que si la función f (x) dada en furma tabular corresponde a un polinomio de grado n, entonces el polinomio de aproximación p(x) de grado mayor o igual a n que pa- sa por los puntos de la tabla es f (x) misma. SUGERENCIA: Con el polinomio y = 2x + 3 forme un tabla de valores y tomando dos de esos valores encuentre p(x) y observe que p(x) = y; después tomando 3 valores cualesquiera observe que el p(x) obtenido es nuevamente y = 2x + 3. Sólo resta generalizar estos resultados. 5.11 Desarrolle algebraicamente el numerador y el denominador de para llegar a 5.12 Verifique que para tres puntos distintos cualesquira de abscisas xo' XI y x2 se cumple que f[xo' xI' x2] =f[x2, xo' XI] =f[xl' x2' xo] así como con cualquier otra permutación de xI' x2' xo' Esta propiedad de las diferencias de segundo orden es conocida como simetría respecto a los argumentos y la cumplen tam- bién las diferencias de primer orden (trivial), las de orden 3, etcétera. 5.13 Elabore un subprograma de propósito general para construir la tabla de diferencias dividi- das de una función tabulada. SUGERENCIA: Vea el algoritmo 5.3. Puede usar una hoja de cálculo electrónica. 5.14 Para los valores siguientes oPuntos 2 3 4 5 6 40 60 80 100 120 140 160e 0.63 1.36 2.18 3.00 3.93 6.22 8.59p donde e son los volts y p los kilowatts en una curva de pérdida en el núcleo para un mo- tor eléctrico: a) Elabore una tabla de diferencias divididas. b) Con el polinomio de Newton en diferencias divididas de segundo grado, aproxime el valor de p correspondiente a e = 90 volts. 5.15 En la tabla siguiente: 1 2 3 4 v 120 94 75 62 Aproximación funcional e interpolación 385 5.9 En el método de posición falsa (capítulo 2) se realiza una interpolación inversa: dados los puntos (x,,f (x,» y (xD,f (XD»se encuentra el polinomio p(x) que pasa por esos puntos y luego el valor de x correspondiente a p(x) =O. Discuta la interpolación inversa para encon- trar raíces de ecuaciones no lineales empleando tres puntos. 5.10 Demuestre que si la función f (x) dada en furma tabular corresponde a un polinomio de grado n, entonces el polinomio de aproximación p(x) de grado mayor o igual a n que pa- sa por los puntos de la tabla es f (x) misma. SUGERENCIA: Con el polinomio y = 2x + 3 forme un tabla de valores y tomando dos de esos valores encuentre p(x) y observe que p(x) = y; después tomando 3 valores cualesquiera observe que el p(x) obtenido es nuevamente y = 2x + 3. Sólo resta generalizar estos resultados. 5.11 Desarrolle algebraicamente el numerador y el denominador de para llegar a 5.12 Verifique que para tres puntos distintos cualesquira de abscisas xo' XI y x2 se cumple que f[xo' xI' x2] =f[x2, xo' XI] =f[xl' x2' xo] así como con cualquier otra permutación de xI' x2' xo. Esta propiedad de las diferencias de segundo orden es conocida como simetría respecto a los argumentos y la cumplen tam- bién las diferencias de primer orden (trivial), las de orden 3, etcétera. 5.13 Elabore un subprograma de propósito general para construir la tabla de diferencias dividi- das de una función tabulada. SUGERENCIA: Vea el algoritmo 5.3. Puede usar una hoja de cálculo electrónica. 5.14 Para los valores siguientes Puntos o 2 3 4 5 6 e 40 60 80 100 120 140 160 p 0.63 1.36 2.18 3.00 3.93 6.22 8.59 donde e son los volts y p los kilowatts en una curva de pérdida en el núcleo para un mo- tor eléctrico: a) Elabore una tabla de diferencias divididas. b) Con el polinomio de Newton en diferencias divididas de segundo grado, aproxime el valor de p correspondiente a e = 90 volts. 5.15 En la tabla siguiente: 1 2 3 4 v 120 94 75 62
  • 401. -----------------~----------------------------"'P""--- 386 Métodos numéricos aplicados a la ingeniería donde i es la corriente y v el voltaje consumido por un arco magnético, aproxime el valor de v para i = 3.5 por un polinomio de Newton en diferencias dividas y compare con el va- lor dado por la fórmula empírica. v = 30.4 + 90.4 ¡-0.507 5.16 Corrobore que el polinomio de Newton en diferencias divididas puede escribirse en térmi- nos de Il, así: (1) NOTA: Considere que ¡.,°j(xo) = f (xo)' Esta notación es generalmente más útil para programar este algoritmo. 5.17 Con los resultados del problema anterior y con la definición de función biominal siguien- te, exprese la ecuación (1) en términos de (t). (O = 1 k-¡ S - i rr ;=0 i + 1 k=O k>O s (s - 1) s - 2) (s - (k - 1)) 1 (2) (3) (k) 5.18 Con los siguientes valores. Puntos o 32 l/r 140 180 220 240 p/a 12,800 7,500 5,000 3,800 donde p/a es la carga en lb/pulg- que causa la ruptura de una columna de hierro dulce con extremos redondeados y l/r es la razón de la longitud de la columna al mínimo radio de gi- ro de su sección transversal. Encuentre el polinomio de tercer grado que pasa por estos puntos en sus distintas formas: a) P3(x) = ao + a¡x + a~2 + a3x3 (aproximación polinomial simple). b) Forma de Lagrange. e) Aproximación de Newton (en diferencias divididas). d) Aproximación de Newton en diferencias finitas (hacia delante y hacia atrás). 5.19 En una reacción química, la concentración del producto CB cambia con el tiempo como se indica en la tabla de abajo. Calcule la concentración CB cuando t = 0.82, usando un poli- nomio de Newton en diferencias finitas. 0.00 1.10 1.150.30 0.55 .80 0.00 0.60 1.000.800.10 0.40 5.20 Resuelve el problema 5.13, empleando diferencias finitas; compare los cálculos realizados y los resultados obrenidos en ambos problemas. 5.21 Elabore un diagrama de flujo y codifíquelo para leer n pares de valores x y f (x), calcular e imprimir la tabla de diferencias finitas hacia atrás. 386 Métodos numéricos aplicados a la ingeniería donde ¡ es la corriente y v el voltaje consumido por un arco magnético, aproxime el valor de v para ¡ = 3.5 por un polinomio de Newton en diferencias dividas y compare con el va- lor dado por la fórmula empírica. v = 30.4 + 90.4 ¡-0.507 5.16 Corrobore que el polinomio de Newton en diferencias divididas puede escribirse en térmi- nos de rr,así: (1) NOTA: Considere que /1°j(xo) = f (xo). Esta notación es generalmente más útil para programar este algoritmo. 5.17 Con los resultados del problema anterior y con la definición de función biominal siguien- te, exprese la ecuación (1) en términos de (n. (n = k-¡ S - i s (s - 1) s - 2) .. .(s - (k - 1)) rr ;=0 ¡ + 1 1 (2) (3) ...(k) 5.18 Con los siguientes valores. Puntos o 2 3 !Ir 140 180 220 240 p/a 12,800 7,500 5,000 3,800 k=O k>O donde p/a es la carga en lb/pulg2 que causa la ruptura de una columna de hierro dulce con extremos redondeados y !Ir es la razón de la longitud de la columna al mínimo radio de gi- ro de su sección transversal. Encuentre el polinomio de tercer grado que pasa por estos puntos en sus distintas formas: a) P3(x) =ao + a¡x + a~2 + a3x3 (aproximación polinomial simple). b) Forma de Lagrange. e) Aproximación de Newton (en diferencias divididas). d) Aproximación de Newton en diferencias finitas (hacia delante y hacia atrás). 5.19 En una reacción química, la concentración del producto CB cambia con el tiempo como se indica en la tabla de abajo. Calcule la concentración CB cuando t = 0.82, usando un poli- nomio de Newton en diferencias finitas. 0.00 0.30 0.55 .80 1.10 1.15 0.00 0.10 0.40 0.60 0.80 1.00 5.20 Resuelve el problema 5.13, empleando diferencias finitas; compare los cálculos realizados y los resultados obrenidos en ambos problemas. 5.21 Elabore un diagrama de flujo y codifíquelo para leer n pares de valores x y f (x), calcular e imprimir la tabla de diferencias finitas hacia atrás.
  • 402. a- 1) Il- on 1- s: se li- os lar Aproximación funcional e. interpolación 387 Puntos Xi f[ Xi] V'f[ Xi] V'2f[ Xi] V'3f[ Xi] ... V'1l-2j[Xi] O Xo f[ Xo] V'f[ XI ] 1 xI f[ x¡] V'2f[ XI ] V'f[ X2] V'3f[ XI ] 2 x2 f[ x2] V'2f[ x2 ] V'f[ x3 ] V'3f[ x2] 3 x3 f[ x3] V'2j [x3 ] V'"-2j[xl _¡] V'2f[xll_l ] V'2f[xn_l] V'f[x n-I] n -1 xll_1 f[x n-I] IV'f[x] = f[x] - f[x - h] V''''f[x] = V'm-If[x] - V' m-If[x- h] 5.22 En el caso en que la distancia h entre dos argumentos consecutivos cualesquiera es la mis- ma a lo largo de la tabla, puede usarse la ecuación 5.35 para interpolar en puntos cercanos a X o o bien 5.38 cuando se quiere interpolar en puntos al final de la tabla (véase Seco 5.5). Si hay que interpolar en puntos centrales de la tabla, resulta conveniente denotar alguno de dichos puntos centrales como xo' como x" x2' x3 , ... , las abscisas mayores que Xo y como x_" x_2' x_3 , ... , las abscisas menores que xo. En estas condiciones e introducien- do el operador lineal 8, conocido como operador en diferencias centrales y definido sobre f (x) como: 8f(x) =f(x + hl2) - f(x- hl2) y cuya aplicación sucesiva conduce a: 8 (8f(x)) = 82f(x) =f(x + h) - 2f(x) +f(x- h) y en general a: Nótese que 8f (xo) no emplea, en general, los valores de la tabla, la cual constituye una di- ficultad para su uso. En cambio, la segunda diferencia central 82f(xk ) =f(xk + 11) - 2f(xk ) + f(xk - h) incluye sólo valores funcionales tabulados; esto es cierto para todas las diferencias centra- les de orden par. A fin de evitar que se requieran valores funcionales no tabulados en la pri- mera diferencia central, puede aplicarse 8 a puntos no tabulados; por ejemplo,j (xk + hI2) con la cual queda: 8f (xk + h/2) =t»,+ h) - f (xk) =f(xk +1) - f (xk), donde ya sólo aparecen valores funcionales de la tabla. En general 82i+lf(xk + h/2)(orden impar) queda en función de ordenadas presentes en la tabla. Con la notación de diferencias divididas se tiene que: (1) (2)
  • 403. 388 Métodos numéricos ap licados a la ingeniería 8f(xo + h/2) =f(Xl) - f(xo) = hf[xOxl] 8f(xo - h/2) =f(xo) - f(X_l) = hf[xo, X_l] 82j(Xl) = 8f(x) + h/2) - 8f(xl - h/2) = hf[xl x?] - hf[xo Xl], - , = 2! h2f[xo, Xl' X2] y en genreral: 8 2i+l f (xk -h/2) = h2i+ 1 (2i +1)!f [xk_i_p xk_i'· .. , Xk'· .. , xk+;J para orden impar y para orden par. La tabla de diferencias centrales queda entonces X_2 f(x_2) 8f (x_2+ h/2) x_1 f(x_) 82 f(x_l) 8f(x_)+ h/2) 53f(x_) + h/2) Xo f(xo) 82 f(xo) 8f (xo+ hl2) 53f(xo + h/2) x) f(xl) 82 f(xl) 8f(x)+ h/2) x2 f(x2 ) Note que el argumento permanece constante en cualquier línea horizontal de la tabla. Con esta notación y la aplicación sucesiva de la ecuaciones 3 y 5 con k = O,la 5.29 se trans- forma en:, " 8f(x +h/2) 82f(xo) f(x) =f(xo) + (x-xo) O + (X-Xo) (X-Xl) + l!h 2!h2 83 f(xo + h/2) (x- xo) (X- Xl) (X- X 1) + ... - 3!h3 Al emplear el cambio de variable: X = Xo + sh, en donde: X-X s = __ 0_ h (3) (4) (5) (6)
  • 404. (3) (4) (S) 5.23 5.24 5.25 a. 5.26 trans- 5.27 (6) Aproximación funcional e interpolación 389 el polinomio (6) queda PI1 (xo + sh) = f(xo) + s 8f(xo + h/2) + s (s -1) 82 f(xo) + 2! S (s2_12) (j3f(xo+h/2)+ s (s2-12)(s-2) 84f(x o )+ 3! 4! s (S2 -12) ... (S2 - (i - 1)2) 82if (xo) (s - i) ... + -------------"--- (2i)! (7) cuando el grado del polinomio es par; si es impar, el último término de la ecuación 7 que- da como: ... + S (s2 -1 2 ) ... (s2 - i 2) 82; + 1f (xo + h/2) (2i +1)! Este polinomio se conoce como la fórmula hacia delante de Gauss. Con la tabla del ejemplo 5.7 construya una tabla de diferencias centrales y mediante la ecuación 7 encuentre por interpolación la presión correspondiente a una temperatura de 76°F. Si aproxima la función dada abajo por un polinomio de segundo grado y con éste interpo- la en x = 10, estime el error cometido en esta interpolación. Puntos o 2 3 4 5 6 x o 196 8 11.5 15 f(x) 38000 38500 35500 27500 19000 15700 11000 Demuestre que el término del error para la aproximación polinomial de segundo grado es: R2 (x) = (x-xo) (X-Xl) (X-X2) f[x, xO,xpx2] Encuentre una cota inferior y una cota superior del error de interpolación R3(x) en X = 6.3 para la funciónf (x) = et dada en los puntos Xo= 5, Xl = 6, x2 = 7, x3 = 8 (véase ejemplo 5.11) Demuestre que la función dada por z(x) = I(x-xo) (x-xl)1 con xo:S; X :s;Xl alcanza su valor máximo en (xo + xl)/2 y está dado por (Xl - xo)2/4. Con lo resultados del problema anterior y la fórmula f(l/+l) (~) 1/ R, (x) = Il (x - x¡), I (n+ 1)! ;=0 demuestre que el error R¡(x) con Xo :s;X :s;Xl correspondiente a una aproximación lineal de f (x) usando como argumento Xo y Xl es menor en magnitud (valor absoluto) que M(xl-x0)2/8, donde M es el valor máximo de If"(x) I en [xo' Xl]' 5.28 Los siguientes valores furon obtenidos de una tabla de distribución biomial. b p n X 0.0500 0.1000 0.1500 0.2000 0.2500 3 O 0.8574 0.7290 0.6141 0.5120 0.4219 1 0.1354 0.2430 0.3251 0.3840 0.4219 2 0.0071 0.0270 0.0574 0.0960 0.1406 3 0.0001 0.0010 0.0034 0.0080 0.0156
  • 405. 390 Métodos nurnértcoa aplicados a la ingeniería Al pie de dicha tabal se lee "la interpolación lineal dará valores exactos de b a lo más en dos cifras decimales". Encuentre una aproximación de f (x; n, p) = f (1; 3, 0.13) exacta en tres cifras decimales. Recuerde que: b(x; n, p) = (.;') ¡r (l - p)II-X ¿Cree usted que si los valores de la tabla son exactos en las cuatro cifras decimales dadas, pueda obtenerse exactitud con cuatro cifras decimales aplicando el método de interpola- ción? 5.29 En la siguiente tabla, r es la resitencia de una bobina en ohms y T la temperatura de la bo- bina en "C. Por mínimos cuadrados determine el mejor polinomio lineal que representa la función dada. r 10.421 10.939 11.321 11.794 12.242 12.668 T 10.50 29.49 42.70 60.01 75.51 91.05 5.30 En la tabla Puntos O 1 2 3 4 5 6 7 8 v 26.43 22.40 19.08 16.32 14.04 12.12 10.51 9.15 8.00 P 14.70 17.53 20.80 24.54 28.83 33.71 39.25 45.49 52.52 v es el volumen en pie.' de una lb de vapor y P es la presión en psia. Encuentre los pará- metros a y b de la ecuación P= a vb aplicando el método de mínimos cuadrados. 5.31 Se sabe que el número de pulgadas de una estructura recién construida que se hunde en el suelo está dada por: y=3-3e-ax donde x es el número de meses que lleva construida la estructura. Con los valores x 2 6 12 18 244 y 1.07 2.26 2.992.78 2.971.88 estime a, usando el criterio de los mínimos cuadrados (véase ejercicio 5.8). 5.32 En el estudio de la constante de velocidad k de una reacción química a diferentes tempe- raturas, se obtuvieron los datos: T (K) 320 400340 360 380293 300 k 8.53 X lO-s 19.1 X lO-s 1.56 X 10-3 0.01 0.0522 0.2284 0.8631
  • 406. pará- en el mpe- Aproximación funcional e interpolación 391 Calcule el factor de frecuencia z y la energía de activación E, asumiendo que los datos ex- perimentales siguen la ley de Arrhenius: k = z e -El1.98T Sieder y Tate* encontraron que una ecuación que relaciona la transferencia de calor de lí- quidos por dentro de tubos en cambiadores de calor, se puede representar con números adi- mensionales. ás en ales. 5.33 adas, ola- a bo- nta la Nu = a (Re)" (Pr)C (~)d J-lIV Donde Nu es el número de Nusselt, Re es el número de Reynolds, Pr el número de Prandtl y J-l Y J-lw las viscosidades del líquido a la temperatura promedio de éste y a la temperatura de la pared del tubo, respectivamente. Encuentre los valores de a, b, e y d asumiendo que la tabla siguiente representa datos ex- perimentales para un grupo de hidrocarburos a diferentes condiciones de operación. Nu 97.45 109.50 129.90 147.76 153.44 168.90 177.65 175.16 Re 10500 12345 15220 18300 21050 25310 28560 31500 Pr 18.2 17.1 16.8 15.3 12.1 10.1 8.7 6.5 J-LlJ-lw 0.85 0.90 0.96 1.05 1.08 1.15 1.18 1.22 5.34 Elabore un programa de propósito general, para aproximar una función dada en forma ta- bular por un polinomio de grado n usando el método de mínimos cuadrados. 5.35 En una reacción gaseosa de expa